文章

YOLO-World:腾讯AI实验室开发的一个实时目标检测工具

研究人员正在帮助机器人变得敏捷、快速和安全

Gemini Ultra即将上线,Bard将更名为 Gemini

AutoMathext:一个200GB的数学文本数据集

多模态 LLM 的进展

一场耗资100万美元的竞赛

Anything in Any Scene:在现有动态视频中无缝插入任何物体

MetaVoice-1B:高度真实和自然的文本到语音(TTS)转换模型

MLBlocks:无代码AI图像生成和分析工作流平台

Stable Video 处理图像运动能力效果演示

ElevenLabs 推出了自己的官方GPTs

谷歌在 Bard谷歌地图和Imagen-2升级,亚马逊推出了人工智能购物助手“Rufus”

Glif StyleHunter:一个Chrome浏览器扩展

Midjourney发布了Niji-v6

@MultiOn_AI 是一个很牛X的AI代理

AppleVisionPro的数款新应用

Media2Face:通过语音合成3D面部画面

机器人技术即将迎来它的ChatGPT时刻

OpenAI 和微软正在洽谈支持人形机器人公司Figure

人机接口 Neuralink 相关视频

Meta发布最新编程辅助模型:CodeLlama70B

今年人工智能基础设施将分为两个市场:LLM 与扩散模型

TeslaRoadster虚拟体验

人工智能广告,它们即将成为大事件

Bard与GeminiPro在 Arena上超越了 GPT-4

Adept Fuyu-Heavy是专为数字代理设计的新型多模态模型

日本生成艺术家 Liber @liberxx0

Lumiere:一次性生成整个视频

Apple Vision Pro 的模拟真实世界物体构造和物理规律功能演示!