文章

Optimizer AI:专门为视频自动生成音效的AI工具 可以为AI视频自动配音

deepseek_ai 的视觉语言模型

2024年AI的顶级课程:AI生成对于每个人

MusicLang-基于 Llama 2 的音乐生成模型!

高质量的文本转语音库MeloTTS是开源的

Easy Scraper:一个在Chrome扩展,只需点击一下即可抓取任何网站的内容

AI开源项目:NavAIGuide-TS

Claude3最新已经上线AWS

OpenReplay:用户操作记录回放

Devv Agent 可以提供更准确、更详细的回答

ChatGPT 语音朗读功能开始灰度测试

AutoPrompt :自动优化你的提示词

Pi 支持通过 iMessage 聊天了

Sanctuary AI旗下的Phoenix机器人最新演示视频

北京大学Yuangroup团队发起了一个 Open-Sora计划

CSM_ai 生成的3D素材能直接在游戏中应用

Chat-With-MLX:在Mac上轻松运行各种开源模型

Google MusicFX推出DJ打碟模式

AFFiNE 的 “Where Notion meets Miro”

Pika推出 Lip Sync【唇部同步】功能

阿里巴巴的EMO: 情感肖像活灵活现

ChatMusician: 能够理解和生成音乐的大语言模型

MeloTTS:由MyShell AI开发的一个高质量的多语言文本到语音(TTS)库

STORM:是一个创新的写作系统

Chrome好的扩展介绍

OpenAI有一个地方可以提前体验Sora的功能

Move AI推出Move API

感觉像是可视化的维基百科

SDXL Lightning 实时生图

ChatGPT代码库进行了一些变动

Stability AI 推出图像提升增强工具:Creative Upscaler

YOLOv9:实时对象检测,能够快速准确地在图像或视频中识别和定位多个对象

YOLO-World + EfficientSAM + Stable Diffusion 能干啥?

AEA 数据集:由Meta团队开发

关于腰椎间盘突出的3个“谣言”

YOLOv8:目标检测跟踪模型

UMI:斯坦福开发的一个机器人数据收集和策略学习框架

Stability AI 的 Stable Video官网正式上线

Google的一个新的视频模型:VideoPoet

「服用失眠药“思诺思”务必要注意的几个事项」

OpenAI推出的一音乐生成模型:Jukebox

Groq 最近的硬件突破疯传

OOTDiffusion:一个高度可控的虚拟服装试穿开源工具

AnyGPT:任意模态到任意多模态的大语言模型

PixelPlayer:MIT研究团队开发的项目

利用Groq可以实现实时AI对话

加拿大建筑电工、工业电工及高级电工证书的区别

电工在加拿大非常受欢迎

UFO:由微软开发的专注于Windows操作系统交互的UI代理

视频生成模型“Sora”的5个弱点

Base10 发布了新市场地图 - 和投资组合公司!

机器人Ameca现在已经具有了视觉能力

Sora视频:一只鲜花老虎飞升

Google发布了 Gemini-Pro-1.5

OpenAI 和 Elon Musk \[译\]

Vicarious :允许外科医生360度可视化和进入腹部的手术机器人

OpenAI Sora的新文本到视频模型

NVIDIA发布一个可以运行在PC上本地模型:Chat With RTX