文章

阿里巴巴推出Qwen1.5-32B模型

一款开源的低成本的机器人手臂,成本只需$250

无界3D城市生成

Hugging和英特尔发布了提高文生图模型空间一致性的方案

动画自动填色技术:可自动为动画中的线条图着色

有意思的项目:EMAGE

MuseV:虚拟人视频的完整解决方案

Living Images:只要输入网址,自动优化你网站上的图片,使其更吸引人

OpenAI公布其语音生成模型:Voice Engine

哥伦比亚大学开发出了一种名为 Emo的人形机器人头

DALL·E的编辑功能即将上线

介绍 Private LLM(@private_llm)

通过聊天的方式来进行UI设计

音乐到 3D 二重奏舞蹈生成

TextCraftor是一种创新的文本编码器微调技术

让你的手机“活起来” ,把你的手机变成桌面机器人

腾讯发布了AniPortrait:

AI21发布世界首个Mamba的生产级模型:Jamba

与世界上第一个有情商的人工智能 EVI 交谈

服装三维生成器

SuperBeasts的ComfyUI真好用

Al Comic Factory:漫画工厂

腾讯也搞了一个让照片能唱歌说话的项目

LaVague现已作为托管应用程序在huggingface Space上

T-Rex2涵盖了所有物体检测场景

Databricks发布了最强的开源模型DBRX

Awesome-Generative-AI-Guide: 一站式AI最新研究更新、面试资源、免费课程等综合库

NoLang:输入任何主题或者网页链接直接生成视频

Cobra将Mamba扩展为多模态LLM

GeoWizard 的拥抱脸渐变演示已经推出!

SMPLer-X:扩大富有表现力的人体姿势和形状估计

DragAPart,可以实现对输入图像内容的“拖动”

Alex Reben, 雕塑家艺术家,OpenAI 的驻地艺术家

SunoAI音乐新手指南

开源的服务:Linkwarden可以创建分类、标签

Google Gemini API Cookbook

Synclabs发布新版的唇型同步模型:Sync-1.6.0

VoiceCraft:官宣超过XTTS的语音模型

Gatekeep:一个新型的文本转视频 AI,专注与教学

FRESCO这个视频转绘项目

Arc浏览器的Windows版本

创建最佳Claude3提示的代理

适用于任何分辨率特征的模型无关框架

可以直接通过文字描述让任何静态图动起来

令人兴奋的新研究警报-𝐏𝐢𝐱𝟐𝐏𝐢𝐱-𝐓𝐮𝐫𝐛𝐨

Creatie这个AI-UI设计工具

2024年的不容错过的课程

Open-Sora开源了

基于真实果蝇行为训练的人工智能模型

OpenRouter:大语言模型“路由器”

Maisa推出的一种新型技术框架:KPU

3D视觉-语言-动作生成世界模型

Google也弄了一个:一张照片+音频即可生成会说话唱歌的视频的项目

Claude 3 Haiku API发布

Musepro这个iPad 应用看起来是真的可用

DexCap开源版经济版的Optimus

LaVague一个开源的浏览器自动化操作Agents

H2O:将人类动作实时转换为机器人动作 实时全身遥控机器人

几个AI免费的在线课程

Midjourney角色一致性功能发布