文章

中国机器人公司LimX Dynamics

微软必应的一项新专利详细介绍了“视觉搜索”

谷歌免费发布了一套 15 门课长达 300 小时的机器学习工程师课程。

Synthesia推出虚拟数字人:Expressive-1

Hugging Face模型镜像站

Vidu:可生成16秒、1080P视频的模型

通过人工智能教程获得超能力

可以在家工作的网站

企图通过开源复现SORA的三个项目

亚马逊推出了 Amazon Q AI 助手

希波克拉底:用于推进医疗保健领域大型语言模型的开源机器学习框架

基于LLAMA3构建的医疗领域的多模态模型

谷歌发布基于 Gemini 微调的医疗领域模型 Med-Gemini

VSR:利用AI算法精确识别 一键去除视频中的字幕

Adobe Premiere Pro 发布重大更新

SpeechAlign:利用人类反馈改变语音合成,以增强技术交互的自然性和表现力

Chat2DB:AI驱动的数据开发和分析平台

马里兰大学开发出一种"隐形斗篷"

SeaLLMs东南亚大型语言模型

Stripe今年夏天将支持USDC的支付

DuckDuckGo也推出AIChat

Open Sora 团队发布了另一个视频生成项目 MagicTime

国产的机器人:星尘智能AI机器人S1

翻译者和插画师将因AI失去了工作

Extropic 发布一种全新的热力学计算机

IDM-VTON:虚拟试衣技术

Mistral入门指南:介绍

ClipDrop是一个超级好用的AI图像处理工具

SAM模型视频分割项目

Foundation Capital 这篇文章的论点非常有意思

Udemy 是免费课程的金矿

斯坦福大学和麻省理工学院的研究人员推出了搜索流

CMMLU 由来自中文教科书的多项选择题组成

Functionary 是一种可以解释和执行函数/插件的语言模型。

Meta公布了其下一代训练和推理加速器(MTIA)的详细信息

CT-LLM:一个 2B 微小的 LLM

伴你思考的AI思维导图

伦敦国防科技黑客马拉松落下帷幕

音乐生成应用Udio正式发布

来看看剑桥大学开发的这个超赞的免费工具

Google扩充Gemma开源家族

OpenAI 发布了GPT-4-Turbo 正式版

巴西医生使用 Apple Vision Pro辅助手术

Google宣布Gemini-1.5-Pro开放API

日本Towa因AI芯片需求股价激增四倍

由人工智能控制的战斗机已经与人类飞行员进行了空中“狗斗”

LiteLLM:统一100多种 LLM 的 API 输入输出操作的开源项目

Meta发布了最新的Llama3

一个投资组合/博客入门模板:

波士顿动力公司刚刚展示了新一代纯电动Atlas机器人

Vercel 上一键部署babyAGI

线性注意力序列并行(LASP)

Chinese Tiny 第一个以中文为中心的完全开源大语言模型

清华大学研究人员提出 SPMamba

北大发布一个新的图像生成框架VAR。

iComMa:通过比较和匹配反转 3D 高斯泼溅进行相机姿势估计

斯坦福大学的研究人员推出 Octopus v2:

Google DeepMind 展示深度混合:

Octopus-v2:可以在移动设备上运行的2B LLMs

Claude发布函数调用工具:Tool use

Meta 宣布推出 URHand

POM给Animatediff训练了三个MotionLora