Mistral AI 发布最新一代开源模型：Mistral Large 2

法国 AI 初创公司 Mistral AI 也加入了竞争。

刚刚，Mistral AI 宣布其旗舰开源模型的下一代产品：Mistral Large 2，该模型拥有 1230 亿个参数，在代码生成、数学、推理等方面与 OpenAI 和 Meta 的最新尖端模型不相上下。

紧随 Llama 3.1 405B 之后，Mistral Large 2 的发布让开源大模型的赛道一下子热闹起来，而这一模型的特点是 ——「足够大」。

具体来说，虽然 Mistral Large 2 参数量低于 Llama 3.1 的 4050 亿，但两者性能接近。并且在多个基准测试中与 GPT-4o、Anthropic 的 Claude 3.5 Sonnet 媲美。

今年 2 月，Mistral AI 推出了最初的 Large 模型，其上下文窗口包含 32,000 个 token，新版模型在此基础上构建，具有更大的 128,000 个上下文窗口（大约相当于一本 300 页的书）—— 与 OpenAI 的 GPT-4o 和 GPT-4o mini 以及 Meta 的 Llama 3.1 相匹配。

目前，Mistral Large 2 支持数十种语言，包括法语、德语、西班牙语、意大利语、葡萄牙语、阿拉伯语、印地语、俄语、中文、日语和韩语，以及 80 多种编程语言，包括 Python、Java、C、C++、JavaScript 和 Bash。

Mistral AI 指出，新模型将继续突破成本效率、速度和性能的界限，同时为用户提供新功能，包括高级函数调用和检索，以构建高性能的 AI 应用。

评估结果：

性能/成本：Mistral Large 2 在性能和成本的权衡方面设立了新的标准。在 MMLU（多任务语言理解）评估中，预训练版本的准确率达到了 84.0%，在开源模型中占据了性能/成本的前沿。

代码与推理能力

代码生成基准测试：在代码生成基准测试中，Mistral Large 2 表现优异，与领先的模型如 GPT-4o、Claude 3 Opus 和 Llama 3 405B 相当。

推理能力：模型在推理能力上显著提升，通过细致的微调，减少了生成不准确或无关信息的“幻觉”现象。模型在数学基准测试中的表现证明了其增强的推理和问题解决能力。

如果想详细了解，可以点开视频下方的链接。

谢谢观看本视频。要是喜欢，请订阅、点赞。谢谢

详细内容：https://mistral.ai/news/mistral-large-2407/

模型下载：https://huggingface.co/mistralai/Mistral-Large-Instruct-2407

油管：https://youtu.be/8cb-CyM6FDI

Tarogo Gugu Bloger

搜尋此網誌

Mistral AI 发布最新一代开源模型：Mistral Large 2

留言

發佈留言