DETECT-2B :音频深度伪造检测工具



可以在只200毫秒内检测30多种语言的音频


Detect-2B采用了一系列预训练的子模型和微调技术,专门用于检查音频片段,判断其是否为AI生成。


“在我们原有Detect模型的基础上,Detect-2B在模型架构、训练数据和整体性能上取得了显著进步。该模型在大量真实和伪造音频片段的数据集上进行了评估,展现出了令人瞩目的性能。”Resemble在官方博客文章中表示。


据Resemble介绍,Detect-2B的子模型由带有关键层插入适配模块的冻结音频表示模型组成。这些适配模块专注于识别真实音频与伪造音频的细微差别——即录音中不经意留下的声音痕迹。大多数AI生成的音频片段听起来都“过于完美”。Detect-2B能够预测音频中AI制作的成分,而且无需每次听到新片段时都重新训练模型。这些子模型也经过了大型数据集的充分训练。


Detect-2B会汇总其预测分数,并与“精心调整的阈值”进行比较,从而判断录音的真实性。Resemble表示,他们通过独特的设计使得Detect-2B训练速度快,且部署时无需大量计算能力。


识别深度伪造变得尤为重要

随着2024年美国总统选举的临近,识别AI生成的声音或视频变得日益重要。AI声音可能会加剧误导选民和传播错误信息的风险。无论是伪造政客的声音、冒充歌曲中的名人,还是仅仅使用AI来陈述某些事情,对AI深度伪造的担忧已经削弱了公众对品牌的信任。


像Detect-2B这样的工具可以在这些深度伪造内容进入公众视野之前,在很大程度上帮助识别和证明其伪造性。当然,Resemble并不是唯一一家致力于检测AI克隆的公司。例如,McAfee在1月推出了Project Mockingbird项目来检测AI音频。而Meta则正在开发一种在AI生成的音频中添加水印的方法。


“但我们的工作还远未结束。随着生成性AI能力的不断增强,我们的检测能力也必须同步提升。我们已经规划了几个激动人心的研究方向,以进一步优化Detect-2B,重点关注表征学习、先进的模型架构和数据扩展等领域。”Resemble表示。


如果想详细了解,可以点开视频下方的链接。

谢谢观看本视频。要是喜欢,请订阅、点赞。谢谢


原文:https://venturebeat.com/ai/resemble-ais-next-generation-ai-audio-detection-model-detect-2b-is-94-accurate/


油管:https://youtu.be/K2Nl1rCSj8E

留言