9月13日消息,今日,小米公司在声音识别算法方面取得了重要突破,声音识别算法国际性能排名第一,音频标记任务取得重要进展。
据小米公司介绍,他们自研的声音识别算法在音频标记任务中取得了重要进展。AudioSet数据集有三个子集,前两个子集用于训练,被合并称为“AudioSet-2M”。正是在这个合并后的训练集中,小米的声音识别算法模型首次在业界突破了50mAP,刷新了音频标记技术指标,成为截至目前性能最好的模型。
此外,小米还发布了一个Mini版模型,适合资源受限的场景。该模型的参数量被压缩到了原模型的约九分之一,远小于其他机构的模型,但性能却优于其他所有机构。
小米是在Google发布的AudioSet音频标记任务中获得的这一突破。它是音频标记任务影响力最大的数据集,被认为是声音领域的ImageNet。这一突破标志着小米声音识别算法在国际上的性能已经达到了领先地位。
小米公司在声明中表示:“未来我们将不断探索科技新高度,在手机、音箱、手环、CyberDog等丰富的设备使用场景中,给用户带来更高效更准确的声音识别体验。”这一声明显示出小米公司对于科技创新的坚定决心和对用户体验的高度重视。
据此前报道,小米在AI大模型方面也有所发力,结合小爱同学进一步拓展用户覆盖范围。随着声音识别算法的进步,小爱同学有望迎来更好的体验。
小米公司的创始人雷军在此前的年度演讲中透露,小米从2016年7月起就开始在AI方面进行布局,今年4月成立了大模型团队,相关团队已经超过3000人。小米AI大模型最新一个13亿参数大模型已经成功在手机本地跑通,部分场景可以媲美60亿参数模型在云端运行结果。
这一系列的进展显示出小米在AI领域的深度布局和强大实力,也预示着未来小米在科技创新和用户体验提升方面将有更大的突破。