关闭广告

小米开源语音大模型Xiaomi-MiMo-Audio,对话自然度达拟人水准

IT之家4426人阅读

IT之家 9 月 19 日消息,小米今天宣布开源首个原生端到端语音大模型 Xiaomi-MiMo-Audio,首次在语音领域实现基于 ICL 的少样本泛化

据小米介绍,五年前 GPT-3 首次展示了通过自回归语言模型 + 大规模无标注数据训练,获得 In-Context Learning(ICL,上下文学习)能力,而在语音领域,现有的大模型仍严重依赖大规模标注数据难以适应新任务达到类人智能

而 Xiaomi-MiMo-Audio 模型打破了这种瓶颈,它基于创新预训练架构和上亿小时训练数据,在智商、情商、表现力与安全性在内的跨模态对齐能力均有提升,在自然度、情感表达和交互适配方面呈现出拟人化水准

这款模型的具体创新点如下:

  • 首次证明把语音无损压缩预训练 Scaling 至 1 亿小时可以“涌现”出跨任务的泛化性,表现为 Few-Shot Learning 能力。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

英伟达联手诺基亚,能否复制“Wintel神话”

经济观察报 浏览 3484

北京105-74广东3利好!曾凡博+斯佩尔曼轰最佳状态,三分联盟第1

篮球资讯达人 浏览 2851

以色列宣布:将扣押的数百名活动人士驱逐出境

环球时报国际 浏览 3816

鲍里妮晋级2026澳网女单次轮

体坛周报 浏览 2620

唐嫣罗晋离婚?她的状态早就说明一切

隔壁灵妹妹 浏览 3440

26岁男子从杭州徒步回重庆过年 途经湖北获邀吃杀猪饭

极目新闻 浏览 6521

50+妈妈冬季穿搭范本:“短羽绒服+阔腿裤”,保暖时髦不费力

静儿时尚达人 浏览 2487

美军袭击2艘所谓"从事毒品走私活动"船只 致5人死亡

环球网资讯 浏览 2796

马斯克谈AI未来:五年后手机和APP将消失,人类文明在模拟世界的存亡

深蓝财经 浏览 3501

多哈相杀后转眼迪拜“相爱”,“梅西”就是一直嗑不完的CP!

网球之家 浏览 1998

9个月出口571万辆车 中国汽车远征军杀出新血路

科学知识点秀 浏览 3491

iX3的“弟弟”来了,BMW iX1测试伪装曝光,2027年登场

ams车评网 浏览 3837

央视一周 4 次点名全红婵,夺冠后真实处境揭开

寒士之言本尊 浏览 3352

韩残疾人福利院院长性虐待19名女性 受害者称其"爸爸"

扬子晚报 浏览 7167

B级车杀入八万元区间,汽车的价格战到底路在何方?

江瀚视野 浏览 3789

商务部回应审查Meta收购Manus:须符合中国法律法规

财联社 浏览 13345

朵朵和小酒窝合体出道,才明白她下了一盘大棋

观察鉴娱 浏览 4262

贵金属风口催生7连板!白银有色涨势凌厉,基本面却“拖后腿”

览富财经网 浏览 2571

AWS推出AI图像编辑新突破:用说话就能精准移动图片中的物体!

科技行者 浏览 2731

马筱梅吐槽老公,称嫁到大陆鲜花都是粉丝送的,汪小菲只送过一次

扒虾侃娱 浏览 4194

外观酷似G级 奔驰全新纯电SUV谍照曝光

车质网 浏览 2534
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1