关闭广告

小米开源语音大模型Xiaomi-MiMo-Audio,对话自然度达拟人水准

IT之家1664人阅读

IT之家 9 月 19 日消息,小米今天宣布开源首个原生端到端语音大模型 Xiaomi-MiMo-Audio,首次在语音领域实现基于 ICL 的少样本泛化

据小米介绍,五年前 GPT-3 首次展示了通过自回归语言模型 + 大规模无标注数据训练,获得 In-Context Learning(ICL,上下文学习)能力,而在语音领域,现有的大模型仍严重依赖大规模标注数据难以适应新任务达到类人智能

而 Xiaomi-MiMo-Audio 模型打破了这种瓶颈,它基于创新预训练架构和上亿小时训练数据,在智商、情商、表现力与安全性在内的跨模态对齐能力均有提升,在自然度、情感表达和交互适配方面呈现出拟人化水准

这款模型的具体创新点如下:

  • 首次证明把语音无损压缩预训练 Scaling 至 1 亿小时可以“涌现”出跨任务的泛化性,表现为 Few-Shot Learning 能力。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

普里戈任下落引发诸多猜测 俄媒:他的政治生涯已结束

环球网资讯 浏览 88493

比亚迪的靓丽业绩,为何留不住巴菲特的心?

第一财经资讯 浏览 18365

太不容易了!勇士险胜篮网后 库里高举双手振臂怒吼

直播吧 浏览 12778

温差大的早春,选这三件外套准没错

Yuki女人故事 浏览 13041

Unity 中国官宣与零跑汽车合作,打造下一代智能座舱交互体验

IT之家 浏览 768

杨怡携家人去海边,穿泳衣秀身材,与老公秀恩爱

显微镜生活 浏览 15928

二封奥斯卡影后!艾玛·斯通获得最佳女主角

网易娱乐 浏览 12236

36岁李菲儿近照引热议,身材发福生图撞脸刘晓庆

叶公子 浏览 13623

鞠婧祎新妆造来袭,身穿花朵白裙宛如精灵

谈资 浏览 19700

街边大排档,涌进商场做“漂亮饭”

餐饮老板内参 浏览 1531

卫报:米兰富勒姆诺丁汉等队有意奥多伊,转会费可能为1500万镑

直播吧 浏览 15294

美国战争部长:特朗普吼了他 因其未完成某项任务

红星新闻 浏览 990

阳光电源:前三季度净利润119亿元 同比增长56%

网易财经 浏览 769

ST华铁信披违法拟被罚800万 律师:受损投资者维权已启动

雷达财经 浏览 12327

上海一业主去美国探亲接到一通越洋电话:你家被淹了

看看新闻Knews 浏览 11492

王思聪生日许愿“赚大钱”,00后新女友卖货,王健林还缺多少钱?

金融八卦女 浏览 12956

保有量接近500万辆 广州要限制电动自行车了

中国新闻周刊 浏览 91192

欧洲对美方"28点计划"逐一删改 令俄罗斯舆论颇为不满

环球网资讯 浏览 13337

特朗普顾问建议他"勿呼吁抗议" 担心"国会山骚乱"重演

环球网资讯 浏览 116236

生成式AI开启大航海时代,但不能靠一个模型走天下

创业邦 浏览 11170

今夏最佳转会是❓罗马诺:麦卡利斯特,伟大的转会,只花近4000万欧难以置信

直播吧 浏览 14198
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1