关闭广告

小米开源语音大模型Xiaomi-MiMo-Audio,对话自然度达拟人水准

IT之家4418人阅读

IT之家 9 月 19 日消息,小米今天宣布开源首个原生端到端语音大模型 Xiaomi-MiMo-Audio,首次在语音领域实现基于 ICL 的少样本泛化

据小米介绍,五年前 GPT-3 首次展示了通过自回归语言模型 + 大规模无标注数据训练,获得 In-Context Learning(ICL,上下文学习)能力,而在语音领域,现有的大模型仍严重依赖大规模标注数据难以适应新任务达到类人智能

而 Xiaomi-MiMo-Audio 模型打破了这种瓶颈,它基于创新预训练架构和上亿小时训练数据,在智商、情商、表现力与安全性在内的跨模态对齐能力均有提升,在自然度、情感表达和交互适配方面呈现出拟人化水准

这款模型的具体创新点如下:

  • 首次证明把语音无损压缩预训练 Scaling 至 1 亿小时可以“涌现”出跨任务的泛化性,表现为 Few-Shot Learning 能力。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

小S二女儿疑曝出恋情,在墨尔本和一男子游玩

小徐讲八卦 浏览 2488

即将结束非洲之旅,网红Speed受邀观战非洲杯决赛并获赠球衣

懂球帝 浏览 2628

幂式“美拉德穿搭”太时髦了!显白又气质,谁穿谁好看!

Yuki女人故事 浏览 5396

霍尔木兹经历局势升级的一天 美防长称给世界一个礼物

环球网资讯 浏览 15548

终结3连败!骑士大胜双杀步行者 米切尔43分末节16分

醉卧浮生 浏览 3137

八部门:加快脑机接口等新型终端的产业化、商业化进程

澎湃新闻 浏览 2800

黄仁勋放豪言:到2027年Blackwell和Rubin芯片至少创收1万亿美元

华尔街见闻官方 浏览 1644

蔚来乐道汽车迎 11 万台新车交付,距离 10 万台里程碑仅 13 天

IT之家 浏览 3491

欧洲多国讨论部署军队 格陵兰岛坚称"不做美国人"

环球网资讯 浏览 2642

陈伟霆新剧《爱情慢慢》开机陷番位争议

梦在深巷qw 浏览 1676

向太曝张艺谋巩俐分手内幕,女方逼婚不成移情,老谋子彻夜痛哭

不八卦会死星人 浏览 3185

被你们的金饰狠狠美到!这篇是大型种草现场

黎贝卡的异想世界 浏览 985

美总统威胁对尼日利亚动武 尼方回应

环球网资讯 浏览 3607

被央媒怒批!目不识丁、脑子空空

东方不败然多多 浏览 3722

新华社:2026世界有7大悬念 或将深刻影响国际政经格局

新华社 浏览 8635

阿尔特塔提醒阿森纳需警惕“危险”的诺丁汉森林

绿茵情报局 浏览 2637

崩老头爆火背后:20块一句“哥哥”,击穿百万中年男人

功夫财经 浏览 533

最便宜GLS 2026款奔驰GLS经典版售96.8万

网易汽车 浏览 2981

阿里主动加码外卖大战,谁能笑到最后?

陆玖商业评论 浏览 2673

法院首次拍卖未披露“凶宅”信息,买家不满申请撤销交易!深圳一房产再次挂拍

红星资本局 浏览 3707

王楚钦:大家都清楚现在的局面,但谁又能说能稳吃我们呢

懂球帝 浏览 516
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1