关闭广告

小米开源语音大模型Xiaomi-MiMo-Audio,对话自然度达拟人水准

IT之家1648人阅读

IT之家 9 月 19 日消息,小米今天宣布开源首个原生端到端语音大模型 Xiaomi-MiMo-Audio,首次在语音领域实现基于 ICL 的少样本泛化

据小米介绍,五年前 GPT-3 首次展示了通过自回归语言模型 + 大规模无标注数据训练,获得 In-Context Learning(ICL,上下文学习)能力,而在语音领域,现有的大模型仍严重依赖大规模标注数据难以适应新任务达到类人智能

而 Xiaomi-MiMo-Audio 模型打破了这种瓶颈,它基于创新预训练架构和上亿小时训练数据,在智商、情商、表现力与安全性在内的跨模态对齐能力均有提升,在自然度、情感表达和交互适配方面呈现出拟人化水准

这款模型的具体创新点如下:

  • 首次证明把语音无损压缩预训练 Scaling 至 1 亿小时可以“涌现”出跨任务的泛化性,表现为 Few-Shot Learning 能力。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

邮报:未来几战将决定波特去留,他若下课西汉姆已在考虑比利奇

直播吧 浏览 1657

被预制菜笼罩,商场餐饮大撤退?

餐饮老板内参 浏览 965

针对小企业,OpenAI推ChatGPT团队订阅服务,每人月费30美元

网易科技报道 浏览 12538

不用等AI毁灭人类了!谷歌前CEO预言:明年美大选“一团糟”

财联社 浏览 15219

陈建州被传唤到庭说明情况 大牙:未收到出庭通知

网易娱乐 浏览 14868

程强:缩量反弹,关注宏观事件密集落地

首席经济学家论坛 浏览 881

AI,人类历史上最后一次科技革命?你准备好“上桌”了吗

北京商报 浏览 954

哈马斯官员:未收到重启加沙停火谈判通知

环球网资讯 浏览 10754

修杰楷庆祝生日获贾静雯献吻 称继女是"宝贝女儿"

娱絮 浏览 19390

被Meta点醒,苹果砍掉廉价头显,押注智能眼镜

网易科技报道 浏览 965

违规拍摄涉密文件多人被处分 国安机关最新提示

新京报 浏览 5800

141家上市大厂被AI耍了!谷歌意外成帮凶

量子位 浏览 15488

扫码即飞!西安街头现身共享无人机

环球网资讯 浏览 670

突发!邓建华被查

中国基金报 浏览 19309

又被起诉!美媒:特朗普被指控试图推翻败选结果,罪名总数增至91项

环球网资讯 浏览 14382

马杨马君妍官宣怀二胎,马立奥要当哥哥了

扒虾侃娱 浏览 906

脱口秀演员杨笠清空社交账号 她到底经历了什么?

代军哥哥谈娱乐 浏览 728

福原爱东京奥运会解说工作被叫停,还将面临经纪公司解约

趣看热点 浏览 26375

特朗普或为中国制造三大机遇,中国如何利用?

浏览 22735

外交部:奉劝包括巴拉圭在内的极个别国家政府认清形势

环球网资讯 浏览 5642

好久没对一双鞋这么心动了!

黎贝卡的异想世界 浏览 1711
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1