关闭广告

小米开源语音大模型Xiaomi-MiMo-Audio,对话自然度达拟人水准

IT之家4428人阅读

IT之家 9 月 19 日消息,小米今天宣布开源首个原生端到端语音大模型 Xiaomi-MiMo-Audio,首次在语音领域实现基于 ICL 的少样本泛化

据小米介绍,五年前 GPT-3 首次展示了通过自回归语言模型 + 大规模无标注数据训练,获得 In-Context Learning(ICL,上下文学习)能力,而在语音领域,现有的大模型仍严重依赖大规模标注数据难以适应新任务达到类人智能

而 Xiaomi-MiMo-Audio 模型打破了这种瓶颈,它基于创新预训练架构和上亿小时训练数据,在智商、情商、表现力与安全性在内的跨模态对齐能力均有提升,在自然度、情感表达和交互适配方面呈现出拟人化水准

这款模型的具体创新点如下:

  • 首次证明把语音无损压缩预训练 Scaling 至 1 亿小时可以“涌现”出跨任务的泛化性,表现为 Few-Shot Learning 能力。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

17岁小伙疑陷东南亚骗局 家人收其戴手铐跪地照片

大风新闻 浏览 17522

OpenAI 呼吁美国政府将芯片法案的税收抵免扩大至 AI 数据中心

IT之家 浏览 3475

斯科尔斯回应利马:有人踢了一场好球,真替你感到高兴

懂球帝 浏览 2598

伊姐周日热推:电视剧《生命树》;电视剧《风过留痕》......

伊周潮流 浏览 2523

以总理"碰瓷"中国 媒体:找错了对象更开错了药方

看看新闻Knews 浏览 15433

俄石油贸易商要求印度简化流程:直接付人民币

澎湃新闻 浏览 5088

这双鞋太流行了,比芭蕾鞋更少女,比玛丽珍更优雅

LinkFashion 浏览 2941

暴涨!全线拉升!芯片传闻,突然刷屏

券商中国 浏览 2636

熊园:“十五五”GDP目标——怎么定、定多少?

首席经济学家论坛 浏览 3740

里瑟:利物浦的排名会比曼联更高,但后者也需要重返英超前列

懂球帝 浏览 2989

女子被逼嫁给大15岁男子喝农药轻生 钱被母亲拿走买房

大风新闻 浏览 13759

媒体:欧洲有人或已接受让出格陵兰 希望美国留个体面

环球时报国际 浏览 13762

建设周期长且成本高昂,欧盟多国重拾核能挑战巨大

环球网资讯 浏览 1632

诋毁蚂蚁集团,粉丝超1亿“专家”被封禁,什么信号?

一见财经 浏览 1088

纯电续航751km 奥迪E7X将于5月8日预售

车质网 浏览 328

71岁朱时茂近况曝光!曾连续登春晚舞台

汪巗的创业之路 浏览 2025

苹果预计今年不会发布标准版 iPhone 18 推迟到 2027 年

威锋网 浏览 2747

闫学晶"哭穷"后多账号被禁止关注 其代言品牌:将索赔

红星新闻 浏览 7913

今日热点:金鸡奖提名发布会;霉霉不出演超级碗中场秀的原因……

伊周潮流 浏览 4372

直播间买货更放心了!两大新规封堵虚假宣传、仅退款乱象

贝壳财经 浏览 2369

告别“躺赚” 消金与小贷走向殊途

北京商报 浏览 2552
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1