关闭广告

小米开源语音大模型Xiaomi-MiMo-Audio,对话自然度达拟人水准

IT之家4431人阅读

IT之家 9 月 19 日消息,小米今天宣布开源首个原生端到端语音大模型 Xiaomi-MiMo-Audio,首次在语音领域实现基于 ICL 的少样本泛化

据小米介绍,五年前 GPT-3 首次展示了通过自回归语言模型 + 大规模无标注数据训练,获得 In-Context Learning(ICL,上下文学习)能力,而在语音领域,现有的大模型仍严重依赖大规模标注数据难以适应新任务达到类人智能

而 Xiaomi-MiMo-Audio 模型打破了这种瓶颈,它基于创新预训练架构和上亿小时训练数据,在智商、情商、表现力与安全性在内的跨模态对齐能力均有提升,在自然度、情感表达和交互适配方面呈现出拟人化水准

这款模型的具体创新点如下:

  • 首次证明把语音无损压缩预训练 Scaling 至 1 亿小时可以“涌现”出跨任务的泛化性,表现为 Few-Shot Learning 能力。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

车长5米3 华为乾崑奕境首款旗舰大六座SUV定名X9

网易汽车 浏览 751

德转:24岁马里中场孔特加盟北京国安,球员身价55万欧

懂球帝 浏览 2067

谷歌IMO金牌级Gemini 3深夜上线!华人大神挂帅,OpenAI无力反击

新智元 浏览 2470

美印友谊的中流砥柱被FBI大张旗鼓拘捕 被控"串通中国"

澎湃新闻 浏览 9225

剖析智元机器人:一场关于人才与资本的博弈

虎嗅APP 浏览 3746

“Mag 7”过时了?华尔街想要AI!

华尔街见闻官方 浏览 4158

郑丽文当选提三大原则 称绝不让台湾成为"麻烦制造者"

海峡导报社 浏览 7045

港股上市未满3个月,干了7年的期货公司董秘突然辞任

财通社 浏览 1763

华为Momenta争夺保时捷,全球大厂智驾再度“投华”

汽车公社 浏览 2695

A股特高压拉升!AI算力引爆电力刚需,巨头订单排至2027年

览富财经网 浏览 2522

海南"零关税"豪车引热议 保时捷卡宴鲜有符合要求车型

每日经济新闻 浏览 30740

5月首发亮相奕派M8 奕派科技4月销量20537辆

网易汽车 浏览 338

大车要做大,小车更加要——工信部第399批新车热评

吴佩频道 浏览 3707

遭美政府和科技企业联合施压 欧盟扛不住了又打算屈服

澎湃新闻 浏览 7551

方媛生三胎后现身芜湖,摘墨镜气血不足显憔悴

小椰的奶奶 浏览 2616

瓜帅:利物浦和阿森纳都在争冠;英超风格的改变?我会接受

懂球帝 浏览 3693

中国又一个伙伴倒向美国 撕毁合同把矛头对准中方

博览历史 浏览 12967

刚果(金)东北部遭武装组织袭击 至少36人死亡

国际在线 浏览 232

64岁男演员春节在景区打工,暴瘦引担忧!

扬子晚报 浏览 2027

杭州一区拟推出“养龙虾”十条!支持OpenClaw&OPC-STC发展

都市快报橙柿互动 浏览 1841

今日热点:迪士尼OpenAI合作;JENNIE和DEX将出演新综艺……

伊周潮流 浏览 2921
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1