关闭广告

小米开源语音大模型Xiaomi-MiMo-Audio,对话自然度达拟人水准

IT之家1649人阅读

IT之家 9 月 19 日消息,小米今天宣布开源首个原生端到端语音大模型 Xiaomi-MiMo-Audio,首次在语音领域实现基于 ICL 的少样本泛化

据小米介绍,五年前 GPT-3 首次展示了通过自回归语言模型 + 大规模无标注数据训练,获得 In-Context Learning(ICL,上下文学习)能力,而在语音领域,现有的大模型仍严重依赖大规模标注数据难以适应新任务达到类人智能

而 Xiaomi-MiMo-Audio 模型打破了这种瓶颈,它基于创新预训练架构和上亿小时训练数据,在智商、情商、表现力与安全性在内的跨模态对齐能力均有提升,在自然度、情感表达和交互适配方面呈现出拟人化水准

这款模型的具体创新点如下:

  • 首次证明把语音无损压缩预训练 Scaling 至 1 亿小时可以“涌现”出跨任务的泛化性,表现为 Few-Shot Learning 能力。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

美股周三:科技股领跌,亚马逊跌超4%,谷歌和微软跌超3%

网易科技报道 浏览 16744

布伦森本赛季出战40场4次砍下40+ 上赛季出场68次也是4场40+

直播吧 浏览 12909

小伙用"摇一摇"睡了多名女子 还在车上与多人发生关系

胖胖侃咖 浏览 74174

有效学习港风穿搭 30年后也不过时

YOKA网 浏览 14827

机长与乘务长互殴事件最新进展,涉事两人被终身停飞

趣看热点 浏览 690769

今年最火的5双鞋,承包一整年的好看时髦!

LinkFashion 浏览 13150

台湾省金钟奖成了“照妖镜”,小S拿奖后,破防人算是照明白了

娱乐圈笔娱君 浏览 895

第二次学贾玲也没用,亏损超1亿?

靠谱电影君 浏览 820

产品力再提升 全新雪佛兰Bolt EV新车图解

车质网 浏览 729

立陶宛称中国有可能干涉立陶宛大选 外交部:没有兴趣

外交部网站 浏览 82645

最熟悉的男演员已离世!连续5日家中吐血,62岁一睡不起

娱乐白名单 浏览 12143

凌晨!全线大涨!美联储宣布:降息!鲍威尔重磅发声!

券商中国 浏览 71

越南首富范日旺担任旗下电动汽车制造商Vinfast首席执行官

界面新闻 浏览 12663

色彩凝聚笔尖,描绘双唇明眸之美

时尚COSMO 浏览 739

五年十代攻关 浙大成功培育高锌水稻“全能选手”

环球网资讯 浏览 973

美媒自揭赚钱套路:兜售高校排名“徽章”

环球网资讯 浏览 12440

博主打假"鬼秤"77g黄金仅称出62g 商家被罚款22000元

每日经济新闻 浏览 77827

辛杰上任9个月辞去万科董事长职务 深铁系黄力平接任

每日经济新闻 浏览 4547

警惕特朗普TACO交易割韭菜

尺度商业 浏览 1003

宁德时代股价连续遭摩根士丹利下调?大摩想干嘛?

江瀚视野 浏览 16136

今日热点:卢靖姗韩庚官宣二胎出生;路行退出《再见爱人5》……

伊周潮流 浏览 827
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1