关闭广告

IDEA研究院发布LEMAS:首个15万小时多语言语音数据集

科技行者2622人阅读


科技发展到今天,人工智能已经能够模仿人类的声音说话了。然而,如果你曾经尝试过让AI说其他语言,比如让一个英语AI说中文,你可能会发现它的口音怪异,发音不准,甚至完全听不懂在说什么。这就像是一个只会说英语的人硬要说中文,结果说得让人啼笑皆非。这背后的根本问题是什么呢?缺乏高质量的多语言语音数据。

由国际数字经济研究院(IDEA)主导的研究团队最近发表了一项突破性成果,这项研究发表于2025年1月的arXiv预印本服务器上,论文编号为arXiv:2601.04233v1。感兴趣的读者可以通过这个编号查询完整论文。研究团队构建了一个名为LEMAS的庞大语音数据集,包含超过15万小时的多语言语音数据,覆盖10种主要语言,并且每个词都有精确的时间戳标注。基于这个数据集,他们还开发了两个强大的AI模型:LEMAS-TTS和LEMAS-Edit,前者专门负责语音合成,后者专门负责语音编辑。

为了理解这项研究的重要性,我们可以把语音AI比作一位多语言播音员。传统的播音员要想掌握多种语言,需要大量的训练素材和精确的指导。同样,AI要想说好多种语言,也需要海量的高质量语音数据作为"教材"。但现有的多语言语音数据存在许多问题:要么

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

华东智能无人系统试验测试认证基地全面完工 占地76亩

财闻 浏览 3713

法甲:马赛2比1客胜斯特拉斯堡

体坛周报 浏览 4108

敷尔佳:定价过高、盟友倒戈,重营销模式难掩发展困境|ESG案例

网易财经ESG 浏览 2913

全世界都被肯德基骗了?公开配方成营销噱头真的好吗?

江瀚视野 浏览 3764

大鹏工业:外购标准件采购占比超七成 自研的被评奖项目背后现客户

金证研 浏览 3674

伊姐周日热推:电视剧《看得见风景的窗》;电视剧《春日狂热》......

伊周潮流 浏览 2652

塞维利亚总监:没有薪资空间引入拉莫斯,目前不考虑补强中卫

懂球帝 浏览 2377

以色列:随时重返战场

极目新闻 浏览 1056

以军一天内93次袭击加沙致70人死亡

国际在线 浏览 3813

日股大跌,政坛地震威胁“高市交易”

国际金融报 浏览 3767

上海核药概念验证联盟成立,将加速核医学成果临床转化

上观新闻 浏览 2601

拼多多没活成“别人家的孩子”

老斯基财经 浏览 3689

兰博基尼Athon概念车:破产边缘的设计奇迹

老爷车 浏览 3712

新款狮铂拓界暂定明年3月份上市!若12万能火吗?

汽车网评 浏览 3040

北美夺冠,中国票房从7.8亿跌到6400万,这块金字招牌算砸了?

靠谱电影君 浏览 3366

欧足联临时禁赛普雷斯蒂安尼依据:捂嘴、维尼修斯&姆巴佩证词等

懂球帝 浏览 2034

蚂蚁阿福声明:问答结果中无任何广告推荐、不存在商业排名

三言科技 浏览 2216

江一燕8年前与赵汉唐因戏结缘 最后同框在今年4月

萌神木木 浏览 3528

杨振宁和她的53年婚姻,是这样的

Yuki女人故事 浏览 3664

女子刚分的新房开着条缝 进门后发现地上有烧纸的灰烬

1818黄金眼 浏览 7093

黄宗泽哭着拿双料视帝,10次提名终于熬出头

手工制作阿歼 浏览 2731
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1