关闭广告

IDEA研究院发布LEMAS:首个15万小时多语言语音数据集

科技行者2623人阅读


科技发展到今天,人工智能已经能够模仿人类的声音说话了。然而,如果你曾经尝试过让AI说其他语言,比如让一个英语AI说中文,你可能会发现它的口音怪异,发音不准,甚至完全听不懂在说什么。这就像是一个只会说英语的人硬要说中文,结果说得让人啼笑皆非。这背后的根本问题是什么呢?缺乏高质量的多语言语音数据。

由国际数字经济研究院(IDEA)主导的研究团队最近发表了一项突破性成果,这项研究发表于2025年1月的arXiv预印本服务器上,论文编号为arXiv:2601.04233v1。感兴趣的读者可以通过这个编号查询完整论文。研究团队构建了一个名为LEMAS的庞大语音数据集,包含超过15万小时的多语言语音数据,覆盖10种主要语言,并且每个词都有精确的时间戳标注。基于这个数据集,他们还开发了两个强大的AI模型:LEMAS-TTS和LEMAS-Edit,前者专门负责语音合成,后者专门负责语音编辑。

为了理解这项研究的重要性,我们可以把语音AI比作一位多语言播音员。传统的播音员要想掌握多种语言,需要大量的训练素材和精确的指导。同样,AI要想说好多种语言,也需要海量的高质量语音数据作为"教材"。但现有的多语言语音数据存在许多问题:要么

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

先索尼后徕卡,为何这些国际巨头都被中国企业吞下?

BT财经 浏览 2437

队报:马尔基尼奥斯伤病恢复慢于预期,将缺席本周法甲比赛

懂球帝 浏览 3763

刚刚,全球首个GB300巨兽救场!一年烧光70亿,OpenAI内斗GPU惨烈

新智元 浏览 3765

铜梁龙李镇全谈冲超:有这么多人支持我们,为什么不能冲超?

懂球帝 浏览 3448

以军称打死哈马斯高级指挥 哈马斯发声

每日经济新闻 浏览 2944

算法工程师想在女友面前秀技术“养龙虾”,结果文件夹被全删 周鸿祎称“龙虾”更像个实习生

红星新闻 浏览 1760

上年纪的女人穿衣别焦虑,试试这几个搭配套路,优雅还减龄

静儿时尚达人 浏览 3492

郝蕾跟辛芷蕾杠上了?

大龄女一晓彤 浏览 3363

香港大学AI程序员超越人类:一键将科学论文变成完整代码库

科技行者 浏览 2673

大搞权钱交易和家族式腐败 湖北省委原书记蒋超良被诉

扬子晚报 浏览 109194

M3旅行版上市售94.39万元 告别平行进口

网易汽车 浏览 3423

英媒抛出谬论:中国的空气质量改善 加速了全球变暖

环球时报国际 浏览 9805

冬季穿衣不用太复杂!内搭选高领、外套选简约款,大方又耐看

静儿时尚达人 浏览 2018

港姐亚军自曝遭网暴!骚扰者竟是小区保安

TVB剧评社 浏览 3643

“大起”被防住后,下周A股怎么走?

每经牛眼 浏览 2550

非足联官方:强烈谴责决赛期间不当行为,目前正审查相关画面

懂球帝 浏览 2575

汪小菲又幸福了!和马筱梅搂腰拥抱好缠绵

疯说时尚 浏览 3649

恩里克:萨福诺夫是我执教过的最擅长点球预判的门将

懂球帝 浏览 2383

U16国足4-1复仇朝鲜!终结热身2连败 15岁红星大四喜+一条龙爆射

我爱英超 浏览 3769

收藏!2026乒乓赛历出炉:全年63站以上,运动员体能迎来严峻考验

乒谈 浏览 2889

媒体人:国足主帅应让中青年土帅担纲,说不定杀出一位霍去病

懂球帝 浏览 4428
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1