关闭广告

马里兰大学与英特尔:AI视频字幕自动评分系统

科技行者903人阅读


这项由马里兰大学巴尔的摩分校的Shubhashis Roy Dipta教授与英特尔实验室的Tz-Ying Wu、Subarna Tripathi等研究团队共同完成的研究发表于2024年9月,论文编号为arXiv:2509.16538v1。对于那些想要深入了解技术细节的读者,可以通过这个编号在学术数据库中查找完整论文。

当我们观看一段视频时,如果有人为这个视频写了一段描述文字,你如何判断这段描述是否准确呢?这听起来像是一个简单的问题,但对计算机来说却是一个巨大的挑战。就好比你请朋友帮你描述一幅画,你需要判断朋友的描述是否靠谱——但问题是,你手里没有这幅画的"标准答案"。

传统的做法就像考试时需要标准答案一样。研究人员会让人工写出视频的"正确"描述,然后用这些标准答案来评判其他描述的好坏。但这种方法有个致命问题:获得这些标准答案需要花费大量人力和金钱,而且当我们面对互联网上海量的视频时,根本不可能为每个视频都准备标准答案。

更糟糕的是,现有的评估方法就像一个粗心的老师,经常给错误的答案打高分。研究团队发现,即使一段描述把视频中的小提琴说成吉他,把男人说成女人,现有的评估系

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

日本外务大臣:将探讨邀请泽连斯基出席G7广岛峰会

界面新闻 浏览 19198

短短五集,真实揭露当代年轻人的失业现状

毒舌电影 浏览 15698

蔚来"疯狂"招工:办公室挤不下去食堂面试 月薪可达8千

每日经济新闻 浏览 3867

极越汽车或迎新生机!

电动知家 浏览 405

近2万亿债务推进 出险房企提速化债

北京商报 浏览 613

俄实施大规模打击 乌多地军工企业和能源设施遭袭

每日经济新闻 浏览 593

无数辣妹的腰间 为何多出两根带子?

健身厨屋 浏览 14986

万达轴承:建设项目信披陷“罗生门” 已竣工背后转固金额现疑云

金证研 浏览 12485

小鹏能吃上英伟达的定制餐吗?

财经十一人官方 浏览 14058

脱口秀演员House演出剧院被罚款10万元

网易娱乐 浏览 16811

549分241板182助!约基奇三数据均为联盟第一:又要成历史首人?

罗说NBA 浏览 16607

西班牙诞生世界首个带新冠病毒抗体的婴儿,医生是这样说的

趣看热点 浏览 969397

没有人永远18岁,但北上广永远年轻

虎嗅APP 浏览 19266

E句话| 姐有新恋情啦?

仙女事件簿 浏览 907

媒体:"二普"隔空对话 普京讲话相比第一次有一点不同

直新闻 浏览 89423

汪峰也没想到,官宣恋情才1年,森林北竟走上了和章子怡一样的路

小娱乐悠悠 浏览 1611

北约秘书长提议让乌用北约武器打击俄领土 被呼吁辞职

环球网资讯 浏览 11382

武契奇:世界正处于第三次世界大战的边缘

环球网资讯 浏览 19414

张朝阳:AI让人人成为“知道分子”,但我们仍需思考丨2025世界互联网大会

红星资本局 浏览 645

三大运营商半年日均赚5.62亿元,云业务酣战升级

21世纪经济报道 浏览 14685

提升科技股估值容忍度 掘金AI“从1到10”爆发机遇

证券时报 浏览 1568
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1