关闭广告

马里兰大学与英特尔:AI视频字幕自动评分系统

科技行者3683人阅读


这项由马里兰大学巴尔的摩分校的Shubhashis Roy Dipta教授与英特尔实验室的Tz-Ying Wu、Subarna Tripathi等研究团队共同完成的研究发表于2024年9月,论文编号为arXiv:2509.16538v1。对于那些想要深入了解技术细节的读者,可以通过这个编号在学术数据库中查找完整论文。

当我们观看一段视频时,如果有人为这个视频写了一段描述文字,你如何判断这段描述是否准确呢?这听起来像是一个简单的问题,但对计算机来说却是一个巨大的挑战。就好比你请朋友帮你描述一幅画,你需要判断朋友的描述是否靠谱——但问题是,你手里没有这幅画的"标准答案"。

传统的做法就像考试时需要标准答案一样。研究人员会让人工写出视频的"正确"描述,然后用这些标准答案来评判其他描述的好坏。但这种方法有个致命问题:获得这些标准答案需要花费大量人力和金钱,而且当我们面对互联网上海量的视频时,根本不可能为每个视频都准备标准答案。

更糟糕的是,现有的评估方法就像一个粗心的老师,经常给错误的答案打高分。研究团队发现,即使一段描述把视频中的小提琴说成吉他,把男人说成女人,现有的评估系

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

美国政府效率部提前解散

北京商报 浏览 3214

马克龙要建欧洲有史以来最大航母 "掠食者"表述不寻常

新京报 浏览 29871

微软团队突破性研究:AI网页助手终于学会在新网站"随机应变"了

科技行者 浏览 2502

年味拉满,好笑戳心,春节档还得看他们!

吐槽电影院 浏览 2053

美军大兵压境 委内瑞拉发现一邻国与中情局勾结

上观新闻 浏览 2838

星光大赏残酷名利场:张国立赵露思坐第一排C位,座位图等级分明

娱乐圈笔娱君 浏览 3053

涉及中国 日本高官公开道歉并撤回错误言论

环球时报国际 浏览 35662

朱丹周一围带娃大理度假,两人很有夫妻相

凛若秋霜 浏览 321

伯利再挖布莱顿,邮报:前布莱顿技术总监威尔加盟斯特拉斯堡

懂球帝 浏览 3528

为拍电影与父母闹掰的翁虹 不让女儿进娱乐圈

二妹扯娱 浏览 3739

上年纪的姐妹们别慌!“反油腻”穿搭就这两招,时髦又显气质

静儿时尚达人 浏览 3675

资产上亿女老板突然失联 知情人:疑似被骗去泰国

上观新闻 浏览 22825

Anthropic指控DeepSeek等中国AI大模型抄袭 遭马斯克贴脸开骂:贼喊捉贼 大规模窃秘数据

快科技 浏览 2005

55岁郑丽文当选国民党主席 其被视为"非典型国民党人"

中国青年报 浏览 7329

MINI与Paul Smith合作推出设计师款 东京车展首秀

网易汽车 浏览 3545

北京105-74终结广东8连胜,曾凡博回归18分,徐杰伤退,萨姆纳35分

懂球帝 浏览 2889

莱因克尔:对阵勒沃库森时哈弗茨应首发,他能提供更多东西

懂球帝 浏览 1675

导演们,该有危机意识了!野生创作正在崛起

时尚COSMO 浏览 2403

德国总理首次访华时间被指敲定 高级经济代表团将跟随

澎湃新闻 浏览 6986

创三年新低 销量暴跌63% 超越特斯拉难不难?

正在说车 浏览 3323

特朗普威胁哥伦比亚总统:马杜罗之后就是你

澎湃新闻 浏览 20639
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1