关闭广告

马里兰大学与英特尔:AI视频字幕自动评分系统

科技行者3687人阅读


这项由马里兰大学巴尔的摩分校的Shubhashis Roy Dipta教授与英特尔实验室的Tz-Ying Wu、Subarna Tripathi等研究团队共同完成的研究发表于2024年9月,论文编号为arXiv:2509.16538v1。对于那些想要深入了解技术细节的读者,可以通过这个编号在学术数据库中查找完整论文。

当我们观看一段视频时,如果有人为这个视频写了一段描述文字,你如何判断这段描述是否准确呢?这听起来像是一个简单的问题,但对计算机来说却是一个巨大的挑战。就好比你请朋友帮你描述一幅画,你需要判断朋友的描述是否靠谱——但问题是,你手里没有这幅画的"标准答案"。

传统的做法就像考试时需要标准答案一样。研究人员会让人工写出视频的"正确"描述,然后用这些标准答案来评判其他描述的好坏。但这种方法有个致命问题:获得这些标准答案需要花费大量人力和金钱,而且当我们面对互联网上海量的视频时,根本不可能为每个视频都准备标准答案。

更糟糕的是,现有的评估方法就像一个粗心的老师,经常给错误的答案打高分。研究团队发现,即使一段描述把视频中的小提琴说成吉他,把男人说成女人,现有的评估系

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

这些才是最适合普通人的穿搭!上衣修身、一衣多穿,大方简约

静儿时尚达人 浏览 765

宋小宝春晚临时瞎编一句话红遍全国

乡野小珥 浏览 3610

哈马斯同意“20点计划”提议:释放所有以色列人质

央视新闻客户端 浏览 3875

外国女教师性侵16岁男学生数月上百次 详情炸裂

胡侃社会百态 浏览 39077

看起来很好亲的唇,能养出来?

时尚COSMO 浏览 2739

千亿豪赌,甲骨文会成“甲骨文”?

每日资本论 浏览 3020

媒体:中美元首打电话"提及台湾" 极为重要、极不寻常

环球网资讯 浏览 15856

2026品牌抢滩战:从野蛮生长,到“唯人格化”

霞光社 浏览 530

从嬉皮士到硅谷教父,他写了一本关于“维修”的书

DeepTech深科技 浏览 782

让AI学会"边看边判断":韩国GIST团队突破视频实时事件分割技术

科技行者 浏览 3414

“胡润富豪”扎堆的“家族办公室”是啥?

野马财经 浏览 1917

走过五年黑暗隧道后,江小白靠一瓶酒杀回来

财经无忌 浏览 2647

修杰楷承认逃兵役!曾花钱造出假病历,贾静雯回应称孩子受到惊吓

萌神木木 浏览 3736

营收147亿的半导体资产遭冻结 闻泰科技:坚决反对

21世纪经济报道 浏览 3753

优质智能体验/1.5T增程 别克至境L7正式亮相

网易汽车 浏览 4596

5部电影亏了8亿,古天乐不甘心,又带来三部生猛大片

娱乐圈笔娱君 浏览 2699

超70亿独角兽“原地解散”,无人车赛道却将爆发?

虎嗅APP 浏览 3221

多家房企称已不被要求上报三道红线 仍需提交资产负债率指标

财联社 浏览 2484

中国灵芝第一股寿仙谷,致敬保健产业30年

证券市场周刊 浏览 4471

何炅瞒着谢娜现身演唱会,现场发言一度抹泪

韩小娱 浏览 322

伊朗军官:美以不再能随心所欲结束战争

央视新闻客户端 浏览 1776
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1