关闭广告

马里兰大学与英特尔:AI视频字幕自动评分系统

科技行者3676人阅读


这项由马里兰大学巴尔的摩分校的Shubhashis Roy Dipta教授与英特尔实验室的Tz-Ying Wu、Subarna Tripathi等研究团队共同完成的研究发表于2024年9月,论文编号为arXiv:2509.16538v1。对于那些想要深入了解技术细节的读者,可以通过这个编号在学术数据库中查找完整论文。

当我们观看一段视频时,如果有人为这个视频写了一段描述文字,你如何判断这段描述是否准确呢?这听起来像是一个简单的问题,但对计算机来说却是一个巨大的挑战。就好比你请朋友帮你描述一幅画,你需要判断朋友的描述是否靠谱——但问题是,你手里没有这幅画的"标准答案"。

传统的做法就像考试时需要标准答案一样。研究人员会让人工写出视频的"正确"描述,然后用这些标准答案来评判其他描述的好坏。但这种方法有个致命问题:获得这些标准答案需要花费大量人力和金钱,而且当我们面对互联网上海量的视频时,根本不可能为每个视频都准备标准答案。

更糟糕的是,现有的评估方法就像一个粗心的老师,经常给错误的答案打高分。研究团队发现,即使一段描述把视频中的小提琴说成吉他,把男人说成女人,现有的评估系

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

马罗塔:国米不考虑中途换帅

体坛周报 浏览 4228

中国长安汽车发布“1445”全球战略 阿维塔深蓝将战略整合

网易汽车 浏览 769

死了么APP征集新中文名

扬子晚报 浏览 2637

殷桃|每个表情都让人欲罢不能

农城浪子 浏览 2708

海信CES发布全新一代RGB-Mini LED电视,搭载“玲珑4芯”真彩背光

IT之家 浏览 2694

媒体:一份非官方的美国就业数据 把美国投资者吓坏了

财联社 浏览 8337

刘宇宁一天迎来两个喜讯,秦海璐没说谎

贵州小娟 浏览 2806

秦昊一家五口度假,伊能静少女打扮但很显胖

八怪娱 浏览 2930

特朗普:泽连斯基阻挠俄乌达成和平协议

环球网资讯 浏览 2668

事关钓鱼岛、南海等问题 国防部最新回应

环球网资讯 浏览 2707

赖清德被迫取消窜访斯威士兰 更多细节披露

澎湃新闻 浏览 34333

年底是购车黄金期吗?看懂购置税博弈再下订不迟!

百姓评车 浏览 3644

或将年内上市 阿维塔全新旅行车谍照曝光

车质网 浏览 2387

宏福苑4小时内火警连升三级:单户最大面积44.9平方米

红星新闻 浏览 30504

这些老电影里的穿搭技巧,绝了!

Yuki女人故事 浏览 3126

2025羽绒服8大流行趋势,温暖时髦过冬天!

LinkFashion 浏览 2903

涉嫌支持台军心战大队 5家企业主营业务被曝光

日月谭天 浏览 7875

被金高银新剧种草了好多单品,从优衣库到爱马仕都帮大家扒出来了

黎贝卡的异想世界 浏览 2860

留几手维护闫学晶翻车!嘲讽短视频用户自卑又敏感,网友呼吁封号

萌神木木 浏览 2625

拟购半导体资产 英唐智控继续转型

北京商报 浏览 3484

美国喊停"毒计":会就相关问题跟中国谈判

澎湃新闻 浏览 9013
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1