关闭广告

马里兰大学与英特尔:AI视频字幕自动评分系统

科技行者3681人阅读


这项由马里兰大学巴尔的摩分校的Shubhashis Roy Dipta教授与英特尔实验室的Tz-Ying Wu、Subarna Tripathi等研究团队共同完成的研究发表于2024年9月,论文编号为arXiv:2509.16538v1。对于那些想要深入了解技术细节的读者,可以通过这个编号在学术数据库中查找完整论文。

当我们观看一段视频时,如果有人为这个视频写了一段描述文字,你如何判断这段描述是否准确呢?这听起来像是一个简单的问题,但对计算机来说却是一个巨大的挑战。就好比你请朋友帮你描述一幅画,你需要判断朋友的描述是否靠谱——但问题是,你手里没有这幅画的"标准答案"。

传统的做法就像考试时需要标准答案一样。研究人员会让人工写出视频的"正确"描述,然后用这些标准答案来评判其他描述的好坏。但这种方法有个致命问题:获得这些标准答案需要花费大量人力和金钱,而且当我们面对互联网上海量的视频时,根本不可能为每个视频都准备标准答案。

更糟糕的是,现有的评估方法就像一个粗心的老师,经常给错误的答案打高分。研究团队发现,即使一段描述把视频中的小提琴说成吉他,把男人说成女人,现有的评估系

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

苹果CEO库克上海两日行:看LABUBU,首次“直播带货”,直言“太爱中国人和中国文化”

澎湃新闻 浏览 3838

搭载闪充技术 比亚迪2026款海狮06EV售价15.99万元起

网易汽车 浏览 1730

刘晓庆回应年龄追问:关你们什么事

期望带来失望 浏览 2316

汪小菲又幸福了!和马筱梅搂腰拥抱好缠绵

疯说时尚 浏览 3651

黄金、白银突然暴跌!发生了什么?

中国品牌 浏览 2888

你觉得美,可能是大脑在偷偷节能|光锥读论文

未来光锥 浏览 3103

阳光电源:前三季度净利润119亿元 同比增长56%

网易财经 浏览 2955

全职主妇吞大量安眠药 丈夫:她觉得她是美女嫁我可惜

扬子晚报 浏览 6724

年度王炸爽剧,还是烂尾了

独立鱼 浏览 3449

4680电池的大饼,马斯克不想画了

远川科技评论 浏览 2613

AI聊天机器人背后的肯尼亚劳工:每条“我爱你”付费0.05美元

DeepTech深科技 浏览 2966

网红基金,历史性暴跌

中国新闻周刊 浏览 2472

韩安冉回应五婚,称暂时不会结烦了,与宋浩然离婚后仍每天见面

扒虾侃娱 浏览 3669

汪小菲接俩娃回北京过春节!玥儿和奶奶逛公园

地理三体说 浏览 2515

星空有约|冬夜焰火!双子座流星雨即将迎来极大

新华社 浏览 3146

蓝宝科技呼吁 GPU 制造商放宽限制,赋予板卡设计更大自主权

环球网资讯 浏览 2983

就两岸关系 郑丽文、马英九最新表态

新京报政事儿 浏览 8397

法尔克:曼城有意科隆前锋赛义德-马拉,巴黎和国米也在关注

懂球帝 浏览 3620

现在整个AI投资逻辑都错了!微软CEO首次承认:成排的H100正在积灰,插不上电

AI寒武纪 浏览 3511

复旦大学OpenNovelty:让AI成为学术论文同行评议的"火眼金睛"

科技行者 浏览 2754

阿森纳欧冠100胜分布:对西班牙球队16胜最多,对德法各11胜

懂球帝 浏览 3610
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1