关闭广告

上海AI实验室团队首创视频驱动交互网页重建基准

科技行者3546人阅读


这项由上海AI实验室、浙江大学、中国科学技术大学深圳分校等机构联合完成的突破性研究发表于2025年9月,论文编号为arXiv:2509.24709。研究团队包括陈阳、刘明浩、沈雨帆等多位来自不同院校的研究者,项目由上海AI实验室的沈雨帆教授领导。有兴趣深入了解的读者可以通过该论文编号查询完整论文内容。

当我们浏览网页时,看到精美的界面、流畅的动画效果和各种交互功能,很少有人会想到这背后需要大量的代码来支撑。传统上,要让AI学会制作网页,研究者们通常只给它看静态的截图,然后让它生成对应的代码。这就像让一个人仅凭一张照片就要画出整幅画作一样,缺少了很多重要信息。

然而,真实的网页远比静态截图复杂得多。当用户点击按钮时页面会发生变化,当鼠标悬停在某个区域时会出现新的内容,当用户填写表单时系统会给出相应反馈。这些动态的交互过程包含了网页运作的核心逻辑,但在传统的AI训练方法中却被完全忽略了。

正是在这样的背景下,研究团队提出了一个革命性的想法:为什么不让AI观看完整的用户操作视频,就像人类学习使用软件一样,通过观察整个交互过程来理解网页的工作原理呢?

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

2025年ETF盘点:冠军花落通信ETF,年度黑马竟是它!十大关键事件影响深远

每经牛眼 浏览 2761

业内独家无孔真全面屏!努比亚Z80 Ultra获认证:支持90W快充

快科技 浏览 4277

让智驾能看懂真实世界 英伟达发布开源Alpamayo平台

网易汽车 浏览 2791

美媒称马杜罗请求普京提供导弹等援助 佩斯科夫回应

环球时报国际 浏览 9319

为嫁"高富帅"与母亲互殴 31岁女子道歉:给他花90多万

潇湘晨报 浏览 7951

1399元,JBL SOUNDGEAR CLIPS琉璃扣耳机预售

IT之家 浏览 3236

月之暗面创始人杨植麟:中国技术不仅要好用还要参与制定规则

IT之家 浏览 2711

高市早苗APEC会议期间与台湾地区人员会面 国台办回应

澎湃新闻 浏览 8795

国家医保局:职工医保个人账户跨省共济今年全国覆盖

商业观察杂志社 浏览 1949

周杰伦带王俊凯陈奕迅聚餐 畅聊音乐

韩小娱 浏览 2406

15万预算“抄底”自主SUV 这几款车型闭眼入

独家引擎 浏览 2767

俄在日本海演习击沉假想敌潜艇

参考消息网 浏览 3474

西媒:梅西造访诺坎普未提前联系巴萨,但俱乐部显然知情

懂球帝 浏览 3482

美联储主席最热人选哈塞特:CPI报告好得令人震惊,美联储有很大空间可以降息

华尔街见闻官方 浏览 3150

官方:阿根廷U20主力中卫皮耶拉尼左膝扭伤;据悉无法出战半决赛

懂球帝 浏览 3759

上海AI实验室推出ATLAS:让AI在科学推理中"败下阵来"的超级考场

科技行者 浏览 2649

活塞99-98险胜老鹰,杜伦21分11板,杰伦-约翰逊空砍29+13

懂球帝 浏览 3134

媒体:在21世纪20年代 美国总统要向外派出"总督大人"

新民周刊 浏览 6214

傍上 “新中式”,现制酸奶能迎来 “二次爆发” 吗?

餐饮老板内参 浏览 3063

伊拉克国防部:已全面接管阿萨德空军基地

极目新闻 浏览 2628

硅谷投资人盛赞特斯拉人形机器人:将令人忘掉特斯拉造过车

澎湃新闻 浏览 2633
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1