关闭广告

上海AI实验室团队首创视频驱动交互网页重建基准

科技行者886人阅读


这项由上海AI实验室、浙江大学、中国科学技术大学深圳分校等机构联合完成的突破性研究发表于2025年9月,论文编号为arXiv:2509.24709。研究团队包括陈阳、刘明浩、沈雨帆等多位来自不同院校的研究者,项目由上海AI实验室的沈雨帆教授领导。有兴趣深入了解的读者可以通过该论文编号查询完整论文内容。

当我们浏览网页时,看到精美的界面、流畅的动画效果和各种交互功能,很少有人会想到这背后需要大量的代码来支撑。传统上,要让AI学会制作网页,研究者们通常只给它看静态的截图,然后让它生成对应的代码。这就像让一个人仅凭一张照片就要画出整幅画作一样,缺少了很多重要信息。

然而,真实的网页远比静态截图复杂得多。当用户点击按钮时页面会发生变化,当鼠标悬停在某个区域时会出现新的内容,当用户填写表单时系统会给出相应反馈。这些动态的交互过程包含了网页运作的核心逻辑,但在传统的AI训练方法中却被完全忽略了。

正是在这样的背景下,研究团队提出了一个革命性的想法:为什么不让AI观看完整的用户操作视频,就像人类学习使用软件一样,通过观察整个交互过程来理解网页的工作原理呢?

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

宝刀不老,34岁加纳老将乔丹-阿尤献7球7助攻率队直通世界杯

懂球帝 浏览 1039

卡塔尔首相与法国总统举行会谈 重点讨论加沙局势

上观新闻 浏览 1020

春敏,可不是单纯的皮肤敏感!

时尚COSMO 浏览 11682

乔治罚球绝杀,快船113-112战胜开拓者

趣看热点 浏览 25530

较劲多年,西北最硬核城市“抱团”了

城市进化论 浏览 12829

媒体:瓦格纳从莫斯科掉头转向基辅 美国现在有点懵

上游新闻 浏览 15751

了解今年早春的3个流行趋势,真是好看不挑人,再不怕显土了

静儿时尚达人 浏览 11605

TikTok电商明年GMV目标达500亿美元,东南亚与美国并进

IT之家 浏览 12869

特斯拉全美工厂工人涨薪,马斯克成本压力加剧

IT之家 浏览 12545

粉色涂装 雷克萨斯Glam LX概念车发布

车质网 浏览 1577

刘嘉玲和刘晓庆同穿吊带泳装 气质画风大不同

木子爱娱乐大号 浏览 19664

更换平面化设计 马自达全新品牌LOGO发布

车质网 浏览 743

记者:湖人近期很活跃,和开拓者、爵士、篮网等队有潜在交易

懂球帝 浏览 10393

用重罚来逼迫商家“限价”,京东在焦虑什么?

斑马消费 浏览 858

主力车增配降价,丰田销量明显上涨,能带动日系车反攻吗?

路咖汽车 浏览 1516

315回头看丨羽感防晒翻车后,珀莱雅正推同系列新品,“生产环节不稳定”问题解决了?

红星资本局 浏览 19638

在泰国,比亚迪挑战丰田

晚点LatePost 浏览 10580

郝蕾风波升级!被扒曾参演《狂野时代》闹掰,辛芷蕾发声打脸她

萌神木木 浏览 693

津媒:方镜淇、徐嘉敏良性竞争相互促进,没有影响彼此友情

直播吧 浏览 19237

还是这些穿搭适合秋天!衣服多穿一下“基础款”,百搭又舒适

静儿时尚达人 浏览 1027

媒体:美国解除对白制裁 系大国格局中精心策划的变动

上观新闻 浏览 12367
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1