关闭广告

上海AI实验室团队首创视频驱动交互网页重建基准

科技行者3545人阅读


这项由上海AI实验室、浙江大学、中国科学技术大学深圳分校等机构联合完成的突破性研究发表于2025年9月,论文编号为arXiv:2509.24709。研究团队包括陈阳、刘明浩、沈雨帆等多位来自不同院校的研究者,项目由上海AI实验室的沈雨帆教授领导。有兴趣深入了解的读者可以通过该论文编号查询完整论文内容。

当我们浏览网页时,看到精美的界面、流畅的动画效果和各种交互功能,很少有人会想到这背后需要大量的代码来支撑。传统上,要让AI学会制作网页,研究者们通常只给它看静态的截图,然后让它生成对应的代码。这就像让一个人仅凭一张照片就要画出整幅画作一样,缺少了很多重要信息。

然而,真实的网页远比静态截图复杂得多。当用户点击按钮时页面会发生变化,当鼠标悬停在某个区域时会出现新的内容,当用户填写表单时系统会给出相应反馈。这些动态的交互过程包含了网页运作的核心逻辑,但在传统的AI训练方法中却被完全忽略了。

正是在这样的背景下,研究团队提出了一个革命性的想法:为什么不让AI观看完整的用户操作视频,就像人类学习使用软件一样,通过观察整个交互过程来理解网页的工作原理呢?

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

预售20.99万元起 新款领克10正式下线

车质网 浏览 325

范乔丹:小卡刚来猛龙就说会走 感谢他让我赚大钱

体坛周报 浏览 3015

业内独家无孔真全面屏!努比亚Z80 Ultra获认证:支持90W快充

快科技 浏览 4274

以军称地面攻势要打数月 以防长:加沙正在燃烧

新华社 浏览 4444

马年壁纸送上,祝大家新年快乐,马上发财!

黎贝卡的异想世界 浏览 2079

非足联官方:强烈谴责决赛期间不当行为,目前正审查相关画面

懂球帝 浏览 2574

你的包挂挺“妆”的

时尚COSMO 浏览 993

萨巴伦卡丢六赛点惨遭30号种子巴蒂斯特逆转,无缘马德里四强

懂球帝 浏览 499

高市早苗:若执政党阵营在选举中未过半数 将即刻辞职

界面新闻 浏览 6856

白宫发了张图:“痛击加拿大鹅”

大风新闻 浏览 38602

小米通报与“大熊”合作处理结果:辞退涉事经办人员

三言科技 浏览 2711

东体:傅欢大概率留在海港;防线还会是引援方向

懂球帝 浏览 2403

特朗普:战事不是挡箭牌 乌克兰该选举了

澎湃新闻 浏览 2197

你敢变重6公斤吗?

时尚COSMO 浏览 224

知名策略师预警:美股“聪明钱”已离场看戏,找不到值得买的票

财通社 浏览 3357

3名00后全国"刮腻子"团队年入百万:凌晨三点在焊钢架

潇湘晨报 浏览 6418

E句话| 《繁花》剧组又回应了?

仙女事件簿 浏览 3444

真爱大牌 || 用了5年才敢说,多亏它帮我守住了发际线

黎贝卡的异想世界 浏览 2984

记者谈马宁连出三红:密集出牌虽彰显权威,却也容易激化矛盾

懂球帝 浏览 3928

工信部第405批申报图曝光:比亚迪、华为系全面出击

网易汽车 浏览 1689

周杰伦蹭霉霉热度翻车!又被质疑崇洋媚外,近些年口碑越来越差

萌神木木 浏览 3595
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1