关闭广告

GUI自动化的新突破:ServiceNow让AI更准确定位屏幕界面元素

科技行者798人阅读


这项由ServiceNow、魁北克人工智能研究院、蒙特利尔大学、约克大学、蒙特利尔理工学院和麦吉尔大学联合进行的研究发表于2025年10月,论文编号为arXiv:2510.03230v1。研究团队由王苏宇辰、张天宇、Ahmed Masry、Christopher Pal、Spandana Gella、刘邦和Perouz Taslakian等学者组成,他们致力于解决人工智能在GUI(图形用户界面)自动化中面临的核心难题。有兴趣深入了解的读者可以通过论文编号arXiv:2510.03230v1查询完整论文。

现代生活中,我们每天都要与各种软件界面打交道——从手机应用到电脑程序,从网页浏览到办公软件。如果能让人工智能像人类一样准确地识别和操作这些界面元素,将会极大提升工作效率。然而,要让AI准确找到屏幕上的按钮、文本框或菜单项,就像要求一个从未见过地图的人在陌生城市中找到特定建筑物一样困难。

这项研究的核心贡献在于解决了当前视觉语言模型在GUI定位任务中的一个根本性问题:如何将自然语言指令准确转换为屏幕上的像素坐标。研究团队发现,现有方法就像让一个盲人通过触摸来画地图一样效率低下,因为AI模型需要在没有明确参照物的

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

9.4分剧王回归,封神到最后一秒

独立鱼 浏览 1001

韩束向上,韩后向下

斑马消费 浏览 12657

银行长期限存款“退场”背后

北京商报 浏览 638

孙铭徽赛季总助攻307次继续领跑国内球员榜 赵继伟居次&高诗岩第3

直播吧 浏览 19423

今年火了一种穿搭 既简单又时髦

猫姐品衣有道 浏览 15403

女人过了50岁 这3种包包再喜欢也别背!

潮范儿 浏览 16353

宋仲基确认妻子今年生产:要在宝宝出生前疯狂约会

开开森森 浏览 39619

马斯克:推特将于本月晚些时候推出加密私信功能

界面新闻 浏览 19079

300135前三季度由盈转亏!池州国资入主后大动作,沥青龙头跨界投资半导体

时代周报 浏览 919

刘欢,早已走上另一条大道

奥字侃剧 浏览 827

黄子佼为脱罪庭上卖惨!自曝离婚请求轻判,律师痛批毁掉别人一生

萌神木木 浏览 876

兹维炮轰巴黎场地速度:太慢,弹跳忽高忽低,阿卡出局或与此有关

网球之家 浏览 725

AI眼镜,大厂第一战

脑极体 浏览 295

福建海警在金门附近海域开展执法巡查

央视新闻客户端 浏览 12427

建立互信和实现共赢,解读国有车企高层为何密集拜会任正非?

百姓评车 浏览 1547

日本考虑年内制定AI使用规则,或采取比欧盟更柔和立场

界面新闻 浏览 15120

普通人冬天就该这么穿,衣服不昂贵、搭配不老气,简单又日常

静儿时尚达人 浏览 246

多邻国大裁员,翻译也要被AI取代了?

刺猬公社 浏览 13089

韩雪在香港聚餐肤白貌美戴两块手表,饮食方式被骂

叶公子 浏览 16795

趋势!考核升级,全国多地探索从严管理新机制

识局 浏览 807

执法过严?拓王之战首节裁判合计吹罚21次犯规并出现31次罚球

懂球帝 浏览 993
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1