关闭广告

GUI自动化的新突破:ServiceNow让AI更准确定位屏幕界面元素

科技行者772人阅读


这项由ServiceNow、魁北克人工智能研究院、蒙特利尔大学、约克大学、蒙特利尔理工学院和麦吉尔大学联合进行的研究发表于2025年10月,论文编号为arXiv:2510.03230v1。研究团队由王苏宇辰、张天宇、Ahmed Masry、Christopher Pal、Spandana Gella、刘邦和Perouz Taslakian等学者组成,他们致力于解决人工智能在GUI(图形用户界面)自动化中面临的核心难题。有兴趣深入了解的读者可以通过论文编号arXiv:2510.03230v1查询完整论文。

现代生活中,我们每天都要与各种软件界面打交道——从手机应用到电脑程序,从网页浏览到办公软件。如果能让人工智能像人类一样准确地识别和操作这些界面元素,将会极大提升工作效率。然而,要让AI准确找到屏幕上的按钮、文本框或菜单项,就像要求一个从未见过地图的人在陌生城市中找到特定建筑物一样困难。

这项研究的核心贡献在于解决了当前视觉语言模型在GUI定位任务中的一个根本性问题:如何将自然语言指令准确转换为屏幕上的像素坐标。研究团队发现,现有方法就像让一个盲人通过触摸来画地图一样效率低下,因为AI模型需要在没有明确参照物的

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

别再穿“运动鞋”了!冬季这3双鞋子增高时髦,中年女人必备

静儿时尚达人 浏览 13365

7月2日外媒科学网站摘要:蚊子是否嗜血取决于它体内激素

网易科技报道 浏览 10610

美国前财长对"去美元化"焦虑:美国正失去全球影响力

直新闻 浏览 114585

离婚4年,42岁佟丽娅高调官宣喜讯

刘森森 浏览 721

E句话 | 没了于正的大饼,祝绪丹也有好饼

仙女事件簿 浏览 12803

杨紫连续七年为李现庆生,没有避嫌只有坦荡

娱乐寡姐 浏览 945

台"馆长"称"把赖清德狗头斩下来" 遭民进党当局约谈

环球时报新闻 浏览 17872

塞前总统去世 曾是南联盟唯一一位驻西方国家大使

新民周刊 浏览 94162

半裙搭配帆布鞋,初夏这样穿不出错

春菇凉时尚穿搭记 浏览 19083

此前5年常规赛库里每场至少命中1记三分 近1个月已2次三分0中

直播吧 浏览 12753

辛杰上任9个月辞去万科董事长职务 深铁系黄力平接任

每日经济新闻 浏览 4533

“龙茅”上市受捧,有平台加价超5000元! 分析师:不要急于“尝鲜”

金融投资报 浏览 12797

重磅!一文看懂巴菲特2023年股东大会

网易财经 浏览 18339

20万请曹姓明星带货3个月成交278元 公司起诉法院判了

都市快报橙柿互动 浏览 113038

《狂飙》高启盛做客网红直播间,强盛集团狂刷礼物

大傻说娱 浏览 19380

布劳恩登全美热搜:创29年纪录被赞完美表演 NCAA+NBA冠军来了?

颜小白的篮球梦 浏览 16552

市场监管总局:去年依法办结各类垄断案件187件

中国消费者报 浏览 16076

将于四季度上市 东风日产新款天籁亮相

车质网 浏览 910

泽连斯基:巴赫穆特战事"艰难而痛苦" 但乌军将坚守

环球网资讯 浏览 19311

每体:拉波尔塔、德科将出席贝肯鲍尔的追悼会

懂球帝 浏览 12463

加速推进!机器人板块传出大消息!

扬子晚报 浏览 172
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1