关闭广告

GUI自动化的新突破:ServiceNow让AI更准确定位屏幕界面元素

科技行者3630人阅读


这项由ServiceNow、魁北克人工智能研究院、蒙特利尔大学、约克大学、蒙特利尔理工学院和麦吉尔大学联合进行的研究发表于2025年10月,论文编号为arXiv:2510.03230v1。研究团队由王苏宇辰、张天宇、Ahmed Masry、Christopher Pal、Spandana Gella、刘邦和Perouz Taslakian等学者组成,他们致力于解决人工智能在GUI(图形用户界面)自动化中面临的核心难题。有兴趣深入了解的读者可以通过论文编号arXiv:2510.03230v1查询完整论文。

现代生活中,我们每天都要与各种软件界面打交道——从手机应用到电脑程序,从网页浏览到办公软件。如果能让人工智能像人类一样准确地识别和操作这些界面元素,将会极大提升工作效率。然而,要让AI准确找到屏幕上的按钮、文本框或菜单项,就像要求一个从未见过地图的人在陌生城市中找到特定建筑物一样困难。

这项研究的核心贡献在于解决了当前视觉语言模型在GUI定位任务中的一个根本性问题:如何将自然语言指令准确转换为屏幕上的像素坐标。研究团队发现,现有方法就像让一个盲人通过触摸来画地图一样效率低下,因为AI模型需要在没有明确参照物的

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

衣服其实没有必要买很贵,准备这三件基础款,百搭实用又不挑人

静儿时尚达人 浏览 200

小川航基:没赢下巴拉圭心有不甘;对阵巴西的机会肯定会更少

懂球帝 浏览 3696

何小鹏邀罗永浩体验 VLA:好产品不怕检验 罗永浩回应笑翻网友

快科技 浏览 1642

加沙地带民防部门:以军袭击一车辆 同一家庭9人死亡

央视新闻客户端 浏览 3761

马斯克2025最新深度长访谈:从政府效率到宇宙尽头

不看车bukanche 浏览 3012

张元英又作大死?香港相关言论炸锅了

小徐讲八卦 浏览 2880

京东再出重拳!联手长安设计开发新能源无人智能化车型以及城市智慧物流

封面新闻 浏览 3706

雷克萨斯NX绝色限定版上市 售价30.96万起

车质网 浏览 2650

惨!拍完被雪藏8年,李幼斌耗资1亿拍战争大片,没上映就被判死刑

靠谱电影君 浏览 3443

限时6.58万起 2026款吉利星愿正式上市

网易汽车 浏览 3939

特斯拉前全球销售主管爆猛料

电动知家 浏览 3013

NBA战报:猛龙112-101骑士,埃文-莫布利29分

懂球帝 浏览 3531

为财政刺激计划融资,日本拟增发逾11.5万亿日元新债

华尔街见闻官方 浏览 3201

歌手黄安:屠颖因在跑步机上摔跤致颅内出血去世

红星新闻 浏览 9487

利昂-贝利替补出场20分钟后被换下,赛季未过半已经受伤三次

懂球帝 浏览 2893

尚界H5成20万元内唯一超五星安全认证车型 余承东:这个有点厉害

快科技 浏览 1679

印度空难唯一幸存者饱受PTSD折磨 至今无法与妻儿说话

扬子晚报 浏览 8973

台湾一古宅所有正房大门都向着大陆 原因让人动容

都市快报橙柿互动 浏览 9493

特斯拉你学坏了!发文内涵国内车企,国产纯电轿车、SUV挨个躺枪

小李车评李建红 浏览 2954

中科院突破:AI实现持续学习不忘旧知

科技行者 浏览 3721

今年冬天最流行搭配:裤子+靴子,高级又时髦!

LinkFashion 浏览 3172
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1