关闭广告

GUI自动化的新突破:ServiceNow让AI更准确定位屏幕界面元素

科技行者780人阅读


这项由ServiceNow、魁北克人工智能研究院、蒙特利尔大学、约克大学、蒙特利尔理工学院和麦吉尔大学联合进行的研究发表于2025年10月,论文编号为arXiv:2510.03230v1。研究团队由王苏宇辰、张天宇、Ahmed Masry、Christopher Pal、Spandana Gella、刘邦和Perouz Taslakian等学者组成,他们致力于解决人工智能在GUI(图形用户界面)自动化中面临的核心难题。有兴趣深入了解的读者可以通过论文编号arXiv:2510.03230v1查询完整论文。

现代生活中,我们每天都要与各种软件界面打交道——从手机应用到电脑程序,从网页浏览到办公软件。如果能让人工智能像人类一样准确地识别和操作这些界面元素,将会极大提升工作效率。然而,要让AI准确找到屏幕上的按钮、文本框或菜单项,就像要求一个从未见过地图的人在陌生城市中找到特定建筑物一样困难。

这项研究的核心贡献在于解决了当前视觉语言模型在GUI定位任务中的一个根本性问题:如何将自然语言指令准确转换为屏幕上的像素坐标。研究团队发现,现有方法就像让一个盲人通过触摸来画地图一样效率低下,因为AI模型需要在没有明确参照物的

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

田栩宁恋情风波再升级!疑似若若回应恋情,喊话外界少打听别惹她

萌神木木 浏览 1012

过时的拍照姿势,毁了多少普通女孩?

Yuki女人故事 浏览 1811

宗馥莉辞职内幕曝光,大女主的复仇之路,如何伤了娃哈哈?

北向财经 浏览 1001

一对农民夫妻1300斤蔬菜卖15块钱,菜贩子给出的理由竟然是

趣看热点 浏览 920653

美计划采购千架无人机遏华,结果出问题

浏览 10703

媒体:被美国逼着“朝中国开枪” 韩国玩得起吗

澎湃新闻 浏览 998

小萨博尼斯本赛季第11次砍下三双 紧追第一名约基奇的12次

直播吧 浏览 12554

半身裙如何搭配出高级感?试试这几套穿搭

In风尚 浏览 16914

京东将造“廉价版蔚来”?可充可换电,价格将很感人

明镜pro 浏览 961

大学教授被11名学生举报学术不端 官网个人页已被删除

每日经济新闻 浏览 76270

近年来首次 福建省委书记出席全省对台工作会议

政知新媒体 浏览 91716

360万克六选错队?三分23中5太铁 33岁亚一控失球权已完全迷失

颜小白的篮球梦 浏览 996

鲁媒谈准入:新赛季会带给更多球队机遇,想获红利需守住阵地

懂球帝 浏览 52

中超第27轮传球成功率榜:国安89.6%居首,时隔5轮再次登顶

懂球帝 浏览 850

上海交大吴家睿:复杂的科学时代需要复杂性思维|全国科普月

上观新闻 浏览 1707

净支出仅3180万欧元!德布劳内大伤缺阵数月,曼城应该砸谁?

直播吧 浏览 14350

应对日本130万吨核污水排海 国内城市有道"防线"

每日经济新闻 浏览 86536

中科大团队实现AI图表数学逻辑理解

科技行者 浏览 663

媒体:特朗普关税战半年 市场没能打得开还弄丢了

新民晚报 浏览 5921

综合续航超1500km 加方盒子车身 智己LS9即将上市!

车品 浏览 658

安踏强势反腐背后 毛利率下滑 营销、采购是重灾区

21世纪经济报道 浏览 1569
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1