关闭广告

7B大模型测试成绩超GPT-4!微软新研究解决工具调用难题

智东西11377人阅读


智东西
作者 徐珊
编辑 云鹏

智东西3月11日消息,近日微软和俄亥俄州立大学的研究人员发布论文,提出了一种受到生物启发的可以增强大语言模型使用工具能力的方法,即模拟试错(STE)法,并将其开源。

该方法协调了试错、想象和记忆三个关键机制。具体而言,STE通过大模型的“想象力”来模拟使用工具的一些合理场景,从而尝试适配不同的大模型,随后从新的反馈中,获得反馈不断优化。

ToolBench实验结果显示,STE在上下文学习和微调设置下显著提高了大语言模型的工具学习能力,让Mistral-Instruct-7B实现了46.7%的性能提升,使其成绩超过了GPT-4。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

曾押中马云的他,再次豪赌

创业家 浏览 915

史上头次只有6人拍总决赛合照,ATP骚操作引球迷众怒:德约呢?

网球之家 浏览 689

拼多多没活成“别人家的孩子”

老斯基财经 浏览 935

遭美政府和科技企业联合施压 欧盟扛不住了又打算屈服

澎湃新闻 浏览 4746

又一个汽车新品牌要来了,背靠五菱,首款车型微型车

汽车公告板 浏览 1641

斯诺克英格兰公开赛决赛第一阶段:周跃龙2-6落后于马克-艾伦

直播吧 浏览 1663

蔚来李斌:“降低事故率”和“使用时长”是衡量智驾能力的核心指标

澎湃新闻 浏览 1580

糊了22年,他终于凭借「性张力」火了

独立鱼 浏览 834

折叠屏,不该只有一个样子

虎嗅APP 浏览 19301

湖人92-100不敌太阳,大比分被扳成2-2平,詹姆斯准备好独自带队挑战

趣看热点 浏览 26124

与中国“交好”,拿盟友“开刀”,战略已明朗

浏览 23202

多家高校发公告将暂停使用微信支付,腾讯回应

IT之家 浏览 15579

牛弹琴:沙特和伊朗在北京和解后 最大的后续来了

上观新闻 浏览 108611

企业家代表委员热议新质生产力:关键在科技创新

澎湃新闻 浏览 12022

如何用"多巴胺穿搭"让自己快乐一点?

界面新闻 浏览 17283

伊森:我的梦想是成为总冠军和全明星 把这些带回休斯敦

直播吧 浏览 18828

继星巴克之后,汉堡王中国也被卖了!中国资管巨头3.5亿美元接手

深蓝财经 浏览 604

颧骨突出就会显老显凶?做到这2点就能高级有气质

小陈聊搭配 浏览 15156

快过年了才发现:羽绒服不兴了!满街都是“大衣裹围巾”,特洋气

潮人志Fashion 浏览 13299

小米的印度“心事”与“新事”

钛媒体APP 浏览 14743

37岁高叶演“恶女”,连面相都变了?

娱乐圈笔娱君 浏览 833
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1