关闭广告

7B大模型测试成绩超GPT-4!微软新研究解决工具调用难题

智东西11348人阅读


智东西
作者 徐珊
编辑 云鹏

智东西3月11日消息,近日微软和俄亥俄州立大学的研究人员发布论文,提出了一种受到生物启发的可以增强大语言模型使用工具能力的方法,即模拟试错(STE)法,并将其开源。

该方法协调了试错、想象和记忆三个关键机制。具体而言,STE通过大模型的“想象力”来模拟使用工具的一些合理场景,从而尝试适配不同的大模型,随后从新的反馈中,获得反馈不断优化。

ToolBench实验结果显示,STE在上下文学习和微调设置下显著提高了大语言模型的工具学习能力,让Mistral-Instruct-7B实现了46.7%的性能提升,使其成绩超过了GPT-4。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

反击美国"变脸"普京即将公布神秘新武器 专家分析

环球网资讯 浏览 992

独行侠内线再多也不够?浓眉小腿拉伤至少缺阵两场

体坛周报 浏览 717

哈登观战休斯顿迪纳摩美国公开杯半决赛,他是该俱乐部股东

直播吧 浏览 14365

印度发射该国迄今最重军用卫星 用于提升印海军远洋作战能力

澎湃新闻 浏览 709

保时捷将在中国设立研发中心 2022年初落户上海

新京报贝壳财经 浏览 20336

韩男团来中国一脸冷漠 保镖撞飞粉丝

萌神木木 浏览 13229

张纪中妻子回应怀四胎:我国老龄化比较严重,要为社会做贡献!

缘木不求娱 浏览 12279

贾永婕说小S越来越像大S,两人早已融为一体,过度消费大S惹争议

萌神木木 浏览 891

重磅!国务院机构改革方案公布 一图读懂13项重要变化

人民日报客户端 浏览 99826

微软、动视暴雪要求美国法官加速处理 FTC 案件

IT之家 浏览 15967

米兰1月最佳球员4人候选:阿德利、特奥、约维奇、奇克

直播吧 浏览 12324

阿维塔第21万辆正式下线

三言科技 浏览 801

联通三季报:宽移用户净增规模创新高,首次披露云收入数字

南方都市报 浏览 889

头皮分泌油脂过多?建议尝试这5种改善方法

医说健康 浏览 18678

"鱼鹰"复飞时间未定 美国海军用"灰狗"来凑

观察者网 浏览 12787

联想 moto razr 60 系列手机获中国线上市场安卓小折叠销量第一

IT之家 浏览 933

波媒:法国正阻止欧盟出资20亿欧元为乌供应弹药

环球网资讯 浏览 18700

又见大幅下调考核目标,监管出手!

中国基金报 浏览 14636

雷军“悔棋”背后,存储市场的涨价潮也是窗口期

北京商报 浏览 713

周冬雨刘昊然新片《燃冬》定档七夕 早前入围戛纳

网易娱乐 浏览 15730

公务员聊天内容被指不尊重女性 同名干部"躺枪"报警

极目新闻 浏览 95800
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1