关闭广告

7B大模型测试成绩超GPT-4!微软新研究解决工具调用难题

智东西11375人阅读


智东西
作者 徐珊
编辑 云鹏

智东西3月11日消息,近日微软和俄亥俄州立大学的研究人员发布论文,提出了一种受到生物启发的可以增强大语言模型使用工具能力的方法,即模拟试错(STE)法,并将其开源。

该方法协调了试错、想象和记忆三个关键机制。具体而言,STE通过大模型的“想象力”来模拟使用工具的一些合理场景,从而尝试适配不同的大模型,随后从新的反馈中,获得反馈不断优化。

ToolBench实验结果显示,STE在上下文学习和微调设置下显著提高了大语言模型的工具学习能力,让Mistral-Instruct-7B实现了46.7%的性能提升,使其成绩超过了GPT-4。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

众星时装周路透:张嘉倪瘦脱相,刘涛低调素颜

盖饭娱乐官方号 浏览 19414

TCL发布超薄零嵌冰箱T9首发价格3499元

网易科技报道 浏览 19500

连爆2大行业瓜!大花回应只字不提影帝

大龄女一晓彤 浏览 633

66岁港星与太太秀恩爱 被指吃软饭遭太太出手维护

TVB剧评社 浏览 19227

清华姚班大神陈立杰,联手00后逆向破局!颠覆50年计算机难题

新智元 浏览 263

明年上市 金标大众首款轿车 与众07申报信息发布

网易汽车 浏览 1081

突发!5000亿元巨头涨价

中国基金报 浏览 12634

本田发布首款电动SUV Prologue

盖世汽车 浏览 12570

媒体:台军将派人赴美考察 意外暴露蔡英文最怕的武器

枢密院十号 浏览 97681

B站将以播放时长取代次数,避免“抖音快手化”

晚点LatePost 浏览 15495

大连海鲜成双十一最热销特产之一 海参大虾扇贝备受追捧

半岛晨报 浏览 632

身上这5条线,决定了女人的气质上限

小陈聊搭配 浏览 15316

台湾省金钟奖成了“照妖镜”,小S拿奖后,破防人算是照明白了

娱乐圈笔娱君 浏览 919

包贝尔自导自演新片定档,看了评论区,才知道他的人脉有多强!

电和影 浏览 12037

初秋街头的松弛vibe 怎么穿出来?

创作者_WCD3 浏览 15086

2024年第一次油价下跌或在本周三进行 但预计跌幅不大

智车情报局 浏览 12864

76人队明日主场战胜公牛即可锁定季后赛席位

直播吧 浏览 19719

致敬 S14 第五冠队服,雷蛇推出巨甲虫 V2 Faker 款游戏鼠标垫

IT之家 浏览 1015

“全球坚韧船队”成员控诉遭辱:以色列虐待所有人

看看新闻Knews 浏览 1018

泽连斯基接受采访期间马林斯基宫两度停电 俄官员回应

环球网资讯 浏览 627

郎酒9月发布的会员尊享酒,为何成懂酒人的优选?

金角财经 浏览 941
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1