关闭广告

7B大模型测试成绩超GPT-4!微软新研究解决工具调用难题

智东西11358人阅读


智东西
作者 徐珊
编辑 云鹏

智东西3月11日消息,近日微软和俄亥俄州立大学的研究人员发布论文,提出了一种受到生物启发的可以增强大语言模型使用工具能力的方法,即模拟试错(STE)法,并将其开源。

该方法协调了试错、想象和记忆三个关键机制。具体而言,STE通过大模型的“想象力”来模拟使用工具的一些合理场景,从而尝试适配不同的大模型,随后从新的反馈中,获得反馈不断优化。

ToolBench实验结果显示,STE在上下文学习和微调设置下显著提高了大语言模型的工具学习能力,让Mistral-Instruct-7B实现了46.7%的性能提升,使其成绩超过了GPT-4。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

爆火的“表演饭”,开始被年轻人避雷

餐饮老板内参 浏览 979

美防长住进ICU五角大楼未及时通报 就连拜登都不知情

环球网资讯 浏览 73487

沃尔宣布哈登将留守火箭,但后者至今仍未归队

趣看热点 浏览 25468

虚假宣传!任泽平宣称能生发防脱的洗护产品被处罚

界面新闻 浏览 12545

周华健回潮汕探亲祭祖

阿纂看事 浏览 187

两人涉嫌切割小区23部电梯钢绳被拘 原物管称被迫退场

红星新闻 浏览 4058

大学副教授被精神病人持棍打死 二审:凶手发病期作案

扬子晚报 浏览 33208

伊能静儿子晒旅行照 穿裙子秀美背

娱絮 浏览 19017

48亿被冻结!小米在印度踩到的坑多深?

环球网资讯 浏览 16159

以色列和哈马斯不会有新年休战

CCTV国际时讯 浏览 12639

泸州老窖前三季度营收净利双降 国窖1573等中高档酒销量同比下滑10%

YOUNG财经 浏览 727

阿里小贷正式完成注销,退出历史舞台!

中国基金报 浏览 860

笑不活了!颜丙燕谈小20岁男友,没想到评论区句句皆是梗

温柔娱公子 浏览 874

秋天穿衣真的一点都不难!从这些穿搭中收获灵感,舒适又耐看

静儿时尚达人 浏览 536

上半年对欧新能源汽车出口近35万辆:比亚迪、蔚来等并不理想

21世纪经济报道 浏览 14256

男子入职2小时猝死,家属向公司索赔140万

趣看热点 浏览 120456

左脚低射破门,加纳乔成为切尔西队史第6位进球的阿根廷球员

懂球帝 浏览 793

硅谷高管消息群一夜未停 H-1B新规让美企慌了白宫找补

红星新闻 浏览 22703

谷爱凌透露几周前右手骨折 先打石膏赛季后手术

网易体育 浏览 25857

美军焦虑如何让航母“神出鬼没”

环球网资讯 浏览 12430

ChatGPT大升级+大降价,反应速度更快,允许更长文本

每日经济新闻 浏览 16150
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1