爆点资讯

这项由加州大学洛杉矶分校计算机科学系主导，联合微软亚洲研究院完成的研究，发表于2025年，目前处于同行评议阶段。有兴趣深入了解技术细节的读者可以通过arXiv:2603.29002v1查询完整论文。

当我们使用ChatGPT或其他大语言模型时，可能并不知道背后发生了什么。每当你输入一个长长的问题，或者上传一篇文档让AI分析时，计算机其实在进行着一场复杂的"记忆游戏"。研究团队发现，现在的AI系统就像一个拥有海量记忆但检索效率低下的图书馆，需要花费大量时间和电力来寻找相关信息。

现代大语言模型越来越强大，能处理的文本也越来越长。以最新的模型为例，它们能够一次性阅读和理解长达100万个词汇的文档，这相当于一本中等厚度的小说。然而，这种强大能力背后隐藏着巨大的计算成本。当模型处理这样的长文档时，需要消耗高达69GB的GPU内存，相当于一台高端游戏电脑的全部内存容量的数倍。

为了解决这个问题，研究人员开发了各种优化技术，比如稀疏注意力机制（只关注重要的部分内容）、检索增强生成（从外部数据库获取信息）和上下文记忆压缩（将信息压缩存储）。然而，这些技术看似各不相同，实际上

异构系统实现大模型推理加速与成本优化能力提升

登贝莱：踢什...

夸克上线千问...

北约举行一年...

上新|| 降...

特朗普向60...

奇瑞QQ3纯...

春季穿衣千万别太暗沉！试试蓝白配色、选基础款裤子，大方得体

法国宣布推出M51.3潜射弹道导弹称其为“重大里程碑”

辞旧迎新，元旦档电影满意度发布！

马斯克宣布重启特斯拉Dojo 3超级计算机项目

媒体：一级政府拒不执行法院判决是非常恶劣的示范

朱丹新年晒全家福，儿女戴眼镜长相很一般

苹果欲推首款低价Mac，定价远低于1000美元，挑战微软与Chromebook

孙宏斌逃出生天

不止镜头、手柄，OPPO 推出“行业首款”哈苏专业磁吸闪补光环灯

谁是AI之王？聊聊备受争议的AI评测与崛起的LMArena

台湾省金钟奖成了“照妖镜”，小S拿奖后，破防人算是照明白了

女人老了别瞎穿，记住“衣不紧身，裙不上膝”，才是真的优雅

“反向春运”火了！部分火车票低至1.9折，南京到上海只要8.5元

或将搭载V8引擎奥迪Q9将于2026年发布

超450亿元！603906，锂电大单

多国欢迎加沙停火协议生效呼吁尽快结束人道主义危机

美媒：特朗普声称美将＂统治＂委其真实意图逐渐明朗

智平方发布模块化具身智能服务空间“智魔方”，计划3年落地1000个

《繁花》声明翻车！官微开始紧急删评，主演胡歌唐嫣等全被牵连

增长遇阻，捷途汽车连续三个月销量下滑？

金店墙体惊现盗洞男子将170万元黄金藏祖坟墓碑后

叶珂不再隐忍，黄晓明“私生活”被揭露

被控诉家暴女儿＂疯狂英语＂李阳诉前妻案一审胜诉

38岁尹正再破天花板，这一次，他让整个娱乐圈“沉默”了