[LG]《OverFill:Two-StageModelsforEffi

爱生活爱珂珂 2025-08-14 06:33:40

[LG]《OverFill: Two-Stage Models for Efficient Language Model Decoding》W Kim, J Wang, J N Yan, M Abdelfattah... [Cornell University] (2025)

OverFill：面向高效语言模型解码的两阶段模型创新方案

• 传统大语言模型推理分为prefill（计算密集）和decode（内存密集）两阶段，现有模型对两阶段采用同一架构，未区分优化。

• OverFill提出prefill阶段使用完整模型，decode阶段采用兼容剪枝后的轻量模型，有效减少解码时的参数加载和内存占用。

• 通过宽度剪枝保持KV缓存维度兼容，确保两阶段模型共享缓存表示，支持端到端训练且只微调剪枝后解码器。

• 在3B→1B和8B→3B配置中，OverFill分别比同规模剪枝模型提升83.2%和79.2%准确率，且训练数据需求更少，性能媲美从零训练同尺度模型。

• 该方法显著降低长序列生成的延迟，解码阶段速度接近小模型，prefill阶段开销相对较小，整体实现Pareto最优的准确率与效率平衡。

• 对比推测解码，OverFill消除回滚和拒绝采样，提升多请求场景的吞吐率，适合实际在线服务部署。

• 未来可探索注意力剪枝、量化等结合方案，进一步压缩KV缓存与提升推理速度。

了解详情🔗arxiv.org/abs/2508.08446

大语言模型模型剪枝高效推理机器学习人工智能

0 阅读：0

爱生活爱珂珂

感谢大家的关注

作者最新文章

1

Shadow：开源背景编程智能代理，专为理解、推理并改进现有代码库而设计，支持本

2

CloudBase AI ToolKit 助力全栈开发，从创意到上线全流程智能加

3

MCP-Use：开源利器，实现任意LLM与MCP服务器的无缝连接，打造具备工具访

4

从4000+ n8n模板中精选的24个「AI 出海营销Agent」，覆盖八大核心

5

Gemini CLI 最新发布了与 VS Code 的原生集成，极大提升了开发者

6

[LG]《Topos Causal Models》S Mahadevan [Ad

7

[LG]《OverFill: Two-Stage Models for Effi

8

[LG]《Scaled-Dot-Product Attention as One

9

[RO]《Rational Inverse Reasoning》B Zandon

10

[LG]《Understanding Transformers through

热门分类

推荐热榜军事 NBA 体育社会明星八卦娱乐财经科技汽车历史国际游戏动漫公益搞笑商业互联网数码国际足球房产家居时尚科学探索职场育儿股票教育影视情感热点中国军情武器中国南海中国足球亚洲杯科比综合体育 CBA 投资楼市大咖秀外汇创业风口 SUV 豪车概念车优惠新能源美国欧洲朝日韩俄罗斯孕期街拍恋爱攻略婚姻正能量

科技TOP

1

以后不会再给女朋友买iPhone手机，并不是iPhone手机不好，而是她买了一大

2

手机圈来袭！9-10月新机扎堆亮相荣耀Magic8Pro主打超强AI，

3

你看人家一加这更新日志做的，都跟人家学学。

4

华为Mate70全系列官方指导价价格调整，渠道价等我更新，过两天部分机型会有不小

5

站哥一旦爆料，基本上已经是板上钉钉，没跑了！荣耀Magic8增加Ultra版！

6

华为Mate70系列今日全渠道降价促销🙌Mate70数字版降价400元；

7

荣耀这操作真的是让人惊掉下巴！原本以为遥不可及的1万毫安大电池，就这么轻描淡写的

8

要买荣耀400Pro的人一定要听劝！后悔可就来不及了，如果只是当做备用机千万

9

5699的时候，你们说太贵5199的时候，你们又说贵4699的时候，有的人说

10

我去荣耀专卖店看手机，看了荣耀X70，荣耀400、荣耀Power、Magic7等

科技最新文章

1

直屏手机推荐来啦！荣耀Magic7绝对是不错的选择，搭载骁龙8至尊版芯片

2

荣耀X70拆机来看8300mAh的青海湖电池直接占了机身60%的空间！主板被压缩

3

听我一句劝，2025年买手机就得这么买：1、要是追求智慧又安全，那荣耀简直是

4

估计不少人已经发现，手机这玩意就别买太贵的现在的千元机其实就能用好几年大多数

5

英伟达说H20没后门，可玉渊潭天把芯片拆到晶体管级，发现三条可疑信号线直通管理引

6

大哥这手机，我闭着眼睛都能认出来是啥

7

5699的时候，你们说太贵5199的时候，你们又说贵4699的时候，有的人说

8

中美芯片大战，日本人突然发现了一个重大的秘密！美国靠着尖端芯片死磕中国，而中国呢

9

荣耀Magic8Pro彻底杀疯了！这次配置直接掀了友商的桌子。超大电池独步

10

我去荣耀专卖店看手机，看了荣耀X70，荣耀400、荣耀Power、Magic7等