[CL]《CompLLM:CompressionforLongConte

爱生活爱珂珂 2025-09-29 05:56:30

[CL]《CompLLM: Compression for Long Context Q&A》G Berton, J Unnikrishnan, S Tran, M Shah [Amazon] (2025)

处理超长上下文时，LLM 面临的计算瓶颈主要源于自注意力机制的二次方复杂度。CompLLM 提出了一种软压缩方法，通过将长文本拆分成独立段落分别压缩，带来了以下突破：

• 线性扩展：将上下文划分为固定长度段落（如20 token），每段内部压缩复杂度为二次方，但整体复杂度因段数线性增长，实现长达10万 token 上下文的高效压缩。

• 计算复用：独立段压缩使得同一段压缩结果可跨多次查询重复利用，极大节省实时推理成本。

• 训练蒸馏：通过对答案部分隐藏层激活进行蒸馏对齐，压缩后的概念嵌入（CEs）能保持与原始 token 嵌入（TEs）相当的生成质量，无需微调下游 LLM。

• 实测加速：2倍压缩率下，上下文极长时TTFT（首字生成延迟）可提升至4倍，KV缓存大小减半，且生成质量不降反升。

• 通用适配：适配多种开源模型（如Gemma3-4B、Qwen3-4B），适用于开放式问答与多选题任务，跨数据集表现稳定。

• 弱点：不适合需精确字符级信息的任务（如拼写检查），但可无缝拔除，保证灵活应用。

心得：

1. 将上下文拆分为模块化独立段，避免整体压缩的非线性复杂度，兼顾效率与效果。

2. 通过隐藏层蒸馏而非输出对齐，获得更细腻的压缩表示，提升长文本生成质量。

3. 压缩结果的可复用性为多轮交互和RAG系统大规模应用提供现实路径，降低算力门槛。

详情🔗 arxiv.org/abs/2509.19228

大语言模型长上下文模型压缩自然语言处理高效推理

0 阅读：0

爱生活爱珂珂

感谢大家的关注

作者最新文章

1

《Modular Manifolds》神经网络权重正则化的下一步：将权重矩阵限制

2

2023 年与 2025 年大语言模型训练对比，揭示了未来模型演进的关键转折：•

3

2023年“AI赋能”成为营销热点，2026年“无AI”或将崛起，企业营销策略正

4

[人人能懂] 从数据纯度、反馈标尺到心智公理你是否想过，AI变聪明的速度，竟取决

5

[CL]《LLM Output Homogenization is Task D

6

[CL]《RLBFF: Binary Flexible Feedback to

7

[LG]《Scaling Laws are Redundancy Laws》Y

8

早！[太阳] 早安

9

图论不仅是数学工具，更是工程师解构复杂系统的核心思维框架。掌握图论，等于掌握理解

10

[人人能懂] 思考的价值、地图的力量、垃圾数据的代价想知道如何让AI的学习效率提

热门分类

科技TOP

1

史上最薄iPhoneiPhoneAir现场真机实拍这外观给几分？

2

重磅！华为公布多颗新昇腾芯片9月18日，在华为全连接大会2025上，华为轮值

3

追觅汽车首款车型官图发布这次会是PPT造车吗？此前追觅就官宣要造车，并且工厂

4

买手机不要着急，买新不买旧。9月10月份将有大量新机发布，配置提升，续航也提升

5

还没下单iphone17Pro的劝你先等等~因为iPhone18Pro已完

6

荣耀不讲武德[捂脸哭]荣耀500系列这是要卷死友商，不仅全系标配2亿大底主摄，电池

7

感受一下1999的真我15Pro，这确实太薄了，7.79mm，187g，

8

9月19日，追觅科技正式宣布，其尚未发布的首款旗舰手机DreameSpace已

9

黄仁勋脸都打肿了！路透社16号的最新报道：英伟达为东方大国生产的RTX600

10

好家伙，大早上的突然宣布了！2025雷军年度演讲定在9月25日晚7点，所以小

科技最新文章

1

多人都在期待华为Mate系列。根据目前的的网络爆料来看，华为Mate80系列预

2

荣耀影像负责人怼vivo蹭热度，名字都不改直接照用[吃瓜]

3

一加15的价格爆料显示，其在国内的起售价低于一加13。一加15预计在中国的起

4

虚假的对标iPhone：名字对标、外观对标真正的对标iPhone：影像对标、系

5

荣耀Magic8和荣耀Magic7外观对比，你能看出区别吗？感觉荣耀Magic

6

被吹上天的荣耀X70，说说掏窝子的话，不要轻易去上手，因为我就是去看了，没忍住…

7

荣耀500系列曝光，全面对标苹果！荣耀500系列在工艺上完全对标苹果，中端机

8

看了雷军的直播后我决定再买一个手机不是因为小米17优秀，而是因为我不想错过

9

这可能是今晚的金句之王了：“我的朋友陈年是我直播间的榜一大哥，但今晚的发布会我没

10

别在说背屏无用！17Pro可卖爆了~是不是有点反直觉？小米17系列，标准版