[CL]《EpiCache:EpisodicKVCacheManagem

爱生活爱珂珂 2025-09-29 05:56:32

[CL]《EpiCache: Episodic KV Cache Management for Long Conversational Question Answering》M Kim, A Kundu, H Kim, R Dixit... [Apple] (2025)

EPICACHE：突破长对话问答中的KV缓存瓶颈，实现资源受限环境下的高效记忆管理

• 解决LLM对话上下文中KV缓存线性增长导致的内存瓶颈，特别适合数万至十万级tokens长对话。

• 创新采用基于语义聚类的“情节（Episodic）KV缓存压缩”，将对话分割为主题连贯的多个情节，针对每个情节构建独立缓存，精准保留话题相关内容。

• 引入分层敏感度自适应内存分配，依据Transformer各层对缓存丢弃的敏感度差异，动态调整缓存预算分配，有效提升多轮问答准确率。

• 采用块式预填充（Block Prefill）策略，边加载边压缩，避免传统后填充（Post Prefill）导致的峰值内存无限制增长，内存使用和延迟均大幅下降（峰值内存减少3.5倍，解码延迟降低2.4倍）。

• 在三大长对话问答基准（Realtalk、LoCoMo、LongMemEval）及多款开源LLM（LLaMA3、Qwen2.5）上，压缩4-6倍KV缓存仍保持接近完整KV性能，准确率提升最高达40%。

• 设计轻量级离线聚类和在线检索机制，查询可快速匹配相关情节缓存，查询切换频率低，检索开销仅占整体延迟5%以内。

• 详尽消融实验验证块大小、聚类窗口、聚类数量、编码器选择对性能的影响，证明系统对参数选择表现鲁棒。

心得：

1. 对话历史的语义结构是压缩缓存的关键，简单基于时间或固定窗口的策略难以兼顾上下文完整性和内存限制。

2. Transformer不同层对丢弃信息的敏感度差异显著，合理分配缓存资源能显著提升多轮对话的上下文利用效率。

3. 块式预填充避免了传统方法预填充后才压缩带来的峰值内存爆炸问题，表明“边处理边压缩”是长上下文管理的必经之路。

EPICACHE为实现大规模长对话系统的内存高效管理提供了切实可行的路径，兼顾性能与资源限制，推动对话式AI向更长、更连贯的交互迈进。

详情阅读👉 arxiv.org/abs/2509.17396

人工智能大语言模型长对话管理KV缓存模型压缩自然语言处理

0 阅读：0

爱生活爱珂珂

感谢大家的关注

作者最新文章

1

Ruben Veidt 深度解析 CUDA 编程核心机制，帮你理解 GPU 真正

2

线性代数中最被低估的真相：矩阵就是图，图就是矩阵。把矩阵看成图，是破解复杂结构的

3

MCP远不止“工具调用”！很多开发者误以为MCP只是另一种工具调用，但它实际上实

4

[CL]《AuditoryBench++: Can Language Model

5

[CL]《CompLLM: Compression for Long Conte

6

[CL]《EpiCache: Episodic KV Cache Managem

7

[CL]《Beyond the Leaderboard: Understandi

8

早！[太阳] 早安

9

在线训练大语言模型（LLM）强化学习环境搭建往往涉及复杂的组件组合，环境构建、评

10

在线处理视频音频常常需要频繁切换命令行工具，操作复杂且不够直观。ffmpeg-m

热门分类

科技TOP

1

史上最薄iPhoneiPhoneAir现场真机实拍这外观给几分？

2

重磅！华为公布多颗新昇腾芯片9月18日，在华为全连接大会2025上，华为轮值

3

追觅汽车首款车型官图发布这次会是PPT造车吗？此前追觅就官宣要造车，并且工厂

4

买手机不要着急，买新不买旧。9月10月份将有大量新机发布，配置提升，续航也提升

5

还没下单iphone17Pro的劝你先等等~因为iPhone18Pro已完

6

荣耀不讲武德[捂脸哭]荣耀500系列这是要卷死友商，不仅全系标配2亿大底主摄，电池

7

感受一下1999的真我15Pro，这确实太薄了，7.79mm，187g，

8

9月19日，追觅科技正式宣布，其尚未发布的首款旗舰手机DreameSpace已

9

黄仁勋脸都打肿了！路透社16号的最新报道：英伟达为东方大国生产的RTX600

10

好家伙，大早上的突然宣布了！2025雷军年度演讲定在9月25日晚7点，所以小

科技最新文章

1

多人都在期待华为Mate系列。根据目前的的网络爆料来看，华为Mate80系列预

2

荣耀影像负责人怼vivo蹭热度，名字都不改直接照用[吃瓜]

3

一加15的价格爆料显示，其在国内的起售价低于一加13。一加15预计在中国的起

4

虚假的对标iPhone：名字对标、外观对标真正的对标iPhone：影像对标、系

5

荣耀Magic8和荣耀Magic7外观对比，你能看出区别吗？感觉荣耀Magic

6

被吹上天的荣耀X70，说说掏窝子的话，不要轻易去上手，因为我就是去看了，没忍住…

7

荣耀500系列曝光，全面对标苹果！荣耀500系列在工艺上完全对标苹果，中端机

8

看了雷军的直播后我决定再买一个手机不是因为小米17优秀，而是因为我不想错过

9

这可能是今晚的金句之王了：“我的朋友陈年是我直播间的榜一大哥，但今晚的发布会我没

10

别在说背屏无用！17Pro可卖爆了~是不是有点反直觉？小米17系列，标准版