Tag: 深度学习
All the articles with the tag "深度学习".
-
【转载】自回归下一个 token 预测与 Transformer 中的 KV Cache
深入浅出地讲解 Transformer 中的 KV Cache 原理:从 prefill 前向传播到 decode 阶段的缓存复用,图解自回归语言模型如何高效生成 tokens。
All the articles with the tag "深度学习".
深入浅出地讲解 Transformer 中的 KV Cache 原理:从 prefill 前向传播到 decode 阶段的缓存复用,图解自回归语言模型如何高效生成 tokens。