⚡ 命中时在干嘛:前面的固定开场白不再重复计算,直接用“上一次背过的结果”,所以又快又省。
🐌 没开缓存时:每次都要从头把所有 token 重新算一遍注意力,就像每次都从第一页开始重读课文,又慢又费钱。