AstrAI/astrai/inference
ViperEkura 3da428e0e4 perf: PagedCache 持久前缀缓存 + LRU 逐出
- astrai/inference/cache.py: refcount 归零时保留 hash 映射,页加入 LRU evictable 池
- alloc() 无空闲页时从 LRU 逐出,优先释放 _free_mask
- lookup_prefix/inc_ref 触发 _touch 更新 LRU 序
- record_page 设置 pin 标记并从 LRU 移除
2026-05-10 18:05:11 +08:00
..
__init__.py fix: 修复 CLI 参数缺失/重复、device_ids 越界、generate 参数名不一致、scheduler 时序、非流式截断等 bug 2026-05-09 14:36:42 +08:00
cache.py perf: PagedCache 持久前缀缓存 + LRU 逐出 2026-05-10 18:05:11 +08:00
engine.py feat: _generate_streaming 支持 batch 模式 2026-05-10 17:42:20 +08:00
sampling.py refactor: 分页 KV cache 替换固定 slot,删除 PrefixCache 及相关死代码 2026-05-08 20:44:05 +08:00
scheduler.py perf: 消除非流式推理 CPU 空转并减少 decode GPU 张量冗余分配 2026-05-10 15:32:11 +08:00
server.py feat: GRPO CLI 接入 + on-policy,OpenAI API top_k 参数化,补充训练参数表 2026-05-09 12:22:33 +08:00