- astrai/inference/cache.py: refcount 归零时保留 hash 映射,页加入 LRU evictable 池 - alloc() 无空闲页时从 LRU 逐出,优先释放 _free_mask - lookup_prefix/inc_ref 触发 _touch 更新 LRU 序 - record_page 设置 pin 标记并从 LRU 移除 |
||
|---|---|---|
| .. | ||
| __init__.py | ||
| cache.py | ||
| engine.py | ||
| sampling.py | ||
| scheduler.py | ||
| server.py | ||