AstrAI

History

ViperEkura c95ace41aa fix: prefill 时 attention mask 长度不足导致 expand 崩溃 - astrai/inference/scheduler.py: prefill input_mask 由 [batch, seq_len] 改为 [batch, prompt_len]，覆盖全部 KV 位置 - astrai/model/transformer.py: seq_mask is None 分支补全 start_pos + seq_len 列，避免 expand 非 singleton 维度不匹配		2026-05-10 19:56:41 +08:00
..
__init__.py	fix: 修复 CLI 参数缺失/重复、device_ids 越界、generate 参数名不一致、scheduler 时序、非流式截断等 bug	2026-05-09 14:36:42 +08:00
cache.py	perf: PagedCache 持久前缀缓存 + LRU 逐出	2026-05-10 18:05:11 +08:00
engine.py	feat: _generate_streaming 支持 batch 模式	2026-05-10 17:42:20 +08:00
sampling.py	refactor: 分页 KV cache 替换固定 slot，删除 PrefixCache 及相关死代码	2026-05-08 20:44:05 +08:00
scheduler.py	fix: prefill 时 attention mask 长度不足导致 expand 崩溃	2026-05-10 19:56:41 +08:00
server.py	feat: GRPO CLI 接入 + on-policy，OpenAI API top_k 参数化，补充训练参数表	2026-05-09 12:22:33 +08:00