AstrAI/astrai/trainer
ViperEkura a6f5ff3b37 fix: 修复 remove_task 未释放 KV cache slot 导致第二轮对话死锁
- remove_task() 现在释放 KV cache slot 和 prefix cache 引用
- _refill_active_batch 中 alloc 失败时将剩余 task 推回 waiting_queue
- 主循环增加 try/except 异常兜底,发送 _STOP 给所有 task
- 重构:server.py 全局变量改为 ServerState 类;automodel.py
  使用 Registry 替代裸 dict;合并 TrainContextBuilder 的 with_*
  方法到 build()
2026-05-08 14:53:04 +08:00
..
__init__.py chore: 修改类名,优化导入顺序 2026-04-05 22:27:57 +08:00
metric_util.py refactor: 优化参数传递,清理导入样式 2026-04-03 22:06:32 +08:00
schedule.py feat: 优化工厂模式的实现 2026-04-04 15:49:46 +08:00
strategy.py chore: 修改拼写错误问题 2026-04-06 09:28:16 +08:00
train_callback.py chore: 修改类名,优化导入顺序 2026-04-05 22:27:57 +08:00
train_context.py fix: 修复 remove_task 未释放 KV cache slot 导致第二轮对话死锁 2026-05-08 14:53:04 +08:00
trainer.py fix: 修复 remove_task 未释放 KV cache slot 导致第二轮对话死锁 2026-05-08 14:53:04 +08:00