AstrAI/astrai/trainer
ViperEkura a44fd22a99 fix: 修复训练与模型参数传递问题
- state_dict_fn 传入 CheckpointCallback,修复多卡 DDP 下 key 前缀丢失
- MLA 增加 use_qk_norm 支持,消除参数静默丢失
- moe_topk_method 统一命名为 topk_method
- checkpoint 回调移至最前
2026-05-17 11:20:13 +08:00
..
__init__.py chore: 修改类名,优化导入顺序 2026-04-05 22:27:57 +08:00
metric_util.py fix: 修复训练循环 step/backward 顺序,重构为三重循环嵌套 2026-05-15 14:44:44 +08:00
schedule.py feat: 优化工厂模式的实现 2026-04-04 15:49:46 +08:00
strategy.py feat: GRPO CLI 接入 + on-policy,OpenAI API top_k 参数化,补充训练参数表 2026-05-09 12:22:33 +08:00
train_callback.py refactor: Config序列化统一BaseConfig基类 2026-05-16 22:06:39 +08:00
train_context.py refactor: Config序列化统一BaseConfig基类 2026-05-16 22:06:39 +08:00
trainer.py fix: 修复训练与模型参数传递问题 2026-05-17 11:20:13 +08:00