AstrAI/tests
ViperEkura a44fd22a99 fix: 修复训练与模型参数传递问题
- state_dict_fn 传入 CheckpointCallback,修复多卡 DDP 下 key 前缀丢失
- MLA 增加 use_qk_norm 支持,消除参数静默丢失
- moe_topk_method 统一命名为 topk_method
- checkpoint 回调移至最前
2026-05-17 11:20:13 +08:00
..
data refactor: checkpoint 按 HF 方式存独立 .pt 文件,callback 接管恢复 2026-05-16 18:29:04 +08:00
inference fix: 修复推理引擎 batch decode 中多项正确性与并发问题 2026-05-14 21:31:39 +08:00
module fix: 修复训练与模型参数传递问题 2026-05-17 11:20:13 +08:00
parallel feat: 增加server, 并且修改测试单元 2026-04-02 15:05:07 +08:00
trainer refactor: 训练循环改为两重迭代并统一参数命名 2026-05-16 21:27:35 +08:00
conftest.py fix: 修复 MLA 多个 bug 并缩小测试模型参数 2026-05-16 14:57:43 +08:00