AstrAI/astrai/trainer
ViperEkura 10ebd7211f feat: 新增 Muon 优化器
- 2D 参数用 Newton-Schulz 正交化 + Nesterov 动量更新
- 1D 参数用 AdamW 更新
- 支持 lr/momentum/weight_decay/ns_steps 配置
2026-05-17 16:44:03 +08:00
..
__init__.py feat: 新增 Muon 优化器 2026-05-17 16:44:03 +08:00
metric_util.py feat: 训练中新增验证循环 2026-05-17 16:12:42 +08:00
optim.py feat: 新增 Muon 优化器 2026-05-17 16:44:03 +08:00
schedule.py feat: 优化工厂模式的实现 2026-04-04 15:49:46 +08:00
strategy.py feat: GRPO CLI 接入 + on-policy,OpenAI API top_k 参数化,补充训练参数表 2026-05-09 12:22:33 +08:00
train_callback.py feat: 训练中新增验证循环 2026-05-17 16:12:42 +08:00
train_context.py feat: 训练中新增验证循环 2026-05-17 16:12:42 +08:00
trainer.py feat: 训练中新增验证循环 2026-05-17 16:12:42 +08:00