AstrAI/astrai/trainer
ViperEkura 2c2697390d feat: 新增 GradientCheckpointingCallback
- TrainConfig.gradient_checkpointing_modules 指定模块类型
- apply 递归遍历,兼容 DDP,不硬编码模型结构
- modules=None 时静默跳过,零开销
2026-05-17 18:21:05 +08:00
..
__init__.py feat: 新增 Muon 优化器 2026-05-17 16:44:03 +08:00
metric_util.py feat: 训练中新增验证循环 2026-05-17 16:12:42 +08:00
optim.py feat: 新增 Muon 优化器 2026-05-17 16:44:03 +08:00
schedule.py feat: 优化工厂模式的实现 2026-04-04 15:49:46 +08:00
strategy.py feat: GRPO CLI 接入 + on-policy,OpenAI API top_k 参数化,补充训练参数表 2026-05-09 12:22:33 +08:00
train_callback.py feat: 新增 GradientCheckpointingCallback 2026-05-17 18:21:05 +08:00
train_context.py feat: 训练中新增验证循环 2026-05-17 16:12:42 +08:00
trainer.py feat: 新增 GradientCheckpointingCallback 2026-05-17 18:21:05 +08:00