AstrAI/astrai/trainer
ViperEkura 7dea929788 refactor: checkpoint 按 HF 方式存独立 .pt 文件,callback 接管恢复
- Checkpoint.save/load: extra 逐 key 写为 {key}.pt 而非单个 extra.pt
- meta.json 新增 timestamp
- CheckpointCallback: save_extra/load_extra 静态方法 + extra_keys 类属性
- on_train_begin 接管 optimizer/scheduler 恢复,TrainContextBuilder 不再传 load_extra_fn
2026-05-16 18:29:04 +08:00
..
__init__.py chore: 修改类名,优化导入顺序 2026-04-05 22:27:57 +08:00
metric_util.py fix: 修复训练循环 step/backward 顺序,重构为三重循环嵌套 2026-05-15 14:44:44 +08:00
schedule.py feat: 优化工厂模式的实现 2026-04-04 15:49:46 +08:00
strategy.py feat: GRPO CLI 接入 + on-policy,OpenAI API top_k 参数化,补充训练参数表 2026-05-09 12:22:33 +08:00
train_callback.py refactor: checkpoint 按 HF 方式存独立 .pt 文件,callback 接管恢复 2026-05-16 18:29:04 +08:00
train_context.py refactor: checkpoint 按 HF 方式存独立 .pt 文件,callback 接管恢复 2026-05-16 18:29:04 +08:00
trainer.py fix: 修复训练循环 step/backward 顺序,重构为三重循环嵌套 2026-05-15 14:44:44 +08:00