AstrAI/tests/trainer
ViperEkura 2c2697390d feat: 新增 GradientCheckpointingCallback
- TrainConfig.gradient_checkpointing_modules 指定模块类型
- apply 递归遍历,兼容 DDP,不硬编码模型结构
- modules=None 时静默跳过,零开销
2026-05-17 18:21:05 +08:00
..
conftest.py refactor: 训练循环改为两重迭代并统一参数命名 2026-05-16 21:27:35 +08:00
test_callbacks.py feat: 新增 GradientCheckpointingCallback 2026-05-17 18:21:05 +08:00
test_early_stopping.py refactor: 训练循环改为两重迭代并统一参数命名 2026-05-16 21:27:35 +08:00
test_train_strategy.py fix: 修复 CLI 参数缺失/重复、device_ids 越界、generate 参数名不一致、scheduler 时序、非流式截断等 bug 2026-05-09 14:36:42 +08:00
test_trainer.py refactor: 训练循环改为两重迭代并统一参数命名 2026-05-16 21:27:35 +08:00