AstrAI/astrai/trainer
ViperEkura 7df6eb9211 feat: 新增FSDP并行后端
- FSDPExecutor通过**fsdp_kwargs直传FSDP参数
- unwrap_model同时支持DDP和FSDP
- parallel_mode新增fsdp选项
2026-05-25 19:43:14 +08:00
..
__init__.py feat: 新增 Muon 优化器 2026-05-17 16:44:03 +08:00
metric_util.py feat: 训练中新增验证循环 2026-05-17 16:12:42 +08:00
optim.py perf: Muon step 改用 torch._foreach_* 批处理并移除 NS 迭代的冗余 bf16 转换 2026-05-23 19:50:12 +08:00
schedule.py feat: 优化工厂模式的实现 2026-04-04 15:49:46 +08:00
strategy.py feat: 新增FSDP并行后端 2026-05-25 19:43:14 +08:00
train_callback.py refactor: 重构训练后端为 Executor 模式 2026-05-24 20:35:44 +08:00
train_context.py refactor: 重构训练后端为 Executor 模式 2026-05-24 20:35:44 +08:00
trainer.py refactor: 重构训练后端为 Executor 模式 2026-05-24 20:35:44 +08:00