AstrAI

History

ViperEkura 3ab4f237e5 refactor: 重构训练后端为 Executor 模式 - backend.py → executor.py，BaseTrainingBackend → BaseExecutor - 新增 NoneExecutor（单卡）和 DDPExecutor（DDP，world_size=1 自动降级） - 新增 GradientState 分离梯度同步状态，AccumOptimizer/AccumScheduler 包裹拦截 - 新增 astrai/protocols.py：OptimizerProtocol/SchedulerProtocol 结构子类型 - TrainContext.backend → executor，TrainConfig 移除 parallel_wrapper/state_dict_fn，新增 parallel_mode/executor_kwargs - 训练循环用 accumulate() 包裹，on_optimizer_step 命名约定=gate - scripts/tools/train.py 移除 ddp_wrap/prepare_checkpoint，新增 --parallel_mode		2026-05-24 20:35:44 +08:00
..
__init__.py	feat: 新增 Muon 优化器	2026-05-17 16:44:03 +08:00
metric_util.py	feat: 训练中新增验证循环	2026-05-17 16:12:42 +08:00
optim.py	perf: Muon step 改用 torch._foreach_* 批处理并移除 NS 迭代的冗余 bf16 转换	2026-05-23 19:50:12 +08:00
schedule.py	feat: 优化工厂模式的实现	2026-04-04 15:49:46 +08:00
strategy.py	feat: GRPO CLI 接入 + on-policy，OpenAI API top_k 参数化，补充训练参数表	2026-05-09 12:22:33 +08:00
train_callback.py	refactor: 重构训练后端为 Executor 模式	2026-05-24 20:35:44 +08:00
train_context.py	refactor: 重构训练后端为 Executor 模式	2026-05-24 20:35:44 +08:00
trainer.py	refactor: 重构训练后端为 Executor 模式	2026-05-24 20:35:44 +08:00