AstrAI

History

ViperEkura d7a7f570ed refactor: 训练循环改为两重迭代并统一参数命名 - 训练循环从三重(epoch→batched→batch)改为二重(epoch→batch) - batch_size → batch_per_device, accumulation_steps → grad_accum_steps - scheduler 移入 step block 对齐 optimizer 更新步 - GradientClippingCallback 改用 on_step_begin 避免零梯度裁剪 - 移除 _train_impl 误导性的 -> Checkpoint 标注 - total_steps 修除为向下取整并精简为一行 - warmup_steps 改为 warmup_ratio (默认0.05)		2026-05-16 21:27:35 +08:00
..
__init__.py	chore: 修改类名，优化导入顺序	2026-04-05 22:27:57 +08:00
metric_util.py	fix: 修复训练循环 step/backward 顺序，重构为三重循环嵌套	2026-05-15 14:44:44 +08:00
schedule.py	feat: 优化工厂模式的实现	2026-04-04 15:49:46 +08:00
strategy.py	feat: GRPO CLI 接入 + on-policy，OpenAI API top_k 参数化，补充训练参数表	2026-05-09 12:22:33 +08:00
train_callback.py	refactor: 训练循环改为两重迭代并统一参数命名	2026-05-16 21:27:35 +08:00
train_context.py	refactor: 训练循环改为两重迭代并统一参数命名	2026-05-16 21:27:35 +08:00
trainer.py	refactor: 训练循环改为两重迭代并统一参数命名	2026-05-16 21:27:35 +08:00