AstrAI/assets/docs
ViperEkura d7a7f570ed refactor: 训练循环改为两重迭代并统一参数命名
- 训练循环从三重(epoch→batched→batch)改为二重(epoch→batch)
- batch_size → batch_per_device, accumulation_steps → grad_accum_steps
- scheduler 移入 step block 对齐 optimizer 更新步
- GradientClippingCallback 改用 on_step_begin 避免零梯度裁剪
- 移除 _train_impl 误导性的 -> Checkpoint 标注
- total_steps 修除为向下取整并精简为一行
- warmup_steps 改为 warmup_ratio (默认0.05)
2026-05-16 21:27:35 +08:00
..
README-zh-CN.md refactor: 训练循环改为两重迭代并统一参数命名 2026-05-16 21:27:35 +08:00
architecture.md refactor: 训练循环改为两重迭代并统一参数命名 2026-05-16 21:27:35 +08:00
dataflow.md docs : 拆分文档并补充类图缺失类和关系线 2026-05-15 23:38:26 +08:00
inference.md docs : 拆分文档并补充类图缺失类和关系线 2026-05-15 23:38:26 +08:00
params.md refactor: 训练循环改为两重迭代并统一参数命名 2026-05-16 21:27:35 +08:00
training.md refactor: 训练循环改为两重迭代并统一参数命名 2026-05-16 21:27:35 +08:00