AstrAI/scripts
ViperEkura 7242eedbf4 fix: 学习率调度按 optimizer step 计数并防止 warmup 越界
- total_steps 除以 accumulation_steps,匹配 optimizer.step() 频率
- warmup_steps 用 min 截断,避免 lr_decay_steps 为负
2026-05-16 17:07:36 +08:00
..
demo fix: batch 推理示例添加 chat template 和 system prompt 2026-05-14 20:59:01 +08:00
tools fix: 学习率调度按 optimizer step 计数并防止 warmup 越界 2026-05-16 17:07:36 +08:00
docker.sh chore: 增加docker 配置 2026-04-04 10:59:32 +08:00
pre_commit.sh ci: 优化 GitHub Actions 工作流 2026-04-05 22:40:16 +08:00