AstrAI/scripts
ViperEkura 9d5e9fa6c4 perf: DDP 加 gradient_as_bucket_view/static_graph/broadcast_buffers,AdamW fused
- gradient_as_bucket_view=True 零拷贝梯度归并
- static_graph=True 跳过每轮 bucket 重建
- broadcast_buffers=False 省 buffer 广播
- AdamW fused=True 融合优化器 kernel
2026-05-15 15:30:24 +08:00
..
demo fix: batch 推理示例添加 chat template 和 system prompt 2026-05-14 20:59:01 +08:00
tools perf: DDP 加 gradient_as_bucket_view/static_graph/broadcast_buffers,AdamW fused 2026-05-15 15:30:24 +08:00
docker.sh chore: 增加docker 配置 2026-04-04 10:59:32 +08:00
pre_commit.sh ci: 优化 GitHub Actions 工作流 2026-04-05 22:40:16 +08:00