AstrAI/scripts/tools
ViperEkura 1d26aa2e93 fix: 禁用DDP static_graph避免PyTorch 2.7.1下no_sync与backward冲突
- static_graph=True时DDP.no_sync() + loss.backward()触发expect_autograd_hooks_内部断言
- PyTorch 2.7.1中no_sync上下文切换与静态图hook状态管理存在兼容性bug
- 将static_graph设为False恢复梯度累积正常执行
- find_unused_parameters保持False(模型无不参与计算的参数)
2026-05-26 15:08:01 +08:00
..
benchmark.py refactor: Transformer更名为AutoRegressiveLM并新增EmbeddingEncoder 2026-05-17 15:29:20 +08:00
generate.py docs: 修正文档中与源码不符的类名、方法签名和模块归属 2026-05-14 15:04:53 +08:00
perplexity.py refactor: 优化工具脚本接口并修复批处理问题 2026-04-05 21:56:22 +08:00
server.py refactor: 重构 inference 模块架构,引入设计模式并分组文件 2026-05-14 17:42:37 +08:00
train.py fix: 禁用DDP static_graph避免PyTorch 2.7.1下no_sync与backward冲突 2026-05-26 15:08:01 +08:00