- static_graph=True时DDP.no_sync() + loss.backward()触发expect_autograd_hooks_内部断言 - PyTorch 2.7.1中no_sync上下文切换与静态图hook状态管理存在兼容性bug - 将static_graph设为False恢复梯度累积正常执行 - find_unused_parameters保持False(模型无不参与计算的参数) |
||
|---|---|---|
| .. | ||
| benchmark.py | ||
| generate.py | ||
| perplexity.py | ||
| server.py | ||
| train.py | ||