- TrainConfig.gradient_checkpointing_modules 指定模块类型 - apply 递归遍历,兼容 DDP,不硬编码模型结构 - modules=None 时静默跳过,零开销 |
||
|---|---|---|
| .. | ||
| data | ||
| inference | ||
| module | ||
| parallel | ||
| trainer | ||
| conftest.py | ||
- TrainConfig.gradient_checkpointing_modules 指定模块类型 - apply 递归遍历,兼容 DDP,不硬编码模型结构 - modules=None 时静默跳过,零开销 |
||
|---|---|---|
| .. | ||
| data | ||
| inference | ||
| module | ||
| parallel | ||
| trainer | ||
| conftest.py | ||