AstrAI/astrai
ViperEkura a4e5a8c81c feat: 新增 WSD 学习率调度器
- 支持 Warmup-Stable-Decay 三段式调度
- stable 阶段保持最高 lr,decay 阶段 sqrt 衰减
- 适用于持续预训练、SFT、RLHF 场景
2026-06-18 15:55:15 +08:00
..
config fix : 修复策略相关文件的类型注解与抽象方法体 2026-06-14 16:20:10 +08:00
dataset refactor : 清理工厂和配置系统中的死代码与冗余抽象 2026-06-07 11:39:50 +08:00
inference fix: 使用 threading.Event 替代裸 bool,补全公共 API 2026-06-18 15:38:35 +08:00
model feat : NEFTune 噪声注入 + label_smoothing 默认值修正 2026-06-11 15:32:43 +08:00
parallel refactor : 移除 LocalStrategy._clear_env 冗余清理 2026-06-02 11:40:45 +08:00
preprocessing fix : 修复策略相关文件的类型注解与抽象方法体 2026-06-14 16:20:10 +08:00
tokenize refactor : Pipeline 去除去重,ids 重命名为 sequence,泛型透传 2026-05-31 15:14:27 +08:00
trainer feat: 新增 WSD 学习率调度器 2026-06-18 15:55:15 +08:00
__init__.py fix: 使用 threading.Event 替代裸 bool,补全公共 API 2026-06-18 15:38:35 +08:00
factory.py fix : 修复策略相关文件的类型注解与抽象方法体 2026-06-14 16:20:10 +08:00
protocols.py refactor: 重构训练后端为 Executor 模式 2026-05-24 20:35:44 +08:00
serialization.py fix : resume_dir 无权重文件时不强制加载,支持仅配置训练 2026-06-13 15:40:14 +08:00