AstrAI/astrai
ViperEkura d88a41f8f1 fix: 修复预处理流水线 4 个致命问题
- pipeline: 单条数据异常不再崩溃整条流水线, 改 log warning 后跳过
- pipeline: _align_bucket 统一用 len(ids) 填充, 修复多输出模式下长度错配
- writer: BinWriter/H5Writer 写入失败自动清理残留文件并记录详细错误
- packing: BFDPacking 真正将序列打包进 bin 而非仅重排, 减少碎片
2026-06-18 17:38:01 +08:00
..
config fix : 修复策略相关文件的类型注解与抽象方法体 2026-06-14 16:20:10 +08:00
dataset refactor : 清理工厂和配置系统中的死代码与冗余抽象 2026-06-07 11:39:50 +08:00
inference fix: 使用 threading.Event 替代裸 bool,补全公共 API 2026-06-18 15:38:35 +08:00
model feat : NEFTune 噪声注入 + label_smoothing 默认值修正 2026-06-11 15:32:43 +08:00
parallel refactor : 移除 LocalStrategy._clear_env 冗余清理 2026-06-02 11:40:45 +08:00
preprocessing fix: 修复预处理流水线 4 个致命问题 2026-06-18 17:38:01 +08:00
tokenize refactor : Pipeline 去除去重,ids 重命名为 sequence,泛型透传 2026-05-31 15:14:27 +08:00
trainer feat: 新增 WSD 学习率调度器 2026-06-18 15:55:15 +08:00
__init__.py fix: 使用 threading.Event 替代裸 bool,补全公共 API 2026-06-18 15:38:35 +08:00
factory.py fix : 修复策略相关文件的类型注解与抽象方法体 2026-06-14 16:20:10 +08:00
protocols.py refactor: 重构训练后端为 Executor 模式 2026-05-24 20:35:44 +08:00
serialization.py fix : resume_dir 无权重文件时不强制加载,支持仅配置训练 2026-06-13 15:40:14 +08:00