AstrAI/astrai/trainer
ViperEkura 985d940db6 feat : 数据流水拼接策略支持 position_ids 预计算
- OutputConfig.position_ids_mode 三种模式控制边界策略
- pipeline._flush() 按配置生成扁平 position_ids 数组
- SFTDataset 在 __getitem__ 中返回 position_ids
- SFTStrategy 将 position_ids 传入 model.forward()
2026-06-04 13:56:19 +08:00
..
__init__.py feat: 新增 Muon 优化器 2026-05-17 16:44:03 +08:00
metric_util.py feat: 训练中新增验证循环 2026-05-17 16:12:42 +08:00
optim.py perf: Muon step 改用 torch._foreach_* 批处理并移除 NS 迭代的冗余 bf16 转换 2026-05-23 19:50:12 +08:00
schedule.py refactor : 移除 -> None 返回值标注,拆分 FSDP 参数,新增 mmap 数据集存储 2026-05-28 13:57:06 +08:00
strategy.py feat : 数据流水拼接策略支持 position_ids 预计算 2026-06-04 13:56:19 +08:00
train_callback.py fix : 并行训练 state_dict 收集与训练/推理并发缺陷 2026-05-29 21:12:52 +08:00
train_context.py feat : TrainConfig 支持 val_split 从训练集自动切分验证集 2026-06-02 20:33:40 +08:00
trainer.py refactor: 检查点加载重构,路径替代对象传递 2026-05-27 20:15:29 +08:00