AstrAI/astrai
ViperEkura d7a7f570ed refactor: 训练循环改为两重迭代并统一参数命名
- 训练循环从三重(epoch→batched→batch)改为二重(epoch→batch)
- batch_size → batch_per_device, accumulation_steps → grad_accum_steps
- scheduler 移入 step block 对齐 optimizer 更新步
- GradientClippingCallback 改用 on_step_begin 避免零梯度裁剪
- 移除 _train_impl 误导性的 -> Checkpoint 标注
- total_steps 修除为向下取整并精简为一行
- warmup_steps 改为 warmup_ratio (默认0.05)
2026-05-16 21:27:35 +08:00
..
config refactor: 训练循环改为两重迭代并统一参数命名 2026-05-16 21:27:35 +08:00
dataset refactor: Storage 改用工厂模式,server reload 接入 uvicorn 2026-05-16 17:00:26 +08:00
inference refactor: Storage 改用工厂模式,server reload 接入 uvicorn 2026-05-16 17:00:26 +08:00
model refactor: 工厂 kwargs 过滤及组件参数清理 2026-05-16 16:47:41 +08:00
parallel refactor: 移除 device_ids 参数设计,统一通过 CUDA_VISIBLE_DEVICES 控制 GPU 分配;更新 README 训练示例 2026-05-09 14:55:43 +08:00
tokenize fix: 修复 CLI 参数缺失/重复、device_ids 越界、generate 参数名不一致、scheduler 时序、非流式截断等 bug 2026-05-09 14:36:42 +08:00
trainer refactor: 训练循环改为两重迭代并统一参数命名 2026-05-16 21:27:35 +08:00
__init__.py chore: 版本号升至 1.3.5 2026-05-15 18:23:27 +08:00
factory.py refactor: 工厂 kwargs 过滤及组件参数清理 2026-05-16 16:47:41 +08:00
serialization.py refactor: checkpoint 按 HF 方式存独立 .pt 文件,callback 接管恢复 2026-05-16 18:29:04 +08:00