AstrAI

History

ViperEkura d7a7f570ed refactor: 训练循环改为两重迭代并统一参数命名 - 训练循环从三重(epoch→batched→batch)改为二重(epoch→batch) - batch_size → batch_per_device, accumulation_steps → grad_accum_steps - scheduler 移入 step block 对齐 optimizer 更新步 - GradientClippingCallback 改用 on_step_begin 避免零梯度裁剪 - 移除 _train_impl 误导性的 -> Checkpoint 标注 - total_steps 修除为向下取整并精简为一行 - warmup_steps 改为 warmup_ratio (默认0.05)		2026-05-16 21:27:35 +08:00
..
benchmark.py	refactor: 重构 cache 和 inference 参数体系，分离存储与分配	2026-05-14 20:05:08 +08:00
generate.py	docs: 修正文档中与源码不符的类名、方法签名和模块归属	2026-05-14 15:04:53 +08:00
perplexity.py	refactor: 优化工具脚本接口并修复批处理问题	2026-04-05 21:56:22 +08:00
server.py	refactor: 重构 inference 模块架构，引入设计模式并分组文件	2026-05-14 17:42:37 +08:00
train.py	refactor: 训练循环改为两重迭代并统一参数命名	2026-05-16 21:27:35 +08:00