AstrAI/astrai/inference
ViperEkura f521a30b22 fix : FSDP 优化器顺序、温度除零、调度器静默死亡、ref模型设备
- executor: use_orig_params 硬编码 True,FSDP 不替换 Parameter 对象
- strategy: DPO/GRPO ref 模型创建后移到 device
- sample: TemperatureStrategy clamp 1e-8,engine 验证改为 >0
- scheduler: 异常不 re-raise 避免 daemon 静默死亡,stop() 发回调给 waiting 任务
2026-05-29 21:57:44 +08:00
..
api fix : 并行训练 state_dict 收集与训练/推理并发缺陷 2026-05-29 21:12:52 +08:00
core fix : FSDP 优化器顺序、温度除零、调度器静默死亡、ref模型设备 2026-05-29 21:57:44 +08:00
__init__.py refactor: 推理协议层重构为策略/建造者模式 2026-05-26 00:12:57 +08:00
engine.py fix : FSDP 优化器顺序、温度除零、调度器静默死亡、ref模型设备 2026-05-29 21:57:44 +08:00
sample.py fix : FSDP 优化器顺序、温度除零、调度器静默死亡、ref模型设备 2026-05-29 21:57:44 +08:00