AstrAI

History

ViperEkura d4451f6afb fix : 并行训练 state_dict 收集与训练/推理并发缺陷 - FSDPExecutor: unwrap_model 返回全量 state_dict (state_dict_type FULL)；use_orig_params=True - DDPExecutor/BaseExecutor: unwrap_model 统一返回 model.module.state_dict() / model.state_dict() - CheckpointCallback: 走 executor.unwrap_model 拿完整 state_dict - strategy.py: 移除 FSDP/DDp 依赖；create_ref_model(model_fn, state_dict) 纯函数 - TrainContextBuilder: 传递 model_fn + executor 到 strategy - GRPOStrategy.sync_ref_model: 通过 executor.unwrap_model 获取完整权重 - TaskManager.wait_for_tasks: 锁内检查队列，消除 clear/set 竞态 - ProtocolHandler: stop token 不再计入 completion_tokens（流式/非流式）		2026-05-29 21:12:52 +08:00
..
api	fix : 并行训练 state_dict 收集与训练/推理并发缺陷	2026-05-29 21:12:52 +08:00
core	fix : 并行训练 state_dict 收集与训练/推理并发缺陷	2026-05-29 21:12:52 +08:00
__init__.py	refactor: 推理协议层重构为策略/建造者模式	2026-05-26 00:12:57 +08:00
engine.py	refactor : 移除 -> None 返回值标注，拆分 FSDP 参数，新增 mmap 数据集存储	2026-05-28 13:57:06 +08:00
sample.py	fix: 修复推理引擎 batch decode 中多项正确性与并发问题	2026-05-14 21:31:39 +08:00