AstrAI/astrai
ViperEkura 29b5717a38 fix: 修复推理引擎 batch decode 中多项正确性与并发问题
- scheduler: decode 分组由幂次分桶改为精确 next_pos,消除 KV cache 位置错乱
- task: activate() 加锁操作 active_tasks,消除数据竞争
- engine: wait_completion 加超时,防止分配失败时永久死锁
- sample: TopKStrategy 向量化为 per-sample threshold,尊重各 task 的 top_k
- cache: Storage.write/gather 中 -1 页改用 mask 处理,防数据污染
- executor: prefill 逐 task 循环改为单次 tensor 调用
2026-05-14 21:27:05 +08:00
..
config refactor: 移除 device_ids 参数设计,统一通过 CUDA_VISIBLE_DEVICES 控制 GPU 分配;更新 README 训练示例 2026-05-09 14:55:43 +08:00
dataset fix: MultiSegmentFetcher 空 dict 崩溃 + BaseDataset assert 替换为显式 raise 2026-05-12 11:41:45 +08:00
inference fix: 修复推理引擎 batch decode 中多项正确性与并发问题 2026-05-14 21:27:05 +08:00
model refactor: 重构 cache 和 inference 参数体系,分离存储与分配 2026-05-14 20:05:08 +08:00
parallel refactor: 移除 device_ids 参数设计,统一通过 CUDA_VISIBLE_DEVICES 控制 GPU 分配;更新 README 训练示例 2026-05-09 14:55:43 +08:00
tokenize fix: 修复 CLI 参数缺失/重复、device_ids 越界、generate 参数名不一致、scheduler 时序、非流式截断等 bug 2026-05-09 14:36:42 +08:00
trainer refactor: 消除多处重复模式,统一工厂和参数传递 2026-05-14 18:00:50 +08:00
__init__.py release: v1.3.4 2026-05-10 15:59:18 +08:00
factory.py refactor: 消除多处重复模式,统一工厂和参数传递 2026-05-14 18:00:50 +08:00
serialization.py refactor: 抽取 BaseStorage 存储抽象,支持 JSON 原始文本数据加载 2026-05-12 11:17:24 +08:00