AstrAI/astrai
ViperEkura 6d6ef99e66 perf: 消除 PagedCache.write 中的 position_ids GPU 同步,解码提速 15%
- CacheView.write 用 total_len - k.size(1) 推导 start_pos,替代 position_ids[0,0].item()

- 移除 GQA/MLA/DecoderBlock 中不再使用的 position_ids 参数

- PagedCache.write 参数 position_ids:Tensor → start_pos:int
2026-05-14 15:37:48 +08:00
..
config refactor: 移除 device_ids 参数设计,统一通过 CUDA_VISIBLE_DEVICES 控制 GPU 分配;更新 README 训练示例 2026-05-09 14:55:43 +08:00
dataset fix: MultiSegmentFetcher 空 dict 崩溃 + BaseDataset assert 替换为显式 raise 2026-05-12 11:41:45 +08:00
inference perf: 消除 PagedCache.write 中的 position_ids GPU 同步,解码提速 15% 2026-05-14 15:37:48 +08:00
model perf: 消除 PagedCache.write 中的 position_ids GPU 同步,解码提速 15% 2026-05-14 15:37:48 +08:00
parallel refactor: 移除 device_ids 参数设计,统一通过 CUDA_VISIBLE_DEVICES 控制 GPU 分配;更新 README 训练示例 2026-05-09 14:55:43 +08:00
tokenize fix: 修复 CLI 参数缺失/重复、device_ids 越界、generate 参数名不一致、scheduler 时序、非流式截断等 bug 2026-05-09 14:36:42 +08:00
trainer feat: Checkpoint 支持 extra 通用扩展数据,用户通过函数自定义保存/恢复优化器等状态 2026-05-09 15:50:38 +08:00
__init__.py release: v1.3.4 2026-05-10 15:59:18 +08:00
factory.py chore: 修改类名,优化导入顺序 2026-04-05 22:27:57 +08:00
serialization.py refactor: 抽取 BaseStorage 存储抽象,支持 JSON 原始文本数据加载 2026-05-12 11:17:24 +08:00