AstrAI/tests
ViperEkura 6d6ef99e66 perf: 消除 PagedCache.write 中的 position_ids GPU 同步,解码提速 15%
- CacheView.write 用 total_len - k.size(1) 推导 start_pos,替代 position_ids[0,0].item()

- 移除 GQA/MLA/DecoderBlock 中不再使用的 position_ids 参数

- PagedCache.write 参数 position_ids:Tensor → start_pos:int
2026-05-14 15:37:48 +08:00
..
data test: 增加 13 个边界条件测试,不需要 base_test_env 的函数移除该参数 2026-05-12 11:47:30 +08:00
inference perf: 消除 PagedCache.write 中的 position_ids GPU 同步,解码提速 15% 2026-05-14 15:37:48 +08:00
module feat: 实现模型动态注册机制 2026-04-05 19:38:12 +08:00
parallel feat: 增加server, 并且修改测试单元 2026-04-02 15:05:07 +08:00
trainer fix: 修复 CLI 参数缺失/重复、device_ids 越界、generate 参数名不一致、scheduler 时序、非流式截断等 bug 2026-05-09 14:36:42 +08:00
conftest.py perf: 测试优化,model 改为 session 共享,scheduler 用 Event 替代 sleep 2026-05-12 11:35:18 +08:00