AstrAI/astrai/model
ViperEkura ed95ef245c perf: 消除 RotaryEmbedding.forward 中 position_ids GPU 同步
- cos/sin 缓存预分配到 max_len,移除运行时动态扩容逻辑

- 移除未使用的 max_len_cached 属性

- 解码累计从 4.23s → 3.99s(+5.7%)
2026-05-14 15:53:21 +08:00
..
__init__.py chore: 修改类名,优化导入顺序 2026-04-05 22:27:57 +08:00
automodel.py fix: 修复 CLI 参数缺失/重复、device_ids 越界、generate 参数名不一致、scheduler 时序、非流式截断等 bug 2026-05-09 14:36:42 +08:00
module.py perf: 消除 RotaryEmbedding.forward 中 position_ids GPU 同步 2026-05-14 15:53:21 +08:00
transformer.py perf: 消除 PagedCache.write 中的 position_ids GPU 同步,解码提速 15% 2026-05-14 15:37:48 +08:00