- CacheView.write 用 total_len - k.size(1) 推导 start_pos,替代 position_ids[0,0].item() - 移除 GQA/MLA/DecoderBlock 中不再使用的 position_ids 参数 - PagedCache.write 参数 position_ids:Tensor → start_pos:int |
||
|---|---|---|
| .. | ||
| conftest.py | ||
| test_cache.py | ||
| test_engine.py | ||
| test_sample.py | ||
| test_scheduler.py | ||
| test_server.py | ||
| test_task.py | ||