- RotaryEmbedding/CacheView 接受 position_ids 替代 start_pos - process_attention_mask 用 position_ids >= arange 做逐位置 causal - 训练/无 KV cache 时 position_ids=None 内部自动处理 - 移除 executor/benchmark 中冗余的 input_mask 构造 |
||
|---|---|---|
| .. | ||
| conftest.py | ||
| test_cache.py | ||
| test_engine.py | ||
| test_sample.py | ||
| test_scheduler.py | ||
| test_server.py | ||
| test_task.py | ||