- Transformer/DecoderBlock/GQA/RotaryEmbedding forward 签名 start_pos → position_ids - _Result → GenerateResult - save_h5/load_h5 从 serialization 移至 dataset 模块 - PagedCache UML 移除内部 PagePool 属性 - 修正 Layer 数不一致(24 vs 32)及 decode 位置分组描述 - 更新文档时间为 2026-05-14 |
||
|---|---|---|
| .. | ||
| README-zh-CN.md | ||
| dataflow.md | ||
| design.md | ||
| introduction.md | ||
| params.md | ||