AstrAI/scripts/tools
ViperEkura c0effc9f5b refactor: 位置编码改用 position_ids [B,S],简化 attention mask 构建
- RotaryEmbedding/CacheView 接受 position_ids 替代 start_pos

- process_attention_mask 用 position_ids >= arange 做逐位置 causal

- 训练/无 KV cache 时 position_ids=None 内部自动处理

- 移除 executor/benchmark 中冗余的 input_mask 构造
2026-05-14 13:26:31 +08:00
..
benchmark.py refactor: 位置编码改用 position_ids [B,S],简化 attention mask 构建 2026-05-14 13:26:31 +08:00
generate.py fix: 修复 CLI 参数缺失/重复、device_ids 越界、generate 参数名不一致、scheduler 时序、非流式截断等 bug 2026-05-09 14:36:42 +08:00
perplexity.py refactor: 优化工具脚本接口并修复批处理问题 2026-04-05 21:56:22 +08:00
server.py refactor: 优化工具脚本接口并修复批处理问题 2026-04-05 21:56:22 +08:00
train.py refactor: 移除 device_ids 参数设计,统一通过 CUDA_VISIBLE_DEVICES 控制 GPU 分配;更新 README 训练示例 2026-05-09 14:55:43 +08:00