AstrAI/astrai/model
ViperEkura acd1103bd0 fix : 使用 bool 注意力掩码并支持打包 SFT 文档边界阻断
- 简化 process_attention_mask,通过广播返回 bool 掩码
- 新增 make_doc_boundary_mask 生成块对角因果掩码
- SFT strategy 传入文档边界掩码
2026-06-05 17:02:28 +08:00
..
components refactor: 统一序列化层,消除分散的 I/O 路径 2026-05-26 16:44:40 +08:00
__init__.py feat: 新增LoRA微调模块 2026-05-25 20:15:31 +08:00
automodel.py refactor : 移除 -> None 返回值标注,拆分 FSDP 参数,新增 mmap 数据集存储 2026-05-28 13:57:06 +08:00
encoder.py fix : 修正类型标注与统一 CLI 参数命名 2026-05-27 20:49:44 +08:00
transformer.py fix : 使用 bool 注意力掩码并支持打包 SFT 文档边界阻断 2026-06-05 17:02:28 +08:00