AstrAI/astrai
ViperEkura dbe5891201 refactor : 统一 SectionedMaskBuilder,支持可配置 dtype
- 三合一 MaskBuilder,移除 chat/instruction/text,统一为 sections 配置
- OutputConfig 增加 dtype 字段 (per-key,默认 int32)
- 移除 from __future__ import annotations
- 测试适配新配置格式
2026-05-31 14:24:10 +08:00
..
config refactor : 统一 SectionedMaskBuilder,支持可配置 dtype 2026-05-31 14:24:10 +08:00
dataset fix : 修复 created 时间戳、bin 多 shard 覆盖与文档遗漏 2026-05-30 23:03:42 +08:00
inference fix : 修复 created 时间戳、bin 多 shard 覆盖与文档遗漏 2026-05-30 23:03:42 +08:00
model refactor : 移除 -> None 返回值标注,拆分 FSDP 参数,新增 mmap 数据集存储 2026-05-28 13:57:06 +08:00
parallel fix : FSDP 优化器顺序、温度除零、调度器静默死亡、ref模型设备 2026-05-29 21:57:44 +08:00
preprocessing refactor : 统一 SectionedMaskBuilder,支持可配置 dtype 2026-05-31 14:24:10 +08:00
tokenize fix: 移除多余 request 参数并增强 tokenizer 健壮性 2026-05-17 12:52:18 +08:00
trainer fix : FSDP 优化器顺序、温度除零、调度器静默死亡、ref模型设备 2026-05-29 21:57:44 +08:00
__init__.py release : v1.3.7 2026-05-29 17:46:03 +08:00
factory.py refactor : 移除 -> None 返回值标注,拆分 FSDP 参数,新增 mmap 数据集存储 2026-05-28 13:57:06 +08:00
protocols.py refactor: 重构训练后端为 Executor 模式 2026-05-24 20:35:44 +08:00
serialization.py feat : load_json/load_safetensors 支持 broadcast,跨节点分布式加载 2026-05-28 20:44:58 +08:00