AstrAI/scripts/tools
ViperEkura e1638a7ade fix: 修正AdamW超参数默认值与文档示例
- 交换adamw_beta1/adamw_beta2默认值:beta1=0.95, beta2=0.99
- label_smoothing默认值改为0.05
- 文档示例统一更新:train_type=pt, weight_decay=0.01
- 移除文档中过时的strategy default标注
2026-05-16 22:46:17 +08:00
..
benchmark.py refactor: 重构 cache 和 inference 参数体系,分离存储与分配 2026-05-14 20:05:08 +08:00
generate.py docs: 修正文档中与源码不符的类名、方法签名和模块归属 2026-05-14 15:04:53 +08:00
perplexity.py refactor: 优化工具脚本接口并修复批处理问题 2026-04-05 21:56:22 +08:00
server.py refactor: 重构 inference 模块架构,引入设计模式并分组文件 2026-05-14 17:42:37 +08:00
train.py fix: 修正AdamW超参数默认值与文档示例 2026-05-16 22:46:17 +08:00