AstrAI/scripts
ViperEkura 34c6c45bd6 feat: 初步实现 MMLU 评测脚本
- 支持 few-shot (log-likelihood ranking) 与 zero-shot
- 自动下载 Hendrycks MMLU 数据集
- --device / --dtype 可配置,默认 GPU bf16
2026-05-26 20:23:31 +08:00
..
demo refactor: generate_ar 改用流式输出并去除冗余注释 2026-05-17 10:23:42 +08:00
tools feat: 初步实现 MMLU 评测脚本 2026-05-26 20:23:31 +08:00
docker.sh fix: docker-compose UID/GID 添加默认值,修复 docker.sh logs 命令 2026-05-18 14:24:00 +08:00
pre_commit.sh ci: 优化 GitHub Actions 工作流 2026-04-05 22:40:16 +08:00