AstrAI/scripts/eval
ViperEkura 1818d06576 feat: 新增 IFD 数据质量评分工具, 移动 ppl 至 eval
- 计算指令遵循难度分数用于数据筛选
- IFD = 条件交叉熵 / 无条件交叉熵
- perplexity 移至 scripts/eval/
2026-06-16 22:03:45 +08:00
..
evaluate_humaneval.py feat: 新增 IFEval 指令遵循评测 2026-06-16 21:57:34 +08:00
evaluate_ifd.py feat: 新增 IFD 数据质量评分工具, 移动 ppl 至 eval 2026-06-16 22:03:45 +08:00
evaluate_ifeval.py feat: 新增 IFEval 指令遵循评测 2026-06-16 21:57:34 +08:00
evaluate_mmlu.py feat: 新增 IFEval 指令遵循评测 2026-06-16 21:57:34 +08:00
evaluate_ppl.py feat: 新增 IFD 数据质量评分工具, 移动 ppl 至 eval 2026-06-16 22:03:45 +08:00