AstrAI/scripts/tools
ViperEkura 615ba5d8ef feat : 新增 HumanEval pass@k 代码生成评测
- InferenceEngine.generate() 批量生成 n 个补全
- 正则提取函数体 + 停止符截断
- multiprocessing sandbox 执行 + timeout 保护
- 标准无偏 pass@k 公式 (1, 10, 100)
2026-06-03 10:52:32 +08:00
..
benchmark.py refactor: Transformer更名为AutoRegressiveLM并新增EmbeddingEncoder 2026-05-17 15:29:20 +08:00
evaluate_humaneval.py feat : 新增 HumanEval pass@k 代码生成评测 2026-06-03 10:52:32 +08:00
evaluate_mmlu.py fix : 修复 MMLU 评测脚本数据源和依赖 2026-05-30 16:51:24 +08:00
generate.py docs: 修正文档中与源码不符的类名、方法签名和模块归属 2026-05-14 15:04:53 +08:00
perplexity.py fix : 修正类型标注与统一 CLI 参数命名 2026-05-27 20:49:44 +08:00
preprocess.py refactor : 基于声明式 JSON 配置的预处理管线重构 2026-05-30 20:45:09 +08:00
server.py fix : 修正类型标注与统一 CLI 参数命名 2026-05-27 20:49:44 +08:00
train.py refactor : 并行启动 Strategy 模式重构,local_rank 解耦 2026-06-02 11:22:24 +08:00