AstrAI

History

ViperEkura 615ba5d8ef feat : 新增 HumanEval pass@k 代码生成评测 - InferenceEngine.generate() 批量生成 n 个补全 - 正则提取函数体 + 停止符截断 - multiprocessing sandbox 执行 + timeout 保护 - 标准无偏 pass@k 公式 (1, 10, 100)		2026-06-03 10:52:32 +08:00
..
benchmark.py	refactor: Transformer更名为AutoRegressiveLM并新增EmbeddingEncoder	2026-05-17 15:29:20 +08:00
evaluate_humaneval.py	feat : 新增 HumanEval pass@k 代码生成评测	2026-06-03 10:52:32 +08:00
evaluate_mmlu.py	fix : 修复 MMLU 评测脚本数据源和依赖	2026-05-30 16:51:24 +08:00
generate.py	docs: 修正文档中与源码不符的类名、方法签名和模块归属	2026-05-14 15:04:53 +08:00
perplexity.py	fix : 修正类型标注与统一 CLI 参数命名	2026-05-27 20:49:44 +08:00
preprocess.py	refactor : 基于声明式 JSON 配置的预处理管线重构	2026-05-30 20:45:09 +08:00
server.py	fix : 修正类型标注与统一 CLI 参数命名	2026-05-27 20:49:44 +08:00
train.py	refactor : 并行启动 Strategy 模式重构，local_rank 解耦	2026-06-02 11:22:24 +08:00