ViperEkura
|
c169659611
|
docs: 修正 assets/docs/ 类图、数据流、参数文档及贡献指南
- design.md: 新增 ProtocolHandler/OpenAIHandler/AnthropicHandler 等缺失类
- design.md: 新增 Template Method、Storage 设计模式
- dataflow.md: 修正 GQA/MLA 为独立条目,补充 JSON 存储后端
- params.md: 标注 label_smoothing CLI 默认与 strategy 默认差异
- introduction.md: 修正 max_tokens 默认值 1024→2048
- CONTRIBUTING.md: 重写(纯 Python 无 conda、补充 CI 步骤与常见问题)
- .github/PULL_REQUEST_TEMPLATE.md: 修正 lint 命令,去除多余注释要求
- .github/ISSUE_TEMPLATE/bug_report.md: 修正 label(enhancement→bug)
|
2026-05-15 22:54:41 +08:00 |
ViperEkura
|
d8da2cf17c
|
docs: 修复文档中与源码不符的类名、方法签名和模块归属
- CONTRIBUTING.md: ruff/pytest 命令改为 conda 方式
- params.md: max_len → max_tokens
- introduction.md: max_len=1024 → max_tokens=None
- dataflow.md: PagedCache/CacheView → KVCache/KvcacheView
- design.md: 全面修正类图(PagedCache→Allocator等6个新类、删除position_ids误参、修正BaseDataset字段和25+条关系线、Module Overview更新)
|
2026-05-14 20:26:24 +08:00 |
ViperEkura
|
a8e2a1ba45
|
docs: 修正文档中与源码不符的类名、方法签名和模块归属
- Transformer/DecoderBlock/GQA/RotaryEmbedding forward 签名 start_pos → position_ids
- _Result → GenerateResult
- save_h5/load_h5 从 serialization 移至 dataset 模块
- PagedCache UML 移除内部 PagePool 属性
- 修正 Layer 数不一致(24 vs 32)及 decode 位置分组描述
- 更新文档时间为 2026-05-14
|
2026-05-14 15:04:53 +08:00 |
ViperEkura
|
db99d8b254
|
fix: 修复文档多处不准确 + inference scheduler 越界 bug + SchedulerCallback 回调阶段修正
文档 (6 个文件):
- design.md: 15+ 处修正 — persistent_key_values→paged_cache,
MLA 字段重写, Server/ParallelSetup 不存在类移除,
关系箭头方向修复, SchedulerCallback 阶段修正等
- dataflow.md: 重写数据流图和描述, 修复训练回调顺序、
数据键名、MLA 归属、MetricTracker 等错误
- introduction.md: 层数 32→24, MLP 图双 Linear 修正,
默认值/响应字段/health 端点修复
- params.md: 补充 grpo 及 4 个 GRPO 参数
- README.md / README-zh-CN.md: generate.py 补全必需参数,
删除重复注释, HuggingFace 声明修正
代码 (2 个文件):
- scheduler.py: n_pages 池加 page_size 余量防止越界;
decode 前预分配页
- train_callback.py: SchedulerCallback 从 on_step_end 改
回 on_batch_end (按 batch 步进学习率)
|
2026-05-09 15:40:17 +08:00 |
ViperEkura
|
d73f52a2f8
|
feat: 新增 Anthropic 兼容 /v1/messages API,移除旧版 /generate 端点
- 新增 /v1/messages 端点,兼容 Anthropic Messages API 格式
- 支持流式 SSE(message_start → content_block_delta → message_stop)
- 支持 system 顶层提示词与 stop_sequences 停止序列
- 新增 AnthropicMessage / MessagesRequest Pydantic 模型
- 移除旧版 /generate 端点及相关测试用例
- 更新 README.md / README-zh-CN.md / introduction.md 文档
|
2026-05-09 11:47:22 +08:00 |
ViperEkura
|
296db909aa
|
docs: 更新设计文档
|
2026-04-09 20:05:54 +08:00 |
ViperEkura
|
408f0cb513
|
docs: 更新网络接口文档
|
2026-04-06 13:39:51 +08:00 |
ViperEkura
|
bf7adb35b3
|
docs: 更新文档
|
2026-04-06 00:50:37 +08:00 |
ViperEkura
|
d2fe8afbd1
|
chore: 更新文档, 修正代码格式
|
2026-04-05 20:59:52 +08:00 |
ViperEkura
|
e7721eafc6
|
docs: 更新说明内容
|
2026-03-31 15:18:49 +08:00 |
ViperEkura
|
50488bd659
|
chore: 简化格式并更新文档
|
2026-03-31 00:28:58 +08:00 |
ViperEkura
|
0e7fc623b4
|
fix: 修复部分已知问题
|
2026-03-30 21:42:00 +08:00 |
ViperEkura
|
a4443765ee
|
Initial commit
|
2025-09-27 12:02:22 +08:00 |