AstrAI/scripts/demo
ViperEkura 44d7a4e959 refactor: 设计模式优化 inference 模块导入结构
- 新建 cache.py:SlotAllocator 对象池 + PrefixCacheManager

- 新建 sampling.py:Temperature/TopK/TopP 可组合策略

- TaskStatus 改用 Enum,GenerationParams 值对象模式

- _STOP 移至 cache.py,解除 engine→scheduler 轻量耦合

- 更新测试导入路径,ruff 格式检查通过
2026-05-08 16:57:57 +08:00
..
download.py build: 修改docker 构建流程 2026-04-10 11:25:00 +08:00
generate_ar.py refactor: 优化工具脚本接口并修复批处理问题 2026-04-05 21:56:22 +08:00
generate_batch.py refactor: 优化工具脚本接口并修复批处理问题 2026-04-05 21:56:22 +08:00
stream_chat.py refactor: 设计模式优化 inference 模块导入结构 2026-05-08 16:57:57 +08:00