AstrAI/astrai
ViperEkura 44d7a4e959 refactor: 设计模式优化 inference 模块导入结构
- 新建 cache.py:SlotAllocator 对象池 + PrefixCacheManager

- 新建 sampling.py:Temperature/TopK/TopP 可组合策略

- TaskStatus 改用 Enum,GenerationParams 值对象模式

- _STOP 移至 cache.py,解除 engine→scheduler 轻量耦合

- 更新测试导入路径,ruff 格式检查通过
2026-05-08 16:57:57 +08:00
..
config feat: 实现模型动态注册机制 2026-04-05 19:38:12 +08:00
dataset chore: 修改错误拼写 2026-04-06 10:37:19 +08:00
inference refactor: 设计模式优化 inference 模块导入结构 2026-05-08 16:57:57 +08:00
model fix: 修复 remove_task 未释放 KV cache slot 导致第二轮对话死锁 2026-05-08 14:53:04 +08:00
parallel refactor: 优化参数传递,清理导入样式 2026-04-03 22:06:32 +08:00
tokenize refactor: 精简推理引擎代码,优化参数传递规范 2026-04-09 14:17:48 +08:00
trainer fix: 修复 remove_task 未释放 KV cache slot 导致第二轮对话死锁 2026-05-08 14:53:04 +08:00
__init__.py chore: 优化未使用的模块 2026-04-06 09:54:17 +08:00
factory.py chore: 修改类名,优化导入顺序 2026-04-05 22:27:57 +08:00
serialization.py refactor: 从data 模块分离tokenizer 2026-04-04 16:12:58 +08:00