- add_task 中 prompt 超长时改为保留末尾 token(prompt_ids[-max_prompt_len:]) 而非开头 token,确保多轮对话时模型能看到最近的提问上下文 |
||
|---|---|---|
| .. | ||
| __init__.py | ||
| engine.py | ||
| scheduler.py | ||
| server.py | ||
- add_task 中 prompt 超长时改为保留末尾 token(prompt_ids[-max_prompt_len:]) 而非开头 token,确保多轮对话时模型能看到最近的提问上下文 |
||
|---|---|---|
| .. | ||
| __init__.py | ||
| engine.py | ||
| scheduler.py | ||
| server.py | ||