- BaseFactory.create() 按 __init__ 签名过滤多余 kwargs - 移除 GQA/MLA/MLP/DeepSeekMoE 中多余的 **kwargs - MLP/DeepSeekMoE 参数名统一为 dim_ffn - scheduler max_seq_len 增加 None 显式判断 - 默认 max_prompt_len 提升至 2048 |
||
|---|---|---|
| .. | ||
| api | ||
| core | ||
| __init__.py | ||
| engine.py | ||
| sample.py | ||
- BaseFactory.create() 按 __init__ 签名过滤多余 kwargs - 移除 GQA/MLA/MLP/DeepSeekMoE 中多余的 **kwargs - MLP/DeepSeekMoE 参数名统一为 dim_ffn - scheduler max_seq_len 增加 None 显式判断 - 默认 max_prompt_len 提升至 2048 |
||
|---|---|---|
| .. | ||
| api | ||
| core | ||
| __init__.py | ||
| engine.py | ||
| sample.py | ||