- BaseModelConfig: fields() 精确字段匹配 + 类型矫正 + 未知key警告 - DeepSeekMoE: 共享专家 + 路由专家 + top-K 门控 - AttnFactory/FFNFactory: 装饰器注册,DecoderBlock 零分支 - config 用 attn_type/ffn_type 驱动组件选择 |
||
|---|---|---|
| .. | ||
| __init__.py | ||
| attention.py | ||
| decoder_block.py | ||
| embedding.py | ||
| linear.py | ||
| mlp.py | ||
| norm.py | ||
| rope.py | ||