fix(convert): Remove unused tensor name mappings

gabe-l-hart · gabe-l-hart · commit b5b9e4bee463 · 2024-09-23T12:54:50.000-06:00
Branch: GraniteMoE

Co-Authored-By: git@compilade.net
Signed-off-by: Gabe Goodhart &lt;ghart@us.ibm.com&gt;
diff --git a/gguf-py/gguf/tensor_mapping.py b/gguf-py/gguf/tensor_mapping.py
@@ -293,11 +293,10 @@ class TensorNameMap:
         ),
 
         MODEL_TENSOR.FFN_UP_EXP: (
-            "layers.{bid}.feed_forward.experts.w3",                # mixtral (merged)
-            "transformer.decoder_layer.{bid}.moe.linear_v",        # Grok (merged)
-            "transformer.blocks.{bid}.ffn.experts.mlp.v1",         # dbrx
-            "model.layers.{bid}.mlp.experts.up_proj",              # qwen2moe olmoe (merged)
-            "model.layers.{bid}.block_sparse_moe.input_linear.up", # granitemoe
+            "layers.{bid}.feed_forward.experts.w3",          # mixtral (merged)
+            "transformer.decoder_layer.{bid}.moe.linear_v",  # Grok (merged)
+            "transformer.blocks.{bid}.ffn.experts.mlp.v1",   # dbrx
+            "model.layers.{bid}.mlp.experts.up_proj",        # qwen2moe olmoe (merged)
         ),
 
         MODEL_TENSOR.FFN_UP_SHEXP: (
@@ -326,11 +325,10 @@ class TensorNameMap:
         ),
 
         MODEL_TENSOR.FFN_GATE_EXP: (
-            "layers.{bid}.feed_forward.experts.w1",                  # mixtral (merged)
-            "transformer.decoder_layer.{bid}.moe.linear",            # Grok (merged)
-            "transformer.blocks.{bid}.ffn.experts.mlp.w1",           # dbrx
-            "model.layers.{bid}.mlp.experts.gate_proj",              # qwen2moe olmoe (merged)
-            "model.layers.{bid}.block_sparse_moe.input_linear.gate", # granitemoe
+            "layers.{bid}.feed_forward.experts.w1",         # mixtral (merged)
+            "transformer.decoder_layer.{bid}.moe.linear",   # Grok (merged)
+            "transformer.blocks.{bid}.ffn.experts.mlp.w1",  # dbrx
+            "model.layers.{bid}.mlp.experts.gate_proj",     # qwen2moe olmoe (merged)
         ),
 
         MODEL_TENSOR.FFN_GATE_SHEXP: (