Push model prefix from VarBuilder if Qwen3-Reranker

alvarobartt · alvarobartt · commit 629b32d1dc9d · 2025-06-10T08:56:18.000+02:00
diff --git a/backends/candle/src/models/flash_qwen3.rs b/backends/candle/src/models/flash_qwen3.rs
@@ -308,6 +308,14 @@ impl FlashQwen3Model {
             ModelType::Embedding(pool) => pool,
         };
 
+        // The Qwen3-Reranker models contain the `model` key
+        // https://huggingface.co/collections/Qwen/qwen3-reranker-6841b22d0192d7ade9cdefea
+        let vb = if vb.contains_tensor("model.embed_tokens.weight") {
+            vb.pp("model")
+        } else {
+            vb
+        };
+
         let embeddings = Embedding::new(
             vb.pp("embed_tokens")
                 .get((config.vocab_size, config.hidden_size), "weight")?,
@@ -497,6 +505,7 @@ impl Model for FlashQwen3Model {
     fn is_padded(&self) -> bool {
         false
     }
+
     fn embed(&self, batch: Batch) -> Result<(Option<Tensor>, Option<Tensor>)> {
         self.forward(batch)
     }