Fix the missing vocab params in llama.py

JamePeng · JamePeng · commit e4d0d97473c6 · 2025-01-27T20:32:41.000+08:00
diff --git a/llama_cpp/llama.py b/llama_cpp/llama.py
@@ -478,10 +478,10 @@ def free_lora_adapter():
         bos_token_id = self.token_bos()
 
         eos_token = (
-            self._model.token_get_text(eos_token_id) if eos_token_id != -1 else ""
+            self._model.token_get_text(self._vocab, eos_token_id) if eos_token_id != -1 else ""
         )
         bos_token = (
-            self._model.token_get_text(bos_token_id) if bos_token_id != -1 else ""
+            self._model.token_get_text(self._vocab, bos_token_id) if bos_token_id != -1 else ""
         )
 
         # Unfortunately the llama.cpp API does not return metadata arrays, so we can't get template names from tokenizer.chat_templates
@@ -1237,7 +1237,7 @@ def _create_completion(
 
         if prompt_tokens[:2] == [self.token_bos()] * 2:
             warnings.warn(
-                f'Detected duplicate leading "{self._model.token_get_text(self.token_bos())}" in prompt, this will likely reduce response quality, consider removing it...',
+                f'Detected duplicate leading "{self._model.token_get_text(self._vocab, self.token_bos())}" in prompt, this will likely reduce response quality, consider removing it...',
                 RuntimeWarning,
             )
 

Original file line number	Diff line number	Diff line change
`@@ -478,10 +478,10 @@ def free_lora_adapter():`
`478`	`478`	`bos_token_id = self.token_bos()`
`479`	`479`
`480`	`480`	`eos_token = (`
`481`		`- self._model.token_get_text(eos_token_id) if eos_token_id != -1 else ""`
	`481`	`+ self._model.token_get_text(self._vocab, eos_token_id) if eos_token_id != -1 else ""`
`482`	`482`	`)`
`483`	`483`	`bos_token = (`
`484`		`- self._model.token_get_text(bos_token_id) if bos_token_id != -1 else ""`
	`484`	`+ self._model.token_get_text(self._vocab, bos_token_id) if bos_token_id != -1 else ""`
`485`	`485`	`)`
`486`	`486`
`487`	`487`	`# Unfortunately the llama.cpp API does not return metadata arrays, so we can't get template names from tokenizer.chat_templates`
`@@ -1237,7 +1237,7 @@ def _create_completion(`
`1237`	`1237`
`1238`	`1238`	`if prompt_tokens[:2] == [self.token_bos()] * 2:`
`1239`	`1239`	`warnings.warn(`
`1240`		`- f'Detected duplicate leading "{self._model.token_get_text(self.token_bos())}" in prompt, this will likely reduce response quality, consider removing it...',`
	`1240`	`+ f'Detected duplicate leading "{self._model.token_get_text(self._vocab, self.token_bos())}" in prompt, this will likely reduce response quality, consider removing it...',`
`1241`	`1241`	`RuntimeWarning,`
`1242`	`1242`	`)`
`1243`	`1243`