add f16 convert

ngxson · ngxson · commit 84288ff9f7e9 · 2024-07-08T17:05:17.000+02:00
diff --git a/convert_lora_to_gguf.py b/convert_lora_to_gguf.py
@@ -139,10 +139,17 @@ def get_tensors(self) -> Iterator[tuple[str, Tensor]]:
 
     # overwrite method
     def modify_tensors(self, data_torch: Tensor, name: str, bid: int | None) -> Iterable[tuple[str, Tensor]]:
+        del bid  # unused
         return [(name, data_torch)]
 
+    # overwrite method
+    def extra_f16_tensors(self, name: str, new_name: str, bid: int | None, n_dims: int) -> bool:
+        del name, new_name, bid, n_dims  # unused
+        return True
+
     model_instance.get_tensors = types.MethodType(get_tensors, model_instance)
     model_instance.modify_tensors = types.MethodType(modify_tensors, model_instance)
+    model_instance.extra_f16_tensors = types.MethodType(extra_f16_tensors, model_instance)
     model_instance.gguf_writer.add_quantization_version(gguf.GGML_QUANT_VERSION)
     logger.info("Exporting model...")
     model_instance.write()