rename the rotation file to apply_spin_quant_r1_r2

shewu-quic · shewu-quic · commit 9a90e5d341f8 · 2024-09-10T11:39:42.000+08:00
diff --git a/examples/models/llama2/export_llama_lib.py b/examples/models/llama2/export_llama_lib.py
@@ -45,13 +45,16 @@
 from executorch.util.activation_memory_profiler import generate_memory_trace
 
 from ..model_factory import EagerModelFactory
+from .source_transformation.apply_spin_quant_r1_r2 import (
+    fuse_layer_norms,
+    get_model_with_r1_r2,
+)
 from .source_transformation.quantize import (
     get_quant_embedding_transform,
     get_quant_weight_transform,
 )
 from .source_transformation.rms_norm import replace_rms_norm_with_native_rms_norm
 from .source_transformation.rope import materialze_broadcast_of_rope_freq_cis
-from .source_transformation.rotation import fuse_layer_norms, get_rotate_model
 from .source_transformation.sdpa import (
     replace_causal_mask,
     replace_kv_cache_with_simple_kv_cache,
@@ -434,7 +437,7 @@ def _prepare_for_llama_export(modelname: str, args) -> LLMEdgeManager:
 
     if args.optimized_rotation_path:
         transforms.append(fuse_layer_norms)
-        transforms.append(get_rotate_model(args.optimized_rotation_path))
+        transforms.append(get_model_with_r1_r2(args.optimized_rotation_path))
     return (
         _load_llama_model(
             modelname=modelname,
diff --git a/examples/models/llama2/source_transformation/apply_spin_quant_r1_r2.py b/examples/models/llama2/source_transformation/apply_spin_quant_r1_r2.py
@@ -93,11 +93,11 @@ def cleanup_memory() -> None:
     gc.collect()
 
 
-def get_rotate_model(optimized_rotation_path: str):
-    return lambda model: rotate_model(model, optimized_rotation_path)
+def get_model_with_r1_r2(optimized_rotation_path: str):
+    return lambda model: apply_spin_quant_r1_r2(model, optimized_rotation_path)
 
 
-def rotate_model(model: torch.nn.Module, optimized_rotation_path: str):
+def apply_spin_quant_r1_r2(model: torch.nn.Module, optimized_rotation_path: str):
     optimized_rotation = torch.load(optimized_rotation_path, weights_only=True)
     R1 = optimized_rotation["R1"].to(torch.float32)
     config = model.params