rebase & code review #1

haowhsu-quic · haowhsu-quic · commit 2f8ae11a6c48 · 2024-09-23T11:50:27.000+08:00
diff --git a/backends/qualcomm/passes/expand_broadcast_tensor_shape.py b/backends/qualcomm/passes/expand_broadcast_tensor_shape.py
@@ -17,16 +17,16 @@ class ExpandBroadcastTensorShape(ExportPass):
 
     def __init__(self):
         super(ExpandBroadcastTensorShape, self).__init__()
-        self.binary_op_targets = [
+        self.broadcast_op_targets = [
             exir_ops.edge.aten.add.Tensor,
             exir_ops.edge.aten.sub.Tensor,
             exir_ops.edge.aten.mul.Tensor,
             exir_ops.edge.aten.div.Tensor,
         ]
 
-    def _traverse_binary_node(self, graph_module: torch.fx.GraphModule):
+    def traverse_broadcast_node(self, graph_module: torch.fx.GraphModule):
         for node in graph_module.graph.nodes:
-            if node.target in self.binary_op_targets:
+            if node.target in self.broadcast_op_targets:
                 for arg in node.args:
                     input_rank = len(arg.meta["val"].shape)
                     output_rank = len(node.meta["val"].shape)
@@ -52,7 +52,7 @@ def _traverse_binary_node(self, graph_module: torch.fx.GraphModule):
                                 user.replace_input_with(arg, reshape_node)
 
     def call(self, graph_module: torch.fx.GraphModule):
-        self._traverse_binary_node(graph_module)
+        self.traverse_broadcast_node(graph_module)
         graph_module.recompile()
         dead_code_elimination_pass(graph_module)
         return PassResult(graph_module, True)
diff --git a/backends/qualcomm/tests/test_qnn_delegate.py b/backends/qualcomm/tests/test_qnn_delegate.py
@@ -1742,13 +1742,12 @@ def required_envs(self, conditions=None) -> bool:
             ]
         )
 
-    def test_fbnet(self):
+    def test_dino_v2(self):
         if not self.required_envs([self.image_dataset]):
             self.skipTest("missing required envs")
-
         cmds = [
             "python",
-            f"{self.executorch_root}/examples/qualcomm/oss_scripts/fbnet.py",
+            f"{self.executorch_root}/examples/qualcomm/oss_scripts/dino_v2.py",
             "--dataset",
             self.image_dataset,
             "--artifact",
@@ -1775,18 +1774,16 @@ def test_fbnet(self):
             if "Error" in msg:
                 self.fail(msg["Error"])
             else:
-                self.assertGreaterEqual(msg["top_1"], 60)
-                self.assertGreaterEqual(msg["top_5"], 90)
+                self.assertGreaterEqual(msg["top_1"], 70)
+                self.assertGreaterEqual(msg["top_5"], 85)
 
-    def test_gMLP(self):
-        if not self.required_envs([self.image_dataset]):
+    def test_esrgan(self):
+        if not self.required_envs():
             self.skipTest("missing required envs")
 
         cmds = [
             "python",
-            f"{self.executorch_root}/examples/qualcomm/oss_scripts/gMLP_image_classification.py",
-            "--dataset",
-            self.image_dataset,
+            f"{self.executorch_root}/examples/qualcomm/oss_scripts/esrgan.py",
             "--artifact",
             self.artifact_dir,
             "--build_folder",
@@ -1795,6 +1792,9 @@ def test_gMLP(self):
             self.device,
             "--model",
             self.model,
+            "--default_dataset",
+            "--oss_repo",
+            self.oss_repo,
             "--ip",
             self.ip,
             "--port",
@@ -1811,17 +1811,17 @@ def test_gMLP(self):
             if "Error" in msg:
                 self.fail(msg["Error"])
             else:
-                self.assertGreaterEqual(msg["top_1"], 60)
-                self.assertGreaterEqual(msg["top_5"], 90)
+                self.assertGreaterEqual(msg["PSNR"], 24)
+                self.assertGreaterEqual(msg["SSIM"], 0.8)
 
-    def test_regnet(self):
-        if not self.required_envs([self.image_dataset]):
+    def test_fastvit(self):
+        if not self.required_envs(
+            [self.image_dataset, self.pretrained_weight, self.oss_repo]
+        ):
             self.skipTest("missing required envs")
-
-        weights = ["regnet_y_400mf", "regnet_x_400mf"]
         cmds = [
             "python",
-            f"{self.executorch_root}/examples/qualcomm/oss_scripts/regnet.py",
+            f"{self.executorch_root}/examples/qualcomm/oss_scripts/fastvit.py",
             "--dataset",
             self.image_dataset,
             "--artifact",
@@ -1832,6 +1832,10 @@ def test_regnet(self):
             self.device,
             "--model",
             self.model,
+            "--oss_repo",
+            self.oss_repo,
+            "--pretrained_weight",
+            self.pretrained_weight,
             "--ip",
             self.ip,
             "--port",
@@ -1840,27 +1844,26 @@ def test_regnet(self):
         if self.host:
             cmds.extend(["--host", self.host])
 
-        for weight in weights:
-            p = subprocess.Popen(
-                cmds + ["--weights", weight], stdout=subprocess.DEVNULL
-            )
-            with Listener((self.ip, self.port)) as listener:
-                conn = listener.accept()
-                p.communicate()
-                msg = json.loads(conn.recv())
-                if "Error" in msg:
-                    self.fail(msg["Error"])
-                else:
-                    self.assertGreaterEqual(msg["top_1"], 60)
-                    self.assertGreaterEqual(msg["top_5"], 85)
+        p = subprocess.Popen(cmds, stdout=subprocess.DEVNULL)
+        with Listener((self.ip, self.port)) as listener:
+            conn = listener.accept()
+            p.communicate()
+            msg = json.loads(conn.recv())
+            if "Error" in msg:
+                self.fail(msg["Error"])
+            else:
+                self.assertGreaterEqual(msg["top_1"], 60)
+                self.assertGreaterEqual(msg["top_5"], 80)
 
-    def test_ssd300_vgg16(self):
-        if not self.required_envs([self.pretrained_weight, self.oss_repo]):
+    def test_fbnet(self):
+        if not self.required_envs([self.image_dataset]):
             self.skipTest("missing required envs")
 
         cmds = [
             "python",
-            f"{self.executorch_root}/examples/qualcomm/oss_scripts/ssd300_vgg16.py",
+            f"{self.executorch_root}/examples/qualcomm/oss_scripts/fbnet.py",
+            "--dataset",
+            self.image_dataset,
             "--artifact",
             self.artifact_dir,
             "--build_folder",
@@ -1869,10 +1872,6 @@ def test_ssd300_vgg16(self):
             self.device,
             "--model",
             self.model,
-            "--oss_repo",
-            self.oss_repo,
-            "--pretrained_weight",
-            self.pretrained_weight,
             "--ip",
             self.ip,
             "--port",
@@ -1889,14 +1888,16 @@ def test_ssd300_vgg16(self):
             if "Error" in msg:
                 self.fail(msg["Error"])
             else:
-                self.assertGreaterEqual(msg["mAP"], 0.70)
+                self.assertGreaterEqual(msg["top_1"], 60)
+                self.assertGreaterEqual(msg["top_5"], 90)
 
-    def test_dino_v2(self):
+    def test_gMLP(self):
         if not self.required_envs([self.image_dataset]):
             self.skipTest("missing required envs")
+
         cmds = [
             "python",
-            f"{self.executorch_root}/examples/qualcomm/oss_scripts/dino_v2.py",
+            f"{self.executorch_root}/examples/qualcomm/oss_scripts/gMLP_image_classification.py",
             "--dataset",
             self.image_dataset,
             "--artifact",
@@ -1923,16 +1924,19 @@ def test_dino_v2(self):
             if "Error" in msg:
                 self.fail(msg["Error"])
             else:
-                self.assertGreaterEqual(msg["top_1"], 70)
-                self.assertGreaterEqual(msg["top_5"], 85)
+                self.assertGreaterEqual(msg["top_1"], 60)
+                self.assertGreaterEqual(msg["top_5"], 90)
 
-    def test_esrgan(self):
-        if not self.required_envs():
+    def test_regnet(self):
+        if not self.required_envs([self.image_dataset]):
             self.skipTest("missing required envs")
 
+        weights = ["regnet_y_400mf", "regnet_x_400mf"]
         cmds = [
             "python",
-            f"{self.executorch_root}/examples/qualcomm/oss_scripts/esrgan.py",
+            f"{self.executorch_root}/examples/qualcomm/oss_scripts/regnet.py",
+            "--dataset",
+            self.image_dataset,
             "--artifact",
             self.artifact_dir,
             "--build_folder",
@@ -1941,9 +1945,6 @@ def test_esrgan(self):
             self.device,
             "--model",
             self.model,
-            "--default_dataset",
-            "--oss_repo",
-            self.oss_repo,
             "--ip",
             self.ip,
             "--port",
@@ -1952,16 +1953,19 @@ def test_esrgan(self):
         if self.host:
             cmds.extend(["--host", self.host])
 
-        p = subprocess.Popen(cmds, stdout=subprocess.DEVNULL)
-        with Listener((self.ip, self.port)) as listener:
-            conn = listener.accept()
-            p.communicate()
-            msg = json.loads(conn.recv())
-            if "Error" in msg:
-                self.fail(msg["Error"])
-            else:
-                self.assertGreaterEqual(msg["PSNR"], 24)
-                self.assertGreaterEqual(msg["SSIM"], 0.8)
+        for weight in weights:
+            p = subprocess.Popen(
+                cmds + ["--weights", weight], stdout=subprocess.DEVNULL
+            )
+            with Listener((self.ip, self.port)) as listener:
+                conn = listener.accept()
+                p.communicate()
+                msg = json.loads(conn.recv())
+                if "Error" in msg:
+                    self.fail(msg["Error"])
+                else:
+                    self.assertGreaterEqual(msg["top_1"], 60)
+                    self.assertGreaterEqual(msg["top_5"], 85)
 
     def test_squeezenet(self):
         if not self.required_envs([self.image_dataset]):
@@ -1996,19 +2000,16 @@ def test_squeezenet(self):
             if "Error" in msg:
                 self.fail(msg["Error"])
             else:
-                self.assertGreaterEqual(msg["top_1"], 50)
-                self.assertGreaterEqual(msg["top_5"], 75)
+                self.assertGreaterEqual(msg["top_1"], 45)
+                self.assertGreaterEqual(msg["top_5"], 70)
 
-    def test_fastvit(self):
-        if not self.required_envs(
-            [self.image_dataset, self.pretrained_weight, self.oss_repo]
-        ):
+    def test_ssd300_vgg16(self):
+        if not self.required_envs([self.pretrained_weight, self.oss_repo]):
             self.skipTest("missing required envs")
+
         cmds = [
             "python",
-            f"{self.executorch_root}/examples/qualcomm/oss_scripts/fastvit.py",
-            "--dataset",
-            self.image_dataset,
+            f"{self.executorch_root}/examples/qualcomm/oss_scripts/ssd300_vgg16.py",
             "--artifact",
             self.artifact_dir,
             "--build_folder",
@@ -2037,8 +2038,7 @@ def test_fastvit(self):
             if "Error" in msg:
                 self.fail(msg["Error"])
             else:
-                self.assertGreaterEqual(msg["top_1"], 60)
-                self.assertGreaterEqual(msg["top_5"], 80)
+                self.assertGreaterEqual(msg["mAP"], 0.70)
 
 
 class TestExampleQaihubScript(TestQNN):
diff --git a/examples/qualcomm/oss_scripts/dino_v2.py b/examples/qualcomm/oss_scripts/dino_v2.py
@@ -65,6 +65,7 @@ def main(args):
         skip_node_id_set=skip_node_id_set,
         skip_node_op_set=skip_node_op_set,
         quant_dtype=QuantDtype.use_8a8w,
+        shared_buffer=args.shared_buffer,
     )
 
     if args.compile_only:
diff --git a/examples/qualcomm/oss_scripts/esrgan.py b/examples/qualcomm/oss_scripts/esrgan.py
@@ -68,6 +68,7 @@ def main(args):
         skip_node_id_set=skip_node_id_set,
         skip_node_op_set=skip_node_op_set,
         quant_dtype=QuantDtype.use_8a8w,
+        shared_buffer=args.shared_buffer,
     )
 
     if args.compile_only:
diff --git a/examples/qualcomm/oss_scripts/fastvit.py b/examples/qualcomm/oss_scripts/fastvit.py
@@ -25,12 +25,10 @@
 from executorch.backends.qualcomm.utils.utils import convert_linear_to_conv2d
 from executorch.examples.qualcomm.utils import (
     build_executorch_binary,
-    convert_pt2e,
     get_imagenet_dataset,
     make_output_dir,
     make_quantizer,
     parse_skip_delegation_node,
-    prepare_pt2e,
     setup_common_args_and_variables,
     SimpleADB,
     topk_accuracy,
@@ -72,10 +70,7 @@ def main(args):
     )
 
     pte_filename = "fastvit_qnn"
-    quantizer = make_quantizer(
-        quant_dtype=QuantDtype.use_8a8w,
-        per_channel_conv=True,
-    )
+    quantizer = make_quantizer(quant_dtype=QuantDtype.use_8a8w)
 
     # there are lots of outliers appearing in fastvit parameters
     # we need to apply special configuration to saturate their impact
@@ -111,27 +106,19 @@ def main(args):
         weight=q_config.weight,
         bias=q_config.bias,
     )
-
-    # perform ptq
-    model = convert_linear_to_conv2d(
-        get_instance(args.oss_repo, args.pretrained_weight)
-    )
-    captured_model = torch.export.export(model, inputs[0]).module()
-    annotated_model = prepare_pt2e(captured_model, quantizer)
-    for input in inputs:
-        annotated_model(*input)
-    quantized_model = convert_pt2e(annotated_model)
-
     # lower to QNN
     build_executorch_binary(
-        quantized_model,
+        convert_linear_to_conv2d(get_instance(args.oss_repo, args.pretrained_weight)),
         inputs[0],
         args.model,
         f"{args.artifact}/{pte_filename}",
-        dataset=None,
+        dataset=inputs,
         skip_node_id_set=skip_node_id_set,
         skip_node_op_set=skip_node_op_set,
+        quant_dtype=QuantDtype.use_8a8w,
+        custom_quantizer=quantizer,
         custom_pass_config={QCOM_PASS_EXPAND_BROADCAST_SHAPE},
+        shared_buffer=args.shared_buffer,
     )
 
     if args.compile_only:
@@ -181,7 +168,7 @@ def main(args):
         "-a",
         "--artifact",
         help="path for storing generated artifacts by this example. Default ./fastvit",
-        default="./esrgan",
+        default="./fastvit",
         type=str,
     )
 
diff --git a/examples/qualcomm/oss_scripts/fbnet.py b/examples/qualcomm/oss_scripts/fbnet.py
@@ -50,6 +50,7 @@ def main(args):
         f"{args.artifact}/{pte_filename}",
         inputs,
         quant_dtype=QuantDtype.use_8a8w,
+        shared_buffer=args.shared_buffer,
     )
 
     if args.compile_only:
diff --git a/examples/qualcomm/oss_scripts/regnet.py b/examples/qualcomm/oss_scripts/regnet.py
@@ -66,6 +66,7 @@ def main(args):
         skip_node_id_set=skip_node_id_set,
         skip_node_op_set=skip_node_op_set,
         quant_dtype=QuantDtype.use_8a8w,
+        shared_buffer=args.shared_buffer,
     )
 
     if args.compile_only:
diff --git a/examples/qualcomm/oss_scripts/squeezenet.py b/examples/qualcomm/oss_scripts/squeezenet.py
@@ -57,6 +57,7 @@ def main(args):
         skip_node_id_set=skip_node_id_set,
         skip_node_op_set=skip_node_op_set,
         quant_dtype=QuantDtype.use_8a8w,
+        shared_buffer=args.shared_buffer,
     )
 
     if args.compile_only:
diff --git a/examples/qualcomm/oss_scripts/ssd300_vgg16.py b/examples/qualcomm/oss_scripts/ssd300_vgg16.py
diff --git a/examples/qualcomm/utils.py b/examples/qualcomm/utils.py

Original file line number	Diff line number	Diff line change
`@@ -65,6 +65,7 @@ def main(args):`
`65`	`65`	`skip_node_id_set=skip_node_id_set,`
`66`	`66`	`skip_node_op_set=skip_node_op_set,`
`67`	`67`	`quant_dtype=QuantDtype.use_8a8w,`
	`68`	`+ shared_buffer=args.shared_buffer,`
`68`	`69`	`)`
`69`	`70`
`70`	`71`	`if args.compile_only:`
Original file line number	Diff line number	Diff line change
`@@ -68,6 +68,7 @@ def main(args):`
`68`	`68`	`skip_node_id_set=skip_node_id_set,`
`69`	`69`	`skip_node_op_set=skip_node_op_set,`
`70`	`70`	`quant_dtype=QuantDtype.use_8a8w,`
	`71`	`+ shared_buffer=args.shared_buffer,`
`71`	`72`	`)`
`72`	`73`
`73`	`74`	`if args.compile_only:`
Original file line number	Diff line number	Diff line change
`@@ -50,6 +50,7 @@ def main(args):`
`50`	`50`	`f"{args.artifact}/{pte_filename}",`
`51`	`51`	`inputs,`
`52`	`52`	`quant_dtype=QuantDtype.use_8a8w,`
	`53`	`+ shared_buffer=args.shared_buffer,`
`53`	`54`	`)`
`54`	`55`
`55`	`56`	`if args.compile_only:`
Original file line number	Diff line number	Diff line change
`@@ -66,6 +66,7 @@ def main(args):`
`66`	`66`	`skip_node_id_set=skip_node_id_set,`
`67`	`67`	`skip_node_op_set=skip_node_op_set,`
`68`	`68`	`quant_dtype=QuantDtype.use_8a8w,`
	`69`	`+ shared_buffer=args.shared_buffer,`
`69`	`70`	`)`
`70`	`71`
`71`	`72`	`if args.compile_only:`
Original file line number	Diff line number	Diff line change
`@@ -57,6 +57,7 @@ def main(args):`
`57`	`57`	`skip_node_id_set=skip_node_id_set,`
`58`	`58`	`skip_node_op_set=skip_node_op_set,`
`59`	`59`	`quant_dtype=QuantDtype.use_8a8w,`
	`60`	`+ shared_buffer=args.shared_buffer,`
`60`	`61`	`)`
`61`	`62`
`62`	`63`	`if args.compile_only:`