Update

swolchok · swolchok · commit 296e82771fe7 · 2025-01-17T12:47:57.000-08:00
[ghstack-poisoned]
diff --git a/backends/cadence/reference/operators/quantized_conv_out.cpp b/backends/cadence/reference/operators/quantized_conv_out.cpp
@@ -119,7 +119,7 @@ __attribute__((noinline)) void conv2d_nchw_core_generic(
                     if (((_h + d0 * _wh - p0) >= 0) &&
                         ((_h + d0 * _wh - p0) < h) &&
                         ((_w + d1 * _ww - p1) >= 0) &&
-                        ((_w + d1 * _ww - p1 < w))) {
+                        ((_w + d1 * _ww - p1) < w)) {
                       int ioff =
                           (_h + d0 * _wh - p0) * w + (_w + d1 * _ww - p1);
                       int woff = _wh * ww + _ww;
diff --git a/backends/vulkan/runtime/graph/ops/glsl/conv2d_pw.glsl b/backends/vulkan/runtime/graph/ops/glsl/conv2d_pw.glsl
@@ -33,7 +33,9 @@ ${layout_declare_ubo(8, "float", "out_min", "float", "out_max")}
 layout(local_size_x_id = 0, local_size_y_id = 1, local_size_z_id = 2) in;
 
 // shared memory to hold calculated positions, this would reduce register usage thus improving performance.
-shared ivec2 pos_shared[gl_WorkGroupSize.x * gl_WorkGroupSize.y * gl_WorkGroupSize.z * TILE_SIZE * TILE_SIZE];
+// 64 is the number of threads in the local wg
+$num_shared = 64 * TILE_SIZE * TILE_SIZE
+shared ivec2 pos_shared[${num_shared}];
 
 /*
  * Computes a 2D pointwise convolution of an NxN output tile. Calculating an
diff --git a/examples/cadence/operators/facto_util.py b/examples/cadence/operators/facto_util.py
@@ -0,0 +1,91 @@
+# (c) Meta Platforms, Inc. and affiliates. Confidential and proprietary.
+
+# pyre-strict
+
+import copy
+from typing import List, OrderedDict, Tuple
+
+import torch
+from inputgen.argtuple.gen import ArgumentTupleGenerator
+from inputgen.specs.model import ConstraintProducer as cp
+from inputgen.utils.random_manager import random_manager
+from inputgen.variable.type import ScalarDtype
+from specdb.db import SpecDictDB
+
+# seed to generate identical cases every run to reproduce from bisect
+random_manager.seed(1729)
+
+
+def apply_tensor_contraints(op_name: str, tensor_constraints: list[object]) -> None:
+    match op_name:
+        case (
+            "sigmoid.default"
+            | "_softmax.default"
+            | "rsqrt.default"
+            | "exp.default"
+            | "mul.Tensor"
+            | "div.Tensor"
+        ):
+            tensor_constraints.append(
+                cp.Dtype.In(lambda deps: [torch.float]),
+            )
+        case (
+            "add.Tensor"
+            | "sub.Tensor"
+            | "add.Scalar"
+            | "sub.Scalar"
+            | "mul.Scalar"
+            | "div.Scalar"
+        ):
+            tensor_constraints.append(
+                cp.Dtype.In(lambda deps: [torch.float, torch.int]),
+            )
+        case _:
+            tensor_constraints.append(
+                cp.Dtype.In(lambda deps: [torch.float, torch.int]),
+            )
+    tensor_constraints.extend(
+        [
+            cp.Value.Ge(lambda deps, dtype, struct: -(2**8)),
+            cp.Value.Le(lambda deps, dtype, struct: 2**8),
+            cp.Rank.Ge(lambda deps: 1),
+            cp.Rank.Le(lambda deps: 2**2),
+            cp.Size.Ge(lambda deps, r, d: 1),
+            cp.Size.Le(lambda deps, r, d: 2**2),
+        ]
+    )
+
+
+def facto_testcase_gen(op_name: str) -> List[Tuple[List[str], OrderedDict[str, str]]]:
+    # minimal example to test add.Tensor using FACTO
+    spec = SpecDictDB[op_name]
+
+    for index, in_spec in enumerate(copy.deepcopy(spec.inspec)):
+        if in_spec.type.is_scalar():
+            if in_spec.name != "alpha":
+                spec.inspec[index].constraints.extend(
+                    [
+                        cp.Dtype.In(lambda deps: [ScalarDtype.float, ScalarDtype.int]),
+                        cp.Value.Ge(lambda deps, dtype: -(2**8)),
+                        cp.Value.Le(lambda deps, dtype: 2**2),
+                        cp.Size.Ge(lambda deps, r, d: 1),
+                        cp.Size.Le(lambda deps, r, d: 2**2),
+                    ]
+                )
+            else:
+                spec.inspec[index].constraints.extend(
+                    [
+                        cp.Value.Gt(lambda deps, dtype: 0),
+                        cp.Value.Le(lambda deps, dtype: 2),
+                    ]
+                )
+        elif in_spec.type.is_tensor():
+            tensor_constraints = []
+            # common tensor constraints
+            apply_tensor_contraints(op_name, tensor_constraints)
+            spec.inspec[index].constraints.extend(tensor_constraints)
+
+    return [
+        (posargs, inkwargs)
+        for posargs, inkwargs, _ in ArgumentTupleGenerator(spec).gen()
+    ]
diff --git a/examples/cadence/operators/targets.bzl b/examples/cadence/operators/targets.bzl
@@ -5,6 +5,7 @@
 # LICENSE file in the root directory of this source tree.
 
 load("@fbcode_macros//build_defs:python_unittest.bzl", "python_unittest")
+load("@fbcode_macros//build_defs:python_library.bzl", "python_library")
 
 TESTS_LIST = [
     "add_op",
@@ -16,6 +17,19 @@ def define_common_targets():
     for op in TESTS_LIST:
         _define_test_target(op)
 
+    python_library(
+        name = "facto_util",
+        srcs = [
+            "facto_util.py",
+        ],
+        typing = True,
+        deps = [
+            "fbcode//caffe2:torch",
+            "fbcode//pytorch/facto:inputgen",
+            "fbcode//pytorch/facto:specdb",
+        ],
+    )
+
 
 def _define_test_target(test_name):
     file_name = "test_{}".format(test_name)