pytorch
diff --git a/‎backends/vulkan/runtime/api/gen_vulkan_spv.py
Lines changed: 56 additions & 37 deletions b/‎backends/vulkan/runtime/api/gen_vulkan_spv.py
Lines changed: 56 additions & 37 deletions
diff --git a/‎backends/vulkan/runtime/graph/ops/glsl/binary_op.glsl
Lines changed: 13 additions & 8 deletions b/‎backends/vulkan/runtime/graph/ops/glsl/binary_op.glsl
Lines changed: 13 additions & 8 deletions
diff --git a/‎backends/vulkan/runtime/graph/ops/glsl/binary_op.yaml
Lines changed: 5 additions & 11 deletions b/‎backends/vulkan/runtime/graph/ops/glsl/binary_op.yaml
Lines changed: 5 additions & 11 deletions
diff --git a/‎backends/vulkan/runtime/graph/ops/glsl/conv2d.glsl
Lines changed: 5 additions & 3 deletions b/‎backends/vulkan/runtime/graph/ops/glsl/conv2d.glsl
Lines changed: 5 additions & 3 deletions
diff --git a/‎backends/vulkan/runtime/graph/ops/glsl/conv2d.yaml
Lines changed: 1 addition & 3 deletions b/‎backends/vulkan/runtime/graph/ops/glsl/conv2d.yaml
Lines changed: 1 addition & 3 deletions
diff --git a/‎backends/vulkan/runtime/graph/ops/glsl/conv2d_dw.glsl
Lines changed: 5 additions & 3 deletions b/‎backends/vulkan/runtime/graph/ops/glsl/conv2d_dw.glsl
Lines changed: 5 additions & 3 deletions
diff --git a/‎backends/vulkan/runtime/graph/ops/glsl/conv2d_dw.yaml
Lines changed: 1 addition & 3 deletions b/‎backends/vulkan/runtime/graph/ops/glsl/conv2d_dw.yaml
Lines changed: 1 addition & 3 deletions
diff --git a/‎backends/vulkan/runtime/graph/ops/glsl/conv2d_dw_output_tile.glsl
Lines changed: 4 additions & 2 deletions b/‎backends/vulkan/runtime/graph/ops/glsl/conv2d_dw_output_tile.glsl
Lines changed: 4 additions & 2 deletions
diff --git a/‎backends/vulkan/runtime/graph/ops/glsl/conv2d_dw_output_tile.yaml
Lines changed: 1 addition & 3 deletions b/‎backends/vulkan/runtime/graph/ops/glsl/conv2d_dw_output_tile.yaml
Lines changed: 1 addition & 3 deletions
@@ -34,22 +34,13 @@
 CPP_H_NAME = "spv.h"
 CPP_SRC_NAME = "spv.cpp"
 
+# Basic configuration settings for shaders
 DEFAULT_ENV: Dict[str, Any] = {
     "PRECISION": "highp",
-    "FLOAT_IMAGE_FORMAT": "rgba16f",
-    "INT_IMAGE_FORMAT": "rgba32i",
-    "UINT_IMAGE_FORMAT": "rgba32ui",
 }
 
-TYPES_ENV: Dict[str, Any] = {
-    "IMAGE_FORMAT": {
-        "float": "rgba32f",
-        "half": "rgba16f",
-        "int": "rgba32i",
-        "uint": "rgba32ui",
-        "int8": "rgba8i",
-        "uint8": "rgba8ui",
-    },
+# Establishes relationships between different tensor types and different GLSL types
+TYPE_MAPPINGS: Dict[str, Any] = {
     "IMAGE_T": {
         3: {
             "float": "image3D",
@@ -78,6 +69,37 @@
             "uint": "usampler2D",
         },
     },
+    "IMAGE_FORMAT": {
+        "float": "rgba32f",
+        "half": "rgba16f",
+        "int": "rgba32i",
+        "uint": "rgba32ui",
+        "int8": "rgba8i",
+        "uint8": "rgba8ui",
+    },
+    "TEXEL_EXTRACT_TYPE": {
+        "rgba32f": "vec4",
+        "rgba16f": "vec4",
+        "rgba32i": "ivec4",
+        "rgba32ui": "uvec4",
+        "int8": "ivec4",
+        "uint8": "uvec4",
+    },
+    "TEXEL_COMPONENT_TYPE": {
+        "vec4": "float",
+        "ivec4": "int",
+        "uvec4": "uint",
+    },
+    "BUFFER_SCALAR_TYPE": {
+        "float": "float",
+        "half": "float",
+        "int": "int",
+        "uint": "uint",
+        "int8": "int",
+        "uint8": "uint",
+    },
+    # Kept for backwards compatibility
+    # TODO(ssjia): remove when no more shaders use these
     "VEC4_T": {
         "float": "vec4",
         "half": "vec4",
@@ -96,11 +118,28 @@
     },
 }
 
-FUNCS_ENV: Dict[str, Any] = {
-    "GET_POS": {
+
+def get_buffer_scalar_type(dtype: str) -> str:
+    return TYPE_MAPPINGS["BUFFER_SCALAR_TYPE"][dtype]
+
+
+def get_texel_type(dtype: str) -> str:
+    image_format = TYPE_MAPPINGS["IMAGE_FORMAT"][dtype]
+    return TYPE_MAPPINGS["TEXEL_EXTRACT_TYPE"][image_format]
+
+
+def get_texel_component_type(dtype: str) -> str:
+    return TYPE_MAPPINGS["TEXEL_COMPONENT_TYPE"][get_texel_type(dtype)]
+
+
+UTILITY_FNS: Dict[str, Any] = {
+    "get_pos": {
         3: lambda pos: pos,
         2: lambda pos: f"{pos}.xy",
-    }
+    },
+    "buffer_scalar_type": get_buffer_scalar_type,
+    "texel_type": get_texel_type,
+    "texel_component_type": get_texel_component_type,
 }
 
 
@@ -376,26 +415,6 @@ def create_shader_params(
         for key, value in variant_params.items():
             shader_params[key] = value
 
-        shader_dtype = shader_params.get("DTYPE", "float")
-
-        if shader_dtype == "int":
-            shader_params["FORMAT"] = self.env["INT_IMAGE_FORMAT"]
-        elif shader_dtype == "uint":
-            shader_params["FORMAT"] = self.env["UINT_IMAGE_FORMAT"]
-        elif shader_dtype == "int32":
-            shader_params["FORMAT"] = "rgba32i"
-        elif shader_dtype == "uint32":
-            shader_params["FORMAT"] = "rgba32ui"
-        elif shader_dtype == "int8":
-            shader_params["FORMAT"] = "rgba8i"
-        elif shader_dtype == "uint8":
-            shader_params["FORMAT"] = "rgba8ui"
-        elif shader_dtype == "float32":
-            shader_params["FORMAT"] = "rgba32f"
-        # Assume float by default
-        else:
-            shader_params["FORMAT"] = self.env["FLOAT_IMAGE_FORMAT"]
-
         return shader_params
 
     def constructOutputMap(self) -> None:
@@ -732,9 +751,9 @@ def main(argv: List[str]) -> int:
     )
     options = parser.parse_args()
 
-    DEFAULT_ENV.update(TYPES_ENV)
-    DEFAULT_ENV.update(FUNCS_ENV)
     env = DEFAULT_ENV
+    env.update(TYPE_MAPPINGS)
+    env.update(UTILITY_FNS)
 
     for key, value in parse_arg_env(options.env).items():
         env[key] = value
 
@@ -13,11 +13,16 @@
 
 #define PRECISION ${PRECISION}
 
-#define OP(X, Y, A) ${OPERATOR}
 
 layout(std430) buffer;
 
-layout(set = 0, binding = 0, ${IMAGE_FORMAT[DTYPE]}) uniform PRECISION restrict writeonly ${IMAGE_T[NDIM][DTYPE]} image_out;
+#define OP(X, Y, A) ${OPERATOR}
+
+#define VEC4_T ${texel_type(DTYPE)}
+#define pos_to_coord pos_to_coord_${PACKING}
+#define coord_to_pos coord_to_pos_${PACKING}
+
+layout(set = 0, binding = 0, ${IMAGE_FORMAT[DTYPE]}) uniform PRECISION restrict writeonly ${IMAGE_T[ND][DTYPE]} image_out;
 layout(set = 0, binding = 1) uniform PRECISION sampler3D image_in;
 layout(set = 0, binding = 2) uniform PRECISION sampler3D image_other;
 
@@ -50,22 +55,22 @@ layout(local_size_x_id = 0, local_size_y_id = 1, local_size_z_id = 2) in;
 
 void main() {
   const ivec3 pos = ivec3(gl_GlobalInvocationID);
-  const ivec4 coord = POS_TO_COORD_${PACKING}(pos, out_sizes.data);
+  const ivec4 coord = pos_to_coord(pos, out_sizes.data);
 
   if (any(greaterThanEqual(coord, out_sizes.data))) {
     return;
   }
 
   ivec4 in_coord = out_coord_to_in_coord(coord, in_sizes.data);
-  ${VEC4_T[DTYPE]} in_texel = ${VEC4_T[DTYPE]}(texelFetch(
+  VEC4_T in_texel = VEC4_T(texelFetch(
     image_in,
-    COORD_TO_POS_${PACKING}(in_coord, in_sizes.data),
+    coord_to_pos(in_coord, in_sizes.data),
     0));
 
   ivec4 other_coord = out_coord_to_in_coord(coord, other_sizes.data);
-  ${VEC4_T[DTYPE]} other_texel = ${VEC4_T[DTYPE]}(texelFetch(
+  VEC4_T other_texel = VEC4_T(texelFetch(
     image_other,
-    COORD_TO_POS_${PACKING}(other_coord, other_sizes.data),
+    coord_to_pos(other_coord, other_sizes.data),
     0));
 
   // Check boolean broadcast flags; we use ivec2 instead of bvec2 for alignment.
@@ -76,5 +81,5 @@ void main() {
     other_texel = other_texel.xxxx;
   }
 
-  imageStore(image_out, pos, ${VEC4_T[DTYPE]}(OP(in_texel, other_texel, alpha.data)));
+  imageStore(image_out, pos, VEC4_T(OP(in_texel, other_texel, alpha.data)));
 }
@@ -7,24 +7,18 @@
 binary_op:
   parameter_names_with_default_values:
     OPERATOR: X + A * Y
-    NDIM: 3
+    ND: 3
     DTYPE: float
-    PACKING: CHANNELS_PACKED
+    PACKING: C_packed
   generate_variant_forall:
     PACKING:
-      - VALUE: CHANNELS_PACKED
-        SUFFIX: C_packed
-      - VALUE: WIDTH_PACKED
-        SUFFIX: W_packed
-      - VALUE: HEIGHT_PACKED
-        SUFFIX: H_packed
+      - VALUE: C_packed
+      - VALUE: W_packed
+      - VALUE: H_packed
     DTYPE:
       - VALUE: half
-        SUFFIX: half
       - VALUE: float
-        SUFFIX: float
       - VALUE: int
-        SUFFIX: int
   shader_variants:
     - NAME: binary_add
     - NAME: binary_sub
 
@@ -14,7 +14,9 @@
 
 layout(std430) buffer;
 
-layout(set = 0, binding = 0, ${IMAGE_FORMAT[DTYPE]}) uniform PRECISION restrict writeonly ${IMAGE_T[NDIM][DTYPE]} image_out;
+#define VEC4_T ${texel_type(DTYPE)}
+
+layout(set = 0, binding = 0, ${IMAGE_FORMAT[DTYPE]}) uniform PRECISION restrict writeonly ${IMAGE_T[ND][DTYPE]} image_out;
 layout(set = 0, binding = 1) uniform PRECISION sampler3D image_in;
 layout(set = 0, binding = 2) uniform PRECISION sampler2D kernel_in;
 layout(set = 0, binding = 3) uniform PRECISION sampler2D bias_in;
@@ -78,12 +80,12 @@ void main() {
   kstart.y += pos.z * params.kernel_size.y;
 
   // Perform the convolution by iterating over the overlay region.
-  ${VEC4_T[DTYPE]} sum = texelFetch(bias_in, ivec2(pos.z, 0), 0);
+  VEC4_T sum = texelFetch(bias_in, ivec2(pos.z, 0), 0);
   const int ic4 = extra_params.in_group_size / 4;
   for (int z4 = 0; z4 < ic4; ++z4, kstart.x += params.kernel_size.x * 4) {
     for (int y = start.y, ky = kstart.y; y < end.y; y += params.dilation.y, ++ky) {
       for (int x = start.x, kx = kstart.x; x < end.x; x += params.dilation.x, kx += 4) {
-        const ${VEC4_T[DTYPE]} in_texel = texelFetch(image_in, ivec3(x, y, z4), 0);
+        const VEC4_T in_texel = texelFetch(image_in, ivec3(x, y, z4), 0);
         const ivec4 kxs = kx + ivec4(0, 1, 2, 3);
 
         // To explain the calculation below, the contents of in_texel and the
 
@@ -6,13 +6,11 @@
 
 conv2d:
   parameter_names_with_default_values:
-    NDIM: 3
+    ND: 3
     DTYPE: float
   generate_variant_forall:
     DTYPE:
       - VALUE: half
-        SUFFIX: half
       - VALUE: float
-        SUFFIX: float
   shader_variants:
     - NAME: conv2d
@@ -14,7 +14,9 @@
 
 layout(std430) buffer;
 
-layout(set = 0, binding = 0, ${IMAGE_FORMAT[DTYPE]}) uniform PRECISION restrict writeonly ${IMAGE_T[NDIM][DTYPE]} image_out;
+#define VEC4_T ${texel_type(DTYPE)}
+
+layout(set = 0, binding = 0, ${IMAGE_FORMAT[DTYPE]}) uniform PRECISION restrict writeonly ${IMAGE_T[ND][DTYPE]} image_out;
 layout(set = 0, binding = 1) uniform PRECISION sampler3D image_in;
 layout(set = 0, binding = 2) uniform PRECISION sampler2D kernel_in;
 layout(set = 0, binding = 3) uniform PRECISION sampler2D bias_in;
@@ -66,14 +68,14 @@ void main() {
   const ivec2 start = ipos;
   const ivec2 end = ipos + extra_params.overlay_region.xy;
 
-  ${VEC4_T[DTYPE]} sum = texelFetch(bias_in, ivec2(pos.z, 0), 0);
+  VEC4_T sum = texelFetch(bias_in, ivec2(pos.z, 0), 0);
   int kx = 0;
   for (int y = start.y; y < end.y; y += params.dilation.y) {
     for (int x = start.x; x < end.x; x += params.dilation.x) {
       // The weight kernel was rearranged such that every NxN filter is
       // flattened to fit in one row. Each filter was then stacked on top of
       // each other vertically.
-      const ${VEC4_T[DTYPE]} in_texel = texelFetch(image_in, ivec3(x, y, pos.z), 0);
+      const VEC4_T in_texel = texelFetch(image_in, ivec3(x, y, pos.z), 0);
       sum = fma(in_texel, texelFetch(kernel_in, ivec2(kx, pos.z), 0), sum);
       ++kx;
     }
 
@@ -6,13 +6,11 @@
 
 conv2d_dw:
   parameter_names_with_default_values:
-    NDIM: 3
+    ND: 3
     DTYPE: float
   generate_variant_forall:
     DTYPE:
       - VALUE: half
-        SUFFIX: half
       - VALUE: float
-        SUFFIX: float
   shader_variants:
     - NAME: conv2d_dw
@@ -14,7 +14,9 @@
 
 layout(std430) buffer;
 
-layout(set = 0, binding = 0, ${IMAGE_FORMAT[DTYPE]}) uniform PRECISION restrict writeonly ${IMAGE_T[NDIM][DTYPE]} image_out;
+#define VEC4_T ${texel_type(DTYPE)}
+
+layout(set = 0, binding = 0, ${IMAGE_FORMAT[DTYPE]}) uniform PRECISION restrict writeonly ${IMAGE_T[ND][DTYPE]} image_out;
 layout(set = 0, binding = 1) uniform PRECISION sampler3D image_in;
 layout(set = 0, binding = 2) uniform PRECISION sampler2D kernel_in;
 layout(set = 0, binding = 3) uniform PRECISION sampler2D bias_in;
@@ -66,7 +68,7 @@ void main() {
   const ivec2 start = ipos;
   const ivec2 end = ipos + extra_params.overlay_region.xy;
 
-  ${VEC4_T[DTYPE]} sum = texelFetch(bias_in, ivec2(pos.z, 0), 0);
+  VEC4_T sum = texelFetch(bias_in, ivec2(pos.z, 0), 0);
   int kx = 0;
   for (int y = start.y, i = 0; i < ${TILE_SIZE}; y += params.dilation.y, i++) {
     for (int x = start.x, j = 0; j < ${TILE_SIZE}; x += params.dilation.x, j++) {
 
@@ -6,15 +6,13 @@
 
 conv2d_dw_output_tile:
   parameter_names_with_default_values:
-    NDIM: 3
+    ND: 3
     DTYPE: float
     TILE_SIZE: 3
   generate_variant_forall:
     DTYPE:
       - VALUE: half
-        SUFFIX: half
       - VALUE: float
-        SUFFIX: float
   shader_variants:
     - NAME: conv2d_dw_output_tile_3x3
     - NAME: conv2d_dw_output_tile_5x5