[SYCL][Matrix] Update element_wise_all_ops_tf32_impl.hpp to use consistent dimension names (e.g. M, K, TM, TK). (#10598)

arnamoy10 · web-flow · commit f22d94c4850e · 2023-07-31T15:43:45.000-07:00
diff --git a/sycl/test-e2e/Matrix/element_wise_all_ops_tf32_impl.hpp b/sycl/test-e2e/Matrix/element_wise_all_ops_tf32_impl.hpp
@@ -23,10 +23,10 @@ void assert_ops_ref(host_accessor<T, 2, access::mode::read> C,
              std::numeric_limits<float>::epsilon());
     }
 }
-template <typename T, typename Ts, size_t M, size_t N>
-void matrix_verify_add(queue q, big_matrix<Ts, M, N> &A, nd_range<2> &r,
+template <typename T, typename Ts, size_t M, size_t K>
+void matrix_verify_add(queue q, big_matrix<Ts, M, K> &A, nd_range<2> &r,
                        const float ref) {
-  buffer<Ts, 2> bufA(A.get_data(), range<2>(M, N));
+  buffer<Ts, 2> bufA(A.get_data(), range<2>(M, K));
 
   q.submit([&](handler &cgh) {
      sycl::accessor accA{bufA, cgh, sycl::read_write};
@@ -52,17 +52,17 @@ void matrix_verify_add(queue q, big_matrix<Ts, M, N> &A, nd_range<2> &r,
            ext::intel::experimental::matrix::joint_matrix_store(
                sg, sub_a,
                accA.template get_multi_ptr<access::decorated::no>() +
-                   (sg_startx * TM) * N + sg_starty / SG_SZ * TK,
-               N);
+                   (sg_startx * TM) * K + sg_starty / SG_SZ * TK,
+               K);
          }); // parallel for
    }).wait();
-  assert_ops_ref<Ts, M, N>(bufA.get_host_access(sycl::read_only), ref);
+  assert_ops_ref<Ts, M, K>(bufA.get_host_access(sycl::read_only), ref);
 }
 
-template <typename T, typename Ts, size_t M, size_t N>
-void matrix_verify_sub(queue q, big_matrix<Ts, M, N> &A, nd_range<2> &r,
+template <typename T, typename Ts, size_t M, size_t K>
+void matrix_verify_sub(queue q, big_matrix<Ts, M, K> &A, nd_range<2> &r,
                        const float ref) {
-  buffer<Ts, 2> bufA(A.get_data(), range<2>(M, N));
+  buffer<Ts, 2> bufA(A.get_data(), range<2>(M, K));
 
   q.submit([&](handler &cgh) {
      sycl::accessor accA{bufA, cgh, sycl::read_write};
@@ -87,17 +87,17 @@ void matrix_verify_sub(queue q, big_matrix<Ts, M, N> &A, nd_range<2> &r,
            ext::intel::experimental::matrix::joint_matrix_store(
                sg, sub_a,
                accA.template get_multi_ptr<access::decorated::no>() +
-                   (sg_startx * TM) * N + sg_starty / SG_SZ * TK,
-               N);
+                   (sg_startx * TM) * K + sg_starty / SG_SZ * TK,
+               K);
          }); // parallel for
    }).wait();
-  assert_ops_ref<Ts, M, N>(bufA.get_host_access(sycl::read_only), ref);
+  assert_ops_ref<Ts, M, K>(bufA.get_host_access(sycl::read_only), ref);
 }
 
-template <typename T, typename Ts, size_t M, size_t N>
-void matrix_verify_mul(queue q, big_matrix<Ts, M, N> &A, nd_range<2> &r,
+template <typename T, typename Ts, size_t M, size_t K>
+void matrix_verify_mul(queue q, big_matrix<Ts, M, K> &A, nd_range<2> &r,
                        const float ref) {
-  buffer<Ts, 2> bufA(A.get_data(), range<2>(M, N));
+  buffer<Ts, 2> bufA(A.get_data(), range<2>(M, K));
 
   q.submit([&](handler &cgh) {
      sycl::accessor accA{bufA, cgh, sycl::read_write};
@@ -121,17 +121,17 @@ void matrix_verify_mul(queue q, big_matrix<Ts, M, N> &A, nd_range<2> &r,
            ext::intel::experimental::matrix::joint_matrix_store(
                sg, sub_a,
                accA.template get_multi_ptr<access::decorated::no>() +
-                   (sg_startx * TM) * N + sg_starty / SG_SZ * TK,
-               N);
+                   (sg_startx * TM) * K + sg_starty / SG_SZ * TK,
+               K);
          }); // parallel for
    }).wait();
-  assert_ops_ref<Ts, M, N>(bufA.get_host_access(sycl::read_only), ref);
+  assert_ops_ref<Ts, M, K>(bufA.get_host_access(sycl::read_only), ref);
 }
 
-template <typename T, typename Ts, size_t M, size_t N>
-void matrix_verify_div(queue q, big_matrix<Ts, M, N> &A, nd_range<2> &r,
+template <typename T, typename Ts, size_t M, size_t K>
+void matrix_verify_div(queue q, big_matrix<Ts, M, K> &A, nd_range<2> &r,
                        const float ref) {
-  buffer<Ts, 2> bufA(A.get_data(), range<2>(M, N));
+  buffer<Ts, 2> bufA(A.get_data(), range<2>(M, K));
 
   q.submit([&](handler &cgh) {
      sycl::accessor accA{bufA, cgh, sycl::read_write};
@@ -156,17 +156,17 @@ void matrix_verify_div(queue q, big_matrix<Ts, M, N> &A, nd_range<2> &r,
            ext::intel::experimental::matrix::joint_matrix_store(
                sg, sub_a,
                accA.template get_multi_ptr<access::decorated::no>() +
-                   (sg_startx * TM) * N + sg_starty / SG_SZ * TK,
-               N);
+                   (sg_startx * TM) * K + sg_starty / SG_SZ * TK,
+               K);
          }); // parallel for
    }).wait();
-  assert_ops_ref<Ts, M, N>(bufA.get_host_access(sycl::read_only), ref);
+  assert_ops_ref<Ts, M, K>(bufA.get_host_access(sycl::read_only), ref);
 }
 
-template <typename T, typename Ts, size_t M, size_t N>
-void matrix_verify_logic(queue q, big_matrix<Ts, M, N> &A, nd_range<2> &r,
+template <typename T, typename Ts, size_t M, size_t K>
+void matrix_verify_logic(queue q, big_matrix<Ts, M, K> &A, nd_range<2> &r,
                          const float ref) {
-  buffer<Ts, 2> bufA(A.get_data(), range<2>(M, N));
+  buffer<Ts, 2> bufA(A.get_data(), range<2>(M, K));
 
   q.submit([&](handler &cgh) {
      sycl::accessor accA{bufA, cgh, sycl::read_write};
@@ -206,33 +206,33 @@ void matrix_verify_logic(queue q, big_matrix<Ts, M, N> &A, nd_range<2> &r,
            ext::intel::experimental::matrix::joint_matrix_store(
                sg, sub_a,
                accA.template get_multi_ptr<access::decorated::no>() +
-                   (sg_startx * TM) * N + sg_starty / SG_SZ * TK,
-               N);
+                   (sg_startx * TM) * K + sg_starty / SG_SZ * TK,
+               K);
          }); // parallel for
    }).wait();
-  assert_ops_ref<Ts, M, N>(bufA.get_host_access(sycl::read_only), ref);
+  assert_ops_ref<Ts, M, K>(bufA.get_host_access(sycl::read_only), ref);
 }
 
 static constexpr size_t MATRIX_M = TM * 2;
-static constexpr size_t MATRIX_N = TN * 2;
-float A[MATRIX_M][MATRIX_N];
-float D[MATRIX_M][MATRIX_N];
+static constexpr size_t MATRIX_K = TK * 2;
+float A[MATRIX_M][MATRIX_K];
+float D[MATRIX_M][MATRIX_K];
 
 int main() {
 
-  big_matrix<float, MATRIX_M, MATRIX_N> MD((float *)&D);
-  big_matrix<float, MATRIX_M, MATRIX_N> MA((float *)&A);
+  big_matrix<float, MATRIX_M, MATRIX_K> MD((float *)&D);
+  big_matrix<float, MATRIX_M, MATRIX_K> MA((float *)&A);
 
   size_t NDRangeM = MATRIX_M / TM;
-  size_t NDRangeN = MATRIX_N / TK;
+  size_t NDRangeK = MATRIX_K / TK;
   queue q;
-  nd_range<2> r({NDRangeM, NDRangeN * SG_SZ}, {1, 1 * SG_SZ});
+  nd_range<2> r({NDRangeM, NDRangeK * SG_SZ}, {1, 1 * SG_SZ});
 
-  matrix_verify_add<precision::tf32, float, MATRIX_M, MATRIX_N>(q, MA, r, 7.0);
-  matrix_verify_sub<precision::tf32, float, MATRIX_M, MATRIX_N>(q, MA, r, 3.0);
-  matrix_verify_mul<precision::tf32, float, MATRIX_M, MATRIX_N>(q, MA, r, 15.0);
-  matrix_verify_div<precision::tf32, float, MATRIX_M, MATRIX_N>(q, MA, r, 2.0);
-  matrix_verify_logic<precision::tf32, float, MATRIX_M, MATRIX_N>(q, MA, r,
+  matrix_verify_add<precision::tf32, float, MATRIX_M, MATRIX_K>(q, MA, r, 7.0);
+  matrix_verify_sub<precision::tf32, float, MATRIX_M, MATRIX_K>(q, MA, r, 3.0);
+  matrix_verify_mul<precision::tf32, float, MATRIX_M, MATRIX_K>(q, MA, r, 15.0);
+  matrix_verify_div<precision::tf32, float, MATRIX_M, MATRIX_K>(q, MA, r, 2.0);
+  matrix_verify_logic<precision::tf32, float, MATRIX_M, MATRIX_K>(q, MA, r,
                                                                   7.0);
 
   return 0;