Add CodeGen test to make sure that attributes are indeed ignored

jchlanda · jchlanda · commit 0a72b7b8aa17 · 2023-11-07T09:20:59.000-05:00
diff --git a/clang/test/CodeGenSYCL/reqd-sub-group-size_ignored_values.cpp b/clang/test/CodeGenSYCL/reqd-sub-group-size_ignored_values.cpp
@@ -0,0 +1,52 @@
+// RUN: %clang_cc1 -fsycl-is-device -internal-isystem %S/Inputs -disable-llvm-passes -triple amdgcn-amd-amdhsa -target-cpu gfx1010 -S -emit-llvm -o - %s | FileCheck -check-prefix=CHECK_AMD_32 %s
+
+// RUN: %clang_cc1 -fsycl-is-device -internal-isystem %S/Inputs -disable-llvm-passes -triple amdgcn-amd-amdhsa -target-cpu gfx90a -S -emit-llvm -o - %s | FileCheck -check-prefix=CHECK_AMD_64 %s
+
+// RUN: %clang_cc1 -fsycl-is-device -internal-isystem %S/Inputs -disable-llvm-passes -triple nvptx-unknown-unknown -target-cpu sm_90 -S -emit-llvm -o - %s | FileCheck -check-prefix=CHECK_CUDA_32 %s
+
+// Check that incorrect values specified for reqd_sub_group_size are ignored.
+// CDNA supports only 64 wave front size, for those GPUs allow subgroup size of
+// 64. Some GPUs support both 32 and 64, for those (and the rest) only allow
+// 32. For CUDA only allow 32.
+
+#include "sycl.hpp"
+
+int main() {
+
+  sycl::queue Q;
+
+  Q.submit([&](sycl::handler &h) {
+    h.single_task<class Kernel_1>([=] [[sycl::reqd_sub_group_size(64)]] {});
+  });
+
+  Q.submit([&](sycl::handler &h) {
+    h.single_task<class Kernel_2>([=] [[sycl::reqd_sub_group_size(32)]] {});
+  });
+
+  Q.submit([&](sycl::handler &h) {
+    h.single_task<class Kernel_3>([=] [[sycl::reqd_sub_group_size(8)]] {});
+  });
+
+  return 0;
+}
+
+// CHECK_AMD_32: define {{.*}}amdgpu_kernel void @{{.*}}Kernel_1() #0 {{.*}}
+// CHECK_AMD_32-NOT: intel_reqd_sub_group_size
+// CHECK_AMD_32: define {{.*}}amdgpu_kernel void @{{.*}}Kernel_2() #0 {{.*}} !intel_reqd_sub_group_size ![[IRSGS_32:[0-9]+]]
+// CHECK_AMD_32: define {{.*}}amdgpu_kernel void @{{.*}}Kernel_3() #0 {{.*}}
+// CHECK_AMD_32-NOT: intel_reqd_sub_group_size
+// CHECK_AMD_32: ![[IRSGS_32]] = !{i32 32}
+
+// CHECK_AMD_64: define {{.*}}amdgpu_kernel void @{{.*}}Kernel_1() #0 {{.*}} !intel_reqd_sub_group_size ![[IRSGS_64:[0-9]+]]
+// CHECK_AMD_64: define {{.*}}amdgpu_kernel void @{{.*}}Kernel_2() #0 {{.*}}
+// CHECK_AMD_64-NOT: intel_reqd_sub_group_size
+// CHECK_AMD_64: define {{.*}}amdgpu_kernel void @{{.*}}Kernel_3() #0 {{.*}}
+// CHECK_AMD_64-NOT: intel_reqd_sub_group_size
+// CHECK_AMD_64: ![[IRSGS_64]] = !{i32 64}
+
+// CHECK_CUDA_32: define {{.*}} void @{{.*}}Kernel_1() #0 {{.*}}
+// CHECK_CUDA_32-NOT: intel_reqd_sub_group_size
+// CHECK_CUDA_32: define {{.*}} void @{{.*}}Kernel_2() #0 {{.*}} !intel_reqd_sub_group_size ![[IRSGS_32:[0-9]+]]
+// CHECK_CUDA_32: define {{.*}} void @{{.*}}Kernel_3() #0 {{.*}}
+// CHECK_CUDA_32-NOT: intel_reqd_sub_group_size
+// CHECK_CUDA_32: ![[IRSGS_32]] = !{i32 32}
diff --git a/clang/test/SemaSYCL/reqd-sub-group-size-amd_32.cpp b/clang/test/SemaSYCL/reqd-sub-group-size-amd_32.cpp
@@ -17,7 +17,7 @@ int main() {
   });
 
   Q.submit([&](sycl::handler &h) {
-    h.single_task<class valid_kernel>([=] [[sycl::reqd_sub_group_size(8)]] {}); // expected-warning {{attribute argument 8 is invalid and will be ignored; amdgcn requires sub_group size 32}}
+    h.single_task<class invalid_kernel_2>([=] [[sycl::reqd_sub_group_size(8)]] {}); // expected-warning {{attribute argument 8 is invalid and will be ignored; amdgcn requires sub_group size 32}}
   });
 
   return 0;
diff --git a/clang/test/SemaSYCL/reqd-sub-group-size-amd_64.cpp b/clang/test/SemaSYCL/reqd-sub-group-size-amd_64.cpp
@@ -9,15 +9,15 @@ int main() {
   sycl::queue Q;
 
   Q.submit([&](sycl::handler &h) {
-    h.single_task<class invalid_kernel>([=] [[sycl::reqd_sub_group_size(64)]] {});
+    h.single_task<class valid_kernel>([=] [[sycl::reqd_sub_group_size(64)]] {});
   });
 
   Q.submit([&](sycl::handler &h) {
-    h.single_task<class valid_kernel>([=] [[sycl::reqd_sub_group_size(32)]] {}); // expected-warning {{attribute argument 32 is invalid and will be ignored; amdgcn requires sub_group size 64}}
+    h.single_task<class invalid_kernel>([=] [[sycl::reqd_sub_group_size(32)]] {}); // expected-warning {{attribute argument 32 is invalid and will be ignored; amdgcn requires sub_group size 64}}
   });
 
   Q.submit([&](sycl::handler &h) {
-    h.single_task<class valid_kernel>([=] [[sycl::reqd_sub_group_size(8)]] {}); // expected-warning {{attribute argument 8 is invalid and will be ignored; amdgcn requires sub_group size 64}}
+    h.single_task<class invalid_kernel_2>([=] [[sycl::reqd_sub_group_size(8)]] {}); // expected-warning {{attribute argument 8 is invalid and will be ignored; amdgcn requires sub_group size 64}}
   });
 
   return 0;