Checking if single line is acceptable.

JackAKirk · JackAKirk · commit 5ab98eaa7f8e · 2022-01-18T18:13:11.000Z
Signed-off-by: jack.kirk &lt;jack.kirk@codeplay.com&gt;
diff --git a/sycl/test/check_device_code/matrix/matrix-nvptx-int8-test.cpp b/sycl/test/check_device_code/matrix/matrix-nvptx-int8-test.cpp
@@ -39,27 +39,15 @@ int main() {
           joint_matrix<int8_t, matrix_use::b, 16, 16, matrix_layout::row_major>
               sub_b;
 
-          // CHECK: tail call { i32, i32, i32, i32, i32, i32, i32, i32 }
-          // @llvm.nvvm.wmma.m16n16k16.load.c.row.stride.s32.p1i32(i32
-          // addrspace(1)* %add.ptr.i, i32 16) #{{.*}}
+          // CHECK: tail call { i32, i32, i32, i32, i32, i32, i32, i32 } @llvm.nvvm.wmma.m16n16k16.load.c.row.stride.s32.p1i32(i32 addrspace(1)* %_arg_, i32 16) #{{.*}}
           joint_matrix_load(sg, sub_c, accC.get_pointer(), stride);
-          // CHECK: tail call { i32, i32 }
-          // @llvm.nvvm.wmma.m16n16k16.load.a.row.stride.s8.p0i32(i32*
-          // %call.ascast.i.i49.i, i32 16) #{{.*}}
+          // CHECK: tail call { i32, i32 } @llvm.nvvm.wmma.m16n16k16.load.a.row.stride.s8.p0i32(i32* %call.ascast.i.i52.i, i32 16) #{{.*}}
           joint_matrix_load(sg, sub_a, accA.get_pointer(), stride);
-          // CHECK: tail call { i32, i32 }
-          // @llvm.nvvm.wmma.m16n16k16.load.b.row.stride.s8.p0i32(i32*
-          // %call.ascast.i.i.i, i32 16) #{{.*}}
+          // CHECK: tail call { i32, i32 } @llvm.nvvm.wmma.m16n16k16.load.b.row.stride.s8.p0i32(i32* %call.ascast.i.i.i, i32 16) #{{.*}}
           joint_matrix_load(sg, sub_b, accB.get_pointer(), stride);
-          // CHECK: tail call { i32, i32, i32, i32, i32, i32, i32, i32 }
-          // @llvm.nvvm.wmma.m16n16k16.mma.row.row.s8(i32 %19, i32 %20, i32 %23,
-          // i32 %24, i32 %9, i32 %10, i32 %11, i32 %12, i32 %13, i32 %14, i32
-          // %15, i32 %16) #{{.*}}
+          // CHECK: tail call { i32, i32, i32, i32, i32, i32, i32, i32 } @llvm.nvvm.wmma.m16n16k16.mma.row.row.s8(i32 %11, i32 %12, i32 %15, i32 %16, i32 %1, i32 %2, i32 %3, i32 %4, i32 %5, i32 %6, i32 %7, i32 %8) #{{.*}}
           sub_c = joint_matrix_mad(sg, sub_a, sub_b, sub_c);
-          // CHECK: tail call void
-          // @llvm.nvvm.wmma.m16n16k16.store.d.row.stride.s32.p1i32(i32
-          // addrspace(1)* %add.ptr.i76, i32 %26, i32 %27, i32 %28, i32 %29, i32
-          // %30, i32 %31, i32 %32, i32 %33, i32 16) #{{.*}}
+          // CHECK: tail call void @llvm.nvvm.wmma.m16n16k16.store.d.row.stride.s32.p1i32(i32 addrspace(1)* %_arg_14, i32 %18, i32 %19, i32 %20, i32 %21, i32 %22, i32 %23, i32 %24, i32 %25, i32 16) #{{.*}}
           joint_matrix_store(sg, sub_c, accD.get_pointer(), stride);
         });
 
@@ -78,27 +66,15 @@ int main() {
           joint_matrix<int8_t, matrix_use::b, 16, 16, matrix_layout::col_major>
               sub_b;
 
-          // CHECK: tail call { i32, i32, i32, i32, i32, i32, i32, i32 }
-          // @llvm.nvvm.wmma.m16n16k16.load.c.col.stride.s32.p1i32(i32
-          // addrspace(1)* %add.ptr.i, i32 16) #{{.*}}
+          // CHECK: tail call { i32, i32, i32, i32, i32, i32, i32, i32 } @llvm.nvvm.wmma.m16n16k16.load.c.col.stride.s32.p1i32(i32 addrspace(1)* %_arg_, i32 16) #{{.*}}
           joint_matrix_load(sg, sub_c, accC.get_pointer(), stride);
-          // CHECK: tail call { i32, i32 }
-          // @llvm.nvvm.wmma.m16n16k16.load.a.col.stride.s8.p0i32(i32*
-          // %call.ascast.i.i49.i, i32 16) #{{.*}}
+          // CHECK: tail call { i32, i32 } @llvm.nvvm.wmma.m16n16k16.load.a.col.stride.s8.p0i32(i32* %call.ascast.i.i52.i, i32 16) #{{.*}}
           joint_matrix_load(sg, sub_a, accA.get_pointer(), stride);
-          // CHECK: tail call { i32, i32 }
-          // @llvm.nvvm.wmma.m16n16k16.load.b.col.stride.s8.p0i32(i32*
-          // %call.ascast.i.i.i, i32 16) #{{.*}}
+          // CHECK: tail call { i32, i32 } @llvm.nvvm.wmma.m16n16k16.load.b.col.stride.s8.p0i32(i32* %call.ascast.i.i.i, i32 16) #{{.*}}
           joint_matrix_load(sg, sub_b, accB.get_pointer(), stride);
-          // CHECK: tail call { i32, i32, i32, i32, i32, i32, i32, i32 }
-          // @llvm.nvvm.wmma.m16n16k16.mma.col.col.s8(i32 %19, i32 %20, i32 %23,
-          // i32 %24, i32 %9, i32 %10, i32 %11, i32 %12, i32 %13, i32 %14, i32
-          // %15, i32 %16) #{{.*}}
+          // CHECK: tail call { i32, i32, i32, i32, i32, i32, i32, i32 } @llvm.nvvm.wmma.m16n16k16.mma.col.col.s8(i32 %11, i32 %12, i32 %15, i32 %16, i32 %1, i32 %2, i32 %3, i32 %4, i32 %5, i32 %6, i32 %7, i32 %8) #{{.*}}
           sub_c = joint_matrix_mad(sg, sub_a, sub_b, sub_c);
-          // CHECK: tail call void
-          // @llvm.nvvm.wmma.m16n16k16.store.d.col.stride.s32.p1i32(i32
-          // addrspace(1)* %add.ptr.i76, i32 %26, i32 %27, i32 %28, i32 %29, i32
-          // %30, i32 %31, i32 %32, i32 %33, i32 16) #{{.*}}
+          // CHECK: tail call void @llvm.nvvm.wmma.m16n16k16.store.d.col.stride.s32.p1i32(i32 addrspace(1)* %_arg_14, i32 %18, i32 %19, i32 %20, i32 %21, i32 %22, i32 %23, i32 %24, i32 %25, i32 16) #{{.*}}
           joint_matrix_store(sg, sub_c, accD.get_pointer(), stride);
         });
 
@@ -117,27 +93,15 @@ int main() {
           joint_matrix<int8_t, matrix_use::b, 16, 8, matrix_layout::row_major>
               sub_b;
 
-          // CHECK: tail call { i32, i32, i32, i32, i32, i32, i32, i32 }
-          // @llvm.nvvm.wmma.m32n8k16.load.c.row.stride.s32.p1i32(i32
-          // addrspace(1)* %add.ptr.i, i32 16) #{{.*}}
+          // CHECK: tail call { i32, i32, i32, i32, i32, i32, i32, i32 } @llvm.nvvm.wmma.m32n8k16.load.c.row.stride.s32.p1i32(i32 addrspace(1)* %_arg_, i32 16) #{{.*}}
           joint_matrix_load(sg, sub_c, accC.get_pointer(), stride);
-          // CHECK: tail call { i32, i32, i32, i32 }
-          // @llvm.nvvm.wmma.m32n8k16.load.a.row.stride.s8.p0i32(i32*
-          // %call.ascast.i.i46.i, i32 16) #{{.*}}
+          // CHECK: tail call { i32, i32, i32, i32 } @llvm.nvvm.wmma.m32n8k16.load.a.row.stride.s8.p0i32(i32* %call.ascast.i.i49.i, i32 16) #{{.*}}
           joint_matrix_load(sg, sub_a, accA.get_pointer(), stride);
-          // CHECK: tail call i32
-          // @llvm.nvvm.wmma.m32n8k16.load.b.row.stride.s8.p0i32(i32*
-          // %call.ascast.i.i.i, i32 16) #{{.*}}
+          // CHECK: tail call i32 @llvm.nvvm.wmma.m32n8k16.load.b.row.stride.s8.p0i32(i32* %call.ascast.i.i.i, i32 16) #{{.*}}
           joint_matrix_load(sg, sub_b, accB.get_pointer(), stride);
-          // CHECK: tail call { i32, i32, i32, i32, i32, i32, i32, i32 }
-          // @llvm.nvvm.wmma.m32n8k16.mma.row.row.s8(i32 %19, i32 %20, i32 %21,
-          // i32 %22, i32 %24, i32 %9, i32 %10, i32 %11, i32 %12, i32 %13, i32
-          // %14, i32 %15, i32 %16) #{{.*}}
+          // CHECK: tail call { i32, i32, i32, i32, i32, i32, i32, i32 } @llvm.nvvm.wmma.m32n8k16.mma.row.row.s8(i32 %11, i32 %12, i32 %13, i32 %14, i32 %16, i32 %1, i32 %2, i32 %3, i32 %4, i32 %5, i32 %6, i32 %7, i32 %8) #{{.*}}
           sub_c = joint_matrix_mad(sg, sub_a, sub_b, sub_c);
-          // CHECK: tail call void
-          // @llvm.nvvm.wmma.m32n8k16.store.d.row.stride.s32.p1i32(i32
-          // addrspace(1)* %add.ptr.i76, i32 %26, i32 %27, i32 %28, i32 %29, i32
-          // %30, i32 %31, i32 %32, i32 %33, i32 16) #{{.*}}
+          // CHECK: tail call void @llvm.nvvm.wmma.m32n8k16.store.d.row.stride.s32.p1i32(i32 addrspace(1)* %_arg_14, i32 %18, i32 %19, i32 %20, i32 %21, i32 %22, i32 %23, i32 %24, i32 %25, i32 16) #{{.*}}
           joint_matrix_store(sg, sub_c, accD.get_pointer(), stride);
         });
 
@@ -156,27 +120,15 @@ int main() {
           joint_matrix<int8_t, matrix_use::b, 16, 8, matrix_layout::col_major>
               sub_b;
 
-          // CHECK: tail call { i32, i32, i32, i32, i32, i32, i32, i32 }
-          // @llvm.nvvm.wmma.m32n8k16.load.c.col.stride.s32.p1i32(i32
-          // addrspace(1)* %add.ptr.i, i32 16) #{{.*}}
+          // CHECK: tail call { i32, i32, i32, i32, i32, i32, i32, i32 } @llvm.nvvm.wmma.m32n8k16.load.c.col.stride.s32.p1i32(i32 addrspace(1)* %_arg_, i32 16) #{{.*}}
           joint_matrix_load(sg, sub_c, accC.get_pointer(), stride);
-          // CHECK: tail call { i32, i32, i32, i32 }
-          // @llvm.nvvm.wmma.m32n8k16.load.a.col.stride.s8.p0i32(i32*
-          // %call.ascast.i.i46.i, i32 16) #{{.*}}
+          // CHECK: tail call { i32, i32, i32, i32 } @llvm.nvvm.wmma.m32n8k16.load.a.col.stride.s8.p0i32(i32* %call.ascast.i.i49.i, i32 16) #{{.*}}
           joint_matrix_load(sg, sub_a, accA.get_pointer(), stride);
-          // CHECK: tail call i32
-          // @llvm.nvvm.wmma.m32n8k16.load.b.col.stride.s8.p0i32(i32*
-          // %call.ascast.i.i.i, i32 16) #{{.*}}
+          // CHECK: tail call i32 @llvm.nvvm.wmma.m32n8k16.load.b.col.stride.s8.p0i32(i32* %call.ascast.i.i.i, i32 16) #{{.*}}
           joint_matrix_load(sg, sub_b, accB.get_pointer(), stride);
-          // CHECK: tail call { i32, i32, i32, i32, i32, i32, i32, i32 }
-          // @llvm.nvvm.wmma.m32n8k16.mma.col.col.s8(i32 %19, i32 %20, i32 %21,
-          // i32 %22, i32 %24, i32 %9, i32 %10, i32 %11, i32 %12, i32 %13, i32
-          // %14, i32 %15, i32 %16) #{{.*}}
+          // CHECK: tail call { i32, i32, i32, i32, i32, i32, i32, i32 } @llvm.nvvm.wmma.m32n8k16.mma.col.col.s8(i32 %11, i32 %12, i32 %13, i32 %14, i32 %16, i32 %1, i32 %2, i32 %3, i32 %4, i32 %5, i32 %6, i32 %7, i32 %8) #{{.*}}
           sub_c = joint_matrix_mad(sg, sub_a, sub_b, sub_c);
-          // CHECK: tail call void
-          // @llvm.nvvm.wmma.m32n8k16.store.d.col.stride.s32.p1i32(i32
-          // addrspace(1)* %add.ptr.i76, i32 %26, i32 %27, i32 %28, i32 %29, i32
-          // %30, i32 %31, i32 %32, i32 %33, i32 16) #{{.*}}
+          // CHECK: tail call void @llvm.nvvm.wmma.m32n8k16.store.d.col.stride.s32.p1i32(i32 addrspace(1)* %_arg_14, i32 %18, i32 %19, i32 %20, i32 %21, i32 %22, i32 %23, i32 %24, i32 %25, i32 16) #{{.*}}
           joint_matrix_store(sg, sub_c, accD.get_pointer(), stride);
         });
 
@@ -195,27 +147,15 @@ int main() {
           joint_matrix<int8_t, matrix_use::b, 16, 32, matrix_layout::row_major>
               sub_b;
 
-          // CHECK: tail call { i32, i32, i32, i32, i32, i32, i32, i32 }
-          // @llvm.nvvm.wmma.m8n32k16.load.c.row.stride.s32.p1i32(i32
-          // addrspace(1)* %add.ptr.i, i32 16) #{{.*}}
+          // CHECK: tail call { i32, i32, i32, i32, i32, i32, i32, i32 } @llvm.nvvm.wmma.m8n32k16.load.c.row.stride.s32.p1i32(i32 addrspace(1)* %_arg_, i32 16) #{{.*}}
           joint_matrix_load(sg, sub_c, accC.get_pointer(), stride);
-          // CHECK: tail call i32
-          // @llvm.nvvm.wmma.m8n32k16.load.a.row.stride.s8.p0i32(i32*
-          // %call.ascast.i.i46.i, i32 16) #{{.*}}
+          // CHECK: tail call i32 @llvm.nvvm.wmma.m8n32k16.load.a.row.stride.s8.p0i32(i32* %call.ascast.i.i49.i, i32 16) #{{.*}}
           joint_matrix_load(sg, sub_a, accA.get_pointer(), stride);
-          // CHECK: tail call { i32, i32, i32, i32 }
-          // @llvm.nvvm.wmma.m8n32k16.load.b.row.stride.s8.p0i32(i32*
-          // %call.ascast.i.i.i, i32 16) #{{.*}}
+          // CHECK: tail call { i32, i32, i32, i32 } @llvm.nvvm.wmma.m8n32k16.load.b.row.stride.s8.p0i32(i32* %call.ascast.i.i.i, i32 16) #{{.*}}
           joint_matrix_load(sg, sub_b, accB.get_pointer(), stride);
-          // CHECK: tail call { i32, i32, i32, i32, i32, i32, i32, i32 }
-          // @llvm.nvvm.wmma.m8n32k16.mma.row.row.s8(i32 %18, i32 %21, i32 %22,
-          // i32 %23, i32 %24, i32 %9, i32 %10, i32 %11, i32 %12, i32 %13, i32
-          // %14, i32 %15, i32 %16) #{{.*}}
+          // CHECK: tail call { i32, i32, i32, i32, i32, i32, i32, i32 } @llvm.nvvm.wmma.m8n32k16.mma.row.row.s8(i32 %10, i32 %13, i32 %14, i32 %15, i32 %16, i32 %1, i32 %2, i32 %3, i32 %4, i32 %5, i32 %6, i32 %7, i32 %8) #{{.*}}
           sub_c = joint_matrix_mad(sg, sub_a, sub_b, sub_c);
-          // CHECK: tail call void
-          // @llvm.nvvm.wmma.m8n32k16.store.d.row.stride.s32.p1i32(i32
-          // addrspace(1)* %add.ptr.i76, i32 %26, i32 %27, i32 %28, i32 %29, i32
-          // %30, i32 %31, i32 %32, i32 %33, i32 16) #{{.*}}
+          // CHECK: tail call void @llvm.nvvm.wmma.m8n32k16.store.d.row.stride.s32.p1i32(i32 addrspace(1)* %_arg_14, i32 %18, i32 %19, i32 %20, i32 %21, i32 %22, i32 %23, i32 %24, i32 %25, i32 16) #{{.*}}
           joint_matrix_store(sg, sub_c, accD.get_pointer(), stride);
         });
 
@@ -234,27 +174,15 @@ int main() {
           joint_matrix<int8_t, matrix_use::b, 16, 32, matrix_layout::col_major>
               sub_b;
 
-          // CHECK: tail call { i32, i32, i32, i32, i32, i32, i32, i32 }
-          // @llvm.nvvm.wmma.m8n32k16.load.c.col.stride.s32.p1i32(i32
-          // addrspace(1)* %add.ptr.i, i32 16) #{{.*}}
+          // CHECK: tail call { i32, i32, i32, i32, i32, i32, i32, i32 } @llvm.nvvm.wmma.m8n32k16.load.c.col.stride.s32.p1i32(i32 addrspace(1)* %_arg_, i32 16) #{{.*}}
           joint_matrix_load(sg, sub_c, accC.get_pointer(), stride);
-          // CHECK: tail call i32
-          // @llvm.nvvm.wmma.m8n32k16.load.a.col.stride.s8.p0i32(i32*
-          // %call.ascast.i.i46.i, i32 16) #{{.*}}
+          // CHECK: tail call i32 @llvm.nvvm.wmma.m8n32k16.load.a.col.stride.s8.p0i32(i32* %call.ascast.i.i49.i, i32 16) #{{.*}}
           joint_matrix_load(sg, sub_a, accA.get_pointer(), stride);
-          // CHECK: tail call { i32, i32, i32, i32 }
-          // @llvm.nvvm.wmma.m8n32k16.load.b.col.stride.s8.p0i32(i32*
-          // %call.ascast.i.i.i, i32 16) #{{.*}}
+          // CHECK: tail call { i32, i32, i32, i32 } @llvm.nvvm.wmma.m8n32k16.load.b.col.stride.s8.p0i32(i32* %call.ascast.i.i.i, i32 16) #{{.*}}
           joint_matrix_load(sg, sub_b, accB.get_pointer(), stride);
-          // CHECK: tail call { i32, i32, i32, i32, i32, i32, i32, i32 }
-          // @llvm.nvvm.wmma.m8n32k16.mma.col.col.s8(i32 %18, i32 %21, i32 %22,
-          // i32 %23, i32 %24, i32 %9, i32 %10, i32 %11, i32 %12, i32 %13, i32
-          // %14, i32 %15, i32 %16) #{{.*}}
+          // CHECK: tail call { i32, i32, i32, i32, i32, i32, i32, i32 } @llvm.nvvm.wmma.m8n32k16.mma.col.col.s8(i32 %10, i32 %13, i32 %14, i32 %15, i32 %16, i32 %1, i32 %2, i32 %3, i32 %4, i32 %5, i32 %6, i32 %7, i32 %8) #{{.*}}
           sub_c = joint_matrix_mad(sg, sub_a, sub_b, sub_c);
-          // CHECK: tail call void
-          // @llvm.nvvm.wmma.m8n32k16.store.d.col.stride.s32.p1i32(i32
-          // addrspace(1)* %add.ptr.i76, i32 %26, i32 %27, i32 %28, i32 %29, i32
-          // %30, i32 %31, i32 %32, i32 %33, i32 16) #{{.*}}
+          // CHECK: tail call void @llvm.nvvm.wmma.m8n32k16.store.d.col.stride.s32.p1i32(i32 addrspace(1)* %_arg_14, i32 %18, i32 %19, i32 %20, i32 %21, i32 %22, i32 %23, i32 %24, i32 %25, i32 16) #{{.*}}
           joint_matrix_store(sg, sub_c, accD.get_pointer(), stride);
         });
   });