@@ -127,7 +127,7 @@ define amdgpu_kernel void @idot4_acc32(ptr addrspace(1) %src1,
127
127
; GFX10-DL-NEXT: s_waitcnt lgkmcnt(0)
128
128
; GFX10-DL-NEXT: v_mov_b32_e32 v0, s2
129
129
; GFX10-DL-NEXT: s_waitcnt vmcnt(0)
130
- ; GFX10-DL-NEXT: v_dot4c_i32_i8_e32 v0, v1, v2
130
+ ; GFX10-DL-NEXT: v_dot4c_i32_i8 v0, v1, v2
131
131
; GFX10-DL-NEXT: global_store_dword v3, v0, s[0:1]
132
132
; GFX10-DL-NEXT: s_endpgm
133
133
;
@@ -336,7 +336,7 @@ define amdgpu_kernel void @idot4_acc16(ptr addrspace(1) %src1,
336
336
; GFX10-DL-NEXT: global_load_dword v3, v0, s[6:7]
337
337
; GFX10-DL-NEXT: global_load_sshort v4, v1, s[2:3]
338
338
; GFX10-DL-NEXT: s_waitcnt vmcnt(0)
339
- ; GFX10-DL-NEXT: v_dot4c_i32_i8_e32 v4, v2, v3
339
+ ; GFX10-DL-NEXT: v_dot4c_i32_i8 v4, v2, v3
340
340
; GFX10-DL-NEXT: global_store_short v1, v4, s[2:3]
341
341
; GFX10-DL-NEXT: s_endpgm
342
342
;
@@ -710,7 +710,7 @@ define amdgpu_kernel void @idot4_multiuse_mul1(ptr addrspace(1) %src1,
710
710
; GFX10-DL-NEXT: s_waitcnt lgkmcnt(0)
711
711
; GFX10-DL-NEXT: v_mad_i32_i24 v0, v0, v3, s2
712
712
; GFX10-DL-NEXT: v_mov_b32_e32 v3, 0
713
- ; GFX10-DL-NEXT: v_dot4c_i32_i8_e32 v0, v1, v2
713
+ ; GFX10-DL-NEXT: v_dot4c_i32_i8 v0, v1, v2
714
714
; GFX10-DL-NEXT: global_store_dword v3, v0, s[0:1]
715
715
; GFX10-DL-NEXT: s_endpgm
716
716
;
@@ -906,7 +906,7 @@ define amdgpu_kernel void @idot4_acc32_vecMul(ptr addrspace(1) %src1,
906
906
; GFX10-DL-NEXT: s_waitcnt lgkmcnt(0)
907
907
; GFX10-DL-NEXT: v_mov_b32_e32 v0, s2
908
908
; GFX10-DL-NEXT: s_waitcnt vmcnt(0)
909
- ; GFX10-DL-NEXT: v_dot4c_i32_i8_e32 v0, v1, v2
909
+ ; GFX10-DL-NEXT: v_dot4c_i32_i8 v0, v1, v2
910
910
; GFX10-DL-NEXT: global_store_dword v3, v0, s[0:1]
911
911
; GFX10-DL-NEXT: s_endpgm
912
912
;
@@ -1335,7 +1335,7 @@ define amdgpu_kernel void @idot4_acc32_2ele(ptr addrspace(1) %src1,
1335
1335
; GFX10-DL-NEXT: v_perm_b32 v1, v2, v2, 0xc0c0100
1336
1336
; GFX10-DL-NEXT: s_waitcnt lgkmcnt(0)
1337
1337
; GFX10-DL-NEXT: v_mov_b32_e32 v2, s2
1338
- ; GFX10-DL-NEXT: v_dot4c_i32_i8_e32 v2, v1, v0
1338
+ ; GFX10-DL-NEXT: v_dot4c_i32_i8 v2, v1, v0
1339
1339
; GFX10-DL-NEXT: global_store_dword v3, v2, s[0:1]
1340
1340
; GFX10-DL-NEXT: s_endpgm
1341
1341
;
@@ -1513,7 +1513,7 @@ define amdgpu_kernel void @idot4_acc32_3ele(ptr addrspace(1) %src1,
1513
1513
; GFX10-DL-NEXT: v_perm_b32 v1, v2, v2, 0xc020100
1514
1514
; GFX10-DL-NEXT: s_waitcnt lgkmcnt(0)
1515
1515
; GFX10-DL-NEXT: v_mov_b32_e32 v2, s2
1516
- ; GFX10-DL-NEXT: v_dot4c_i32_i8_e32 v2, v1, v0
1516
+ ; GFX10-DL-NEXT: v_dot4c_i32_i8 v2, v1, v0
1517
1517
; GFX10-DL-NEXT: global_store_dword v3, v2, s[0:1]
1518
1518
; GFX10-DL-NEXT: s_endpgm
1519
1519
;
@@ -1698,7 +1698,7 @@ define amdgpu_kernel void @idot4_acc32_3ele_permuted(ptr addrspace(1) %src1,
1698
1698
; GFX10-DL-NEXT: v_perm_b32 v1, v2, v2, 0xc020003
1699
1699
; GFX10-DL-NEXT: s_waitcnt lgkmcnt(0)
1700
1700
; GFX10-DL-NEXT: v_mov_b32_e32 v2, s2
1701
- ; GFX10-DL-NEXT: v_dot4c_i32_i8_e32 v2, v1, v0
1701
+ ; GFX10-DL-NEXT: v_dot4c_i32_i8 v2, v1, v0
1702
1702
; GFX10-DL-NEXT: global_store_dword v3, v2, s[0:1]
1703
1703
; GFX10-DL-NEXT: s_endpgm
1704
1704
;
@@ -1870,7 +1870,7 @@ define amdgpu_kernel void @idot4_acc32_opt(ptr addrspace(1) %src1,
1870
1870
; GFX10-DL-NEXT: global_load_dword v2, v0, s[6:7]
1871
1871
; GFX10-DL-NEXT: v_mov_b32_e32 v0, 0
1872
1872
; GFX10-DL-NEXT: s_waitcnt vmcnt(0)
1873
- ; GFX10-DL-NEXT: v_dot4c_i32_i8_e32 v0, v1, v2
1873
+ ; GFX10-DL-NEXT: v_dot4c_i32_i8 v0, v1, v2
1874
1874
; GFX10-DL-NEXT: global_store_dword v3, v0, s[0:1]
1875
1875
; GFX10-DL-NEXT: s_endpgm
1876
1876
;
@@ -2070,7 +2070,7 @@ define amdgpu_kernel void @idot4_acc32_3src(ptr addrspace(1) %src1,
2070
2070
; GFX10-DL-NEXT: v_or_b32_e32 v0, v0, v1
2071
2071
; GFX10-DL-NEXT: s_waitcnt lgkmcnt(0)
2072
2072
; GFX10-DL-NEXT: v_mov_b32_e32 v1, s0
2073
- ; GFX10-DL-NEXT: v_dot4c_i32_i8_e32 v1, v3, v0
2073
+ ; GFX10-DL-NEXT: v_dot4c_i32_i8 v1, v3, v0
2074
2074
; GFX10-DL-NEXT: global_store_dword v2, v1, s[6:7]
2075
2075
; GFX10-DL-NEXT: s_endpgm
2076
2076
;
@@ -2276,7 +2276,7 @@ define amdgpu_kernel void @idot4_acc32_3src_3ele(ptr addrspace(1) %src1,
2276
2276
; GFX10-DL-NEXT: v_or_b32_e32 v0, v0, v1
2277
2277
; GFX10-DL-NEXT: s_waitcnt lgkmcnt(0)
2278
2278
; GFX10-DL-NEXT: v_mov_b32_e32 v1, s0
2279
- ; GFX10-DL-NEXT: v_dot4c_i32_i8_e32 v1, v2, v0
2279
+ ; GFX10-DL-NEXT: v_dot4c_i32_i8 v1, v2, v0
2280
2280
; GFX10-DL-NEXT: global_store_dword v3, v1, s[6:7]
2281
2281
; GFX10-DL-NEXT: s_endpgm
2282
2282
;
@@ -2479,7 +2479,7 @@ define amdgpu_kernel void @idot4_bad_source(ptr addrspace(1) %src1,
2479
2479
; GFX10-DL-NEXT: v_perm_b32 v1, v1, v1, 0xc0c0201
2480
2480
; GFX10-DL-NEXT: s_waitcnt lgkmcnt(0)
2481
2481
; GFX10-DL-NEXT: v_mad_i32_i24 v0, v0, s2, s3
2482
- ; GFX10-DL-NEXT: v_dot4c_i32_i8_e32 v0, v1, v2
2482
+ ; GFX10-DL-NEXT: v_dot4c_i32_i8 v0, v1, v2
2483
2483
; GFX10-DL-NEXT: global_store_dword v3, v0, s[0:1]
2484
2484
; GFX10-DL-NEXT: s_endpgm
2485
2485
;
@@ -2674,7 +2674,7 @@ define amdgpu_kernel void @idot4_commutative(ptr addrspace(1) %src1,
2674
2674
; GFX10-DL-NEXT: v_perm_b32 v1, v2, v2, 0xc020100
2675
2675
; GFX10-DL-NEXT: s_waitcnt lgkmcnt(0)
2676
2676
; GFX10-DL-NEXT: v_mov_b32_e32 v2, s2
2677
- ; GFX10-DL-NEXT: v_dot4c_i32_i8_e32 v2, v1, v0
2677
+ ; GFX10-DL-NEXT: v_dot4c_i32_i8 v2, v1, v0
2678
2678
; GFX10-DL-NEXT: global_store_dword v3, v2, s[0:1]
2679
2679
; GFX10-DL-NEXT: s_endpgm
2680
2680
;
@@ -2874,7 +2874,7 @@ define amdgpu_kernel void @idot4_acc32_3src_3ele_src0(ptr addrspace(1) %src1,
2874
2874
; GFX10-DL-NEXT: v_or_b32_e32 v0, v0, v1
2875
2875
; GFX10-DL-NEXT: s_waitcnt lgkmcnt(0)
2876
2876
; GFX10-DL-NEXT: v_mov_b32_e32 v1, s0
2877
- ; GFX10-DL-NEXT: v_dot4c_i32_i8_e32 v1, v2, v0
2877
+ ; GFX10-DL-NEXT: v_dot4c_i32_i8 v1, v2, v0
2878
2878
; GFX10-DL-NEXT: global_store_dword v3, v1, s[6:7]
2879
2879
; GFX10-DL-NEXT: s_endpgm
2880
2880
;
@@ -3105,7 +3105,7 @@ define amdgpu_kernel void @idot4_4src(ptr addrspace(1) %src1,
3105
3105
; GFX10-DL-NEXT: v_or_b32_e32 v1, v2, v1
3106
3106
; GFX10-DL-NEXT: s_waitcnt lgkmcnt(0)
3107
3107
; GFX10-DL-NEXT: v_mov_b32_e32 v2, s2
3108
- ; GFX10-DL-NEXT: v_dot4c_i32_i8_e32 v2, v1, v0
3108
+ ; GFX10-DL-NEXT: v_dot4c_i32_i8 v2, v1, v0
3109
3109
; GFX10-DL-NEXT: global_store_dword v3, v2, s[0:1]
3110
3110
; GFX10-DL-NEXT: s_endpgm
3111
3111
;
0 commit comments