@@ -182,8 +182,7 @@ define amdgpu_kernel void @soff1_voff2(i32 %soff) {
182
182
; GFX942-SDAG-NEXT: v_and_b32_e32 v0, 0x3ff, v0
183
183
; GFX942-SDAG-NEXT: v_mov_b32_e32 v1, 1
184
184
; GFX942-SDAG-NEXT: s_waitcnt lgkmcnt(0)
185
- ; GFX942-SDAG-NEXT: v_mov_b32_e32 v2, s0
186
- ; GFX942-SDAG-NEXT: v_mad_u32_u24 v0, v0, 2, v2
185
+ ; GFX942-SDAG-NEXT: v_mad_u32_u24 v0, v0, 2, s0
187
186
; GFX942-SDAG-NEXT: v_add_u32_e32 v2, 1, v0
188
187
; GFX942-SDAG-NEXT: v_add_u32_e32 v3, 2, v0
189
188
; GFX942-SDAG-NEXT: scratch_store_byte v2, v1, off sc0 sc1
@@ -356,8 +355,7 @@ define amdgpu_kernel void @soff1_voff4(i32 %soff) {
356
355
; GFX942-SDAG-NEXT: v_and_b32_e32 v0, 0x3ff, v0
357
356
; GFX942-SDAG-NEXT: v_mov_b32_e32 v1, 1
358
357
; GFX942-SDAG-NEXT: s_waitcnt lgkmcnt(0)
359
- ; GFX942-SDAG-NEXT: v_mov_b32_e32 v2, s0
360
- ; GFX942-SDAG-NEXT: v_mad_u32_u24 v0, v0, 4, v2
358
+ ; GFX942-SDAG-NEXT: v_mad_u32_u24 v0, v0, 4, s0
361
359
; GFX942-SDAG-NEXT: v_add_u32_e32 v2, 1, v0
362
360
; GFX942-SDAG-NEXT: v_add_u32_e32 v3, 2, v0
363
361
; GFX942-SDAG-NEXT: scratch_store_byte v2, v1, off sc0 sc1
@@ -701,14 +699,13 @@ define amdgpu_kernel void @soff2_voff2(i32 %soff) {
701
699
; GFX942-SDAG-NEXT: s_load_dword s0, s[4:5], 0x24
702
700
; GFX942-SDAG-NEXT: v_and_b32_e32 v0, 0x3ff, v0
703
701
; GFX942-SDAG-NEXT: v_mov_b32_e32 v1, 1
702
+ ; GFX942-SDAG-NEXT: v_mov_b32_e32 v2, 2
704
703
; GFX942-SDAG-NEXT: s_waitcnt lgkmcnt(0)
705
704
; GFX942-SDAG-NEXT: s_lshl_b32 s0, s0, 1
706
- ; GFX942-SDAG-NEXT: v_mov_b32_e32 v2, s0
707
- ; GFX942-SDAG-NEXT: v_mad_u32_u24 v0, v0, 2, v2
705
+ ; GFX942-SDAG-NEXT: v_mad_u32_u24 v0, v0, 2, s0
708
706
; GFX942-SDAG-NEXT: scratch_store_byte v0, v1, off offset:1 sc0 sc1
709
707
; GFX942-SDAG-NEXT: s_waitcnt vmcnt(0)
710
708
; GFX942-SDAG-NEXT: v_add_u32_e32 v1, 2, v0
711
- ; GFX942-SDAG-NEXT: v_mov_b32_e32 v2, 2
712
709
; GFX942-SDAG-NEXT: scratch_store_byte v1, v2, off sc0 sc1
713
710
; GFX942-SDAG-NEXT: s_waitcnt vmcnt(0)
714
711
; GFX942-SDAG-NEXT: v_add_u32_e32 v0, 4, v0
@@ -884,14 +881,13 @@ define amdgpu_kernel void @soff2_voff4(i32 %soff) {
884
881
; GFX942-SDAG-NEXT: s_load_dword s0, s[4:5], 0x24
885
882
; GFX942-SDAG-NEXT: v_and_b32_e32 v0, 0x3ff, v0
886
883
; GFX942-SDAG-NEXT: v_mov_b32_e32 v1, 1
884
+ ; GFX942-SDAG-NEXT: v_mov_b32_e32 v2, 2
887
885
; GFX942-SDAG-NEXT: s_waitcnt lgkmcnt(0)
888
886
; GFX942-SDAG-NEXT: s_lshl_b32 s0, s0, 1
889
- ; GFX942-SDAG-NEXT: v_mov_b32_e32 v2, s0
890
- ; GFX942-SDAG-NEXT: v_mad_u32_u24 v0, v0, 4, v2
887
+ ; GFX942-SDAG-NEXT: v_mad_u32_u24 v0, v0, 4, s0
891
888
; GFX942-SDAG-NEXT: scratch_store_byte v0, v1, off offset:1 sc0 sc1
892
889
; GFX942-SDAG-NEXT: s_waitcnt vmcnt(0)
893
890
; GFX942-SDAG-NEXT: v_add_u32_e32 v1, 2, v0
894
- ; GFX942-SDAG-NEXT: v_mov_b32_e32 v2, 2
895
891
; GFX942-SDAG-NEXT: scratch_store_byte v1, v2, off sc0 sc1
896
892
; GFX942-SDAG-NEXT: s_waitcnt vmcnt(0)
897
893
; GFX942-SDAG-NEXT: v_add_u32_e32 v0, 4, v0
@@ -1239,14 +1235,13 @@ define amdgpu_kernel void @soff4_voff2(i32 %soff) {
1239
1235
; GFX942-SDAG-NEXT: s_load_dword s0, s[4:5], 0x24
1240
1236
; GFX942-SDAG-NEXT: v_and_b32_e32 v0, 0x3ff, v0
1241
1237
; GFX942-SDAG-NEXT: v_mov_b32_e32 v1, 1
1238
+ ; GFX942-SDAG-NEXT: v_mov_b32_e32 v2, 2
1242
1239
; GFX942-SDAG-NEXT: s_waitcnt lgkmcnt(0)
1243
1240
; GFX942-SDAG-NEXT: s_lshl_b32 s0, s0, 2
1244
- ; GFX942-SDAG-NEXT: v_mov_b32_e32 v2, s0
1245
- ; GFX942-SDAG-NEXT: v_mad_u32_u24 v0, v0, 2, v2
1241
+ ; GFX942-SDAG-NEXT: v_mad_u32_u24 v0, v0, 2, s0
1246
1242
; GFX942-SDAG-NEXT: scratch_store_byte v0, v1, off offset:1 sc0 sc1
1247
1243
; GFX942-SDAG-NEXT: s_waitcnt vmcnt(0)
1248
1244
; GFX942-SDAG-NEXT: v_add_u32_e32 v1, 2, v0
1249
- ; GFX942-SDAG-NEXT: v_mov_b32_e32 v2, 2
1250
1245
; GFX942-SDAG-NEXT: scratch_store_byte v1, v2, off sc0 sc1
1251
1246
; GFX942-SDAG-NEXT: s_waitcnt vmcnt(0)
1252
1247
; GFX942-SDAG-NEXT: v_add_u32_e32 v0, 4, v0
@@ -1425,8 +1420,7 @@ define amdgpu_kernel void @soff4_voff4(i32 %soff) {
1425
1420
; GFX942-SDAG-NEXT: v_mov_b32_e32 v2, 2
1426
1421
; GFX942-SDAG-NEXT: s_waitcnt lgkmcnt(0)
1427
1422
; GFX942-SDAG-NEXT: s_lshl_b32 s0, s0, 2
1428
- ; GFX942-SDAG-NEXT: v_mov_b32_e32 v3, s0
1429
- ; GFX942-SDAG-NEXT: v_mad_u32_u24 v0, v0, 4, v3
1423
+ ; GFX942-SDAG-NEXT: v_mad_u32_u24 v0, v0, 4, s0
1430
1424
; GFX942-SDAG-NEXT: scratch_store_byte v0, v1, off offset:1 sc0 sc1
1431
1425
; GFX942-SDAG-NEXT: s_waitcnt vmcnt(0)
1432
1426
; GFX942-SDAG-NEXT: scratch_store_byte v0, v2, off offset:2 sc0 sc1
0 commit comments