@@ -41,13 +41,12 @@ define amdgpu_cs void @atomic_add(<4 x i32> inreg %arg) {
41
41
; GCN-NEXT: v_mbcnt_hi_u32_b32_e32 v0, s6, v0
42
42
; GCN-NEXT: v_cmp_eq_u32_e32 vcc, 0, v0
43
43
; GCN-NEXT: s_and_saveexec_b64 s[6:7], vcc
44
- ; GCN-NEXT: s_cbranch_execz .LBB0_2
45
44
; GCN-NEXT: ; %bb.1:
46
45
; GCN-NEXT: s_bcnt1_i32_b64 s4, s[4:5]
47
46
; GCN-NEXT: v_mov_b32_e32 v0, 0
48
47
; GCN-NEXT: v_mov_b32_e32 v1, s4
49
48
; GCN-NEXT: buffer_atomic_add v1, v0, s[0:3], 0 idxen
50
- ; GCN-NEXT: .LBB0_2 :
49
+ ; GCN-NEXT: ; %bb.2 :
51
50
; GCN-NEXT: s_endpgm
52
51
.entry:
53
52
call i32 @llvm.amdgcn.struct.buffer.atomic.add.i32 (i32 1 , <4 x i32 > %arg , i32 0 , i32 0 , i32 0 , i32 0 )
@@ -87,13 +86,12 @@ define amdgpu_cs void @atomic_add_and_format(<4 x i32> inreg %arg) {
87
86
; GCN-NEXT: v_cmp_eq_u32_e32 vcc, 0, v0
88
87
; GCN-NEXT: ; implicit-def: $vgpr1
89
88
; GCN-NEXT: s_and_saveexec_b64 s[4:5], vcc
90
- ; GCN-NEXT: s_cbranch_execz .LBB1_2
91
89
; GCN-NEXT: ; %bb.1:
92
90
; GCN-NEXT: s_bcnt1_i32_b64 s6, s[6:7]
93
91
; GCN-NEXT: v_mov_b32_e32 v1, s6
94
92
; GCN-NEXT: v_mov_b32_e32 v2, 0
95
93
; GCN-NEXT: buffer_atomic_add v1, v2, s[0:3], 0 idxen glc
96
- ; GCN-NEXT: .LBB1_2 :
94
+ ; GCN-NEXT: ; %bb.2 :
97
95
; GCN-NEXT: s_or_b64 exec, exec, s[4:5]
98
96
; GCN-NEXT: s_waitcnt vmcnt(0)
99
97
; GCN-NEXT: v_readfirstlane_b32 s4, v1
@@ -139,13 +137,12 @@ define amdgpu_cs void @atomic_sub(<4 x i32> inreg %arg) {
139
137
; GCN-NEXT: v_mbcnt_hi_u32_b32_e32 v0, s6, v0
140
138
; GCN-NEXT: v_cmp_eq_u32_e32 vcc, 0, v0
141
139
; GCN-NEXT: s_and_saveexec_b64 s[6:7], vcc
142
- ; GCN-NEXT: s_cbranch_execz .LBB2_2
143
140
; GCN-NEXT: ; %bb.1:
144
141
; GCN-NEXT: s_bcnt1_i32_b64 s4, s[4:5]
145
142
; GCN-NEXT: v_mov_b32_e32 v0, 0
146
143
; GCN-NEXT: v_mov_b32_e32 v1, s4
147
144
; GCN-NEXT: buffer_atomic_sub v1, v0, s[0:3], 0 idxen
148
- ; GCN-NEXT: .LBB2_2 :
145
+ ; GCN-NEXT: ; %bb.2 :
149
146
; GCN-NEXT: s_endpgm
150
147
.entry:
151
148
call i32 @llvm.amdgcn.struct.buffer.atomic.sub.i32 (i32 1 , <4 x i32 > %arg , i32 0 , i32 0 , i32 0 , i32 0 )
@@ -185,13 +182,12 @@ define amdgpu_cs void @atomic_sub_and_format(<4 x i32> inreg %arg) {
185
182
; GCN-NEXT: v_cmp_eq_u32_e32 vcc, 0, v0
186
183
; GCN-NEXT: ; implicit-def: $vgpr1
187
184
; GCN-NEXT: s_and_saveexec_b64 s[4:5], vcc
188
- ; GCN-NEXT: s_cbranch_execz .LBB3_2
189
185
; GCN-NEXT: ; %bb.1:
190
186
; GCN-NEXT: s_bcnt1_i32_b64 s6, s[6:7]
191
187
; GCN-NEXT: v_mov_b32_e32 v1, s6
192
188
; GCN-NEXT: v_mov_b32_e32 v2, 0
193
189
; GCN-NEXT: buffer_atomic_sub v1, v2, s[0:3], 0 idxen glc
194
- ; GCN-NEXT: .LBB3_2 :
190
+ ; GCN-NEXT: ; %bb.2 :
195
191
; GCN-NEXT: s_or_b64 exec, exec, s[4:5]
196
192
; GCN-NEXT: s_waitcnt vmcnt(0)
197
193
; GCN-NEXT: v_readfirstlane_b32 s4, v1
@@ -238,14 +234,13 @@ define amdgpu_cs void @atomic_xor(<4 x i32> inreg %arg) {
238
234
; GCN-NEXT: v_mbcnt_hi_u32_b32_e32 v0, s6, v0
239
235
; GCN-NEXT: v_cmp_eq_u32_e32 vcc, 0, v0
240
236
; GCN-NEXT: s_and_saveexec_b64 s[6:7], vcc
241
- ; GCN-NEXT: s_cbranch_execz .LBB4_2
242
237
; GCN-NEXT: ; %bb.1:
243
238
; GCN-NEXT: s_bcnt1_i32_b64 s4, s[4:5]
244
239
; GCN-NEXT: s_and_b32 s4, s4, 1
245
240
; GCN-NEXT: v_mov_b32_e32 v0, 0
246
241
; GCN-NEXT: v_mov_b32_e32 v1, s4
247
242
; GCN-NEXT: buffer_atomic_xor v1, v0, s[0:3], 0 idxen
248
- ; GCN-NEXT: .LBB4_2 :
243
+ ; GCN-NEXT: ; %bb.2 :
249
244
; GCN-NEXT: s_endpgm
250
245
.entry:
251
246
call i32 @llvm.amdgcn.struct.buffer.atomic.xor.i32 (i32 1 , <4 x i32 > %arg , i32 0 , i32 0 , i32 0 , i32 0 )
@@ -287,14 +282,13 @@ define amdgpu_cs void @atomic_xor_and_format(<4 x i32> inreg %arg) {
287
282
; GCN-NEXT: v_cmp_eq_u32_e32 vcc, 0, v0
288
283
; GCN-NEXT: ; implicit-def: $vgpr1
289
284
; GCN-NEXT: s_and_saveexec_b64 s[4:5], vcc
290
- ; GCN-NEXT: s_cbranch_execz .LBB5_2
291
285
; GCN-NEXT: ; %bb.1:
292
286
; GCN-NEXT: s_bcnt1_i32_b64 s6, s[6:7]
293
287
; GCN-NEXT: s_and_b32 s6, s6, 1
294
288
; GCN-NEXT: v_mov_b32_e32 v1, s6
295
289
; GCN-NEXT: v_mov_b32_e32 v2, 0
296
290
; GCN-NEXT: buffer_atomic_xor v1, v2, s[0:3], 0 idxen glc
297
- ; GCN-NEXT: .LBB5_2 :
291
+ ; GCN-NEXT: ; %bb.2 :
298
292
; GCN-NEXT: s_or_b64 exec, exec, s[4:5]
299
293
; GCN-NEXT: s_waitcnt vmcnt(0)
300
294
; GCN-NEXT: v_readfirstlane_b32 s4, v1
@@ -341,13 +335,12 @@ define amdgpu_cs void @atomic_ptr_add(ptr addrspace(8) inreg %arg) {
341
335
; GCN-NEXT: v_mbcnt_hi_u32_b32_e32 v0, s6, v0
342
336
; GCN-NEXT: v_cmp_eq_u32_e32 vcc, 0, v0
343
337
; GCN-NEXT: s_and_saveexec_b64 s[6:7], vcc
344
- ; GCN-NEXT: s_cbranch_execz .LBB6_2
345
338
; GCN-NEXT: ; %bb.1:
346
339
; GCN-NEXT: s_bcnt1_i32_b64 s4, s[4:5]
347
340
; GCN-NEXT: v_mov_b32_e32 v0, 0
348
341
; GCN-NEXT: v_mov_b32_e32 v1, s4
349
342
; GCN-NEXT: buffer_atomic_add v1, v0, s[0:3], 0 idxen
350
- ; GCN-NEXT: .LBB6_2 :
343
+ ; GCN-NEXT: ; %bb.2 :
351
344
; GCN-NEXT: s_endpgm
352
345
.entry:
353
346
call i32 @llvm.amdgcn.struct.ptr.buffer.atomic.add.i32 (i32 1 , ptr addrspace (8 ) %arg , i32 0 , i32 0 , i32 0 , i32 0 )
@@ -389,13 +382,12 @@ define amdgpu_cs void @atomic_ptr_add_and_format(ptr addrspace(8) inreg %arg) {
389
382
; GCN-NEXT: v_cmp_eq_u32_e32 vcc, 0, v0
390
383
; GCN-NEXT: ; implicit-def: $vgpr1
391
384
; GCN-NEXT: s_and_saveexec_b64 s[4:5], vcc
392
- ; GCN-NEXT: s_cbranch_execz .LBB7_2
393
385
; GCN-NEXT: ; %bb.1:
394
386
; GCN-NEXT: s_bcnt1_i32_b64 s6, s[6:7]
395
387
; GCN-NEXT: v_mov_b32_e32 v1, s6
396
388
; GCN-NEXT: v_mov_b32_e32 v2, 0
397
389
; GCN-NEXT: buffer_atomic_add v1, v2, s[0:3], 0 idxen glc
398
- ; GCN-NEXT: .LBB7_2 :
390
+ ; GCN-NEXT: ; %bb.2 :
399
391
; GCN-NEXT: s_or_b64 exec, exec, s[4:5]
400
392
; GCN-NEXT: s_waitcnt vmcnt(0)
401
393
; GCN-NEXT: v_readfirstlane_b32 s4, v1
@@ -443,13 +435,12 @@ define amdgpu_cs void @atomic_ptr_sub(ptr addrspace(8) inreg %arg) {
443
435
; GCN-NEXT: v_mbcnt_hi_u32_b32_e32 v0, s6, v0
444
436
; GCN-NEXT: v_cmp_eq_u32_e32 vcc, 0, v0
445
437
; GCN-NEXT: s_and_saveexec_b64 s[6:7], vcc
446
- ; GCN-NEXT: s_cbranch_execz .LBB8_2
447
438
; GCN-NEXT: ; %bb.1:
448
439
; GCN-NEXT: s_bcnt1_i32_b64 s4, s[4:5]
449
440
; GCN-NEXT: v_mov_b32_e32 v0, 0
450
441
; GCN-NEXT: v_mov_b32_e32 v1, s4
451
442
; GCN-NEXT: buffer_atomic_sub v1, v0, s[0:3], 0 idxen
452
- ; GCN-NEXT: .LBB8_2 :
443
+ ; GCN-NEXT: ; %bb.2 :
453
444
; GCN-NEXT: s_endpgm
454
445
.entry:
455
446
call i32 @llvm.amdgcn.struct.ptr.buffer.atomic.sub.i32 (i32 1 , ptr addrspace (8 ) %arg , i32 0 , i32 0 , i32 0 , i32 0 )
@@ -491,13 +482,12 @@ define amdgpu_cs void @atomic_ptr_sub_and_format(ptr addrspace(8) inreg %arg) {
491
482
; GCN-NEXT: v_cmp_eq_u32_e32 vcc, 0, v0
492
483
; GCN-NEXT: ; implicit-def: $vgpr1
493
484
; GCN-NEXT: s_and_saveexec_b64 s[4:5], vcc
494
- ; GCN-NEXT: s_cbranch_execz .LBB9_2
495
485
; GCN-NEXT: ; %bb.1:
496
486
; GCN-NEXT: s_bcnt1_i32_b64 s6, s[6:7]
497
487
; GCN-NEXT: v_mov_b32_e32 v1, s6
498
488
; GCN-NEXT: v_mov_b32_e32 v2, 0
499
489
; GCN-NEXT: buffer_atomic_sub v1, v2, s[0:3], 0 idxen glc
500
- ; GCN-NEXT: .LBB9_2 :
490
+ ; GCN-NEXT: ; %bb.2 :
501
491
; GCN-NEXT: s_or_b64 exec, exec, s[4:5]
502
492
; GCN-NEXT: s_waitcnt vmcnt(0)
503
493
; GCN-NEXT: v_readfirstlane_b32 s4, v1
@@ -546,14 +536,13 @@ define amdgpu_cs void @atomic_ptr_xor(ptr addrspace(8) inreg %arg) {
546
536
; GCN-NEXT: v_mbcnt_hi_u32_b32_e32 v0, s6, v0
547
537
; GCN-NEXT: v_cmp_eq_u32_e32 vcc, 0, v0
548
538
; GCN-NEXT: s_and_saveexec_b64 s[6:7], vcc
549
- ; GCN-NEXT: s_cbranch_execz .LBB10_2
550
539
; GCN-NEXT: ; %bb.1:
551
540
; GCN-NEXT: s_bcnt1_i32_b64 s4, s[4:5]
552
541
; GCN-NEXT: s_and_b32 s4, s4, 1
553
542
; GCN-NEXT: v_mov_b32_e32 v0, 0
554
543
; GCN-NEXT: v_mov_b32_e32 v1, s4
555
544
; GCN-NEXT: buffer_atomic_xor v1, v0, s[0:3], 0 idxen
556
- ; GCN-NEXT: .LBB10_2 :
545
+ ; GCN-NEXT: ; %bb.2 :
557
546
; GCN-NEXT: s_endpgm
558
547
.entry:
559
548
call i32 @llvm.amdgcn.struct.ptr.buffer.atomic.xor.i32 (i32 1 , ptr addrspace (8 ) %arg , i32 0 , i32 0 , i32 0 , i32 0 )
@@ -597,14 +586,13 @@ define amdgpu_cs void @atomic_ptr_xor_and_format(ptr addrspace(8) inreg %arg) {
597
586
; GCN-NEXT: v_cmp_eq_u32_e32 vcc, 0, v0
598
587
; GCN-NEXT: ; implicit-def: $vgpr1
599
588
; GCN-NEXT: s_and_saveexec_b64 s[4:5], vcc
600
- ; GCN-NEXT: s_cbranch_execz .LBB11_2
601
589
; GCN-NEXT: ; %bb.1:
602
590
; GCN-NEXT: s_bcnt1_i32_b64 s6, s[6:7]
603
591
; GCN-NEXT: s_and_b32 s6, s6, 1
604
592
; GCN-NEXT: v_mov_b32_e32 v1, s6
605
593
; GCN-NEXT: v_mov_b32_e32 v2, 0
606
594
; GCN-NEXT: buffer_atomic_xor v1, v2, s[0:3], 0 idxen glc
607
- ; GCN-NEXT: .LBB11_2 :
595
+ ; GCN-NEXT: ; %bb.2 :
608
596
; GCN-NEXT: s_or_b64 exec, exec, s[4:5]
609
597
; GCN-NEXT: s_waitcnt vmcnt(0)
610
598
; GCN-NEXT: v_readfirstlane_b32 s4, v1
0 commit comments