@@ -46,7 +46,7 @@ define void @test(ptr %dp0, ptr addrspace(1) %dp1, ptr addrspace(3) %dp3, bfloat
46
46
; CHECKPTX71-LABEL: test(
47
47
; CHECKPTX71: {
48
48
; CHECKPTX71-NEXT: .reg .pred %p<5>;
49
- ; CHECKPTX71-NEXT: .reg .b16 %rs<34 >;
49
+ ; CHECKPTX71-NEXT: .reg .b16 %rs<22 >;
50
50
; CHECKPTX71-NEXT: .reg .b32 %r<4>;
51
51
; CHECKPTX71-NEXT: .reg .f32 %f<12>;
52
52
; CHECKPTX71-EMPTY:
@@ -55,49 +55,49 @@ define void @test(ptr %dp0, ptr addrspace(1) %dp1, ptr addrspace(3) %dp3, bfloat
55
55
; CHECKPTX71-NEXT: ld.param.u32 %r3, [test_param_2];
56
56
; CHECKPTX71-NEXT: ld.param.u32 %r2, [test_param_1];
57
57
; CHECKPTX71-NEXT: ld.param.u32 %r1, [test_param_0];
58
- ; CHECKPTX71-NEXT: ld.b16 %rs30 , [%r1];
58
+ ; CHECKPTX71-NEXT: ld.b16 %rs18 , [%r1];
59
59
; CHECKPTX71-NEXT: cvt.f32.bf16 %f1, %rs13;
60
60
; CHECKPTX71-NEXT: $L__BB0_1: // %atomicrmw.start14
61
61
; CHECKPTX71-NEXT: // =>This Inner Loop Header: Depth=1
62
- ; CHECKPTX71-NEXT: cvt.f32.bf16 %f2, %rs30 ;
62
+ ; CHECKPTX71-NEXT: cvt.f32.bf16 %f2, %rs18 ;
63
63
; CHECKPTX71-NEXT: add.rn.f32 %f3, %f2, %f1;
64
64
; CHECKPTX71-NEXT: cvt.rn.bf16.f32 %rs14, %f3;
65
- ; CHECKPTX71-NEXT: atom.cas.b16 %rs17 , [%r1], %rs30 , %rs14;
66
- ; CHECKPTX71-NEXT: setp.ne.s16 %p1, %rs17 , %rs30 ;
67
- ; CHECKPTX71-NEXT: mov.u16 %rs30 , %rs17 ;
65
+ ; CHECKPTX71-NEXT: atom.cas.b16 %rs3 , [%r1], %rs18 , %rs14;
66
+ ; CHECKPTX71-NEXT: setp.ne.s16 %p1, %rs3 , %rs18 ;
67
+ ; CHECKPTX71-NEXT: mov.u16 %rs18 , %rs3 ;
68
68
; CHECKPTX71-NEXT: @%p1 bra $L__BB0_1;
69
69
; CHECKPTX71-NEXT: // %bb.2: // %atomicrmw.end13
70
- ; CHECKPTX71-NEXT: ld.b16 %rs31 , [%r1];
70
+ ; CHECKPTX71-NEXT: ld.b16 %rs19 , [%r1];
71
71
; CHECKPTX71-NEXT: $L__BB0_3: // %atomicrmw.start8
72
72
; CHECKPTX71-NEXT: // =>This Inner Loop Header: Depth=1
73
- ; CHECKPTX71-NEXT: cvt.f32.bf16 %f4, %rs31 ;
73
+ ; CHECKPTX71-NEXT: cvt.f32.bf16 %f4, %rs19 ;
74
74
; CHECKPTX71-NEXT: add.rn.f32 %f5, %f4, 0f3F800000;
75
- ; CHECKPTX71-NEXT: cvt.rn.bf16.f32 %rs18 , %f5;
76
- ; CHECKPTX71-NEXT: atom.cas.b16 %rs21 , [%r1], %rs31 , %rs18 ;
77
- ; CHECKPTX71-NEXT: setp.ne.s16 %p2, %rs21 , %rs31 ;
78
- ; CHECKPTX71-NEXT: mov.u16 %rs31 , %rs21 ;
75
+ ; CHECKPTX71-NEXT: cvt.rn.bf16.f32 %rs15 , %f5;
76
+ ; CHECKPTX71-NEXT: atom.cas.b16 %rs6 , [%r1], %rs19 , %rs15 ;
77
+ ; CHECKPTX71-NEXT: setp.ne.s16 %p2, %rs6 , %rs19 ;
78
+ ; CHECKPTX71-NEXT: mov.u16 %rs19 , %rs6 ;
79
79
; CHECKPTX71-NEXT: @%p2 bra $L__BB0_3;
80
80
; CHECKPTX71-NEXT: // %bb.4: // %atomicrmw.end7
81
- ; CHECKPTX71-NEXT: ld.global.b16 %rs32 , [%r2];
81
+ ; CHECKPTX71-NEXT: ld.global.b16 %rs20 , [%r2];
82
82
; CHECKPTX71-NEXT: $L__BB0_5: // %atomicrmw.start2
83
83
; CHECKPTX71-NEXT: // =>This Inner Loop Header: Depth=1
84
- ; CHECKPTX71-NEXT: cvt.f32.bf16 %f7, %rs32 ;
84
+ ; CHECKPTX71-NEXT: cvt.f32.bf16 %f7, %rs20 ;
85
85
; CHECKPTX71-NEXT: add.rn.f32 %f8, %f7, %f1;
86
- ; CHECKPTX71-NEXT: cvt.rn.bf16.f32 %rs22 , %f8;
87
- ; CHECKPTX71-NEXT: atom.global.cas.b16 %rs25 , [%r2], %rs32 , %rs22 ;
88
- ; CHECKPTX71-NEXT: setp.ne.s16 %p3, %rs25 , %rs32 ;
89
- ; CHECKPTX71-NEXT: mov.u16 %rs32 , %rs25 ;
86
+ ; CHECKPTX71-NEXT: cvt.rn.bf16.f32 %rs16 , %f8;
87
+ ; CHECKPTX71-NEXT: atom.global.cas.b16 %rs9 , [%r2], %rs20 , %rs16 ;
88
+ ; CHECKPTX71-NEXT: setp.ne.s16 %p3, %rs9 , %rs20 ;
89
+ ; CHECKPTX71-NEXT: mov.u16 %rs20 , %rs9 ;
90
90
; CHECKPTX71-NEXT: @%p3 bra $L__BB0_5;
91
91
; CHECKPTX71-NEXT: // %bb.6: // %atomicrmw.end1
92
- ; CHECKPTX71-NEXT: ld.shared.b16 %rs33 , [%r3];
92
+ ; CHECKPTX71-NEXT: ld.shared.b16 %rs21 , [%r3];
93
93
; CHECKPTX71-NEXT: $L__BB0_7: // %atomicrmw.start
94
94
; CHECKPTX71-NEXT: // =>This Inner Loop Header: Depth=1
95
- ; CHECKPTX71-NEXT: cvt.f32.bf16 %f10, %rs33 ;
95
+ ; CHECKPTX71-NEXT: cvt.f32.bf16 %f10, %rs21 ;
96
96
; CHECKPTX71-NEXT: add.rn.f32 %f11, %f10, %f1;
97
- ; CHECKPTX71-NEXT: cvt.rn.bf16.f32 %rs26 , %f11;
98
- ; CHECKPTX71-NEXT: atom.shared.cas.b16 %rs29 , [%r3], %rs33 , %rs26 ;
99
- ; CHECKPTX71-NEXT: setp.ne.s16 %p4, %rs29 , %rs33 ;
100
- ; CHECKPTX71-NEXT: mov.u16 %rs33 , %rs29 ;
97
+ ; CHECKPTX71-NEXT: cvt.rn.bf16.f32 %rs17 , %f11;
98
+ ; CHECKPTX71-NEXT: atom.shared.cas.b16 %rs12 , [%r3], %rs21 , %rs17 ;
99
+ ; CHECKPTX71-NEXT: setp.ne.s16 %p4, %rs12 , %rs21 ;
100
+ ; CHECKPTX71-NEXT: mov.u16 %rs21 , %rs12 ;
101
101
; CHECKPTX71-NEXT: @%p4 bra $L__BB0_7;
102
102
; CHECKPTX71-NEXT: // %bb.8: // %atomicrmw.end
103
103
; CHECKPTX71-NEXT: ret;
0 commit comments