@@ -45,36 +45,36 @@ define half @fh(ptr %p) {
45
45
; ENABLED-LABEL: fh(
46
46
; ENABLED: {
47
47
; ENABLED-NEXT: .reg .b16 %rs<10>;
48
- ; ENABLED-NEXT: .reg .b32 %f <13>;
48
+ ; ENABLED-NEXT: .reg .b32 %r <13>;
49
49
; ENABLED-NEXT: .reg .b64 %rd<2>;
50
50
; ENABLED-EMPTY:
51
51
; ENABLED-NEXT: // %bb.0:
52
52
; ENABLED-NEXT: ld.param.b64 %rd1, [fh_param_0];
53
53
; ENABLED-NEXT: ld.v4.b16 {%rs1, %rs2, %rs3, %rs4}, [%rd1];
54
54
; ENABLED-NEXT: ld.b16 %rs5, [%rd1+8];
55
- ; ENABLED-NEXT: cvt.f32.f16 %f1 , %rs2;
56
- ; ENABLED-NEXT: cvt.f32.f16 %f2 , %rs1;
57
- ; ENABLED-NEXT: add.rn.f32 %f3 , %f2 , %f1 ;
58
- ; ENABLED-NEXT: cvt.rn.f16.f32 %rs6, %f3 ;
59
- ; ENABLED-NEXT: cvt.f32.f16 %f4 , %rs4;
60
- ; ENABLED-NEXT: cvt.f32.f16 %f5 , %rs3;
61
- ; ENABLED-NEXT: add.rn.f32 %f6 , %f5 , %f4 ;
62
- ; ENABLED-NEXT: cvt.rn.f16.f32 %rs7, %f6 ;
63
- ; ENABLED-NEXT: cvt.f32.f16 %f7 , %rs7;
64
- ; ENABLED-NEXT: cvt.f32.f16 %f8 , %rs6;
65
- ; ENABLED-NEXT: add.rn.f32 %f9 , %f8 , %f7 ;
66
- ; ENABLED-NEXT: cvt.rn.f16.f32 %rs8, %f9 ;
67
- ; ENABLED-NEXT: cvt.f32.f16 %f10 , %rs8;
68
- ; ENABLED-NEXT: cvt.f32.f16 %f11 , %rs5;
69
- ; ENABLED-NEXT: add.rn.f32 %f12 , %f10 , %f11 ;
70
- ; ENABLED-NEXT: cvt.rn.f16.f32 %rs9, %f12 ;
55
+ ; ENABLED-NEXT: cvt.f32.f16 %r1 , %rs2;
56
+ ; ENABLED-NEXT: cvt.f32.f16 %r2 , %rs1;
57
+ ; ENABLED-NEXT: add.rn.f32 %r3 , %r2 , %r1 ;
58
+ ; ENABLED-NEXT: cvt.rn.f16.f32 %rs6, %r3 ;
59
+ ; ENABLED-NEXT: cvt.f32.f16 %r4 , %rs4;
60
+ ; ENABLED-NEXT: cvt.f32.f16 %r5 , %rs3;
61
+ ; ENABLED-NEXT: add.rn.f32 %r6 , %r5 , %r4 ;
62
+ ; ENABLED-NEXT: cvt.rn.f16.f32 %rs7, %r6 ;
63
+ ; ENABLED-NEXT: cvt.f32.f16 %r7 , %rs7;
64
+ ; ENABLED-NEXT: cvt.f32.f16 %r8 , %rs6;
65
+ ; ENABLED-NEXT: add.rn.f32 %r9 , %r8 , %r7 ;
66
+ ; ENABLED-NEXT: cvt.rn.f16.f32 %rs8, %r9 ;
67
+ ; ENABLED-NEXT: cvt.f32.f16 %r10 , %rs8;
68
+ ; ENABLED-NEXT: cvt.f32.f16 %r11 , %rs5;
69
+ ; ENABLED-NEXT: add.rn.f32 %r12 , %r10 , %r11 ;
70
+ ; ENABLED-NEXT: cvt.rn.f16.f32 %rs9, %r12 ;
71
71
; ENABLED-NEXT: st.param.b16 [func_retval0], %rs9;
72
72
; ENABLED-NEXT: ret;
73
73
;
74
74
; DISABLED-LABEL: fh(
75
75
; DISABLED: {
76
76
; DISABLED-NEXT: .reg .b16 %rs<10>;
77
- ; DISABLED-NEXT: .reg .b32 %f <13>;
77
+ ; DISABLED-NEXT: .reg .b32 %r <13>;
78
78
; DISABLED-NEXT: .reg .b64 %rd<2>;
79
79
; DISABLED-EMPTY:
80
80
; DISABLED-NEXT: // %bb.0:
@@ -84,22 +84,22 @@ define half @fh(ptr %p) {
84
84
; DISABLED-NEXT: ld.b16 %rs3, [%rd1+4];
85
85
; DISABLED-NEXT: ld.b16 %rs4, [%rd1+6];
86
86
; DISABLED-NEXT: ld.b16 %rs5, [%rd1+8];
87
- ; DISABLED-NEXT: cvt.f32.f16 %f1 , %rs2;
88
- ; DISABLED-NEXT: cvt.f32.f16 %f2 , %rs1;
89
- ; DISABLED-NEXT: add.rn.f32 %f3 , %f2 , %f1 ;
90
- ; DISABLED-NEXT: cvt.rn.f16.f32 %rs6, %f3 ;
91
- ; DISABLED-NEXT: cvt.f32.f16 %f4 , %rs4;
92
- ; DISABLED-NEXT: cvt.f32.f16 %f5 , %rs3;
93
- ; DISABLED-NEXT: add.rn.f32 %f6 , %f5 , %f4 ;
94
- ; DISABLED-NEXT: cvt.rn.f16.f32 %rs7, %f6 ;
95
- ; DISABLED-NEXT: cvt.f32.f16 %f7 , %rs7;
96
- ; DISABLED-NEXT: cvt.f32.f16 %f8 , %rs6;
97
- ; DISABLED-NEXT: add.rn.f32 %f9 , %f8 , %f7 ;
98
- ; DISABLED-NEXT: cvt.rn.f16.f32 %rs8, %f9 ;
99
- ; DISABLED-NEXT: cvt.f32.f16 %f10 , %rs8;
100
- ; DISABLED-NEXT: cvt.f32.f16 %f11 , %rs5;
101
- ; DISABLED-NEXT: add.rn.f32 %f12 , %f10 , %f11 ;
102
- ; DISABLED-NEXT: cvt.rn.f16.f32 %rs9, %f12 ;
87
+ ; DISABLED-NEXT: cvt.f32.f16 %r1 , %rs2;
88
+ ; DISABLED-NEXT: cvt.f32.f16 %r2 , %rs1;
89
+ ; DISABLED-NEXT: add.rn.f32 %r3 , %r2 , %r1 ;
90
+ ; DISABLED-NEXT: cvt.rn.f16.f32 %rs6, %r3 ;
91
+ ; DISABLED-NEXT: cvt.f32.f16 %r4 , %rs4;
92
+ ; DISABLED-NEXT: cvt.f32.f16 %r5 , %rs3;
93
+ ; DISABLED-NEXT: add.rn.f32 %r6 , %r5 , %r4 ;
94
+ ; DISABLED-NEXT: cvt.rn.f16.f32 %rs7, %r6 ;
95
+ ; DISABLED-NEXT: cvt.f32.f16 %r7 , %rs7;
96
+ ; DISABLED-NEXT: cvt.f32.f16 %r8 , %rs6;
97
+ ; DISABLED-NEXT: add.rn.f32 %r9 , %r8 , %r7 ;
98
+ ; DISABLED-NEXT: cvt.rn.f16.f32 %rs8, %r9 ;
99
+ ; DISABLED-NEXT: cvt.f32.f16 %r10 , %rs8;
100
+ ; DISABLED-NEXT: cvt.f32.f16 %r11 , %rs5;
101
+ ; DISABLED-NEXT: add.rn.f32 %r12 , %r10 , %r11 ;
102
+ ; DISABLED-NEXT: cvt.rn.f16.f32 %rs9, %r12 ;
103
103
; DISABLED-NEXT: st.param.b16 [func_retval0], %rs9;
104
104
; DISABLED-NEXT: ret;
105
105
%p.1 = getelementptr half , ptr %p , i32 1
@@ -121,37 +121,37 @@ define half @fh(ptr %p) {
121
121
define float @ff (ptr %p ) {
122
122
; ENABLED-LABEL: ff(
123
123
; ENABLED: {
124
- ; ENABLED-NEXT: .reg .b32 %f <10>;
124
+ ; ENABLED-NEXT: .reg .b32 %r <10>;
125
125
; ENABLED-NEXT: .reg .b64 %rd<2>;
126
126
; ENABLED-EMPTY:
127
127
; ENABLED-NEXT: // %bb.0:
128
128
; ENABLED-NEXT: ld.param.b64 %rd1, [ff_param_0];
129
- ; ENABLED-NEXT: ld.v4.b32 {%f1 , %f2 , %f3 , %f4 }, [%rd1];
130
- ; ENABLED-NEXT: ld.b32 %f5 , [%rd1+16];
131
- ; ENABLED-NEXT: add.rn.f32 %f6 , %f1 , %f2 ;
132
- ; ENABLED-NEXT: add.rn.f32 %f7 , %f3 , %f4 ;
133
- ; ENABLED-NEXT: add.rn.f32 %f8 , %f6 , %f7 ;
134
- ; ENABLED-NEXT: add.rn.f32 %f9 , %f8 , %f5 ;
135
- ; ENABLED-NEXT: st.param.b32 [func_retval0], %f9 ;
129
+ ; ENABLED-NEXT: ld.v4.b32 {%r1 , %r2 , %r3 , %r4 }, [%rd1];
130
+ ; ENABLED-NEXT: ld.b32 %r5 , [%rd1+16];
131
+ ; ENABLED-NEXT: add.rn.f32 %r6 , %r1 , %r2 ;
132
+ ; ENABLED-NEXT: add.rn.f32 %r7 , %r3 , %r4 ;
133
+ ; ENABLED-NEXT: add.rn.f32 %r8 , %r6 , %r7 ;
134
+ ; ENABLED-NEXT: add.rn.f32 %r9 , %r8 , %r5 ;
135
+ ; ENABLED-NEXT: st.param.b32 [func_retval0], %r9 ;
136
136
; ENABLED-NEXT: ret;
137
137
;
138
138
; DISABLED-LABEL: ff(
139
139
; DISABLED: {
140
- ; DISABLED-NEXT: .reg .b32 %f <10>;
140
+ ; DISABLED-NEXT: .reg .b32 %r <10>;
141
141
; DISABLED-NEXT: .reg .b64 %rd<2>;
142
142
; DISABLED-EMPTY:
143
143
; DISABLED-NEXT: // %bb.0:
144
144
; DISABLED-NEXT: ld.param.b64 %rd1, [ff_param_0];
145
- ; DISABLED-NEXT: ld.b32 %f1 , [%rd1];
146
- ; DISABLED-NEXT: ld.b32 %f2 , [%rd1+4];
147
- ; DISABLED-NEXT: ld.b32 %f3 , [%rd1+8];
148
- ; DISABLED-NEXT: ld.b32 %f4 , [%rd1+12];
149
- ; DISABLED-NEXT: ld.b32 %f5 , [%rd1+16];
150
- ; DISABLED-NEXT: add.rn.f32 %f6 , %f1 , %f2 ;
151
- ; DISABLED-NEXT: add.rn.f32 %f7 , %f3 , %f4 ;
152
- ; DISABLED-NEXT: add.rn.f32 %f8 , %f6 , %f7 ;
153
- ; DISABLED-NEXT: add.rn.f32 %f9 , %f8 , %f5 ;
154
- ; DISABLED-NEXT: st.param.b32 [func_retval0], %f9 ;
145
+ ; DISABLED-NEXT: ld.b32 %r1 , [%rd1];
146
+ ; DISABLED-NEXT: ld.b32 %r2 , [%rd1+4];
147
+ ; DISABLED-NEXT: ld.b32 %r3 , [%rd1+8];
148
+ ; DISABLED-NEXT: ld.b32 %r4 , [%rd1+12];
149
+ ; DISABLED-NEXT: ld.b32 %r5 , [%rd1+16];
150
+ ; DISABLED-NEXT: add.rn.f32 %r6 , %r1 , %r2 ;
151
+ ; DISABLED-NEXT: add.rn.f32 %r7 , %r3 , %r4 ;
152
+ ; DISABLED-NEXT: add.rn.f32 %r8 , %r6 , %r7 ;
153
+ ; DISABLED-NEXT: add.rn.f32 %r9 , %r8 , %r5 ;
154
+ ; DISABLED-NEXT: st.param.b32 [func_retval0], %r9 ;
155
155
; DISABLED-NEXT: ret;
156
156
%p.1 = getelementptr float , ptr %p , i32 1
157
157
%p.2 = getelementptr float , ptr %p , i32 2
0 commit comments