@@ -126,14 +126,13 @@ define <2 x float> @v_pow_v2f32(<2 x float> %x, <2 x float> %y) {
126
126
; GFX6-LABEL: v_pow_v2f32:
127
127
; GFX6: ; %bb.0:
128
128
; GFX6-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
129
- ; GFX6-NEXT: s_mov_b32 s4, 0x800000
130
- ; GFX6-NEXT: v_mov_b32_e32 v4, 0x4f800000
131
- ; GFX6-NEXT: v_cmp_gt_f32_e32 vcc, s4, v0
132
- ; GFX6-NEXT: v_cndmask_b32_e32 v5, 1.0, v4, vcc
133
- ; GFX6-NEXT: v_mul_f32_e32 v0, v0, v5
134
- ; GFX6-NEXT: v_mov_b32_e32 v5, 0x800000
135
- ; GFX6-NEXT: v_cmp_lt_f32_e64 s[4:5], v1, v5
136
- ; GFX6-NEXT: v_cndmask_b32_e64 v4, 1.0, v4, s[4:5]
129
+ ; GFX6-NEXT: v_mov_b32_e32 v4, 0x800000
130
+ ; GFX6-NEXT: v_mov_b32_e32 v5, 0x4f800000
131
+ ; GFX6-NEXT: v_cmp_lt_f32_e32 vcc, v0, v4
132
+ ; GFX6-NEXT: v_cndmask_b32_e32 v6, 1.0, v5, vcc
133
+ ; GFX6-NEXT: v_cmp_lt_f32_e64 s[4:5], v1, v4
134
+ ; GFX6-NEXT: v_mul_f32_e32 v0, v0, v6
135
+ ; GFX6-NEXT: v_cndmask_b32_e64 v4, 1.0, v5, s[4:5]
137
136
; GFX6-NEXT: v_log_f32_e32 v0, v0
138
137
; GFX6-NEXT: v_mul_f32_e32 v1, v1, v4
139
138
; GFX6-NEXT: v_log_f32_e32 v1, v1
@@ -142,15 +141,15 @@ define <2 x float> @v_pow_v2f32(<2 x float> %x, <2 x float> %y) {
142
141
; GFX6-NEXT: v_sub_f32_e32 v0, v0, v7
143
142
; GFX6-NEXT: v_cndmask_b32_e64 v5, 0, v6, s[4:5]
144
143
; GFX6-NEXT: v_mul_legacy_f32_e32 v0, v0, v2
145
- ; GFX6-NEXT: s_mov_b32 s6 , 0xc2fc0000
144
+ ; GFX6-NEXT: v_mov_b32_e32 v2 , 0xc2fc0000
146
145
; GFX6-NEXT: v_sub_f32_e32 v1, v1, v5
147
- ; GFX6-NEXT: v_mov_b32_e32 v2 , 0x42800000
148
- ; GFX6-NEXT: v_cmp_gt_f32_e32 vcc, s6, v0
146
+ ; GFX6-NEXT: v_mov_b32_e32 v7 , 0x42800000
147
+ ; GFX6-NEXT: v_cmp_lt_f32_e32 vcc, v0, v2
149
148
; GFX6-NEXT: v_mul_legacy_f32_e32 v1, v1, v3
150
- ; GFX6-NEXT: v_cndmask_b32_e32 v7 , 0, v2 , vcc
151
- ; GFX6-NEXT: v_cmp_gt_f32_e64 s[4:5], s6, v1
152
- ; GFX6-NEXT: v_add_f32_e32 v0, v0, v7
153
- ; GFX6-NEXT: v_cndmask_b32_e64 v2, 0, v2 , s[4:5]
149
+ ; GFX6-NEXT: v_cndmask_b32_e32 v8 , 0, v7 , vcc
150
+ ; GFX6-NEXT: v_cmp_lt_f32_e64 s[4:5], v1, v2
151
+ ; GFX6-NEXT: v_add_f32_e32 v0, v0, v8
152
+ ; GFX6-NEXT: v_cndmask_b32_e64 v2, 0, v7 , s[4:5]
154
153
; GFX6-NEXT: v_exp_f32_e32 v0, v0
155
154
; GFX6-NEXT: v_add_f32_e32 v1, v1, v2
156
155
; GFX6-NEXT: v_exp_f32_e32 v1, v1
@@ -164,14 +163,13 @@ define <2 x float> @v_pow_v2f32(<2 x float> %x, <2 x float> %y) {
164
163
; GFX8-LABEL: v_pow_v2f32:
165
164
; GFX8: ; %bb.0:
166
165
; GFX8-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
167
- ; GFX8-NEXT: s_mov_b32 s4, 0x800000
168
- ; GFX8-NEXT: v_mov_b32_e32 v4, 0x4f800000
169
- ; GFX8-NEXT: v_cmp_gt_f32_e32 vcc, s4, v0
170
- ; GFX8-NEXT: v_cndmask_b32_e32 v5, 1.0, v4, vcc
171
- ; GFX8-NEXT: v_mul_f32_e32 v0, v0, v5
172
- ; GFX8-NEXT: v_mov_b32_e32 v5, 0x800000
173
- ; GFX8-NEXT: v_cmp_lt_f32_e64 s[4:5], v1, v5
174
- ; GFX8-NEXT: v_cndmask_b32_e64 v4, 1.0, v4, s[4:5]
166
+ ; GFX8-NEXT: v_mov_b32_e32 v4, 0x800000
167
+ ; GFX8-NEXT: v_mov_b32_e32 v5, 0x4f800000
168
+ ; GFX8-NEXT: v_cmp_lt_f32_e32 vcc, v0, v4
169
+ ; GFX8-NEXT: v_cndmask_b32_e32 v6, 1.0, v5, vcc
170
+ ; GFX8-NEXT: v_cmp_lt_f32_e64 s[4:5], v1, v4
171
+ ; GFX8-NEXT: v_mul_f32_e32 v0, v0, v6
172
+ ; GFX8-NEXT: v_cndmask_b32_e64 v4, 1.0, v5, s[4:5]
175
173
; GFX8-NEXT: v_log_f32_e32 v0, v0
176
174
; GFX8-NEXT: v_mul_f32_e32 v1, v1, v4
177
175
; GFX8-NEXT: v_log_f32_e32 v1, v1
@@ -180,15 +178,15 @@ define <2 x float> @v_pow_v2f32(<2 x float> %x, <2 x float> %y) {
180
178
; GFX8-NEXT: v_sub_f32_e32 v0, v0, v7
181
179
; GFX8-NEXT: v_cndmask_b32_e64 v5, 0, v6, s[4:5]
182
180
; GFX8-NEXT: v_mul_legacy_f32_e32 v0, v0, v2
183
- ; GFX8-NEXT: s_mov_b32 s6 , 0xc2fc0000
181
+ ; GFX8-NEXT: v_mov_b32_e32 v2 , 0xc2fc0000
184
182
; GFX8-NEXT: v_sub_f32_e32 v1, v1, v5
185
- ; GFX8-NEXT: v_mov_b32_e32 v2 , 0x42800000
186
- ; GFX8-NEXT: v_cmp_gt_f32_e32 vcc, s6, v0
183
+ ; GFX8-NEXT: v_mov_b32_e32 v7 , 0x42800000
184
+ ; GFX8-NEXT: v_cmp_lt_f32_e32 vcc, v0, v2
187
185
; GFX8-NEXT: v_mul_legacy_f32_e32 v1, v1, v3
188
- ; GFX8-NEXT: v_cndmask_b32_e32 v7 , 0, v2 , vcc
189
- ; GFX8-NEXT: v_cmp_gt_f32_e64 s[4:5], s6, v1
190
- ; GFX8-NEXT: v_add_f32_e32 v0, v0, v7
191
- ; GFX8-NEXT: v_cndmask_b32_e64 v2, 0, v2 , s[4:5]
186
+ ; GFX8-NEXT: v_cndmask_b32_e32 v8 , 0, v7 , vcc
187
+ ; GFX8-NEXT: v_cmp_lt_f32_e64 s[4:5], v1, v2
188
+ ; GFX8-NEXT: v_add_f32_e32 v0, v0, v8
189
+ ; GFX8-NEXT: v_cndmask_b32_e64 v2, 0, v7 , s[4:5]
192
190
; GFX8-NEXT: v_exp_f32_e32 v0, v0
193
191
; GFX8-NEXT: v_add_f32_e32 v1, v1, v2
194
192
; GFX8-NEXT: v_exp_f32_e32 v1, v1
@@ -202,14 +200,13 @@ define <2 x float> @v_pow_v2f32(<2 x float> %x, <2 x float> %y) {
202
200
; GFX9-LABEL: v_pow_v2f32:
203
201
; GFX9: ; %bb.0:
204
202
; GFX9-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
205
- ; GFX9-NEXT: s_mov_b32 s4, 0x800000
206
- ; GFX9-NEXT: v_mov_b32_e32 v4, 0x4f800000
207
- ; GFX9-NEXT: v_cmp_gt_f32_e32 vcc, s4, v0
208
- ; GFX9-NEXT: v_cndmask_b32_e32 v5, 1.0, v4, vcc
209
- ; GFX9-NEXT: v_mul_f32_e32 v0, v0, v5
210
- ; GFX9-NEXT: v_mov_b32_e32 v5, 0x800000
211
- ; GFX9-NEXT: v_cmp_lt_f32_e64 s[4:5], v1, v5
212
- ; GFX9-NEXT: v_cndmask_b32_e64 v4, 1.0, v4, s[4:5]
203
+ ; GFX9-NEXT: v_mov_b32_e32 v4, 0x800000
204
+ ; GFX9-NEXT: v_mov_b32_e32 v5, 0x4f800000
205
+ ; GFX9-NEXT: v_cmp_lt_f32_e32 vcc, v0, v4
206
+ ; GFX9-NEXT: v_cndmask_b32_e32 v6, 1.0, v5, vcc
207
+ ; GFX9-NEXT: v_cmp_lt_f32_e64 s[4:5], v1, v4
208
+ ; GFX9-NEXT: v_mul_f32_e32 v0, v0, v6
209
+ ; GFX9-NEXT: v_cndmask_b32_e64 v4, 1.0, v5, s[4:5]
213
210
; GFX9-NEXT: v_log_f32_e32 v0, v0
214
211
; GFX9-NEXT: v_mul_f32_e32 v1, v1, v4
215
212
; GFX9-NEXT: v_log_f32_e32 v1, v1
@@ -218,15 +215,15 @@ define <2 x float> @v_pow_v2f32(<2 x float> %x, <2 x float> %y) {
218
215
; GFX9-NEXT: v_sub_f32_e32 v0, v0, v7
219
216
; GFX9-NEXT: v_cndmask_b32_e64 v5, 0, v6, s[4:5]
220
217
; GFX9-NEXT: v_mul_legacy_f32_e32 v0, v0, v2
221
- ; GFX9-NEXT: s_mov_b32 s6 , 0xc2fc0000
218
+ ; GFX9-NEXT: v_mov_b32_e32 v2 , 0xc2fc0000
222
219
; GFX9-NEXT: v_sub_f32_e32 v1, v1, v5
223
- ; GFX9-NEXT: v_mov_b32_e32 v2 , 0x42800000
224
- ; GFX9-NEXT: v_cmp_gt_f32_e32 vcc, s6, v0
220
+ ; GFX9-NEXT: v_mov_b32_e32 v7 , 0x42800000
221
+ ; GFX9-NEXT: v_cmp_lt_f32_e32 vcc, v0, v2
225
222
; GFX9-NEXT: v_mul_legacy_f32_e32 v1, v1, v3
226
- ; GFX9-NEXT: v_cndmask_b32_e32 v7 , 0, v2 , vcc
227
- ; GFX9-NEXT: v_cmp_gt_f32_e64 s[4:5], s6, v1
228
- ; GFX9-NEXT: v_add_f32_e32 v0, v0, v7
229
- ; GFX9-NEXT: v_cndmask_b32_e64 v2, 0, v2 , s[4:5]
223
+ ; GFX9-NEXT: v_cndmask_b32_e32 v8 , 0, v7 , vcc
224
+ ; GFX9-NEXT: v_cmp_lt_f32_e64 s[4:5], v1, v2
225
+ ; GFX9-NEXT: v_add_f32_e32 v0, v0, v8
226
+ ; GFX9-NEXT: v_cndmask_b32_e64 v2, 0, v7 , s[4:5]
230
227
; GFX9-NEXT: v_exp_f32_e32 v0, v0
231
228
; GFX9-NEXT: v_add_f32_e32 v1, v1, v2
232
229
; GFX9-NEXT: v_exp_f32_e32 v1, v1
@@ -382,25 +379,25 @@ define <2 x half> @v_pow_v2f16(<2 x half> %x, <2 x half> %y) {
382
379
; GFX6-NEXT: v_cvt_f32_f16_e32 v0, v0
383
380
; GFX6-NEXT: v_cvt_f32_f16_e32 v2, v2
384
381
; GFX6-NEXT: v_cvt_f32_f16_e32 v1, v1
385
- ; GFX6-NEXT: s_mov_b32 s4 , 0xc2fc0000
382
+ ; GFX6-NEXT: v_mov_b32_e32 v4 , 0xc2fc0000
386
383
; GFX6-NEXT: v_log_f32_e32 v0, v0
387
- ; GFX6-NEXT: v_mov_b32_e32 v4 , 0x42800000
384
+ ; GFX6-NEXT: v_mov_b32_e32 v5 , 0x42800000
388
385
; GFX6-NEXT: v_log_f32_e32 v1, v1
389
386
; GFX6-NEXT: v_mul_legacy_f32_e32 v0, v0, v2
390
- ; GFX6-NEXT: v_cmp_gt_f32_e32 vcc, s4, v0
391
- ; GFX6-NEXT: v_cndmask_b32_e32 v2, 0, v4 , vcc
387
+ ; GFX6-NEXT: v_cmp_lt_f32_e32 vcc, v0, v4
388
+ ; GFX6-NEXT: v_cndmask_b32_e32 v2, 0, v5 , vcc
392
389
; GFX6-NEXT: v_add_f32_e32 v0, v0, v2
393
390
; GFX6-NEXT: v_cvt_f32_f16_e32 v2, v3
394
391
; GFX6-NEXT: v_mov_b32_e32 v3, 0x1f800000
395
- ; GFX6-NEXT: v_cndmask_b32_e32 v5 , 1.0, v3, vcc
392
+ ; GFX6-NEXT: v_cndmask_b32_e32 v6 , 1.0, v3, vcc
396
393
; GFX6-NEXT: v_exp_f32_e32 v0, v0
397
394
; GFX6-NEXT: v_mul_legacy_f32_e32 v1, v1, v2
398
- ; GFX6-NEXT: v_cmp_gt_f32_e32 vcc, s4, v1
399
- ; GFX6-NEXT: v_cndmask_b32_e32 v2, 0, v4 , vcc
395
+ ; GFX6-NEXT: v_cmp_lt_f32_e32 vcc, v1, v4
396
+ ; GFX6-NEXT: v_cndmask_b32_e32 v2, 0, v5 , vcc
400
397
; GFX6-NEXT: v_add_f32_e32 v1, v1, v2
401
398
; GFX6-NEXT: v_exp_f32_e32 v1, v1
402
399
; GFX6-NEXT: v_cndmask_b32_e32 v2, 1.0, v3, vcc
403
- ; GFX6-NEXT: v_mul_f32_e32 v0, v0, v5
400
+ ; GFX6-NEXT: v_mul_f32_e32 v0, v0, v6
404
401
; GFX6-NEXT: v_cvt_f16_f32_e32 v0, v0
405
402
; GFX6-NEXT: v_mul_f32_e32 v1, v1, v2
406
403
; GFX6-NEXT: v_cvt_f16_f32_e32 v1, v1
@@ -505,22 +502,22 @@ define <2 x half> @v_pow_v2f16_fneg_lhs(<2 x half> %x, <2 x half> %y) {
505
502
; GFX6-NEXT: v_log_f32_e32 v1, v1
506
503
; GFX6-NEXT: v_cvt_f32_f16_e32 v3, v3
507
504
; GFX6-NEXT: v_log_f32_e32 v0, v0
508
- ; GFX6-NEXT: s_mov_b32 s4, 0xc2fc0000
505
+ ; GFX6-NEXT: v_mov_b32_e32 v4, 0x42800000
509
506
; GFX6-NEXT: v_mul_legacy_f32_e32 v1, v1, v2
510
- ; GFX6-NEXT: v_mov_b32_e32 v2, 0x42800000
511
- ; GFX6-NEXT: v_cmp_gt_f32_e32 vcc, s4, v1
512
- ; GFX6-NEXT: v_cndmask_b32_e32 v4 , 0, v2 , vcc
513
- ; GFX6-NEXT: v_add_f32_e32 v1, v1, v4
514
- ; GFX6-NEXT: v_mov_b32_e32 v4 , 0x1f800000
507
+ ; GFX6-NEXT: v_mov_b32_e32 v2, 0xc2fc0000
508
+ ; GFX6-NEXT: v_cmp_lt_f32_e32 vcc, v1, v2
509
+ ; GFX6-NEXT: v_cndmask_b32_e32 v5 , 0, v4 , vcc
510
+ ; GFX6-NEXT: v_add_f32_e32 v1, v1, v5
511
+ ; GFX6-NEXT: v_mov_b32_e32 v5 , 0x1f800000
515
512
; GFX6-NEXT: v_mul_legacy_f32_e32 v0, v0, v3
516
- ; GFX6-NEXT: v_cndmask_b32_e32 v5 , 1.0, v4 , vcc
517
- ; GFX6-NEXT: v_cmp_gt_f32_e32 vcc, s4, v0
518
- ; GFX6-NEXT: v_cndmask_b32_e32 v2, 0, v2 , vcc
513
+ ; GFX6-NEXT: v_cndmask_b32_e32 v6 , 1.0, v5 , vcc
514
+ ; GFX6-NEXT: v_cmp_lt_f32_e32 vcc, v0, v2
515
+ ; GFX6-NEXT: v_cndmask_b32_e32 v2, 0, v4 , vcc
519
516
; GFX6-NEXT: v_exp_f32_e32 v1, v1
520
517
; GFX6-NEXT: v_add_f32_e32 v0, v0, v2
521
518
; GFX6-NEXT: v_exp_f32_e32 v2, v0
522
- ; GFX6-NEXT: v_mul_f32_e32 v0, v1, v5
523
- ; GFX6-NEXT: v_cndmask_b32_e32 v1, 1.0, v4 , vcc
519
+ ; GFX6-NEXT: v_mul_f32_e32 v0, v1, v6
520
+ ; GFX6-NEXT: v_cndmask_b32_e32 v1, 1.0, v5 , vcc
524
521
; GFX6-NEXT: v_mul_f32_e32 v1, v2, v1
525
522
; GFX6-NEXT: v_cvt_f16_f32_e32 v0, v0
526
523
; GFX6-NEXT: v_cvt_f16_f32_e32 v1, v1
@@ -632,21 +629,21 @@ define <2 x half> @v_pow_v2f16_fneg_rhs(<2 x half> %x, <2 x half> %y) {
632
629
; GFX6-NEXT: v_cvt_f32_f16_e32 v2, v2
633
630
; GFX6-NEXT: v_log_f32_e32 v1, v1
634
631
; GFX6-NEXT: v_mul_legacy_f32_e32 v0, v0, v3
635
- ; GFX6-NEXT: s_mov_b32 s4 , 0xc2fc0000
636
- ; GFX6-NEXT: v_mov_b32_e32 v3 , 0x42800000
637
- ; GFX6-NEXT: v_cmp_gt_f32_e32 vcc, s4, v0
638
- ; GFX6-NEXT: v_cndmask_b32_e32 v4 , 0, v3 , vcc
639
- ; GFX6-NEXT: v_add_f32_e32 v0, v0, v4
640
- ; GFX6-NEXT: v_mov_b32_e32 v4 , 0x1f800000
632
+ ; GFX6-NEXT: v_mov_b32_e32 v3 , 0xc2fc0000
633
+ ; GFX6-NEXT: v_mov_b32_e32 v4 , 0x42800000
634
+ ; GFX6-NEXT: v_cmp_lt_f32_e32 vcc, v0, v3
635
+ ; GFX6-NEXT: v_cndmask_b32_e32 v5 , 0, v4 , vcc
636
+ ; GFX6-NEXT: v_add_f32_e32 v0, v0, v5
637
+ ; GFX6-NEXT: v_mov_b32_e32 v5 , 0x1f800000
641
638
; GFX6-NEXT: v_mul_legacy_f32_e32 v1, v1, v2
642
- ; GFX6-NEXT: v_cndmask_b32_e32 v5 , 1.0, v4 , vcc
643
- ; GFX6-NEXT: v_cmp_gt_f32_e32 vcc, s4, v1
644
- ; GFX6-NEXT: v_cndmask_b32_e32 v2, 0, v3 , vcc
639
+ ; GFX6-NEXT: v_cndmask_b32_e32 v6 , 1.0, v5 , vcc
640
+ ; GFX6-NEXT: v_cmp_lt_f32_e32 vcc, v1, v3
641
+ ; GFX6-NEXT: v_cndmask_b32_e32 v2, 0, v4 , vcc
645
642
; GFX6-NEXT: v_add_f32_e32 v1, v1, v2
646
643
; GFX6-NEXT: v_exp_f32_e32 v0, v0
647
644
; GFX6-NEXT: v_exp_f32_e32 v1, v1
648
- ; GFX6-NEXT: v_cndmask_b32_e32 v2, 1.0, v4 , vcc
649
- ; GFX6-NEXT: v_mul_f32_e32 v0, v0, v5
645
+ ; GFX6-NEXT: v_cndmask_b32_e32 v2, 1.0, v5 , vcc
646
+ ; GFX6-NEXT: v_mul_f32_e32 v0, v0, v6
650
647
; GFX6-NEXT: v_mul_f32_e32 v1, v1, v2
651
648
; GFX6-NEXT: v_cvt_f16_f32_e32 v0, v0
652
649
; GFX6-NEXT: v_cvt_f16_f32_e32 v1, v1
@@ -762,21 +759,21 @@ define <2 x half> @v_pow_v2f16_fneg_lhs_rhs(<2 x half> %x, <2 x half> %y) {
762
759
; GFX6-NEXT: v_cvt_f32_f16_e32 v1, v1
763
760
; GFX6-NEXT: v_log_f32_e32 v0, v0
764
761
; GFX6-NEXT: v_mul_legacy_f32_e32 v2, v3, v2
765
- ; GFX6-NEXT: s_mov_b32 s4 , 0xc2fc0000
766
- ; GFX6-NEXT: v_mov_b32_e32 v3 , 0x42800000
767
- ; GFX6-NEXT: v_cmp_gt_f32_e32 vcc, s4, v2
768
- ; GFX6-NEXT: v_cndmask_b32_e32 v4 , 0, v3 , vcc
769
- ; GFX6-NEXT: v_add_f32_e32 v2, v2, v4
770
- ; GFX6-NEXT: v_mov_b32_e32 v4 , 0x1f800000
762
+ ; GFX6-NEXT: v_mov_b32_e32 v3 , 0xc2fc0000
763
+ ; GFX6-NEXT: v_mov_b32_e32 v4 , 0x42800000
764
+ ; GFX6-NEXT: v_cmp_lt_f32_e32 vcc, v2, v3
765
+ ; GFX6-NEXT: v_cndmask_b32_e32 v5 , 0, v4 , vcc
766
+ ; GFX6-NEXT: v_add_f32_e32 v2, v2, v5
767
+ ; GFX6-NEXT: v_mov_b32_e32 v5 , 0x1f800000
771
768
; GFX6-NEXT: v_mul_legacy_f32_e32 v0, v0, v1
772
- ; GFX6-NEXT: v_cndmask_b32_e32 v5 , 1.0, v4 , vcc
773
- ; GFX6-NEXT: v_cmp_gt_f32_e32 vcc, s4, v0
774
- ; GFX6-NEXT: v_cndmask_b32_e32 v1, 0, v3 , vcc
769
+ ; GFX6-NEXT: v_cndmask_b32_e32 v6 , 1.0, v5 , vcc
770
+ ; GFX6-NEXT: v_cmp_lt_f32_e32 vcc, v0, v3
771
+ ; GFX6-NEXT: v_cndmask_b32_e32 v1, 0, v4 , vcc
775
772
; GFX6-NEXT: v_exp_f32_e32 v2, v2
776
773
; GFX6-NEXT: v_add_f32_e32 v0, v0, v1
777
774
; GFX6-NEXT: v_exp_f32_e32 v1, v0
778
- ; GFX6-NEXT: v_mul_f32_e32 v0, v2, v5
779
- ; GFX6-NEXT: v_cndmask_b32_e32 v2, 1.0, v4 , vcc
775
+ ; GFX6-NEXT: v_mul_f32_e32 v0, v2, v6
776
+ ; GFX6-NEXT: v_cndmask_b32_e32 v2, 1.0, v5 , vcc
780
777
; GFX6-NEXT: v_mul_f32_e32 v1, v1, v2
781
778
; GFX6-NEXT: v_cvt_f16_f32_e32 v0, v0
782
779
; GFX6-NEXT: v_cvt_f16_f32_e32 v1, v1
0 commit comments