@@ -7,12 +7,12 @@ define <2 x i32> @uniform_masked_load_ptr1_mask_v2i32(ptr addrspace(1) inreg noc
7
7
; GFX942-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
8
8
; GFX942-NEXT: v_and_b32_e32 v0, 1, v0
9
9
; GFX942-NEXT: v_cmp_eq_u32_e32 vcc, 1, v0
10
- ; GFX942-NEXT: v_mov_b32_e32 v0 , 0
11
- ; GFX942-NEXT: v_mov_b32_e32 v1, v0
10
+ ; GFX942-NEXT: v_mov_b32_e32 v2 , 0
11
+ ; GFX942-NEXT: v_mov_b64_e32 v[0:1], 0
12
12
; GFX942-NEXT: s_and_saveexec_b64 s[2:3], vcc
13
13
; GFX942-NEXT: s_cbranch_execz .LBB0_2
14
14
; GFX942-NEXT: ; %bb.1: ; %cond.load
15
- ; GFX942-NEXT: global_load_dwordx2 v[0:1], v0 , s[0:1]
15
+ ; GFX942-NEXT: global_load_dwordx2 v[0:1], v2 , s[0:1]
16
16
; GFX942-NEXT: .LBB0_2:
17
17
; GFX942-NEXT: s_or_b64 exec, exec, s[2:3]
18
18
; GFX942-NEXT: s_waitcnt vmcnt(0)
@@ -30,14 +30,13 @@ define <4 x i32> @uniform_masked_load_ptr1_mask_v4i32(ptr addrspace(1) inreg noc
30
30
; GFX942-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
31
31
; GFX942-NEXT: v_and_b32_e32 v0, 1, v0
32
32
; GFX942-NEXT: v_cmp_eq_u32_e32 vcc, 1, v0
33
- ; GFX942-NEXT: v_mov_b32_e32 v0, 0
34
- ; GFX942-NEXT: v_mov_b32_e32 v1, v0
35
- ; GFX942-NEXT: v_mov_b32_e32 v2, v0
36
- ; GFX942-NEXT: v_mov_b32_e32 v3, v0
33
+ ; GFX942-NEXT: v_mov_b64_e32 v[0:1], 0
34
+ ; GFX942-NEXT: v_mov_b32_e32 v4, 0
35
+ ; GFX942-NEXT: v_mov_b64_e32 v[2:3], v[0:1]
37
36
; GFX942-NEXT: s_and_saveexec_b64 s[2:3], vcc
38
37
; GFX942-NEXT: s_cbranch_execz .LBB1_2
39
38
; GFX942-NEXT: ; %bb.1: ; %cond.load
40
- ; GFX942-NEXT: global_load_dwordx4 v[0:3], v0 , s[0:1]
39
+ ; GFX942-NEXT: global_load_dwordx4 v[0:3], v4 , s[0:1]
41
40
; GFX942-NEXT: .LBB1_2:
42
41
; GFX942-NEXT: s_or_b64 exec, exec, s[2:3]
43
42
; GFX942-NEXT: s_waitcnt vmcnt(0)
@@ -55,14 +54,13 @@ define <4 x float> @uniform_masked_load_ptr1_mask_v4f32(ptr addrspace(1) inreg n
55
54
; GFX942-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
56
55
; GFX942-NEXT: v_and_b32_e32 v0, 1, v0
57
56
; GFX942-NEXT: v_cmp_eq_u32_e32 vcc, 1, v0
58
- ; GFX942-NEXT: v_mov_b32_e32 v0, 0
59
- ; GFX942-NEXT: v_mov_b32_e32 v1, v0
60
- ; GFX942-NEXT: v_mov_b32_e32 v2, v0
61
- ; GFX942-NEXT: v_mov_b32_e32 v3, v0
57
+ ; GFX942-NEXT: v_mov_b64_e32 v[0:1], 0
58
+ ; GFX942-NEXT: v_mov_b32_e32 v4, 0
59
+ ; GFX942-NEXT: v_mov_b64_e32 v[2:3], v[0:1]
62
60
; GFX942-NEXT: s_and_saveexec_b64 s[2:3], vcc
63
61
; GFX942-NEXT: s_cbranch_execz .LBB2_2
64
62
; GFX942-NEXT: ; %bb.1: ; %cond.load
65
- ; GFX942-NEXT: global_load_dwordx4 v[0:3], v0 , s[0:1]
63
+ ; GFX942-NEXT: global_load_dwordx4 v[0:3], v4 , s[0:1]
66
64
; GFX942-NEXT: .LBB2_2:
67
65
; GFX942-NEXT: s_or_b64 exec, exec, s[2:3]
68
66
; GFX942-NEXT: s_waitcnt vmcnt(0)
@@ -80,20 +78,16 @@ define <8 x i32> @uniform_masked_load_ptr1_mask_v8i32(ptr addrspace(1) inreg noc
80
78
; GFX942-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
81
79
; GFX942-NEXT: v_and_b32_e32 v0, 1, v0
82
80
; GFX942-NEXT: v_cmp_eq_u32_e32 vcc, 1, v0
83
- ; GFX942-NEXT: v_mov_b32_e32 v0, 0
84
- ; GFX942-NEXT: v_mov_b32_e32 v1, v0
85
- ; GFX942-NEXT: v_mov_b32_e32 v2, v0
86
- ; GFX942-NEXT: v_mov_b32_e32 v3, v0
87
- ; GFX942-NEXT: v_mov_b32_e32 v4, v0
88
- ; GFX942-NEXT: v_mov_b32_e32 v5, v0
89
- ; GFX942-NEXT: v_mov_b32_e32 v6, v0
90
- ; GFX942-NEXT: v_mov_b32_e32 v7, v0
81
+ ; GFX942-NEXT: v_mov_b64_e32 v[0:1], 0
82
+ ; GFX942-NEXT: v_mov_b32_e32 v8, 0
83
+ ; GFX942-NEXT: v_mov_b64_e32 v[2:3], v[0:1]
84
+ ; GFX942-NEXT: v_mov_b64_e32 v[4:5], v[0:1]
85
+ ; GFX942-NEXT: v_mov_b64_e32 v[6:7], v[0:1]
91
86
; GFX942-NEXT: s_and_saveexec_b64 s[2:3], vcc
92
87
; GFX942-NEXT: s_cbranch_execz .LBB3_2
93
88
; GFX942-NEXT: ; %bb.1: ; %cond.load
94
- ; GFX942-NEXT: global_load_dwordx4 v[4:7], v0, s[0:1] offset:16
95
- ; GFX942-NEXT: s_nop 0
96
- ; GFX942-NEXT: global_load_dwordx4 v[0:3], v0, s[0:1]
89
+ ; GFX942-NEXT: global_load_dwordx4 v[4:7], v8, s[0:1] offset:16
90
+ ; GFX942-NEXT: global_load_dwordx4 v[0:3], v8, s[0:1]
97
91
; GFX942-NEXT: .LBB3_2:
98
92
; GFX942-NEXT: s_or_b64 exec, exec, s[2:3]
99
93
; GFX942-NEXT: s_waitcnt vmcnt(0)
@@ -111,20 +105,16 @@ define <8 x float> @uniform_masked_load_ptr1_mask_v8f32(ptr addrspace(1) inreg n
111
105
; GFX942-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
112
106
; GFX942-NEXT: v_and_b32_e32 v0, 1, v0
113
107
; GFX942-NEXT: v_cmp_eq_u32_e32 vcc, 1, v0
114
- ; GFX942-NEXT: v_mov_b32_e32 v0, 0
115
- ; GFX942-NEXT: v_mov_b32_e32 v1, v0
116
- ; GFX942-NEXT: v_mov_b32_e32 v2, v0
117
- ; GFX942-NEXT: v_mov_b32_e32 v3, v0
118
- ; GFX942-NEXT: v_mov_b32_e32 v4, v0
119
- ; GFX942-NEXT: v_mov_b32_e32 v5, v0
120
- ; GFX942-NEXT: v_mov_b32_e32 v6, v0
121
- ; GFX942-NEXT: v_mov_b32_e32 v7, v0
108
+ ; GFX942-NEXT: v_mov_b64_e32 v[0:1], 0
109
+ ; GFX942-NEXT: v_mov_b32_e32 v8, 0
110
+ ; GFX942-NEXT: v_mov_b64_e32 v[2:3], v[0:1]
111
+ ; GFX942-NEXT: v_mov_b64_e32 v[4:5], v[0:1]
112
+ ; GFX942-NEXT: v_mov_b64_e32 v[6:7], v[0:1]
122
113
; GFX942-NEXT: s_and_saveexec_b64 s[2:3], vcc
123
114
; GFX942-NEXT: s_cbranch_execz .LBB4_2
124
115
; GFX942-NEXT: ; %bb.1: ; %cond.load
125
- ; GFX942-NEXT: global_load_dwordx4 v[4:7], v0, s[0:1] offset:16
126
- ; GFX942-NEXT: s_nop 0
127
- ; GFX942-NEXT: global_load_dwordx4 v[0:3], v0, s[0:1]
116
+ ; GFX942-NEXT: global_load_dwordx4 v[4:7], v8, s[0:1] offset:16
117
+ ; GFX942-NEXT: global_load_dwordx4 v[0:3], v8, s[0:1]
128
118
; GFX942-NEXT: .LBB4_2:
129
119
; GFX942-NEXT: s_or_b64 exec, exec, s[2:3]
130
120
; GFX942-NEXT: s_waitcnt vmcnt(0)
@@ -142,14 +132,13 @@ define <8 x i16> @uniform_masked_load_ptr1_mask_v8i16(ptr addrspace(1) inreg noc
142
132
; GFX942-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
143
133
; GFX942-NEXT: v_and_b32_e32 v0, 1, v0
144
134
; GFX942-NEXT: v_cmp_eq_u32_e32 vcc, 1, v0
145
- ; GFX942-NEXT: v_mov_b32_e32 v0, 0
146
- ; GFX942-NEXT: v_mov_b32_e32 v1, v0
147
- ; GFX942-NEXT: v_mov_b32_e32 v2, v0
148
- ; GFX942-NEXT: v_mov_b32_e32 v3, v0
135
+ ; GFX942-NEXT: v_mov_b64_e32 v[0:1], 0
136
+ ; GFX942-NEXT: v_mov_b32_e32 v4, 0
137
+ ; GFX942-NEXT: v_mov_b64_e32 v[2:3], v[0:1]
149
138
; GFX942-NEXT: s_and_saveexec_b64 s[2:3], vcc
150
139
; GFX942-NEXT: s_cbranch_execz .LBB5_2
151
140
; GFX942-NEXT: ; %bb.1: ; %cond.load
152
- ; GFX942-NEXT: global_load_dwordx4 v[0:3], v0 , s[0:1]
141
+ ; GFX942-NEXT: global_load_dwordx4 v[0:3], v4 , s[0:1]
153
142
; GFX942-NEXT: .LBB5_2:
154
143
; GFX942-NEXT: s_or_b64 exec, exec, s[2:3]
155
144
; GFX942-NEXT: s_waitcnt vmcnt(0)
@@ -167,14 +156,13 @@ define <8 x half> @uniform_masked_load_ptr1_mask_v8f16(ptr addrspace(1) inreg no
167
156
; GFX942-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
168
157
; GFX942-NEXT: v_and_b32_e32 v0, 1, v0
169
158
; GFX942-NEXT: v_cmp_eq_u32_e32 vcc, 1, v0
170
- ; GFX942-NEXT: v_mov_b32_e32 v0, 0
171
- ; GFX942-NEXT: v_mov_b32_e32 v1, v0
172
- ; GFX942-NEXT: v_mov_b32_e32 v2, v0
173
- ; GFX942-NEXT: v_mov_b32_e32 v3, v0
159
+ ; GFX942-NEXT: v_mov_b64_e32 v[0:1], 0
160
+ ; GFX942-NEXT: v_mov_b32_e32 v4, 0
161
+ ; GFX942-NEXT: v_mov_b64_e32 v[2:3], v[0:1]
174
162
; GFX942-NEXT: s_and_saveexec_b64 s[2:3], vcc
175
163
; GFX942-NEXT: s_cbranch_execz .LBB6_2
176
164
; GFX942-NEXT: ; %bb.1: ; %cond.load
177
- ; GFX942-NEXT: global_load_dwordx4 v[0:3], v0 , s[0:1]
165
+ ; GFX942-NEXT: global_load_dwordx4 v[0:3], v4 , s[0:1]
178
166
; GFX942-NEXT: .LBB6_2:
179
167
; GFX942-NEXT: s_or_b64 exec, exec, s[2:3]
180
168
; GFX942-NEXT: s_waitcnt vmcnt(0)
@@ -192,14 +180,13 @@ define <8 x bfloat> @uniform_masked_load_ptr1_mask_v8bf16(ptr addrspace(1) inreg
192
180
; GFX942-NEXT: s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
193
181
; GFX942-NEXT: v_and_b32_e32 v0, 1, v0
194
182
; GFX942-NEXT: v_cmp_eq_u32_e32 vcc, 1, v0
195
- ; GFX942-NEXT: v_mov_b32_e32 v0, 0
196
- ; GFX942-NEXT: v_mov_b32_e32 v1, v0
197
- ; GFX942-NEXT: v_mov_b32_e32 v2, v0
198
- ; GFX942-NEXT: v_mov_b32_e32 v3, v0
183
+ ; GFX942-NEXT: v_mov_b64_e32 v[0:1], 0
184
+ ; GFX942-NEXT: v_mov_b32_e32 v4, 0
185
+ ; GFX942-NEXT: v_mov_b64_e32 v[2:3], v[0:1]
199
186
; GFX942-NEXT: s_and_saveexec_b64 s[2:3], vcc
200
187
; GFX942-NEXT: s_cbranch_execz .LBB7_2
201
188
; GFX942-NEXT: ; %bb.1: ; %cond.load
202
- ; GFX942-NEXT: global_load_dwordx4 v[0:3], v0 , s[0:1]
189
+ ; GFX942-NEXT: global_load_dwordx4 v[0:3], v4 , s[0:1]
203
190
; GFX942-NEXT: .LBB7_2:
204
191
; GFX942-NEXT: s_or_b64 exec, exec, s[2:3]
205
192
; GFX942-NEXT: s_waitcnt vmcnt(0)
0 commit comments