@@ -1215,10 +1215,10 @@ define void @store_i8_stride7_vf8(ptr %in.vecptr0, ptr %in.vecptr1, ptr %in.vecp
1215
1215
; AVX512BW-NEXT: vpshufb {{.*#+}} zmm0 = zero,zero,zero,zero,zero,zero,zmm0[0],zero,zero,zero,zero,zero,zero,zmm0[1],zero,zero,zero,zero,zmm0[18,26],zero,zero,zero,zero,zero,zmm0[19,27],zero,zero,zero,zero,zero,zero,zero,zmm0[36],zero,zero,zero,zero,zero,zero,zmm0[37],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zmm0[55,63],zero,zero,zero,zero,zero,zero,zero,zero,zero
1216
1216
; AVX512BW-NEXT: vporq %zmm1, %zmm0, %zmm0
1217
1217
; AVX512BW-NEXT: vinserti64x4 $1, %ymm2, %zmm2, %zmm1
1218
- ; AVX512BW-NEXT: vpshufb {{.*#+}} zmm2 = zmm1[0,8],zero,zero,zero,zero,zero,zmm1[1,9],zero,zero,zero,zero,zero,zmm1[2,10,18,26],zero,zero,zero,zero,zero,zmm1[19,27],zero,zero,zero,zero,zero,zmm1[20,28],zero,zero,zero,zmm1[37,45],zero,zero,zero,zero,zero,zmm1[38,46],zero,zero,zero,zero,zero,zero,zero,zmm1[55,63],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero
1219
- ; AVX512BW-NEXT: vpermq {{.*#+}} zmm1 = zmm1 [2,3,0,1,6,7,4,5 ]
1220
- ; AVX512BW-NEXT: vpshufb {{.*#+}} zmm1 = zero,zero,zmm1 [0,8],zero,zero,zero,zero,zero,zmm1 [1,9],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zmm1 [19,27],zero,zero,zero,zero,zero,zmm1 [20,28],zero,zero,zero,zero,zero,zero,zero,zmm1 [37,45],zero,zero,zero,zero,zero,zmm1 [38,46],zero,zero,zero,zmm1 [55,63],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero
1221
- ; AVX512BW-NEXT: vporq %zmm2 , %zmm1 , %zmm1
1218
+ ; AVX512BW-NEXT: vpshufb {{.*#+}} zmm1 = zmm1[0,8],zero,zero,zero,zero,zero,zmm1[1,9],zero,zero,zero,zero,zero,zmm1[2,10,18,26],zero,zero,zero,zero,zero,zmm1[19,27],zero,zero,zero,zero,zero,zmm1[20,28],zero,zero,zero,zmm1[37,45],zero,zero,zero,zero,zero,zmm1[38,46],zero,zero,zero,zero,zero,zero,zero,zmm1[55,63],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero
1219
+ ; AVX512BW-NEXT: vshufi64x2 {{.*#+}} zmm2 = zmm2 [2,3,0,1,2,3,0,1 ]
1220
+ ; AVX512BW-NEXT: vpshufb {{.*#+}} zmm2 = zero,zero,zmm2 [0,8],zero,zero,zero,zero,zero,zmm2 [1,9],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zmm2 [19,27],zero,zero,zero,zero,zero,zmm2 [20,28],zero,zero,zero,zero,zero,zero,zero,zmm2 [37,45],zero,zero,zero,zero,zero,zmm2 [38,46],zero,zero,zero,zmm2 [55,63],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero
1221
+ ; AVX512BW-NEXT: vporq %zmm1 , %zmm2 , %zmm1
1222
1222
; AVX512BW-NEXT: movabsq $63546854584629360, %rcx # imm = 0xE1C3870E1C3870
1223
1223
; AVX512BW-NEXT: kmovq %rcx, %k1
1224
1224
; AVX512BW-NEXT: vmovdqu8 %zmm0, %zmm1 {%k1}
@@ -1294,10 +1294,10 @@ define void @store_i8_stride7_vf8(ptr %in.vecptr0, ptr %in.vecptr1, ptr %in.vecp
1294
1294
; AVX512DQ-BW-NEXT: vpshufb {{.*#+}} zmm0 = zero,zero,zero,zero,zero,zero,zmm0[0],zero,zero,zero,zero,zero,zero,zmm0[1],zero,zero,zero,zero,zmm0[18,26],zero,zero,zero,zero,zero,zmm0[19,27],zero,zero,zero,zero,zero,zero,zero,zmm0[36],zero,zero,zero,zero,zero,zero,zmm0[37],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zmm0[55,63],zero,zero,zero,zero,zero,zero,zero,zero,zero
1295
1295
; AVX512DQ-BW-NEXT: vporq %zmm1, %zmm0, %zmm0
1296
1296
; AVX512DQ-BW-NEXT: vinserti64x4 $1, %ymm2, %zmm2, %zmm1
1297
- ; AVX512DQ-BW-NEXT: vpshufb {{.*#+}} zmm2 = zmm1[0,8],zero,zero,zero,zero,zero,zmm1[1,9],zero,zero,zero,zero,zero,zmm1[2,10,18,26],zero,zero,zero,zero,zero,zmm1[19,27],zero,zero,zero,zero,zero,zmm1[20,28],zero,zero,zero,zmm1[37,45],zero,zero,zero,zero,zero,zmm1[38,46],zero,zero,zero,zero,zero,zero,zero,zmm1[55,63],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero
1298
- ; AVX512DQ-BW-NEXT: vpermq {{.*#+}} zmm1 = zmm1 [2,3,0,1,6,7,4,5 ]
1299
- ; AVX512DQ-BW-NEXT: vpshufb {{.*#+}} zmm1 = zero,zero,zmm1 [0,8],zero,zero,zero,zero,zero,zmm1 [1,9],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zmm1 [19,27],zero,zero,zero,zero,zero,zmm1 [20,28],zero,zero,zero,zero,zero,zero,zero,zmm1 [37,45],zero,zero,zero,zero,zero,zmm1 [38,46],zero,zero,zero,zmm1 [55,63],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero
1300
- ; AVX512DQ-BW-NEXT: vporq %zmm2 , %zmm1 , %zmm1
1297
+ ; AVX512DQ-BW-NEXT: vpshufb {{.*#+}} zmm1 = zmm1[0,8],zero,zero,zero,zero,zero,zmm1[1,9],zero,zero,zero,zero,zero,zmm1[2,10,18,26],zero,zero,zero,zero,zero,zmm1[19,27],zero,zero,zero,zero,zero,zmm1[20,28],zero,zero,zero,zmm1[37,45],zero,zero,zero,zero,zero,zmm1[38,46],zero,zero,zero,zero,zero,zero,zero,zmm1[55,63],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero
1298
+ ; AVX512DQ-BW-NEXT: vshufi64x2 {{.*#+}} zmm2 = zmm2 [2,3,0,1,2,3,0,1 ]
1299
+ ; AVX512DQ-BW-NEXT: vpshufb {{.*#+}} zmm2 = zero,zero,zmm2 [0,8],zero,zero,zero,zero,zero,zmm2 [1,9],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zmm2 [19,27],zero,zero,zero,zero,zero,zmm2 [20,28],zero,zero,zero,zero,zero,zero,zero,zmm2 [37,45],zero,zero,zero,zero,zero,zmm2 [38,46],zero,zero,zero,zmm2 [55,63],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero
1300
+ ; AVX512DQ-BW-NEXT: vporq %zmm1 , %zmm2 , %zmm1
1301
1301
; AVX512DQ-BW-NEXT: movabsq $63546854584629360, %rcx # imm = 0xE1C3870E1C3870
1302
1302
; AVX512DQ-BW-NEXT: kmovq %rcx, %k1
1303
1303
; AVX512DQ-BW-NEXT: vmovdqu8 %zmm0, %zmm1 {%k1}
0 commit comments