Skip to content

Avx512bw #953

New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Merged
merged 35 commits into from
Nov 22, 2020
Merged
Show file tree
Hide file tree
Changes from all commits
Commits
Show all changes
35 commits
Select commit Hold shift + click to select a range
63225e5
add avx512bw.md
minybot Nov 14, 2020
22c028e
cmplt: epu8,epu16,epi8,epi16
minybot Nov 14, 2020
423522b
cmpgt: epu8,epu16,epi8,epi16
minybot Nov 14, 2020
ade36c0
cmple: epu8,epu16,epi8,epi16, cmpge: epu8,epu16,epi8,epi16
minybot Nov 15, 2020
7c07a18
cmpeq: epu8,epu16,epi8,epi16; cmpneq: epu8,epu16,epi8,epi16
minybot Nov 15, 2020
48bd95f
cmp_mask: epu8,epu16,epi8,epi16
minybot Nov 15, 2020
a372d27
fix set_epi16, set_epi8; add mm512_loadu_epi16
minybot Nov 15, 2020
45d3ba9
loadu: epi8; storeu: epi8,epi16
minybot Nov 15, 2020
da30df2
abs: epi8,epi16
minybot Nov 15, 2020
fd20dbf
add: epi8,epi16
minybot Nov 16, 2020
3d41431
adds: epu8,epu16,epi8,epi16
minybot Nov 16, 2020
001d753
sub: epi8,epi16, subs: epu8,epu16,epi8,epi16
minybot Nov 16, 2020
76efdc9
mulhi: epu16,epi16
minybot Nov 16, 2020
757faf0
mulhrs: epi16; mullo: epi16
minybot Nov 16, 2020
a57d428
max: epu8,epu16,epi8,epi16
minybot Nov 17, 2020
29447c5
min: epu8,epu16,epi8,epi16
minybot Nov 17, 2020
c18ccd0
fix format
minybot Nov 17, 2020
b62938d
fix format
minybot Nov 17, 2020
dfea85d
madd: epi16; maddubs: epi16
minybot Nov 17, 2020
2c5eeec
packs: epi32,epi16; packus: epi32,epi16
minybot Nov 17, 2020
5254990
avg: epu8,epu16
minybot Nov 18, 2020
1fb90b9
sll: epi16, slli: epi16, sllv: epi16
minybot Nov 18, 2020
4c7cdba
srl: epi16, srli: epi16, srlv: epi16
minybot Nov 18, 2020
bc7753a
sra: epi16; srai: epi16; srav: epi16
minybot Nov 18, 2020
e75313e
permutex2var: epi16
minybot Nov 19, 2020
4dadcc2
fix assert_instr
minybot Nov 19, 2020
d2b2328
fix assert_instr for msvc
minybot Nov 19, 2020
de9dae3
permutexvar: epi16
minybot Nov 19, 2020
03d8056
blend: epi16,epi8, broadcastw: epi16
minybot Nov 19, 2020
6560268
broadcastb: epi8, unpackhi: epi16
minybot Nov 19, 2020
d53548c
unpackhi: epi8, unpacklo: epi16,epi8
minybot Nov 19, 2020
b2772de
mov: epi8,epi16; mask_set1: epi8,epi16
minybot Nov 20, 2020
c4ceb9a
shufflelo: epi16; shufflehi: epi16
minybot Nov 22, 2020
34a6131
put a comment on aarch64/neon/mod.rs
minybot Nov 22, 2020
c369b1c
recover delete comment
minybot Nov 22, 2020
File filter

Filter by extension

Filter by extension

Conversations
Failed to load comments.
Loading
Jump to
Jump to file
Failed to load files.
Loading
Diff view
Diff view
322 changes: 322 additions & 0 deletions crates/core_arch/avx512bw.md
Original file line number Diff line number Diff line change
@@ -0,0 +1,322 @@
<summary>["AVX512BW"]</summary><p>

* [x] [`_mm512_abs_epi16`]
* [x] [`_mm512_mask_abs_epi16`]
* [x] [`_mm512_maskz_abs_epi16`]
* [x] [`_mm512_abs_epi8`]
* [x] [`_mm512_mask_abs_epi8`]
* [x] [`_mm512_maskz_abs_epi8`]
* [x] [`_mm512_add_epi16`]
* [x] [`_mm512_mask_add_epi16`]
* [x] [`_mm512_maskz_add_epi16`]
* [x] [`_mm512_add_epi8`]
* [x] [`_mm512_mask_add_epi8`]
* [x] [`_mm512_maskz_add_epi8`]
* [x] [`_mm512_adds_epi16`]
* [x] [`_mm512_mask_adds_epi16`]
* [x] [`_mm512_maskz_adds_epi16`]
* [x] [`_mm512_adds_epi8`]
* [x] [`_mm512_mask_adds_epi8`]
* [x] [`_mm512_maskz_adds_epi8`]
* [x] [`_mm512_adds_epu16`]
* [x] [`_mm512_mask_adds_epu16`]
* [x] [`_mm512_maskz_adds_epu16`]
* [x] [`_mm512_adds_epu8`]
* [x] [`_mm512_mask_adds_epu8`]
* [x] [`_mm512_maskz_adds_epu8`]
* [x] [`_mm512_alignr_epi8`]
* [_] [`_mm512_mask_alignr_epi8`]
* [_] [`_mm512_maskz_alignr_epi8`]
* [x] [`_mm512_avg_epu16`]
* [x] [`_mm512_mask_avg_epu16`]
* [x] [`_mm512_maskz_avg_epu16`]
* [x] [`_mm512_avg_epu8`]
* [x] [`_mm512_mask_avg_epu8`]
* [x] [`_mm512_maskz_avg_epu8`]
* [x] [`_mm512_mask_blend_epi16`]
* [x] [`_mm512_mask_blend_epi8`]
* [x] [`_mm512_broadcastb_epi8`]
* [x] [`_mm512_mask_broadcastb_epi8`]
* [x] [`_mm512_maskz_broadcastb_epi8`]
* [x] [`_mm512_broadcastw_epi16`]
* [x] [`_mm512_mask_broadcastw_epi16`]
* [x] [`_mm512_maskz_broadcastw_epi16`]
* [_] [`_mm512_bslli_epi128`]
* [_] [`_mm512_bsrli_epi128`]
* [x] [`_mm512_cmp_epi16_mask`]
* [x] [`_mm512_mask_cmp_epi16_mask`]
* [x] [`_mm512_cmp_epi8_mask`]
* [x] [`_mm512_mask_cmp_epi8_mask`]
* [x] [`_mm512_cmp_epu16_mask`]
* [x] [`_mm512_mask_cmp_epu16_mask`]
* [x] [`_mm512_cmp_epu8_mask`]
* [x] [`_mm512_mask_cmp_epu8_mask`]
* [x] [`_mm512_cmpeq_epi16_mask`]
* [x] [`_mm512_mask_cmpeq_epi16_mask`]
* [x] [`_mm512_cmpeq_epi8_mask`]
* [x] [`_mm512_mask_cmpeq_epi8_mask`]
* [x] [`_mm512_cmpeq_epu16_mask`]
* [x] [`_mm512_mask_cmpeq_epu16_mask`]
* [x] [`_mm512_cmpeq_epu8_mask`]
* [x] [`_mm512_mask_cmpeq_epu8_mask`]
* [x] [`_mm512_cmpge_epi16_mask`]
* [x] [`_mm512_mask_cmpge_epi16_mask`]
* [x] [`_mm512_cmpge_epi8_mask`]
* [x] [`_mm512_mask_cmpge_epi8_mask`]
* [x] [`_mm512_cmpge_epu16_mask`]
* [x] [`_mm512_mask_cmpge_epu16_mask`]
* [x] [`_mm512_cmpge_epu8_mask`]
* [x] [`_mm512_mask_cmpge_epu8_mask`]
* [x] [`_mm512_cmpgt_epi16_mask`]
* [x] [`_mm512_mask_cmpgt_epi16_mask`]
* [x] [`_mm512_cmpgt_epi8_mask`]
* [x] [`_mm512_mask_cmpgt_epi8_mask`]
* [x] [`_mm512_cmpgt_epu16_mask`]
* [x] [`_mm512_mask_cmpgt_epu16_mask`]
* [x] [`_mm512_cmpgt_epu8_mask`]
* [x] [`_mm512_mask_cmpgt_epu8_mask`]
* [x] [`_mm512_cmple_epi16_mask`]
* [x] [`_mm512_mask_cmple_epi16_mask`]
* [x] [`_mm512_cmple_epi8_mask`]
* [x] [`_mm512_mask_cmple_epi8_mask`]
* [x] [`_mm512_cmple_epu16_mask`]
* [x] [`_mm512_mask_cmple_epu16_mask`]
* [x] [`_mm512_cmple_epu8_mask`]
* [x] [`_mm512_mask_cmple_epu8_mask`]
* [x] [`_mm512_cmplt_epi16_mask`]
* [x] [`_mm512_mask_cmplt_epi16_mask`]
* [x] [`_mm512_cmplt_epi8_mask`]
* [x] [`_mm512_mask_cmplt_epi8_mask`]
* [x] [`_mm512_cmplt_epu16_mask`]
* [x] [`_mm512_mask_cmplt_epu16_mask`]
* [x] [`_mm512_cmplt_epu8_mask`]
* [x] [`_mm512_mask_cmplt_epu8_mask`]
* [x] [`_mm512_cmpneq_epi16_mask`]
* [x] [`_mm512_mask_cmpneq_epi16_mask`]
* [x] [`_mm512_cmpneq_epi8_mask`]
* [x] [`_mm512_mask_cmpneq_epi8_mask`]
* [x] [`_mm512_cmpneq_epu16_mask`]
* [x] [`_mm512_mask_cmpneq_epu16_mask`]
* [x] [`_mm512_cmpneq_epu8_mask`]
* [x] [`_mm512_mask_cmpneq_epu8_mask`]
* [_] [`_mm512_cvtepi16_epi8`]
* [_] [`_mm512_mask_cvtepi16_epi8`]
* [_] [`_mm512_maskz_cvtepi16_epi8`]
* [_] [`_mm512_mask_cvtepi16_storeu_epi8`]
* [_] [`_mm512_cvtepi8_epi16`]
* [_] [`_mm512_mask_cvtepi8_epi16`]
* [_] [`_mm512_maskz_cvtepi8_epi16`]
* [_] [`_mm512_cvtepu8_epi16`]
* [_] [`_mm512_mask_cvtepu8_epi16`]
* [_] [`_mm512_maskz_cvtepu8_epi16`]
* [_] [`_cvtmask32_u32`]
* [_] [`_cvtmask64_u64`]
* [_] [`_mm512_cvtsepi16_epi8`]
* [_] [`_mm512_mask_cvtsepi16_epi8`]
* [_] [`_mm512_maskz_cvtsepi16_epi8`]
* [_] [`_mm512_mask_cvtsepi16_storeu_epi8`]
* [_] [`_cvtu32_mask32`]
* [_] [`_cvtu64_mask64`]
* [_] [`_mm512_cvtusepi16_epi8`]
* [_] [`_mm512_mask_cvtusepi16_epi8`]
* [_] [`_mm512_maskz_cvtusepi16_epi8`]
* [_] [`_mm512_mask_cvtusepi16_storeu_epi8`]
* [_] [`_mm512_dbsad_epu8`]
* [_] [`_mm512_mask_dbsad_epu8`]
* [_] [`_mm512_maskz_dbsad_epu8`]
* [_] [`_kadd_mask32`]
* [_] [`_kadd_mask64`]
* [_] [`_kand_mask32`]
* [_] [`_kand_mask64`]
* [_] [`_kandn_mask32`]
* [_] [`_kandn_mask64`]
* [_] [`_knot_mask32`]
* [_] [`_knot_mask64`]
* [_] [`_kor_mask32`]
* [_] [`_kor_mask64`]
* [_] [`_kortest_mask32_u8`]
* [_] [`_kortest_mask64_u8`]
* [_] [`_kortestc_mask32_u8`]
* [_] [`_kortestc_mask64_u8`]
* [_] [`_kortestz_mask32_u8`]
* [_] [`_kortestz_mask64_u8`]
* [_] [`_kshiftli_mask32`]
* [_] [`_kshiftli_mask64`]
* [_] [`_kshiftri_mask32`]
* [_] [`_kshiftri_mask64`]
* [_] [`_ktest_mask32_u8`]
* [_] [`_ktest_mask64_u8`]
* [_] [`_ktestc_mask32_u8`]
* [_] [`_ktestc_mask64_u8`]
* [_] [`_ktestz_mask32_u8`]
* [_] [`_ktestz_mask64_u8`]
* [_] [`_mm512_kunpackd`]
* [_] [`_mm512_kunpackw`]
* [_] [`_kxnor_mask32`]
* [_] [`_kxnor_mask64`]
* [_] [`_kxor_mask32`]
* [_] [`_kxor_mask64`]
* [_] [`_load_mask32`]
* [_] [`_load_mask64`]
* [x] [`_mm512_loadu_epi16`]
* [_] [`_mm512_mask_loadu_epi16`]
* [_] [`_mm512_maskz_loadu_epi16`]
* [x] [`_mm512_loadu_epi8`]
* [_] [`_mm512_mask_loadu_epi8`]
* [_] [`_mm512_maskz_loadu_epi8`]
* [x] [`_mm512_madd_epi16`]
* [x] [`_mm512_mask_madd_epi16`]
* [x] [`_mm512_maskz_madd_epi16`]
* [x] [`_mm512_maddubs_epi16`]
* [x] [`_mm512_mask_maddubs_epi16`]
* [x] [`_mm512_maskz_maddubs_epi16`]
* [x] [`_mm512_mask_max_epi16`]
* [x] [`_mm512_maskz_max_epi16`]
* [x] [`_mm512_max_epi16`]
* [x] [`_mm512_mask_max_epi8`]
* [x] [`_mm512_maskz_max_epi8`]
* [x] [`_mm512_max_epi8`]
* [x] [`_mm512_mask_max_epu16`]
* [x] [`_mm512_maskz_max_epu16`]
* [x] [`_mm512_max_epu16`]
* [x] [`_mm512_mask_max_epu8`]
* [x] [`_mm512_maskz_max_epu8`]
* [x] [`_mm512_max_epu8`]
* [x] [`_mm512_mask_min_epi16`]
* [x] [`_mm512_maskz_min_epi16`]
* [x] [`_mm512_min_epi16`]
* [x] [`_mm512_mask_min_epi8`]
* [x] [`_mm512_maskz_min_epi8`]
* [x] [`_mm512_min_epi8`]
* [x] [`_mm512_mask_min_epu16`]
* [x] [`_mm512_maskz_min_epu16`]
* [x] [`_mm512_min_epu16`]
* [x] [`_mm512_mask_min_epu8`]
* [x] [`_mm512_maskz_min_epu8`]
* [x] [`_mm512_min_epu8`]
* [x] [`_mm512_mask_mov_epi16`]
* [x] [`_mm512_maskz_mov_epi16`]
* [x] [`_mm512_mask_mov_epi8`]
* [x] [`_mm512_maskz_mov_epi8`]
* [_] [`_mm512_movepi16_mask`]
* [_] [`_mm512_movepi8_mask`]
* [_] [`_mm512_movm_epi16`]
* [_] [`_mm512_movm_epi8`]
* [x] [`_mm512_mask_mulhi_epi16`]
* [x] [`_mm512_maskz_mulhi_epi16`]
* [x] [`_mm512_mulhi_epi16`]
* [x] [`_mm512_mask_mulhi_epu16`]
* [x] [`_mm512_maskz_mulhi_epu16`]
* [x] [`_mm512_mulhi_epu16`]
* [x] [`_mm512_mask_mulhrs_epi16`]
* [x] [`_mm512_maskz_mulhrs_epi16`]
* [x] [`_mm512_mulhrs_epi16`]
* [x] [`_mm512_mask_mullo_epi16`]
* [x] [`_mm512_maskz_mullo_epi16`]
* [x] [`_mm512_mullo_epi16`]
* [x] [`_mm512_mask_packs_epi16`]
* [x] [`_mm512_maskz_packs_epi16`]
* [x] [`_mm512_packs_epi16`]
* [x] [`_mm512_mask_packs_epi32`]
* [x] [`_mm512_maskz_packs_epi32`]
* [x] [`_mm512_packs_epi32`]
* [x] [`_mm512_mask_packus_epi16`]
* [x] [`_mm512_maskz_packus_epi16`]
* [x] [`_mm512_packus_epi16`]
* [x] [`_mm512_mask_packus_epi32`]
* [x] [`_mm512_maskz_packus_epi32`]
* [x] [`_mm512_packus_epi32`]
* [x] [`_mm512_mask_permutex2var_epi16`]
* [x] [`_mm512_mask2_permutex2var_epi16`]
* [x] [`_mm512_maskz_permutex2var_epi16`]
* [x] [`_mm512_permutex2var_epi16`]
* [x] [`_mm512_mask_permutexvar_epi16`]
* [x] [`_mm512_maskz_permutexvar_epi16`]
* [x] [`_mm512_permutexvar_epi16`]
* [_] [`_mm512_sad_epu8`]
* [x] [`_mm512_mask_set1_epi16`]
* [x] [`_mm512_maskz_set1_epi16`]
* [x] [`_mm512_mask_set1_epi8`]
* [x] [`_mm512_maskz_set1_epi8`]
* [_] [`_mm512_mask_shuffle_epi8`]
* [_] [`_mm512_maskz_shuffle_epi8`]
* [_] [`_mm512_shuffle_epi8`]
* [x] [`_mm512_mask_shufflehi_epi16`]
* [x] [`_mm512_maskz_shufflehi_epi16`]
* [x] [`_mm512_shufflehi_epi16`]
* [x] [`_mm512_mask_shufflelo_epi16`]
* [x] [`_mm512_maskz_shufflelo_epi16`]
* [x] [`_mm512_shufflelo_epi16`]
* [x] [`_mm512_mask_sll_epi16`]
* [x] [`_mm512_maskz_sll_epi16`]
* [x] [`_mm512_sll_epi16`]
* [x] [`_mm512_mask_slli_epi16`]
* [x] [`_mm512_maskz_slli_epi16`]
* [x] [`_mm512_slli_epi16`]
* [x] [`_mm512_mask_sllv_epi16`]
* [x] [`_mm512_maskz_sllv_epi16`]
* [x] [`_mm512_sllv_epi16`]
* [x] [`_mm512_mask_sra_epi16`]
* [x] [`_mm512_maskz_sra_epi16`]
* [x] [`_mm512_sra_epi16`]
* [x] [`_mm512_mask_srai_epi16`]
* [x] [`_mm512_maskz_srai_epi16`]
* [x] [`_mm512_srai_epi16`]
* [x] [`_mm512_mask_srav_epi16`]
* [x] [`_mm512_maskz_srav_epi16`]
* [x] [`_mm512_srav_epi16`]
* [x] [`_mm512_mask_srl_epi16`]
* [x] [`_mm512_maskz_srl_epi16`]
* [x] [`_mm512_srl_epi16`]
* [x] [`_mm512_mask_srli_epi16`]
* [x] [`_mm512_maskz_srli_epi16`]
* [x] [`_mm512_srli_epi16`]
* [x] [`_mm512_mask_srlv_epi16`]
* [x] [`_mm512_maskz_srlv_epi16`]
* [x] [`_mm512_srlv_epi16`]
* [_] [`_store_mask32`]
* [_] [`_store_mask64`]
* [_] [`_mm512_mask_storeu_epi16`]
* [x] [`_mm512_storeu_epi16`]
* [_] [`_mm512_mask_storeu_epi8`]
* [x] [`_mm512_storeu_epi8`]
* [x] [`_mm512_mask_sub_epi16`]
* [x] [`_mm512_maskz_sub_epi16`]
* [x] [`_mm512_sub_epi16`]
* [x] [`_mm512_mask_sub_epi8`]
* [x] [`_mm512_maskz_sub_epi8`
* [x] [`_mm512_sub_epi8`]
* [x] [`_mm512_mask_subs_epi16`]
* [x] [`_mm512_maskz_subs_epi16`]
* [x] [`_mm512_subs_epi16`]
* [x] [`_mm512_mask_subs_epi8`]
* [x] [`_mm512_maskz_subs_epi8`]
* [x] [`_mm512_subs_epi8`]
* [x] [`_mm512_mask_subs_epu16`]
* [x] [`_mm512_maskz_subs_epu16`]
* [x] [`_mm512_subs_epu16`]
* [x] [`_mm512_mask_subs_epu8`]
* [x] [`_mm512_maskz_subs_epu8`]
* [x] [`_mm512_subs_epu8`]
* [_] [`_mm512_mask_test_epi16_mask`]
* [_] [`_mm512_test_epi16_mask`]
* [_] [`_mm512_mask_test_epi8_mask`]
* [_] [`_mm512_test_epi8_mask`]
* [_] [`_mm512_mask_testn_epi16_mask`]
* [_] [`_mm512_testn_epi16_mask`]
* [_] [`_mm512_mask_testn_epi8_mask`]
* [_] [`_mm512_testn_epi8_mask`]
* [x] [`_mm512_mask_unpackhi_epi16`]
* [x] [`_mm512_maskz_unpackhi_epi16`]
* [x] [`_mm512_unpackhi_epi16`]
* [x] [`_mm512_mask_unpackhi_epi8`]
* [x] [`_mm512_maskz_unpackhi_epi8`]
* [x] [`_mm512_unpackhi_epi8`]
* [x] [`_mm512_mask_unpacklo_epi16`]
* [x] [`_mm512_maskz_unpacklo_epi16`]
* [x] [`_mm512_unpacklo_epi16`]
* [x] [`_mm512_mask_unpacklo_epi8`]
* [x] [`_mm512_maskz_unpacklo_epi8`]
* [x] [`_mm512_unpacklo_epi8`]

</p>
Loading