Avx512f #933

minybot · 2020-10-19T16:57:40Z

mask_fmsub: ss,sd; fmsub_round: ss,sd;
fnmadd: ss,sd; fnmsub: ss,sd; fnmadd_round: ss,sd; fnmsub_round: ss,sd;
fixupimm: ss,sd; fixupimm_round: ss,sd;
cvt_roundss_sd, cvtss_sd, cvtroundsd_ss, cvtsd_ss;
cvt_roundss_si32, cvt_roundss_i32, cvt_roundss_si64, cvt_roundss_i64, cvtss_i32, cvt_roundss_u32, cvt_roundss_u64, cvtss_i64, cvtss_u32, cvtss_u64;
cvt_roundsd_si32, cvt_roundsd_i32, cvt_roundsd_si64, cvt_roundsd_i64, cvtsd_i32, cvt_roundsd_u32, cvt_roundsd_u64, cvtsd_i64, cvtsd_u32, cvtsd_u64;
cvt_roundsi32_ss, cvt_roundi32_ss, cvt_roundsi64_ss, cvt_roundi64_ss, cvt_roundsi64_sd, cvt_roundi64_sd, cvt_roundu32_ss, cvt_roundu64_ss, cvt_roundu64_sd;
cvti32_ss; cvti32_sd; cvti64_ss; cvti64_sd;
cvtt_roundsd_si32, cvtt_roundsd_i32, cvtt_roundsd_si64, cvtt_roundsd_i64, cvttsd_i32, cvtt_roundsd_u32, cvtt_roundsd_u64, cvttsd_i64, cvttsd_u32, cvttsd_u64, cvtt_roundss_si32, cvtt_roundss_i32, cvtt_roundss_si64, cvtt_roundss_i64, cvttss_i32, cvtt_roundss_u32, cvtt_roundss_u64, cvttss_i64, cvttss_u32, cvttss_u64;
cvtu32_ss, cvtu32_sd, cvtu64_ss, cvtu64_sd;
mm_comi_ss; mm_comi_sd;

merge

merge from base

merge base

… cvtss_i32, cvt_roundss_u32, cvt_roundss_u64, cvtss_i64, cvtss_u32, cvtss_u64

… cvtsd_i32, cvt_roundsd_u32, cvt_roundsd_u64, cvtsd_i64, cvtsd_u32, cvtsd_u64

… cvt_roundsi64_sd, cvt_roundi64_sd, cvt_roundu32_ss, cvt_roundu64_ss, cvt_roundu64_sd

…i64, cvttsd_i32, cvtt_roundsd_u32, cvtt_roundsd_u64, cvttsd_i64, cvttsd_u32, cvttsd_u64, cvtt_roundss_si32, cvtt_roundss_i32, cvtt_roundss_si64, cvtt_roundss_i64, cvttss_i32, cvtt_roundss_u32, cvtt_roundss_u64, cvttss_i64, cvttss_u32, cvttss_u64;

rust-highfive · 2020-10-19T16:57:43Z

r? @Amanieu

(rust_highfive has picked a reviewer for you, use r? to override)

minybot · 2020-10-20T22:13:28Z

It seems "mm_cvt_roundss_si64()" ..., i64,si64 cause i686-unknown-linux-gnu test error.

Amanieu · 2020-11-02T00:47:09Z

crates/core_arch/src/x86/avx512f.rs

+/// [Intel's documentation](https://software.intel.com/sites/landingpage/IntrinsicsGuide/#text=mm_mask_fmsub_ss&expand=2668)
+#[inline]
+#[target_feature(enable = "avx512f")]
+#[cfg_attr(test, assert_instr(vfmadd213ss))] //should be vfmsub213ss


This seems wrong: it should be generating the vfmsub213ss instruction. Maybe you need to invoke the subtract intrinsic directly instead of negating extractc.

I follow LLVM code, it uses llvm.fma.f32. I think vfmadd213ss and vfmsub213ss have the same latency, and vfmaddss comes first when generating.

__m128 test_mm_mask3_fmsub_ss(__m128 __W, __m128 __X, __m128 __Y, __mmask8 __U){
// CHECK-LABEL: @test_mm_mask3_fmsub_ss
// CHECK: [[NEG:%.+]] = fneg <4 x float> [[ORIGC:%.+]]
// CHECK: [[A:%.+]] = extractelement <4 x float> %{{.}}, i64 0
// CHECK-NEXT: [[B:%.+]] = extractelement <4 x float> %{{.}}, i64 0
// CHECK-NEXT: [[C:%.+]] = extractelement <4 x float> [[NEG]], i64 0
// CHECK-NEXT: [[FMA:%.+]] = call float @llvm.fma.f32(float [[A]], float [[B]], float [[C]])
// CHECK-NEXT: [[C2:%.+]] = extractelement <4 x float> [[ORIGC]], i64 0
// CHECK-NEXT: bitcast i8 %{{.}} to <8 x i1>
// CHECK-NEXT: extractelement <8 x i1> %{{.}}, i64 0
// CHECK-NEXT: [[SEL:%.+]] = select i1 %{{.*}}, float [[FMA]], float [[C2]]
// CHECK-NEXT: insertelement <4 x float> [[ORIGC]], float [[SEL]], i64 0
return _mm_mask3_fmsub_ss(__W, __X, __Y, __U);
}

I think the problem is that you are using 0. - extractc instead of -extractc. The former is a subtraction while the latter is a negation. They have different behavior in edge cases like negative zero.

minybot added 20 commits September 4, 2020 20:36

Merge pull request #1 from rust-lang/master

731dc70

merge

Merge pull request #3 from rust-lang/master

72ff3d7

merge from base

Merge pull request #4 from rust-lang/master

bcc2a2c

merge base

Merge remote-tracking branch 'upstream/master'

9b729dc

Merge remote-tracking branch 'upstream/master'

123faf2

Merge remote-tracking branch 'upstream/master'

6e9ddb1

Merge remote-tracking branch 'upstream/master'

27b6812

Merge remote-tracking branch 'upstream/master'

c164a2f

mask_fmsub: ss,sd; fmsub_round: ss,sd;

9078104

fnmadd: ss,sd; fnmsub: ss,sd; fnmadd_round: ss,sd; fnmsub_round: ss,sd;

57d652d

fixupimm: ss,sd; fixupimm_round: ss,sd;

f620cc3

cvt_roundss_sd, cvtss_sd, cvtroundsd_ss, cvtsd_ss

e446e01

cvt_roundss_si32, cvt_roundss_i32, cvt_roundss_si64, cvt_roundss_i64,…

9618c7e

… cvtss_i32, cvt_roundss_u32, cvt_roundss_u64, cvtss_i64, cvtss_u32, cvtss_u64

cvt_roundsd_si32, cvt_roundsd_i32, cvt_roundsd_si64, cvt_roundsd_i64,…

4d73d80

… cvtsd_i32, cvt_roundsd_u32, cvt_roundsd_u64, cvtsd_i64, cvtsd_u32, cvtsd_u64

cvt_roundsi32_ss, cvt_roundi32_ss, cvt_roundsi64_ss, cvt_roundi64_ss,…

dbb1bfd

… cvt_roundsi64_sd, cvt_roundi64_sd, cvt_roundu32_ss, cvt_roundu64_ss, cvt_roundu64_sd

cvti32_ss; cvti32_sd; cvti64_ss; cvti64_sd;

d25fd1f

cvtu32_ss, cvtu32_sd, cvtu64_ss, cvtu64_sd;

4cb4889

mm_comi_ss; mm_comi_sd;

46ea324

fix x86/macro.rs

4788e47

rust-highfive assigned Amanieu Oct 19, 2020

minybot added 2 commits October 19, 2020 18:17

512_kunpackb

348278f

512_kortestc

5138879

minybot added 2 commits October 22, 2020 00:24

fix document link error; unify the document format

0a92030

remove cvt,cvtt i64,si64,u64 because i686 crash llvm

e7b43e7

Amanieu reviewed Nov 2, 2020

View reviewed changes

fix mm_fmsub, mm_fnmadd, mm_fnmsub

c6ac764

Amanieu merged commit 2acca02 into rust-lang:master Nov 7, 2020

minybot deleted the avx512f branch November 9, 2020 11:22

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Avx512f #933

Avx512f #933

Uh oh!

minybot commented Oct 19, 2020

Uh oh!

rust-highfive commented Oct 19, 2020

Uh oh!

minybot commented Oct 20, 2020

Uh oh!

Amanieu Nov 2, 2020

Uh oh!

minybot Nov 2, 2020

Uh oh!

Amanieu Nov 2, 2020

Uh oh!

Uh oh!

Avx512f #933

Avx512f #933

Uh oh!

Conversation

minybot commented Oct 19, 2020

Uh oh!

rust-highfive commented Oct 19, 2020

Uh oh!

minybot commented Oct 20, 2020

Uh oh!

Amanieu Nov 2, 2020

Choose a reason for hiding this comment

Uh oh!

minybot Nov 2, 2020

Choose a reason for hiding this comment

Uh oh!

Amanieu Nov 2, 2020

Choose a reason for hiding this comment

Uh oh!

Uh oh!