llvm
diff --git a/‎compiler-rt/lib/builtins/extendhfdf2.c
Lines changed: 0 additions & 2 deletions b/‎compiler-rt/lib/builtins/extendhfdf2.c
Lines changed: 0 additions & 2 deletions
diff --git a/‎llvm/lib/Target/SystemZ/SystemZISelLowering.cpp
Lines changed: 228 additions & 108 deletions b/‎llvm/lib/Target/SystemZ/SystemZISelLowering.cpp
Lines changed: 228 additions & 108 deletions
diff --git a/‎llvm/lib/Target/SystemZ/SystemZISelLowering.h
Lines changed: 3 additions & 2 deletions b/‎llvm/lib/Target/SystemZ/SystemZISelLowering.h
Lines changed: 3 additions & 2 deletions
diff --git a/‎llvm/lib/Target/SystemZ/SystemZInstrVector.td
Lines changed: 2 additions & 2 deletions b/‎llvm/lib/Target/SystemZ/SystemZInstrVector.td
Lines changed: 2 additions & 2 deletions
diff --git a/‎llvm/test/CodeGen/SystemZ/atomic-load-10.ll
Lines changed: 1 addition & 1 deletion b/‎llvm/test/CodeGen/SystemZ/atomic-load-10.ll
Lines changed: 1 addition & 1 deletion
diff --git a/‎llvm/test/CodeGen/SystemZ/fp-abs-01.ll
Lines changed: 3 additions & 2 deletions b/‎llvm/test/CodeGen/SystemZ/fp-abs-01.ll
Lines changed: 3 additions & 2 deletions
diff --git a/‎llvm/test/CodeGen/SystemZ/fp-abs-03.ll
Lines changed: 3 additions & 3 deletions b/‎llvm/test/CodeGen/SystemZ/fp-abs-03.ll
Lines changed: 3 additions & 3 deletions
diff --git a/‎llvm/test/CodeGen/SystemZ/fp-conv-08.ll
Lines changed: 3 additions & 1 deletion b/‎llvm/test/CodeGen/SystemZ/fp-conv-08.ll
Lines changed: 3 additions & 1 deletion
diff --git a/‎llvm/test/CodeGen/SystemZ/fp-conv-20.ll
Lines changed: 8 additions & 4 deletions b/‎llvm/test/CodeGen/SystemZ/fp-conv-20.ll
Lines changed: 8 additions & 4 deletions
diff --git a/‎llvm/test/CodeGen/SystemZ/fp-copysign-01.ll
Lines changed: 0 additions & 32 deletions b/‎llvm/test/CodeGen/SystemZ/fp-copysign-01.ll
Lines changed: 0 additions & 32 deletions
diff --git a/‎llvm/test/CodeGen/SystemZ/fp-copysign-02.ll
Lines changed: 0 additions & 29 deletions b/‎llvm/test/CodeGen/SystemZ/fp-copysign-02.ll
Lines changed: 0 additions & 29 deletions
diff --git a/‎llvm/test/CodeGen/SystemZ/fp-copysign-03.ll
Lines changed: 65 additions & 0 deletions b/‎llvm/test/CodeGen/SystemZ/fp-copysign-03.ll
Lines changed: 65 additions & 0 deletions
diff --git a/‎llvm/test/CodeGen/SystemZ/fp-half-mem.ll
Lines changed: 4 additions & 6 deletions b/‎llvm/test/CodeGen/SystemZ/fp-half-mem.ll
Lines changed: 4 additions & 6 deletions
diff --git a/‎llvm/test/CodeGen/SystemZ/fp-half-move.ll
Lines changed: 7 additions & 9 deletions b/‎llvm/test/CodeGen/SystemZ/fp-half-move.ll
Lines changed: 7 additions & 9 deletions
diff --git a/‎llvm/test/CodeGen/SystemZ/fp-half-strict.ll
Lines changed: 3 additions & 5 deletions b/‎llvm/test/CodeGen/SystemZ/fp-half-strict.ll
Lines changed: 3 additions & 5 deletions
@@ -10,8 +10,6 @@
 #define DST_DOUBLE
 #include "fp_extend_impl.inc"
 
-// Use a forwarding definition and noinline to implement a poor man's alias,
-// as there isn't a good cross-platform way of defining one.
 COMPILER_RT_ABI NOINLINE dst_t __extendhfdf2(src_t a) {
   return __extendXfYf2__(a);
 }
@@ -627,6 +627,9 @@ class SystemZTargetLowering : public TargetLowering {
                    bool IsSigned, SDLoc DL, bool DoesNotReturn,
                    bool IsReturnValueUsed) const;
 
+  SDValue useLibCall(SelectionDAG &DAG, RTLIB::Libcall LC, MVT VT, SDValue Arg,
+                     SDLoc DL, SDValue Chain, bool IsStrict) const;
+
   bool CanLowerReturn(CallingConv::ID CallConv, MachineFunction &MF,
                       bool isVarArg,
                       const SmallVectorImpl<ISD::OutputArg> &Outs,
@@ -747,9 +750,7 @@ class SystemZTargetLowering : public TargetLowering {
   SDValue lowerFSHR(SDValue Op, SelectionDAG &DAG) const;
   SDValue lowerFP_EXTEND(SDValue Op, SelectionDAG &DAG) const;
   SDValue lower_FP_TO_INT(SDValue Op, SelectionDAG &DAG) const;
-  SDValue lowerSTRICT_FP_TO_INT(SDValue Op, SelectionDAG &DAG) const;
   SDValue lower_INT_TO_FP(SDValue Op, SelectionDAG &DAG) const;
-  SDValue lowerSTRICT_INT_TO_FP(SDValue Op, SelectionDAG &DAG) const;
   SDValue lowerLoadF16(SDValue Op, SelectionDAG &DAG) const;
   SDValue lowerStoreF16(SDValue Op, SelectionDAG &DAG) const;
 
 
@@ -141,7 +141,7 @@ let Predicates = [FeatureVector] in {
   // LEY and LDY offer full 20-bit displacement fields.  It's often better
   // to use those instructions rather than force a 20-bit displacement
   // into a GPR temporary.
-  let mayLoad = 1, canFoldAsLoad = 1 in {
+  let mayLoad = 1, SimpleBDXLoad = 1, canFoldAsLoad = 1 in {
     def VL16 : UnaryAliasVRX<z_load, v16hb, bdxaddr12pair>;
     def VL32 : UnaryAliasVRX<z_load, v32sb, bdxaddr12pair>;
     def VL64 : UnaryAliasVRX<z_load, v64db, bdxaddr12pair>;
@@ -238,7 +238,7 @@ let Predicates = [FeatureVector] in {
   // STEY and STDY offer full 20-bit displacement fields.  It's often better
   // to use those instructions rather than force a 20-bit displacement
   // into a GPR temporary.
-  let mayStore = 1 in {
+  let mayStore = 1, SimpleBDXStore = 1 in {
     def VST16 : StoreAliasVRX<store, v16hb, bdxaddr12pair>;
     def VST32 : StoreAliasVRX<store, v32sb, bdxaddr12pair>;
     def VST64 : StoreAliasVRX<store, v64db, bdxaddr12pair>;
 
@@ -7,7 +7,7 @@
 define half @f1(ptr %src) {
 ; CHECK-LABEL: f1:
 ; CHECK:       # %bb.0:
-; CHECK-NEXT:    lh %r0, 0(%r2)
+; CHECK-NEXT:    lgh %r0, 0(%r2)
 ; CHECK-NEXT:    sllg %r0, %r0, 48
 ; CHECK-NEXT:    ldgr %f0, %r0
 ; CHECK-NEXT:    # kill: def $f0h killed $f0h killed $f0d
 
@@ -7,8 +7,9 @@
 declare half @llvm.fabs.f16(half %f)
 define half @f0(half %f) {
 ; CHECK-LABEL: f0:
-; CHECK: brasl %r14, __extendhfsf2@PLT
-; CHECK: lpdfr %f0, %f0
+; CHECK:      brasl %r14, __extendhfsf2@PLT
+; CHECK-NEXT: lpdfr %f0, %f0
+; CHECK-NEXT: brasl %r14, __truncsfhf2@PLT
 ; CHECK: br %r14
   %res = call half @llvm.fabs.f16(half %f)
   ret half %res
 
@@ -6,9 +6,9 @@
 declare half @llvm.fabs.f16(half %f)
 define half @f0(half %f) {
 ; CHECK-LABEL: f0:
-; CHECK: brasl %r14, __extendhfsf2@PLT
-; CHECK: lpdfr %f0, %f0
-; CHECK: brasl %r14, __truncsfhf2@PLT
+; CHECK:      brasl %r14, __extendhfsf2@PLT
+; CHECK-NEXT: lpdfr %f0, %f0
+; CHECK-NEXT: brasl %r14, __truncsfhf2@PLT
 ; CHECK: br %r14
   %res = call half @llvm.fabs.f16(half %f)
   ret half %res
 
@@ -5,7 +5,9 @@
 ; Test i64->f16. For z10, this results in just a single a libcall.
 define half @f0(i64 %i) {
 ; CHECK-LABEL: f0:
-; CHECK: brasl %r14, __floatundihf@PLT
+; CHECK: cegbr
+; CHECK: aebr
+; CHECK: brasl %r14, __truncsfhf2@PLT
 ; CHECK: br %r14
   %conv = uitofp i64 %i to half
   ret half %conv
 
@@ -33,7 +33,8 @@ define float @f3(i128 %i) {
 ; Test signed i128->f16.
 define half @f4(i128 %i) {
 ; CHECK-LABEL: f4:
-; CHECK: brasl %r14, __floattihf@PLT
+; CHECK: brasl   %r14, __floattisf@PLT
+; CHECK: brasl   %r14, __truncsfhf2@PLT
 ; CHECK: br %r14
   %conv = sitofp i128 %i to half
   ret half %conv
@@ -69,7 +70,8 @@ define float @f7(i128 %i) {
 ; Test unsigned i128->f16.
 define half @f8(i128 %i) {
 ; CHECK-LABEL: f8:
-; CHECK: brasl %r14, __floatuntihf@PLT
+; CHECK: brasl   %r14, __floatuntisf@PLT
+; CHECK: brasl   %r14, __truncsfhf2@PLT
 ; CHECK: br %r14
   %conv = uitofp i128 %i to half
   ret half %conv
@@ -105,7 +107,8 @@ define i128 @f11(float %f) {
 ; Test signed f16->i128.
 define i128 @f12(half %f) {
 ; CHECK-LABEL: f12:
-; CHECK: brasl %r14, __fixhfti@PLT
+; CHECK: brasl %r14, __extendhfsf2@PLT
+; CHECK: brasl %r14, __fixsfti@PLT
 ; CHECK: br %r14
   %conv = fptosi half %f to i128
   ret i128 %conv
@@ -141,7 +144,8 @@ define i128 @f15(float %f) {
 ; Test unsigned f16->i128.
 define i128 @f16(half %f) {
 ; CHECK-LABEL: f16:
-; CHECK: brasl %r14, __fixunshfti@PLT
+; CHECK: brasl %r14, __extendhfsf2@PLT
+; CHECK: brasl %r14, __fixunssfti@PLT
 ; CHECK: br %r14
   %conv = fptoui half %f to i128
   ret i128 %conv
 
@@ -2,23 +2,11 @@
 ;
 ; RUN: llc < %s -mtriple=s390x-linux-gnu | FileCheck %s
 
-declare half @copysignh(half, half) readnone
 declare float @copysignf(float, float) readnone
 declare double @copysign(double, double) readnone
 ; FIXME: not really the correct prototype for SystemZ.
 declare fp128 @copysignl(fp128, fp128) readnone
 
-; Test f32 copies in which the sign comes from an f16.
-define float @f0(float %a, half %bh) {
-; CHECK-LABEL: f0:
-; CHECK: brasl %r14, __extendhfsf2@PLT
-; CHECK: cpsdr %f0, %f0, %f8
-; CHECK: br %r14
-  %b = fpext half %bh to float
-  %res = call float @copysignf(float %a, float %b) readnone
-  ret float %res
-}
-
 ; Test f32 copies in which the sign comes from an f32.
 define float @f1(float %a, float %b) {
 ; CHECK-LABEL: f1:
@@ -138,23 +126,3 @@ define void @f9(ptr %cptr, ptr %aptr, ptr %bptr) {
   store fp128 %c, ptr %cptr
   ret void
 }
-
-; Test f16 copies in which the sign comes from an f16.
-define half @f10(half %a, half %b) {
-; CHECK-LABEL: f10:
-; CHECK: brasl %r14, copysignh@PLT
-; CHECK: br %r14
-  %res = call half @copysignh(half %a, half %b) readnone
-  ret half %res
-}
-
-; Test f16 copies in which the sign comes from an f32.
-define half @f11(half %a, float %bf) {
-; CHECK-LABEL: f11:
-; CHECK: brasl %r14, __truncsfhf2@PLT
-; CHECK: brasl %r14, copysignh@PLT
-; CHECK: br %r14
-  %b = fptrunc float %bf to half
-  %res = call half @copysignh(half %a, half %b) readnone
-  ret half %res
-}
@@ -2,25 +2,11 @@
 ;
 ; RUN: llc < %s -mtriple=s390x-linux-gnu -mcpu=z14 | FileCheck %s
 
-declare half @copysignh(half, half) readnone
 declare float @copysignf(float, float) readnone
 declare double @copysign(double, double) readnone
 ; FIXME: not really the correct prototype for SystemZ.
 declare fp128 @copysignl(fp128, fp128) readnone
 
-; Test f16 copies in which the sign comes from an f128.
-define half @f0(half %a, ptr %bptr) {
-; CHECK-LABEL: f0:
-; CHECK: vl %v[[REG:[0-9]+]], 0(%r2)
-; CHECK: brasl %r14, __trunctfhf2@PLT
-; CHECK: brasl %r14, copysignh@PLT
-; CHECK: br %r14
-  %bl = load volatile fp128, ptr %bptr
-  %b = fptrunc fp128 %bl to half
-  %res = call half @copysignh(half %a, half %b) readnone
-  ret half %res
-}
-
 ; Test f32 copies in which the sign comes from an f128.
 define float @f1(float %a, ptr %bptr) {
 ; CHECK-LABEL: f1:
@@ -45,21 +31,6 @@ define double @f2(double %a, ptr %bptr) {
   ret double %res
 }
 
-; Test f128 copies in which the sign comes from an f16.
-define void @f7_half(ptr %cptr, ptr %aptr, half %bh) {
-; CHECK-LABEL: f7_half:
-; CHECK: vl [[REG1:%v[0-7]+]], 0(%r3)
-; CHECK: vsteh   %v0, 164(%r15), 0
-; CHECK: tm      164(%r15), 128
-; CHECK: wflnxb [[REG2:%v[0-9]+]], [[REG1]]
-; CHECK: wflpxb [[REG2]], [[REG1]]
-  %a = load volatile fp128, ptr %aptr
-  %b = fpext half %bh to fp128
-  %c = call fp128 @copysignl(fp128 %a, fp128 %b) readnone
-  store fp128 %c, ptr %cptr
-  ret void
-}
-
 ; Test f128 copies in which the sign comes from an f32.
 define void @f7(ptr %cptr, ptr %aptr, float %bf) {
 ; CHECK-LABEL: f7:
 
@@ -0,0 +1,65 @@
+; Test copysign intrinsics involving half.
+;
+; RUN: llc < %s -mtriple=s390x-linux-gnu | FileCheck %s
+
+declare half @llvm.copysign.f16(half, half)
+declare float @llvm.copysign.f32(float, float)
+declare double @llvm.copysign.f64(double, double)
+
+; Test f16 copies.
+define half @f0(half %a, half %b) {
+; CHECK-LABEL: f0:
+; CHECK: brasl %r14, __extendhfsf2@PLT
+; CHECK: brasl %r14, __extendhfsf2@PLT
+; CHECK: cpsdr %f0, %f9, %f0
+; CHECK: brasl %r14, __truncsfhf2@PLT
+; CHECK: br %r14
+  %res = call half @llvm.copysign.f16(half %a, half %b)
+  ret half %res
+}
+
+; Test f16 copies where the sign comes from an f32.
+define half @f1(half %a, float %b) {
+; CHECK-LABEL: f1:
+; CHECK: brasl %r14, __extendhfsf2@PLT
+; CHECK: cpsdr %f0, %f8, %f0
+; CHECK: brasl %r14, __truncsfhf2@PLT
+; CHECK: br %r14
+  %bh = fptrunc float %b to half
+  %res = call half @llvm.copysign.f16(half %a, half %bh)
+  ret half %res
+}
+
+; Test f16 copies where the sign comes from an f64.
+define half @f2(half %a, double %b) {
+; CHECK-LABEL: f2:
+; CHECK: brasl %r14, __extendhfdf2@PLT
+; CHECK: cpsdr %f0, %f8, %f0
+; CHECK: brasl %r14, __truncdfhf2@PLT
+; CHECK: br %r14
+  %bh = fptrunc double %b to half
+  %res = call half @llvm.copysign.f16(half %a, half %bh)
+  ret half %res
+}
+
+; Test f32 copies in which the sign comes from an f16.
+define float @f3(float %a, half %b) {
+; CHECK-LABEL: f3:
+; CHECK: brasl %r14, __extendhfsf2@PLT
+; CHECK: cpsdr %f0, %f0, %f8
+; CHECK: br %r14
+  %bf = fpext half %b to float
+  %res = call float @llvm.copysign.f32(float %a, float %bf)
+  ret float %res
+}
+
+; Test f64 copies in which the sign comes from an f16.
+define double @f4(double %a, half %b) {
+; CHECK-LABEL: f4:
+; CHECK: brasl %r14, __extendhfdf2@PLT
+; CHECK: cpsdr %f0, %f0, %f8
+; CHECK: br %r14
+  %bd = fpext half %b to double
+  %res = call double @llvm.copysign.f64(double %a, double %bd)
+  ret double %res
+}
@@ -17,9 +17,8 @@ define half @f1() {
 ; NOVEC-NEXT:    .cfi_def_cfa_offset 328
 ; NOVEC-NEXT:    la %r2, 166(%r15)
 ; NOVEC-NEXT:    brasl %r14, foo@PLT
-; NOVEC-NEXT:    lh %r0, 166(%r15)
-; NOVEC-NEXT:    sll %r0, 16
-; NOVEC-NEXT:    risbhg %r0, %r0, 0, 159, 32
+; NOVEC-NEXT:    lgh %r0, 166(%r15)
+; NOVEC-NEXT:    sllg %r0, %r0, 48
 ; NOVEC-NEXT:    ldgr %f0, %r0
 ; NOVEC-NEXT:    # kill: def $f0h killed $f0h killed $f0d
 ; NOVEC-NEXT:    lmg %r14, %r15, 280(%r15)
@@ -48,9 +47,8 @@ define half @f1() {
 define half @f2(ptr %P) {
 ; NOVEC-LABEL: f2:
 ; NOVEC:       # %bb.0:
-; NOVEC-NEXT:    lh %r0, 6(%r2)
-; NOVEC-NEXT:    sll %r0, 16
-; NOVEC-NEXT:    risbhg %r0, %r0, 0, 159, 32
+; NOVEC-NEXT:    lgh %r0, 6(%r2)
+; NOVEC-NEXT:    sllg %r0, %r0, 48
 ; NOVEC-NEXT:    ldgr %f0, %r0
 ; NOVEC-NEXT:    # kill: def $f0h killed $f0h killed $f0d
 ; NOVEC-NEXT:    br %r14
 
@@ -10,9 +10,8 @@ define half @f1(ptr %ptr) {
 ; NOVEC-LABEL: f1:
 ; NOVEC:       # %bb.0:
 ; NOVEC-NEXT:    lh %r0, 0(%r2)
-; NOVEC-NEXT:    sll %r0, 16
-; NOVEC-NEXT:    oilh %r0, 255
-; NOVEC-NEXT:    risbhg %r0, %r0, 0, 159, 32
+; NOVEC-NEXT:    oill %r0, 255
+; NOVEC-NEXT:    sllg %r0, %r0, 48
 ; NOVEC-NEXT:    ldgr %f0, %r0
 ; NOVEC-NEXT:    # kill: def $f0h killed $f0h killed $f0d
 ; NOVEC-NEXT:    br %r14
@@ -32,8 +31,8 @@ define half @f1(ptr %ptr) {
 define half @f2(i16 %Arg) {
 ; NOVEC-LABEL: f2:
 ; NOVEC:       # %bb.0:
-; NOVEC-NEXT:    sll %r2, 16
-; NOVEC-NEXT:    risbhg %r0, %r2, 0, 159, 32
+; NOVEC-NEXT:    # kill: def $r2l killed $r2l def $r2d
+; NOVEC-NEXT:    sllg %r0, %r2, 48
 ; NOVEC-NEXT:    ldgr %f0, %r0
 ; NOVEC-NEXT:    # kill: def $f0h killed $f0h killed $f0d
 ; NOVEC-NEXT:    br %r14
@@ -51,8 +50,7 @@ define void @f3(half %val, ptr %ptr) {
 ; NOVEC:       # %bb.0:
 ; NOVEC-NEXT:    # kill: def $f0h killed $f0h def $f0d
 ; NOVEC-NEXT:    lgdr %r0, %f0
-; NOVEC-NEXT:    risblg %r0, %r0, 0, 159, 32
-; NOVEC-NEXT:    srl %r0, 16
+; NOVEC-NEXT:    srlg %r0, %r0, 48
 ; NOVEC-NEXT:    stc %r0, 0(%r2)
 ; NOVEC-NEXT:    br %r14
 ;
@@ -72,8 +70,8 @@ define i16 @f4(half %Arg) {
 ; NOVEC:       # %bb.0:
 ; NOVEC-NEXT:    # kill: def $f0h killed $f0h def $f0d
 ; NOVEC-NEXT:    lgdr %r0, %f0
-; NOVEC-NEXT:    risblg %r2, %r0, 0, 159, 32
-; NOVEC-NEXT:    srl %r2, 16
+; NOVEC-NEXT:    srlg %r2, %r0, 48
+; NOVEC-NEXT:    # kill: def $r2l killed $r2l killed $r2d
 ; NOVEC-NEXT:    br %r14
 ;
 ; VECTOR-LABEL: f4:
 
@@ -77,9 +77,8 @@ define void @fun1(ptr %Src, ptr %Dst) #0 {
 ; NOVEC-NEXT:    .cfi_offset %r15, -40
 ; NOVEC-NEXT:    aghi %r15, -160
 ; NOVEC-NEXT:    .cfi_def_cfa_offset 320
-; NOVEC-NEXT:    lh %r0, 0(%r2)
-; NOVEC-NEXT:    sll %r0, 16
-; NOVEC-NEXT:    risbhg %r0, %r0, 0, 159, 32
+; NOVEC-NEXT:    lgh %r0, 0(%r2)
+; NOVEC-NEXT:    sllg %r0, %r0, 48
 ; NOVEC-NEXT:    lgr %r13, %r3
 ; NOVEC-NEXT:    ldgr %f0, %r0
 ; NOVEC-NEXT:    # kill: def $f0h killed $f0h killed $f0d
@@ -88,8 +87,7 @@ define void @fun1(ptr %Src, ptr %Dst) #0 {
 ; NOVEC-NEXT:    brasl %r14, __truncdfhf2@PLT
 ; NOVEC-NEXT:    # kill: def $f0h killed $f0h def $f0d
 ; NOVEC-NEXT:    lgdr %r0, %f0
-; NOVEC-NEXT:    risblg %r0, %r0, 0, 159, 32
-; NOVEC-NEXT:    srl %r0, 16
+; NOVEC-NEXT:    srlg %r0, %r0, 48
 ; NOVEC-NEXT:    sth %r0, 0(%r13)
 ; NOVEC-NEXT:    bcr 14, %r0
 ; NOVEC-NEXT:    lmg %r13, %r15, 264(%r15)
Original file line number	Diff line number	Diff line change
`@@ -10,8 +10,6 @@`
`10`	`10`	`#define DST_DOUBLE`
`11`	`11`	`#include "fp_extend_impl.inc"`
`12`	`12`
`13`		`-// Use a forwarding definition and noinline to implement a poor man's alias,`
`14`		`-// as there isn't a good cross-platform way of defining one.`
`15`	`13`	`COMPILER_RT_ABI NOINLINE dst_t __extendhfdf2(src_t a) {`
`16`	`14`	`return __extendXfYf2__(a);`
`17`	`15`	`}`