espressif
diff --git a/‎llvm/test/CodeGen/RISCV/RISCVSplitLoopByLength/add.ll
Lines changed: 67 additions & 0 deletions b/‎llvm/test/CodeGen/RISCV/RISCVSplitLoopByLength/add.ll
Lines changed: 67 additions & 0 deletions
diff --git a/‎llvm/test/CodeGen/RISCV/RISCVSplitLoopByLength/addc.ll
Lines changed: 57 additions & 0 deletions b/‎llvm/test/CodeGen/RISCV/RISCVSplitLoopByLength/addc.ll
Lines changed: 57 additions & 0 deletions
diff --git a/‎llvm/test/CodeGen/RISCV/RISCVSplitLoopByLength/biquad.ll
Lines changed: 91 additions & 0 deletions b/‎llvm/test/CodeGen/RISCV/RISCVSplitLoopByLength/biquad.ll
Lines changed: 91 additions & 0 deletions
diff --git a/‎llvm/test/CodeGen/RISCV/RISCVSplitLoopByLength/dotprod.ll
Lines changed: 46 additions & 0 deletions b/‎llvm/test/CodeGen/RISCV/RISCVSplitLoopByLength/dotprod.ll
Lines changed: 46 additions & 0 deletions
diff --git a/‎llvm/test/CodeGen/RISCV/RISCVSplitLoopByLength/dotprode.ll
Lines changed: 50 additions & 0 deletions b/‎llvm/test/CodeGen/RISCV/RISCVSplitLoopByLength/dotprode.ll
Lines changed: 50 additions & 0 deletions
@@ -0,0 +1,67 @@
+; NOTE: Assertions have been autogenerated by utils/update_test_checks.py UTC_ARGS: --version 4
+; RUN: opt -S -mtriple=riscv32-esp-unknown-elf -passes=riscv-split-loop-by-length -riscv-split-loop-by-length=false < %s | FileCheck %s
+; Function Attrs: nofree norecurse nosync nounwind memory(argmem: readwrite)
+define dso_local noundef i32 @dsps_add_f32_ansi(ptr noundef readonly %input1, ptr noundef readonly %input2, ptr noundef writeonly %output, i32 noundef %len, i32 noundef %step1, i32 noundef %step2, i32 noundef %step_out) local_unnamed_addr {
+; CHECK-LABEL: define dso_local noundef i32 @dsps_add_f32_ansi(
+; CHECK-SAME: ptr noundef readonly [[INPUT1:%.*]], ptr noundef readonly [[INPUT2:%.*]], ptr noundef writeonly [[OUTPUT:%.*]], i32 noundef [[LEN:%.*]], i32 noundef [[STEP1:%.*]], i32 noundef [[STEP2:%.*]], i32 noundef [[STEP_OUT:%.*]]) local_unnamed_addr {
+; CHECK-NEXT:  entry:
+; CHECK-NEXT:    [[CMP:%.*]] = icmp eq ptr [[INPUT1]], null
+; CHECK-NEXT:    [[CMP1:%.*]] = icmp eq ptr [[INPUT2]], null
+; CHECK-NEXT:    [[OR_COND:%.*]] = or i1 [[CMP]], [[CMP1]]
+; CHECK-NEXT:    [[CMP4:%.*]] = icmp eq ptr [[OUTPUT]], null
+; CHECK-NEXT:    [[OR_COND19:%.*]] = or i1 [[OR_COND]], [[CMP4]]
+; CHECK-NEXT:    br i1 [[OR_COND19]], label [[RETURN:%.*]], label [[FOR_COND_PREHEADER:%.*]]
+; CHECK:       for.cond.preheader:
+; CHECK-NEXT:    [[CMP720:%.*]] = icmp sgt i32 [[LEN]], 0
+; CHECK-NEXT:    br i1 [[CMP720]], label [[FOR_BODY:%.*]], label [[RETURN]]
+; CHECK:       for.body:
+; CHECK-NEXT:    [[I_021:%.*]] = phi i32 [ [[INC:%.*]], [[FOR_BODY]] ], [ 0, [[FOR_COND_PREHEADER]] ]
+; CHECK-NEXT:    [[MUL:%.*]] = mul nsw i32 [[I_021]], [[STEP1]]
+; CHECK-NEXT:    [[ARRAYIDX:%.*]] = getelementptr inbounds float, ptr [[INPUT1]], i32 [[MUL]]
+; CHECK-NEXT:    [[TMP0:%.*]] = load float, ptr [[ARRAYIDX]], align 4
+; CHECK-NEXT:    [[MUL8:%.*]] = mul nsw i32 [[I_021]], [[STEP2]]
+; CHECK-NEXT:    [[ARRAYIDX9:%.*]] = getelementptr inbounds float, ptr [[INPUT2]], i32 [[MUL8]]
+; CHECK-NEXT:    [[TMP1:%.*]] = load float, ptr [[ARRAYIDX9]], align 4
+; CHECK-NEXT:    [[ADD:%.*]] = fadd float [[TMP0]], [[TMP1]]
+; CHECK-NEXT:    [[MUL10:%.*]] = mul nsw i32 [[I_021]], [[STEP_OUT]]
+; CHECK-NEXT:    [[ARRAYIDX11:%.*]] = getelementptr inbounds float, ptr [[OUTPUT]], i32 [[MUL10]]
+; CHECK-NEXT:    store float [[ADD]], ptr [[ARRAYIDX11]], align 4
+; CHECK-NEXT:    [[INC]] = add nuw nsw i32 [[I_021]], 1
+; CHECK-NEXT:    [[EXITCOND_NOT:%.*]] = icmp eq i32 [[INC]], [[LEN]]
+; CHECK-NEXT:    br i1 [[EXITCOND_NOT]], label [[RETURN]], label [[FOR_BODY]]
+; CHECK:       return:
+; CHECK-NEXT:    [[RETVAL_0:%.*]] = phi i32 [ 458755, [[ENTRY:%.*]] ], [ 0, [[FOR_COND_PREHEADER]] ], [ 0, [[FOR_BODY]] ]
+; CHECK-NEXT:    ret i32 [[RETVAL_0]]
+;
+entry:
+  %cmp = icmp eq ptr %input1, null
+  %cmp1 = icmp eq ptr %input2, null
+  %or.cond = or i1 %cmp, %cmp1
+  %cmp4 = icmp eq ptr %output, null
+  %or.cond19 = or i1 %or.cond, %cmp4
+  br i1 %or.cond19, label %return, label %for.cond.preheader
+
+for.cond.preheader:                               ; preds = %entry
+  %cmp720 = icmp sgt i32 %len, 0
+  br i1 %cmp720, label %for.body, label %return
+
+for.body:                                         ; preds = %for.body, %for.cond.preheader
+  %i.021 = phi i32 [ %inc, %for.body ], [ 0, %for.cond.preheader ]
+  %mul = mul nsw i32 %i.021, %step1
+  %arrayidx = getelementptr inbounds float, ptr %input1, i32 %mul
+  %0 = load float, ptr %arrayidx, align 4
+  %mul8 = mul nsw i32 %i.021, %step2
+  %arrayidx9 = getelementptr inbounds float, ptr %input2, i32 %mul8
+  %1 = load float, ptr %arrayidx9, align 4
+  %add = fadd float %0, %1
+  %mul10 = mul nsw i32 %i.021, %step_out
+  %arrayidx11 = getelementptr inbounds float, ptr %output, i32 %mul10
+  store float %add, ptr %arrayidx11, align 4
+  %inc = add nuw nsw i32 %i.021, 1
+  %exitcond.not = icmp eq i32 %inc, %len
+  br i1 %exitcond.not, label %return, label %for.body
+
+return:                                           ; preds = %for.body, %for.cond.preheader, %entry
+  %retval.0 = phi i32 [ 458755, %entry ], [ 0, %for.cond.preheader ], [ 0, %for.body ]
+  ret i32 %retval.0
+}
@@ -0,0 +1,57 @@
+; NOTE: Assertions have been autogenerated by utils/update_test_checks.py UTC_ARGS: --version 4
+; RUN: opt -S -mtriple=riscv32-esp-unknown-elf -passes=riscv-split-loop-by-length -riscv-split-loop-by-length=false < %s | FileCheck %s
+; Function Attrs: nofree norecurse nosync nounwind memory(argmem: readwrite)
+define dso_local noundef i32 @dsps_addc_f32_ansi(ptr noundef readonly %input, ptr noundef writeonly %output, i32 noundef %len, float noundef %C, i32 noundef %step_in, i32 noundef %step_out) local_unnamed_addr {
+; CHECK-LABEL: define dso_local noundef i32 @dsps_addc_f32_ansi(
+; CHECK-SAME: ptr noundef readonly [[INPUT:%.*]], ptr noundef writeonly [[OUTPUT:%.*]], i32 noundef [[LEN:%.*]], float noundef [[C:%.*]], i32 noundef [[STEP_IN:%.*]], i32 noundef [[STEP_OUT:%.*]]) local_unnamed_addr {
+; CHECK-NEXT:  entry:
+; CHECK-NEXT:    [[CMP:%.*]] = icmp eq ptr [[INPUT]], null
+; CHECK-NEXT:    [[CMP1:%.*]] = icmp eq ptr [[OUTPUT]], null
+; CHECK-NEXT:    [[OR_COND:%.*]] = or i1 [[CMP]], [[CMP1]]
+; CHECK-NEXT:    br i1 [[OR_COND]], label [[RETURN:%.*]], label [[FOR_COND_PREHEADER:%.*]]
+; CHECK:       for.cond.preheader:
+; CHECK-NEXT:    [[CMP412:%.*]] = icmp sgt i32 [[LEN]], 0
+; CHECK-NEXT:    br i1 [[CMP412]], label [[FOR_BODY:%.*]], label [[RETURN]]
+; CHECK:       for.body:
+; CHECK-NEXT:    [[I_013:%.*]] = phi i32 [ [[INC:%.*]], [[FOR_BODY]] ], [ 0, [[FOR_COND_PREHEADER]] ]
+; CHECK-NEXT:    [[MUL:%.*]] = mul nsw i32 [[I_013]], [[STEP_IN]]
+; CHECK-NEXT:    [[ARRAYIDX:%.*]] = getelementptr inbounds float, ptr [[INPUT]], i32 [[MUL]]
+; CHECK-NEXT:    [[TMP0:%.*]] = load float, ptr [[ARRAYIDX]], align 4
+; CHECK-NEXT:    [[ADD:%.*]] = fadd float [[TMP0]], [[C]]
+; CHECK-NEXT:    [[MUL5:%.*]] = mul nsw i32 [[I_013]], [[STEP_OUT]]
+; CHECK-NEXT:    [[ARRAYIDX6:%.*]] = getelementptr inbounds float, ptr [[OUTPUT]], i32 [[MUL5]]
+; CHECK-NEXT:    store float [[ADD]], ptr [[ARRAYIDX6]], align 4
+; CHECK-NEXT:    [[INC]] = add nuw nsw i32 [[I_013]], 1
+; CHECK-NEXT:    [[EXITCOND_NOT:%.*]] = icmp eq i32 [[INC]], [[LEN]]
+; CHECK-NEXT:    br i1 [[EXITCOND_NOT]], label [[RETURN]], label [[FOR_BODY]]
+; CHECK:       return:
+; CHECK-NEXT:    [[RETVAL_0:%.*]] = phi i32 [ 458755, [[ENTRY:%.*]] ], [ 0, [[FOR_COND_PREHEADER]] ], [ 0, [[FOR_BODY]] ]
+; CHECK-NEXT:    ret i32 [[RETVAL_0]]
+;
+entry:
+  %cmp = icmp eq ptr %input, null
+  %cmp1 = icmp eq ptr %output, null
+  %or.cond = or i1 %cmp, %cmp1
+  br i1 %or.cond, label %return, label %for.cond.preheader
+
+for.cond.preheader:                               ; preds = %entry
+  %cmp412 = icmp sgt i32 %len, 0
+  br i1 %cmp412, label %for.body, label %return
+
+for.body:                                         ; preds = %for.body, %for.cond.preheader
+  %i.013 = phi i32 [ %inc, %for.body ], [ 0, %for.cond.preheader ]
+  %mul = mul nsw i32 %i.013, %step_in
+  %arrayidx = getelementptr inbounds float, ptr %input, i32 %mul
+  %0 = load float, ptr %arrayidx, align 4
+  %add = fadd float %0, %C
+  %mul5 = mul nsw i32 %i.013, %step_out
+  %arrayidx6 = getelementptr inbounds float, ptr %output, i32 %mul5
+  store float %add, ptr %arrayidx6, align 4
+  %inc = add nuw nsw i32 %i.013, 1
+  %exitcond.not = icmp eq i32 %inc, %len
+  br i1 %exitcond.not, label %return, label %for.body
+
+return:                                           ; preds = %for.body, %for.cond.preheader, %entry
+  %retval.0 = phi i32 [ 458755, %entry ], [ 0, %for.cond.preheader ], [ 0, %for.body ]
+  ret i32 %retval.0
+}
@@ -0,0 +1,91 @@
+; NOTE: Assertions have been autogenerated by utils/update_test_checks.py UTC_ARGS: --version 4
+; RUN: opt -S -mtriple=riscv32-esp-unknown-elf -passes=riscv-split-loop-by-length -riscv-split-loop-by-length=false < %s | FileCheck %s
+; Function Attrs: nofree norecurse nosync nounwind memory(argmem: readwrite)
+define dso_local noundef i32 @dsps_biquad_f32_ansi(ptr nocapture noundef readonly %input, ptr nocapture noundef writeonly %output, i32 noundef %len, ptr nocapture noundef readonly %coef, ptr nocapture noundef %w) local_unnamed_addr {
+; CHECK-LABEL: define dso_local noundef i32 @dsps_biquad_f32_ansi(
+; CHECK-SAME: ptr nocapture noundef readonly [[INPUT:%.*]], ptr nocapture noundef writeonly [[OUTPUT:%.*]], i32 noundef [[LEN:%.*]], ptr nocapture noundef readonly [[COEF:%.*]], ptr nocapture noundef [[W:%.*]]) local_unnamed_addr {
+; CHECK-NEXT:  entry:
+; CHECK-NEXT:    [[CMP30:%.*]] = icmp sgt i32 [[LEN]], 0
+; CHECK-NEXT:    br i1 [[CMP30]], label [[FOR_BODY_LR_PH:%.*]], label [[FOR_COND_CLEANUP:%.*]]
+; CHECK:       for.body.lr.ph:
+; CHECK-NEXT:    [[ARRAYIDX1:%.*]] = getelementptr inbounds float, ptr [[COEF]], i32 3
+; CHECK-NEXT:    [[ARRAYIDX3:%.*]] = getelementptr inbounds float, ptr [[COEF]], i32 4
+; CHECK-NEXT:    [[ARRAYIDX4:%.*]] = getelementptr inbounds float, ptr [[W]], i32 1
+; CHECK-NEXT:    [[ARRAYIDX7:%.*]] = getelementptr inbounds float, ptr [[COEF]], i32 1
+; CHECK-NEXT:    [[ARRAYIDX10:%.*]] = getelementptr inbounds float, ptr [[COEF]], i32 2
+; CHECK-NEXT:    [[DOTPRE:%.*]] = load float, ptr [[W]], align 4
+; CHECK-NEXT:    [[DOTPRE32:%.*]] = load float, ptr [[ARRAYIDX4]], align 4
+; CHECK-NEXT:    br label [[FOR_BODY:%.*]]
+; CHECK:       for.cond.cleanup:
+; CHECK-NEXT:    ret i32 0
+; CHECK:       for.body:
+; CHECK-NEXT:    [[TMP0:%.*]] = phi float [ [[DOTPRE32]], [[FOR_BODY_LR_PH]] ], [ [[TMP12:%.*]], [[FOR_BODY]] ]
+; CHECK-NEXT:    [[TMP1:%.*]] = phi float [ [[DOTPRE]], [[FOR_BODY_LR_PH]] ], [ [[TMP6:%.*]], [[FOR_BODY]] ]
+; CHECK-NEXT:    [[I_031:%.*]] = phi i32 [ 0, [[FOR_BODY_LR_PH]] ], [ [[INC:%.*]], [[FOR_BODY]] ]
+; CHECK-NEXT:    [[ARRAYIDX:%.*]] = getelementptr inbounds float, ptr [[INPUT]], i32 [[I_031]]
+; CHECK-NEXT:    [[TMP2:%.*]] = load float, ptr [[ARRAYIDX]], align 4
+; CHECK-NEXT:    [[TMP3:%.*]] = load float, ptr [[ARRAYIDX1]], align 4
+; CHECK-NEXT:    [[NEG:%.*]] = fneg float [[TMP3]]
+; CHECK-NEXT:    [[TMP4:%.*]] = tail call float @llvm.fmuladd.f32(float [[NEG]], float [[TMP1]], float [[TMP2]])
+; CHECK-NEXT:    [[TMP5:%.*]] = load float, ptr [[ARRAYIDX3]], align 4
+; CHECK-NEXT:    [[NEG5:%.*]] = fneg float [[TMP5]]
+; CHECK-NEXT:    [[TMP6]] = tail call float @llvm.fmuladd.f32(float [[NEG5]], float [[TMP0]], float [[TMP4]])
+; CHECK-NEXT:    [[TMP7:%.*]] = load float, ptr [[COEF]], align 4
+; CHECK-NEXT:    [[TMP8:%.*]] = load float, ptr [[ARRAYIDX7]], align 4
+; CHECK-NEXT:    [[MUL9:%.*]] = fmul float [[TMP1]], [[TMP8]]
+; CHECK-NEXT:    [[TMP9:%.*]] = tail call float @llvm.fmuladd.f32(float [[TMP7]], float [[TMP6]], float [[MUL9]])
+; CHECK-NEXT:    [[TMP10:%.*]] = load float, ptr [[ARRAYIDX10]], align 4
+; CHECK-NEXT:    [[TMP11:%.*]] = tail call float @llvm.fmuladd.f32(float [[TMP10]], float [[TMP0]], float [[TMP9]])
+; CHECK-NEXT:    [[ARRAYIDX12:%.*]] = getelementptr inbounds float, ptr [[OUTPUT]], i32 [[I_031]]
+; CHECK-NEXT:    store float [[TMP11]], ptr [[ARRAYIDX12]], align 4
+; CHECK-NEXT:    [[TMP12]] = load float, ptr [[W]], align 4
+; CHECK-NEXT:    store float [[TMP12]], ptr [[ARRAYIDX4]], align 4
+; CHECK-NEXT:    store float [[TMP6]], ptr [[W]], align 4
+; CHECK-NEXT:    [[INC]] = add nuw nsw i32 [[I_031]], 1
+; CHECK-NEXT:    [[EXITCOND_NOT:%.*]] = icmp eq i32 [[INC]], [[LEN]]
+; CHECK-NEXT:    br i1 [[EXITCOND_NOT]], label [[FOR_COND_CLEANUP]], label [[FOR_BODY]]
+;
+entry:
+  %cmp30 = icmp sgt i32 %len, 0
+  br i1 %cmp30, label %for.body.lr.ph, label %for.cond.cleanup
+
+for.body.lr.ph:                                   ; preds = %entry
+  %arrayidx1 = getelementptr inbounds float, ptr %coef, i32 3
+  %arrayidx3 = getelementptr inbounds float, ptr %coef, i32 4
+  %arrayidx4 = getelementptr inbounds float, ptr %w, i32 1
+  %arrayidx7 = getelementptr inbounds float, ptr %coef, i32 1
+  %arrayidx10 = getelementptr inbounds float, ptr %coef, i32 2
+  %.pre = load float, ptr %w, align 4
+  %.pre32 = load float, ptr %arrayidx4, align 4
+  br label %for.body
+
+for.cond.cleanup:                                 ; preds = %for.body, %entry
+  ret i32 0
+
+for.body:                                         ; preds = %for.body, %for.body.lr.ph
+  %0 = phi float [ %.pre32, %for.body.lr.ph ], [ %12, %for.body ]
+  %1 = phi float [ %.pre, %for.body.lr.ph ], [ %6, %for.body ]
+  %i.031 = phi i32 [ 0, %for.body.lr.ph ], [ %inc, %for.body ]
+  %arrayidx = getelementptr inbounds float, ptr %input, i32 %i.031
+  %2 = load float, ptr %arrayidx, align 4
+  %3 = load float, ptr %arrayidx1, align 4
+  %neg = fneg float %3
+  %4 = tail call float @llvm.fmuladd.f32(float %neg, float %1, float %2)
+  %5 = load float, ptr %arrayidx3, align 4
+  %neg5 = fneg float %5
+  %6 = tail call float @llvm.fmuladd.f32(float %neg5, float %0, float %4)
+  %7 = load float, ptr %coef, align 4
+  %8 = load float, ptr %arrayidx7, align 4
+  %mul9 = fmul float %1, %8
+  %9 = tail call float @llvm.fmuladd.f32(float %7, float %6, float %mul9)
+  %10 = load float, ptr %arrayidx10, align 4
+  %11 = tail call float @llvm.fmuladd.f32(float %10, float %0, float %9)
+  %arrayidx12 = getelementptr inbounds float, ptr %output, i32 %i.031
+  store float %11, ptr %arrayidx12, align 4
+  %12 = load float, ptr %w, align 4
+  store float %12, ptr %arrayidx4, align 4
+  store float %6, ptr %w, align 4
+  %inc = add nuw nsw i32 %i.031, 1
+  %exitcond.not = icmp eq i32 %inc, %len
+  br i1 %exitcond.not, label %for.cond.cleanup, label %for.body
+}
@@ -0,0 +1,46 @@
+; NOTE: Assertions have been autogenerated by utils/update_test_checks.py UTC_ARGS: --version 4
+; RUN: opt -S -mtriple=riscv32-esp-unknown-elf -passes=riscv-split-loop-by-length -riscv-split-loop-by-length=false < %s | FileCheck %s
+; Function Attrs: nofree norecurse nosync nounwind memory(argmem: readwrite)
+define dso_local noundef i32 @dsps_dotprod_f32_ansi(ptr nocapture noundef readonly %src1, ptr nocapture noundef readonly %src2, ptr nocapture noundef writeonly %dest, i32 noundef %len) local_unnamed_addr {
+; CHECK-LABEL: define dso_local noundef i32 @dsps_dotprod_f32_ansi(
+; CHECK-SAME: ptr nocapture noundef readonly [[SRC1:%.*]], ptr nocapture noundef readonly [[SRC2:%.*]], ptr nocapture noundef writeonly [[DEST:%.*]], i32 noundef [[LEN:%.*]]) local_unnamed_addr {
+; CHECK-NEXT:  entry:
+; CHECK-NEXT:    [[CMP6:%.*]] = icmp sgt i32 [[LEN]], 0
+; CHECK-NEXT:    br i1 [[CMP6]], label [[FOR_BODY:%.*]], label [[FOR_COND_CLEANUP:%.*]]
+; CHECK:       for.cond.cleanup:
+; CHECK-NEXT:    [[ACC_0_LCSSA:%.*]] = phi float [ 0.000000e+00, [[ENTRY:%.*]] ], [ [[TMP2:%.*]], [[FOR_BODY]] ]
+; CHECK-NEXT:    store float [[ACC_0_LCSSA]], ptr [[DEST]], align 4
+; CHECK-NEXT:    ret i32 0
+; CHECK:       for.body:
+; CHECK-NEXT:    [[I_08:%.*]] = phi i32 [ [[INC:%.*]], [[FOR_BODY]] ], [ 0, [[ENTRY]] ]
+; CHECK-NEXT:    [[ACC_07:%.*]] = phi float [ [[TMP2]], [[FOR_BODY]] ], [ 0.000000e+00, [[ENTRY]] ]
+; CHECK-NEXT:    [[ARRAYIDX:%.*]] = getelementptr inbounds float, ptr [[SRC1]], i32 [[I_08]]
+; CHECK-NEXT:    [[TMP0:%.*]] = load float, ptr [[ARRAYIDX]], align 4
+; CHECK-NEXT:    [[ARRAYIDX1:%.*]] = getelementptr inbounds float, ptr [[SRC2]], i32 [[I_08]]
+; CHECK-NEXT:    [[TMP1:%.*]] = load float, ptr [[ARRAYIDX1]], align 4
+; CHECK-NEXT:    [[TMP2]] = tail call float @llvm.fmuladd.f32(float [[TMP0]], float [[TMP1]], float [[ACC_07]])
+; CHECK-NEXT:    [[INC]] = add nuw nsw i32 [[I_08]], 1
+; CHECK-NEXT:    [[EXITCOND_NOT:%.*]] = icmp eq i32 [[INC]], [[LEN]]
+; CHECK-NEXT:    br i1 [[EXITCOND_NOT]], label [[FOR_COND_CLEANUP]], label [[FOR_BODY]]
+;
+entry:
+  %cmp6 = icmp sgt i32 %len, 0
+  br i1 %cmp6, label %for.body, label %for.cond.cleanup
+
+for.cond.cleanup:                                 ; preds = %for.body, %entry
+  %acc.0.lcssa = phi float [ 0.000000e+00, %entry ], [ %2, %for.body ]
+  store float %acc.0.lcssa, ptr %dest, align 4
+  ret i32 0
+
+for.body:                                         ; preds = %for.body, %entry
+  %i.08 = phi i32 [ %inc, %for.body ], [ 0, %entry ]
+  %acc.07 = phi float [ %2, %for.body ], [ 0.000000e+00, %entry ]
+  %arrayidx = getelementptr inbounds float, ptr %src1, i32 %i.08
+  %0 = load float, ptr %arrayidx, align 4
+  %arrayidx1 = getelementptr inbounds float, ptr %src2, i32 %i.08
+  %1 = load float, ptr %arrayidx1, align 4
+  %2 = tail call float @llvm.fmuladd.f32(float %0, float %1, float %acc.07)
+  %inc = add nuw nsw i32 %i.08, 1
+  %exitcond.not = icmp eq i32 %inc, %len
+  br i1 %exitcond.not, label %for.cond.cleanup, label %for.body
+}
@@ -0,0 +1,50 @@
+; NOTE: Assertions have been autogenerated by utils/update_test_checks.py UTC_ARGS: --version 4
+; RUN: opt -S -mtriple=riscv32-esp-unknown-elf -passes=riscv-split-loop-by-length -riscv-split-loop-by-length=false < %s | FileCheck %s
+; Function Attrs: nofree norecurse nosync nounwind memory(argmem: readwrite)
+define dso_local noundef i32 @dsps_dotprode_f32_ansi(ptr nocapture noundef readonly %src1, ptr nocapture noundef readonly %src2, ptr nocapture noundef writeonly %dest, i32 noundef %len, i32 noundef %step1, i32 noundef %step2) local_unnamed_addr {
+; CHECK-LABEL: define dso_local noundef i32 @dsps_dotprode_f32_ansi(
+; CHECK-SAME: ptr nocapture noundef readonly [[SRC1:%.*]], ptr nocapture noundef readonly [[SRC2:%.*]], ptr nocapture noundef writeonly [[DEST:%.*]], i32 noundef [[LEN:%.*]], i32 noundef [[STEP1:%.*]], i32 noundef [[STEP2:%.*]]) local_unnamed_addr {
+; CHECK-NEXT:  entry:
+; CHECK-NEXT:    [[CMP8:%.*]] = icmp sgt i32 [[LEN]], 0
+; CHECK-NEXT:    br i1 [[CMP8]], label [[FOR_BODY:%.*]], label [[FOR_COND_CLEANUP:%.*]]
+; CHECK:       for.cond.cleanup:
+; CHECK-NEXT:    [[ACC_0_LCSSA:%.*]] = phi float [ 0.000000e+00, [[ENTRY:%.*]] ], [ [[TMP2:%.*]], [[FOR_BODY]] ]
+; CHECK-NEXT:    store float [[ACC_0_LCSSA]], ptr [[DEST]], align 4
+; CHECK-NEXT:    ret i32 0
+; CHECK:       for.body:
+; CHECK-NEXT:    [[I_010:%.*]] = phi i32 [ [[INC:%.*]], [[FOR_BODY]] ], [ 0, [[ENTRY]] ]
+; CHECK-NEXT:    [[ACC_09:%.*]] = phi float [ [[TMP2]], [[FOR_BODY]] ], [ 0.000000e+00, [[ENTRY]] ]
+; CHECK-NEXT:    [[MUL:%.*]] = mul nsw i32 [[I_010]], [[STEP1]]
+; CHECK-NEXT:    [[ARRAYIDX:%.*]] = getelementptr inbounds float, ptr [[SRC1]], i32 [[MUL]]
+; CHECK-NEXT:    [[TMP0:%.*]] = load float, ptr [[ARRAYIDX]], align 4
+; CHECK-NEXT:    [[MUL1:%.*]] = mul nsw i32 [[I_010]], [[STEP2]]
+; CHECK-NEXT:    [[ARRAYIDX2:%.*]] = getelementptr inbounds float, ptr [[SRC2]], i32 [[MUL1]]
+; CHECK-NEXT:    [[TMP1:%.*]] = load float, ptr [[ARRAYIDX2]], align 4
+; CHECK-NEXT:    [[TMP2]] = tail call float @llvm.fmuladd.f32(float [[TMP0]], float [[TMP1]], float [[ACC_09]])
+; CHECK-NEXT:    [[INC]] = add nuw nsw i32 [[I_010]], 1
+; CHECK-NEXT:    [[EXITCOND_NOT:%.*]] = icmp eq i32 [[INC]], [[LEN]]
+; CHECK-NEXT:    br i1 [[EXITCOND_NOT]], label [[FOR_COND_CLEANUP]], label [[FOR_BODY]]
+;
+entry:
+  %cmp8 = icmp sgt i32 %len, 0
+  br i1 %cmp8, label %for.body, label %for.cond.cleanup
+
+for.cond.cleanup:                                 ; preds = %for.body, %entry
+  %acc.0.lcssa = phi float [ 0.000000e+00, %entry ], [ %2, %for.body ]
+  store float %acc.0.lcssa, ptr %dest, align 4
+  ret i32 0
+
+for.body:                                         ; preds = %for.body, %entry
+  %i.010 = phi i32 [ %inc, %for.body ], [ 0, %entry ]
+  %acc.09 = phi float [ %2, %for.body ], [ 0.000000e+00, %entry ]
+  %mul = mul nsw i32 %i.010, %step1
+  %arrayidx = getelementptr inbounds float, ptr %src1, i32 %mul
+  %0 = load float, ptr %arrayidx, align 4
+  %mul1 = mul nsw i32 %i.010, %step2
+  %arrayidx2 = getelementptr inbounds float, ptr %src2, i32 %mul1
+  %1 = load float, ptr %arrayidx2, align 4
+  %2 = tail call float @llvm.fmuladd.f32(float %0, float %1, float %acc.09)
+  %inc = add nuw nsw i32 %i.010, 1
+  %exitcond.not = icmp eq i32 %inc, %len
+  br i1 %exitcond.not, label %for.cond.cleanup, label %for.body
+}