[LLVM][NVPTX] Add support for div.full instruction #116482

schwarzschild-radius · 2024-11-16T09:58:06Z

This commit adds NVPTX support for div.full PTX instruction with test under div.ll. For more information, see PTX ISA

llvmbot · 2024-11-16T09:58:39Z

@llvm/pr-subscribers-backend-nvptx

@llvm/pr-subscribers-llvm-ir

Author: Pradeep Kumar (schwarzschild-radius)

Changes

This commit adds NVPTX support for div.full PTX instruction with test under div.ll. For more information, see PTX ISA

Full diff: https://github.com/llvm/llvm-project/pull/116482.diff

3 Files Affected:

(modified) llvm/include/llvm/IR/IntrinsicsNVVM.td (+7)
(modified) llvm/lib/Target/NVPTX/NVPTXIntrinsics.td (+12)
(added) llvm/test/CodeGen/NVPTX/div.ll (+10)

diff --git a/llvm/include/llvm/IR/IntrinsicsNVVM.td b/llvm/include/llvm/IR/IntrinsicsNVVM.td
index 115fcee0b04f22..8802ca2534355c 100644
--- a/llvm/include/llvm/IR/IntrinsicsNVVM.td
+++ b/llvm/include/llvm/IR/IntrinsicsNVVM.td
@@ -820,6 +820,13 @@ let TargetPrefix = "nvvm" in {
       DefaultAttrsIntrinsic<[llvm_double_ty], [llvm_double_ty, llvm_double_ty],
         [IntrNoMem]>;
 
+  def int_nvvm_div_full : ClangBuiltin<"__nvvm_div_full">,
+      DefaultAttrsIntrinsic<[llvm_float_ty], [llvm_float_ty, llvm_float_ty],
+        [IntrNoMem]>;
+  def int_nvvm_div_full_ftz : ClangBuiltin<"__nvvm_div_full_ftz">,
+      DefaultAttrsIntrinsic<[llvm_float_ty], [llvm_float_ty, llvm_float_ty],
+        [IntrNoMem]>;
+
 //
 // Sad
 //
diff --git a/llvm/lib/Target/NVPTX/NVPTXIntrinsics.td b/llvm/lib/Target/NVPTX/NVPTXIntrinsics.td
index 5878940812f62b..5528e7b9fe0dda 100644
--- a/llvm/lib/Target/NVPTX/NVPTXIntrinsics.td
+++ b/llvm/lib/Target/NVPTX/NVPTXIntrinsics.td
@@ -1096,6 +1096,18 @@ def INT_NVVM_DIV_RM_D : F_MATH_2<"div.rm.f64 \t$dst, $src0, $src1;",
 def INT_NVVM_DIV_RP_D : F_MATH_2<"div.rp.f64 \t$dst, $src0, $src1;",
   Float64Regs, Float64Regs, Float64Regs, int_nvvm_div_rp_d>;
 
+def : Pat<(int_nvvm_div_full Float32Regs:$a, Float32Regs:$b),
+          (FDIV32rr Float32Regs:$a, Float32Regs:$b)>;
+
+def : Pat<(int_nvvm_div_full Float32Regs:$a, fpimm:$b),
+          (FDIV32ri Float32Regs:$a, f32imm:$b)>;
+
+def : Pat<(int_nvvm_div_full_ftz Float32Regs:$a, Float32Regs:$b),
+          (FDIV32rr_ftz Float32Regs:$a, Float32Regs:$b)>;
+
+def : Pat<(int_nvvm_div_full_ftz Float32Regs:$a, fpimm:$b),
+          (FDIV32ri_ftz Float32Regs:$a, f32imm:$b)>;
+
 //
 // Sad
 //
diff --git a/llvm/test/CodeGen/NVPTX/div.ll b/llvm/test/CodeGen/NVPTX/div.ll
new file mode 100644
index 00000000000000..e75461999c65e4
--- /dev/null
+++ b/llvm/test/CodeGen/NVPTX/div.ll
@@ -0,0 +1,10 @@
+; RUN: llc < %s -march=nvptx64 | FileCheck %s
+; RUN: %if ptxas %{ llc < %s -march=nvptx64 | %ptxas-verify %}
+
+define float @div_full(float %a, float %b) {
+  ; CHECK: div.full.f32 {{%f[0-9]+}}, {{%f[0-9]+}}, {{%f[0-9]+}}
+  %1 = call float @llvm.nvvm.div.full(float %a, float %b)
+  ; CHECK: div.full.ftz.f32 {{%f[0-9]+}}, {{%f[0-9]+}}, {{%f[0-9]+}}
+  %2 = call float @llvm.nvvm.div.full.ftz(float %1, float %b)
+  ret float %2
+}
\ No newline at end of file

llvm/lib/Target/NVPTX/NVPTXIntrinsics.td

llvm/test/CodeGen/NVPTX/div.ll

Artem-B

LGTM w/ a test nit.

This commit adds NVPTX support for div.full PTX instruction with test under div.ll

llvmbot added backend:NVPTX llvm:ir labels Nov 16, 2024

schwarzschild-radius requested review from Artem-B and AlexMaclean November 16, 2024 09:58

Artem-B reviewed Nov 18, 2024

View reviewed changes

llvm/lib/Target/NVPTX/NVPTXIntrinsics.td Show resolved Hide resolved

justinfargnoli reviewed Nov 18, 2024

View reviewed changes

llvm/test/CodeGen/NVPTX/div.ll Outdated Show resolved Hide resolved

llvm/test/CodeGen/NVPTX/div.ll Show resolved Hide resolved

schwarzschild-radius force-pushed the div_full_nvptx_support branch from b52174d to 8e3b135 Compare November 23, 2024 11:03

Artem-B reviewed Nov 25, 2024

View reviewed changes

llvm/test/CodeGen/NVPTX/div.ll Show resolved Hide resolved

Artem-B approved these changes Nov 25, 2024

View reviewed changes

[LLVM][NVPTX] Add support for div.full instruction

9f0fd9f

This commit adds NVPTX support for div.full PTX instruction with test under div.ll

schwarzschild-radius force-pushed the div_full_nvptx_support branch from 8e3b135 to 9f0fd9f Compare November 26, 2024 15:30

Artem-B approved these changes Nov 26, 2024

View reviewed changes

schwarzschild-radius merged commit e846148 into llvm:main Nov 26, 2024
8 checks passed

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

[LLVM][NVPTX] Add support for div.full instruction #116482

[LLVM][NVPTX] Add support for div.full instruction #116482

Uh oh!

schwarzschild-radius commented Nov 16, 2024

Uh oh!

llvmbot commented Nov 16, 2024 •

edited

Loading

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Artem-B left a comment

Uh oh!

Uh oh!

Uh oh!

[LLVM][NVPTX] Add support for div.full instruction #116482

[LLVM][NVPTX] Add support for div.full instruction #116482

Uh oh!

Conversation

schwarzschild-radius commented Nov 16, 2024

Uh oh!

llvmbot commented Nov 16, 2024 • edited Loading Uh oh! There was an error while loading. Please reload this page.

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Artem-B left a comment

Choose a reason for hiding this comment

Uh oh!

Uh oh!

Uh oh!

llvmbot commented Nov 16, 2024 •

edited

Loading