Merge pull request #543 from NVIDIA/yutec/clone_copy_evaluators

narendasan · web-flow · commit bbc7949788d9 · 2021-07-26T13:22:26.000-04:00
Feat: Add aten::clone and aten::copy_ support.
diff --git a/core/conversion/evaluators/aten.cpp b/core/conversion/evaluators/aten.cpp
@@ -576,6 +576,41 @@ auto aten_registrations TRTORCH_UNUSED =
                             Layout? layout=None, Device? device=None, bool? pin_memory=None) -> (Tensor))SIG",
                         R"SIG(aten::arange.start_step(Scalar start, Scalar end, Scalar step, *, ScalarType? dtype=None,
                         Layout? layout=None, Device? device=None, bool? pin_memory=None) -> (Tensor))SIG",
+                    })})
+        .evaluator({c10::Symbol::fromQualString("aten::clone"),
+                    [](const torch::jit::Node* n, kwargs& args) -> c10::optional<torch::jit::IValue> {
+                      if (args.at(n->input(0)).isITensor()) {
+                        auto source_tensor = args.at(n->input(0)).ITensor();
+                        auto tensor_holder = TensorContainer();
+                        tensor_holder.hold_tensor(source_tensor);
+                        auto clone_tensor = c10::IValue(std::move(c10::make_intrusive<TensorContainer>(tensor_holder)));
+                        return std::move(clone_tensor);
+                      } else {
+                        auto source_tensor = args.at(n->input(0)).unwrapToTensor();
+                        auto clone_tensor = source_tensor.clone();
+                        return clone_tensor;
+                      }
+                    },
+                    EvalOptions().validSchemas({
+                        R"SIG(aten::clone(Tensor self, *, int? memory_format=None) -> (Tensor))SIG",
+                    })})
+        .evaluator({c10::Symbol::fromQualString("aten::copy_"),
+                    [](const torch::jit::Node* n, kwargs& args) -> c10::optional<torch::jit::IValue> {
+                      if (args.at(n->input(1)).isITensor()) {
+                        auto source_tensor = args.at(n->input(1)).ITensor();
+                        auto tensor_holder = TensorContainer();
+                        tensor_holder.hold_tensor(source_tensor);
+                        auto clone_tensor = c10::IValue(std::move(c10::make_intrusive<TensorContainer>(tensor_holder)));
+                        return std::move(clone_tensor);
+                      } else {
+                        auto source_tensor = args.at(n->input(1)).unwrapToTensor();
+                        auto self_tensor = args.at(n->input(0)).unwrapToTensor();
+                        self_tensor.copy_(source_tensor);
+                        return self_tensor;
+                      }
+                    },
+                    EvalOptions().validSchemas({
+                        R"SIG(aten::copy_(Tensor(a!) self, Tensor src, bool non_blocking=False) -> (Tensor(a!)))SIG",
                     })});
 } // namespace
 } // namespace evaluators
diff --git a/tests/core/conversion/converters/BUILD b/tests/core/conversion/converters/BUILD
@@ -15,6 +15,10 @@ converter_test(
     name = "test_batch_norm",
 )
 
+converter_test(
+    name = "test_clone",
+)
+
 converter_test(
     name = "test_concat",
 )
@@ -27,6 +31,10 @@ converter_test(
     name = "test_conv_deconv",
 )
 
+converter_test(
+    name = "test_copy",
+)
+
 converter_test(
     name = "test_cumsum"
 )
@@ -112,9 +120,11 @@ test_suite(
     tests = [
         ":test_activation",
         ":test_batch_norm",
+        ":test_clone",
         ":test_concat",
         ":test_constant_pad",
         ":test_conv_deconv",
+        ":test_copy",
         ":test_cumsum",
         ":test_element_wise",
         ":test_expand",
diff --git a/tests/core/conversion/converters/test_clone.cpp b/tests/core/conversion/converters/test_clone.cpp
@@ -0,0 +1,30 @@
+#include <string>
+#include "core/compiler.h"
+#include "gtest/gtest.h"
+#include "tests/util/util.h"
+#include "torch/csrc/jit/ir/irparser.h"
+
+TEST(Converters, ATenCloneConvertsCorrectly) {
+  const auto graph = R"IR(
+      graph(%0 : Tensor):
+        %1 : Tensor = aten::relu(%0)
+        %2 : None = prim::Constant()
+        %3 : Tensor = aten::clone(%1, %2)
+        %4 : Tensor = aten::relu(%3)
+        %5 : int = prim::Constant[value=1]()
+        %6 : Tensor = aten::add(%1, %4, %5)
+        return (%6))IR";
+
+  auto g = std::make_shared<torch::jit::Graph>();
+  torch::jit::parseIR(graph, g.get());
+
+  auto in = at::randint(1, 10, {1, 3, 10, 10}, {at::kCUDA});
+
+  auto params = trtorch::core::conversion::get_named_params(g->inputs(), {});
+  auto jit_results = trtorch::tests::util::RunGraph(g, params, {in});
+
+  params = trtorch::core::conversion::get_named_params(g->inputs(), {});
+  auto trt_results = trtorch::tests::util::RunGraphEngine(g, params, {in});
+
+  ASSERT_TRUE(trtorch::tests::util::almostEqual(jit_results[0], trt_results[0].reshape_as(jit_results[0]), 2e-6));
+}
diff --git a/tests/core/conversion/converters/test_copy.cpp b/tests/core/conversion/converters/test_copy.cpp
@@ -0,0 +1,38 @@
+#include <string>
+#include "core/compiler.h"
+#include "gtest/gtest.h"
+#include "tests/util/util.h"
+#include "torch/csrc/jit/ir/irparser.h"
+
+TEST(Converters, ATenCopyConvertsCorrectly) {
+  const auto graph = R"IR(
+      graph(%0 : Tensor):
+        %0.1 : Tensor = aten::relu(%0)
+        %1 : int = prim::Constant[value=1]()
+        %2 : int = prim::Constant[value=3]()
+        %3 : int = prim::Constant[value=10]()
+        %4 : int = prim::Constant[value=10]()
+        %5 : int[] = prim::ListConstruct(%1, %2, %3, %4)
+        %6 : None = prim::Constant()
+        %7 : Device = prim::Constant[value="cuda"]()
+        %8 : Tensor = aten::ones(%5, %6, %6, %7, %6)
+        %9 : bool = prim::Constant[value=0]()
+        %10 : Tensor = aten::copy_(%8, %0.1, %9)
+        %11 : Tensor = aten::relu(%10)
+        %12 : int = prim::Constant[value=1]()
+        %13 : Tensor = aten::add(%0.1, %11, %12)
+        return (%13))IR";
+
+  auto g = std::make_shared<torch::jit::Graph>();
+  torch::jit::parseIR(graph, g.get());
+
+  auto in = at::randint(1, 10, {1, 3, 10, 10}, {at::kCUDA});
+
+  auto params = trtorch::core::conversion::get_named_params(g->inputs(), {});
+  auto jit_results = trtorch::tests::util::RunGraph(g, params, {in});
+
+  params = trtorch::core::conversion::get_named_params(g->inputs(), {});
+  auto trt_results = trtorch::tests::util::RunGraphEngine(g, params, {in});
+
+  ASSERT_TRUE(trtorch::tests::util::almostEqual(jit_results[0], trt_results[0].reshape_as(jit_results[0]), 2e-6));
+}
diff --git a/tests/core/conversion/evaluators/test_aten_evaluators.cpp b/tests/core/conversion/evaluators/test_aten_evaluators.cpp
@@ -355,4 +355,48 @@ TEST(Evaluators, ATenAppendWithITensorAndTensorEvaluatesCorrectly) {
   auto trt_results = trtorch::tests::util::RunGraphEngine(g, params, {in0});
 
   ASSERT_TRUE(trtorch::tests::util::almostEqual(jit_results[0], trt_results[0].reshape_as(jit_results[0]), 2e-6));
+}
+
+TEST(Evaluators, ATenCloneEvaluatesCorrectly) {
+  const auto graph = R"IR(
+      graph(%0 : Tensor):
+        %1 : None = prim::Constant()
+        %2 : Tensor = aten::clone(%0, %1)
+        return (%2))IR";
+
+  auto in = at::randint(1, 10, {1, 3, 10, 10}, {at::kCUDA});
+
+  auto g = std::make_shared<torch::jit::Graph>();
+  torch::jit::parseIR(graph, g.get());
+
+  auto jit_results = trtorch::tests::util::EvaluateGraphJIT(g, {in});
+  auto trt_results = trtorch::tests::util::EvaluateGraph(g->block(), {in});
+
+  ASSERT_TRUE(at::equal(jit_results[0].toTensor().to(at::kCUDA), trt_results[0].toTensor()));
+}
+
+TEST(Evaluators, ATenCopyEvaluatesCorrectly) {
+  const auto graph = R"IR(
+      graph(%0 : Tensor):
+        %1 : int = prim::Constant[value=1]()
+        %2 : int = prim::Constant[value=3]()
+        %3 : int = prim::Constant[value=10]()
+        %4 : int = prim::Constant[value=10]()
+        %5 : int[] = prim::ListConstruct(%1, %2, %3, %4)
+        %6 : None = prim::Constant()
+        %7 : Device = prim::Constant[value="cuda"]()
+        %8 : Tensor = aten::ones(%5, %6, %6, %7, %6)
+        %9 : bool = prim::Constant[value=0]()
+        %10 : Tensor = aten::copy_(%8, %0, %9)
+        return (%10))IR";
+
+  auto in = at::randint(1, 10, {1, 3, 10, 10}, {at::kCUDA});
+
+  auto g = std::make_shared<torch::jit::Graph>();
+  torch::jit::parseIR(graph, g.get());
+
+  auto jit_results = trtorch::tests::util::EvaluateGraphJIT(g, {in});
+  auto trt_results = trtorch::tests::util::EvaluateGraph(g->block(), {in});
+
+  ASSERT_TRUE(at::equal(jit_results[0].toTensor().to(at::kCUDA), trt_results[0].toTensor()));
 }