pytorch
diff --git a/‎core/runtime/TRTEngine.cpp
Lines changed: 1 addition & 1 deletion b/‎core/runtime/TRTEngine.cpp
Lines changed: 1 addition & 1 deletion
diff --git a/‎examples/fx/lower_example.py
Lines changed: 20 additions & 11 deletions b/‎examples/fx/lower_example.py
Lines changed: 20 additions & 11 deletions
diff --git a/‎examples/fx/lower_example_aten.py
Lines changed: 14 additions & 6 deletions b/‎examples/fx/lower_example_aten.py
Lines changed: 14 additions & 6 deletions
diff --git a/‎py/setup.py
Lines changed: 5 additions & 1 deletion b/‎py/setup.py
Lines changed: 5 additions & 1 deletion
diff --git a/‎py/torch_tensorrt/_Input.py
Lines changed: 9 additions & 56 deletions b/‎py/torch_tensorrt/_Input.py
Lines changed: 9 additions & 56 deletions
diff --git a/‎py/torch_tensorrt/fx/input_tensor_spec.py
Lines changed: 1 addition & 0 deletions b/‎py/torch_tensorrt/fx/input_tensor_spec.py
Lines changed: 1 addition & 0 deletions
diff --git a/‎py/torch_tensorrt/fx/lower.py
Lines changed: 4 additions & 1 deletion b/‎py/torch_tensorrt/fx/lower.py
Lines changed: 4 additions & 1 deletion
diff --git a/‎py/torch_tensorrt/fx/lower_setting.py
Lines changed: 2 additions & 2 deletions b/‎py/torch_tensorrt/fx/lower_setting.py
Lines changed: 2 additions & 2 deletions
@@ -148,10 +148,10 @@ TRTEngine::TRTEngine(
 }
 
 TRTEngine::~TRTEngine() {
-  rt.reset();
   trt_engine_profiler.reset();
   exec_ctx.reset();
   cuda_engine.reset();
+  rt.reset();
 }
 
 void TRTEngine::disable_profiling() {
 
@@ -4,6 +4,7 @@
 
 import torch
 import torchvision
+import torch_tensorrt
 from torch_tensorrt.fx import compile
 from torch_tensorrt.fx.utils import LowerPrecision
 
@@ -98,13 +99,17 @@ def benchmark(
 
     model = model.cuda().eval()
     inputs = [x.cuda() for x in inputs]
-
+    # inputs = [torch_tensorrt.Input(shape=(128, 3, 224, 224), dtype=torch.float32)]
+    # inputs = [torch_tensorrt.Input(min_shape=[1, 3, 224, 224],
+    #                                opt_shape=[8, 3, 224, 224],
+    #                                max_shape=[32, 3, 224, 224],
+    #                                dtype=torch.float32)]
     # benchmark base configuration
     conf = Configuration(batch_iter=batch_iter, batch_size=batch_size)
 
     configurations = [
         # Baseline
-        replace(conf, name="CUDA Eager", trt=False),
+        # replace(conf, name="CUDA Eager", trt=False),
         # FP32
         replace(
             conf,
@@ -115,14 +120,14 @@ def benchmark(
             accuracy_rtol=1e-3,
         ),
         # FP16
-        replace(
-            conf,
-            name="TRT FP16 Eager",
-            trt=True,
-            jit=False,
-            fp16=True,
-            accuracy_rtol=1e-2,
-        ),
+        # replace(
+        #     conf,
+        #     name="TRT FP16 Eager",
+        #     trt=True,
+        #     jit=False,
+        #     fp16=True,
+        #     accuracy_rtol=1e-2,
+        # ),
     ]
 
     results = [
@@ -189,8 +194,12 @@ def run_configuration_benchmark(
             max_batch_size=conf.batch_size,
             lower_precision=LowerPrecision.FP16 if conf.fp16 else LowerPrecision.FP32,
             explicit_batch_dimension=True,
+            dynamic_batch=False,
+        )
+        random_inputs = [torch.randn((128, 3, 224, 224), dtype=torch.float32).cuda()]
+        time = benchmark_torch_function(
+            conf.batch_iter, lambda: lowered_module(*random_inputs)
         )
-        time = benchmark_torch_function(conf.batch_iter, lambda: lowered_module(*input))
     else:
         print("Lowering with JIT is not available!", "red")
 
 
@@ -4,6 +4,7 @@
 
 import torch
 import torchvision
+import torch_tensorrt
 from torch_tensorrt.fx import compile
 from torch_tensorrt.fx.utils import LowerPrecision
 
@@ -97,21 +98,25 @@ def benchmark(
     """
 
     model = model.cuda().eval()
-    inputs = [x.cuda() for x in inputs]
-
+    # inputs = [x.cuda() for x in inputs]
+    inputs = [torch_tensorrt.Input(shape=(128, 3, 224, 224), dtype=torch.float32)]
+    # inputs = [torch_tensorrt.Input(min_shape=[1, 3, 224, 224],
+    #                                opt_shape=[8, 3, 224, 224],
+    #                                max_shape=[32, 3, 224, 224],
+    #                                dtype=torch.float32)]
     # benchmark base configuration
     conf = Configuration(batch_iter=batch_iter, batch_size=batch_size)
 
     configurations = [
         # Baseline
-        replace(conf, name="CUDA Eager", trt=False),
+        # replace(conf, name="CUDA Eager", trt=False),
         # FP16
         replace(
             conf,
-            name="TRT FP16 Eager",
+            name="TRT FP32 Eager",
             trt=True,
             jit=False,
-            fp16=True,
+            fp16=False,
             accuracy_rtol=1e-2,
         ),
     ]
@@ -182,7 +187,10 @@ def run_configuration_benchmark(
             explicit_batch_dimension=True,
             is_aten=True,
         )
-        time = benchmark_torch_function(conf.batch_iter, lambda: lowered_module(*input))
+        random_inputs = [torch.randn((128, 3, 224, 224), dtype=torch.float32).cuda()]
+        time = benchmark_torch_function(
+            conf.batch_iter, lambda: lowered_module(*random_inputs)
+        )
     else:
         print("Lowering with JIT is not available!", "red")
 
 
@@ -350,6 +350,7 @@ def run(self):
 if FX_ONLY:
     ext_modules = None
     packages = [
+        "torch_tensorrt",
         "torch_tensorrt.fx",
         "torch_tensorrt.fx.converters",
         "torch_tensorrt.fx.passes",
@@ -358,6 +359,7 @@ def run(self):
         "torch_tensorrt.fx.tracer.dispatch_tracer",
     ]
     package_dir = {
+        "torch_tensorrt": "torch_tensorrt/",
         "torch_tensorrt.fx": "torch_tensorrt/fx",
         "torch_tensorrt.fx.converters": "torch_tensorrt/fx/converters",
         "torch_tensorrt.fx.passes": "torch_tensorrt/fx/passes",
@@ -437,7 +439,9 @@ def run(self):
             "bin/*",
             "BUILD",
             "WORKSPACE",
-        ],
+        ]
+        if not FX_ONLY
+        else ["_Input.py"]
     },
     exclude_package_data={
         "": ["*.cpp"],
 
@@ -4,7 +4,6 @@
 import torch
 
 from torch_tensorrt import _enums
-from torch_tensorrt import _C
 
 
 class Input(object):
@@ -41,6 +40,7 @@ class _ShapeMode(Enum):
     DOMAIN_OFFSET = 2.0
     low_tensor_domain_incl = 0.0
     high_tensor_domain_excl = low_tensor_domain_incl + DOMAIN_OFFSET
+    torch_dtype = None
 
     def __init__(self, *args, **kwargs):
         """__init__ Method for torch_tensorrt.Input
@@ -138,6 +138,9 @@ def __init__(self, *args, **kwargs):
             )
 
         if "dtype" in kwargs:
+            if isinstance(kwargs["dtype"], torch.dtype):
+                self.torch_dtype = kwargs["dtype"]
+
             self.dtype = Input._parse_dtype(kwargs["dtype"])
             self._explicit_set_dtype = True
 
@@ -173,59 +176,6 @@ def __str__(self) -> str:
         else:
             raise RuntimeError("Unknown input shape mode")
 
-    def _to_internal(self) -> _C.Input:
-        internal_in = _C.Input()
-        if self.shape_mode == Input._ShapeMode.DYNAMIC:
-            if not Input._supported_input_size_type(self.shape["min_shape"]):
-                raise TypeError(
-                    "Input shape specifications for inputs are required to be a List, tuple or torch.Size, found type: "
-                    + str(type(self.shape["min_shape"]))
-                    + " for min_shape"
-                )
-            else:
-                internal_in.min = self.shape["min_shape"]
-
-            if not Input._supported_input_size_type(self.shape["opt_shape"]):
-                raise TypeError(
-                    "Input shape specifications for inputs are required to be a List, tuple or torch.Size, found type: "
-                    + str(type(self.shape["opt_shape"]))
-                    + " for opt_shape"
-                )
-            else:
-                internal_in.opt = self.shape["opt_shape"]
-
-            if not Input._supported_input_size_type(self.shape["max_shape"]):
-                raise TypeError(
-                    "Input shape specifications for inputs are required to be a List, tuple or torch.Size, found type: "
-                    + str(type(self.shape["max_shape"]))
-                    + " for max_shape"
-                )
-            else:
-                internal_in.max = self.shape["max_shape"]
-            internal_in.input_is_dynamic = True
-        else:
-            if not Input._supported_input_size_type(self.shape):
-                raise TypeError(
-                    "Input shape specifications for inputs are required to be a List, tuple or torch.Size, found type: "
-                    + str(type(self.shape))
-                    + " for shape"
-                )
-            else:
-                internal_in.opt = self.shape
-            internal_in.input_is_dynamic = False
-
-        if self.dtype != _enums.dtype.unknown:
-            self._explicit_set_dtype = True
-        else:
-            self._explicit_set_dtype = False
-
-        internal_in.dtype = Input._parse_dtype(self.dtype)
-        internal_in._explicit_set_dtype = self._explicit_set_dtype
-        internal_in.format = Input._parse_format(self.format)
-
-        internal_in.tensor_domain = Input._parse_tensor_domain(self.tensor_domain)
-        return internal_in
-
     @staticmethod
     def _supported_input_size_type(input_size: Any) -> bool:
         if isinstance(input_size, torch.Size):
@@ -304,6 +254,7 @@ def _parse_tensor_domain(domain: Optional[Tuple[float, float]]) -> Tuple:
                 Input.low_tensor_domain_incl,
                 Input.high_tensor_domain_excl,
             )
+
         elif len(domain) == 2:
             domain_lo, domain_hi = domain
 
@@ -416,8 +367,10 @@ def example_tensor(self, optimization_profile_field: str = None) -> torch.Tensor
             )
 
         if self.shape_mode == Input._ShapeMode.STATIC:
-            return torch.randn(self.shape).to(dtype=self.dtype)
+            return torch.randn(self.shape).to(
+                dtype=self.dtype if not self.torch_dtype else self.torch_dtype
+            )
         else:
             return torch.randn(self.shape[optimization_profile_field]).to(
-                dtype=self.dtype
+                dtype=self.dtype if not self.torch_dtype else self.torch_dtype
             )
@@ -4,6 +4,7 @@
 
 from .types import Shape, ShapeRange
 from .utils import get_dynamic_dims
+from torch_tensorrt._Input import Input
 
 
 def generate_input_specs(inputs, lower_setting, additional_inputs=None):
 
@@ -7,6 +7,7 @@
 import torch
 import torch.fx as fx
 import torch.nn as nn
+import torch_tensorrt
 import torch_tensorrt.fx.tracer.dispatch_tracer.aten_tracer as aten_tracer
 from torch.fx.passes.splitter_base import SplitResult
 
@@ -22,8 +23,9 @@
 from .utils import LowerPrecision
 
 logger = logging.getLogger(__name__)
+from torch_tensorrt._Input import Input
 
-Input = Sequence[Any]
+# Input = Sequence[Any]
 
 
 def compile(
@@ -302,6 +304,7 @@ def do_lower(module: nn.Module, inputs: Input) -> nn.Module:
                     conversion_fn = fp16_conversion_fn
 
                 inputs = tuple(conversion_fn(x) for x in inputs)
+
             if lower_setting.is_aten:
                 pm = self.lower_pass_manager_builder.build_aten2trt_lower_pipeline(
                     inputs, additional_inputs
 
@@ -4,7 +4,7 @@
 from torch import nn
 from torch.fx.passes.pass_manager import PassManager
 
-from .input_tensor_spec import InputTensorSpec
+from torch_tensorrt._Input import Input
 from .passes.lower_basic_pass import fuse_permute_linear, fuse_permute_matmul
 from .utils import LowerPrecision
 
@@ -76,7 +76,7 @@ class LowerSetting(LowerSettingBasic):
     use_experimental_rt: Uses the next generation TRTModule which supports both Python and TorchScript based execution (including in C++).
     """
 
-    input_specs: List[InputTensorSpec] = dc.field(default_factory=list)
+    input_specs: List[Input] = dc.field(default_factory=list)
     explicit_batch_dimension: bool = True
     explicit_precision: bool = False
     max_workspace_size: int = 1 << 30
Original file line number	Diff line number	Diff line change
`@@ -148,10 +148,10 @@ TRTEngine::TRTEngine(`
`148`	`148`	`}`
`149`	`149`
`150`	`150`	`TRTEngine::~TRTEngine() {`
`151`		`- rt.reset();`
`152`	`151`	`trt_engine_profiler.reset();`
`153`	`152`	`exec_ctx.reset();`
`154`	`153`	`cuda_engine.reset();`
	`154`	`+ rt.reset();`
`155`	`155`	`}`
`156`	`156`
`157`	`157`	`void TRTEngine::disable_profiling() {`