pytorch · narendasan · Aug 26, 2020 · May 27, 2020 · Aug 4, 2020 · Aug 5, 2020
diff --git a/docsrc/index.rst b/docsrc/index.rst
@@ -48,6 +48,7 @@ Notebooks
    :hidden:
 
    _notebooks/lenet-getting-started
+   _notebooks/ssd-object-detection-demo
 
 
 Python API Documenation

diff --git a/notebooks/README.md b/notebooks/README.md
@@ -42,4 +42,5 @@ Within the container, the notebooks themselves are located at `/workspace/TRTorc
 
 ## 2. Notebook list
 
-- [LeNet-example.ipynb](LeNet-example.ipynb): simple example on a LeNet network.
+- [lenet-getting-started.ipynb](lenet-getting-started.ipynb): simple example on a LeNet network.
+- [ssd-object-detection-demo.ipynb](ssd-object-detection-demo.ipynb): demo for compiling a pretrained SSD model using TRTorch.
diff --git a/notebooks/lenet-getting-started.ipynb b/notebooks/lenet-getting-started.ipynb
@@ -134,7 +134,7 @@
   },
   {
    "cell_type": "code",
-   "execution_count": 9,
+   "execution_count": 3,
    "metadata": {},
    "outputs": [],
    "source": [
@@ -183,7 +183,7 @@
   },
   {
    "cell_type": "code",
-   "execution_count": 10,
+   "execution_count": 4,
    "metadata": {},
    "outputs": [
     {
@@ -202,7 +202,7 @@
        ")"
       ]
      },
-     "execution_count": 10,
+     "execution_count": 4,
      "metadata": {},
      "output_type": "execute_result"
     }
@@ -214,28 +214,30 @@
   },
   {
    "cell_type": "code",
-   "execution_count": 11,
-   "metadata": {},
+   "execution_count": 5,
+   "metadata": {
+    "scrolled": true
+   },
    "outputs": [
     {
      "name": "stdout",
      "output_type": "stream",
      "text": [
       "Warm up ...\n",
       "Start timing ...\n",
-      "Iteration 1000/10000, ave batch time 0.93 ms\n",
-      "Iteration 2000/10000, ave batch time 0.93 ms\n",
-      "Iteration 3000/10000, ave batch time 0.93 ms\n",
-      "Iteration 4000/10000, ave batch time 0.93 ms\n",
-      "Iteration 5000/10000, ave batch time 0.93 ms\n",
-      "Iteration 6000/10000, ave batch time 0.93 ms\n",
-      "Iteration 7000/10000, ave batch time 0.93 ms\n",
-      "Iteration 8000/10000, ave batch time 0.93 ms\n",
-      "Iteration 9000/10000, ave batch time 0.93 ms\n",
-      "Iteration 10000/10000, ave batch time 0.93 ms\n",
+      "Iteration 1000/10000, ave batch time 0.58 ms\n",
+      "Iteration 2000/10000, ave batch time 0.58 ms\n",
+      "Iteration 3000/10000, ave batch time 0.58 ms\n",
+      "Iteration 4000/10000, ave batch time 0.58 ms\n",
+      "Iteration 5000/10000, ave batch time 0.58 ms\n",
+      "Iteration 6000/10000, ave batch time 0.58 ms\n",
+      "Iteration 7000/10000, ave batch time 0.58 ms\n",
+      "Iteration 8000/10000, ave batch time 0.58 ms\n",
+      "Iteration 9000/10000, ave batch time 0.58 ms\n",
+      "Iteration 10000/10000, ave batch time 0.58 ms\n",
       "Input shape: torch.Size([1024, 1, 32, 32])\n",
       "Output features size: torch.Size([1024, 10])\n",
-      "Average batch time: 0.93 ms\n"
+      "Average batch time: 0.58 ms\n"
      ]
     }
    ],
@@ -256,7 +258,7 @@
   },
   {
    "cell_type": "code",
-   "execution_count": 12,
+   "execution_count": 6,
    "metadata": {},
    "outputs": [
     {
@@ -278,7 +280,7 @@
        ")"
       ]
      },
-     "execution_count": 12,
+     "execution_count": 6,
      "metadata": {},
      "output_type": "execute_result"
     }
@@ -290,7 +292,7 @@
   },
   {
    "cell_type": "code",
-   "execution_count": 13,
+   "execution_count": 7,
    "metadata": {},
    "outputs": [
     {
@@ -299,19 +301,19 @@
      "text": [
       "Warm up ...\n",
       "Start timing ...\n",
-      "Iteration 1000/10000, ave batch time 0.68 ms\n",
-      "Iteration 2000/10000, ave batch time 0.68 ms\n",
-      "Iteration 3000/10000, ave batch time 0.68 ms\n",
-      "Iteration 4000/10000, ave batch time 0.68 ms\n",
-      "Iteration 5000/10000, ave batch time 0.68 ms\n",
-      "Iteration 6000/10000, ave batch time 0.68 ms\n",
-      "Iteration 7000/10000, ave batch time 0.68 ms\n",
-      "Iteration 8000/10000, ave batch time 0.68 ms\n",
-      "Iteration 9000/10000, ave batch time 0.68 ms\n",
-      "Iteration 10000/10000, ave batch time 0.68 ms\n",
+      "Iteration 1000/10000, ave batch time 0.58 ms\n",
+      "Iteration 2000/10000, ave batch time 0.59 ms\n",
+      "Iteration 3000/10000, ave batch time 0.59 ms\n",
+      "Iteration 4000/10000, ave batch time 0.59 ms\n",
+      "Iteration 5000/10000, ave batch time 0.59 ms\n",
+      "Iteration 6000/10000, ave batch time 0.59 ms\n",
+      "Iteration 7000/10000, ave batch time 0.59 ms\n",
+      "Iteration 8000/10000, ave batch time 0.59 ms\n",
+      "Iteration 9000/10000, ave batch time 0.59 ms\n",
+      "Iteration 10000/10000, ave batch time 0.59 ms\n",
       "Input shape: torch.Size([1024, 1, 32, 32])\n",
       "Output features size: torch.Size([1024, 10])\n",
-      "Average batch time: 0.68 ms\n"
+      "Average batch time: 0.59 ms\n"
      ]
     }
    ],
@@ -330,7 +332,7 @@
   },
   {
    "cell_type": "code",
-   "execution_count": 14,
+   "execution_count": 8,
    "metadata": {},
    "outputs": [],
    "source": [
@@ -340,7 +342,7 @@
   },
   {
    "cell_type": "code",
-   "execution_count": 15,
+   "execution_count": 9,
    "metadata": {},
    "outputs": [
     {
@@ -362,7 +364,7 @@
        ")"
       ]
      },
-     "execution_count": 15,
+     "execution_count": 9,
      "metadata": {},
      "output_type": "execute_result"
     }
@@ -373,7 +375,7 @@
   },
   {
    "cell_type": "code",
-   "execution_count": 16,
+   "execution_count": 10,
    "metadata": {},
    "outputs": [
     {
@@ -382,19 +384,19 @@
      "text": [
       "Warm up ...\n",
       "Start timing ...\n",
-      "Iteration 1000/10000, ave batch time 0.68 ms\n",
-      "Iteration 2000/10000, ave batch time 0.68 ms\n",
-      "Iteration 3000/10000, ave batch time 0.68 ms\n",
-      "Iteration 4000/10000, ave batch time 0.68 ms\n",
-      "Iteration 5000/10000, ave batch time 0.68 ms\n",
-      "Iteration 6000/10000, ave batch time 0.68 ms\n",
-      "Iteration 7000/10000, ave batch time 0.68 ms\n",
-      "Iteration 8000/10000, ave batch time 0.68 ms\n",
-      "Iteration 9000/10000, ave batch time 0.68 ms\n",
-      "Iteration 10000/10000, ave batch time 0.68 ms\n",
+      "Iteration 1000/10000, ave batch time 0.59 ms\n",
+      "Iteration 2000/10000, ave batch time 0.59 ms\n",
+      "Iteration 3000/10000, ave batch time 0.59 ms\n",
+      "Iteration 4000/10000, ave batch time 0.59 ms\n",
+      "Iteration 5000/10000, ave batch time 0.59 ms\n",
+      "Iteration 6000/10000, ave batch time 0.59 ms\n",
+      "Iteration 7000/10000, ave batch time 0.59 ms\n",
+      "Iteration 8000/10000, ave batch time 0.59 ms\n",
+      "Iteration 9000/10000, ave batch time 0.59 ms\n",
+      "Iteration 10000/10000, ave batch time 0.59 ms\n",
       "Input shape: torch.Size([1024, 1, 32, 32])\n",
       "Output features size: torch.Size([1024, 10])\n",
-      "Average batch time: 0.68 ms\n"
+      "Average batch time: 0.59 ms\n"
      ]
     }
    ],
@@ -421,26 +423,27 @@
   },
   {
    "cell_type": "code",
-   "execution_count": 17,
+   "execution_count": 11,
    "metadata": {},
    "outputs": [],
    "source": [
     "import trtorch\n",
     "\n",
+    "# We use a batch-size of 1024, and half precision\n",
     "compile_settings = {\n",
     "    \"input_shapes\": [\n",
     "        {\n",
-    "            \"min\" : [1, 1, 32, 32],\n",
-    "            \"opt\" : [1, 1, 33, 33],\n",
-    "            \"max\" : [1, 1, 34, 34],\n",
+    "            \"min\" : [1024, 1, 32, 32],\n",
+    "            \"opt\" : [1024, 1, 33, 33],\n",
+    "            \"max\" : [1024, 1, 34, 34],\n",
     "        }\n",
     "    ],\n",
     "    \"op_precision\": torch.half # Run with FP16\n",
     "}\n",
     "\n",
     "trt_ts_module = trtorch.compile(traced_model, compile_settings)\n",
     "\n",
-    "input_data = torch.randn((1, 1, 32, 32))\n",
+    "input_data = torch.randn((1024, 1, 32, 32))\n",
     "input_data = input_data.half().to(\"cuda\")\n",
     "\n",
     "input_data = input_data.half()\n",
@@ -450,7 +453,7 @@
   },
   {
    "cell_type": "code",
-   "execution_count": 18,
+   "execution_count": 12,
    "metadata": {},
    "outputs": [
     {
@@ -459,24 +462,24 @@
      "text": [
       "Warm up ...\n",
       "Start timing ...\n",
-      "Iteration 1000/10000, ave batch time 0.24 ms\n",
-      "Iteration 2000/10000, ave batch time 0.24 ms\n",
-      "Iteration 3000/10000, ave batch time 0.24 ms\n",
-      "Iteration 4000/10000, ave batch time 0.24 ms\n",
-      "Iteration 5000/10000, ave batch time 0.24 ms\n",
-      "Iteration 6000/10000, ave batch time 0.24 ms\n",
-      "Iteration 7000/10000, ave batch time 0.23 ms\n",
-      "Iteration 8000/10000, ave batch time 0.23 ms\n",
-      "Iteration 9000/10000, ave batch time 0.23 ms\n",
-      "Iteration 10000/10000, ave batch time 0.23 ms\n",
+      "Iteration 1000/10000, ave batch time 0.41 ms\n",
+      "Iteration 2000/10000, ave batch time 0.41 ms\n",
+      "Iteration 3000/10000, ave batch time 0.41 ms\n",
+      "Iteration 4000/10000, ave batch time 0.40 ms\n",
+      "Iteration 5000/10000, ave batch time 0.40 ms\n",
+      "Iteration 6000/10000, ave batch time 0.40 ms\n",
+      "Iteration 7000/10000, ave batch time 0.40 ms\n",
+      "Iteration 8000/10000, ave batch time 0.40 ms\n",
+      "Iteration 9000/10000, ave batch time 0.40 ms\n",
+      "Iteration 10000/10000, ave batch time 0.40 ms\n",
       "Input shape: torch.Size([1024, 1, 32, 32])\n",
-      "Output features size: torch.Size([1, 10])\n",
-      "Average batch time: 0.23 ms\n"
+      "Output features size: torch.Size([1024, 10])\n",
+      "Average batch time: 0.40 ms\n"
      ]
     }
    ],
    "source": [
-    "benchmark(trt_ts_module, dtype=\"fp16\")"
+    "benchmark(trt_ts_module, input_shape=(1024, 1, 32, 32), dtype=\"fp16\")"
    ]
   },
   {
@@ -490,26 +493,27 @@
   },
   {
    "cell_type": "code",
-   "execution_count": 19,
+   "execution_count": 14,
    "metadata": {},
    "outputs": [],
    "source": [
     "import trtorch\n",
     "\n",
+    "# We use a batch-size of 1024, and half precision\n",
     "compile_settings = {\n",
     "    \"input_shapes\": [\n",
     "        {\n",
-    "            \"min\" : [1, 1, 32, 32],\n",
-    "            \"opt\" : [1, 1, 33, 33],\n",
-    "            \"max\" : [1, 1, 34, 34],\n",
+    "            \"min\" : [1024, 1, 32, 32],\n",
+    "            \"opt\" : [1024, 1, 33, 33],\n",
+    "            \"max\" : [1024, 1, 34, 34],\n",
     "        }\n",
     "    ],\n",
     "    \"op_precision\": torch.half # Run with FP16\n",
     "}\n",
     "\n",
     "trt_script_module = trtorch.compile(script_model, compile_settings)\n",
     "\n",
-    "input_data = torch.randn((1, 1, 32, 32))\n",
+    "input_data = torch.randn((1024, 1, 32, 32))\n",
     "input_data = input_data.half().to(\"cuda\")\n",
     "\n",
     "input_data = input_data.half()\n",
@@ -519,7 +523,7 @@
   },
   {
    "cell_type": "code",
-   "execution_count": 20,
+   "execution_count": 15,
    "metadata": {},
    "outputs": [
     {
@@ -528,24 +532,24 @@
      "text": [
       "Warm up ...\n",
       "Start timing ...\n",
-      "Iteration 1000/10000, ave batch time 0.20 ms\n",
-      "Iteration 2000/10000, ave batch time 0.20 ms\n",
-      "Iteration 3000/10000, ave batch time 0.20 ms\n",
-      "Iteration 4000/10000, ave batch time 0.21 ms\n",
-      "Iteration 5000/10000, ave batch time 0.21 ms\n",
-      "Iteration 6000/10000, ave batch time 0.21 ms\n",
-      "Iteration 7000/10000, ave batch time 0.21 ms\n",
-      "Iteration 8000/10000, ave batch time 0.21 ms\n",
-      "Iteration 9000/10000, ave batch time 0.21 ms\n",
-      "Iteration 10000/10000, ave batch time 0.21 ms\n",
+      "Iteration 1000/10000, ave batch time 0.40 ms\n",
+      "Iteration 2000/10000, ave batch time 0.40 ms\n",
+      "Iteration 3000/10000, ave batch time 0.40 ms\n",
+      "Iteration 4000/10000, ave batch time 0.40 ms\n",
+      "Iteration 5000/10000, ave batch time 0.40 ms\n",
+      "Iteration 6000/10000, ave batch time 0.40 ms\n",
+      "Iteration 7000/10000, ave batch time 0.40 ms\n",
+      "Iteration 8000/10000, ave batch time 0.40 ms\n",
+      "Iteration 9000/10000, ave batch time 0.40 ms\n",
+      "Iteration 10000/10000, ave batch time 0.40 ms\n",
       "Input shape: torch.Size([1024, 1, 32, 32])\n",
-      "Output features size: torch.Size([1, 10])\n",
-      "Average batch time: 0.21 ms\n"
+      "Output features size: torch.Size([1024, 10])\n",
+      "Average batch time: 0.40 ms\n"
      ]
     }
    ],
    "source": [
-    "benchmark(trt_ts_module, dtype=\"fp16\")"
+    "benchmark(trt_script_module, input_shape=(1024, 1, 32, 32), dtype=\"fp16\")"
    ]
   },
   {
@@ -559,13 +563,6 @@
     "### What's next\n",
     "Now it's time to try TRTorch on your own model. Fill out issues at https://github.com/NVIDIA/TRTorch. Your involvement will help future development of TRTorch.\n"
    ]
-  },
-  {
-   "cell_type": "code",
-   "execution_count": null,
-   "metadata": {},
-   "outputs": [],
-   "source": []
   }
  ],
  "metadata": {
@@ -589,4 +586,4 @@
  },
  "nbformat": 4,
  "nbformat_minor": 4
-}
+}