Add DCGAN (#261)

rickwierenga · BradLarson · commit b8db17903e85 · 2020-01-02T09:54:49.000-06:00
* add dcgan

* add batch size

* use swift-format

* format comments

* update to work with master

* Use saveImage instead of matplotlib

* add copyright notice

* remove placeholder labels

* remove unnecessary comments
diff --git a/DCGAN/README.md b/DCGAN/README.md
@@ -0,0 +1,30 @@
+# Deep Convolutional Generative Adversarial Network 
+
+arXiv: https://arxiv.org/abs/1406.2661
+
+After Epoch 1:
+<p align="center">
+<img src="images/epoch-1-output.png" height="270" width="360">
+</p>
+
+After Epoch 10:
+<p align="center">
+<img src="images/epoch-10-output.png" height="270" width="360">
+</p>
+
+
+## Tutorial
+
+You can read the tutorial on creating this model [here](https://rickwierenga.com/blog/s4tf/s4tf-gan.html) (rickwierenga.com).
+
+## Setup
+
+To begin, you'll need the [latest version of Swift for
+TensorFlow](https://github.com/tensorflow/swift/blob/master/Installation.md)
+installed. Make sure you've added the correct version of `swift` to your path.
+
+To train the model, run:
+
+```sh
+swift run DCGAN
+```
diff --git a/DCGAN/main.swift b/DCGAN/main.swift
@@ -0,0 +1,169 @@
+// Copyright 2019 The TensorFlow Authors. All Rights Reserved.
+//
+// Licensed under the Apache License, Version 2.0 (the "License");
+// you may not use this file except in compliance with the License.
+// You may obtain a copy of the License at
+//
+//     http://www.apache.org/licenses/LICENSE-2.0
+//
+// Unless required by applicable law or agreed to in writing, software
+// distributed under the License is distributed on an "AS IS" BASIS,
+// WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+// See the License for the specific language governing permissions and
+// limitations under the License.
+
+import Datasets
+import Foundation
+import ModelSupport
+import TensorFlow
+
+let batchSize = 512
+let mnist = MNIST(flattening: false, normalizing: true)
+
+let outputFolder = "./output/"
+
+let zDim = 100
+
+// MARK: - Models
+
+// MARK: Generator
+
+struct Generator: Layer {
+    var flatten = Flatten<Float>()
+
+    var dense1 = Dense<Float>(inputSize: zDim, outputSize: 7 * 7 * 256)
+    var batchNorm1 = BatchNorm<Float>(featureCount: 7 * 7 * 256)
+    var transConv2D1 = TransposedConv2D<Float>(
+        filterShape: (5, 5, 128, 256),
+        strides: (1, 1),
+        padding: .same
+    )
+    var batchNorm2 = BatchNorm<Float>(featureCount: 7 * 7 * 128)
+    var transConv2D2 = TransposedConv2D<Float>(
+        filterShape: (5, 5, 64, 128),
+        strides: (2, 2),
+        padding: .same
+    )
+    var batchNorm3 = BatchNorm<Float>(featureCount: 14 * 14 * 64)
+    var transConv2D3 = TransposedConv2D<Float>(
+        filterShape: (5, 5, 1, 64),
+        strides: (2, 2),
+        padding: .same
+    )
+
+    @differentiable
+    public func callAsFunction(_ input: Tensor<Float>) -> Tensor<Float> {
+        let x1 = leakyRelu(input.sequenced(through: dense1, batchNorm1))
+        let x1Reshape = x1.reshaped(to: TensorShape(x1.shape.contiguousSize / (7 * 7 * 256), 7, 7, 256))
+        let x2 = leakyRelu(x1Reshape.sequenced(through: transConv2D1, flatten, batchNorm2))
+        let x2Reshape = x2.reshaped(to: TensorShape(x2.shape.contiguousSize / (7 * 7 * 128), 7, 7, 128))
+        let x3 = leakyRelu(x2Reshape.sequenced(through: transConv2D2, flatten, batchNorm3))
+        let x3Reshape = x3.reshaped(to: TensorShape(x3.shape.contiguousSize / (14 * 14 * 64), 14, 14, 64))
+        return tanh(transConv2D3(x3Reshape))
+    }
+}
+
+@differentiable
+func generatorLoss(fakeLabels: Tensor<Float>) -> Tensor<Float> {
+    sigmoidCrossEntropy(logits: fakeLabels,
+                        labels: Tensor(ones: fakeLabels.shape))
+}
+
+// MARK: Discriminator
+
+struct Discriminator: Layer {
+    var conv2D1 = Conv2D<Float>(
+        filterShape: (5, 5, 1, 64),
+        strides: (2, 2),
+        padding: .same
+    )
+    var dropout = Dropout<Float>(probability: 0.3)
+    var conv2D2 = Conv2D<Float>(
+        filterShape: (5, 5, 64, 128),
+        strides: (2, 2),
+        padding: .same
+    )
+    var flatten = Flatten<Float>()
+    var dense = Dense<Float>(inputSize: 6272, outputSize: 1)
+
+    @differentiable
+    public func callAsFunction(_ input: Tensor<Float>) -> Tensor<Float> {
+        let x1 = dropout(leakyRelu(conv2D1(input)))
+        let x2 = dropout(leakyRelu(conv2D2(x1)))
+        return x2.sequenced(through: flatten, dense)
+    }
+}
+
+@differentiable
+func discriminatorLoss(realLabels: Tensor<Float>, fakeLabels: Tensor<Float>) -> Tensor<Float> {
+    let realLoss = sigmoidCrossEntropy(logits: realLabels,
+                                       labels: Tensor(ones: realLabels.shape))
+    let fakeLoss = sigmoidCrossEntropy(logits: fakeLabels,
+                                       labels: Tensor(zeros: fakeLabels.shape))
+    return realLoss + fakeLoss
+}
+
+// MARK: - Training
+
+// Create instances of models.
+var discriminator = Discriminator()
+var generator = Generator()
+
+// Define optimizers.
+let optG = Adam(for: generator, learningRate: 0.0001)
+let optD = Adam(for: discriminator, learningRate: 0.0001)
+
+// Test noise so we can track progress.
+let noise = Tensor<Float>(randomNormal: TensorShape(1, zDim))
+
+print("Begin training...")
+let epochs = 20
+for epoch in 0 ... epochs {
+    Context.local.learningPhase = .training
+    let trainingShuffled = mnist.trainingDataset.shuffled(sampleCount: mnist.trainingExampleCount, randomSeed: Int64(epoch)) 
+    for batch in trainingShuffled.batched(batchSize) {
+        let realImages = batch.data 
+
+        // Train generator.
+        let noiseG = Tensor<Float>(randomNormal: TensorShape(batchSize, zDim))
+        let 𝛁generator = generator.gradient { generator -> Tensor<Float> in
+            let fakeImages = generator(noiseG)
+            let fakeLabels = discriminator(fakeImages)
+            let loss = generatorLoss(fakeLabels: fakeLabels)
+            return loss
+        }
+        optG.update(&generator, along: 𝛁generator)
+
+        // Train discriminator.
+        let noiseD = Tensor<Float>(randomNormal: TensorShape(batchSize, zDim))
+        let fakeImages = generator(noiseD)
+
+        let 𝛁discriminator = discriminator.gradient { discriminator -> Tensor<Float> in
+            let realLabels = discriminator(realImages)
+            let fakeLabels = discriminator(fakeImages)
+            let loss = discriminatorLoss(realLabels: realLabels, fakeLabels: fakeLabels)
+            return loss
+        }
+        optD.update(&discriminator, along: 𝛁discriminator)
+    }
+
+    // Test the networks.
+    Context.local.learningPhase = .inference
+
+    // Render images.
+    let generatedImage = generator(noise)
+    try saveImage(
+        generatedImage, size: (28, 28), directory: outputFolder,
+        name: "\(epoch).jpg")
+
+    // Print loss.
+    let generatorLoss_ = generatorLoss(fakeLabels: generatedImage)
+    print("epoch: \(epoch) | Generator loss: \(generatorLoss_)")
+}
+
+// Generate another image.
+let noise1 = Tensor<Float>(randomNormal: TensorShape(1, 100))
+let generatedImage = generator(noise1)
+try saveImage(
+        generatedImage, size: (28, 28), directory: outputFolder,
+        name: "final.jpg")
diff --git a/Package.swift b/Package.swift
@@ -19,6 +19,7 @@ let package = Package(
         .executable(name: "MiniGoDemo", targets: ["MiniGoDemo"]),
         .library(name: "MiniGo", targets: ["MiniGo"]),
         .executable(name: "GAN", targets: ["GAN"]),
+        .executable(name: "DCGAN", targets: ["DCGAN"]),
         .executable(name: "FastStyleTransferDemo", targets: ["FastStyleTransferDemo"]),
         .library(name: "FastStyleTransfer", targets: ["FastStyleTransfer"]),
         .executable(name: "Benchmarks", targets: ["Benchmarks"]),
@@ -57,6 +58,7 @@ let package = Package(
         .testTarget(name: "DatasetsTests", dependencies: ["Datasets"]),
         .target(name: "Transformer", path: "Transformer"),
         .target(name: "GAN", dependencies: ["Datasets", "ModelSupport"], path: "GAN"),
+        .target(name: "DCGAN", dependencies: ["Datasets", "ModelSupport"], path: "DCGAN"),
         .target(name: "FastStyleTransfer", path: "FastStyleTransfer", exclude: ["Demo"]),
         .target(name: "FastStyleTransferDemo", dependencies: ["FastStyleTransfer"], 
             path: "FastStyleTransfer/Demo"),