add

Longsheng Du · Longsheng Du · commit d6a2e7a5967d · 2024-05-08T16:14:31.000+08:00
diff --git a/lib/gc-dialects/Transforms/OneDNNGraphToLinalg.cpp b/lib/gc-dialects/Transforms/OneDNNGraphToLinalg.cpp
@@ -0,0 +1,293 @@
+//===- OneDNNGraphToLinalg.cpp - OneDNN Graph To Linalg Lowering --*- C++ -*-=//
+//-*-===//
+//
+// This file is licensed under the Apache License v2.0 with LLVM Exceptions.
+// See https://llvm.org/LICENSE.txt for license information.
+// SPDX-License-Identifier: Apache-2.0 WITH LLVM-exception
+//
+//===----------------------------------------------------------------------===//
+
+#include <numeric>
+#include <vector>
+
+#include "gc-dialects/OneDNNGraph/OneDNNGraphDialect.h"
+#include "gc-dialects/OneDNNGraph/OneDNNGraphOps.h"
+#include "gc-dialects/Passes.h"
+#include "mlir/Dialect/Func/IR/FuncOps.h"
+#include "mlir/Dialect/LLVMIR/LLVMDialect.h"
+#include "mlir/Dialect/Linalg/IR/Linalg.h"
+#include "mlir/Dialect/Math/IR/Math.h"
+#include "mlir/Dialect/Tensor/IR/Tensor.h"
+#include "mlir/IR/PatternMatch.h"
+#include "mlir/Rewrite/FrozenRewritePatternSet.h"
+#include "mlir/Support/LogicalResult.h"
+#include "mlir/Transforms/GreedyPatternRewriteDriver.h"
+
+using namespace mlir::onednn_graph;
+
+namespace mlir {
+namespace gc {
+#define GEN_PASS_DEF_CONVERTONEDNNGRAPHTOLINALG
+#include "gc-dialects/Passes.h.inc"
+
+namespace {
+//===----------------------------------------------------------------------===//
+// Util funcs
+//===----------------------------------------------------------------------===//
+
+// Create lowered elementwise Op
+struct CreateElementwiseOp {
+  virtual ~CreateElementwiseOp() = default;
+  virtual Value create(OpBuilder &b, Location loc, ValueRange args) const = 0;
+};
+
+// Generate elementwise op using linalg::GenericOp
+Value createElemwiseOp(Location loc, PatternRewriter &rewriter, TensorType ty,
+                       llvm::ArrayRef<Value> inputs,
+                       const CreateElementwiseOp &createOp) {
+  // create indexing maps for elemwise_op as all identity maps
+  llvm::SmallVector<AffineMap> indexingMaps( //
+      inputs.size() + 1,                     //
+      rewriter.getMultiDimIdentityMap(ty.getRank()));
+  // create iterator types all "parallel", no axis for "reduction"
+  llvm::SmallVector<utils::IteratorType> iteratorTypes( //
+      ty.getRank(),                                     //
+      utils::IteratorType::parallel);
+
+  // create a new output tensor
+  Value outTensor =
+      rewriter.create<tensor::EmptyOp>(loc, ty.getShape(), ty.getElementType());
+
+  auto elemwiseOp = rewriter.create<linalg::GenericOp>(
+      /*location=*/loc,
+      /*resultTensorTypes=*/outTensor.getType(),
+      /*inputs=*/inputs,
+      /*outputs=*/outTensor,
+      /*indexingMaps=*/indexingMaps,
+      /*iteratorTypes=*/iteratorTypes,
+      [&](OpBuilder &b, Location loc, ValueRange args) {
+        Value result = createOp.create(b, loc, args);
+        b.create<linalg::YieldOp>(loc, result);
+      });
+
+  return elemwiseOp.getResult(0);
+}
+
+Value createBroadcastOperand(Location loc, PatternRewriter &rewriter,
+                             TensorType ty, Value op) {
+  auto opTy = dyn_cast<TensorType>(op.getType());
+  llvm::ArrayRef<int64_t> bcastShape = ty.getShape();
+  llvm::ArrayRef<int64_t> opShape = opTy.getShape();
+  int64_t diff = bcastShape.size() - opShape.size();
+  //
+  if (bcastShape.equals(opShape)) {
+    return op;
+  } else {
+    // get broadcast dimensions
+    llvm::SmallVector<int64_t> bcastDims;
+    for (int64_t i = 0; i < (int64_t)bcastShape.size(); i++) {
+      int64_t idxOp = i - diff;
+      if (idxOp < 0) {
+        bcastDims.push_back(i);
+      } else if (bcastShape[i] != opShape[idxOp]) {
+        bcastDims.push_back(i);
+      }
+    }
+    // create a new output tensor
+    Value initTensor =
+        rewriter.create<tensor::EmptyOp>(loc, bcastShape, ty.getElementType());
+    return rewriter
+        .create<linalg::BroadcastOp>(
+            /*location=*/loc,
+            /*inputs=*/op,
+            /*inits=*/initTensor,
+            /*dimensions=*/bcastDims)
+        .getResults()
+        .front();
+  }
+}
+
+//===----------------------------------------------------------------------===//
+// UnaryOp lowering
+//===----------------------------------------------------------------------===//
+
+template <typename UnaryOp, typename CreateLoweredOp>
+struct UnaryElemwiseLowering : public OpRewritePattern<UnaryOp> {
+  using OpRewritePattern<UnaryOp>::OpRewritePattern;
+  LogicalResult matchAndRewrite(UnaryOp op,
+                                PatternRewriter &rewriter) const final {
+    auto loc = op->getLoc();
+    auto resultTy = dyn_cast<TensorType>(op->getResultTypes().front());
+    //
+    auto unaryOp = createElemwiseOp(loc, rewriter, resultTy,
+                                    {op->getOperand(0)}, CreateLoweredOp());
+    rewriter.replaceOp(op, unaryOp);
+    return success();
+  }
+};
+
+template <typename LoweredOp>
+struct CreateLoweredUnaryOp : public CreateElementwiseOp {
+  Value create(OpBuilder &b, Location loc, ValueRange args) const final {
+    return b.create<LoweredOp>(loc, args[0]);
+  }
+};
+
+struct CreateLoweredReLUOp : public CreateElementwiseOp {
+  Value create(OpBuilder &b, Location loc, ValueRange args) const final {
+    Value input = args[0];
+    Value zeros =
+        b.create<arith::ConstantOp>(loc, FloatAttr::get(input.getType(), 0.f));
+    return b.create<arith::MaximumFOp>(loc, input, zeros);
+  }
+};
+
+//===----------------------------------------------------------------------===//
+// BinaryOp lowering
+//===----------------------------------------------------------------------===//
+
+template <typename BinaryOp, typename CreateLoweredOp>
+struct BinaryElemwiseLowering : public OpRewritePattern<BinaryOp> {
+  using OpRewritePattern<BinaryOp>::OpRewritePattern;
+  LogicalResult matchAndRewrite(BinaryOp op,
+                                PatternRewriter &rewriter) const final {
+    auto loc = op->getLoc();
+    auto resultTy = dyn_cast<TensorType>(op->getResultTypes().front());
+    //
+    auto lhsOp =
+        createBroadcastOperand(loc, rewriter, resultTy, op->getOperand(0));
+    auto rhsOp =
+        createBroadcastOperand(loc, rewriter, resultTy, op->getOperand(1));
+    //
+    auto binaryOp = createElemwiseOp(loc, rewriter, resultTy, {lhsOp, rhsOp},
+                                     CreateLoweredOp());
+    rewriter.replaceOp(op, binaryOp);
+    return success();
+  }
+};
+
+template <typename LoweredOp>
+struct CreateLoweredBinaryOp : public CreateElementwiseOp {
+  Value create(OpBuilder &b, Location loc, ValueRange args) const final {
+    return b.create<LoweredOp>(loc, args[0], args[1]);
+  }
+};
+
+//===----------------------------------------------------------------------===//
+// Op lowering
+//===----------------------------------------------------------------------===//
+
+using ReLUOpLowering = UnaryElemwiseLowering< //
+    onednn_graph::ReLUOp, CreateLoweredReLUOp>;
+// using ExpOpLowering = UnaryElemwiseLowering< //
+//     onednn_graph::ExpOp, CreateLoweredUnaryOp<math::ExpOp>>;
+
+using AddOpLowering = BinaryElemwiseLowering< //
+    onednn_graph::AddOp, CreateLoweredBinaryOp<arith::AddFOp>>;
+// using SubOpLowering = BinaryElemwiseLowering< //
+//     onednn_graph::SubOp, CreateLoweredBinaryOp<arith::SubFOp>>;
+// using MulOpLowering = BinaryElemwiseLowering< //
+//     onednn_graph::MulOp, CreateLoweredBinaryOp<arith::MulFOp>>;
+// using DivOpLowering = BinaryElemwiseLowering< //
+//     onednn_graph::DivOp, CreateLoweredBinaryOp<arith::DivFOp>>;
+
+//===----------------------------------------------------------------------===//
+// MatMulOp lowering
+//===----------------------------------------------------------------------===//
+
+struct MatMulOpLowering : public OpRewritePattern<MatMulOp> {
+  using OpRewritePattern<MatMulOp>::OpRewritePattern;
+  LogicalResult matchAndRewrite(MatMulOp op,
+                                PatternRewriter &rewriter) const final {
+    auto loc = op->getLoc();
+    auto resultTy = dyn_cast<TensorType>(op->getResultTypes().front());
+    //
+    Value newTensor = rewriter.create<tensor::EmptyOp>(
+        loc, resultTy.getShape(), resultTy.getElementType());
+    Value zero = rewriter.create<arith::ConstantOp>(
+        loc, rewriter.getZeroAttr(resultTy.getElementType()));
+    Value outTensor =
+        rewriter.create<linalg::FillOp>(loc, zero, newTensor).getResult(0);
+
+    bool transposeA = op.getTransposeA();
+    bool transposeB = op.getTransposeB();
+    Operation *newOp;
+    if (!transposeA && !transposeB) {
+      // (A * B)
+      newOp = rewriter.create<linalg::MatmulOp>(
+          /*location=*/loc,
+          /*resultTensorTypes=*/resultTy,
+          /*inputs=*/ValueRange{op.getInputA(), op.getInputB()},
+          /*outputs=*/outTensor);
+    } else if (transposeA && !transposeB) {
+      // T(A) * B
+      newOp = rewriter.create<linalg::MatmulTransposeAOp>(
+          /*location=*/loc,
+          /*resultTensorTypes=*/resultTy,
+          /*inputs=*/ValueRange{op.getInputA(), op.getInputB()},
+          /*outputs=*/outTensor);
+    } else if (!transposeA && transposeB) {
+      // A * T(B)
+      newOp = rewriter.create<linalg::MatmulTransposeBOp>(
+          /*location=*/loc,
+          /*resultTensorTypes=*/resultTy,
+          /*inputs=*/ValueRange{op.getInputA(), op.getInputB()},
+          /*outputs=*/outTensor);
+    } else {
+      // T(B * A)
+      int64_t rank = resultTy.getRank();
+      SmallVector<int64_t> permutation(rank);
+      std::iota(std::begin(permutation), std::end(permutation), 0);
+      permutation[rank - 2] = rank - 1;
+      permutation[rank - 1] = rank - 2;
+      auto matmulOp = rewriter.create<linalg::MatmulOp>(
+          /*location=*/loc,
+          /*resultTensorTypes=*/resultTy,
+          /*inputs=*/ValueRange{op.getInputB(), op.getInputA()},
+          /*outputs=*/outTensor);
+      newOp = rewriter.create<linalg::TransposeOp>(
+          /*location=*/loc,
+          /*inputs=*/matmulOp.getResult(0),
+          /*outputs=*/outTensor,
+          /*permutation=*/permutation);
+    }
+
+    if (op.getBias()) {
+      auto bias = createBroadcastOperand(loc, rewriter, resultTy, op.getBias());
+      newOp = rewriter.create<linalg::AddOp>(
+          /*location=*/loc,
+          /*resultTensorTypes=*/outTensor.getType(),
+          /*inputs=*/newOp->getResult(0),
+          /*outputs=*/bias);
+    }
+
+    rewriter.replaceOp(op, newOp);
+    return success();
+  }
+};
+
+//===----------------------------------------------------------------------===//
+// Pass define
+//===----------------------------------------------------------------------===//
+
+struct ConvertOneDNNGraphToLinalg
+    : public impl::ConvertOneDNNGraphToLinalgBase<ConvertOneDNNGraphToLinalg> {
+
+  void runOnOperation() final {
+    //
+    auto *ctx = &getContext();
+    RewritePatternSet patterns(ctx);
+    patterns.add<AddOpLowering>(ctx);
+    patterns.add<ReLUOpLowering>(ctx);
+    patterns.add<MatMulOpLowering>(ctx);
+    //
+    if (failed(applyPatternsAndFoldGreedily(getOperation(),
+                                            std::move(patterns)))) {
+      signalPassFailure();
+    }
+  }
+};
+
+} // namespace
+} // namespace gc
+} // namespace mlir