Linalg/Transforms/TransposeConv2D.cpp

4a3d2088SJack Frankland//===- TransposeConv2D.cpp - Convolution transposition  -------------------===//
4a3d2088SJack Frankland//
4a3d2088SJack Frankland// Part of the LLVM Project, under the Apache License v2.0 with LLVM Exceptions.
4a3d2088SJack Frankland// See https://llvm.org/LICENSE.txt for license information.
4a3d2088SJack Frankland// SPDX-License-Identifier: Apache-2.0 WITH LLVM-exception
4a3d2088SJack Frankland//
4a3d2088SJack Frankland//===----------------------------------------------------------------------===//
4a3d2088SJack Frankland
4a3d2088SJack Frankland#include "mlir/Dialect/Func/IR/FuncOps.h"
4a3d2088SJack Frankland#include "mlir/Dialect/Linalg/IR/Linalg.h"
4a3d2088SJack Frankland#include "mlir/Dialect/MemRef/IR/MemRef.h"
4a3d2088SJack Frankland#include "mlir/Dialect/Tensor/IR/Tensor.h"
4a3d2088SJack Frankland#include "mlir/IR/BuiltinTypes.h"
4a3d2088SJack Frankland#include "mlir/IR/PatternMatch.h"
4a3d2088SJack Frankland#include "mlir/IR/ValueRange.h"
4a3d2088SJack Frankland#include "mlir/Transforms/DialectConversion.h"
4a3d2088SJack Frankland#include "mlir/Transforms/GreedyPatternRewriteDriver.h"
4a3d2088SJack Frankland#include "llvm/ADT/SmallVector.h"
4a3d2088SJack Frankland#include "llvm/Support/ErrorHandling.h"
4a3d2088SJack Frankland#include "llvm/Support/RWMutex.h"
4a3d2088SJack Frankland#include <memory>
4a3d2088SJack Frankland#include <numeric>
4a3d2088SJack Frankland
4a3d2088SJack Franklandnamespace mlir {
4a3d2088SJack Franklandnamespace linalg {
4a3d2088SJack Franklandnamespace {
4a3d2088SJack Frankland// clang-format off
4a3d2088SJack Frankland/// Convolution converter that applies the following rewrite:
4a3d2088SJack Frankland///
4a3d2088SJack Frankland/// Before:
4a3d2088SJack Frankland///
4a3d2088SJack Frankland///   %0 = linalg.conv_2d_nhwc_fhwc {dilations = dense<1> : tensor<2xi64>,
4a3d2088SJack Frankland///                                               strides = dense<2> : tensor<2xi64>}
4a3d2088SJack Frankland///      ins (%input, %filter: tensor<1x4x4x6xf32>, tensor<8x2x2x6xf32>)
4a3d2088SJack Frankland///     outs (%init: tensor<1x2x2x8xf32>) -> tensor<1x2x2x8xf32>
4a3d2088SJack Frankland///
4a3d2088SJack Frankland/// After:
4a3d2088SJack Frankland///
4a3d2088SJack Frankland///    %cst = arith.constant 0.000000e+00 : f32
4a3d2088SJack Frankland///    %0 = tensor.empty() : tensor<2x2x6x8xf32>
4a3d2088SJack Frankland///    %1 = linalg.fill ins(%cst : f32) outs(%0 : tensor<2x2x6x8xf32>) -> tensor<2x2x6x8xf32>
4a3d2088SJack Frankland///    %transposed = linalg.transpose ins(%arg1 : tensor<8x2x2x6xf32>) outs(%1 : tensor<2x2x6x8xf32>)
4a3d2088SJack Frankland///                  permutation = [1, 2, 3, 0]
4a3d2088SJack Frankland///    %2 = linalg.conv_2d_nhwc_hwcf {dilations = dense<1> : tensor<2xi64>, strides = dense<2> : tensor<2xi64>}
4a3d2088SJack Frankland///         ins(%arg0, %transposed : tensor<1x4x4x6xf32>, tensor<2x2x6x8xf32>) outs(%arg2 : tensor<1x2x2x8xf32>)
4a3d2088SJack Frankland///         -> tensor<1x2x2x8xf32>
4a3d2088SJack Frankland///
4a3d2088SJack Frankland/// with an analogous example for the quantized case.
4a3d2088SJack Frankland// clang-format on
4a3d2088SJack Franklandtemplate <typename FHWCConvOp, typename HWCFConvOp>
4a3d2088SJack FranklandFailureOr<Operation *> transposeConv2DHelper(RewriterBase &rewriter,
4a3d2088SJack Frankland                                             FHWCConvOp op) {
4a3d2088SJack Frankland  // Construct a permutation of the filter tensor dimensions. For a 2D
4a3d2088SJack Frankland  // convolution this will be known statically as [1, 2, 3, 0].
9cbc1f29SHan-Chung Wang  SmallVector<int64_t> filterPerm = {1, 2, 3, 0};
4a3d2088SJack Frankland
4a3d2088SJack Frankland  // Create the type for the transposed filter tensor.
4a3d2088SJack Frankland  auto filter = op->getOperand(1);
4a3d2088SJack Frankland  auto filterTy = cast<ShapedType>(filter.getType());
4a3d2088SJack Frankland  SmallVector<int64_t> newFilterShape(filterPerm.size());
4a3d2088SJack Frankland  std::generate(std::begin(newFilterShape), std::end(newFilterShape),
4a3d2088SJack Frankland                [dim = 0, &filterTy, &filterPerm]() mutable {
4a3d2088SJack Frankland                  return filterTy.getShape()[filterPerm[dim++]];
4a3d2088SJack Frankland                });
4a3d2088SJack Frankland
4a3d2088SJack Frankland  // Because linalg.transpose expects an "out" parameter we need to pass it a
4a3d2088SJack Frankland  // tensor of zeros of the result type so here we construct that tensor.
4a3d2088SJack Frankland  auto inputType = op->getOperand(0).getType();
4a3d2088SJack Frankland  auto elementTy = cast<ShapedType>(inputType).getElementType();
4a3d2088SJack Frankland  auto loc = op->getLoc();
4a3d2088SJack Frankland
4a3d2088SJack Frankland  const auto isTensorOp = isa<TensorType>(inputType);
4a3d2088SJack Frankland  Value input;
4a3d2088SJack Frankland  if (isTensorOp) {
4a3d2088SJack Frankland
4a3d2088SJack Frankland    input = rewriter.create<tensor::EmptyOp>(loc, newFilterShape, elementTy)
4a3d2088SJack Frankland                .getResult();
4a3d2088SJack Frankland  } else {
4a3d2088SJack Frankland    input = rewriter
4a3d2088SJack Frankland                .create<memref::AllocOp>(
4a3d2088SJack Frankland                    loc, MemRefType::get(newFilterShape, elementTy))
4a3d2088SJack Frankland                .getResult();
4a3d2088SJack Frankland  }
4a3d2088SJack Frankland
4a3d2088SJack Frankland  // We can then construct the transposition on our filter.
4a3d2088SJack Frankland  auto transpose =
4a3d2088SJack Frankland      rewriter.create<linalg::TransposeOp>(loc, filter, input, filterPerm);
4a3d2088SJack Frankland
4a3d2088SJack Frankland  Value newFilter;
4a3d2088SJack Frankland  if (isTensorOp) {
4a3d2088SJack Frankland    newFilter = transpose.getResult()[0];
4a3d2088SJack Frankland  } else {
4a3d2088SJack Frankland    newFilter = input;
4a3d2088SJack Frankland  }
4a3d2088SJack Frankland
4a3d2088SJack Frankland  SmallVector<Value> newInputs{op.getInputs()};
4a3d2088SJack Frankland  // The filter is always the second input argument, the other inputs can be
4a3d2088SJack Frankland  // left as they are.
4a3d2088SJack Frankland  newInputs[1] = newFilter;
4a3d2088SJack Frankland  // It is possible the convolution doesn't define any results and its
4a3d2088SJack Frankland  // out argument is just used instead.
4a3d2088SJack Frankland  SmallVector<Type> resultTy;
4a3d2088SJack Frankland  if (op.getNumResults()) {
4a3d2088SJack Frankland    resultTy.push_back(op->getResult(0).getType());
4a3d2088SJack Frankland  }
4a3d2088SJack Frankland  auto newConv =
4a3d2088SJack Frankland      rewriter.create<HWCFConvOp>(loc, resultTy, newInputs, op.getOutputs(),
4a3d2088SJack Frankland                                  op.getStrides(), op.getDilations());
4a3d2088SJack Frankland  rewriter.replaceOp(op, newConv);
4a3d2088SJack Frankland  return newConv.getOperation();
4a3d2088SJack Frankland}
4a3d2088SJack Frankland
4a3d2088SJack Franklandtemplate <typename FHWCConvOp, typename HWCFConvOp>
4a3d2088SJack Franklandclass ConvConverter : public OpRewritePattern<FHWCConvOp> {
4a3d2088SJack Franklandpublic:
4a3d2088SJack Frankland  using OpRewritePattern<FHWCConvOp>::OpRewritePattern;
4a3d2088SJack Frankland  LogicalResult matchAndRewrite(FHWCConvOp op,
4a3d2088SJack Frankland                                PatternRewriter &rewriter) const final {
4a3d2088SJack Frankland    if (failed(transposeConv2DHelper<FHWCConvOp, HWCFConvOp>(rewriter, op))) {
4a3d2088SJack Frankland      return failure();
4a3d2088SJack Frankland    }
4a3d2088SJack Frankland    return success();
4a3d2088SJack Frankland  }
4a3d2088SJack Frankland};
4a3d2088SJack Frankland} // namespace
4a3d2088SJack Frankland
4a3d2088SJack FranklandFailureOr<Operation *> transposeConv2D(RewriterBase &rewriter,
4a3d2088SJack Frankland                                       linalg::Conv2DNhwcFhwcOp op) {
4a3d2088SJack Frankland
4a3d2088SJack Frankland  return transposeConv2DHelper<linalg::Conv2DNhwcFhwcOp,
4a3d2088SJack Frankland                               linalg::Conv2DNhwcHwcfOp>(rewriter, op);
4a3d2088SJack Frankland}
4a3d2088SJack Frankland
4a3d2088SJack FranklandFailureOr<Operation *> transposeConv2D(RewriterBase &rewriter,
4a3d2088SJack Frankland                                       linalg::Conv2DNhwcFhwcQOp op) {
4a3d2088SJack Frankland
4a3d2088SJack Frankland  return transposeConv2DHelper<linalg::Conv2DNhwcFhwcQOp,
4a3d2088SJack Frankland                               linalg::Conv2DNhwcHwcfQOp>(rewriter, op);
4a3d2088SJack Frankland}
4a3d2088SJack Frankland
*aa295216SJay Foadvoid populateTransposeConv2DPatterns(RewritePatternSet &patterns) {
4a3d2088SJack Frankland  MLIRContext *context = patterns.getContext();
4a3d2088SJack Frankland  patterns.insert<
4a3d2088SJack Frankland      ConvConverter<linalg::Conv2DNhwcFhwcOp, linalg::Conv2DNhwcHwcfOp>,
4a3d2088SJack Frankland      ConvConverter<linalg::Conv2DNhwcFhwcQOp, linalg::Conv2DNhwcHwcfQOp>>(
4a3d2088SJack Frankland      context);
4a3d2088SJack Frankland}
4a3d2088SJack Frankland} // namespace linalg
4a3d2088SJack Frankland} // namespace mlir