Vector/Transforms/LowerVectorMultiReduction.cpp

2bc4c3e9SNicolas Vasilache//===- LowerVectorMultiReduction.cpp - Lower `vector.multi_reduction` op --===//
2bc4c3e9SNicolas Vasilache//
2bc4c3e9SNicolas Vasilache/// Part of the LLVM Project, under the Apache License v2.0 with LLVM
2bc4c3e9SNicolas Vasilache/// Exceptions. See https://llvm.org/LICENSE.txt for license information.
2bc4c3e9SNicolas Vasilache/// SPDX-License-Identifier: Apache-2.0 WITH LLVM-exception
2bc4c3e9SNicolas Vasilache//
2bc4c3e9SNicolas Vasilache//===----------------------------------------------------------------------===//
2bc4c3e9SNicolas Vasilache//
2bc4c3e9SNicolas Vasilache// This file implements target-independent rewrites and utilities to lower the
2bc4c3e9SNicolas Vasilache// 'vector.multi_reduction' operation.
2bc4c3e9SNicolas Vasilache//
2bc4c3e9SNicolas Vasilache//===----------------------------------------------------------------------===//
2bc4c3e9SNicolas Vasilache
2bc4c3e9SNicolas Vasilache#include "mlir/Dialect/Arith/IR/Arith.h"
8d6469b0Sxiaoleis-nv#include "mlir/Dialect/Func/IR/FuncOps.h"
2bc4c3e9SNicolas Vasilache#include "mlir/Dialect/Vector/Transforms/LoweringPatterns.h"
8d6469b0Sxiaoleis-nv#include "mlir/Dialect/Vector/Transforms/Passes.h"
2bc4c3e9SNicolas Vasilache#include "mlir/IR/Builders.h"
2bc4c3e9SNicolas Vasilache#include "mlir/IR/TypeUtilities.h"
8d6469b0Sxiaoleis-nv#include "mlir/Transforms/GreedyPatternRewriteDriver.h"
8d6469b0Sxiaoleis-nv
8d6469b0Sxiaoleis-nvnamespace mlir {
8d6469b0Sxiaoleis-nvnamespace vector {
8d6469b0Sxiaoleis-nv#define GEN_PASS_DEF_LOWERVECTORMULTIREDUCTION
8d6469b0Sxiaoleis-nv#include "mlir/Dialect/Vector/Transforms/Passes.h.inc"
8d6469b0Sxiaoleis-nv} // namespace vector
8d6469b0Sxiaoleis-nv} // namespace mlir
2bc4c3e9SNicolas Vasilache
2bc4c3e9SNicolas Vasilache#define DEBUG_TYPE "vector-multi-reduction"
2bc4c3e9SNicolas Vasilache
2bc4c3e9SNicolas Vasilacheusing namespace mlir;
2bc4c3e9SNicolas Vasilache
2bc4c3e9SNicolas Vasilachenamespace {
2bc4c3e9SNicolas Vasilache/// This file implements the following transformations as composable atomic
2bc4c3e9SNicolas Vasilache/// patterns.
2bc4c3e9SNicolas Vasilache
2bc4c3e9SNicolas Vasilache/// Converts vector.multi_reduction into inner-most/outer-most reduction form
2bc4c3e9SNicolas Vasilache/// by using vector.transpose
2bc4c3e9SNicolas Vasilacheclass InnerOuterDimReductionConversion
2bc4c3e9SNicolas Vasilache    : public OpRewritePattern<vector::MultiDimReductionOp> {
2bc4c3e9SNicolas Vasilachepublic:
2bc4c3e9SNicolas Vasilache  using OpRewritePattern::OpRewritePattern;
2bc4c3e9SNicolas Vasilache
2bc4c3e9SNicolas Vasilache  explicit InnerOuterDimReductionConversion(
2bc4c3e9SNicolas Vasilache      MLIRContext *context, vector::VectorMultiReductionLowering options,
2bc4c3e9SNicolas Vasilache      PatternBenefit benefit = 1)
2bc4c3e9SNicolas Vasilache      : mlir::OpRewritePattern<vector::MultiDimReductionOp>(context, benefit),
2bc4c3e9SNicolas Vasilache        useInnerDimsForReduction(
2bc4c3e9SNicolas Vasilache            options == vector::VectorMultiReductionLowering::InnerReduction) {}
2bc4c3e9SNicolas Vasilache
2bc4c3e9SNicolas Vasilache  LogicalResult matchAndRewrite(vector::MultiDimReductionOp multiReductionOp,
2bc4c3e9SNicolas Vasilache                                PatternRewriter &rewriter) const override {
2bc4c3e9SNicolas Vasilache    // Vector mask setup.
2bc4c3e9SNicolas Vasilache    OpBuilder::InsertionGuard guard(rewriter);
2bc4c3e9SNicolas Vasilache    auto maskableOp =
2bc4c3e9SNicolas Vasilache        cast<vector::MaskableOpInterface>(multiReductionOp.getOperation());
2bc4c3e9SNicolas Vasilache    Operation *rootOp;
2bc4c3e9SNicolas Vasilache    if (maskableOp.isMasked()) {
2bc4c3e9SNicolas Vasilache      rewriter.setInsertionPoint(maskableOp.getMaskingOp());
2bc4c3e9SNicolas Vasilache      rootOp = maskableOp.getMaskingOp();
2bc4c3e9SNicolas Vasilache    } else {
2bc4c3e9SNicolas Vasilache      rootOp = multiReductionOp;
2bc4c3e9SNicolas Vasilache    }
2bc4c3e9SNicolas Vasilache
2bc4c3e9SNicolas Vasilache    auto src = multiReductionOp.getSource();
2bc4c3e9SNicolas Vasilache    auto loc = multiReductionOp.getLoc();
2bc4c3e9SNicolas Vasilache    auto srcRank = multiReductionOp.getSourceVectorType().getRank();
2bc4c3e9SNicolas Vasilache
2bc4c3e9SNicolas Vasilache    // Separate reduction and parallel dims
5f26497dSBenjamin Maxwell    ArrayRef<int64_t> reductionDims = multiReductionOp.getReductionDims();
2bc4c3e9SNicolas Vasilache    llvm::SmallDenseSet<int64_t> reductionDimsSet(reductionDims.begin(),
2bc4c3e9SNicolas Vasilache                                                  reductionDims.end());
2bc4c3e9SNicolas Vasilache    int64_t reductionSize = reductionDims.size();
2bc4c3e9SNicolas Vasilache    SmallVector<int64_t, 4> parallelDims;
2bc4c3e9SNicolas Vasilache    for (int64_t i = 0; i < srcRank; ++i)
2bc4c3e9SNicolas Vasilache      if (!reductionDimsSet.contains(i))
2bc4c3e9SNicolas Vasilache        parallelDims.push_back(i);
2bc4c3e9SNicolas Vasilache
2bc4c3e9SNicolas Vasilache    // Add transpose only if inner-most/outer-most dimensions are not parallel
2bc4c3e9SNicolas Vasilache    // and there are parallel dims.
2bc4c3e9SNicolas Vasilache    if (parallelDims.empty())
2bc4c3e9SNicolas Vasilache      return failure();
2bc4c3e9SNicolas Vasilache    if (useInnerDimsForReduction &&
2bc4c3e9SNicolas Vasilache        (parallelDims ==
2bc4c3e9SNicolas Vasilache         llvm::to_vector<4>(llvm::seq<int64_t>(0, parallelDims.size()))))
2bc4c3e9SNicolas Vasilache      return failure();
2bc4c3e9SNicolas Vasilache
2bc4c3e9SNicolas Vasilache    if (!useInnerDimsForReduction &&
2bc4c3e9SNicolas Vasilache        (parallelDims == llvm::to_vector<4>(llvm::seq<int64_t>(
2bc4c3e9SNicolas Vasilache                             reductionDims.size(),
2bc4c3e9SNicolas Vasilache                             parallelDims.size() + reductionDims.size()))))
2bc4c3e9SNicolas Vasilache      return failure();
2bc4c3e9SNicolas Vasilache
2bc4c3e9SNicolas Vasilache    SmallVector<int64_t, 4> indices;
2bc4c3e9SNicolas Vasilache    if (useInnerDimsForReduction) {
2bc4c3e9SNicolas Vasilache      indices.append(parallelDims.begin(), parallelDims.end());
2bc4c3e9SNicolas Vasilache      indices.append(reductionDims.begin(), reductionDims.end());
2bc4c3e9SNicolas Vasilache    } else {
2bc4c3e9SNicolas Vasilache      indices.append(reductionDims.begin(), reductionDims.end());
2bc4c3e9SNicolas Vasilache      indices.append(parallelDims.begin(), parallelDims.end());
2bc4c3e9SNicolas Vasilache    }
2bc4c3e9SNicolas Vasilache
2bc4c3e9SNicolas Vasilache    // If masked, transpose the original mask.
2bc4c3e9SNicolas Vasilache    Value transposedMask;
2bc4c3e9SNicolas Vasilache    if (maskableOp.isMasked()) {
2bc4c3e9SNicolas Vasilache      transposedMask = rewriter.create<vector::TransposeOp>(
2bc4c3e9SNicolas Vasilache          loc, maskableOp.getMaskingOp().getMask(), indices);
2bc4c3e9SNicolas Vasilache    }
2bc4c3e9SNicolas Vasilache
2bc4c3e9SNicolas Vasilache    // Transpose reduction source.
2bc4c3e9SNicolas Vasilache    auto transposeOp = rewriter.create<vector::TransposeOp>(loc, src, indices);
2bc4c3e9SNicolas Vasilache    SmallVector<bool> reductionMask(srcRank, false);
2bc4c3e9SNicolas Vasilache    for (int i = 0; i < reductionSize; ++i) {
2bc4c3e9SNicolas Vasilache      if (useInnerDimsForReduction)
2bc4c3e9SNicolas Vasilache        reductionMask[srcRank - i - 1] = true;
2bc4c3e9SNicolas Vasilache      else
2bc4c3e9SNicolas Vasilache        reductionMask[i] = true;
2bc4c3e9SNicolas Vasilache    }
2bc4c3e9SNicolas Vasilache
2bc4c3e9SNicolas Vasilache    Operation *newMultiRedOp = rewriter.create<vector::MultiDimReductionOp>(
2bc4c3e9SNicolas Vasilache        multiReductionOp.getLoc(), transposeOp.getResult(),
2bc4c3e9SNicolas Vasilache        multiReductionOp.getAcc(), reductionMask, multiReductionOp.getKind());
2bc4c3e9SNicolas Vasilache    newMultiRedOp =
2bc4c3e9SNicolas Vasilache        mlir::vector::maskOperation(rewriter, newMultiRedOp, transposedMask);
2bc4c3e9SNicolas Vasilache
2bc4c3e9SNicolas Vasilache    rewriter.replaceOp(rootOp, newMultiRedOp->getResult(0));
2bc4c3e9SNicolas Vasilache    return success();
2bc4c3e9SNicolas Vasilache  }
2bc4c3e9SNicolas Vasilache
2bc4c3e9SNicolas Vasilacheprivate:
2bc4c3e9SNicolas Vasilache  const bool useInnerDimsForReduction;
2bc4c3e9SNicolas Vasilache};
2bc4c3e9SNicolas Vasilache
2bc4c3e9SNicolas Vasilache/// Reduces the rank of vector.multi_reduction nd -> 2d given all reduction
2bc4c3e9SNicolas Vasilache/// dimensions are either inner most or outer most.
2bc4c3e9SNicolas Vasilacheclass ReduceMultiDimReductionRank
2bc4c3e9SNicolas Vasilache    : public OpRewritePattern<vector::MultiDimReductionOp> {
2bc4c3e9SNicolas Vasilachepublic:
2bc4c3e9SNicolas Vasilache  using OpRewritePattern::OpRewritePattern;
2bc4c3e9SNicolas Vasilache
2bc4c3e9SNicolas Vasilache  explicit ReduceMultiDimReductionRank(
2bc4c3e9SNicolas Vasilache      MLIRContext *context, vector::VectorMultiReductionLowering options,
2bc4c3e9SNicolas Vasilache      PatternBenefit benefit = 1)
2bc4c3e9SNicolas Vasilache      : mlir::OpRewritePattern<vector::MultiDimReductionOp>(context, benefit),
2bc4c3e9SNicolas Vasilache        useInnerDimsForReduction(
2bc4c3e9SNicolas Vasilache            options == vector::VectorMultiReductionLowering::InnerReduction) {}
2bc4c3e9SNicolas Vasilache
2bc4c3e9SNicolas Vasilache  LogicalResult matchAndRewrite(vector::MultiDimReductionOp multiReductionOp,
2bc4c3e9SNicolas Vasilache                                PatternRewriter &rewriter) const override {
2bc4c3e9SNicolas Vasilache    // Vector mask setup.
2bc4c3e9SNicolas Vasilache    OpBuilder::InsertionGuard guard(rewriter);
2bc4c3e9SNicolas Vasilache    auto maskableOp =
2bc4c3e9SNicolas Vasilache        cast<vector::MaskableOpInterface>(multiReductionOp.getOperation());
2bc4c3e9SNicolas Vasilache    Operation *rootOp;
2bc4c3e9SNicolas Vasilache    if (maskableOp.isMasked()) {
2bc4c3e9SNicolas Vasilache      rewriter.setInsertionPoint(maskableOp.getMaskingOp());
2bc4c3e9SNicolas Vasilache      rootOp = maskableOp.getMaskingOp();
2bc4c3e9SNicolas Vasilache    } else {
2bc4c3e9SNicolas Vasilache      rootOp = multiReductionOp;
2bc4c3e9SNicolas Vasilache    }
2bc4c3e9SNicolas Vasilache
2bc4c3e9SNicolas Vasilache    auto srcRank = multiReductionOp.getSourceVectorType().getRank();
2bc4c3e9SNicolas Vasilache    auto srcShape = multiReductionOp.getSourceVectorType().getShape();
5c581720SAndrzej Warzynski    auto srcScalableDims =
5c581720SAndrzej Warzynski        multiReductionOp.getSourceVectorType().getScalableDims();
2bc4c3e9SNicolas Vasilache    auto loc = multiReductionOp.getLoc();
2bc4c3e9SNicolas Vasilache
2bc4c3e9SNicolas Vasilache    // If rank less than 2, nothing to do.
2bc4c3e9SNicolas Vasilache    if (srcRank < 2)
2bc4c3e9SNicolas Vasilache      return failure();
2bc4c3e9SNicolas Vasilache
5c581720SAndrzej Warzynski    // Allow only 1 scalable dimensions. Otherwise we could end-up with e.g.
5c581720SAndrzej Warzynski    // `vscale * vscale` that's currently not modelled.
5c581720SAndrzej Warzynski    if (llvm::count(srcScalableDims, true) > 1)
5c581720SAndrzej Warzynski      return failure();
5c581720SAndrzej Warzynski
2bc4c3e9SNicolas Vasilache    // If already rank-2 ["parallel", "reduce"] or ["reduce", "parallel"] bail.
2bc4c3e9SNicolas Vasilache    SmallVector<bool> reductionMask = multiReductionOp.getReductionMask();
2bc4c3e9SNicolas Vasilache    if (srcRank == 2 && reductionMask.front() != reductionMask.back())
2bc4c3e9SNicolas Vasilache      return failure();
2bc4c3e9SNicolas Vasilache
2bc4c3e9SNicolas Vasilache    // 1. Separate reduction and parallel dims.
2bc4c3e9SNicolas Vasilache    SmallVector<int64_t, 4> parallelDims, parallelShapes;
5c581720SAndrzej Warzynski    SmallVector<bool, 4> parallelScalableDims;
2bc4c3e9SNicolas Vasilache    SmallVector<int64_t, 4> reductionDims, reductionShapes;
5c581720SAndrzej Warzynski    bool isReductionDimScalable = false;
2bc4c3e9SNicolas Vasilache    for (const auto &it : llvm::enumerate(reductionMask)) {
2bc4c3e9SNicolas Vasilache      int64_t i = it.index();
2bc4c3e9SNicolas Vasilache      bool isReduction = it.value();
2bc4c3e9SNicolas Vasilache      if (isReduction) {
2bc4c3e9SNicolas Vasilache        reductionDims.push_back(i);
2bc4c3e9SNicolas Vasilache        reductionShapes.push_back(srcShape[i]);
5c581720SAndrzej Warzynski        isReductionDimScalable |= srcScalableDims[i];
2bc4c3e9SNicolas Vasilache      } else {
2bc4c3e9SNicolas Vasilache        parallelDims.push_back(i);
2bc4c3e9SNicolas Vasilache        parallelShapes.push_back(srcShape[i]);
5c581720SAndrzej Warzynski        parallelScalableDims.push_back(srcScalableDims[i]);
2bc4c3e9SNicolas Vasilache      }
2bc4c3e9SNicolas Vasilache    }
2bc4c3e9SNicolas Vasilache
2bc4c3e9SNicolas Vasilache    // 2. Compute flattened parallel and reduction sizes.
2bc4c3e9SNicolas Vasilache    int flattenedParallelDim = 0;
2bc4c3e9SNicolas Vasilache    int flattenedReductionDim = 0;
2bc4c3e9SNicolas Vasilache    if (!parallelShapes.empty()) {
2bc4c3e9SNicolas Vasilache      flattenedParallelDim = 1;
2bc4c3e9SNicolas Vasilache      for (auto d : parallelShapes)
2bc4c3e9SNicolas Vasilache        flattenedParallelDim *= d;
2bc4c3e9SNicolas Vasilache    }
2bc4c3e9SNicolas Vasilache    if (!reductionShapes.empty()) {
2bc4c3e9SNicolas Vasilache      flattenedReductionDim = 1;
2bc4c3e9SNicolas Vasilache      for (auto d : reductionShapes)
2bc4c3e9SNicolas Vasilache        flattenedReductionDim *= d;
2bc4c3e9SNicolas Vasilache    }
2bc4c3e9SNicolas Vasilache    // We must at least have some parallel or some reduction.
2bc4c3e9SNicolas Vasilache    assert((flattenedParallelDim || flattenedReductionDim) &&
2bc4c3e9SNicolas Vasilache           "expected at least one parallel or reduction dim");
2bc4c3e9SNicolas Vasilache
2bc4c3e9SNicolas Vasilache    // 3. Fail if reduction/parallel dims are not contiguous.
2bc4c3e9SNicolas Vasilache    // Check parallelDims are exactly [0 .. size).
2bc4c3e9SNicolas Vasilache    int64_t counter = 0;
2bc4c3e9SNicolas Vasilache    if (useInnerDimsForReduction &&
2bc4c3e9SNicolas Vasilache        llvm::any_of(parallelDims, [&](int64_t i) { return i != counter++; }))
2bc4c3e9SNicolas Vasilache      return failure();
2bc4c3e9SNicolas Vasilache    // Check parallelDims are exactly {reductionDims.size()} + [0 .. size).
2bc4c3e9SNicolas Vasilache    counter = reductionDims.size();
2bc4c3e9SNicolas Vasilache    if (!useInnerDimsForReduction &&
2bc4c3e9SNicolas Vasilache        llvm::any_of(parallelDims, [&](int64_t i) { return i != counter++; }))
2bc4c3e9SNicolas Vasilache      return failure();
2bc4c3e9SNicolas Vasilache
2bc4c3e9SNicolas Vasilache    // 4. Shape cast to collapse consecutive parallel (resp. reduction dim) into
2bc4c3e9SNicolas Vasilache    // a single parallel (resp. reduction) dim.
2bc4c3e9SNicolas Vasilache    SmallVector<bool, 2> mask;
5c581720SAndrzej Warzynski    SmallVector<bool, 2> scalableDims;
2bc4c3e9SNicolas Vasilache    SmallVector<int64_t, 2> vectorShape;
5c581720SAndrzej Warzynski    bool isParallelDimScalable = llvm::is_contained(parallelScalableDims, true);
2bc4c3e9SNicolas Vasilache    if (flattenedParallelDim) {
2bc4c3e9SNicolas Vasilache      mask.push_back(false);
2bc4c3e9SNicolas Vasilache      vectorShape.push_back(flattenedParallelDim);
5c581720SAndrzej Warzynski      scalableDims.push_back(isParallelDimScalable);
2bc4c3e9SNicolas Vasilache    }
2bc4c3e9SNicolas Vasilache    if (flattenedReductionDim) {
2bc4c3e9SNicolas Vasilache      mask.push_back(true);
2bc4c3e9SNicolas Vasilache      vectorShape.push_back(flattenedReductionDim);
5c581720SAndrzej Warzynski      scalableDims.push_back(isReductionDimScalable);
2bc4c3e9SNicolas Vasilache    }
2bc4c3e9SNicolas Vasilache    if (!useInnerDimsForReduction && vectorShape.size() == 2) {
2bc4c3e9SNicolas Vasilache      std::swap(mask.front(), mask.back());
2bc4c3e9SNicolas Vasilache      std::swap(vectorShape.front(), vectorShape.back());
5c581720SAndrzej Warzynski      std::swap(scalableDims.front(), scalableDims.back());
2bc4c3e9SNicolas Vasilache    }
2bc4c3e9SNicolas Vasilache
2bc4c3e9SNicolas Vasilache    Value newVectorMask;
2bc4c3e9SNicolas Vasilache    if (maskableOp.isMasked()) {
2bc4c3e9SNicolas Vasilache      Value vectorMask = maskableOp.getMaskingOp().getMask();
2bc4c3e9SNicolas Vasilache      auto maskCastedType = VectorType::get(
2bc4c3e9SNicolas Vasilache          vectorShape,
c1fa60b4STres Popp          llvm::cast<VectorType>(vectorMask.getType()).getElementType());
2bc4c3e9SNicolas Vasilache      newVectorMask =
2bc4c3e9SNicolas Vasilache          rewriter.create<vector::ShapeCastOp>(loc, maskCastedType, vectorMask);
2bc4c3e9SNicolas Vasilache    }
2bc4c3e9SNicolas Vasilache
2bc4c3e9SNicolas Vasilache    auto castedType = VectorType::get(
5c581720SAndrzej Warzynski        vectorShape, multiReductionOp.getSourceVectorType().getElementType(),
5c581720SAndrzej Warzynski        scalableDims);
2bc4c3e9SNicolas Vasilache    Value cast = rewriter.create<vector::ShapeCastOp>(
2bc4c3e9SNicolas Vasilache        loc, castedType, multiReductionOp.getSource());
2bc4c3e9SNicolas Vasilache
2bc4c3e9SNicolas Vasilache    Value acc = multiReductionOp.getAcc();
2bc4c3e9SNicolas Vasilache    if (flattenedParallelDim) {
2bc4c3e9SNicolas Vasilache      auto accType = VectorType::get(
2bc4c3e9SNicolas Vasilache          {flattenedParallelDim},
5c581720SAndrzej Warzynski          multiReductionOp.getSourceVectorType().getElementType(),
5c581720SAndrzej Warzynski          /*scalableDims=*/{isParallelDimScalable});
2bc4c3e9SNicolas Vasilache      acc = rewriter.create<vector::ShapeCastOp>(loc, accType, acc);
2bc4c3e9SNicolas Vasilache    }
2bc4c3e9SNicolas Vasilache    // 6. Creates the flattened form of vector.multi_reduction with inner/outer
2bc4c3e9SNicolas Vasilache    // most dim as reduction.
2bc4c3e9SNicolas Vasilache    Operation *newMultiDimRedOp = rewriter.create<vector::MultiDimReductionOp>(
2bc4c3e9SNicolas Vasilache        loc, cast, acc, mask, multiReductionOp.getKind());
2bc4c3e9SNicolas Vasilache    newMultiDimRedOp =
2bc4c3e9SNicolas Vasilache        mlir::vector::maskOperation(rewriter, newMultiDimRedOp, newVectorMask);
2bc4c3e9SNicolas Vasilache
2bc4c3e9SNicolas Vasilache    // 7. If there are no parallel shapes, the result is a scalar.
2bc4c3e9SNicolas Vasilache    // TODO: support 0-d vectors when available.
2bc4c3e9SNicolas Vasilache    if (parallelShapes.empty()) {
2bc4c3e9SNicolas Vasilache      rewriter.replaceOp(rootOp, newMultiDimRedOp->getResult(0));
2bc4c3e9SNicolas Vasilache      return success();
2bc4c3e9SNicolas Vasilache    }
2bc4c3e9SNicolas Vasilache
2bc4c3e9SNicolas Vasilache    // 8. Creates shape cast for the output n-D -> 2-D.
2bc4c3e9SNicolas Vasilache    VectorType outputCastedType = VectorType::get(
5c581720SAndrzej Warzynski        parallelShapes, multiReductionOp.getSourceVectorType().getElementType(),
5c581720SAndrzej Warzynski        parallelScalableDims);
2bc4c3e9SNicolas Vasilache    rewriter.replaceOpWithNewOp<vector::ShapeCastOp>(
2bc4c3e9SNicolas Vasilache        rootOp, outputCastedType, newMultiDimRedOp->getResult(0));
2bc4c3e9SNicolas Vasilache    return success();
2bc4c3e9SNicolas Vasilache  }
2bc4c3e9SNicolas Vasilache
2bc4c3e9SNicolas Vasilacheprivate:
2bc4c3e9SNicolas Vasilache  const bool useInnerDimsForReduction;
2bc4c3e9SNicolas Vasilache};
2bc4c3e9SNicolas Vasilache
2bc4c3e9SNicolas Vasilache/// Unrolls vector.multi_reduction with outermost reductions
2bc4c3e9SNicolas Vasilache/// and combines results
2bc4c3e9SNicolas Vasilachestruct TwoDimMultiReductionToElementWise
2bc4c3e9SNicolas Vasilache    : public OpRewritePattern<vector::MultiDimReductionOp> {
2bc4c3e9SNicolas Vasilache  using OpRewritePattern::OpRewritePattern;
2bc4c3e9SNicolas Vasilache
2bc4c3e9SNicolas Vasilache  LogicalResult matchAndRewrite(vector::MultiDimReductionOp multiReductionOp,
2bc4c3e9SNicolas Vasilache                                PatternRewriter &rewriter) const override {
2bc4c3e9SNicolas Vasilache    auto maskableOp =
2bc4c3e9SNicolas Vasilache        cast<vector::MaskableOpInterface>(multiReductionOp.getOperation());
2bc4c3e9SNicolas Vasilache    if (maskableOp.isMasked())
2bc4c3e9SNicolas Vasilache      // TODO: Support masking.
2bc4c3e9SNicolas Vasilache      return failure();
2bc4c3e9SNicolas Vasilache
2bc4c3e9SNicolas Vasilache    auto srcRank = multiReductionOp.getSourceVectorType().getRank();
2bc4c3e9SNicolas Vasilache    // Rank-2 ["parallel", "reduce"] or bail.
2bc4c3e9SNicolas Vasilache    if (srcRank != 2)
2bc4c3e9SNicolas Vasilache      return failure();
2bc4c3e9SNicolas Vasilache
2bc4c3e9SNicolas Vasilache    if (multiReductionOp.isReducedDim(1) || !multiReductionOp.isReducedDim(0))
2bc4c3e9SNicolas Vasilache      return failure();
2bc4c3e9SNicolas Vasilache
2bc4c3e9SNicolas Vasilache    auto loc = multiReductionOp.getLoc();
2bc4c3e9SNicolas Vasilache    ArrayRef<int64_t> srcShape =
2bc4c3e9SNicolas Vasilache        multiReductionOp.getSourceVectorType().getShape();
2bc4c3e9SNicolas Vasilache
2bc4c3e9SNicolas Vasilache    Type elementType = getElementTypeOrSelf(multiReductionOp.getDestType());
2bc4c3e9SNicolas Vasilache    if (!elementType.isIntOrIndexOrFloat())
2bc4c3e9SNicolas Vasilache      return failure();
2bc4c3e9SNicolas Vasilache
2bc4c3e9SNicolas Vasilache    Value result = multiReductionOp.getAcc();
2bc4c3e9SNicolas Vasilache    for (int64_t i = 0; i < srcShape[0]; i++) {
2bc4c3e9SNicolas Vasilache      auto operand = rewriter.create<vector::ExtractOp>(
2bc4c3e9SNicolas Vasilache          loc, multiReductionOp.getSource(), i);
2bc4c3e9SNicolas Vasilache      result = makeArithReduction(rewriter, loc, multiReductionOp.getKind(),
2bc4c3e9SNicolas Vasilache                                  operand, result);
2bc4c3e9SNicolas Vasilache    }
2bc4c3e9SNicolas Vasilache
2bc4c3e9SNicolas Vasilache    rewriter.replaceOp(multiReductionOp, result);
2bc4c3e9SNicolas Vasilache    return success();
2bc4c3e9SNicolas Vasilache  }
2bc4c3e9SNicolas Vasilache};
2bc4c3e9SNicolas Vasilache
2bc4c3e9SNicolas Vasilache/// Converts 2d vector.multi_reduction with inner most reduction dimension into
2bc4c3e9SNicolas Vasilache/// a sequence of vector.reduction ops.
2bc4c3e9SNicolas Vasilachestruct TwoDimMultiReductionToReduction
2bc4c3e9SNicolas Vasilache    : public OpRewritePattern<vector::MultiDimReductionOp> {
2bc4c3e9SNicolas Vasilache  using OpRewritePattern::OpRewritePattern;
2bc4c3e9SNicolas Vasilache
2bc4c3e9SNicolas Vasilache  LogicalResult matchAndRewrite(vector::MultiDimReductionOp multiReductionOp,
2bc4c3e9SNicolas Vasilache                                PatternRewriter &rewriter) const override {
2bc4c3e9SNicolas Vasilache    auto srcRank = multiReductionOp.getSourceVectorType().getRank();
2bc4c3e9SNicolas Vasilache    if (srcRank != 2)
2bc4c3e9SNicolas Vasilache      return failure();
2bc4c3e9SNicolas Vasilache
2bc4c3e9SNicolas Vasilache    if (multiReductionOp.isReducedDim(0) || !multiReductionOp.isReducedDim(1))
2bc4c3e9SNicolas Vasilache      return failure();
2bc4c3e9SNicolas Vasilache
2bc4c3e9SNicolas Vasilache    // Vector mask setup.
2bc4c3e9SNicolas Vasilache    OpBuilder::InsertionGuard guard(rewriter);
2bc4c3e9SNicolas Vasilache    auto maskableOp =
2bc4c3e9SNicolas Vasilache        cast<vector::MaskableOpInterface>(multiReductionOp.getOperation());
2bc4c3e9SNicolas Vasilache    Operation *rootOp;
2bc4c3e9SNicolas Vasilache    if (maskableOp.isMasked()) {
2bc4c3e9SNicolas Vasilache      rewriter.setInsertionPoint(maskableOp.getMaskingOp());
2bc4c3e9SNicolas Vasilache      rootOp = maskableOp.getMaskingOp();
2bc4c3e9SNicolas Vasilache    } else {
2bc4c3e9SNicolas Vasilache      rootOp = multiReductionOp;
2bc4c3e9SNicolas Vasilache    }
2bc4c3e9SNicolas Vasilache
2bc4c3e9SNicolas Vasilache    auto loc = multiReductionOp.getLoc();
2bc4c3e9SNicolas Vasilache    Value result = rewriter.create<arith::ConstantOp>(
2bc4c3e9SNicolas Vasilache        loc, multiReductionOp.getDestType(),
2bc4c3e9SNicolas Vasilache        rewriter.getZeroAttr(multiReductionOp.getDestType()));
2bc4c3e9SNicolas Vasilache    int outerDim = multiReductionOp.getSourceVectorType().getShape()[0];
2bc4c3e9SNicolas Vasilache
2bc4c3e9SNicolas Vasilache    for (int i = 0; i < outerDim; ++i) {
2bc4c3e9SNicolas Vasilache      auto v = rewriter.create<vector::ExtractOp>(
2bc4c3e9SNicolas Vasilache          loc, multiReductionOp.getSource(), ArrayRef<int64_t>{i});
2bc4c3e9SNicolas Vasilache      auto acc = rewriter.create<vector::ExtractOp>(
2bc4c3e9SNicolas Vasilache          loc, multiReductionOp.getAcc(), ArrayRef<int64_t>{i});
2bc4c3e9SNicolas Vasilache      Operation *reductionOp = rewriter.create<vector::ReductionOp>(
2bc4c3e9SNicolas Vasilache          loc, multiReductionOp.getKind(), v, acc);
2bc4c3e9SNicolas Vasilache
2bc4c3e9SNicolas Vasilache      // If masked, slice the mask and mask the new reduction operation.
2bc4c3e9SNicolas Vasilache      if (maskableOp.isMasked()) {
2bc4c3e9SNicolas Vasilache        Value mask = rewriter.create<vector::ExtractOp>(
2bc4c3e9SNicolas Vasilache            loc, maskableOp.getMaskingOp().getMask(), ArrayRef<int64_t>{i});
2bc4c3e9SNicolas Vasilache        reductionOp = mlir::vector::maskOperation(rewriter, reductionOp, mask);
2bc4c3e9SNicolas Vasilache      }
2bc4c3e9SNicolas Vasilache
8e663039SKunwar Grover      result = rewriter.create<vector::InsertOp>(loc, reductionOp->getResult(0),
8e663039SKunwar Grover                                                 result, i);
2bc4c3e9SNicolas Vasilache    }
2bc4c3e9SNicolas Vasilache
2bc4c3e9SNicolas Vasilache    rewriter.replaceOp(rootOp, result);
2bc4c3e9SNicolas Vasilache    return success();
2bc4c3e9SNicolas Vasilache  }
2bc4c3e9SNicolas Vasilache};
2bc4c3e9SNicolas Vasilache
2bc4c3e9SNicolas Vasilache/// Converts 1d vector.multi_reduction with a single reduction dimension to a 2d
2bc4c3e9SNicolas Vasilache/// form with both a single parallel and reduction dimension.
2bc4c3e9SNicolas Vasilache/// This is achieved with a simple vector.shape_cast that inserts a leading 1.
2bc4c3e9SNicolas Vasilache/// The case with a single parallel dimension is a noop and folds away
2bc4c3e9SNicolas Vasilache/// separately.
2bc4c3e9SNicolas Vasilachestruct OneDimMultiReductionToTwoDim
2bc4c3e9SNicolas Vasilache    : public OpRewritePattern<vector::MultiDimReductionOp> {
2bc4c3e9SNicolas Vasilache  using OpRewritePattern::OpRewritePattern;
2bc4c3e9SNicolas Vasilache
2bc4c3e9SNicolas Vasilache  LogicalResult matchAndRewrite(vector::MultiDimReductionOp multiReductionOp,
2bc4c3e9SNicolas Vasilache                                PatternRewriter &rewriter) const override {
2bc4c3e9SNicolas Vasilache    auto srcRank = multiReductionOp.getSourceVectorType().getRank();
2bc4c3e9SNicolas Vasilache    // Rank-1 or bail.
2bc4c3e9SNicolas Vasilache    if (srcRank != 1)
2bc4c3e9SNicolas Vasilache      return failure();
2bc4c3e9SNicolas Vasilache
2bc4c3e9SNicolas Vasilache    // Vector mask setup.
2bc4c3e9SNicolas Vasilache    OpBuilder::InsertionGuard guard(rewriter);
2bc4c3e9SNicolas Vasilache    auto maskableOp =
2bc4c3e9SNicolas Vasilache        cast<vector::MaskableOpInterface>(multiReductionOp.getOperation());
2bc4c3e9SNicolas Vasilache    Operation *rootOp;
2bc4c3e9SNicolas Vasilache    Value mask;
2bc4c3e9SNicolas Vasilache    if (maskableOp.isMasked()) {
2bc4c3e9SNicolas Vasilache      rewriter.setInsertionPoint(maskableOp.getMaskingOp());
2bc4c3e9SNicolas Vasilache      rootOp = maskableOp.getMaskingOp();
2bc4c3e9SNicolas Vasilache      mask = maskableOp.getMaskingOp().getMask();
2bc4c3e9SNicolas Vasilache    } else {
2bc4c3e9SNicolas Vasilache      rootOp = multiReductionOp;
2bc4c3e9SNicolas Vasilache    }
2bc4c3e9SNicolas Vasilache
2bc4c3e9SNicolas Vasilache    auto loc = multiReductionOp.getLoc();
2bc4c3e9SNicolas Vasilache    auto srcVectorType = multiReductionOp.getSourceVectorType();
2bc4c3e9SNicolas Vasilache    auto srcShape = srcVectorType.getShape();
dbcc4549SZhaoshi Zheng    auto castedType = VectorType::get(
dbcc4549SZhaoshi Zheng        ArrayRef<int64_t>{1, srcShape.back()}, srcVectorType.getElementType(),
dbcc4549SZhaoshi Zheng        ArrayRef<bool>{false, srcVectorType.getScalableDims().back()});
dbcc4549SZhaoshi Zheng
2bc4c3e9SNicolas Vasilache    auto accType =
2bc4c3e9SNicolas Vasilache        VectorType::get(ArrayRef<int64_t>{1}, srcVectorType.getElementType());
c1fa60b4STres Popp    assert(!llvm::isa<VectorType>(multiReductionOp.getDestType()) &&
2bc4c3e9SNicolas Vasilache           "multi_reduction with a single dimension expects a scalar result");
2bc4c3e9SNicolas Vasilache
2bc4c3e9SNicolas Vasilache    // If the unique dim is reduced and we insert a parallel in front, we need a
2bc4c3e9SNicolas Vasilache    // {false, true} mask.
2bc4c3e9SNicolas Vasilache    SmallVector<bool, 2> reductionMask{false, true};
2bc4c3e9SNicolas Vasilache
2bc4c3e9SNicolas Vasilache    /// vector.extract(vector.multi_reduce(vector.shape_cast(v, 1xk)), 0)
2bc4c3e9SNicolas Vasilache    Value cast = rewriter.create<vector::ShapeCastOp>(
2bc4c3e9SNicolas Vasilache        loc, castedType, multiReductionOp.getSource());
2bc4c3e9SNicolas Vasilache    Value castAcc = rewriter.create<vector::BroadcastOp>(
2bc4c3e9SNicolas Vasilache        loc, accType, multiReductionOp.getAcc());
2bc4c3e9SNicolas Vasilache    Value castMask;
2bc4c3e9SNicolas Vasilache    if (maskableOp.isMasked()) {
dbcc4549SZhaoshi Zheng      auto maskType = llvm::cast<VectorType>(mask.getType());
dbcc4549SZhaoshi Zheng      auto castMaskType = VectorType::get(
dbcc4549SZhaoshi Zheng          ArrayRef<int64_t>{1, maskType.getShape().back()},
dbcc4549SZhaoshi Zheng          maskType.getElementType(),
dbcc4549SZhaoshi Zheng          ArrayRef<bool>{false, maskType.getScalableDims().back()});
2bc4c3e9SNicolas Vasilache      castMask = rewriter.create<vector::BroadcastOp>(loc, castMaskType, mask);
2bc4c3e9SNicolas Vasilache    }
2bc4c3e9SNicolas Vasilache
2bc4c3e9SNicolas Vasilache    Operation *newOp = rewriter.create<vector::MultiDimReductionOp>(
2bc4c3e9SNicolas Vasilache        loc, cast, castAcc, reductionMask, multiReductionOp.getKind());
2bc4c3e9SNicolas Vasilache    newOp = vector::maskOperation(rewriter, newOp, castMask);
2bc4c3e9SNicolas Vasilache
2bc4c3e9SNicolas Vasilache    rewriter.replaceOpWithNewOp<vector::ExtractOp>(rootOp, newOp->getResult(0),
2bc4c3e9SNicolas Vasilache                                                   ArrayRef<int64_t>{0});
2bc4c3e9SNicolas Vasilache    return success();
2bc4c3e9SNicolas Vasilache  }
2bc4c3e9SNicolas Vasilache};
8d6469b0Sxiaoleis-nv
8d6469b0Sxiaoleis-nvstruct LowerVectorMultiReductionPass
8d6469b0Sxiaoleis-nv    : public vector::impl::LowerVectorMultiReductionBase<
8d6469b0Sxiaoleis-nv          LowerVectorMultiReductionPass> {
8d6469b0Sxiaoleis-nv  LowerVectorMultiReductionPass(vector::VectorMultiReductionLowering option) {
8d6469b0Sxiaoleis-nv    this->loweringStrategy = option;
8d6469b0Sxiaoleis-nv  }
8d6469b0Sxiaoleis-nv
8d6469b0Sxiaoleis-nv  void runOnOperation() override {
8d6469b0Sxiaoleis-nv    Operation *op = getOperation();
8d6469b0Sxiaoleis-nv    MLIRContext *context = op->getContext();
8d6469b0Sxiaoleis-nv
8d6469b0Sxiaoleis-nv    RewritePatternSet loweringPatterns(context);
8d6469b0Sxiaoleis-nv    populateVectorMultiReductionLoweringPatterns(loweringPatterns,
8d6469b0Sxiaoleis-nv                                                 this->loweringStrategy);
8d6469b0Sxiaoleis-nv
*09dfc571SJacques Pienaar    if (failed(applyPatternsGreedily(op, std::move(loweringPatterns))))
8d6469b0Sxiaoleis-nv      signalPassFailure();
8d6469b0Sxiaoleis-nv  }
8d6469b0Sxiaoleis-nv
8d6469b0Sxiaoleis-nv  void getDependentDialects(DialectRegistry &registry) const override {
8d6469b0Sxiaoleis-nv    registry.insert<vector::VectorDialect>();
8d6469b0Sxiaoleis-nv  }
8d6469b0Sxiaoleis-nv};
8d6469b0Sxiaoleis-nv
2bc4c3e9SNicolas Vasilache} // namespace
2bc4c3e9SNicolas Vasilache
2bc4c3e9SNicolas Vasilachevoid mlir::vector::populateVectorMultiReductionLoweringPatterns(
2bc4c3e9SNicolas Vasilache    RewritePatternSet &patterns, VectorMultiReductionLowering options,
2bc4c3e9SNicolas Vasilache    PatternBenefit benefit) {
2bc4c3e9SNicolas Vasilache  patterns.add<InnerOuterDimReductionConversion, ReduceMultiDimReductionRank>(
2bc4c3e9SNicolas Vasilache      patterns.getContext(), options, benefit);
2bc4c3e9SNicolas Vasilache  patterns.add<OneDimMultiReductionToTwoDim>(patterns.getContext(), benefit);
2bc4c3e9SNicolas Vasilache  if (options == VectorMultiReductionLowering ::InnerReduction)
2bc4c3e9SNicolas Vasilache    patterns.add<TwoDimMultiReductionToReduction>(patterns.getContext(),
2bc4c3e9SNicolas Vasilache                                                  benefit);
2bc4c3e9SNicolas Vasilache  else
2bc4c3e9SNicolas Vasilache    patterns.add<TwoDimMultiReductionToElementWise>(patterns.getContext(),
2bc4c3e9SNicolas Vasilache                                                    benefit);
2bc4c3e9SNicolas Vasilache}
8d6469b0Sxiaoleis-nv
8d6469b0Sxiaoleis-nvstd::unique_ptr<Pass> vector::createLowerVectorMultiReductionPass(
8d6469b0Sxiaoleis-nv    vector::VectorMultiReductionLowering option) {
8d6469b0Sxiaoleis-nv  return std::make_unique<LowerVectorMultiReductionPass>(option);
8d6469b0Sxiaoleis-nv}