Linalg/Transforms/ConstantFold.cpp

2291705dSMahesh Ravishankar//===- ConstantFold.cpp - Implementation of constant folding on Linalg ops ===//
2291705dSMahesh Ravishankar//
2291705dSMahesh Ravishankar// Part of the LLVM Project, under the Apache License v2.0 with LLVM Exceptions.
2291705dSMahesh Ravishankar// See https://llvm.org/LICENSE.txt for license information.
2291705dSMahesh Ravishankar// SPDX-License-Identifier: Apache-2.0 WITH LLVM-exception
2291705dSMahesh Ravishankar//
2291705dSMahesh Ravishankar//===----------------------------------------------------------------------===//
2291705dSMahesh Ravishankar//
2291705dSMahesh Ravishankar// This file implements constant folding on Linalg operations.
2291705dSMahesh Ravishankar//
2291705dSMahesh Ravishankar//===----------------------------------------------------------------------===//
2291705dSMahesh Ravishankar
2291705dSMahesh Ravishankar#include "mlir/Dialect/Affine/IR/AffineOps.h"
2291705dSMahesh Ravishankar#include "mlir/Dialect/Linalg/IR/Linalg.h"
2291705dSMahesh Ravishankar#include "mlir/Dialect/Linalg/Transforms/Transforms.h"
2291705dSMahesh Ravishankar#include "mlir/IR/Matchers.h"
2291705dSMahesh Ravishankar#include "mlir/IR/PatternMatch.h"
2291705dSMahesh Ravishankar#include "mlir/Support/LLVM.h"
2291705dSMahesh Ravishankar#include "mlir/Transforms/GreedyPatternRewriteDriver.h"
a1fe1f5fSKazu Hirata#include <optional>
2291705dSMahesh Ravishankar
2291705dSMahesh Ravishankarusing namespace mlir;
2291705dSMahesh Ravishankarusing namespace mlir::linalg;
2291705dSMahesh Ravishankar
2291705dSMahesh Ravishankarnamespace {
*74ed79f7SRyan Holt/// Base class for constant folding linalg structured ops with N inputs, 1
*74ed79f7SRyan Holt/// output, and permutation indexing maps.
2291705dSMahesh Ravishankar///
2291705dSMahesh Ravishankar/// `ConcreteType` should provide methods with signatures
2291705dSMahesh Ravishankar///
2291705dSMahesh Ravishankar/// ```c++
*74ed79f7SRyan Holt///   bool matchIndexingMaps(LinalgOp linalgOp) const;
*74ed79f7SRyan Holt///   RegionComputationFn getRegionComputeFn(LinalgOp) const;
2291705dSMahesh Ravishankar/// ```
2291705dSMahesh Ravishankar///
2291705dSMahesh Ravishankar/// The latter inspects the region and returns the computation inside as a
2291705dSMahesh Ravishankar/// functor. The functor will be invoked with constant elements for all inputs
2291705dSMahesh Ravishankar/// and should return the corresponding computed constant element for output.
2291705dSMahesh Ravishankartemplate <typename ConcreteType>
*74ed79f7SRyan Holtclass FoldConstantBase : public OpInterfaceRewritePattern<LinalgOp> {
2291705dSMahesh Ravishankarpublic:
2291705dSMahesh Ravishankar  struct APIntOrFloat {
0a81ace0SKazu Hirata    std::optional<APInt> apInt;
0a81ace0SKazu Hirata    std::optional<APFloat> apFloat;
2291705dSMahesh Ravishankar  };
2291705dSMahesh Ravishankar  struct APIntOrFloatArray {
2291705dSMahesh Ravishankar    SmallVector<APInt> apInts;
2291705dSMahesh Ravishankar    SmallVector<APFloat> apFloats;
2291705dSMahesh Ravishankar  };
2291705dSMahesh Ravishankar  using RegionComputationFn =
2291705dSMahesh Ravishankar      std::function<APIntOrFloat(const APIntOrFloatArray &)>;
2291705dSMahesh Ravishankar
2291705dSMahesh Ravishankar  FoldConstantBase(MLIRContext *context, const ControlFusionFn &controlFn,
2291705dSMahesh Ravishankar                   PatternBenefit benefit = 1)
*74ed79f7SRyan Holt      : OpInterfaceRewritePattern<LinalgOp>(context, benefit),
*74ed79f7SRyan Holt        controlFn(controlFn) {}
2291705dSMahesh Ravishankar
*74ed79f7SRyan Holt  LogicalResult matchAndRewrite(LinalgOp linalgOp,
2291705dSMahesh Ravishankar                                PatternRewriter &rewriter) const override {
e3f75c1cSIvan Butygin    // Mixed and buffer sematics aren't supported.
*74ed79f7SRyan Holt    if (!linalgOp.hasPureTensorSemantics())
2291705dSMahesh Ravishankar      return failure();
2291705dSMahesh Ravishankar
2291705dSMahesh Ravishankar    // Only support ops generating one output for now.
*74ed79f7SRyan Holt    if (linalgOp.getNumDpsInits() != 1)
2291705dSMahesh Ravishankar      return failure();
2291705dSMahesh Ravishankar
*74ed79f7SRyan Holt    auto outputType = dyn_cast<ShapedType>(linalgOp->getResultTypes().front());
2291705dSMahesh Ravishankar    // Require the output types to be static given that we are generating
2291705dSMahesh Ravishankar    // constants.
2291705dSMahesh Ravishankar    if (!outputType || !outputType.hasStaticShape())
2291705dSMahesh Ravishankar      return failure();
2291705dSMahesh Ravishankar
*74ed79f7SRyan Holt    if (!llvm::all_of(linalgOp.getDpsInputs(), [](Value input) {
5550c821STres Popp          return isa<ShapedType>(input.getType());
2291705dSMahesh Ravishankar        }))
2291705dSMahesh Ravishankar      return failure();
2291705dSMahesh Ravishankar
2291705dSMahesh Ravishankar    // Make sure all element types are the same.
a7cccb9cSAlexander Belyaev    auto getOperandElementType = [](Value value) {
5550c821STres Popp      return cast<ShapedType>(value.getType()).getElementType();
2291705dSMahesh Ravishankar    };
a7cccb9cSAlexander Belyaev    if (!llvm::all_equal(
*74ed79f7SRyan Holt            llvm::map_range(linalgOp->getOperands(), getOperandElementType)))
2291705dSMahesh Ravishankar      return failure();
2291705dSMahesh Ravishankar
2291705dSMahesh Ravishankar    // We can only handle the case where we have int/float elements.
2291705dSMahesh Ravishankar    auto elementType = outputType.getElementType();
2291705dSMahesh Ravishankar    if (!elementType.isIntOrFloat())
2291705dSMahesh Ravishankar      return failure();
2291705dSMahesh Ravishankar
2291705dSMahesh Ravishankar    // Require all indexing maps to be permutations for now. This is common and
2291705dSMahesh Ravishankar    // it simplifies input/output access greatly: we can do the data shuffling
2291705dSMahesh Ravishankar    // entirely in the compiler, without needing to turn all indices into
2291705dSMahesh Ravishankar    // Values, and then do affine apply on them, and then match back the
2291705dSMahesh Ravishankar    // constant again.
*74ed79f7SRyan Holt    if (!llvm::all_of(linalgOp.getIndexingMapsArray(),
2291705dSMahesh Ravishankar                      [](AffineMap map) { return map.isPermutation(); }))
2291705dSMahesh Ravishankar      return failure();
2291705dSMahesh Ravishankar
*74ed79f7SRyan Holt    for (OpOperand &operand : linalgOp.getDpsInitsMutable()) {
*74ed79f7SRyan Holt      if (linalgOp.payloadUsesValueFromOperand(&operand))
2291705dSMahesh Ravishankar        return failure();
2291705dSMahesh Ravishankar    }
2291705dSMahesh Ravishankar
2291705dSMahesh Ravishankar    // Further check the indexing maps are okay for the ConcreteType.
*74ed79f7SRyan Holt    if (!static_cast<const ConcreteType *>(this)->matchIndexingMaps(linalgOp))
2291705dSMahesh Ravishankar      return failure();
2291705dSMahesh Ravishankar
2291705dSMahesh Ravishankar    // Defer to the concrete type to check the region and discover the
2291705dSMahesh Ravishankar    // computation inside.
2291705dSMahesh Ravishankar    RegionComputationFn computeFn =
*74ed79f7SRyan Holt        static_cast<const ConcreteType *>(this)->getRegionComputeFn(linalgOp);
2291705dSMahesh Ravishankar    if (!computeFn)
2291705dSMahesh Ravishankar      return failure();
2291705dSMahesh Ravishankar
2291705dSMahesh Ravishankar    // All inputs should be constants.
*74ed79f7SRyan Holt    int numInputs = linalgOp.getNumDpsInputs();
2291705dSMahesh Ravishankar    SmallVector<DenseIntOrFPElementsAttr> inputValues(numInputs);
*74ed79f7SRyan Holt    for (const auto &en : llvm::enumerate(linalgOp.getDpsInputOperands())) {
a7cccb9cSAlexander Belyaev      if (!matchPattern(en.value()->get(),
a7cccb9cSAlexander Belyaev                        m_Constant(&inputValues[en.index()])))
2291705dSMahesh Ravishankar        return failure();
2291705dSMahesh Ravishankar    }
2291705dSMahesh Ravishankar
2291705dSMahesh Ravishankar    // Identified this as a potential candidate for folding. Now check the
2291705dSMahesh Ravishankar    // policy to see whether we are allowed to proceed.
*74ed79f7SRyan Holt    for (OpOperand *operand : linalgOp.getDpsInputOperands()) {
a7bfdc23SMahesh Ravishankar      if (!controlFn(operand))
2291705dSMahesh Ravishankar        return failure();
2291705dSMahesh Ravishankar    }
2291705dSMahesh Ravishankar
2291705dSMahesh Ravishankar    SmallVector<int64_t, 4> loopBounds = linalgOp.computeStaticLoopSizes();
2291705dSMahesh Ravishankar    int64_t numElements = outputType.getNumElements();
2291705dSMahesh Ravishankar
2291705dSMahesh Ravishankar    // Use APInt/APFloat instead of Attribute here for constructing the output.
2291705dSMahesh Ravishankar    // This helps to avoid blowing up compiler memory usage: Attributes would
2291705dSMahesh Ravishankar    // unify the following cases but they have lifetime as the MLIRContext.
2291705dSMahesh Ravishankar    SmallVector<APInt> intOutputValues;
2291705dSMahesh Ravishankar    SmallVector<APFloat> fpOutputValues;
5550c821STres Popp    if (isa<FloatType>(elementType))
2291705dSMahesh Ravishankar      fpOutputValues.resize(numElements, APFloat(0.f));
2291705dSMahesh Ravishankar    else
2291705dSMahesh Ravishankar      intOutputValues.resize(numElements);
2291705dSMahesh Ravishankar
2291705dSMahesh Ravishankar    // Return the constant dim positions from the given permutation map.
2291705dSMahesh Ravishankar    auto getDimPositions = [](AffineMap map) {
2291705dSMahesh Ravishankar      SmallVector<unsigned> dims;
2291705dSMahesh Ravishankar      dims.reserve(map.getNumResults());
2291705dSMahesh Ravishankar      for (AffineExpr result : map.getResults()) {
1609f1c2Slong.chen        dims.push_back(cast<AffineDimExpr>(result).getPosition());
2291705dSMahesh Ravishankar      }
2291705dSMahesh Ravishankar      return dims;
2291705dSMahesh Ravishankar    };
2291705dSMahesh Ravishankar
2291705dSMahesh Ravishankar    SmallVector<SmallVector<unsigned>> inputDims;
2291705dSMahesh Ravishankar    for (int i = 0; i < numInputs; ++i)
*74ed79f7SRyan Holt      inputDims.push_back(getDimPositions(linalgOp.getIndexingMapsArray()[i]));
*74ed79f7SRyan Holt    auto outputDims = getDimPositions(linalgOp.getIndexingMapsArray().back());
2291705dSMahesh Ravishankar    auto outputShape = outputType.getShape();
2291705dSMahesh Ravishankar
2291705dSMahesh Ravishankar    // Allocate small vectors for index delinearization. Initial values do not
2291705dSMahesh Ravishankar    // matter here as they will be overwritten later.
2291705dSMahesh Ravishankar    SmallVector<uint64_t> indices(loopBounds.size(), 0);
2291705dSMahesh Ravishankar    SmallVector<uint64_t> dstIndices(loopBounds.size(), 0);
2291705dSMahesh Ravishankar    SmallVector<SmallVector<uint64_t>> srcIndices(
2291705dSMahesh Ravishankar        numInputs, SmallVector<uint64_t>(loopBounds.size(), 0));
2291705dSMahesh Ravishankar    SmallVector<uint64_t> srcLinearIndices(numInputs, 0);
2291705dSMahesh Ravishankar    uint64_t dstLinearIndex = 0;
2291705dSMahesh Ravishankar
2291705dSMahesh Ravishankar    // Allocate spaces for compute function inputs. Initial values do not matter
2291705dSMahesh Ravishankar    // here as they will be overwritten later.
2291705dSMahesh Ravishankar    APIntOrFloatArray computeFnInputs;
2291705dSMahesh Ravishankar
2291705dSMahesh Ravishankar    auto inputShapes = llvm::to_vector<4>(
*74ed79f7SRyan Holt        llvm::map_range(linalgOp.getDpsInputs(), [](Value value) {
5550c821STres Popp          return cast<ShapedType>(value.getType()).getShape();
2291705dSMahesh Ravishankar        }));
2291705dSMahesh Ravishankar
2291705dSMahesh Ravishankar    // Given a `linearIndex`, remap it to a linear index to access linalg op
2291705dSMahesh Ravishankar    // inputs/ouputs. This mutates `indices`, `srcIndices`, `dstIndices`,
2291705dSMahesh Ravishankar    // `srcLinearIndices`, `dstLinearIndex` in place.
2291705dSMahesh Ravishankar    auto computeRemappedLinearIndex = [&](int linearIndex) {
2291705dSMahesh Ravishankar      int totalCount = linearIndex;
2291705dSMahesh Ravishankar      for (int dim = loopBounds.size() - 1; dim >= 0; --dim) {
2291705dSMahesh Ravishankar        indices[dim] = totalCount % loopBounds[dim];
2291705dSMahesh Ravishankar        totalCount /= loopBounds[dim];
2291705dSMahesh Ravishankar      }
2291705dSMahesh Ravishankar
2291705dSMahesh Ravishankar      for (int dim = loopBounds.size() - 1; dim >= 0; --dim) {
2291705dSMahesh Ravishankar        for (int i = 0; i < numInputs; ++i)
2291705dSMahesh Ravishankar          srcIndices[i][dim] = indices[inputDims[i][dim]];
2291705dSMahesh Ravishankar        dstIndices[dim] = indices[outputDims[dim]];
2291705dSMahesh Ravishankar      }
2291705dSMahesh Ravishankar
2291705dSMahesh Ravishankar      dstLinearIndex = dstIndices.front();
2291705dSMahesh Ravishankar      for (int i = 0; i < numInputs; ++i)
2291705dSMahesh Ravishankar        srcLinearIndices[i] = srcIndices[i].front();
2291705dSMahesh Ravishankar
2291705dSMahesh Ravishankar      for (int dim = 1; dim < outputType.getRank(); ++dim) {
2291705dSMahesh Ravishankar        dstLinearIndex = dstLinearIndex * outputShape[dim] + dstIndices[dim];
2291705dSMahesh Ravishankar        for (int i = 0; i < numInputs; ++i)
2291705dSMahesh Ravishankar          srcLinearIndices[i] =
2291705dSMahesh Ravishankar              srcLinearIndices[i] * inputShapes[i][dim] + srcIndices[i][dim];
2291705dSMahesh Ravishankar      }
2291705dSMahesh Ravishankar    };
2291705dSMahesh Ravishankar
5550c821STres Popp    bool isFloat = isa<FloatType>(elementType);
2291705dSMahesh Ravishankar    if (isFloat) {
2291705dSMahesh Ravishankar      SmallVector<DenseElementsAttr::iterator_range<APFloat>> inFpRanges;
2291705dSMahesh Ravishankar      for (int i = 0; i < numInputs; ++i)
2291705dSMahesh Ravishankar        inFpRanges.push_back(inputValues[i].getValues<APFloat>());
2291705dSMahesh Ravishankar
2291705dSMahesh Ravishankar      computeFnInputs.apFloats.resize(numInputs, APFloat(0.f));
2291705dSMahesh Ravishankar
2291705dSMahesh Ravishankar      // Transpose the input constant. Because we don't know its rank in
2291705dSMahesh Ravishankar      // advance, we need to loop over the range [0, element count) and
2291705dSMahesh Ravishankar      // delinearize the index.
2291705dSMahesh Ravishankar      for (int linearIndex = 0; linearIndex < numElements; ++linearIndex) {
2291705dSMahesh Ravishankar        computeRemappedLinearIndex(linearIndex);
2291705dSMahesh Ravishankar
2291705dSMahesh Ravishankar        // Collect constant elements for all inputs at this loop iteration.
2291705dSMahesh Ravishankar        for (int i = 0; i < numInputs; ++i)
2291705dSMahesh Ravishankar          computeFnInputs.apFloats[i] = inFpRanges[i][srcLinearIndices[i]];
2291705dSMahesh Ravishankar
2291705dSMahesh Ravishankar        // Invoke the computation to get the corresponding constant output
2291705dSMahesh Ravishankar        // element.
2291705dSMahesh Ravishankar        fpOutputValues[dstLinearIndex] = *computeFn(computeFnInputs).apFloat;
2291705dSMahesh Ravishankar      }
2291705dSMahesh Ravishankar    } else {
2291705dSMahesh Ravishankar      SmallVector<DenseElementsAttr::iterator_range<APInt>> inIntRanges;
2291705dSMahesh Ravishankar      for (int i = 0; i < numInputs; ++i)
2291705dSMahesh Ravishankar        inIntRanges.push_back(inputValues[i].getValues<APInt>());
2291705dSMahesh Ravishankar
2291705dSMahesh Ravishankar      computeFnInputs.apInts.resize(numInputs);
2291705dSMahesh Ravishankar
2291705dSMahesh Ravishankar      // Transpose the input constant. Because we don't know its rank in
2291705dSMahesh Ravishankar      // advance, we need to loop over the range [0, element count) and
2291705dSMahesh Ravishankar      // delinearize the index.
2291705dSMahesh Ravishankar      for (int linearIndex = 0; linearIndex < numElements; ++linearIndex) {
2291705dSMahesh Ravishankar        computeRemappedLinearIndex(linearIndex);
2291705dSMahesh Ravishankar
2291705dSMahesh Ravishankar        // Collect constant elements for all inputs at this loop iteration.
2291705dSMahesh Ravishankar        for (int i = 0; i < numInputs; ++i)
2291705dSMahesh Ravishankar          computeFnInputs.apInts[i] = inIntRanges[i][srcLinearIndices[i]];
2291705dSMahesh Ravishankar
2291705dSMahesh Ravishankar        // Invoke the computation to get the corresponding constant output
2291705dSMahesh Ravishankar        // element.
2291705dSMahesh Ravishankar        intOutputValues[dstLinearIndex] = *computeFn(computeFnInputs).apInt;
2291705dSMahesh Ravishankar      }
2291705dSMahesh Ravishankar    }
2291705dSMahesh Ravishankar
2291705dSMahesh Ravishankar    DenseElementsAttr outputAttr =
2291705dSMahesh Ravishankar        isFloat ? DenseElementsAttr::get(outputType, fpOutputValues)
2291705dSMahesh Ravishankar                : DenseElementsAttr::get(outputType, intOutputValues);
2291705dSMahesh Ravishankar
*74ed79f7SRyan Holt    rewriter.replaceOpWithNewOp<arith::ConstantOp>(linalgOp, outputAttr);
2291705dSMahesh Ravishankar    return success();
2291705dSMahesh Ravishankar  }
2291705dSMahesh Ravishankar
2291705dSMahesh Ravishankarprivate:
2291705dSMahesh Ravishankar  ControlFusionFn controlFn;
2291705dSMahesh Ravishankar};
2291705dSMahesh Ravishankar
*74ed79f7SRyan Holt// Folds linalg.transpose (and linalg.generic ops that are actually transposes)
*74ed79f7SRyan Holt// on constant values.
2291705dSMahesh Ravishankarstruct FoldConstantTranspose : public FoldConstantBase<FoldConstantTranspose> {
*74ed79f7SRyan Holt
2291705dSMahesh Ravishankar  using FoldConstantBase::FoldConstantBase;
2291705dSMahesh Ravishankar
*74ed79f7SRyan Holt  bool matchIndexingMaps(LinalgOp linalgOp) const {
2291705dSMahesh Ravishankar    // We should have one input and one output.
*74ed79f7SRyan Holt    return linalgOp.getIndexingMapsArray().size() == 2;
2291705dSMahesh Ravishankar  }
2291705dSMahesh Ravishankar
*74ed79f7SRyan Holt  RegionComputationFn getRegionComputeFn(LinalgOp linalgOp) const {
2291705dSMahesh Ravishankar    // Make sure the region only contains a yield op.
*74ed79f7SRyan Holt    Block &body = linalgOp->getRegion(0).front();
2291705dSMahesh Ravishankar    if (!llvm::hasSingleElement(body))
2291705dSMahesh Ravishankar      return nullptr;
2291705dSMahesh Ravishankar    auto yieldOp = dyn_cast<linalg::YieldOp>(body.getTerminator());
2291705dSMahesh Ravishankar    if (!yieldOp)
2291705dSMahesh Ravishankar      return nullptr;
2291705dSMahesh Ravishankar
2291705dSMahesh Ravishankar    // The yield op should return the block argument corresponds to the input.
d3b3f765SJacques Pienaar    for (Value yieldVal : yieldOp.getValues()) {
5550c821STres Popp      auto yieldArg = dyn_cast<BlockArgument>(yieldVal);
2291705dSMahesh Ravishankar      if (!yieldArg || yieldArg.getOwner() != &body)
2291705dSMahesh Ravishankar        return nullptr;
2291705dSMahesh Ravishankar      if (yieldArg.getArgNumber() != 0)
2291705dSMahesh Ravishankar        return nullptr;
2291705dSMahesh Ravishankar    }
2291705dSMahesh Ravishankar
2291705dSMahesh Ravishankar    // No computation; just return the orginal value.
2291705dSMahesh Ravishankar    return [](const APIntOrFloatArray &inputs) {
2291705dSMahesh Ravishankar      if (inputs.apFloats.empty())
1a36588eSKazu Hirata        return APIntOrFloat{inputs.apInts.front(), std::nullopt};
1a36588eSKazu Hirata      return APIntOrFloat{std::nullopt, inputs.apFloats.front()};
2291705dSMahesh Ravishankar    };
2291705dSMahesh Ravishankar  }
2291705dSMahesh Ravishankar
2291705dSMahesh Ravishankar  ControlFusionFn controlFn;
2291705dSMahesh Ravishankar};
2291705dSMahesh Ravishankar} // namespace
2291705dSMahesh Ravishankar
2291705dSMahesh Ravishankarvoid mlir::linalg::populateConstantFoldLinalgOperations(
2291705dSMahesh Ravishankar    RewritePatternSet &patterns, const ControlFusionFn &controlFn) {
2291705dSMahesh Ravishankar  MLIRContext *context = patterns.getContext();
2291705dSMahesh Ravishankar  patterns.insert<FoldConstantTranspose>(context, controlFn);
2291705dSMahesh Ravishankar}