SparseTensor/Transforms/SparsificationAndBufferizationPass.cpp

c1fef4e8SMatthias Springer//===- SparsificationAndBufferizationPass.cpp - Tensor to Memref Lowering -===//
c1fef4e8SMatthias Springer//
c1fef4e8SMatthias Springer// Part of the LLVM Project, under the Apache License v2.0 with LLVM Exceptions.
c1fef4e8SMatthias Springer// See https://llvm.org/LICENSE.txt for license information.
c1fef4e8SMatthias Springer// SPDX-License-Identifier: Apache-2.0 WITH LLVM-exception
c1fef4e8SMatthias Springer//
c1fef4e8SMatthias Springer//===----------------------------------------------------------------------===//
c1fef4e8SMatthias Springer
c1fef4e8SMatthias Springer#include "mlir/Dialect/SparseTensor/Transforms/Passes.h"
c1fef4e8SMatthias Springer
8154494eSAart Bik#include "mlir/Dialect/Affine/IR/AffineOps.h"
c1fef4e8SMatthias Springer#include "mlir/Dialect/Bufferization/IR/BufferizableOpInterface.h"
a0568eabSbixia1#include "mlir/Dialect/Bufferization/IR/Bufferization.h"
c1fef4e8SMatthias Springer#include "mlir/Dialect/Bufferization/Transforms/Bufferize.h"
c1fef4e8SMatthias Springer#include "mlir/Dialect/Bufferization/Transforms/OneShotAnalysis.h"
c7a9e5e5SPeiming Liu#include "mlir/Dialect/Bufferization/Transforms/OneShotModuleBufferize.h"
be630f07SMatthias Springer#include "mlir/Dialect/Bufferization/Transforms/Passes.h"
c1fef4e8SMatthias Springer#include "mlir/Dialect/Bufferization/Transforms/Transforms.h"
c1fef4e8SMatthias Springer#include "mlir/Dialect/Func/IR/FuncOps.h"
ee42e236SAart Bik#include "mlir/Dialect/GPU/IR/GPUDialect.h"
006340baSPeiming Liu#include "mlir/Dialect/LLVMIR/LLVMDialect.h"
8154494eSAart Bik#include "mlir/Dialect/Linalg/IR/Linalg.h"
8154494eSAart Bik#include "mlir/Dialect/MemRef/IR/MemRef.h"
8154494eSAart Bik#include "mlir/Dialect/SCF/IR/SCF.h"
c1fef4e8SMatthias Springer#include "mlir/Dialect/SparseTensor/IR/SparseTensor.h"
c1fef4e8SMatthias Springer#include "mlir/Dialect/SparseTensor/Transforms/Passes.h"
9f3334e9SMatthias Springer#include "mlir/Dialect/Vector/IR/VectorOps.h"
c1fef4e8SMatthias Springer#include "mlir/Pass/PassManager.h"
16aa4e4bSAart Bik#include "mlir/Transforms/Passes.h"
c1fef4e8SMatthias Springer
c1fef4e8SMatthias Springerusing namespace mlir;
c1fef4e8SMatthias Springer
c1fef4e8SMatthias Springernamespace mlir {
8154494eSAart Bik
8154494eSAart Bik#define GEN_PASS_DEF_SPARSIFICATIONANDBUFFERIZATION
8154494eSAart Bik#include "mlir/Dialect/SparseTensor/Transforms/Passes.h.inc"
8154494eSAart Bik
c1fef4e8SMatthias Springernamespace sparse_tensor {
c1fef4e8SMatthias Springer
c1fef4e8SMatthias Springer/// Return `true` if one of the given types is a sparse tensor type.
c1fef4e8SMatthias Springerstatic bool containsSparseTensor(TypeRange types) {
c1fef4e8SMatthias Springer  for (Type t : types)
48a73bc4SMatthias Springer    if (isa<TensorType>(t) && getSparseTensorEncoding(t))
c1fef4e8SMatthias Springer      return true;
c1fef4e8SMatthias Springer  return false;
c1fef4e8SMatthias Springer}
c1fef4e8SMatthias Springer
c1fef4e8SMatthias Springer/// A pass that lowers tensor ops to memref ops, regardless of whether they are
c1fef4e8SMatthias Springer/// dense or sparse.
c1fef4e8SMatthias Springer///
c1fef4e8SMatthias Springer/// One-Shot Analysis is used to detect RaW conflicts and to insert buffer
c1fef4e8SMatthias Springer/// copies of the tensor level (`insertTensorCopies`). Afterwards, the lowering
c1fef4e8SMatthias Springer/// of tensor ops to memref ops follows a different code path depending on
c1fef4e8SMatthias Springer/// whether the op is sparse or dense:
c1fef4e8SMatthias Springer///
c1fef4e8SMatthias Springer/// * Sparse tensor ops are lowered through Sparsification and follow-up pass
c1fef4e8SMatthias Springer///   that lowers sparse_tensor dialect ops.
c1fef4e8SMatthias Springer/// * Dense tensor ops are lowered through BufferizableOpInterface
c1fef4e8SMatthias Springer///   implementations.
c1fef4e8SMatthias Springerclass SparsificationAndBufferizationPass
8154494eSAart Bik    : public impl::SparsificationAndBufferizationBase<
8154494eSAart Bik          SparsificationAndBufferizationPass> {
c1fef4e8SMatthias Springerpublic:
438a7d4cSAart Bik  // Private pass options only.
c1fef4e8SMatthias Springer  SparsificationAndBufferizationPass(
c1fef4e8SMatthias Springer      const bufferization::OneShotBufferizationOptions &bufferizationOptions,
c1fef4e8SMatthias Springer      const SparsificationOptions &sparsificationOptions,
c44d307cSPeiming Liu      bool createSparseDeallocs, bool enableRuntimeLibrary,
438a7d4cSAart Bik      bool enableBufferInitialization)
c1fef4e8SMatthias Springer      : bufferizationOptions(bufferizationOptions),
c1fef4e8SMatthias Springer        sparsificationOptions(sparsificationOptions),
c44d307cSPeiming Liu        createSparseDeallocs(createSparseDeallocs),
c1fef4e8SMatthias Springer        enableRuntimeLibrary(enableRuntimeLibrary),
438a7d4cSAart Bik        enableBufferInitialization(enableBufferInitialization) {}
438a7d4cSAart Bik  // Private pass options and visible pass options.
438a7d4cSAart Bik  SparsificationAndBufferizationPass(
438a7d4cSAart Bik      const bufferization::OneShotBufferizationOptions &bufferizationOptions,
438a7d4cSAart Bik      const SparsificationOptions &sparsificationOptions,
438a7d4cSAart Bik      bool createSparseDeallocs, bool enableRuntimeLibrary,
438a7d4cSAart Bik      bool enableBufferInitialization, unsigned vl, bool vla, bool index32,
*8f0c014bSYinying Li      bool gpu, SparseEmitStrategy emitStrategy,
*8f0c014bSYinying Li      SparseParallelizationStrategy parallelizationStrategy)
438a7d4cSAart Bik      : bufferizationOptions(bufferizationOptions),
438a7d4cSAart Bik        sparsificationOptions(sparsificationOptions),
438a7d4cSAart Bik        createSparseDeallocs(createSparseDeallocs),
438a7d4cSAart Bik        enableRuntimeLibrary(enableRuntimeLibrary),
438a7d4cSAart Bik        enableBufferInitialization(enableBufferInitialization) {
438a7d4cSAart Bik    // Set the visible pass options explicitly.
438a7d4cSAart Bik    vectorLength = vl;
438a7d4cSAart Bik    enableVLAVectorization = vla;
438a7d4cSAart Bik    enableSIMDIndex32 = index32;
438a7d4cSAart Bik    enableGPULibgen = gpu;
1ba2768cSPeiming Liu    sparseEmitStrategy = emitStrategy;
*8f0c014bSYinying Li    parallelization = parallelizationStrategy;
5f32bcfbSAart Bik  }
c1fef4e8SMatthias Springer
c1fef4e8SMatthias Springer  /// Bufferize all dense ops. This assumes that no further analysis is needed
c1fef4e8SMatthias Springer  /// and that all required buffer copies were already inserted by
c1fef4e8SMatthias Springer  /// `insertTensorCopies` in the form of `bufferization.alloc_tensor` ops.
c1fef4e8SMatthias Springer  LogicalResult runDenseBufferization() {
9d34c052SMatthias Springer    bufferization::OneShotBufferizationOptions updatedOptions =
9d34c052SMatthias Springer        bufferizationOptions;
9d34c052SMatthias Springer    // Skip all sparse ops.
9d34c052SMatthias Springer    updatedOptions.opFilter.denyOperation([&](Operation *op) {
c1fef4e8SMatthias Springer      if (containsSparseTensor(TypeRange(op->getResults())) ||
c1fef4e8SMatthias Springer          containsSparseTensor(TypeRange(op->getOperands())))
9d34c052SMatthias Springer        return true;
c1fef4e8SMatthias Springer      if (auto funcOp = dyn_cast<func::FuncOp>(op)) {
c1fef4e8SMatthias Springer        FunctionType funcType = funcOp.getFunctionType();
c1fef4e8SMatthias Springer        if (containsSparseTensor(funcType.getInputs()) ||
c1fef4e8SMatthias Springer            containsSparseTensor(funcType.getResults()))
c1fef4e8SMatthias Springer          return true;
9d34c052SMatthias Springer      }
9d34c052SMatthias Springer      return false;
c1fef4e8SMatthias Springer    });
c7a9e5e5SPeiming Liu
48a73bc4SMatthias Springer    if (failed(bufferization::bufferizeModuleOp(cast<ModuleOp>(getOperation()),
48a73bc4SMatthias Springer                                                updatedOptions)))
c7a9e5e5SPeiming Liu      return failure();
c7a9e5e5SPeiming Liu
c7a9e5e5SPeiming Liu    bufferization::removeBufferizationAttributesInModule(getOperation());
c7a9e5e5SPeiming Liu    return success();
c1fef4e8SMatthias Springer  }
c1fef4e8SMatthias Springer
c1fef4e8SMatthias Springer  void runOnOperation() override {
1ba2768cSPeiming Liu    // Overrides the default emit strategy using user-provided value.
1ba2768cSPeiming Liu    this->sparsificationOptions.sparseEmitStrategy = sparseEmitStrategy;
1ba2768cSPeiming Liu
*8f0c014bSYinying Li    // Overrides the default parallelization strategy using user-provided value.
*8f0c014bSYinying Li    this->sparsificationOptions.parallelizationStrategy = parallelization;
*8f0c014bSYinying Li
c1fef4e8SMatthias Springer    // Run enabling transformations.
b19c40c5SAart Bik    {
c1fef4e8SMatthias Springer      OpPassManager pm("builtin.module");
c1fef4e8SMatthias Springer      pm.addPass(createPreSparsificationRewritePass());
be630f07SMatthias Springer      pm.addNestedPass<func::FuncOp>(
be630f07SMatthias Springer          bufferization::createEmptyTensorToAllocTensorPass());
c1fef4e8SMatthias Springer      if (failed(runPipeline(pm, getOperation())))
c1fef4e8SMatthias Springer        return signalPassFailure();
c1fef4e8SMatthias Springer    }
c1fef4e8SMatthias Springer
c1fef4e8SMatthias Springer    // Insert tensor copies. This step runs One-Shot Analysis (which analyzes
c1fef4e8SMatthias Springer    // SSA use-def chains of tensor IR) and decides where buffer copies are
c1fef4e8SMatthias Springer    // needed and where buffers can be written to in-place. These decisions are
c1fef4e8SMatthias Springer    // materialized in the IR in the form of `bufferization.alloc_tensor` ops.
c1fef4e8SMatthias Springer    //
c1fef4e8SMatthias Springer    // Note: All following steps in this pass must be careful not to modify the
c1fef4e8SMatthias Springer    // structure of the IR (i.e., tensor use-def chains), as that could
c1fef4e8SMatthias Springer    // invalidate the results of the analysis. From now on, only small and
c1fef4e8SMatthias Springer    // localized rewrites are allowed, such as replacing a tensor op with its
c1fef4e8SMatthias Springer    // memref equivalent.
c1fef4e8SMatthias Springer    if (failed(bufferization::insertTensorCopies(getOperation(),
c1fef4e8SMatthias Springer                                                 bufferizationOptions)))
c1fef4e8SMatthias Springer      return signalPassFailure();
c1fef4e8SMatthias Springer
b19c40c5SAart Bik    // Option `testAnalysisOnly` is a debug/testing flag. If set, the results of
c1fef4e8SMatthias Springer    // OneShotAnalysis are added to the IR via attributes. In that case, do not
c1fef4e8SMatthias Springer    // continue with the remaining pipeline.
c1fef4e8SMatthias Springer    if (bufferizationOptions.testAnalysisOnly)
c1fef4e8SMatthias Springer      return;
c1fef4e8SMatthias Springer
c1fef4e8SMatthias Springer    // Bufferize all sparse ops. No further analysis is needed. All required
c1fef4e8SMatthias Springer    // buffer copies were already inserted by `insertTensorCopies` in the form
c1fef4e8SMatthias Springer    // of `bufferization.alloc_tensor` ops.
c1fef4e8SMatthias Springer    {
c1fef4e8SMatthias Springer      OpPassManager pm("builtin.module");
5f32bcfbSAart Bik      if (enableGPULibgen)
5f32bcfbSAart Bik        pm.addPass(createSparseGPUCodegenPass(0, enableRuntimeLibrary));
c99951d4SPeiming Liu      pm.addPass(createSparseReinterpretMapPass(ReinterpretMapScope::kAll));
c1fef4e8SMatthias Springer      pm.addPass(createSparsificationPass(sparsificationOptions));
a02010b3SPeiming Liu      if (sparsificationOptions.sparseEmitStrategy ==
a02010b3SPeiming Liu          SparseEmitStrategy::kSparseIterator) {
a02010b3SPeiming Liu        pm.addNestedPass<func::FuncOp>(createSparseSpaceCollapsePass());
a02010b3SPeiming Liu        pm.addNestedPass<func::FuncOp>(createLowerSparseIterationToSCFPass());
a02010b3SPeiming Liu      }
a02010b3SPeiming Liu
dda3dc5eSPeiming Liu      pm.addNestedPass<func::FuncOp>(createStageSparseOperationsPass());
f82bee13SPeiming Liu      pm.addPass(createLowerSparseOpsToForeachPass(enableRuntimeLibrary,
f82bee13SPeiming Liu                                                   /*enableConvert=*/true));
ef100c22SPeiming Liu      pm.addPass(
ef100c22SPeiming Liu          createSparseReinterpretMapPass(ReinterpretMapScope::kExceptGeneric));
f82bee13SPeiming Liu      pm.addNestedPass<func::FuncOp>(createLowerForeachToSCFPass());
16aa4e4bSAart Bik      pm.addPass(mlir::createLoopInvariantCodeMotionPass());
b6cad75eSPeiming Liu      if (vectorLength > 0) {
16aa4e4bSAart Bik        pm.addPass(createSparseVectorizationPass(
16aa4e4bSAart Bik            vectorLength, enableVLAVectorization, enableSIMDIndex32));
16aa4e4bSAart Bik      }
c1fef4e8SMatthias Springer      if (enableRuntimeLibrary) {
f248d0b2SPeiming Liu        pm.addPass(createSparseTensorConversionPass());
c1fef4e8SMatthias Springer      } else {
c44d307cSPeiming Liu        pm.addPass(createSparseTensorCodegenPass(createSparseDeallocs,
c44d307cSPeiming Liu                                                 enableBufferInitialization));
c1fef4e8SMatthias Springer        pm.addPass(createSparseBufferRewritePass(enableBufferInitialization));
c1fef4e8SMatthias Springer      }
c1fef4e8SMatthias Springer      if (failed(runPipeline(pm, getOperation())))
c1fef4e8SMatthias Springer        return signalPassFailure();
c1fef4e8SMatthias Springer    }
c1fef4e8SMatthias Springer
c1fef4e8SMatthias Springer    // Bufferize all dense ops.
c1fef4e8SMatthias Springer    if (failed(runDenseBufferization()))
c1fef4e8SMatthias Springer      signalPassFailure();
c1fef4e8SMatthias Springer  }
c1fef4e8SMatthias Springer
c1fef4e8SMatthias Springerprivate:
c1fef4e8SMatthias Springer  bufferization::OneShotBufferizationOptions bufferizationOptions;
c1fef4e8SMatthias Springer  SparsificationOptions sparsificationOptions;
c44d307cSPeiming Liu  bool createSparseDeallocs;
c1fef4e8SMatthias Springer  bool enableRuntimeLibrary;
c1fef4e8SMatthias Springer  bool enableBufferInitialization;
c1fef4e8SMatthias Springer};
16aa4e4bSAart Bik
c1fef4e8SMatthias Springer} // namespace sparse_tensor
c1fef4e8SMatthias Springer} // namespace mlir
c1fef4e8SMatthias Springer
8154494eSAart Bikmlir::bufferization::OneShotBufferizationOptions
8154494eSAart Bikmlir::getBufferizationOptionsForSparsification(bool analysisOnly) {
8154494eSAart Bik  using namespace mlir::bufferization;
8154494eSAart Bik  OneShotBufferizationOptions options;
8154494eSAart Bik  options.bufferizeFunctionBoundaries = true;
8154494eSAart Bik  options.setFunctionBoundaryTypeConversion(LayoutMapOption::IdentityLayoutMap);
8154494eSAart Bik  options.unknownTypeConverterFn = [](Value value, Attribute memorySpace,
8154494eSAart Bik                                      const BufferizationOptions &options) {
8154494eSAart Bik    return getMemRefTypeWithStaticIdentityLayout(
8154494eSAart Bik        cast<TensorType>(value.getType()), memorySpace);
8154494eSAart Bik  };
8154494eSAart Bik  if (analysisOnly) {
8154494eSAart Bik    options.testAnalysisOnly = true;
8154494eSAart Bik    options.printConflicts = true;
8154494eSAart Bik  }
aec73eadSAart Bik  // Since this mini-pipeline may be used in alternative pipelines (viz.
aec73eadSAart Bik  // different from the default "sparsifier" pipeline) where unknown ops
aec73eadSAart Bik  // are handled by alternative bufferization methods that are downstream
aec73eadSAart Bik  // of this mini-pipeline, we allow unknown ops by default (failure to
aec73eadSAart Bik  // bufferize is eventually apparent by failing to convert to LLVM IR).
aec73eadSAart Bik  options.allowUnknownOps = true;
8154494eSAart Bik  return options;
8154494eSAart Bik}
8154494eSAart Bik
8154494eSAart Bikstd::unique_ptr<mlir::Pass> mlir::createSparsificationAndBufferizationPass() {
8154494eSAart Bik  SparsificationOptions sparseOptions;
438a7d4cSAart Bik  return std::make_unique<
438a7d4cSAart Bik      mlir::sparse_tensor::SparsificationAndBufferizationPass>(
8154494eSAart Bik      getBufferizationOptionsForSparsification(/*analysisOnly=*/false),
f248d0b2SPeiming Liu      sparseOptions,
8154494eSAart Bik      /*createSparseDeallocs=*/false,
8154494eSAart Bik      /*enableRuntimeLibrary=*/false,
438a7d4cSAart Bik      /*enableBufferInitialization=*/false);
8154494eSAart Bik}
8154494eSAart Bik
8154494eSAart Bikstd::unique_ptr<mlir::Pass> mlir::createSparsificationAndBufferizationPass(
c1fef4e8SMatthias Springer    const bufferization::OneShotBufferizationOptions &bufferizationOptions,
c1fef4e8SMatthias Springer    const SparsificationOptions &sparsificationOptions,
c44d307cSPeiming Liu    bool createSparseDeallocs, bool enableRuntimeLibrary,
c44d307cSPeiming Liu    bool enableBufferInitialization, unsigned vectorLength,
1ba2768cSPeiming Liu    bool enableVLAVectorization, bool enableSIMDIndex32, bool enableGPULibgen,
*8f0c014bSYinying Li    SparseEmitStrategy emitStrategy,
*8f0c014bSYinying Li    SparseParallelizationStrategy parallelizationStrategy) {
c1fef4e8SMatthias Springer  return std::make_unique<
c1fef4e8SMatthias Springer      mlir::sparse_tensor::SparsificationAndBufferizationPass>(
f248d0b2SPeiming Liu      bufferizationOptions, sparsificationOptions, createSparseDeallocs,
f248d0b2SPeiming Liu      enableRuntimeLibrary, enableBufferInitialization, vectorLength,
*8f0c014bSYinying Li      enableVLAVectorization, enableSIMDIndex32, enableGPULibgen, emitStrategy,
*8f0c014bSYinying Li      parallelizationStrategy);
c1fef4e8SMatthias Springer}