SparseTensor/Transforms/SparseTensorCodegen.cpp

86b22d31SAart Bik//===- SparseTensorCodegen.cpp - Sparse tensor primitives conversion ------===//
86b22d31SAart Bik//
86b22d31SAart Bik// Part of the LLVM Project, under the Apache License v2.0 with LLVM Exceptions.
86b22d31SAart Bik// See https://llvm.org/LICENSE.txt for license information.
86b22d31SAart Bik// SPDX-License-Identifier: Apache-2.0 WITH LLVM-exception
86b22d31SAart Bik//
86b22d31SAart Bik//===----------------------------------------------------------------------===//
86b22d31SAart Bik//
86b22d31SAart Bik// A pass that converts sparse tensor types and primitives to actual compiler
86b22d31SAart Bik// visible buffers and actual compiler IR that implements these primitives on
86b22d31SAart Bik// the selected sparse tensor storage schemes. This pass provides an alternative
86b22d31SAart Bik// to the SparseTensorConversion pass, eliminating the dependence on a runtime
bc61122aSAart Bik// support library (other than for file I/O), and providing many more
bc61122aSAart Bik// opportunities for subsequent compiler optimization of the generated code.
86b22d31SAart Bik//
86b22d31SAart Bik//===----------------------------------------------------------------------===//
86b22d31SAart Bik
365777ecSAart Bik#include "Utils/CodegenUtils.h"
365777ecSAart Bik#include "Utils/SparseTensorDescriptor.h"
86b22d31SAart Bik
6db397a8SPeiming Liu#include "mlir/Dialect/Arith/Utils/Utils.h"
2ddfacd9SAart Bik#include "mlir/Dialect/Bufferization/IR/Bufferization.h"
86b22d31SAart Bik#include "mlir/Dialect/Func/IR/FuncOps.h"
8a583bd5Sbixia1#include "mlir/Dialect/Linalg/Utils/Utils.h"
86b22d31SAart Bik#include "mlir/Dialect/MemRef/IR/MemRef.h"
840e2ba3Sbixia1#include "mlir/Dialect/SparseTensor/IR/Enums.h"
86b22d31SAart Bik#include "mlir/Dialect/SparseTensor/IR/SparseTensor.h"
f708a549Swren romano#include "mlir/Dialect/SparseTensor/IR/SparseTensorType.h"
86b22d31SAart Bik#include "mlir/Dialect/SparseTensor/Transforms/Passes.h"
86b22d31SAart Bik#include "mlir/Dialect/Tensor/IR/Tensor.h"
86b22d31SAart Bik#include "mlir/Transforms/DialectConversion.h"
f708a549Swren romano
a1fe1f5fSKazu Hirata#include <optional>
86b22d31SAart Bik
86b22d31SAart Bikusing namespace mlir;
86b22d31SAart Bikusing namespace mlir::sparse_tensor;
86b22d31SAart Bik
86b22d31SAart Bik//===----------------------------------------------------------------------===//
86b22d31SAart Bik// Helper methods.
86b22d31SAart Bik//===----------------------------------------------------------------------===//
86b22d31SAart Bik
*9df63b26SMatthias Springer/// Flatten the given value ranges into a single vector of values.
*9df63b26SMatthias Springerstatic SmallVector<Value> flattenValues(ArrayRef<ValueRange> values) {
*9df63b26SMatthias Springer  SmallVector<Value> result;
*9df63b26SMatthias Springer  for (const auto &vals : values)
*9df63b26SMatthias Springer    llvm::append_range(result, vals);
*9df63b26SMatthias Springer  return result;
edca72f5SPeiming Liu}
*9df63b26SMatthias Springer
*9df63b26SMatthias Springer/// Assert that the given value range contains a single value and return it.
*9df63b26SMatthias Springerstatic Value getSingleValue(ValueRange values) {
*9df63b26SMatthias Springer  assert(values.size() == 1 && "expected single value");
*9df63b26SMatthias Springer  return values.front();
5ab1a8aeSPeiming Liu}
edca72f5SPeiming Liu
84cd51bbSwren romano/// Generates a load with proper `index` typing.
70633a8dSAart Bikstatic Value genLoad(OpBuilder &builder, Location loc, Value mem, Value idx) {
44ff23d5SPeiming Liu  idx = genCast(builder, loc, idx, builder.getIndexType());
70633a8dSAart Bik  return builder.create<memref::LoadOp>(loc, mem, idx);
70633a8dSAart Bik}
70633a8dSAart Bik
84cd51bbSwren romano/// Generates a store with proper `index` typing and proper value.
70633a8dSAart Bikstatic void genStore(OpBuilder &builder, Location loc, Value val, Value mem,
70633a8dSAart Bik                     Value idx) {
44ff23d5SPeiming Liu  idx = genCast(builder, loc, idx, builder.getIndexType());
44ff23d5SPeiming Liu  val = genCast(builder, loc, val,
5550c821STres Popp                cast<ShapedType>(mem.getType()).getElementType());
70633a8dSAart Bik  builder.create<memref::StoreOp>(loc, val, mem, idx);
70633a8dSAart Bik}
70633a8dSAart Bik
70633a8dSAart Bik/// Creates a straightforward counting for-loop.
70633a8dSAart Bikstatic scf::ForOp createFor(OpBuilder &builder, Location loc, Value upper,
191c43f6SPeiming Liu                            MutableArrayRef<Value> fields,
70633a8dSAart Bik                            Value lower = Value()) {
70633a8dSAart Bik  Type indexType = builder.getIndexType();
70633a8dSAart Bik  if (!lower)
70633a8dSAart Bik    lower = constantZero(builder, loc, indexType);
70633a8dSAart Bik  Value one = constantOne(builder, loc, indexType);
70633a8dSAart Bik  scf::ForOp forOp = builder.create<scf::ForOp>(loc, lower, upper, one, fields);
70633a8dSAart Bik  for (unsigned i = 0, e = fields.size(); i < e; i++)
70633a8dSAart Bik    fields[i] = forOp.getRegionIterArg(i);
70633a8dSAart Bik  builder.setInsertionPointToStart(forOp.getBody());
70633a8dSAart Bik  return forOp;
70633a8dSAart Bik}
70633a8dSAart Bik
bc61122aSAart Bik/// Creates a push back operation.
70633a8dSAart Bikstatic void createPushback(OpBuilder &builder, Location loc,
988733c6SPeiming Liu                           MutSparseTensorDescriptor desc,
f708a549Swren romano                           SparseTensorFieldKind kind, std::optional<Level> lvl,
f708a549Swren romano                           Value value, Value repeat = Value()) {
f708a549Swren romano  Type etp = desc.getMemRefElementType(kind, lvl);
f708a549Swren romano  Value field = desc.getMemRefField(kind, lvl);
988733c6SPeiming Liu  StorageSpecifierKind specFieldKind = toSpecifierKind(kind);
6607fdf7SAart Bik
988733c6SPeiming Liu  auto pushBackOp = builder.create<PushBackOp>(
f708a549Swren romano      loc, desc.getSpecifierField(builder, loc, specFieldKind, lvl), field,
44ff23d5SPeiming Liu      genCast(builder, loc, value, etp), repeat);
191c43f6SPeiming Liu
f708a549Swren romano  desc.setMemRefField(kind, lvl, pushBackOp.getOutBuffer());
f708a549Swren romano  desc.setSpecifierField(builder, loc, specFieldKind, lvl,
988733c6SPeiming Liu                         pushBackOp.getNewSize());
3ae98fd2SAart Bik}
3ae98fd2SAart Bik
70633a8dSAart Bik/// Generates code that allocates a sparse storage scheme for given rank.
70633a8dSAart Bikstatic void allocSchemeForRank(OpBuilder &builder, Location loc,
f708a549Swren romano                               MutSparseTensorDescriptor desc, Level startLvl) {
f708a549Swren romano  const SparseTensorType stt(desc.getRankedTensorType());
70633a8dSAart Bik  Value linear = constantIndex(builder, loc, 1);
f708a549Swren romano  const Level lvlRank = stt.getLvlRank();
160d483bSAart Bik  for (Level lvl = startLvl; lvl < lvlRank; lvl++) {
1dd387e1SAart Bik    const auto lt = stt.getLvlType(lvl);
1dd387e1SAart Bik    if (isCompressedLT(lt) || isLooseCompressedLT(lt)) {
84cd51bbSwren romano      // Append linear x positions, initialized to zero. Since each compressed
70633a8dSAart Bik      // dimension initially already has a single zero entry, this maintains
160d483bSAart Bik      // the desired "linear + 1" length property at all times. For loose
160d483bSAart Bik      // compression, we multiply linear by two in order to append both the
160d483bSAart Bik      // lo/hi positions.
84cd51bbSwren romano      Value posZero = constantZero(builder, loc, stt.getPosType());
1dd387e1SAart Bik      if (isLooseCompressedLT(lt)) {
160d483bSAart Bik        Value two = constantIndex(builder, loc, 2);
160d483bSAart Bik        linear = builder.create<arith::MulIOp>(loc, linear, two);
ef99c27dSMehdi Amini      }
160d483bSAart Bik      createPushback(builder, loc, desc, SparseTensorFieldKind::PosMemRef, lvl,
160d483bSAart Bik                     /*value=*/posZero, /*repeat=*/linear);
160d483bSAart Bik      return;
e5924d64SYinying Li    } else if (isSingletonLT(lt) || isNOutOfMLT(lt)) {
70633a8dSAart Bik      return; // nothing to do
dd33481fSPeiming Liu    }
dd33481fSPeiming Liu    // Keep compounding the size, but nothing needs to be initialized
70633a8dSAart Bik    // at this level. We will eventually reach a compressed level or
70633a8dSAart Bik    // otherwise the values array for the from-here "all-dense" case.
1dd387e1SAart Bik    assert(isDenseLT(lt));
160d483bSAart Bik    Value size = desc.getLvlSize(builder, loc, lvl);
70633a8dSAart Bik    linear = builder.create<arith::MulIOp>(loc, linear, size);
70633a8dSAart Bik  }
70633a8dSAart Bik  // Reached values array so prepare for an insertion.
f708a549Swren romano  Value valZero = constantZero(builder, loc, stt.getElementType());
988733c6SPeiming Liu  createPushback(builder, loc, desc, SparseTensorFieldKind::ValMemRef,
160d483bSAart Bik                 std::nullopt, /*value=*/valZero, /*repeat=*/linear);
70633a8dSAart Bik}
70633a8dSAart Bik
80b08b68SAart Bik/// Creates allocation operation.
191c43f6SPeiming Liustatic Value createAllocation(OpBuilder &builder, Location loc,
191c43f6SPeiming Liu                              MemRefType memRefType, Value sz,
191c43f6SPeiming Liu                              bool enableInit) {
191c43f6SPeiming Liu  Value buffer = builder.create<memref::AllocOp>(loc, memRefType, sz);
191c43f6SPeiming Liu  Type elemType = memRefType.getElementType();
7276b643Sbixia1  if (enableInit) {
ea4be70cSbixia1    Value fillValue = constantZero(builder, loc, elemType);
7276b643Sbixia1    builder.create<linalg::FillOp>(loc, fillValue, buffer);
7276b643Sbixia1  }
7276b643Sbixia1  return buffer;
0c7abd39SAart Bik}
0c7abd39SAart Bik
83cf0dc9SAart Bik/// Creates the dim sizes array, filling in from dynamic sizes.
83cf0dc9SAart Bikstatic void createDimSizes(OpBuilder &builder, Location loc,
83cf0dc9SAart Bik                           SparseTensorType stt, ValueRange dynSizes,
83cf0dc9SAart Bik                           /*out*/ SmallVectorImpl<Value> &dimSizesValues) {
83cf0dc9SAart Bik  const Dimension dimRank = stt.getDimRank();
83cf0dc9SAart Bik  dimSizesValues.clear();
83cf0dc9SAart Bik  dimSizesValues.reserve(dimRank);
83cf0dc9SAart Bik  unsigned i = 0;
83cf0dc9SAart Bik  for (const Size sz : stt.getDimShape())
83cf0dc9SAart Bik    dimSizesValues.push_back(ShapedType::isDynamic(sz)
83cf0dc9SAart Bik                                 ? dynSizes[i++]
83cf0dc9SAart Bik                                 : constantIndex(builder, loc, sz));
83cf0dc9SAart Bik}
83cf0dc9SAart Bik
6607fdf7SAart Bik/// Creates allocation for each field in sparse tensor type. Note that
160d483bSAart Bik/// for all dynamic memrefs in the sparse tensor stroage layout, the
160d483bSAart Bik/// memory size is really the capacity of the "vector", while the actual
160d483bSAart Bik/// size resides in the sizes array.
f708a549Swren romanostatic void createAllocFields(OpBuilder &builder, Location loc,
83cf0dc9SAart Bik                              SparseTensorType stt, bool enableInit,
83cf0dc9SAart Bik                              Value sizeHint,
83cf0dc9SAart Bik                              SmallVectorImpl<Value> &lvlSizesValues,
83cf0dc9SAart Bik                              /*out*/ SmallVectorImpl<Value> &fields) {
83cf0dc9SAart Bik  Level lvlRank = stt.getLvlRank();
e2e6e7a6SAart Bik  // Set up some heuristic sizes. We try to set the initial
e2e6e7a6SAart Bik  // size based on available information. Otherwise we just
e2e6e7a6SAart Bik  // initialize a few elements to start the reallocation chain.
e2e6e7a6SAart Bik  // TODO: refine this
84cd51bbSwren romano  Value posHeuristic, crdHeuristic, valHeuristic;
f708a549Swren romano  if (stt.isAllDense()) {
83cf0dc9SAart Bik    valHeuristic = lvlSizesValues[0];
83cf0dc9SAart Bik    for (Level lvl = 1; lvl < lvlRank; lvl++)
83cf0dc9SAart Bik      valHeuristic =
83cf0dc9SAart Bik          builder.create<arith::MulIOp>(loc, valHeuristic, lvlSizesValues[lvl]);
e2e6e7a6SAart Bik  } else if (sizeHint) {
5248a987SPeiming Liu    if (stt.getAoSCOOStart() == 0) {
84cd51bbSwren romano      posHeuristic = constantIndex(builder, loc, 2);
84cd51bbSwren romano      crdHeuristic = builder.create<arith::MulIOp>(
83cf0dc9SAart Bik          loc, constantIndex(builder, loc, lvlRank), sizeHint); // AOS
83cf0dc9SAart Bik    } else if (lvlRank == 2 && stt.isDenseLvl(0) && stt.isCompressedLvl(1)) {
84cd51bbSwren romano      posHeuristic = builder.create<arith::AddIOp>(
3bd82f30SAart Bik          loc, sizeHint, constantIndex(builder, loc, 1));
84cd51bbSwren romano      crdHeuristic = sizeHint;
e2e6e7a6SAart Bik    } else {
84cd51bbSwren romano      posHeuristic = crdHeuristic = constantIndex(builder, loc, 16);
b78b5473Sbixia1    }
e2e6e7a6SAart Bik    valHeuristic = sizeHint;
e2e6e7a6SAart Bik  } else {
84cd51bbSwren romano    posHeuristic = crdHeuristic = valHeuristic =
e2e6e7a6SAart Bik        constantIndex(builder, loc, 16);
e2e6e7a6SAart Bik  }
160d483bSAart Bik  // Initializes all fields. An initial storage specifier and allocated
160d483bSAart Bik  // positions/coordinates/values memrefs (with heuristic capacity).
191c43f6SPeiming Liu  foreachFieldAndTypeInSparseTensor(
f708a549Swren romano      stt,
84cd51bbSwren romano      [&builder, &fields, stt, loc, posHeuristic, crdHeuristic, valHeuristic,
f708a549Swren romano       enableInit](Type fType, FieldIndex fIdx, SparseTensorFieldKind fKind,
1944c4f7SAart Bik                   Level /*lvl*/, LevelType /*lt*/) -> bool {
191c43f6SPeiming Liu        assert(fields.size() == fIdx);
191c43f6SPeiming Liu        Value field;
191c43f6SPeiming Liu        switch (fKind) {
988733c6SPeiming Liu        case SparseTensorFieldKind::StorageSpec:
f708a549Swren romano          field = SparseTensorSpecifier::getInitValue(builder, loc, stt);
191c43f6SPeiming Liu          break;
84cd51bbSwren romano        case SparseTensorFieldKind::PosMemRef:
160d483bSAart Bik          field = createAllocation(builder, loc, cast<MemRefType>(fType),
160d483bSAart Bik                                   posHeuristic, enableInit);
160d483bSAart Bik          break;
84cd51bbSwren romano        case SparseTensorFieldKind::CrdMemRef:
160d483bSAart Bik          field = createAllocation(builder, loc, cast<MemRefType>(fType),
160d483bSAart Bik                                   crdHeuristic, enableInit);
160d483bSAart Bik          break;
191c43f6SPeiming Liu        case SparseTensorFieldKind::ValMemRef:
160d483bSAart Bik          field = createAllocation(builder, loc, cast<MemRefType>(fType),
160d483bSAart Bik                                   valHeuristic, enableInit);
191c43f6SPeiming Liu          break;
191c43f6SPeiming Liu        }
191c43f6SPeiming Liu        assert(field);
191c43f6SPeiming Liu        fields.push_back(field);
191c43f6SPeiming Liu        // Returns true to continue the iteration.
191c43f6SPeiming Liu        return true;
191c43f6SPeiming Liu      });
160d483bSAart Bik  // Initialize the storage scheme to an empty tensor. Sets the lvlSizes
160d483bSAart Bik  // and gives all position fields an initial zero entry, so that it is
160d483bSAart Bik  // easier to maintain the "linear + 1" length property.
f708a549Swren romano  MutSparseTensorDescriptor desc(stt, fields);
84cd51bbSwren romano  Value posZero = constantZero(builder, loc, stt.getPosType());
160d483bSAart Bik  for (Level lvl = 0, lvlRank = stt.getLvlRank(); lvl < lvlRank; lvl++) {
83cf0dc9SAart Bik    desc.setLvlSize(builder, loc, lvl, lvlSizesValues[lvl]);
1dd387e1SAart Bik    const auto lt = stt.getLvlType(lvl);
1dd387e1SAart Bik    if (isCompressedLT(lt) || isLooseCompressedLT(lt))
160d483bSAart Bik      createPushback(builder, loc, desc, SparseTensorFieldKind::PosMemRef, lvl,
160d483bSAart Bik                     /*value=*/posZero);
988733c6SPeiming Liu  }
191c43f6SPeiming Liu  allocSchemeForRank(builder, loc, desc, /*rank=*/0);
0c7abd39SAart Bik}
0c7abd39SAart Bik
70633a8dSAart Bik/// Helper method that generates block specific to compressed case:
70633a8dSAart Bik///
84cd51bbSwren romano///  // given: parentPos = posCursor[lvl-1]
84cd51bbSwren romano///  pstart = desc.positions[lvl][parentPos]
84cd51bbSwren romano///  pstop = desc.positions[lvl][parentPos+1]
84cd51bbSwren romano///  plast = pstop - 1
84cd51bbSwren romano///  msz = desc.coordinates[lvl].size()
84cd51bbSwren romano///  if (pstart < pstop) {
84cd51bbSwren romano///    isPresent = (desc.coordinates[lvl][plast] == lvlCoords[lvl])
70633a8dSAart Bik///  } else { // first insertion
84cd51bbSwren romano///    isPresent = false
84cd51bbSwren romano///    desc.positions[lvl][parentPos] = msz
70633a8dSAart Bik///  }
84cd51bbSwren romano///  if (isPresent) { // coordinate is already present
84cd51bbSwren romano///    pnext = plast
70633a8dSAart Bik///  } else {
84cd51bbSwren romano///    desc.coordinates[lvl].push_back(lvlCoords[lvl])
84cd51bbSwren romano///    desc.positions[lvl][parentPos+1] = msz+1
84cd51bbSwren romano///    pnext = msz
84cd51bbSwren romano///    <prepare level lvl+1>
70633a8dSAart Bik///  }
84cd51bbSwren romano///  posCursor[lvl] = pnext
70633a8dSAart Bikstatic Value genCompressed(OpBuilder &builder, Location loc,
84cd51bbSwren romano                           MutSparseTensorDescriptor desc, ValueRange lvlCoords,
84cd51bbSwren romano                           Value /*unused*/, Value parentPos, Level lvl) {
f708a549Swren romano  const SparseTensorType stt(desc.getRankedTensorType());
f708a549Swren romano  const Level lvlRank = stt.getLvlRank();
f708a549Swren romano  assert(lvl < lvlRank && "Level is out of bounds");
84cd51bbSwren romano  assert(lvlCoords.size() == static_cast<size_t>(lvlRank) &&
f708a549Swren romano         "Level-rank mismatch");
0e1708ffSAart Bik  SmallVector<Type> types;
3986c869SAart Bik  Type indexType = builder.getIndexType();
70633a8dSAart Bik  Type boolType = builder.getIntegerType(1);
84cd51bbSwren romano  unsigned crdFidx;
84cd51bbSwren romano  unsigned crdStride;
84cd51bbSwren romano  std::tie(crdFidx, crdStride) = desc.getCrdMemRefIndexAndStride(lvl);
84cd51bbSwren romano  const Value one = constantIndex(builder, loc, 1);
84cd51bbSwren romano  const Value pp1 = builder.create<arith::AddIOp>(loc, parentPos, one);
84cd51bbSwren romano  const Value positionsAtLvl = desc.getPosMemRef(lvl);
84cd51bbSwren romano  const Value pstart = genLoad(builder, loc, positionsAtLvl, parentPos);
84cd51bbSwren romano  const Value pstop = genLoad(builder, loc, positionsAtLvl, pp1);
84cd51bbSwren romano  const Value crdMsz = desc.getCrdMemSize(builder, loc, lvl);
84cd51bbSwren romano  const Value crdStrideC =
84cd51bbSwren romano      crdStride > 1 ? constantIndex(builder, loc, crdStride) : Value();
84cd51bbSwren romano  const Value msz =
84cd51bbSwren romano      crdStrideC ? builder.create<arith::DivUIOp>(loc, crdMsz, crdStrideC)
84cd51bbSwren romano                 : crdMsz;
84cd51bbSwren romano  const Value plast = builder.create<arith::SubIOp>(
84cd51bbSwren romano      loc, genCast(builder, loc, pstop, indexType), one);
70633a8dSAart Bik  // Conditional expression.
84cd51bbSwren romano  Value lt = builder.create<arith::CmpIOp>(loc, arith::CmpIPredicate::ult,
84cd51bbSwren romano                                           pstart, pstop);
70633a8dSAart Bik  types.push_back(boolType);
70633a8dSAart Bik  scf::IfOp ifOp1 = builder.create<scf::IfOp>(loc, types, lt, /*else*/ true);
70633a8dSAart Bik  types.pop_back();
70633a8dSAart Bik  builder.setInsertionPointToStart(&ifOp1.getThenRegion().front());
84cd51bbSwren romano  Value crd =
84cd51bbSwren romano      genLoad(builder, loc, desc.getMemRefField(crdFidx),
84cd51bbSwren romano              crdStrideC ? builder.create<arith::MulIOp>(loc, plast, crdStrideC)
84cd51bbSwren romano                         : plast);
44ff23d5SPeiming Liu  Value eq = builder.create<arith::CmpIOp>(
44ff23d5SPeiming Liu      loc, arith::CmpIPredicate::eq, genCast(builder, loc, crd, indexType),
84cd51bbSwren romano      lvlCoords[lvl]);
70633a8dSAart Bik  builder.create<scf::YieldOp>(loc, eq);
70633a8dSAart Bik  builder.setInsertionPointToStart(&ifOp1.getElseRegion().front());
f708a549Swren romano  if (lvl > 0)
84cd51bbSwren romano    genStore(builder, loc, msz, positionsAtLvl, parentPos);
70633a8dSAart Bik  builder.create<scf::YieldOp>(loc, constantI1(builder, loc, false));
70633a8dSAart Bik  builder.setInsertionPointAfter(ifOp1);
191c43f6SPeiming Liu  // If present construct. Note that for a non-unique dimension level, we
191c43f6SPeiming Liu  // simply set the condition to false and rely on CSE/DCE to clean up the IR.
70633a8dSAart Bik  //
70633a8dSAart Bik  // TODO: generate less temporary IR?
70633a8dSAart Bik  //
191c43f6SPeiming Liu  for (unsigned i = 0, e = desc.getNumFields(); i < e; i++)
191c43f6SPeiming Liu    types.push_back(desc.getField(i).getType());
70633a8dSAart Bik  types.push_back(indexType);
f708a549Swren romano  const Value p = stt.isUniqueLvl(lvl) ? ifOp1.getResult(0)
f708a549Swren romano                                       : constantI1(builder, loc, false);
70633a8dSAart Bik  scf::IfOp ifOp2 = builder.create<scf::IfOp>(loc, types, p, /*else*/ true);
84cd51bbSwren romano  // If present (fields unaffected, update pnext to plast).
70633a8dSAart Bik  builder.setInsertionPointToStart(&ifOp2.getThenRegion().front());
191c43f6SPeiming Liu
191c43f6SPeiming Liu  // FIXME: This does not looks like a clean way, but probably the most
191c43f6SPeiming Liu  // efficient way.
84cd51bbSwren romano  desc.getFields().push_back(plast);
191c43f6SPeiming Liu  builder.create<scf::YieldOp>(loc, desc.getFields());
191c43f6SPeiming Liu  desc.getFields().pop_back();
191c43f6SPeiming Liu
84cd51bbSwren romano  // If !present (changes fields, update pnext).
70633a8dSAart Bik  builder.setInsertionPointToStart(&ifOp2.getElseRegion().front());
70633a8dSAart Bik  Value mszp1 = builder.create<arith::AddIOp>(loc, msz, one);
84cd51bbSwren romano  genStore(builder, loc, mszp1, positionsAtLvl, pp1);
84cd51bbSwren romano  createPushback(builder, loc, desc, SparseTensorFieldKind::CrdMemRef, lvl,
160d483bSAart Bik                 /*value=*/lvlCoords[lvl]);
84cd51bbSwren romano  // Prepare the next level "as needed".
f708a549Swren romano  if ((lvl + 1) < lvlRank)
f708a549Swren romano    allocSchemeForRank(builder, loc, desc, lvl + 1);
191c43f6SPeiming Liu
191c43f6SPeiming Liu  desc.getFields().push_back(msz);
191c43f6SPeiming Liu  builder.create<scf::YieldOp>(loc, desc.getFields());
191c43f6SPeiming Liu  desc.getFields().pop_back();
191c43f6SPeiming Liu
70633a8dSAart Bik  // Update fields and return next pos.
70633a8dSAart Bik  builder.setInsertionPointAfter(ifOp2);
70633a8dSAart Bik  unsigned o = 0;
191c43f6SPeiming Liu  for (unsigned i = 0, e = desc.getNumFields(); i < e; i++)
191c43f6SPeiming Liu    desc.setField(i, ifOp2.getResult(o++));
70633a8dSAart Bik  return ifOp2.getResult(o);
3986c869SAart Bik}
3986c869SAart Bik
bc61122aSAart Bik/// Generates insertion finalization code.
bc61122aSAart Bikstatic void genEndInsert(OpBuilder &builder, Location loc,
bc61122aSAart Bik                         SparseTensorDescriptor desc) {
bc61122aSAart Bik  const SparseTensorType stt(desc.getRankedTensorType());
bc61122aSAart Bik  const Level lvlRank = stt.getLvlRank();
83cf0dc9SAart Bik  for (Level lvl = 0; lvl < lvlRank; lvl++) {
1dd387e1SAart Bik    const auto lt = stt.getLvlType(lvl);
1dd387e1SAart Bik    if (isCompressedLT(lt)) {
bc61122aSAart Bik      // Compressed dimensions need a position cleanup for all entries
bc61122aSAart Bik      // that were not visited during the insertion pass.
bc61122aSAart Bik      //
bc61122aSAart Bik      // TODO: avoid cleanup and keep compressed scheme consistent at all
bc61122aSAart Bik      // times?
bc61122aSAart Bik      //
83cf0dc9SAart Bik      if (lvl > 0) {
bc61122aSAart Bik        Type posType = stt.getPosType();
83cf0dc9SAart Bik        Value posMemRef = desc.getPosMemRef(lvl);
83cf0dc9SAart Bik        Value hi = desc.getPosMemSize(builder, loc, lvl);
bc61122aSAart Bik        Value zero = constantIndex(builder, loc, 0);
bc61122aSAart Bik        Value one = constantIndex(builder, loc, 1);
bc61122aSAart Bik        // Vector of only one, but needed by createFor's prototype.
bc61122aSAart Bik        SmallVector<Value, 1> inits{genLoad(builder, loc, posMemRef, zero)};
bc61122aSAart Bik        scf::ForOp loop = createFor(builder, loc, hi, inits, one);
bc61122aSAart Bik        Value i = loop.getInductionVar();
bc61122aSAart Bik        Value oldv = loop.getRegionIterArg(0);
bc61122aSAart Bik        Value newv = genLoad(builder, loc, posMemRef, i);
bc61122aSAart Bik        Value posZero = constantZero(builder, loc, posType);
bc61122aSAart Bik        Value cond = builder.create<arith::CmpIOp>(
bc61122aSAart Bik            loc, arith::CmpIPredicate::eq, newv, posZero);
bc61122aSAart Bik        scf::IfOp ifOp = builder.create<scf::IfOp>(loc, TypeRange(posType),
bc61122aSAart Bik                                                   cond, /*else*/ true);
bc61122aSAart Bik        builder.setInsertionPointToStart(&ifOp.getThenRegion().front());
bc61122aSAart Bik        genStore(builder, loc, oldv, posMemRef, i);
bc61122aSAart Bik        builder.create<scf::YieldOp>(loc, oldv);
bc61122aSAart Bik        builder.setInsertionPointToStart(&ifOp.getElseRegion().front());
bc61122aSAart Bik        builder.create<scf::YieldOp>(loc, newv);
bc61122aSAart Bik        builder.setInsertionPointAfter(ifOp);
bc61122aSAart Bik        builder.create<scf::YieldOp>(loc, ifOp.getResult(0));
bc61122aSAart Bik        builder.setInsertionPointAfter(loop);
bc61122aSAart Bik      }
bc61122aSAart Bik    } else {
1dd387e1SAart Bik      assert(isDenseLT(lt) || isLooseCompressedLT(lt) || isSingletonLT(lt) ||
e5924d64SYinying Li             isNOutOfMLT(lt));
bc61122aSAart Bik    }
bc61122aSAart Bik  }
bc61122aSAart Bik}
bc61122aSAart Bik
bc61122aSAart Bik/// Generates a subview into the sizes.
bc61122aSAart Bikstatic Value genSliceToSize(OpBuilder &builder, Location loc, Value mem,
bc61122aSAart Bik                            Value sz) {
c4e5a8a4SAart Bik  auto memTp = llvm::cast<MemRefType>(mem.getType());
c4e5a8a4SAart Bik  // For higher-dimensional memrefs, we assume that the innermost
c4e5a8a4SAart Bik  // dimension is always of the right size.
c4e5a8a4SAart Bik  // TODO: generate complex truncating view here too?
c4e5a8a4SAart Bik  if (memTp.getRank() > 1)
c4e5a8a4SAart Bik    return mem;
c4e5a8a4SAart Bik  // Truncate linear memrefs to given size.
bc61122aSAart Bik  return builder
bc61122aSAart Bik      .create<memref::SubViewOp>(
c4e5a8a4SAart Bik          loc, MemRefType::get({ShapedType::kDynamic}, memTp.getElementType()),
c4e5a8a4SAart Bik          mem, ValueRange{}, ValueRange{sz}, ValueRange{},
bc61122aSAart Bik          ArrayRef<int64_t>{0},                    // static offset
bc61122aSAart Bik          ArrayRef<int64_t>{ShapedType::kDynamic}, // dynamic size
bc61122aSAart Bik          ArrayRef<int64_t>{1})                    // static stride
bc61122aSAart Bik      .getResult();
bc61122aSAart Bik}
bc61122aSAart Bik
bc61122aSAart Bik/// Creates the reassociation array.
52b69aa3SPeiming Liustatic SmallVector<ReassociationIndices>
52b69aa3SPeiming LiugetReassociationForFlattening(ShapedType srcTp, unsigned batchLvls) {
52b69aa3SPeiming Liu  SmallVector<ReassociationIndices> ret(batchLvls + 1, {});
52b69aa3SPeiming Liu  // Create reassociation in the form:
52b69aa3SPeiming Liu  // {0}, {1}, ..., {batchLvl - 1}, {batchLvl, ..., rank}
52b69aa3SPeiming Liu  for (unsigned i = 0; i < batchLvls; i++)
52b69aa3SPeiming Liu    ret[i].push_back(i);
52b69aa3SPeiming Liu
52b69aa3SPeiming Liu  for (int i = batchLvls, e = srcTp.getRank(); i < e; i++)
52b69aa3SPeiming Liu    ret.back().push_back(i);
52b69aa3SPeiming Liu
52b69aa3SPeiming Liu  return ret;
bc61122aSAart Bik}
bc61122aSAart Bik
bc61122aSAart Bik//===----------------------------------------------------------------------===//
bc61122aSAart Bik// Codegen rules.
bc61122aSAart Bik//===----------------------------------------------------------------------===//
bc61122aSAart Bik
bc61122aSAart Biknamespace {
bc61122aSAart Bik
ad469385SPeiming Liu/// Helper class to help lowering sparse_tensor.insert operation.
ad469385SPeiming Liuclass SparseInsertGenerator
ad469385SPeiming Liu    : public FuncCallOrInlineGenerator<SparseInsertGenerator> {
ad469385SPeiming Liupublic:
ad469385SPeiming Liu  SparseInsertGenerator(TensorType rtp, TypeRange retTypes, ValueRange params,
ad469385SPeiming Liu                        bool genCall)
ad469385SPeiming Liu      : FuncCallOrInlineGenerator(retTypes, params, genCall), rtp(rtp){};
ad469385SPeiming Liu
70633a8dSAart Bik  /// Generates code along an insertion path without the need for a "cursor".
70633a8dSAart Bik  /// This current insertion strategy comes at the expense of some testing
70633a8dSAart Bik  /// overhead for each insertion. The strategy will be optimized later for
70633a8dSAart Bik  /// common insertion patterns. The current insertion strategy also assumes
70633a8dSAart Bik  /// insertions occur in "a reasonable order" that enables building the
70633a8dSAart Bik  /// storage scheme in an appending/inserting kind of fashion (i.e. no
70633a8dSAart Bik  /// in-between insertions that need data movement). The implementation
70633a8dSAart Bik  /// relies on CSE/DCE to clean up all bookkeeping that is not needed.
70633a8dSAart Bik  ///
70633a8dSAart Bik  /// TODO: better unord/not-unique; also generalize, optimize, specialize!
ad469385SPeiming Liu  SmallVector<Value> genImplementation(TypeRange retTypes, ValueRange args,
ad469385SPeiming Liu                                       OpBuilder &builder, Location loc) {
68f58812STres Popp    const SparseTensorType stt(llvm::cast<RankedTensorType>(rtp));
f708a549Swren romano    const Level lvlRank = stt.getLvlRank();
84cd51bbSwren romano    // Extract fields and coordinates from args.
f708a549Swren romano    SmallVector<Value> fields = llvm::to_vector(args.drop_back(lvlRank + 1));
ad469385SPeiming Liu    MutSparseTensorDescriptor desc(stt, fields);
962484aeSwren romano    const SmallVector<Value> coords =
f708a549Swren romano        llvm::to_vector(args.take_back(lvlRank + 1).drop_back());
2aceaddaSbixia1    Value value = args.back();
84cd51bbSwren romano    Value parentPos = constantZero(builder, loc, builder.getIndexType());
f708a549Swren romano    // Generate code for every level.
160d483bSAart Bik    for (Level lvl = 0; lvl < lvlRank; lvl++) {
1dd387e1SAart Bik      const auto lt = stt.getLvlType(lvl);
1dd387e1SAart Bik      if (isCompressedLT(lt) || isLooseCompressedLT(lt)) {
70633a8dSAart Bik        // Create:
70633a8dSAart Bik        //   if (!present) {
160d483bSAart Bik        //     coordinates[lvl].push_back(coords[lvl])
160d483bSAart Bik        //     <update positions and prepare level lvl + 1>
70633a8dSAart Bik        //   }
160d483bSAart Bik        //   positions[lvl] = coordinates.size() - 1
160d483bSAart Bik        //   <insert @ positions[lvl] at next level lvl + 1>
1dd387e1SAart Bik        if (isLooseCompressedLT(lt)) {
160d483bSAart Bik          Value two = constantIndex(builder, loc, 2);
160d483bSAart Bik          parentPos = builder.create<arith::MulIOp>(loc, parentPos, two);
160d483bSAart Bik        }
84cd51bbSwren romano        parentPos =
160d483bSAart Bik            genCompressed(builder, loc, desc, coords, value, parentPos, lvl);
e5924d64SYinying Li      } else if (isSingletonLT(lt) || isNOutOfMLT(lt)) {
70633a8dSAart Bik        // Create:
160d483bSAart Bik        //   coordinates[lvl].push_back(coords[lvl])
160d483bSAart Bik        //   positions[lvl] = positions[lvl-1]
160d483bSAart Bik        //   <insert @ positions[lvl] at next level lvl + 1>
160d483bSAart Bik        createPushback(builder, loc, desc, SparseTensorFieldKind::CrdMemRef,
160d483bSAart Bik                       lvl, /*value=*/coords[lvl]);
70633a8dSAart Bik      } else {
1dd387e1SAart Bik        assert(isDenseLT(lt));
70633a8dSAart Bik        // Construct the new position as:
160d483bSAart Bik        //   positions[lvl] = size * positions[lvl-1] + coords[lvl]
160d483bSAart Bik        //   <insert @ positions[lvl] at next level lvl + 1>
160d483bSAart Bik        Value size = desc.getLvlSize(builder, loc, lvl);
84cd51bbSwren romano        Value mult = builder.create<arith::MulIOp>(loc, size, parentPos);
160d483bSAart Bik        parentPos = builder.create<arith::AddIOp>(loc, mult, coords[lvl]);
70633a8dSAart Bik      }
70633a8dSAart Bik    }
70633a8dSAart Bik    // Reached the actual value append/insert.
f708a549Swren romano    if (!stt.isDenseLvl(lvlRank - 1))
988733c6SPeiming Liu      createPushback(builder, loc, desc, SparseTensorFieldKind::ValMemRef,
988733c6SPeiming Liu                     std::nullopt, value);
70633a8dSAart Bik    else
84cd51bbSwren romano      genStore(builder, loc, value, desc.getValMemRef(), parentPos);
ad469385SPeiming Liu    return fields;
2aceaddaSbixia1  }
2aceaddaSbixia1
ad469385SPeiming Liu  std::string getMangledFuncName() {
2aceaddaSbixia1    // The mangled name of the function has this format:
1dd387e1SAart Bik    //   <namePrefix>_<LT>_<shape>_<ordering>_<eltType>_<crdWidth>_<posWidth>
ad469385SPeiming Liu    constexpr const char kInsertFuncNamePrefix[] = "_insert_";
68f58812STres Popp    const SparseTensorType stt(llvm::cast<RankedTensorType>(rtp));
2aceaddaSbixia1    SmallString<32> nameBuffer;
2aceaddaSbixia1    llvm::raw_svector_ostream nameOstream(nameBuffer);
ad469385SPeiming Liu    nameOstream << kInsertFuncNamePrefix;
f708a549Swren romano    const Level lvlRank = stt.getLvlRank();
6280e231SYinying Li    for (Level l = 0; l < lvlRank; l++) {
6280e231SYinying Li      std::string lvlType = toMLIRString(stt.getLvlType(l));
6280e231SYinying Li      // Replace/remove punctuations in level properties.
6280e231SYinying Li      std::replace_if(
6280e231SYinying Li          lvlType.begin(), lvlType.end(),
6280e231SYinying Li          [](char c) { return c == '(' || c == ','; }, '_');
6461a824SKazu Hirata      llvm::erase_if(lvlType, [](char c) { return c == ')' || c == ' '; });
6280e231SYinying Li      nameOstream << lvlType << "_";
6280e231SYinying Li    }
2aceaddaSbixia1    // Static dim sizes are used in the generated code while dynamic sizes are
2aceaddaSbixia1    // loaded from the dimSizes buffer. This is the reason for adding the shape
2aceaddaSbixia1    // to the function name.
160d483bSAart Bik    for (const auto sz : stt.getDimShape())
160d483bSAart Bik      nameOstream << sz << "_";
2aceaddaSbixia1    // Permutation information is also used in generating insertion.
f708a549Swren romano    if (!stt.isIdentity())
76647fceSwren romano      nameOstream << stt.getDimToLvl() << "_";
f708a549Swren romano    nameOstream << stt.getElementType() << "_";
84cd51bbSwren romano    nameOstream << stt.getCrdWidth() << "_" << stt.getPosWidth();
ad469385SPeiming Liu    return nameOstream.str().str();
2aceaddaSbixia1  }
2aceaddaSbixia1
ad469385SPeiming Liuprivate:
ad469385SPeiming Liu  TensorType rtp;
ad469385SPeiming Liu};
9f596a7cSAart Bik
edca72f5SPeiming Liu/// Sparse tensor storage conversion rule for returns.
86b22d31SAart Bikclass SparseReturnConverter : public OpConversionPattern<func::ReturnOp> {
86b22d31SAart Bikpublic:
86b22d31SAart Bik  using OpConversionPattern::OpConversionPattern;
86b22d31SAart Bik  LogicalResult
*9df63b26SMatthias Springer  matchAndRewrite(func::ReturnOp op, OneToNOpAdaptor adaptor,
86b22d31SAart Bik                  ConversionPatternRewriter &rewriter) const override {
edca72f5SPeiming Liu    // Create a return with the flattened value extracted from sparse tensors.
*9df63b26SMatthias Springer    rewriter.replaceOpWithNewOp<func::ReturnOp>(
*9df63b26SMatthias Springer        op, flattenValues(adaptor.getOperands()));
edca72f5SPeiming Liu    return success();
edca72f5SPeiming Liu  }
edca72f5SPeiming Liu};
edca72f5SPeiming Liu
edca72f5SPeiming Liu/// Sparse tensor storage conversion rule for calls.
edca72f5SPeiming Liuclass SparseCallConverter : public OpConversionPattern<func::CallOp> {
edca72f5SPeiming Liupublic:
edca72f5SPeiming Liu  // The default CallOp converter can not handle 1:N type conversion.
edca72f5SPeiming Liu  using OpConversionPattern::OpConversionPattern;
edca72f5SPeiming Liu  LogicalResult
*9df63b26SMatthias Springer  matchAndRewrite(func::CallOp op, OneToNOpAdaptor adaptor,
edca72f5SPeiming Liu                  ConversionPatternRewriter &rewriter) const override {
edca72f5SPeiming Liu    Location loc = op.getLoc();
edca72f5SPeiming Liu    // In case of:
edca72f5SPeiming Liu    //  sparse_tensor, f, sparse_tensor = call @foo(...)
edca72f5SPeiming Liu    // ==>
edca72f5SPeiming Liu    //  memref..., f, memref = call @foo(...) replace with
edca72f5SPeiming Liu    //  cast(memref...)->sparse_tensor, f, cast(memref...)->sparse_tensor
0e1708ffSAart Bik    SmallVector<Type> finalRetTy;
edca72f5SPeiming Liu    if (failed(typeConverter->convertTypes(op.getResultTypes(), finalRetTy)))
edca72f5SPeiming Liu      return failure();
edca72f5SPeiming Liu
be556ee1SYinying Li    // (1) Generates new call with flattened return value.
*9df63b26SMatthias Springer    auto newCall = rewriter.create<func::CallOp>(
*9df63b26SMatthias Springer        loc, op.getCallee(), finalRetTy, flattenValues(adaptor.getOperands()));
aed43562SMatthias Springer    // (2) Gather sparse tensor returns.
aed43562SMatthias Springer    SmallVector<SmallVector<Value>> packedResultVals;
be556ee1SYinying Li    // Tracks the offset of current return value (of the original call)
edca72f5SPeiming Liu    // relative to the new call (after sparse tensor flattening);
edca72f5SPeiming Liu    unsigned retOffset = 0;
edca72f5SPeiming Liu    // Temporal buffer to hold the flattened list of type for
edca72f5SPeiming Liu    // a sparse tensor.
0e1708ffSAart Bik    SmallVector<Type> sparseFlat;
edca72f5SPeiming Liu    for (auto ret : op.getResults()) {
edca72f5SPeiming Liu      assert(retOffset < newCall.getNumResults());
edca72f5SPeiming Liu      auto retType = ret.getType();
edca72f5SPeiming Liu      if (failed(typeConverter->convertType(retType, sparseFlat)))
edca72f5SPeiming Liu        llvm_unreachable("Failed to convert type in sparse tensor codegen");
edca72f5SPeiming Liu
edca72f5SPeiming Liu      // Converted types can not be empty when the type conversion succeed.
edca72f5SPeiming Liu      assert(!sparseFlat.empty());
edca72f5SPeiming Liu      if (sparseFlat.size() > 1) {
edca72f5SPeiming Liu        auto flatSize = sparseFlat.size();
aed43562SMatthias Springer        packedResultVals.emplace_back();
aed43562SMatthias Springer        llvm::append_range(packedResultVals.back(),
aed43562SMatthias Springer                           newCall.getResults().slice(retOffset, flatSize));
edca72f5SPeiming Liu        retOffset += flatSize;
edca72f5SPeiming Liu      } else {
edca72f5SPeiming Liu        // If this is an 1:1 conversion, no need for casting.
aed43562SMatthias Springer        packedResultVals.emplace_back();
aed43562SMatthias Springer        packedResultVals.back().push_back(newCall.getResult(retOffset));
edca72f5SPeiming Liu        retOffset++;
edca72f5SPeiming Liu      }
edca72f5SPeiming Liu      sparseFlat.clear();
edca72f5SPeiming Liu    }
edca72f5SPeiming Liu
aed43562SMatthias Springer    assert(packedResultVals.size() == op.getNumResults());
aed43562SMatthias Springer    rewriter.replaceOpWithMultiple(
aed43562SMatthias Springer        op, llvm::to_vector_of<ValueRange>(packedResultVals));
86b22d31SAart Bik    return success();
86b22d31SAart Bik  }
86b22d31SAart Bik};
86b22d31SAart Bik
c780352dSPeiming Liu/// Sparse codegen rule for level accesses.
c780352dSPeiming Liuclass SparseLvlOpConverter : public OpConversionPattern<LvlOp> {
1be09496SAart Bikpublic:
1be09496SAart Bik  using OpConversionPattern::OpConversionPattern;
1be09496SAart Bik  LogicalResult
*9df63b26SMatthias Springer  matchAndRewrite(LvlOp op, OneToNOpAdaptor adaptor,
1be09496SAart Bik                  ConversionPatternRewriter &rewriter) const override {
c780352dSPeiming Liu    std::optional<int64_t> lvl = op.getConstantLvlIndex();
204234a6SMatthias Springer    RankedTensorType srcType = op.getSource().getType();
204234a6SMatthias Springer    if (!lvl || !getSparseTensorEncoding(srcType))
1be09496SAart Bik      return failure();
191c43f6SPeiming Liu
204234a6SMatthias Springer    auto desc = getDescriptorFromTensorTuple(adaptor.getSource(), srcType);
c780352dSPeiming Liu    auto sz = desc.getLvlSize(rewriter, op.getLoc(), *lvl);
191c43f6SPeiming Liu
83a50839SPeiming Liu    rewriter.replaceOp(op, sz);
3ae98fd2SAart Bik    return success();
3ae98fd2SAart Bik  }
3ae98fd2SAart Bik};
3ae98fd2SAart Bik
dda3dc5eSPeiming Liu// TODO: use a new SortCOO operation here instead of reusing convert op.
f248d0b2SPeiming Liustruct SparseReorderCOOConverter : public OpConversionPattern<ReorderCOOOp> {
dda3dc5eSPeiming Liu  using OpConversionPattern::OpConversionPattern;
dda3dc5eSPeiming Liu  LogicalResult
*9df63b26SMatthias Springer  matchAndRewrite(ReorderCOOOp op, OneToNOpAdaptor adaptor,
dda3dc5eSPeiming Liu                  ConversionPatternRewriter &rewriter) const override {
dda3dc5eSPeiming Liu    Location loc = op.getLoc();
dda3dc5eSPeiming Liu    MLIRContext *ctx = op.getContext();
dda3dc5eSPeiming Liu
f248d0b2SPeiming Liu    SparseTensorType srcStt = getSparseTensorType(op.getInputCoo());
f248d0b2SPeiming Liu    SparseTensorType dstStt = getSparseTensorType(op.getResultCoo());
dda3dc5eSPeiming Liu
f248d0b2SPeiming Liu    // Should have been verified.
dda3dc5eSPeiming Liu    assert(dstStt.isAllOrdered() && !srcStt.isAllOrdered() &&
5b729503SAart Bik           dstStt.isCOOType() && srcStt.isCOOType());
dda3dc5eSPeiming Liu    assert(dstStt.hasSameDimToLvl(srcStt));
dda3dc5eSPeiming Liu
dda3dc5eSPeiming Liu    // We don't need a mutable descriptor here as we perform sorting in-place.
204234a6SMatthias Springer    auto desc = getDescriptorFromTensorTuple(adaptor.getInputCoo(),
204234a6SMatthias Springer                                             op.getInputCoo().getType());
204234a6SMatthias Springer    auto nnz = desc.getValMemSize(rewriter, op.getLoc());
dda3dc5eSPeiming Liu    auto crd = desc.getAOSMemRef();
dda3dc5eSPeiming Liu    auto val = desc.getValMemRef();
dda3dc5eSPeiming Liu
dda3dc5eSPeiming Liu    // Otherwise we need another data shuffle and a non-identity map.
dda3dc5eSPeiming Liu    assert(dstStt.hasSameDimToLvl(srcStt));
837a26f2SPeiming Liu    (void)dstStt; // to silence warning when assertion is disabled
837a26f2SPeiming Liu
dda3dc5eSPeiming Liu    auto id = AffineMap::getMultiDimIdentityMap(srcStt.getLvlRank(), ctx);
dda3dc5eSPeiming Liu
dda3dc5eSPeiming Liu    rewriter.create<SortOp>(loc, nnz, crd, ValueRange{val}, id,
f248d0b2SPeiming Liu                            rewriter.getIndexAttr(0), op.getAlgorithm());
dda3dc5eSPeiming Liu
dda3dc5eSPeiming Liu    // Since we do in-place sorting, the destinate tensor will have the same set
dda3dc5eSPeiming Liu    // of memrefs as the source tensor.
*9df63b26SMatthias Springer    rewriter.replaceOpWithMultiple(op, {adaptor.getInputCoo()});
dda3dc5eSPeiming Liu    return success();
dda3dc5eSPeiming Liu  }
dda3dc5eSPeiming Liu};
dda3dc5eSPeiming Liu
6db397a8SPeiming Liutemplate <typename Op, StorageSpecifierKind kind>
6db397a8SPeiming Liuclass SparseSliceGetterOpConverter : public OpConversionPattern<Op> {
6db397a8SPeiming Liupublic:
6db397a8SPeiming Liu  using OpConversionPattern<Op>::OpConversionPattern;
*9df63b26SMatthias Springer  using typename OpConversionPattern<Op>::OneToNOpAdaptor;
*9df63b26SMatthias Springer
6db397a8SPeiming Liu  LogicalResult
*9df63b26SMatthias Springer  matchAndRewrite(Op op, OneToNOpAdaptor adaptor,
6db397a8SPeiming Liu                  ConversionPatternRewriter &rewriter) const override {
6db397a8SPeiming Liu    // Simply lowers to specifer.get <field> operation.
204234a6SMatthias Springer    auto desc = getDescriptorFromTensorTuple(adaptor.getSlice(),
204234a6SMatthias Springer                                             op.getSlice().getType());
6db397a8SPeiming Liu    auto v = desc.getSpecifierField(rewriter, op.getLoc(), kind,
6db397a8SPeiming Liu                                    op.getDim().getZExtValue());
6db397a8SPeiming Liu
6db397a8SPeiming Liu    rewriter.replaceOp(op, v);
6db397a8SPeiming Liu    return success();
6db397a8SPeiming Liu  }
6db397a8SPeiming Liu};
6db397a8SPeiming Liu
f27b806dSAart Bik/// Sparse codegen rule for trivial tensor casts.
f27b806dSAart Bikclass SparseCastConverter : public OpConversionPattern<tensor::CastOp> {
f27b806dSAart Bikpublic:
f27b806dSAart Bik  using OpConversionPattern::OpConversionPattern;
f27b806dSAart Bik  LogicalResult
*9df63b26SMatthias Springer  matchAndRewrite(tensor::CastOp op, OneToNOpAdaptor adaptor,
f27b806dSAart Bik                  ConversionPatternRewriter &rewriter) const override {
f27b806dSAart Bik    // Only rewrite identically annotated source/dest.
f27b806dSAart Bik    auto encDst = getSparseTensorEncoding(op.getType());
f27b806dSAart Bik    auto encSrc = getSparseTensorEncoding(op.getSource().getType());
f27b806dSAart Bik    if (!encDst || encDst != encSrc)
f27b806dSAart Bik      return failure();
*9df63b26SMatthias Springer    rewriter.replaceOpWithMultiple(op, {adaptor.getSource()});
f27b806dSAart Bik    return success();
f27b806dSAart Bik  }
f27b806dSAart Bik};
f27b806dSAart Bik
ef222988SPeiming Liuclass SparseReMapConverter : public OpConversionPattern<ReinterpretMapOp> {
ef222988SPeiming Liupublic:
ef222988SPeiming Liu  using OpConversionPattern::OpConversionPattern;
ef222988SPeiming Liu  LogicalResult
*9df63b26SMatthias Springer  matchAndRewrite(ReinterpretMapOp op, OneToNOpAdaptor adaptor,
ef222988SPeiming Liu                  ConversionPatternRewriter &rewriter) const override {
ef222988SPeiming Liu    // Simply fold the operation.
*9df63b26SMatthias Springer    rewriter.replaceOpWithMultiple(op, {adaptor.getSource()});
ef222988SPeiming Liu    return success();
ef222988SPeiming Liu  }
ef222988SPeiming Liu};
ef222988SPeiming Liu
be556ee1SYinying Li/// Sparse codegen rule for the alloc operator.
0c7abd39SAart Bikclass SparseTensorAllocConverter
0c7abd39SAart Bik    : public OpConversionPattern<bufferization::AllocTensorOp> {
0c7abd39SAart Bikpublic:
0c7abd39SAart Bik  using OpConversionPattern::OpConversionPattern;
206fad0eSMatthias Springer  SparseTensorAllocConverter(const TypeConverter &typeConverter,
206fad0eSMatthias Springer                             MLIRContext *context, bool enableInit)
7276b643Sbixia1      : OpConversionPattern(typeConverter, context),
7276b643Sbixia1        enableBufferInitialization(enableInit) {}
988733c6SPeiming Liu
0c7abd39SAart Bik  LogicalResult
*9df63b26SMatthias Springer  matchAndRewrite(bufferization::AllocTensorOp op, OneToNOpAdaptor adaptor,
0c7abd39SAart Bik                  ConversionPatternRewriter &rewriter) const override {
f708a549Swren romano    const auto resType = getSparseTensorType(op);
f708a549Swren romano    if (!resType.hasEncoding())
0c7abd39SAart Bik      return failure();
83cf0dc9SAart Bik
2cc4b3d0SPeiming Liu    Location loc = op.getLoc();
83cf0dc9SAart Bik    // Deal with copy.
7b86f7c5SPeiming Liu    if (op.getCopy()) {
204234a6SMatthias Springer      auto desc = getDescriptorFromTensorTuple(
204234a6SMatthias Springer          adaptor.getCopy(), cast<RankedTensorType>(op.getCopy().getType()));
7b86f7c5SPeiming Liu      SmallVector<Value> fields;
7b86f7c5SPeiming Liu      fields.reserve(desc.getNumFields());
7b86f7c5SPeiming Liu      // Memcpy on memref fields.
7b86f7c5SPeiming Liu      for (auto field : desc.getMemRefFields()) {
5550c821STres Popp        auto memrefTp = cast<MemRefType>(field.getType());
7b86f7c5SPeiming Liu        auto size = rewriter.create<memref::DimOp>(loc, field, 0);
7b86f7c5SPeiming Liu        auto copied =
7b86f7c5SPeiming Liu            rewriter.create<memref::AllocOp>(loc, memrefTp, ValueRange{size});
7b86f7c5SPeiming Liu        rewriter.create<memref::CopyOp>(loc, field, copied);
7b86f7c5SPeiming Liu        fields.push_back(copied);
7b86f7c5SPeiming Liu      }
7b86f7c5SPeiming Liu      // Reuses specifier.
7b86f7c5SPeiming Liu      fields.push_back(desc.getSpecifier());
7b86f7c5SPeiming Liu      assert(fields.size() == desc.getNumFields());
aed43562SMatthias Springer      rewriter.replaceOpWithMultiple(op, {fields});
7b86f7c5SPeiming Liu      return success();
7b86f7c5SPeiming Liu    }
7b86f7c5SPeiming Liu
2cc4b3d0SPeiming Liu    if (!resType.isIdentity()) {
2cc4b3d0SPeiming Liu      return rewriter.notifyMatchFailure(
2cc4b3d0SPeiming Liu          op, "try run --sparse-reinterpret-map before codegen");
2cc4b3d0SPeiming Liu    }
2cc4b3d0SPeiming Liu    // Level size equals to dimension size since lvl2dim map is an identity map.
83cf0dc9SAart Bik    SmallVector<Value> lvlSizesValues;
*9df63b26SMatthias Springer    createDimSizes(rewriter, loc, resType,
*9df63b26SMatthias Springer                   flattenValues(adaptor.getDynamicSizes()),
2cc4b3d0SPeiming Liu                   /*dimSizesValues=*/lvlSizesValues);
83cf0dc9SAart Bik
160d483bSAart Bik    // Construct allocation for each field.
160d483bSAart Bik    Value sizeHint = op.getSizeHint();
0e1708ffSAart Bik    SmallVector<Value> fields;
83cf0dc9SAart Bik    createAllocFields(rewriter, loc, resType, enableBufferInitialization,
83cf0dc9SAart Bik                      sizeHint, lvlSizesValues, fields);
160d483bSAart Bik
d22df0ebSAart Bik    // Replace operation with resulting memrefs.
aed43562SMatthias Springer    rewriter.replaceOpWithMultiple(op, {fields});
0c7abd39SAart Bik    return success();
0c7abd39SAart Bik  }
7276b643Sbixia1
7276b643Sbixia1private:
7276b643Sbixia1  bool enableBufferInitialization;
0c7abd39SAart Bik};
0c7abd39SAart Bik
3e4a8c2cSAart Bik/// Sparse codegen rule for the empty tensor operator.
3e4a8c2cSAart Bikclass SparseTensorEmptyConverter : public OpConversionPattern<tensor::EmptyOp> {
3e4a8c2cSAart Bikpublic:
3e4a8c2cSAart Bik  using OpConversionPattern::OpConversionPattern;
206fad0eSMatthias Springer  SparseTensorEmptyConverter(const TypeConverter &typeConverter,
206fad0eSMatthias Springer                             MLIRContext *context, bool enableInit)
3e4a8c2cSAart Bik      : OpConversionPattern(typeConverter, context),
3e4a8c2cSAart Bik        enableBufferInitialization(enableInit) {}
3e4a8c2cSAart Bik
3e4a8c2cSAart Bik  LogicalResult
3e4a8c2cSAart Bik  matchAndRewrite(tensor::EmptyOp op, OpAdaptor adaptor,
3e4a8c2cSAart Bik                  ConversionPatternRewriter &rewriter) const override {
3e4a8c2cSAart Bik    const auto resType = getSparseTensorType(op);
3e4a8c2cSAart Bik    if (!resType.hasEncoding())
3e4a8c2cSAart Bik      return failure();
2cc4b3d0SPeiming Liu
2cc4b3d0SPeiming Liu    if (!resType.isIdentity()) {
2cc4b3d0SPeiming Liu      return rewriter.notifyMatchFailure(
2cc4b3d0SPeiming Liu          op, "try run --sparse-reinterpret-map before codegen");
2cc4b3d0SPeiming Liu    }
2cc4b3d0SPeiming Liu
83cf0dc9SAart Bik    Location loc = op.getLoc();
2cc4b3d0SPeiming Liu    // Level size equals to dimension size since lvl2dim map is an identity map.
83cf0dc9SAart Bik    SmallVector<Value> lvlSizesValues;
83cf0dc9SAart Bik    createDimSizes(rewriter, loc, resType, adaptor.getDynamicSizes(),
2cc4b3d0SPeiming Liu                   /*dimSizesValues=*/lvlSizesValues);
3e4a8c2cSAart Bik    // Construct allocation for each field.
160d483bSAart Bik    Value sizeHint; // none
3e4a8c2cSAart Bik    SmallVector<Value> fields;
83cf0dc9SAart Bik    createAllocFields(rewriter, loc, resType, enableBufferInitialization,
83cf0dc9SAart Bik                      sizeHint, lvlSizesValues, fields);
160d483bSAart Bik
3e4a8c2cSAart Bik    // Replace operation with resulting memrefs.
aed43562SMatthias Springer    rewriter.replaceOpWithMultiple(op, {fields});
3e4a8c2cSAart Bik    return success();
3e4a8c2cSAart Bik  }
3e4a8c2cSAart Bik
3e4a8c2cSAart Bikprivate:
3e4a8c2cSAart Bik  bool enableBufferInitialization;
3e4a8c2cSAart Bik};
3e4a8c2cSAart Bik
2ddfacd9SAart Bik/// Sparse codegen rule for the dealloc operator.
2ddfacd9SAart Bikclass SparseTensorDeallocConverter
2ddfacd9SAart Bik    : public OpConversionPattern<bufferization::DeallocTensorOp> {
2ddfacd9SAart Bikpublic:
2ddfacd9SAart Bik  using OpConversionPattern::OpConversionPattern;
206fad0eSMatthias Springer  SparseTensorDeallocConverter(const TypeConverter &typeConverter,
c44d307cSPeiming Liu                               MLIRContext *context, bool createDeallocs)
c44d307cSPeiming Liu      : OpConversionPattern(typeConverter, context),
c44d307cSPeiming Liu        createDeallocs(createDeallocs) {}
c44d307cSPeiming Liu
2ddfacd9SAart Bik  LogicalResult
*9df63b26SMatthias Springer  matchAndRewrite(bufferization::DeallocTensorOp op, OneToNOpAdaptor adaptor,
2ddfacd9SAart Bik                  ConversionPatternRewriter &rewriter) const override {
2ddfacd9SAart Bik    auto enc = getSparseTensorEncoding(op.getTensor().getType());
2ddfacd9SAart Bik    if (!enc)
2ddfacd9SAart Bik      return failure();
edca72f5SPeiming Liu
c44d307cSPeiming Liu    // If user requests not to deallocate sparse tensors, simply erase the
c44d307cSPeiming Liu    // operation.
c44d307cSPeiming Liu    if (createDeallocs) {
edca72f5SPeiming Liu      // Replace the sparse tensor deallocation with field deallocations.
edca72f5SPeiming Liu      Location loc = op.getLoc();
204234a6SMatthias Springer      auto desc = getDescriptorFromTensorTuple(
204234a6SMatthias Springer          adaptor.getTensor(),
204234a6SMatthias Springer          cast<RankedTensorType>(op.getTensor().getType()));
988733c6SPeiming Liu      for (auto input : desc.getMemRefFields())
edca72f5SPeiming Liu        // Deallocate every buffer used to store the sparse tensor handler.
edca72f5SPeiming Liu        rewriter.create<memref::DeallocOp>(loc, input);
c44d307cSPeiming Liu    }
2ddfacd9SAart Bik    rewriter.eraseOp(op);
2ddfacd9SAart Bik    return success();
2ddfacd9SAart Bik  }
c44d307cSPeiming Liu
c44d307cSPeiming Liuprivate:
fd2211d8SPeiming Liu  const bool createDeallocs;
2ddfacd9SAart Bik};
2ddfacd9SAart Bik
0c7abd39SAart Bik/// Sparse codegen rule for tensor rematerialization.
0c7abd39SAart Bikclass SparseTensorLoadConverter : public OpConversionPattern<LoadOp> {
0c7abd39SAart Bikpublic:
0c7abd39SAart Bik  using OpConversionPattern::OpConversionPattern;
0c7abd39SAart Bik  LogicalResult
*9df63b26SMatthias Springer  matchAndRewrite(LoadOp op, OneToNOpAdaptor adaptor,
0c7abd39SAart Bik                  ConversionPatternRewriter &rewriter) const override {
191c43f6SPeiming Liu    // Prepare descriptor.
204234a6SMatthias Springer    auto desc = getDescriptorFromTensorTuple(adaptor.getTensor(),
204234a6SMatthias Springer                                             op.getTensor().getType());
9f596a7cSAart Bik    // Generate optional insertion finalization code.
9f596a7cSAart Bik    if (op.getHasInserts())
191c43f6SPeiming Liu      genEndInsert(rewriter, op.getLoc(), desc);
d22df0ebSAart Bik    // Replace operation with resulting memrefs.
aed43562SMatthias Springer    rewriter.replaceOpWithMultiple(op, {desc.getFields()});
0c7abd39SAart Bik    return success();
0c7abd39SAart Bik  }
0c7abd39SAart Bik};
0c7abd39SAart Bik
8a583bd5Sbixia1/// Sparse codegen rule for the expand op.
8a583bd5Sbixia1class SparseExpandConverter : public OpConversionPattern<ExpandOp> {
8a583bd5Sbixia1public:
8a583bd5Sbixia1  using OpConversionPattern::OpConversionPattern;
8a583bd5Sbixia1  LogicalResult
*9df63b26SMatthias Springer  matchAndRewrite(ExpandOp op, OneToNOpAdaptor adaptor,
8a583bd5Sbixia1                  ConversionPatternRewriter &rewriter) const override {
191c43f6SPeiming Liu    if (!getSparseTensorEncoding(op.getTensor().getType()))
191c43f6SPeiming Liu      return failure();
8a583bd5Sbixia1    Location loc = op->getLoc();
204234a6SMatthias Springer    auto desc = getDescriptorFromTensorTuple(adaptor.getTensor(),
204234a6SMatthias Springer                                             op.getTensor().getType());
f708a549Swren romano    const auto srcType = getSparseTensorType(op.getTensor());
8a583bd5Sbixia1    Type eltType = srcType.getElementType();
8a583bd5Sbixia1    Type boolType = rewriter.getIntegerType(1);
8a583bd5Sbixia1    Type idxType = rewriter.getIndexType();
8a583bd5Sbixia1    // All initialization should be done on entry of the loop nest.
8a583bd5Sbixia1    rewriter.setInsertionPointAfter(op.getTensor().getDefiningOp());
c780352dSPeiming Liu
8a583bd5Sbixia1    // Determine the size for access expansion (always the innermost stored
c780352dSPeiming Liu    // level size).
c780352dSPeiming Liu    const auto sz = desc.getLvlSize(rewriter, loc, srcType.getLvlRank() - 1);
8a583bd5Sbixia1    // Generate a memref for `sz` elements of type `t`.
f708a549Swren romano    const auto genAlloc = [&](Type t) {
f708a549Swren romano      const auto memTp = MemRefType::get({ShapedType::kDynamic}, t);
83a50839SPeiming Liu      return rewriter.create<memref::AllocOp>(loc, memTp, ValueRange{sz});
8a583bd5Sbixia1    };
3986c869SAart Bik    // Allocate temporary buffers for values/filled-switch and added.
8a583bd5Sbixia1    // We do not use stack buffers for this, since the expanded size may
8a583bd5Sbixia1    // be rather large (as it envelops a single expanded dense dimension).
8a583bd5Sbixia1    Value values = genAlloc(eltType);
8a583bd5Sbixia1    Value filled = genAlloc(boolType);
3986c869SAart Bik    Value added = genAlloc(idxType);
8a583bd5Sbixia1    Value zero = constantZero(rewriter, loc, idxType);
8a583bd5Sbixia1    // Reset the values/filled-switch to all-zero/false. Note that this
8a583bd5Sbixia1    // introduces an O(N) operation into the computation, but this reset
8a583bd5Sbixia1    // operation is amortized over the innermost loops for the access
8a583bd5Sbixia1    // pattern expansion. As noted in the operation doc, we would like
8a583bd5Sbixia1    // to amortize this setup cost even between kernels.
8a583bd5Sbixia1    rewriter.create<linalg::FillOp>(
8a583bd5Sbixia1        loc, ValueRange{constantZero(rewriter, loc, eltType)},
8a583bd5Sbixia1        ValueRange{values});
8a583bd5Sbixia1    rewriter.create<linalg::FillOp>(
8a583bd5Sbixia1        loc, ValueRange{constantZero(rewriter, loc, boolType)},
8a583bd5Sbixia1        ValueRange{filled});
84cd51bbSwren romano    // Replace expansion op with these buffers and initial coordinate.
8a583bd5Sbixia1    assert(op.getNumResults() == 4);
3986c869SAart Bik    rewriter.replaceOp(op, {values, filled, added, zero});
3986c869SAart Bik    return success();
3986c869SAart Bik  }
3986c869SAart Bik};
3986c869SAart Bik
3986c869SAart Bik/// Sparse codegen rule for the compress operator.
3986c869SAart Bikclass SparseCompressConverter : public OpConversionPattern<CompressOp> {
3986c869SAart Bikpublic:
3986c869SAart Bik  using OpConversionPattern::OpConversionPattern;
3986c869SAart Bik  LogicalResult
*9df63b26SMatthias Springer  matchAndRewrite(CompressOp op, OneToNOpAdaptor adaptor,
3986c869SAart Bik                  ConversionPatternRewriter &rewriter) const override {
3986c869SAart Bik    Location loc = op->getLoc();
191c43f6SPeiming Liu    SmallVector<Value> fields;
204234a6SMatthias Springer    auto desc = getMutDescriptorFromTensorTuple(adaptor.getTensor(), fields,
204234a6SMatthias Springer                                                op.getTensor().getType());
*9df63b26SMatthias Springer    Value values = getSingleValue(adaptor.getValues());
*9df63b26SMatthias Springer    Value filled = getSingleValue(adaptor.getFilled());
*9df63b26SMatthias Springer    Value added = getSingleValue(adaptor.getAdded());
*9df63b26SMatthias Springer    Value count = getSingleValue(adaptor.getCount());
f708a549Swren romano    const SparseTensorType dstType(desc.getRankedTensorType());
191c43f6SPeiming Liu    Type eltType = dstType.getElementType();
ad469385SPeiming Liu
84cd51bbSwren romano    // If the innermost level is ordered, we need to sort the coordinates
4d068619SAart Bik    // in the "added" array prior to applying the compression.
f708a549Swren romano    if (dstType.isOrderedLvl(dstType.getLvlRank() - 1))
0083f833SPeiming Liu      rewriter.create<SortOp>(
bfa3bc43SPeiming Liu          loc, count, added, ValueRange{}, rewriter.getMultiDimIdentityMap(1),
bfa3bc43SPeiming Liu          rewriter.getIndexAttr(0), SparseTensorSortKind::HybridQuickSort);
3986c869SAart Bik    // While performing the insertions, we also need to reset the elements
3986c869SAart Bik    // of the values/filled-switch by only iterating over the set elements,
3986c869SAart Bik    // to ensure that the runtime complexity remains proportional to the
3986c869SAart Bik    // sparsity of the expanded access pattern.
3986c869SAart Bik    //
3986c869SAart Bik    // Generate
d22df0ebSAart Bik    //    out_memrefs = for (i = 0; i < count; i++)(in_memrefs) {
84cd51bbSwren romano    //      crd = added[i];
84cd51bbSwren romano    //      value = values[crd];
84cd51bbSwren romano    //      insert({lvlCoords, crd}, value);
84cd51bbSwren romano    //      new_memrefs = insert(in_memrefs, {lvlCoords, crd}, value);
84cd51bbSwren romano    //      values[crd] = 0;
84cd51bbSwren romano    //      filled[crd] = false;
d22df0ebSAart Bik    //      yield new_memrefs
3986c869SAart Bik    //    }
191c43f6SPeiming Liu    scf::ForOp loop = createFor(rewriter, loc, count, desc.getFields());
d22df0ebSAart Bik    Value i = loop.getInductionVar();
ad469385SPeiming Liu
84cd51bbSwren romano    Value crd = genLoad(rewriter, loc, added, i);
84cd51bbSwren romano    Value value = genLoad(rewriter, loc, values, crd);
ad469385SPeiming Liu    SmallVector<Value> params(desc.getFields().begin(), desc.getFields().end());
ad469385SPeiming Liu    SmallVector<Type> flatSpTensorTps = llvm::to_vector(
ad469385SPeiming Liu        llvm::map_range(desc.getFields(), [](Value v) { return v.getType(); }));
*9df63b26SMatthias Springer    SmallVector<Value> flatLvlCoords = flattenValues(adaptor.getLvlCoords());
*9df63b26SMatthias Springer    params.append(flatLvlCoords.begin(), flatLvlCoords.end());
ad469385SPeiming Liu    params.push_back(crd);
ad469385SPeiming Liu    params.push_back(value);
ad469385SPeiming Liu    SparseInsertGenerator insertGen(op.getTensor().getType(), flatSpTensorTps,
ad469385SPeiming Liu                                    params, /*genCall=*/true);
ad469385SPeiming Liu    SmallVector<Value> insertRet = insertGen.genCallOrInline(rewriter, loc);
84cd51bbSwren romano    genStore(rewriter, loc, constantZero(rewriter, loc, eltType), values, crd);
84cd51bbSwren romano    genStore(rewriter, loc, constantI1(rewriter, loc, false), filled, crd);
ad469385SPeiming Liu    rewriter.create<scf::YieldOp>(loc, insertRet);
ad469385SPeiming Liu
129177eaSAart Bik    rewriter.setInsertionPointAfter(loop);
3986c869SAart Bik    // Deallocate the buffers on exit of the full loop nest.
5661647eSAart Bik    Operation *parent = getTop(op);
3986c869SAart Bik    rewriter.setInsertionPointAfter(parent);
3986c869SAart Bik    rewriter.create<memref::DeallocOp>(loc, values);
3986c869SAart Bik    rewriter.create<memref::DeallocOp>(loc, filled);
3986c869SAart Bik    rewriter.create<memref::DeallocOp>(loc, added);
d22df0ebSAart Bik    // Replace operation with resulting memrefs.
aed43562SMatthias Springer    rewriter.replaceOpWithMultiple(op, {loop->getResults()});
9f596a7cSAart Bik    return success();
9f596a7cSAart Bik  }
9f596a7cSAart Bik};
9f596a7cSAart Bik
9f596a7cSAart Bik/// Sparse codegen rule for the insert operator.
94e27c26SPeiming Liuclass SparseInsertConverter : public OpConversionPattern<tensor::InsertOp> {
9f596a7cSAart Bikpublic:
9f596a7cSAart Bik  using OpConversionPattern::OpConversionPattern;
9f596a7cSAart Bik  LogicalResult
*9df63b26SMatthias Springer  matchAndRewrite(tensor::InsertOp op, OneToNOpAdaptor adaptor,
9f596a7cSAart Bik                  ConversionPatternRewriter &rewriter) const override {
*9df63b26SMatthias Springer    auto stt = getSparseTensorType(op.getDest());
94e27c26SPeiming Liu    if (!stt.hasEncoding())
94e27c26SPeiming Liu      return failure();
94e27c26SPeiming Liu    assert(stt.isIdentity() && "Run reinterpret-map before conversion.");
94e27c26SPeiming Liu
ad469385SPeiming Liu    Location loc = op.getLoc();
204234a6SMatthias Springer    auto desc =
204234a6SMatthias Springer        getDescriptorFromTensorTuple(adaptor.getDest(), op.getDest().getType());
ad469385SPeiming Liu    TypeRange flatSpTensorTps = desc.getFields().getTypes();
ad469385SPeiming Liu    SmallVector<Value> params = llvm::to_vector(desc.getFields());
*9df63b26SMatthias Springer    SmallVector<Value> flatIndices = flattenValues(adaptor.getIndices());
*9df63b26SMatthias Springer    params.append(flatIndices.begin(), flatIndices.end());
*9df63b26SMatthias Springer    params.push_back(getSingleValue(adaptor.getScalar()));
94e27c26SPeiming Liu    SparseInsertGenerator insertGen(op.getDest().getType(), flatSpTensorTps,
ad469385SPeiming Liu                                    params, /*genCall=*/true);
ad469385SPeiming Liu    SmallVector<Value> ret = insertGen.genCallOrInline(rewriter, loc);
d22df0ebSAart Bik    // Replace operation with resulting memrefs.
aed43562SMatthias Springer    rewriter.replaceOpWithMultiple(op, {ret});
8a583bd5Sbixia1    return success();
8a583bd5Sbixia1  }
8a583bd5Sbixia1};
8a583bd5Sbixia1
84cd51bbSwren romano/// Sparse codegen rule for position accesses.
84cd51bbSwren romanoclass SparseToPositionsConverter : public OpConversionPattern<ToPositionsOp> {
6607fdf7SAart Bikpublic:
84cd51bbSwren romano  using OpAdaptor = typename ToPositionsOp::Adaptor;
84cd51bbSwren romano  using OpConversionPattern<ToPositionsOp>::OpConversionPattern;
6607fdf7SAart Bik  LogicalResult
*9df63b26SMatthias Springer  matchAndRewrite(ToPositionsOp op, OneToNOpAdaptor adaptor,
6607fdf7SAart Bik                  ConversionPatternRewriter &rewriter) const override {
84cd51bbSwren romano    // Replace the requested position access with corresponding field.
5c511655SAart Bik    // The view is restricted to the actual size to ensure clients
5c511655SAart Bik    // of this operation truly observe size, not capacity!
5c511655SAart Bik    Location loc = op.getLoc();
5c511655SAart Bik    Level lvl = op.getLevel();
204234a6SMatthias Springer    auto desc = getDescriptorFromTensorTuple(adaptor.getTensor(),
204234a6SMatthias Springer                                             op.getTensor().getType());
5c511655SAart Bik    auto mem = desc.getPosMemRef(lvl);
5c511655SAart Bik    auto size = desc.getPosMemSize(rewriter, loc, lvl);
5c511655SAart Bik    rewriter.replaceOp(op, genSliceToSize(rewriter, loc, mem, size));
6607fdf7SAart Bik    return success();
6607fdf7SAart Bik  }
6607fdf7SAart Bik};
6607fdf7SAart Bik
84cd51bbSwren romano/// Sparse codegen rule for accessing the coordinates arrays.
84cd51bbSwren romanoclass SparseToCoordinatesConverter
84cd51bbSwren romano    : public OpConversionPattern<ToCoordinatesOp> {
edca72f5SPeiming Liupublic:
84cd51bbSwren romano  using OpAdaptor = typename ToCoordinatesOp::Adaptor;
84cd51bbSwren romano  using OpConversionPattern<ToCoordinatesOp>::OpConversionPattern;
90aa4362Sbixia1  LogicalResult
*9df63b26SMatthias Springer  matchAndRewrite(ToCoordinatesOp op, OneToNOpAdaptor adaptor,
90aa4362Sbixia1                  ConversionPatternRewriter &rewriter) const override {
84cd51bbSwren romano    // Replace the requested coordinates access with corresponding field.
5c511655SAart Bik    // The view is restricted to the actual size to ensure clients
5c511655SAart Bik    // of this operation truly observe size, not capacity!
5c511655SAart Bik    Location loc = op.getLoc();
5c511655SAart Bik    Level lvl = op.getLevel();
204234a6SMatthias Springer    auto desc = getDescriptorFromTensorTuple(adaptor.getTensor(),
204234a6SMatthias Springer                                             op.getTensor().getType());
5c511655SAart Bik    auto mem = desc.getCrdMemRefOrView(rewriter, loc, lvl);
5c511655SAart Bik    if (lvl < getSparseTensorType(op.getTensor()).getAoSCOOStart()) {
5c511655SAart Bik      auto size = desc.getCrdMemSize(rewriter, loc, lvl);
5c511655SAart Bik      mem = genSliceToSize(rewriter, loc, mem, size);
5c511655SAart Bik    }
5c511655SAart Bik    rewriter.replaceOp(op, mem);
90aa4362Sbixia1    return success();
edca72f5SPeiming Liu  }
edca72f5SPeiming Liu};
edca72f5SPeiming Liu
84cd51bbSwren romano/// Sparse codegen rule for accessing the linear coordinates buffer.
84cd51bbSwren romanoclass SparseToCoordinatesBufferConverter
84cd51bbSwren romano    : public OpConversionPattern<ToCoordinatesBufferOp> {
81e3079dSbixia1public:
84cd51bbSwren romano  using OpAdaptor = typename ToCoordinatesBufferOp::Adaptor;
84cd51bbSwren romano  using OpConversionPattern<ToCoordinatesBufferOp>::OpConversionPattern;
81e3079dSbixia1  LogicalResult
*9df63b26SMatthias Springer  matchAndRewrite(ToCoordinatesBufferOp op, OneToNOpAdaptor adaptor,
81e3079dSbixia1                  ConversionPatternRewriter &rewriter) const override {
84cd51bbSwren romano    // Replace the requested coordinates access with corresponding field.
5c511655SAart Bik    // The view is restricted to the actual size to ensure clients
5c511655SAart Bik    // of this operation truly observe size, not capacity!
5c511655SAart Bik    Location loc = op.getLoc();
5c511655SAart Bik    Level lvl = getSparseTensorType(op.getTensor()).getAoSCOOStart();
204234a6SMatthias Springer    auto desc = getDescriptorFromTensorTuple(adaptor.getTensor(),
204234a6SMatthias Springer                                             op.getTensor().getType());
5c511655SAart Bik    auto mem = desc.getAOSMemRef();
5c511655SAart Bik    auto size = desc.getCrdMemSize(rewriter, loc, lvl);
5c511655SAart Bik    rewriter.replaceOp(op, genSliceToSize(rewriter, loc, mem, size));
81e3079dSbixia1    return success();
81e3079dSbixia1  }
81e3079dSbixia1};
81e3079dSbixia1
edca72f5SPeiming Liu/// Sparse codegen rule for value accesses.
90aa4362Sbixia1class SparseToValuesConverter : public OpConversionPattern<ToValuesOp> {
edca72f5SPeiming Liupublic:
90aa4362Sbixia1  using OpAdaptor = typename ToValuesOp::Adaptor;
90aa4362Sbixia1  using OpConversionPattern<ToValuesOp>::OpConversionPattern;
90aa4362Sbixia1  LogicalResult
*9df63b26SMatthias Springer  matchAndRewrite(ToValuesOp op, OneToNOpAdaptor adaptor,
90aa4362Sbixia1                  ConversionPatternRewriter &rewriter) const override {
84cd51bbSwren romano    // Replace the requested values access with corresponding field.
5c511655SAart Bik    // The view is restricted to the actual size to ensure clients
5c511655SAart Bik    // of this operation truly observe size, not capacity!
5c511655SAart Bik    Location loc = op.getLoc();
204234a6SMatthias Springer    auto desc = getDescriptorFromTensorTuple(adaptor.getTensor(),
204234a6SMatthias Springer                                             op.getTensor().getType());
5c511655SAart Bik    auto mem = desc.getValMemRef();
5c511655SAart Bik    auto size = desc.getValMemSize(rewriter, loc);
5c511655SAart Bik    rewriter.replaceOp(op, genSliceToSize(rewriter, loc, mem, size));
90aa4362Sbixia1    return success();
edca72f5SPeiming Liu  }
edca72f5SPeiming Liu};
edca72f5SPeiming Liu
58b449c3Sbixia1/// Sparse codegen rule for the convert operator.
58b449c3Sbixia1class SparseConvertConverter : public OpConversionPattern<ConvertOp> {
58b449c3Sbixia1public:
58b449c3Sbixia1  using OpConversionPattern::OpConversionPattern;
58b449c3Sbixia1  LogicalResult
*9df63b26SMatthias Springer  matchAndRewrite(ConvertOp op, OneToNOpAdaptor adaptor,
58b449c3Sbixia1                  ConversionPatternRewriter &rewriter) const override {
0128f801Sbixia1    SparseTensorEncodingAttr encDst = getSparseTensorEncoding(op.getType());
0128f801Sbixia1    SparseTensorEncodingAttr encSrc =
0128f801Sbixia1        getSparseTensorEncoding(op.getSource().getType());
33267f40SPeiming Liu    // The output tensor can not be a slice and those cases should have been
33267f40SPeiming Liu    // rejected by ConvertOp::verify() already.
33267f40SPeiming Liu    assert(!encDst.isSlice() && "Cannot convert to a sparse tensor slices.");
85dbb3fcSPeiming Liu    // Different encoding (except for different bitwidth) should be handled by
85dbb3fcSPeiming Liu    // rewriting.
33267f40SPeiming Liu    // We need further rewrites if the input tensor is a slice too.
33267f40SPeiming Liu    if (encDst.withoutBitWidths() != encSrc.withoutBitWidths() ||
33267f40SPeiming Liu        encSrc.isSlice()) {
58b449c3Sbixia1      return failure();
58b449c3Sbixia1    }
85dbb3fcSPeiming Liu
85dbb3fcSPeiming Liu    Type retElemTp = op.getResult().getType().getElementType();
85dbb3fcSPeiming Liu    Type srcElemTp = op.getSource().getType().getElementType();
85dbb3fcSPeiming Liu    // Fold the trivial cases.
85dbb3fcSPeiming Liu    if (retElemTp == srcElemTp && encDst == encSrc) {
*9df63b26SMatthias Springer      rewriter.replaceOpWithMultiple(op, {adaptor.getSource()});
58b449c3Sbixia1      return success();
58b449c3Sbixia1    }
85dbb3fcSPeiming Liu    //
85dbb3fcSPeiming Liu    // Do element-wise type conversion without using InsertOp.
85dbb3fcSPeiming Liu    //
85dbb3fcSPeiming Liu    // for each memref in srcTensor:
85dbb3fcSPeiming Liu    //   dst = memref.alloc
85dbb3fcSPeiming Liu    //   if srcMemRefType != dstMemRefType:
85dbb3fcSPeiming Liu    //     for every dst[i] = cast(src[i])
85dbb3fcSPeiming Liu    //   else:
85dbb3fcSPeiming Liu    //     dst = memref.copy(src)
85dbb3fcSPeiming Liu    Location loc = op.getLoc();
204234a6SMatthias Springer    auto srcDesc = getDescriptorFromTensorTuple(adaptor.getSource(),
204234a6SMatthias Springer                                                op.getSource().getType());
85dbb3fcSPeiming Liu    SmallVector<Value> fields;
85dbb3fcSPeiming Liu    foreachFieldAndTypeInSparseTensor(
5550c821STres Popp        SparseTensorType(cast<RankedTensorType>(op.getResult().getType())),
85dbb3fcSPeiming Liu        [&rewriter, &fields, srcDesc,
85dbb3fcSPeiming Liu         loc](Type fTp, FieldIndex fIdx, SparseTensorFieldKind fKind, Level lvl,
1944c4f7SAart Bik              LevelType /*lt*/) -> bool {
85dbb3fcSPeiming Liu          // Simply reuses the storage specifier as it is an SSA value.
85dbb3fcSPeiming Liu          if (fKind == SparseTensorFieldKind::StorageSpec) {
85dbb3fcSPeiming Liu            fields.push_back(srcDesc.getSpecifier());
85dbb3fcSPeiming Liu          } else {
85dbb3fcSPeiming Liu            // Allocates new memrefs
85dbb3fcSPeiming Liu            Value srcMem = srcDesc.getMemRefField(fIdx);
85dbb3fcSPeiming Liu            // TODO: We can instead use the actual memSize in specifier, that
85dbb3fcSPeiming Liu            // would require a subViewOp to avoid overflow when copying
85dbb3fcSPeiming Liu            // values.
85dbb3fcSPeiming Liu            Value sz = linalg::createOrFoldDimOp(rewriter, loc, srcMem, 0);
85dbb3fcSPeiming Liu            auto dstMem = rewriter.create<memref::AllocOp>(
5550c821STres Popp                loc, cast<MemRefType>(fTp), sz);
85dbb3fcSPeiming Liu            if (fTp != srcMem.getType()) {
85dbb3fcSPeiming Liu              // Converts elements type.
85dbb3fcSPeiming Liu              scf::buildLoopNest(
85dbb3fcSPeiming Liu                  rewriter, loc, constantIndex(rewriter, loc, 0), sz,
85dbb3fcSPeiming Liu                  constantIndex(rewriter, loc, 1),
85dbb3fcSPeiming Liu                  [srcMem, &dstMem](OpBuilder &builder, Location loc,
85dbb3fcSPeiming Liu                                    ValueRange ivs) {
85dbb3fcSPeiming Liu                    Value v = builder.create<memref::LoadOp>(loc, srcMem, ivs);
85dbb3fcSPeiming Liu                    Value casted = genCast(builder, loc, v,
85dbb3fcSPeiming Liu                                           dstMem.getType().getElementType());
85dbb3fcSPeiming Liu                    builder.create<memref::StoreOp>(loc, casted, dstMem, ivs);
85dbb3fcSPeiming Liu                  });
85dbb3fcSPeiming Liu            } else {
85dbb3fcSPeiming Liu              // TODO: We can even reuse the same memref for the new tensor,
85dbb3fcSPeiming Liu              // but that requires a `ref-counting` based memory management
85dbb3fcSPeiming Liu              // for shared memrefs between multiple sparse tensors.
85dbb3fcSPeiming Liu              rewriter.create<memref::CopyOp>(loc, srcMem, dstMem);
85dbb3fcSPeiming Liu            }
85dbb3fcSPeiming Liu            fields.push_back(dstMem);
85dbb3fcSPeiming Liu          }
85dbb3fcSPeiming Liu          return true;
85dbb3fcSPeiming Liu        });
85dbb3fcSPeiming Liu
aed43562SMatthias Springer    rewriter.replaceOpWithMultiple(op, {fields});
85dbb3fcSPeiming Liu    return success();
85dbb3fcSPeiming Liu  }
58b449c3Sbixia1};
58b449c3Sbixia1
6db397a8SPeiming Liuclass SparseExtractSliceConverter
03526904SPeiming Liu    : public OpConversionPattern<tensor::ExtractSliceOp> {
03526904SPeiming Liupublic:
03526904SPeiming Liu  using OpConversionPattern::OpConversionPattern;
03526904SPeiming Liu  LogicalResult
*9df63b26SMatthias Springer  matchAndRewrite(tensor::ExtractSliceOp op, OneToNOpAdaptor adaptor,
03526904SPeiming Liu                  ConversionPatternRewriter &rewriter) const override {
6db397a8SPeiming Liu    Location loc = op.getLoc();
6db397a8SPeiming Liu    MLIRContext *ctx = op.getContext();
03526904SPeiming Liu    auto srcEnc = getSparseTensorEncoding(op.getSourceType());
03526904SPeiming Liu    auto dstEnc = getSparseTensorEncoding(op.getResult().getType());
03526904SPeiming Liu    // TODO: We should check these in ExtractSliceOp::verify.
dbdb4affSAart Bik    if (!srcEnc || !dstEnc || !dstEnc.isSlice())
dbdb4affSAart Bik      return failure();
af2bec7cSwren romano    assert(srcEnc.withoutDimSlices() == dstEnc.withoutDimSlices());
03526904SPeiming Liu
6db397a8SPeiming Liu    SmallVector<Value> fields;
204234a6SMatthias Springer    auto desc = getMutDescriptorFromTensorTuple(adaptor.getSource(), fields,
204234a6SMatthias Springer                                                op.getSource().getType());
6db397a8SPeiming Liu
6db397a8SPeiming Liu    auto newSpec = rewriter.create<StorageSpecifierInitOp>(
6db397a8SPeiming Liu        loc, StorageSpecifierType::get(ctx, dstEnc), desc.getSpecifier());
6db397a8SPeiming Liu    desc.setSpecifier(newSpec);
6db397a8SPeiming Liu
6db397a8SPeiming Liu    // Fills in slice information.
a0a76804SJakub Kuderski    for (auto [idx, offset, size, stride] : llvm::enumerate(
a0a76804SJakub Kuderski             op.getMixedOffsets(), op.getMixedSizes(), op.getMixedStrides())) {
a0a76804SJakub Kuderski      Dimension dim = idx;
6db397a8SPeiming Liu
6db397a8SPeiming Liu      Value offsetV = getValueOrCreateConstantIndexOp(rewriter, loc, offset);
6db397a8SPeiming Liu      Value sizeV = getValueOrCreateConstantIndexOp(rewriter, loc, size);
6db397a8SPeiming Liu      Value strideV = getValueOrCreateConstantIndexOp(rewriter, loc, stride);
6db397a8SPeiming Liu      // TODO: We could probably only set dynamic value here. But it would
6db397a8SPeiming Liu      // requires us to fill the hole when casting a static slice to dynamic
6db397a8SPeiming Liu      // slice.
6db397a8SPeiming Liu      desc.setSpecifierField(rewriter, loc, StorageSpecifierKind::DimOffset,
6db397a8SPeiming Liu                             dim, offsetV);
6db397a8SPeiming Liu
6db397a8SPeiming Liu      // FIXME: we need to distinguish level sizes and dimension size for slices
6db397a8SPeiming Liu      // here. Maybe we should store slice level sizes in a different array
6db397a8SPeiming Liu      // instead of reusing it.
76647fceSwren romano      assert(srcEnc.isIdentity());
6db397a8SPeiming Liu      desc.setSpecifierField(rewriter, loc, StorageSpecifierKind::LvlSize, dim,
6db397a8SPeiming Liu                             sizeV);
6db397a8SPeiming Liu      desc.setSpecifierField(rewriter, loc, StorageSpecifierKind::DimStride,
6db397a8SPeiming Liu                             dim, strideV);
03526904SPeiming Liu    }
03526904SPeiming Liu
6db397a8SPeiming Liu    // NOTE: we can not generate tuples directly from descriptor here, as the
6db397a8SPeiming Liu    // descriptor is holding the original type, yet we want the slice type
6db397a8SPeiming Liu    // here (they shared every memref but with an updated specifier).
aed43562SMatthias Springer    rewriter.replaceOpWithMultiple(op, {desc.getFields()});
03526904SPeiming Liu    return success();
03526904SPeiming Liu  }
03526904SPeiming Liu};
03526904SPeiming Liu
0f3e4d1aSAart Bik/// Sparse codegen rule for number of entries operator.
0f3e4d1aSAart Bikclass SparseNumberOfEntriesConverter
0f3e4d1aSAart Bik    : public OpConversionPattern<NumberOfEntriesOp> {
0f3e4d1aSAart Bikpublic:
0f3e4d1aSAart Bik  using OpConversionPattern::OpConversionPattern;
0f3e4d1aSAart Bik  LogicalResult
*9df63b26SMatthias Springer  matchAndRewrite(NumberOfEntriesOp op, OneToNOpAdaptor adaptor,
0f3e4d1aSAart Bik                  ConversionPatternRewriter &rewriter) const override {
63d31a4dSbixia1    // Query memSizes for the actually stored values.
de560888SPeiming Liu    // FIXME: the nse value computed in this way might be wrong when there is
d2e85179SYinying Li    // any "loose_compressed" level.
204234a6SMatthias Springer    auto desc = getDescriptorFromTensorTuple(adaptor.getTensor(),
204234a6SMatthias Springer                                             op.getTensor().getType());
204234a6SMatthias Springer    rewriter.replaceOp(op, desc.getValMemSize(rewriter, op.getLoc()));
0f3e4d1aSAart Bik    return success();
0f3e4d1aSAart Bik  }
0f3e4d1aSAart Bik};
0f3e4d1aSAart Bik
6ca47eb4SPeiming Liustruct SparseAssembleOpConverter : public OpConversionPattern<AssembleOp> {
a41672e1SPeiming Liu  using OpConversionPattern::OpConversionPattern;
a41672e1SPeiming Liu  LogicalResult
6ca47eb4SPeiming Liu  matchAndRewrite(AssembleOp op, OpAdaptor adaptor,
a41672e1SPeiming Liu                  ConversionPatternRewriter &rewriter) const override {
de560888SPeiming Liu    Location loc = op.getLoc();
34c9c59cSwren romano    const auto stt = getSparseTensorType(op.getResult());
a41672e1SPeiming Liu
a41672e1SPeiming Liu    SmallVector<Value> fields;
a41672e1SPeiming Liu
a41672e1SPeiming Liu    foreachFieldAndTypeInSparseTensor(
34c9c59cSwren romano        stt,
de560888SPeiming Liu        [&rewriter, &fields, &op, &stt,
f708a549Swren romano         loc](Type fType, FieldIndex fIdx, SparseTensorFieldKind fKind,
1944c4f7SAart Bik              Level /*lvl*/, LevelType lt) -> bool {
a41672e1SPeiming Liu          assert(fields.size() == fIdx);
de560888SPeiming Liu          if (fKind == SparseTensorFieldKind::StorageSpec) {
de560888SPeiming Liu            fields.push_back(
de560888SPeiming Liu                SparseTensorSpecifier::getInitValue(rewriter, loc, stt));
7864d736SPeiming Liu          } else {
de560888SPeiming Liu            // Else simply takes the inputs.
b2e6b735SPeiming Liu            Value tensor = fKind == SparseTensorFieldKind::ValMemRef
de560888SPeiming Liu                               ? op.getValues()
de560888SPeiming Liu                               : op.getLevels()[fIdx];
0d1f9576SPeiming Liu            // TODO: handle batch.
b2e6b735SPeiming Liu            TypedValue<BaseMemRefType> mem = genToMemref(rewriter, loc, tensor);
52b69aa3SPeiming Liu            if (mem.getType().getRank() > stt.getBatchLvlRank() + 1) {
52b69aa3SPeiming Liu              // Flattens the buffer to batchLvlRank.
52b69aa3SPeiming Liu              auto reassoc = getReassociationForFlattening(
52b69aa3SPeiming Liu                  mem.getType(), stt.getBatchLvlRank());
b2e6b735SPeiming Liu              mem = rewriter.create<memref::CastOp>(
b2e6b735SPeiming Liu                  loc, fType,
b2e6b735SPeiming Liu                  rewriter.create<memref::CollapseShapeOp>(loc, mem, reassoc));
b2e6b735SPeiming Liu            } else {
b2e6b735SPeiming Liu              mem = rewriter.create<memref::CastOp>(loc, fType, mem);
a41672e1SPeiming Liu            }
b2e6b735SPeiming Liu            fields.push_back(mem);
de560888SPeiming Liu          }
a41672e1SPeiming Liu          return true;
a41672e1SPeiming Liu        });
a41672e1SPeiming Liu
34c9c59cSwren romano    MutSparseTensorDescriptor desc(stt, fields);
f7b8b005SPeiming Liu    Value c0 = constantIndex(rewriter, loc, 0);
de560888SPeiming Liu    Value c1 = constantIndex(rewriter, loc, 1);
de560888SPeiming Liu    Value c2 = constantIndex(rewriter, loc, 2);
be556ee1SYinying Li    Value posBack = c0; // index to the last value in the position array
f7b8b005SPeiming Liu    Value memSize = c1; // memory size for current array
b2e6b735SPeiming Liu
5248a987SPeiming Liu    Level trailCOOStart = stt.getAoSCOOStart();
b2e6b735SPeiming Liu    Level trailCOORank = stt.getLvlRank() - trailCOOStart;
de560888SPeiming Liu    // Sets up SparseTensorSpecifier.
34c9c59cSwren romano    for (Level lvl = 0, lvlRank = stt.getLvlRank(); lvl < lvlRank; lvl++) {
de560888SPeiming Liu      assert(!ShapedType::isDynamic(stt.getDimShape()[lvl]));
a41672e1SPeiming Liu
de560888SPeiming Liu      // Sets up the level size.
0d1f9576SPeiming Liu      auto lvlSize = constantIndex(rewriter, loc, stt.getLvlShape()[lvl]);
de560888SPeiming Liu      desc.setLvlSize(rewriter, loc, lvl, lvlSize);
b2e6b735SPeiming Liu      // We use a single AOS array to store the trailing COO, so there is only
b2e6b735SPeiming Liu      // one memory size to set for the entire COO section.
b2e6b735SPeiming Liu      if (lvl > trailCOOStart)
b2e6b735SPeiming Liu        continue;
de560888SPeiming Liu
de560888SPeiming Liu      // Sets up the memory size by reading the last value in position array.
1944c4f7SAart Bik      LevelType lt = stt.getLvlType(lvl);
de560888SPeiming Liu      // Simply forwards the position index when this is a dense level.
52b69aa3SPeiming Liu      if (lt.isa<LevelFormat::Dense>()) {
f7b8b005SPeiming Liu        memSize = rewriter.create<arith::MulIOp>(loc, lvlSize, memSize);
de560888SPeiming Liu        posBack = rewriter.create<arith::SubIOp>(loc, memSize, c1);
de560888SPeiming Liu        continue;
a41672e1SPeiming Liu      }
52b69aa3SPeiming Liu      if (lt.isa<LevelFormat::Batch>()) {
52b69aa3SPeiming Liu        // Skips batch levels as it is not linearized.
52b69aa3SPeiming Liu        // FIXME: this assumes that every batch has the same number of nse, need
52b69aa3SPeiming Liu        // to be generalized to handle varied-size batches.
52b69aa3SPeiming Liu        continue;
52b69aa3SPeiming Liu      }
de560888SPeiming Liu
1dd387e1SAart Bik      if (isWithPosLT(lt)) {
1dd387e1SAart Bik        assert(isCompressedLT(lt) || isLooseCompressedLT(lt));
1dd387e1SAart Bik        if (isLooseCompressedLT(lt)) {
de560888SPeiming Liu          memSize = rewriter.create<arith::MulIOp>(loc, memSize, c2);
de560888SPeiming Liu          posBack = rewriter.create<arith::SubIOp>(loc, memSize, c1);
f7b8b005SPeiming Liu        } else {
1dd387e1SAart Bik          assert(isCompressedLT(lt));
f7b8b005SPeiming Liu          posBack = memSize;
f7b8b005SPeiming Liu          memSize = rewriter.create<arith::AddIOp>(loc, memSize, c1);
de560888SPeiming Liu        }
de560888SPeiming Liu        desc.setPosMemSize(rewriter, loc, lvl, memSize);
de560888SPeiming Liu        // The last value in position array is the memory size for next level.
52b69aa3SPeiming Liu        // FIXME: this assumes that every batch has the same number of nse, need
52b69aa3SPeiming Liu        // to be generalized to handle varied-size batches.
52b69aa3SPeiming Liu        SmallVector<Value> batched(stt.getBatchLvlRank(),
52b69aa3SPeiming Liu                                   constantIndex(rewriter, loc, 0));
52b69aa3SPeiming Liu        batched.push_back(posBack);
52b69aa3SPeiming Liu        memSize = genIndexLoad(rewriter, loc, desc.getPosMemRef(lvl), batched);
de560888SPeiming Liu        posBack = rewriter.create<arith::SubIOp>(loc, posBack, c1);
de560888SPeiming Liu      }
1dd387e1SAart Bik      assert(isWithCrdLT(lt) && lvl <= trailCOOStart);
b2e6b735SPeiming Liu      // FIXME: This seems to be unnecessarily complex, can we simplify it?
b2e6b735SPeiming Liu      if (lvl == trailCOOStart) {
b2e6b735SPeiming Liu        Value cooSz = rewriter.create<arith::MulIOp>(
b2e6b735SPeiming Liu            loc, memSize, constantIndex(rewriter, loc, trailCOORank));
b2e6b735SPeiming Liu        desc.setCrdMemSize(rewriter, loc, lvl, cooSz);
b2e6b735SPeiming Liu      } else {
de560888SPeiming Liu        desc.setCrdMemSize(rewriter, loc, lvl, memSize);
de560888SPeiming Liu      }
b2e6b735SPeiming Liu    }
de560888SPeiming Liu    desc.setValMemSize(rewriter, loc, memSize);
a41672e1SPeiming Liu
aed43562SMatthias Springer    rewriter.replaceOpWithMultiple(op, {desc.getFields()});
a41672e1SPeiming Liu    return success();
a41672e1SPeiming Liu  }
a41672e1SPeiming Liu};
a41672e1SPeiming Liu
6ca47eb4SPeiming Liustruct SparseDisassembleOpConverter
6ca47eb4SPeiming Liu    : public OpConversionPattern<DisassembleOp> {
d4db5289SPeiming Liu  using OpConversionPattern::OpConversionPattern;
206fad0eSMatthias Springer  SparseDisassembleOpConverter(const TypeConverter &typeConverter,
6ca47eb4SPeiming Liu                               MLIRContext *context)
de560888SPeiming Liu      : OpConversionPattern(typeConverter, context) {}
d4db5289SPeiming Liu
d4db5289SPeiming Liu  LogicalResult
*9df63b26SMatthias Springer  matchAndRewrite(DisassembleOp op, OneToNOpAdaptor adaptor,
d4db5289SPeiming Liu                  ConversionPatternRewriter &rewriter) const override {
204234a6SMatthias Springer    auto desc = getDescriptorFromTensorTuple(adaptor.getTensor(),
204234a6SMatthias Springer                                             op.getTensor().getType());
b2e6b735SPeiming Liu    Location loc = op.getLoc();
b2e6b735SPeiming Liu    SmallVector<Value> retMem;
a63d6a00SPeiming Liu    SmallVector<Value> retLen;
1944c4f7SAart Bik    desc.getLayout().foreachField([desc, loc, &rewriter, &op, &retMem,
1944c4f7SAart Bik                                   &retLen](FieldIndex fid,
1944c4f7SAart Bik                                            SparseTensorFieldKind fKind,
1944c4f7SAart Bik                                            Level lvl, LevelType lt) -> bool {
b2e6b735SPeiming Liu      if (fKind == SparseTensorFieldKind::StorageSpec)
b2e6b735SPeiming Liu        return true;
b2e6b735SPeiming Liu      SparseTensorType stt(desc.getRankedTensorType());
b2e6b735SPeiming Liu      Value sz, src;
b2e6b735SPeiming Liu      TypedValue<BaseMemRefType> dst;
b2e6b735SPeiming Liu      if (fKind == SparseTensorFieldKind::ValMemRef) {
b2e6b735SPeiming Liu        sz = desc.getValMemSize(rewriter, loc);
b2e6b735SPeiming Liu        src = desc.getValMemRef();
b2e6b735SPeiming Liu        dst = genToMemref(rewriter, loc, op.getOutValues());
fc9f1d49SPeiming Liu
fc9f1d49SPeiming Liu        retMem.push_back(dst);
64df1c08SPeiming Liu        Type valLenTp = op.getValLen().getType();
fc9f1d49SPeiming Liu        retLen.push_back(genScalarToTensor(rewriter, loc, sz, valLenTp));
b2e6b735SPeiming Liu      } else {
b2e6b735SPeiming Liu        assert(fKind == SparseTensorFieldKind::PosMemRef ||
b2e6b735SPeiming Liu               fKind == SparseTensorFieldKind::CrdMemRef);
b2e6b735SPeiming Liu
b2e6b735SPeiming Liu        sz = fKind == SparseTensorFieldKind::PosMemRef
b2e6b735SPeiming Liu                 ? desc.getPosMemSize(rewriter, loc, lvl)
b2e6b735SPeiming Liu                 : desc.getCrdMemSize(rewriter, loc, lvl);
b2e6b735SPeiming Liu        src = desc.getMemRefField(fid);
b2e6b735SPeiming Liu        dst = genToMemref(rewriter, loc, op.getOutLevels()[fid]);
b2e6b735SPeiming Liu        retMem.push_back(dst);
64df1c08SPeiming Liu        // Retrieves the corresponding level length type.
64df1c08SPeiming Liu        Type lvlLenTp = op.getLvlLens().getTypes()[retLen.size()];
098f46dcSPeiming Liu        retLen.push_back(genScalarToTensor(rewriter, loc, sz, lvlLenTp));
b2e6b735SPeiming Liu      }
b2e6b735SPeiming Liu      Value flatOut = dst;
52b69aa3SPeiming Liu      if (dst.getType().getRank() > stt.getBatchLvlRank() + 1) {
52b69aa3SPeiming Liu        auto reassoc =
52b69aa3SPeiming Liu            getReassociationForFlattening(dst.getType(), stt.getBatchLvlRank());
b2e6b735SPeiming Liu        flatOut = rewriter.create<memref::CollapseShapeOp>(loc, dst, reassoc);
b2e6b735SPeiming Liu      }
b2e6b735SPeiming Liu      Value dstMem = genSliceToSize(rewriter, loc, flatOut, sz);
b2e6b735SPeiming Liu      Value srcMem = genSliceToSize(rewriter, loc, src, sz);
b2e6b735SPeiming Liu      rewriter.create<memref::CopyOp>(loc, srcMem, dstMem);
b2e6b735SPeiming Liu      return true;
b2e6b735SPeiming Liu    });
b2e6b735SPeiming Liu
b2e6b735SPeiming Liu    // Converts MemRefs back to Tensors.
a63d6a00SPeiming Liu    SmallVector<Value> retValues = llvm::to_vector(
b2e6b735SPeiming Liu        llvm::map_range(retMem, [&rewriter, loc](Value v) -> Value {
b2e6b735SPeiming Liu          return rewriter.create<bufferization::ToTensorOp>(loc, v);
b2e6b735SPeiming Liu        }));
a63d6a00SPeiming Liu    // Appends the actual memory length used in each buffer returned.
a63d6a00SPeiming Liu    retValues.append(retLen.begin(), retLen.end());
a63d6a00SPeiming Liu    rewriter.replaceOp(op, retValues);
b2e6b735SPeiming Liu    return success();
d4db5289SPeiming Liu  }
dc6427d6SPeiming Liu};
dc6427d6SPeiming Liu
d3af6535SAart Bikstruct SparseNewConverter : public OpConversionPattern<NewOp> {
2c81d432Sbixia1  using OpConversionPattern::OpConversionPattern;
2c81d432Sbixia1  LogicalResult
2c81d432Sbixia1  matchAndRewrite(NewOp op, OpAdaptor adaptor,
2c81d432Sbixia1                  ConversionPatternRewriter &rewriter) const override {
2c81d432Sbixia1    Location loc = op.getLoc();
2c81d432Sbixia1    const auto dstTp = getSparseTensorType(op.getResult());
2c81d432Sbixia1    // Creating COO with NewOp is handled by direct IR codegen. All other cases
2c81d432Sbixia1    // are handled by rewriting.
5248a987SPeiming Liu    if (!dstTp.hasEncoding() || dstTp.getAoSCOOStart() != 0)
2c81d432Sbixia1      return failure();
2c81d432Sbixia1
d3af6535SAart Bik    // Implement as follows:
b86d3cbcSAart Bik    //   %reader = @createCheckedSparseTensorReader(%filename)
84cd51bbSwren romano    //   %nse = @getSparseTensorNSE(%reader)
84cd51bbSwren romano    //   %coo = bufferization.alloc_tensor an ordered COO with
84cd51bbSwren romano    //          dst dim ordering, size_hint = %nse
84cd51bbSwren romano    //   %coordinates = sparse_tensor.coordinates_buffer(%coo)
84cd51bbSwren romano    //   %values = sparse_tensor.values(%coo)
84cd51bbSwren romano    //   %isSorted = @sparseTensorReaderReadToBuffers(%coordinates, %values)
84cd51bbSwren romano    //   if (! %isSorted) sparse_tensor.sort_coo(%nse, %coordinates, %values)
2c81d432Sbixia1    //   update storage specifier
84cd51bbSwren romano    //   @delSparseTensorReader(%reader)
83cf0dc9SAart Bik    SmallVector<Value> dimSizesValues;
d3af6535SAart Bik    Value dimSizesBuffer;
d3af6535SAart Bik    Value reader = genReader(rewriter, loc, dstTp, adaptor.getOperands()[0],
83cf0dc9SAart Bik                             dimSizesValues, dimSizesBuffer);
2c81d432Sbixia1
d3af6535SAart Bik    // Get the number of stored entries.
84cd51bbSwren romano    const Type indexTp = rewriter.getIndexType();
d3af6535SAart Bik    Value nse = createFuncCall(rewriter, loc, "getSparseTensorReaderNSE",
d3af6535SAart Bik                               {indexTp}, {reader}, EmitCInterface::Off)
d3af6535SAart Bik                    .getResult(0);
2c81d432Sbixia1
83cf0dc9SAart Bik    // Construct the lvl sizes and the dim2lvl/lvl2dim buffers.
2323f48eSAart Bik    SmallVector<Value> lvlSizesValues;
d3af6535SAart Bik    Value dim2lvlBuffer;
d3af6535SAart Bik    Value lvl2dimBuffer;
83cf0dc9SAart Bik    genMapBuffers(rewriter, loc, dstTp, dimSizesValues, dimSizesBuffer,
2323f48eSAart Bik                  lvlSizesValues, dim2lvlBuffer, lvl2dimBuffer);
2c81d432Sbixia1
83cf0dc9SAart Bik    // Construct allocation for each field.
83cf0dc9SAart Bik    Value sizeHint = nse;
83cf0dc9SAart Bik    SmallVector<Value> fields;
83cf0dc9SAart Bik    createAllocFields(rewriter, loc, dstTp, /*enableInit=*/false, sizeHint,
83cf0dc9SAart Bik                      lvlSizesValues, fields);
83cf0dc9SAart Bik
84cd51bbSwren romano    // Read the COO tensor data.
160d483bSAart Bik    MutSparseTensorDescriptor desc(dstTp, fields);
84cd51bbSwren romano    Value xs = desc.getAOSMemRef();
84cd51bbSwren romano    Value ys = desc.getValMemRef();
84cd51bbSwren romano    const Type boolTp = rewriter.getIntegerType(1);
84cd51bbSwren romano    const Type elemTp = dstTp.getElementType();
84cd51bbSwren romano    const Type crdTp = dstTp.getCrdType();
b86d3cbcSAart Bik    SmallString<32> readToBuffersFuncName{"getSparseTensorReaderReadToBuffers",
84cd51bbSwren romano                                          overheadTypeFunctionSuffix(crdTp),
84cd51bbSwren romano                                          primaryTypeFunctionSuffix(elemTp)};
2c81d432Sbixia1    Value isSorted =
84cd51bbSwren romano        createFuncCall(rewriter, loc, readToBuffersFuncName, {boolTp},
d3af6535SAart Bik                       {reader, dim2lvlBuffer, lvl2dimBuffer, xs, ys},
d3af6535SAart Bik                       EmitCInterface::On)
2c81d432Sbixia1            .getResult(0);
2c81d432Sbixia1
2c81d432Sbixia1    // If the destination tensor is a sorted COO, we need to sort the COO tensor
2c81d432Sbixia1    // data if the input elements aren't sorted yet.
d3af6535SAart Bik    const Level lvlRank = dstTp.getLvlRank();
84cd51bbSwren romano    if (dstTp.isOrderedLvl(lvlRank - 1)) {
84cd51bbSwren romano      Value kFalse = constantI1(rewriter, loc, false);
2c81d432Sbixia1      Value notSorted = rewriter.create<arith::CmpIOp>(
84cd51bbSwren romano          loc, arith::CmpIPredicate::eq, isSorted, kFalse);
2c81d432Sbixia1      scf::IfOp ifOp =
2c81d432Sbixia1          rewriter.create<scf::IfOp>(loc, notSorted, /*else*/ false);
2c81d432Sbixia1      rewriter.setInsertionPointToStart(&ifOp.getThenRegion().front());
bfa3bc43SPeiming Liu      auto xPerm = rewriter.getMultiDimIdentityMap(lvlRank);
0083f833SPeiming Liu      rewriter.create<SortOp>(loc, nse, xs, ValueRange{ys}, xPerm,
bfa3bc43SPeiming Liu                              rewriter.getIndexAttr(0),
bfa3bc43SPeiming Liu                              SparseTensorSortKind::HybridQuickSort);
2c81d432Sbixia1      rewriter.setInsertionPointAfter(ifOp);
2c81d432Sbixia1    }
2c81d432Sbixia1
84cd51bbSwren romano    // Set PosMemRef0[1] = nse.
84cd51bbSwren romano    const Value c1 = constantIndex(rewriter, loc, 1);
84cd51bbSwren romano    const Value posMemref0 = desc.getPosMemRef(0);
84cd51bbSwren romano    const Type posTp = dstTp.getPosType();
84cd51bbSwren romano    const Value posNse = genCast(rewriter, loc, nse, posTp);
84cd51bbSwren romano    rewriter.create<memref::StoreOp>(loc, posNse, posMemref0, c1);
2c81d432Sbixia1
2c81d432Sbixia1    // Update storage specifier.
84cd51bbSwren romano    Value coordinatesSize = rewriter.create<arith::MulIOp>(
84cd51bbSwren romano        loc, nse, constantIndex(rewriter, loc, lvlRank));
84cd51bbSwren romano    desc.setSpecifierField(rewriter, loc, StorageSpecifierKind::CrdMemSize, 0,
84cd51bbSwren romano                           coordinatesSize);
2c81d432Sbixia1    desc.setSpecifierField(rewriter, loc, StorageSpecifierKind::ValMemSize,
2c81d432Sbixia1                           std::nullopt, nse);
2c81d432Sbixia1
2c81d432Sbixia1    // Release the sparse tensor reader.
2c81d432Sbixia1    createFuncCall(rewriter, loc, "delSparseTensorReader", {}, {reader},
2c81d432Sbixia1                   EmitCInterface::Off);
2c81d432Sbixia1
2c81d432Sbixia1    // Replace operation with resulting memrefs.
aed43562SMatthias Springer    rewriter.replaceOpWithMultiple(op, {fields});
2c81d432Sbixia1    return success();
2c81d432Sbixia1  }
2c81d432Sbixia1};
2c81d432Sbixia1
e8e8df4cSMatthias Springerstruct SparseHasRuntimeLibraryConverter
e8e8df4cSMatthias Springer    : public OpConversionPattern<HasRuntimeLibraryOp> {
e8e8df4cSMatthias Springer  using OpConversionPattern::OpConversionPattern;
e8e8df4cSMatthias Springer  LogicalResult
e8e8df4cSMatthias Springer  matchAndRewrite(HasRuntimeLibraryOp op, OpAdaptor adaptor,
e8e8df4cSMatthias Springer                  ConversionPatternRewriter &rewriter) const override {
e8e8df4cSMatthias Springer    auto i1Type = rewriter.getI1Type();
e8e8df4cSMatthias Springer    rewriter.replaceOpWithNewOp<arith::ConstantOp>(
e8e8df4cSMatthias Springer        op, i1Type, rewriter.getIntegerAttr(i1Type, 0));
e8e8df4cSMatthias Springer    return success();
e8e8df4cSMatthias Springer  }
e8e8df4cSMatthias Springer};
e8e8df4cSMatthias Springer
86b22d31SAart Bik} // namespace
86b22d31SAart Bik
86b22d31SAart Bik//===----------------------------------------------------------------------===//
86b22d31SAart Bik// Public method for populating conversion rules.
86b22d31SAart Bik//===----------------------------------------------------------------------===//
86b22d31SAart Bik
86b22d31SAart Bik/// Populates the given patterns list with conversion rules required for
86b22d31SAart Bik/// the sparsification of linear algebra operations.
7276b643Sbixia1void mlir::populateSparseTensorCodegenPatterns(
206fad0eSMatthias Springer    const TypeConverter &typeConverter, RewritePatternSet &patterns,
c44d307cSPeiming Liu    bool createSparseDeallocs, bool enableBufferInitialization) {
e8e8df4cSMatthias Springer  patterns.add<
e8e8df4cSMatthias Springer      SparseAssembleOpConverter, SparseDisassembleOpConverter,
c780352dSPeiming Liu      SparseReturnConverter, SparseCallConverter, SparseLvlOpConverter,
de560888SPeiming Liu      SparseCastConverter, SparseExtractSliceConverter,
e8e8df4cSMatthias Springer      SparseTensorLoadConverter, SparseExpandConverter, SparseCompressConverter,
e8e8df4cSMatthias Springer      SparseInsertConverter, SparseReorderCOOConverter, SparseReMapConverter,
6db397a8SPeiming Liu      SparseSliceGetterOpConverter<ToSliceOffsetOp,
6db397a8SPeiming Liu                                   StorageSpecifierKind::DimOffset>,
6db397a8SPeiming Liu      SparseSliceGetterOpConverter<ToSliceStrideOp,
6db397a8SPeiming Liu                                   StorageSpecifierKind::DimStride>,
6db397a8SPeiming Liu      SparseToPositionsConverter, SparseToCoordinatesConverter,
6db397a8SPeiming Liu      SparseToCoordinatesBufferConverter, SparseToValuesConverter,
d3af6535SAart Bik      SparseConvertConverter, SparseNewConverter,
e8e8df4cSMatthias Springer      SparseNumberOfEntriesConverter, SparseHasRuntimeLibraryConverter>(
e8e8df4cSMatthias Springer      typeConverter, patterns.getContext());
de560888SPeiming Liu  patterns.add<SparseTensorDeallocConverter>(
c44d307cSPeiming Liu      typeConverter, patterns.getContext(), createSparseDeallocs);
3e4a8c2cSAart Bik  patterns.add<SparseTensorAllocConverter, SparseTensorEmptyConverter>(
3e4a8c2cSAart Bik      typeConverter, patterns.getContext(), enableBufferInitialization);
86b22d31SAart Bik}