Vector/Transforms/LowerVectorBitCast.cpp

0ea1271eSHan-Chung Wang//===- LowerVectorBitCast.cpp - Lower 'vector.bitcast' operation ----------===//
0ea1271eSHan-Chung Wang//
0ea1271eSHan-Chung Wang// Part of the LLVM Project, under the Apache License v2.0 with LLVM Exceptions.
0ea1271eSHan-Chung Wang// See https://llvm.org/LICENSE.txt for license information.
0ea1271eSHan-Chung Wang// SPDX-License-Identifier: Apache-2.0 WITH LLVM-exception
0ea1271eSHan-Chung Wang//
0ea1271eSHan-Chung Wang//===----------------------------------------------------------------------===//
0ea1271eSHan-Chung Wang//
0ea1271eSHan-Chung Wang// This file implements target-independent rewrites and utilities to lower the
0ea1271eSHan-Chung Wang// 'vector.bitcast' operation.
0ea1271eSHan-Chung Wang//
0ea1271eSHan-Chung Wang//===----------------------------------------------------------------------===//
0ea1271eSHan-Chung Wang
0ea1271eSHan-Chung Wang#include "mlir/Dialect/Vector/IR/VectorOps.h"
0ea1271eSHan-Chung Wang#include "mlir/Dialect/Vector/Transforms/LoweringPatterns.h"
0ea1271eSHan-Chung Wang#include "mlir/Dialect/Vector/Utils/VectorUtils.h"
0ea1271eSHan-Chung Wang#include "mlir/IR/BuiltinTypes.h"
0ea1271eSHan-Chung Wang#include "mlir/IR/PatternMatch.h"
0ea1271eSHan-Chung Wang
0ea1271eSHan-Chung Wang#define DEBUG_TYPE "vector-bitcast-lowering"
0ea1271eSHan-Chung Wang
0ea1271eSHan-Chung Wangusing namespace mlir;
0ea1271eSHan-Chung Wangusing namespace mlir::vector;
0ea1271eSHan-Chung Wang
0ea1271eSHan-Chung Wangnamespace {
0ea1271eSHan-Chung Wang
0ea1271eSHan-Chung Wang/// A one-shot unrolling of vector.bitcast to the `targetRank`.
0ea1271eSHan-Chung Wang///
0ea1271eSHan-Chung Wang/// Example:
0ea1271eSHan-Chung Wang///
0ea1271eSHan-Chung Wang///   vector.bitcast %a, %b : vector<1x2x3x4xi64> to vector<1x2x3x8xi32>
0ea1271eSHan-Chung Wang///
0ea1271eSHan-Chung Wang/// Would be unrolled to:
0ea1271eSHan-Chung Wang///
0ea1271eSHan-Chung Wang/// %result = arith.constant dense<0> : vector<1x2x3x8xi32>
0ea1271eSHan-Chung Wang/// %0 = vector.extract %a[0, 0, 0]                 ─┐
0ea1271eSHan-Chung Wang///        : vector<4xi64> from vector<1x2x3x4xi64>  |
0ea1271eSHan-Chung Wang/// %1 = vector.bitcast %0                           | - Repeated 6x for
0ea1271eSHan-Chung Wang///        : vector<4xi64> to vector<8xi32>          |   all leading positions
0ea1271eSHan-Chung Wang/// %2 = vector.insert %1, %result [0, 0, 0]         |
0ea1271eSHan-Chung Wang///        : vector<8xi64> into vector<1x2x3x8xi32> ─┘
0ea1271eSHan-Chung Wang///
0ea1271eSHan-Chung Wang/// Note: If any leading dimension before the `targetRank` is scalable the
0ea1271eSHan-Chung Wang/// unrolling will stop before the scalable dimension.
0ea1271eSHan-Chung Wangclass UnrollBitCastOp final : public OpRewritePattern<vector::BitCastOp> {
0ea1271eSHan-Chung Wangpublic:
0ea1271eSHan-Chung Wang  UnrollBitCastOp(int64_t targetRank, MLIRContext *context,
0ea1271eSHan-Chung Wang                  PatternBenefit benefit = 1)
0ea1271eSHan-Chung Wang      : OpRewritePattern(context, benefit), targetRank(targetRank) {};
0ea1271eSHan-Chung Wang
0ea1271eSHan-Chung Wang  LogicalResult matchAndRewrite(vector::BitCastOp op,
0ea1271eSHan-Chung Wang                                PatternRewriter &rewriter) const override {
0ea1271eSHan-Chung Wang    VectorType resultType = op.getResultVectorType();
0ea1271eSHan-Chung Wang    auto unrollIterator = vector::createUnrollIterator(resultType, targetRank);
0ea1271eSHan-Chung Wang    if (!unrollIterator)
0ea1271eSHan-Chung Wang      return failure();
0ea1271eSHan-Chung Wang
*dc5d5410SBenjamin Maxwell    auto unrollRank = unrollIterator->getRank();
*dc5d5410SBenjamin Maxwell    ArrayRef<int64_t> shape = resultType.getShape().drop_front(unrollRank);
*dc5d5410SBenjamin Maxwell    ArrayRef<bool> scalableDims =
*dc5d5410SBenjamin Maxwell        resultType.getScalableDims().drop_front(unrollRank);
*dc5d5410SBenjamin Maxwell    auto bitcastResType =
*dc5d5410SBenjamin Maxwell        VectorType::get(shape, resultType.getElementType(), scalableDims);
0ea1271eSHan-Chung Wang
0ea1271eSHan-Chung Wang    Location loc = op.getLoc();
0ea1271eSHan-Chung Wang    Value result = rewriter.create<arith::ConstantOp>(
0ea1271eSHan-Chung Wang        loc, resultType, rewriter.getZeroAttr(resultType));
0ea1271eSHan-Chung Wang    for (auto position : *unrollIterator) {
0ea1271eSHan-Chung Wang      Value extract =
0ea1271eSHan-Chung Wang          rewriter.create<vector::ExtractOp>(loc, op.getSource(), position);
0ea1271eSHan-Chung Wang      Value bitcast =
0ea1271eSHan-Chung Wang          rewriter.create<vector::BitCastOp>(loc, bitcastResType, extract);
0ea1271eSHan-Chung Wang      result =
0ea1271eSHan-Chung Wang          rewriter.create<vector::InsertOp>(loc, bitcast, result, position);
0ea1271eSHan-Chung Wang    }
0ea1271eSHan-Chung Wang
0ea1271eSHan-Chung Wang    rewriter.replaceOp(op, result);
0ea1271eSHan-Chung Wang    return success();
0ea1271eSHan-Chung Wang  }
0ea1271eSHan-Chung Wang
0ea1271eSHan-Chung Wangprivate:
0ea1271eSHan-Chung Wang  int64_t targetRank = 1;
0ea1271eSHan-Chung Wang};
0ea1271eSHan-Chung Wang
0ea1271eSHan-Chung Wang} // namespace
0ea1271eSHan-Chung Wang
0ea1271eSHan-Chung Wangvoid mlir::vector::populateVectorBitCastLoweringPatterns(
0ea1271eSHan-Chung Wang    RewritePatternSet &patterns, int64_t targetRank, PatternBenefit benefit) {
0ea1271eSHan-Chung Wang  patterns.add<UnrollBitCastOp>(targetRank, patterns.getContext(), benefit);
0ea1271eSHan-Chung Wang}