Target/RISCV/RISCVCodeGenPrepare.cpp

1a8468baSCraig Topper//===----- RISCVCodeGenPrepare.cpp ----------------------------------------===//
1a8468baSCraig Topper//
1a8468baSCraig Topper// Part of the LLVM Project, under the Apache License v2.0 with LLVM Exceptions.
1a8468baSCraig Topper// See https://llvm.org/LICENSE.txt for license information.
1a8468baSCraig Topper// SPDX-License-Identifier: Apache-2.0 WITH LLVM-exception
1a8468baSCraig Topper//
1a8468baSCraig Topper//===----------------------------------------------------------------------===//
1a8468baSCraig Topper//
29463612SCraig Topper// This is a RISC-V specific version of CodeGenPrepare.
1a8468baSCraig Topper// It munges the code in the input function to better prepare it for
1a8468baSCraig Topper// SelectionDAG-based code generation. This works around limitations in it's
1a8468baSCraig Topper// basic-block-at-a-time approach.
1a8468baSCraig Topper//
1a8468baSCraig Topper//===----------------------------------------------------------------------===//
1a8468baSCraig Topper
1a8468baSCraig Topper#include "RISCV.h"
1a8468baSCraig Topper#include "RISCVTargetMachine.h"
1a8468baSCraig Topper#include "llvm/ADT/Statistic.h"
1a8468baSCraig Topper#include "llvm/Analysis/ValueTracking.h"
1a8468baSCraig Topper#include "llvm/CodeGen/TargetPassConfig.h"
94279ae4SYeting Kuo#include "llvm/IR/Dominators.h"
15b0fabbSLuke Lau#include "llvm/IR/IRBuilder.h"
f19497f7SCraig Topper#include "llvm/IR/InstVisitor.h"
15b0fabbSLuke Lau#include "llvm/IR/Intrinsics.h"
93968912SCraig Topper#include "llvm/IR/PatternMatch.h"
1a8468baSCraig Topper#include "llvm/InitializePasses.h"
1a8468baSCraig Topper#include "llvm/Pass.h"
1a8468baSCraig Topper
1a8468baSCraig Topperusing namespace llvm;
1a8468baSCraig Topper
1a8468baSCraig Topper#define DEBUG_TYPE "riscv-codegenprepare"
0f4c9c01SCraig Topper#define PASS_NAME "RISC-V CodeGenPrepare"
1a8468baSCraig Topper
1a8468baSCraig Toppernamespace {
1a8468baSCraig Topper
f19497f7SCraig Topperclass RISCVCodeGenPrepare : public FunctionPass,
f19497f7SCraig Topper                            public InstVisitor<RISCVCodeGenPrepare, bool> {
1a8468baSCraig Topper  const DataLayout *DL;
94279ae4SYeting Kuo  const DominatorTree *DT;
1a8468baSCraig Topper  const RISCVSubtarget *ST;
1a8468baSCraig Topper
1a8468baSCraig Topperpublic:
1a8468baSCraig Topper  static char ID;
1a8468baSCraig Topper
1a8468baSCraig Topper  RISCVCodeGenPrepare() : FunctionPass(ID) {}
1a8468baSCraig Topper
1a8468baSCraig Topper  bool runOnFunction(Function &F) override;
1a8468baSCraig Topper
1a8468baSCraig Topper  StringRef getPassName() const override { return PASS_NAME; }
1a8468baSCraig Topper
1a8468baSCraig Topper  void getAnalysisUsage(AnalysisUsage &AU) const override {
1a8468baSCraig Topper    AU.setPreservesCFG();
94279ae4SYeting Kuo    AU.addRequired<DominatorTreeWrapperPass>();
1a8468baSCraig Topper    AU.addRequired<TargetPassConfig>();
1a8468baSCraig Topper  }
1a8468baSCraig Topper
f19497f7SCraig Topper  bool visitInstruction(Instruction &I) { return false; }
f19497f7SCraig Topper  bool visitAnd(BinaryOperator &BO);
15b0fabbSLuke Lau  bool visitIntrinsicInst(IntrinsicInst &I);
94279ae4SYeting Kuo  bool expandVPStrideLoad(IntrinsicInst &I);
1a8468baSCraig Topper};
1a8468baSCraig Topper
1a8468baSCraig Topper} // end anonymous namespace
1a8468baSCraig Topper
8cc48309SCraig Topper// Try to optimize (i64 (and (zext/sext (i32 X), C1))) if C1 has bit 31 set,
784a2cd5SPhilip Reames// but bits 63:32 are zero. If we know that bit 31 of X is 0, we can fill
784a2cd5SPhilip Reames// the upper 32 bits with ones.
f19497f7SCraig Topperbool RISCVCodeGenPrepare::visitAnd(BinaryOperator &BO) {
8cc48309SCraig Topper  if (!ST->is64Bit())
8cc48309SCraig Topper    return false;
8cc48309SCraig Topper
f19497f7SCraig Topper  if (!BO.getType()->isIntegerTy(64))
8cc48309SCraig Topper    return false;
8cc48309SCraig Topper
93968912SCraig Topper  using namespace PatternMatch;
784a2cd5SPhilip Reames
93968912SCraig Topper  // Left hand side should be a zext nneg.
93968912SCraig Topper  Value *LHSSrc;
93968912SCraig Topper  if (!match(BO.getOperand(0), m_NNegZExt(m_Value(LHSSrc))))
8cc48309SCraig Topper    return false;
8cc48309SCraig Topper
8cc48309SCraig Topper  if (!LHSSrc->getType()->isIntegerTy(32))
8cc48309SCraig Topper    return false;
8cc48309SCraig Topper
8cc48309SCraig Topper  // Right hand side should be a constant.
f19497f7SCraig Topper  Value *RHS = BO.getOperand(1);
8cc48309SCraig Topper
8cc48309SCraig Topper  auto *CI = dyn_cast<ConstantInt>(RHS);
8cc48309SCraig Topper  if (!CI)
8cc48309SCraig Topper    return false;
8cc48309SCraig Topper  uint64_t C = CI->getZExtValue();
8cc48309SCraig Topper
8cc48309SCraig Topper  // Look for constants that fit in 32 bits but not simm12, and can be made
8cc48309SCraig Topper  // into simm12 by sign extending bit 31. This will allow use of ANDI.
8cc48309SCraig Topper  // TODO: Is worth making simm32?
8cc48309SCraig Topper  if (!isUInt<32>(C) || isInt<12>(C) || !isInt<12>(SignExtend64<32>(C)))
8cc48309SCraig Topper    return false;
8cc48309SCraig Topper
8cc48309SCraig Topper  // Sign extend the constant and replace the And operand.
8cc48309SCraig Topper  C = SignExtend64<32>(C);
93968912SCraig Topper  BO.setOperand(1, ConstantInt::get(RHS->getType(), C));
8cc48309SCraig Topper
8cc48309SCraig Topper  return true;
8cc48309SCraig Topper}
8cc48309SCraig Topper
15b0fabbSLuke Lau// LLVM vector reduction intrinsics return a scalar result, but on RISC-V vector
15b0fabbSLuke Lau// reduction instructions write the result in the first element of a vector
15b0fabbSLuke Lau// register. So when a reduction in a loop uses a scalar phi, we end up with
15b0fabbSLuke Lau// unnecessary scalar moves:
15b0fabbSLuke Lau//
15b0fabbSLuke Lau// loop:
15b0fabbSLuke Lau// vfmv.s.f v10, fa0
15b0fabbSLuke Lau// vfredosum.vs v8, v8, v10
15b0fabbSLuke Lau// vfmv.f.s fa0, v8
15b0fabbSLuke Lau//
15b0fabbSLuke Lau// This mainly affects ordered fadd reductions, since other types of reduction
15b0fabbSLuke Lau// typically use element-wise vectorisation in the loop body. This tries to
15b0fabbSLuke Lau// vectorize any scalar phis that feed into a fadd reduction:
15b0fabbSLuke Lau//
15b0fabbSLuke Lau// loop:
15b0fabbSLuke Lau// %phi = phi <float> [ ..., %entry ], [ %acc, %loop ]
f0ac8903SPiotr Fusik// %acc = call float @llvm.vector.reduce.fadd.nxv2f32(float %phi,
f0ac8903SPiotr Fusik//                                                    <vscale x 2 x float> %vec)
15b0fabbSLuke Lau//
15b0fabbSLuke Lau// ->
15b0fabbSLuke Lau//
15b0fabbSLuke Lau// loop:
15b0fabbSLuke Lau// %phi = phi <vscale x 2 x float> [ ..., %entry ], [ %acc.vec, %loop ]
15b0fabbSLuke Lau// %phi.scalar = extractelement <vscale x 2 x float> %phi, i64 0
f0ac8903SPiotr Fusik// %acc = call float @llvm.vector.reduce.fadd.nxv2f32(float %x,
f0ac8903SPiotr Fusik//                                                    <vscale x 2 x float> %vec)
15b0fabbSLuke Lau// %acc.vec = insertelement <vscale x 2 x float> poison, float %acc.next, i64 0
15b0fabbSLuke Lau//
15b0fabbSLuke Lau// Which eliminates the scalar -> vector -> scalar crossing during instruction
15b0fabbSLuke Lau// selection.
15b0fabbSLuke Laubool RISCVCodeGenPrepare::visitIntrinsicInst(IntrinsicInst &I) {
94279ae4SYeting Kuo  if (expandVPStrideLoad(I))
94279ae4SYeting Kuo    return true;
94279ae4SYeting Kuo
15b0fabbSLuke Lau  if (I.getIntrinsicID() != Intrinsic::vector_reduce_fadd)
15b0fabbSLuke Lau    return false;
15b0fabbSLuke Lau
15b0fabbSLuke Lau  auto *PHI = dyn_cast<PHINode>(I.getOperand(0));
15b0fabbSLuke Lau  if (!PHI || !PHI->hasOneUse() ||
15b0fabbSLuke Lau      !llvm::is_contained(PHI->incoming_values(), &I))
15b0fabbSLuke Lau    return false;
15b0fabbSLuke Lau
15b0fabbSLuke Lau  Type *VecTy = I.getOperand(1)->getType();
15b0fabbSLuke Lau  IRBuilder<> Builder(PHI);
15b0fabbSLuke Lau  auto *VecPHI = Builder.CreatePHI(VecTy, PHI->getNumIncomingValues());
15b0fabbSLuke Lau
15b0fabbSLuke Lau  for (auto *BB : PHI->blocks()) {
15b0fabbSLuke Lau    Builder.SetInsertPoint(BB->getTerminator());
15b0fabbSLuke Lau    Value *InsertElt = Builder.CreateInsertElement(
15b0fabbSLuke Lau        VecTy, PHI->getIncomingValueForBlock(BB), (uint64_t)0);
15b0fabbSLuke Lau    VecPHI->addIncoming(InsertElt, BB);
15b0fabbSLuke Lau  }
15b0fabbSLuke Lau
15b0fabbSLuke Lau  Builder.SetInsertPoint(&I);
15b0fabbSLuke Lau  I.setOperand(0, Builder.CreateExtractElement(VecPHI, (uint64_t)0));
15b0fabbSLuke Lau
15b0fabbSLuke Lau  PHI->eraseFromParent();
15b0fabbSLuke Lau
15b0fabbSLuke Lau  return true;
15b0fabbSLuke Lau}
15b0fabbSLuke Lau
d5f4f084SLuke Lau// Always expand zero strided loads so we match more .vx splat patterns, even if
d5f4f084SLuke Lau// we have +optimized-zero-stride-loads. RISCVDAGToDAGISel::Select will convert
d5f4f084SLuke Lau// it back to a strided load if it's optimized.
94279ae4SYeting Kuobool RISCVCodeGenPrepare::expandVPStrideLoad(IntrinsicInst &II) {
94279ae4SYeting Kuo  Value *BasePtr, *VL;
94279ae4SYeting Kuo
94279ae4SYeting Kuo  using namespace PatternMatch;
94279ae4SYeting Kuo  if (!match(&II, m_Intrinsic<Intrinsic::experimental_vp_strided_load>(
94279ae4SYeting Kuo                      m_Value(BasePtr), m_Zero(), m_AllOnes(), m_Value(VL))))
94279ae4SYeting Kuo    return false;
94279ae4SYeting Kuo
563ae620SLuke Lau  // If SEW>XLEN then a splat will get lowered as a zero strided load anyway, so
563ae620SLuke Lau  // avoid expanding here.
563ae620SLuke Lau  if (II.getType()->getScalarSizeInBits() > ST->getXLen())
563ae620SLuke Lau    return false;
563ae620SLuke Lau
94279ae4SYeting Kuo  if (!isKnownNonZero(VL, {*DL, DT, nullptr, &II}))
94279ae4SYeting Kuo    return false;
94279ae4SYeting Kuo
94279ae4SYeting Kuo  auto *VTy = cast<VectorType>(II.getType());
94279ae4SYeting Kuo
94279ae4SYeting Kuo  IRBuilder<> Builder(&II);
94279ae4SYeting Kuo  Type *STy = VTy->getElementType();
94279ae4SYeting Kuo  Value *Val = Builder.CreateLoad(STy, BasePtr);
*87af9ee8SYeting Kuo  Value *Res = Builder.CreateIntrinsic(Intrinsic::experimental_vp_splat, {VTy},
*87af9ee8SYeting Kuo                                       {Val, II.getOperand(2), VL});
94279ae4SYeting Kuo
94279ae4SYeting Kuo  II.replaceAllUsesWith(Res);
94279ae4SYeting Kuo  II.eraseFromParent();
94279ae4SYeting Kuo  return true;
94279ae4SYeting Kuo}
94279ae4SYeting Kuo
1a8468baSCraig Topperbool RISCVCodeGenPrepare::runOnFunction(Function &F) {
1a8468baSCraig Topper  if (skipFunction(F))
1a8468baSCraig Topper    return false;
1a8468baSCraig Topper
1a8468baSCraig Topper  auto &TPC = getAnalysis<TargetPassConfig>();
1a8468baSCraig Topper  auto &TM = TPC.getTM<RISCVTargetMachine>();
1a8468baSCraig Topper  ST = &TM.getSubtarget<RISCVSubtarget>(F);
1a8468baSCraig Topper
9df71d76SNikita Popov  DL = &F.getDataLayout();
94279ae4SYeting Kuo  DT = &getAnalysis<DominatorTreeWrapperPass>().getDomTree();
1a8468baSCraig Topper
1a8468baSCraig Topper  bool MadeChange = false;
f19497f7SCraig Topper  for (auto &BB : F)
f19497f7SCraig Topper    for (Instruction &I : llvm::make_early_inc_range(BB))
f19497f7SCraig Topper      MadeChange |= visit(I);
1a8468baSCraig Topper
1a8468baSCraig Topper  return MadeChange;
1a8468baSCraig Topper}
1a8468baSCraig Topper
1a8468baSCraig TopperINITIALIZE_PASS_BEGIN(RISCVCodeGenPrepare, DEBUG_TYPE, PASS_NAME, false, false)
1a8468baSCraig TopperINITIALIZE_PASS_DEPENDENCY(TargetPassConfig)
1a8468baSCraig TopperINITIALIZE_PASS_END(RISCVCodeGenPrepare, DEBUG_TYPE, PASS_NAME, false, false)
1a8468baSCraig Topper
1a8468baSCraig Topperchar RISCVCodeGenPrepare::ID = 0;
1a8468baSCraig Topper
1a8468baSCraig TopperFunctionPass *llvm::createRISCVCodeGenPreparePass() {
1a8468baSCraig Topper  return new RISCVCodeGenPrepare();
1a8468baSCraig Topper}