Target/X86/X86ISelLoweringCall.cpp

26a73082SReid Kleckner//===- llvm/lib/Target/X86/X86ISelCallLowering.cpp - Call lowering --------===//
26a73082SReid Kleckner//
26a73082SReid Kleckner// Part of the LLVM Project, under the Apache License v2.0 with LLVM Exceptions.
26a73082SReid Kleckner// See https://llvm.org/LICENSE.txt for license information.
26a73082SReid Kleckner// SPDX-License-Identifier: Apache-2.0 WITH LLVM-exception
26a73082SReid Kleckner//
26a73082SReid Kleckner//===----------------------------------------------------------------------===//
26a73082SReid Kleckner//
26a73082SReid Kleckner/// \file
26a73082SReid Kleckner/// This file implements the lowering of LLVM calls to DAG nodes.
26a73082SReid Kleckner//
26a73082SReid Kleckner//===----------------------------------------------------------------------===//
26a73082SReid Kleckner
26a73082SReid Kleckner#include "X86.h"
26a73082SReid Kleckner#include "X86CallingConv.h"
26a73082SReid Kleckner#include "X86FrameLowering.h"
26a73082SReid Kleckner#include "X86ISelLowering.h"
26a73082SReid Kleckner#include "X86InstrBuilder.h"
26a73082SReid Kleckner#include "X86MachineFunctionInfo.h"
26a73082SReid Kleckner#include "X86TargetMachine.h"
26a73082SReid Kleckner#include "llvm/ADT/Statistic.h"
26a73082SReid Kleckner#include "llvm/Analysis/ObjCARCUtil.h"
26a73082SReid Kleckner#include "llvm/CodeGen/MachineJumpTableInfo.h"
26a73082SReid Kleckner#include "llvm/CodeGen/MachineModuleInfo.h"
26a73082SReid Kleckner#include "llvm/CodeGen/WinEHFuncInfo.h"
26a73082SReid Kleckner#include "llvm/IR/DiagnosticInfo.h"
26a73082SReid Kleckner#include "llvm/IR/IRBuilder.h"
74deadf1SNikita Popov#include "llvm/IR/Module.h"
26a73082SReid Kleckner
26a73082SReid Kleckner#define DEBUG_TYPE "x86-isel"
26a73082SReid Kleckner
26a73082SReid Klecknerusing namespace llvm;
26a73082SReid Kleckner
26a73082SReid KlecknerSTATISTIC(NumTailCalls, "Number of tail calls");
26a73082SReid Kleckner
26a73082SReid Kleckner/// Call this when the user attempts to do something unsupported, like
26a73082SReid Kleckner/// returning a double without SSE2 enabled on x86_64. This is not fatal, unlike
26a73082SReid Kleckner/// report_fatal_error, so calling code should attempt to recover without
26a73082SReid Kleckner/// crashing.
26a73082SReid Klecknerstatic void errorUnsupported(SelectionDAG &DAG, const SDLoc &dl,
26a73082SReid Kleckner                             const char *Msg) {
26a73082SReid Kleckner  MachineFunction &MF = DAG.getMachineFunction();
26a73082SReid Kleckner  DAG.getContext()->diagnose(
26a73082SReid Kleckner      DiagnosticInfoUnsupported(MF.getFunction(), Msg, dl.getDebugLoc()));
26a73082SReid Kleckner}
26a73082SReid Kleckner
26a73082SReid Kleckner/// Returns true if a CC can dynamically exclude a register from the list of
26a73082SReid Kleckner/// callee-saved-registers (TargetRegistryInfo::getCalleeSavedRegs()) based on
26a73082SReid Kleckner/// the return registers.
26a73082SReid Klecknerstatic bool shouldDisableRetRegFromCSR(CallingConv::ID CC) {
26a73082SReid Kleckner  switch (CC) {
26a73082SReid Kleckner  default:
26a73082SReid Kleckner    return false;
26a73082SReid Kleckner  case CallingConv::X86_RegCall:
26a73082SReid Kleckner  case CallingConv::PreserveMost:
26a73082SReid Kleckner  case CallingConv::PreserveAll:
26a73082SReid Kleckner    return true;
26a73082SReid Kleckner  }
26a73082SReid Kleckner}
26a73082SReid Kleckner
26a73082SReid Kleckner/// Returns true if a CC can dynamically exclude a register from the list of
26a73082SReid Kleckner/// callee-saved-registers (TargetRegistryInfo::getCalleeSavedRegs()) based on
26a73082SReid Kleckner/// the parameters.
26a73082SReid Klecknerstatic bool shouldDisableArgRegFromCSR(CallingConv::ID CC) {
26a73082SReid Kleckner  return CC == CallingConv::X86_RegCall;
26a73082SReid Kleckner}
26a73082SReid Kleckner
26a73082SReid Klecknerstatic std::pair<MVT, unsigned>
26a73082SReid KlecknerhandleMaskRegisterForCallingConv(unsigned NumElts, CallingConv::ID CC,
26a73082SReid Kleckner                                 const X86Subtarget &Subtarget) {
26a73082SReid Kleckner  // v2i1/v4i1/v8i1/v16i1 all pass in xmm registers unless the calling
26a73082SReid Kleckner  // convention is one that uses k registers.
26a73082SReid Kleckner  if (NumElts == 2)
26a73082SReid Kleckner    return {MVT::v2i64, 1};
26a73082SReid Kleckner  if (NumElts == 4)
26a73082SReid Kleckner    return {MVT::v4i32, 1};
26a73082SReid Kleckner  if (NumElts == 8 && CC != CallingConv::X86_RegCall &&
26a73082SReid Kleckner      CC != CallingConv::Intel_OCL_BI)
26a73082SReid Kleckner    return {MVT::v8i16, 1};
26a73082SReid Kleckner  if (NumElts == 16 && CC != CallingConv::X86_RegCall &&
26a73082SReid Kleckner      CC != CallingConv::Intel_OCL_BI)
26a73082SReid Kleckner    return {MVT::v16i8, 1};
26a73082SReid Kleckner  // v32i1 passes in ymm unless we have BWI and the calling convention is
26a73082SReid Kleckner  // regcall.
26a73082SReid Kleckner  if (NumElts == 32 && (!Subtarget.hasBWI() || CC != CallingConv::X86_RegCall))
26a73082SReid Kleckner    return {MVT::v32i8, 1};
26a73082SReid Kleckner  // Split v64i1 vectors if we don't have v64i8 available.
26a73082SReid Kleckner  if (NumElts == 64 && Subtarget.hasBWI() && CC != CallingConv::X86_RegCall) {
26a73082SReid Kleckner    if (Subtarget.useAVX512Regs())
26a73082SReid Kleckner      return {MVT::v64i8, 1};
26a73082SReid Kleckner    return {MVT::v32i8, 2};
26a73082SReid Kleckner  }
26a73082SReid Kleckner
26a73082SReid Kleckner  // Break wide or odd vXi1 vectors into scalars to match avx2 behavior.
26a73082SReid Kleckner  if (!isPowerOf2_32(NumElts) || (NumElts == 64 && !Subtarget.hasBWI()) ||
26a73082SReid Kleckner      NumElts > 64)
26a73082SReid Kleckner    return {MVT::i8, NumElts};
26a73082SReid Kleckner
26a73082SReid Kleckner  return {MVT::INVALID_SIMPLE_VALUE_TYPE, 0};
26a73082SReid Kleckner}
26a73082SReid Kleckner
26a73082SReid KlecknerMVT X86TargetLowering::getRegisterTypeForCallingConv(LLVMContext &Context,
26a73082SReid Kleckner                                                     CallingConv::ID CC,
26a73082SReid Kleckner                                                     EVT VT) const {
26a73082SReid Kleckner  if (VT.isVector()) {
26a73082SReid Kleckner    if (VT.getVectorElementType() == MVT::i1 && Subtarget.hasAVX512()) {
26a73082SReid Kleckner      unsigned NumElts = VT.getVectorNumElements();
26a73082SReid Kleckner
26a73082SReid Kleckner      MVT RegisterVT;
26a73082SReid Kleckner      unsigned NumRegisters;
26a73082SReid Kleckner      std::tie(RegisterVT, NumRegisters) =
26a73082SReid Kleckner          handleMaskRegisterForCallingConv(NumElts, CC, Subtarget);
26a73082SReid Kleckner      if (RegisterVT != MVT::INVALID_SIMPLE_VALUE_TYPE)
26a73082SReid Kleckner        return RegisterVT;
26a73082SReid Kleckner    }
26a73082SReid Kleckner
26a73082SReid Kleckner    if (VT.getVectorElementType() == MVT::f16 && VT.getVectorNumElements() < 8)
26a73082SReid Kleckner      return MVT::v8f16;
26a73082SReid Kleckner  }
26a73082SReid Kleckner
26a73082SReid Kleckner  // We will use more GPRs for f64 and f80 on 32 bits when x87 is disabled.
26a73082SReid Kleckner  if ((VT == MVT::f64 || VT == MVT::f80) && !Subtarget.is64Bit() &&
26a73082SReid Kleckner      !Subtarget.hasX87())
26a73082SReid Kleckner    return MVT::i32;
26a73082SReid Kleckner
9177e812SMatt Arsenault  if (isTypeLegal(MVT::f16)) {
26a73082SReid Kleckner    if (VT.isVector() && VT.getVectorElementType() == MVT::bf16)
9177e812SMatt Arsenault      return getRegisterTypeForCallingConv(
9177e812SMatt Arsenault          Context, CC, VT.changeVectorElementType(MVT::f16));
26a73082SReid Kleckner
59af659eSPhoebe Wang    if (VT == MVT::bf16)
59af659eSPhoebe Wang      return MVT::f16;
9177e812SMatt Arsenault  }
59af659eSPhoebe Wang
26a73082SReid Kleckner  return TargetLowering::getRegisterTypeForCallingConv(Context, CC, VT);
26a73082SReid Kleckner}
26a73082SReid Kleckner
26a73082SReid Klecknerunsigned X86TargetLowering::getNumRegistersForCallingConv(LLVMContext &Context,
26a73082SReid Kleckner                                                          CallingConv::ID CC,
26a73082SReid Kleckner                                                          EVT VT) const {
26a73082SReid Kleckner  if (VT.isVector()) {
26a73082SReid Kleckner    if (VT.getVectorElementType() == MVT::i1 && Subtarget.hasAVX512()) {
26a73082SReid Kleckner      unsigned NumElts = VT.getVectorNumElements();
26a73082SReid Kleckner
26a73082SReid Kleckner      MVT RegisterVT;
26a73082SReid Kleckner      unsigned NumRegisters;
26a73082SReid Kleckner      std::tie(RegisterVT, NumRegisters) =
26a73082SReid Kleckner          handleMaskRegisterForCallingConv(NumElts, CC, Subtarget);
26a73082SReid Kleckner      if (RegisterVT != MVT::INVALID_SIMPLE_VALUE_TYPE)
26a73082SReid Kleckner        return NumRegisters;
26a73082SReid Kleckner    }
26a73082SReid Kleckner
26a73082SReid Kleckner    if (VT.getVectorElementType() == MVT::f16 && VT.getVectorNumElements() < 8)
26a73082SReid Kleckner      return 1;
26a73082SReid Kleckner  }
26a73082SReid Kleckner
26a73082SReid Kleckner  // We have to split f64 to 2 registers and f80 to 3 registers on 32 bits if
26a73082SReid Kleckner  // x87 is disabled.
26a73082SReid Kleckner  if (!Subtarget.is64Bit() && !Subtarget.hasX87()) {
26a73082SReid Kleckner    if (VT == MVT::f64)
26a73082SReid Kleckner      return 2;
26a73082SReid Kleckner    if (VT == MVT::f80)
26a73082SReid Kleckner      return 3;
26a73082SReid Kleckner  }
26a73082SReid Kleckner
9177e812SMatt Arsenault  if (VT.isVector() && VT.getVectorElementType() == MVT::bf16 &&
9177e812SMatt Arsenault      isTypeLegal(MVT::f16))
26a73082SReid Kleckner    return getNumRegistersForCallingConv(Context, CC,
26a73082SReid Kleckner                                         VT.changeVectorElementType(MVT::f16));
26a73082SReid Kleckner
26a73082SReid Kleckner  return TargetLowering::getNumRegistersForCallingConv(Context, CC, VT);
26a73082SReid Kleckner}
26a73082SReid Kleckner
26a73082SReid Klecknerunsigned X86TargetLowering::getVectorTypeBreakdownForCallingConv(
26a73082SReid Kleckner    LLVMContext &Context, CallingConv::ID CC, EVT VT, EVT &IntermediateVT,
26a73082SReid Kleckner    unsigned &NumIntermediates, MVT &RegisterVT) const {
26a73082SReid Kleckner  // Break wide or odd vXi1 vectors into scalars to match avx2 behavior.
26a73082SReid Kleckner  if (VT.isVector() && VT.getVectorElementType() == MVT::i1 &&
26a73082SReid Kleckner      Subtarget.hasAVX512() &&
26a73082SReid Kleckner      (!isPowerOf2_32(VT.getVectorNumElements()) ||
26a73082SReid Kleckner       (VT.getVectorNumElements() == 64 && !Subtarget.hasBWI()) ||
26a73082SReid Kleckner       VT.getVectorNumElements() > 64)) {
26a73082SReid Kleckner    RegisterVT = MVT::i8;
26a73082SReid Kleckner    IntermediateVT = MVT::i1;
26a73082SReid Kleckner    NumIntermediates = VT.getVectorNumElements();
26a73082SReid Kleckner    return NumIntermediates;
26a73082SReid Kleckner  }
26a73082SReid Kleckner
26a73082SReid Kleckner  // Split v64i1 vectors if we don't have v64i8 available.
26a73082SReid Kleckner  if (VT == MVT::v64i1 && Subtarget.hasBWI() && !Subtarget.useAVX512Regs() &&
26a73082SReid Kleckner      CC != CallingConv::X86_RegCall) {
26a73082SReid Kleckner    RegisterVT = MVT::v32i8;
26a73082SReid Kleckner    IntermediateVT = MVT::v32i1;
26a73082SReid Kleckner    NumIntermediates = 2;
26a73082SReid Kleckner    return 2;
26a73082SReid Kleckner  }
26a73082SReid Kleckner
26a73082SReid Kleckner  // Split vNbf16 vectors according to vNf16.
9177e812SMatt Arsenault  if (VT.isVector() && VT.getVectorElementType() == MVT::bf16 &&
9177e812SMatt Arsenault      isTypeLegal(MVT::f16))
26a73082SReid Kleckner    VT = VT.changeVectorElementType(MVT::f16);
26a73082SReid Kleckner
26a73082SReid Kleckner  return TargetLowering::getVectorTypeBreakdownForCallingConv(Context, CC, VT, IntermediateVT,
26a73082SReid Kleckner                                              NumIntermediates, RegisterVT);
26a73082SReid Kleckner}
26a73082SReid Kleckner
26a73082SReid KlecknerEVT X86TargetLowering::getSetCCResultType(const DataLayout &DL,
26a73082SReid Kleckner                                          LLVMContext& Context,
26a73082SReid Kleckner                                          EVT VT) const {
26a73082SReid Kleckner  if (!VT.isVector())
26a73082SReid Kleckner    return MVT::i8;
26a73082SReid Kleckner
26a73082SReid Kleckner  if (Subtarget.hasAVX512()) {
26a73082SReid Kleckner    // Figure out what this type will be legalized to.
26a73082SReid Kleckner    EVT LegalVT = VT;
26a73082SReid Kleckner    while (getTypeAction(Context, LegalVT) != TypeLegal)
26a73082SReid Kleckner      LegalVT = getTypeToTransformTo(Context, LegalVT);
26a73082SReid Kleckner
26a73082SReid Kleckner    // If we got a 512-bit vector then we'll definitely have a vXi1 compare.
26a73082SReid Kleckner    if (LegalVT.getSimpleVT().is512BitVector())
26a73082SReid Kleckner      return EVT::getVectorVT(Context, MVT::i1, VT.getVectorElementCount());
26a73082SReid Kleckner
26a73082SReid Kleckner    if (LegalVT.getSimpleVT().isVector() && Subtarget.hasVLX()) {
26a73082SReid Kleckner      // If we legalized to less than a 512-bit vector, then we will use a vXi1
26a73082SReid Kleckner      // compare for vXi32/vXi64 for sure. If we have BWI we will also support
26a73082SReid Kleckner      // vXi16/vXi8.
26a73082SReid Kleckner      MVT EltVT = LegalVT.getSimpleVT().getVectorElementType();
26a73082SReid Kleckner      if (Subtarget.hasBWI() || EltVT.getSizeInBits() >= 32)
26a73082SReid Kleckner        return EVT::getVectorVT(Context, MVT::i1, VT.getVectorElementCount());
26a73082SReid Kleckner    }
26a73082SReid Kleckner  }
26a73082SReid Kleckner
26a73082SReid Kleckner  return VT.changeVectorElementTypeToInteger();
26a73082SReid Kleckner}
26a73082SReid Kleckner
*2068b1baSNikita Popovbool X86TargetLowering::functionArgumentNeedsConsecutiveRegisters(
*2068b1baSNikita Popov    Type *Ty, CallingConv::ID CallConv, bool isVarArg,
*2068b1baSNikita Popov    const DataLayout &DL) const {
*2068b1baSNikita Popov  // i128 split into i64 needs to be allocated to two consecutive registers,
*2068b1baSNikita Popov  // or spilled to the stack as a whole.
*2068b1baSNikita Popov  return Ty->isIntegerTy(128);
*2068b1baSNikita Popov}
*2068b1baSNikita Popov
26a73082SReid Kleckner/// Helper for getByValTypeAlignment to determine
26a73082SReid Kleckner/// the desired ByVal argument alignment.
26a73082SReid Klecknerstatic void getMaxByValAlign(Type *Ty, Align &MaxAlign) {
26a73082SReid Kleckner  if (MaxAlign == 16)
26a73082SReid Kleckner    return;
26a73082SReid Kleckner  if (VectorType *VTy = dyn_cast<VectorType>(Ty)) {
26a73082SReid Kleckner    if (VTy->getPrimitiveSizeInBits().getFixedValue() == 128)
26a73082SReid Kleckner      MaxAlign = Align(16);
26a73082SReid Kleckner  } else if (ArrayType *ATy = dyn_cast<ArrayType>(Ty)) {
26a73082SReid Kleckner    Align EltAlign;
26a73082SReid Kleckner    getMaxByValAlign(ATy->getElementType(), EltAlign);
26a73082SReid Kleckner    if (EltAlign > MaxAlign)
26a73082SReid Kleckner      MaxAlign = EltAlign;
26a73082SReid Kleckner  } else if (StructType *STy = dyn_cast<StructType>(Ty)) {
26a73082SReid Kleckner    for (auto *EltTy : STy->elements()) {
26a73082SReid Kleckner      Align EltAlign;
26a73082SReid Kleckner      getMaxByValAlign(EltTy, EltAlign);
26a73082SReid Kleckner      if (EltAlign > MaxAlign)
26a73082SReid Kleckner        MaxAlign = EltAlign;
26a73082SReid Kleckner      if (MaxAlign == 16)
26a73082SReid Kleckner        break;
26a73082SReid Kleckner    }
26a73082SReid Kleckner  }
26a73082SReid Kleckner}
26a73082SReid Kleckner
26a73082SReid Kleckner/// Return the desired alignment for ByVal aggregate
26a73082SReid Kleckner/// function arguments in the caller parameter area. For X86, aggregates
26a73082SReid Kleckner/// that contain SSE vectors are placed at 16-byte boundaries while the rest
26a73082SReid Kleckner/// are at 4-byte boundaries.
e55c1677SSergei BarannikovAlign X86TargetLowering::getByValTypeAlignment(Type *Ty,
26a73082SReid Kleckner                                               const DataLayout &DL) const {
e55c1677SSergei Barannikov  if (Subtarget.is64Bit())
e55c1677SSergei Barannikov    return std::max(DL.getABITypeAlign(Ty), Align::Constant<8>());
26a73082SReid Kleckner
26a73082SReid Kleckner  Align Alignment(4);
26a73082SReid Kleckner  if (Subtarget.hasSSE1())
26a73082SReid Kleckner    getMaxByValAlign(Ty, Alignment);
e55c1677SSergei Barannikov  return Alignment;
26a73082SReid Kleckner}
26a73082SReid Kleckner
26a73082SReid Kleckner/// It returns EVT::Other if the type should be determined using generic
26a73082SReid Kleckner/// target-independent logic.
26a73082SReid Kleckner/// For vector ops we check that the overall size isn't larger than our
26a73082SReid Kleckner/// preferred vector width.
26a73082SReid KlecknerEVT X86TargetLowering::getOptimalMemOpType(
26a73082SReid Kleckner    const MemOp &Op, const AttributeList &FuncAttributes) const {
26a73082SReid Kleckner  if (!FuncAttributes.hasFnAttr(Attribute::NoImplicitFloat)) {
26a73082SReid Kleckner    if (Op.size() >= 16 &&
26a73082SReid Kleckner        (!Subtarget.isUnalignedMem16Slow() || Op.isAligned(Align(16)))) {
26a73082SReid Kleckner      // FIXME: Check if unaligned 64-byte accesses are slow.
58d4fe28SPhoebe Wang      if (Op.size() >= 64 && Subtarget.hasAVX512() && Subtarget.hasEVEX512() &&
26a73082SReid Kleckner          (Subtarget.getPreferVectorWidth() >= 512)) {
26a73082SReid Kleckner        return Subtarget.hasBWI() ? MVT::v64i8 : MVT::v16i32;
26a73082SReid Kleckner      }
26a73082SReid Kleckner      // FIXME: Check if unaligned 32-byte accesses are slow.
26a73082SReid Kleckner      if (Op.size() >= 32 && Subtarget.hasAVX() &&
26a73082SReid Kleckner          Subtarget.useLight256BitInstructions()) {
26a73082SReid Kleckner        // Although this isn't a well-supported type for AVX1, we'll let
26a73082SReid Kleckner        // legalization and shuffle lowering produce the optimal codegen. If we
26a73082SReid Kleckner        // choose an optimal type with a vector element larger than a byte,
26a73082SReid Kleckner        // getMemsetStores() may create an intermediate splat (using an integer
26a73082SReid Kleckner        // multiply) before we splat as a vector.
26a73082SReid Kleckner        return MVT::v32i8;
26a73082SReid Kleckner      }
26a73082SReid Kleckner      if (Subtarget.hasSSE2() && (Subtarget.getPreferVectorWidth() >= 128))
26a73082SReid Kleckner        return MVT::v16i8;
26a73082SReid Kleckner      // TODO: Can SSE1 handle a byte vector?
26a73082SReid Kleckner      // If we have SSE1 registers we should be able to use them.
26a73082SReid Kleckner      if (Subtarget.hasSSE1() && (Subtarget.is64Bit() || Subtarget.hasX87()) &&
26a73082SReid Kleckner          (Subtarget.getPreferVectorWidth() >= 128))
26a73082SReid Kleckner        return MVT::v4f32;
26a73082SReid Kleckner    } else if (((Op.isMemcpy() && !Op.isMemcpyStrSrc()) || Op.isZeroMemset()) &&
26a73082SReid Kleckner               Op.size() >= 8 && !Subtarget.is64Bit() && Subtarget.hasSSE2()) {
26a73082SReid Kleckner      // Do not use f64 to lower memcpy if source is string constant. It's
26a73082SReid Kleckner      // better to use i32 to avoid the loads.
26a73082SReid Kleckner      // Also, do not use f64 to lower memset unless this is a memset of zeros.
26a73082SReid Kleckner      // The gymnastics of splatting a byte value into an XMM register and then
26a73082SReid Kleckner      // only using 8-byte stores (because this is a CPU with slow unaligned
26a73082SReid Kleckner      // 16-byte accesses) makes that a loser.
26a73082SReid Kleckner      return MVT::f64;
26a73082SReid Kleckner    }
26a73082SReid Kleckner  }
26a73082SReid Kleckner  // This is a compromise. If we reach here, unaligned accesses may be slow on
26a73082SReid Kleckner  // this target. However, creating smaller, aligned accesses could be even
26a73082SReid Kleckner  // slower and would certainly be a lot more code.
26a73082SReid Kleckner  if (Subtarget.is64Bit() && Op.size() >= 8)
26a73082SReid Kleckner    return MVT::i64;
26a73082SReid Kleckner  return MVT::i32;
26a73082SReid Kleckner}
26a73082SReid Kleckner
26a73082SReid Klecknerbool X86TargetLowering::isSafeMemOpType(MVT VT) const {
26a73082SReid Kleckner  if (VT == MVT::f32)
26a73082SReid Kleckner    return Subtarget.hasSSE1();
26a73082SReid Kleckner  if (VT == MVT::f64)
26a73082SReid Kleckner    return Subtarget.hasSSE2();
26a73082SReid Kleckner  return true;
26a73082SReid Kleckner}
26a73082SReid Kleckner
26a73082SReid Klecknerstatic bool isBitAligned(Align Alignment, uint64_t SizeInBits) {
26a73082SReid Kleckner  return (8 * Alignment.value()) % SizeInBits == 0;
26a73082SReid Kleckner}
26a73082SReid Kleckner
26a73082SReid Klecknerbool X86TargetLowering::isMemoryAccessFast(EVT VT, Align Alignment) const {
26a73082SReid Kleckner  if (isBitAligned(Alignment, VT.getSizeInBits()))
26a73082SReid Kleckner    return true;
26a73082SReid Kleckner  switch (VT.getSizeInBits()) {
26a73082SReid Kleckner  default:
26a73082SReid Kleckner    // 8-byte and under are always assumed to be fast.
26a73082SReid Kleckner    return true;
26a73082SReid Kleckner  case 128:
26a73082SReid Kleckner    return !Subtarget.isUnalignedMem16Slow();
26a73082SReid Kleckner  case 256:
26a73082SReid Kleckner    return !Subtarget.isUnalignedMem32Slow();
26a73082SReid Kleckner    // TODO: What about AVX-512 (512-bit) accesses?
26a73082SReid Kleckner  }
26a73082SReid Kleckner}
26a73082SReid Kleckner
26a73082SReid Klecknerbool X86TargetLowering::allowsMisalignedMemoryAccesses(
26a73082SReid Kleckner    EVT VT, unsigned, Align Alignment, MachineMemOperand::Flags Flags,
26a73082SReid Kleckner    unsigned *Fast) const {
26a73082SReid Kleckner  if (Fast)
26a73082SReid Kleckner    *Fast = isMemoryAccessFast(VT, Alignment);
26a73082SReid Kleckner  // NonTemporal vector memory ops must be aligned.
26a73082SReid Kleckner  if (!!(Flags & MachineMemOperand::MONonTemporal) && VT.isVector()) {
26a73082SReid Kleckner    // NT loads can only be vector aligned, so if its less aligned than the
26a73082SReid Kleckner    // minimum vector size (which we can split the vector down to), we might as
26a73082SReid Kleckner    // well use a regular unaligned vector load.
26a73082SReid Kleckner    // We don't have any NT loads pre-SSE41.
26a73082SReid Kleckner    if (!!(Flags & MachineMemOperand::MOLoad))
26a73082SReid Kleckner      return (Alignment < 16 || !Subtarget.hasSSE41());
26a73082SReid Kleckner    return false;
26a73082SReid Kleckner  }
26a73082SReid Kleckner  // Misaligned accesses of any size are always allowed.
26a73082SReid Kleckner  return true;
26a73082SReid Kleckner}
26a73082SReid Kleckner
26a73082SReid Klecknerbool X86TargetLowering::allowsMemoryAccess(LLVMContext &Context,
26a73082SReid Kleckner                                           const DataLayout &DL, EVT VT,
26a73082SReid Kleckner                                           unsigned AddrSpace, Align Alignment,
26a73082SReid Kleckner                                           MachineMemOperand::Flags Flags,
26a73082SReid Kleckner                                           unsigned *Fast) const {
26a73082SReid Kleckner  if (Fast)
26a73082SReid Kleckner    *Fast = isMemoryAccessFast(VT, Alignment);
26a73082SReid Kleckner  if (!!(Flags & MachineMemOperand::MONonTemporal) && VT.isVector()) {
26a73082SReid Kleckner    if (allowsMisalignedMemoryAccesses(VT, AddrSpace, Alignment, Flags,
26a73082SReid Kleckner                                       /*Fast=*/nullptr))
26a73082SReid Kleckner      return true;
26a73082SReid Kleckner    // NonTemporal vector memory ops are special, and must be aligned.
26a73082SReid Kleckner    if (!isBitAligned(Alignment, VT.getSizeInBits()))
26a73082SReid Kleckner      return false;
26a73082SReid Kleckner    switch (VT.getSizeInBits()) {
26a73082SReid Kleckner    case 128:
26a73082SReid Kleckner      if (!!(Flags & MachineMemOperand::MOLoad) && Subtarget.hasSSE41())
26a73082SReid Kleckner        return true;
26a73082SReid Kleckner      if (!!(Flags & MachineMemOperand::MOStore) && Subtarget.hasSSE2())
26a73082SReid Kleckner        return true;
26a73082SReid Kleckner      return false;
26a73082SReid Kleckner    case 256:
26a73082SReid Kleckner      if (!!(Flags & MachineMemOperand::MOLoad) && Subtarget.hasAVX2())
26a73082SReid Kleckner        return true;
26a73082SReid Kleckner      if (!!(Flags & MachineMemOperand::MOStore) && Subtarget.hasAVX())
26a73082SReid Kleckner        return true;
26a73082SReid Kleckner      return false;
26a73082SReid Kleckner    case 512:
58d4fe28SPhoebe Wang      if (Subtarget.hasAVX512() && Subtarget.hasEVEX512())
26a73082SReid Kleckner        return true;
26a73082SReid Kleckner      return false;
26a73082SReid Kleckner    default:
26a73082SReid Kleckner      return false; // Don't have NonTemporal vector memory ops of this size.
26a73082SReid Kleckner    }
26a73082SReid Kleckner  }
26a73082SReid Kleckner  return true;
26a73082SReid Kleckner}
26a73082SReid Kleckner
26a73082SReid Kleckner/// Return the entry encoding for a jump table in the
26a73082SReid Kleckner/// current function.  The returned value is a member of the
26a73082SReid Kleckner/// MachineJumpTableInfo::JTEntryKind enum.
26a73082SReid Klecknerunsigned X86TargetLowering::getJumpTableEncoding() const {
26a73082SReid Kleckner  // In GOT pic mode, each entry in the jump table is emitted as a @GOTOFF
26a73082SReid Kleckner  // symbol.
26a73082SReid Kleckner  if (isPositionIndependent() && Subtarget.isPICStyleGOT())
26a73082SReid Kleckner    return MachineJumpTableInfo::EK_Custom32;
2a2f02e1SArthur Eubanks  if (isPositionIndependent() &&
300c41c2SArthur Eubanks      getTargetMachine().getCodeModel() == CodeModel::Large &&
300c41c2SArthur Eubanks      !Subtarget.isTargetCOFF())
2a2f02e1SArthur Eubanks    return MachineJumpTableInfo::EK_LabelDifference64;
26a73082SReid Kleckner
26a73082SReid Kleckner  // Otherwise, use the normal jump table encoding heuristics.
26a73082SReid Kleckner  return TargetLowering::getJumpTableEncoding();
26a73082SReid Kleckner}
26a73082SReid Kleckner
26a73082SReid Klecknerbool X86TargetLowering::useSoftFloat() const {
26a73082SReid Kleckner  return Subtarget.useSoftFloat();
26a73082SReid Kleckner}
26a73082SReid Kleckner
26a73082SReid Klecknervoid X86TargetLowering::markLibCallAttributes(MachineFunction *MF, unsigned CC,
26a73082SReid Kleckner                                              ArgListTy &Args) const {
26a73082SReid Kleckner
26a73082SReid Kleckner  // Only relabel X86-32 for C / Stdcall CCs.
26a73082SReid Kleckner  if (Subtarget.is64Bit())
26a73082SReid Kleckner    return;
26a73082SReid Kleckner  if (CC != CallingConv::C && CC != CallingConv::X86_StdCall)
26a73082SReid Kleckner    return;
26a73082SReid Kleckner  unsigned ParamRegs = 0;
26a73082SReid Kleckner  if (auto *M = MF->getFunction().getParent())
26a73082SReid Kleckner    ParamRegs = M->getNumberRegisterParameters();
26a73082SReid Kleckner
26a73082SReid Kleckner  // Mark the first N int arguments as having reg
26a73082SReid Kleckner  for (auto &Arg : Args) {
26a73082SReid Kleckner    Type *T = Arg.Ty;
26a73082SReid Kleckner    if (T->isIntOrPtrTy())
26a73082SReid Kleckner      if (MF->getDataLayout().getTypeAllocSize(T) <= 8) {
26a73082SReid Kleckner        unsigned numRegs = 1;
26a73082SReid Kleckner        if (MF->getDataLayout().getTypeAllocSize(T) > 4)
26a73082SReid Kleckner          numRegs = 2;
26a73082SReid Kleckner        if (ParamRegs < numRegs)
26a73082SReid Kleckner          return;
26a73082SReid Kleckner        ParamRegs -= numRegs;
26a73082SReid Kleckner        Arg.IsInReg = true;
26a73082SReid Kleckner      }
26a73082SReid Kleckner  }
26a73082SReid Kleckner}
26a73082SReid Kleckner
26a73082SReid Klecknerconst MCExpr *
26a73082SReid KlecknerX86TargetLowering::LowerCustomJumpTableEntry(const MachineJumpTableInfo *MJTI,
26a73082SReid Kleckner                                             const MachineBasicBlock *MBB,
26a73082SReid Kleckner                                             unsigned uid,MCContext &Ctx) const{
26a73082SReid Kleckner  assert(isPositionIndependent() && Subtarget.isPICStyleGOT());
26a73082SReid Kleckner  // In 32-bit ELF systems, our jump table entries are formed with @GOTOFF
26a73082SReid Kleckner  // entries.
26a73082SReid Kleckner  return MCSymbolRefExpr::create(MBB->getSymbol(),
26a73082SReid Kleckner                                 MCSymbolRefExpr::VK_GOTOFF, Ctx);
26a73082SReid Kleckner}
26a73082SReid Kleckner
26a73082SReid Kleckner/// Returns relocation base for the given PIC jumptable.
26a73082SReid KlecknerSDValue X86TargetLowering::getPICJumpTableRelocBase(SDValue Table,
26a73082SReid Kleckner                                                    SelectionDAG &DAG) const {
26a73082SReid Kleckner  if (!Subtarget.is64Bit())
26a73082SReid Kleckner    // This doesn't have SDLoc associated with it, but is not really the
26a73082SReid Kleckner    // same as a Register.
26a73082SReid Kleckner    return DAG.getNode(X86ISD::GlobalBaseReg, SDLoc(),
26a73082SReid Kleckner                       getPointerTy(DAG.getDataLayout()));
26a73082SReid Kleckner  return Table;
26a73082SReid Kleckner}
26a73082SReid Kleckner
26a73082SReid Kleckner/// This returns the relocation base for the given PIC jumptable,
26a73082SReid Kleckner/// the same as getPICJumpTableRelocBase, but as an MCExpr.
26a73082SReid Klecknerconst MCExpr *X86TargetLowering::
26a73082SReid KlecknergetPICJumpTableRelocBaseExpr(const MachineFunction *MF, unsigned JTI,
26a73082SReid Kleckner                             MCContext &Ctx) const {
26a73082SReid Kleckner  // X86-64 uses RIP relative addressing based on the jump table label.
2a2f02e1SArthur Eubanks  if (Subtarget.isPICStyleRIPRel() ||
2a2f02e1SArthur Eubanks      (Subtarget.is64Bit() &&
2a2f02e1SArthur Eubanks       getTargetMachine().getCodeModel() == CodeModel::Large))
26a73082SReid Kleckner    return TargetLowering::getPICJumpTableRelocBaseExpr(MF, JTI, Ctx);
26a73082SReid Kleckner
26a73082SReid Kleckner  // Otherwise, the reference is relative to the PIC base.
26a73082SReid Kleckner  return MCSymbolRefExpr::create(MF->getPICBaseSymbol(), Ctx);
26a73082SReid Kleckner}
26a73082SReid Kleckner
26a73082SReid Klecknerstd::pair<const TargetRegisterClass *, uint8_t>
26a73082SReid KlecknerX86TargetLowering::findRepresentativeClass(const TargetRegisterInfo *TRI,
26a73082SReid Kleckner                                           MVT VT) const {
26a73082SReid Kleckner  const TargetRegisterClass *RRC = nullptr;
26a73082SReid Kleckner  uint8_t Cost = 1;
26a73082SReid Kleckner  switch (VT.SimpleTy) {
26a73082SReid Kleckner  default:
26a73082SReid Kleckner    return TargetLowering::findRepresentativeClass(TRI, VT);
26a73082SReid Kleckner  case MVT::i8: case MVT::i16: case MVT::i32: case MVT::i64:
26a73082SReid Kleckner    RRC = Subtarget.is64Bit() ? &X86::GR64RegClass : &X86::GR32RegClass;
26a73082SReid Kleckner    break;
26a73082SReid Kleckner  case MVT::x86mmx:
26a73082SReid Kleckner    RRC = &X86::VR64RegClass;
26a73082SReid Kleckner    break;
26a73082SReid Kleckner  case MVT::f32: case MVT::f64:
26a73082SReid Kleckner  case MVT::v16i8: case MVT::v8i16: case MVT::v4i32: case MVT::v2i64:
26a73082SReid Kleckner  case MVT::v4f32: case MVT::v2f64:
26a73082SReid Kleckner  case MVT::v32i8: case MVT::v16i16: case MVT::v8i32: case MVT::v4i64:
26a73082SReid Kleckner  case MVT::v8f32: case MVT::v4f64:
26a73082SReid Kleckner  case MVT::v64i8: case MVT::v32i16: case MVT::v16i32: case MVT::v8i64:
26a73082SReid Kleckner  case MVT::v16f32: case MVT::v8f64:
26a73082SReid Kleckner    RRC = &X86::VR128XRegClass;
26a73082SReid Kleckner    break;
26a73082SReid Kleckner  }
26a73082SReid Kleckner  return std::make_pair(RRC, Cost);
26a73082SReid Kleckner}
26a73082SReid Kleckner
26a73082SReid Klecknerunsigned X86TargetLowering::getAddressSpace() const {
26a73082SReid Kleckner  if (Subtarget.is64Bit())
6611efdfSCraig Topper    return (getTargetMachine().getCodeModel() == CodeModel::Kernel) ? X86AS::GS
6611efdfSCraig Topper                                                                    : X86AS::FS;
6611efdfSCraig Topper  return X86AS::GS;
26a73082SReid Kleckner}
26a73082SReid Kleckner
26a73082SReid Klecknerstatic bool hasStackGuardSlotTLS(const Triple &TargetTriple) {
26a73082SReid Kleckner  return TargetTriple.isOSGlibc() || TargetTriple.isOSFuchsia() ||
26a73082SReid Kleckner         (TargetTriple.isAndroid() && !TargetTriple.isAndroidVersionLT(17));
26a73082SReid Kleckner}
26a73082SReid Kleckner
26a73082SReid Klecknerstatic Constant* SegmentOffset(IRBuilderBase &IRB,
26a73082SReid Kleckner                               int Offset, unsigned AddressSpace) {
26a73082SReid Kleckner  return ConstantExpr::getIntToPtr(
26a73082SReid Kleckner      ConstantInt::get(Type::getInt32Ty(IRB.getContext()), Offset),
4ce7c4a9SBjorn Pettersson      IRB.getPtrTy(AddressSpace));
26a73082SReid Kleckner}
26a73082SReid Kleckner
26a73082SReid KlecknerValue *X86TargetLowering::getIRStackGuard(IRBuilderBase &IRB) const {
26a73082SReid Kleckner  // glibc, bionic, and Fuchsia have a special slot for the stack guard in
26a73082SReid Kleckner  // tcbhead_t; use it instead of the usual global variable (see
26a73082SReid Kleckner  // sysdeps/{i386,x86_64}/nptl/tls.h)
26a73082SReid Kleckner  if (hasStackGuardSlotTLS(Subtarget.getTargetTriple())) {
26a73082SReid Kleckner    unsigned AddressSpace = getAddressSpace();
26a73082SReid Kleckner
26a73082SReid Kleckner    // <zircon/tls.h> defines ZX_TLS_STACK_GUARD_OFFSET with this value.
26a73082SReid Kleckner    if (Subtarget.isTargetFuchsia())
26a73082SReid Kleckner      return SegmentOffset(IRB, 0x10, AddressSpace);
26a73082SReid Kleckner
26a73082SReid Kleckner    Module *M = IRB.GetInsertBlock()->getParent()->getParent();
26a73082SReid Kleckner    // Specially, some users may customize the base reg and offset.
26a73082SReid Kleckner    int Offset = M->getStackProtectorGuardOffset();
26a73082SReid Kleckner    // If we don't set -stack-protector-guard-offset value:
26a73082SReid Kleckner    // %fs:0x28, unless we're using a Kernel code model, in which case
26a73082SReid Kleckner    // it's %gs:0x28.  gs:0x14 on i386.
26a73082SReid Kleckner    if (Offset == INT_MAX)
26a73082SReid Kleckner      Offset = (Subtarget.is64Bit()) ? 0x28 : 0x14;
26a73082SReid Kleckner
26a73082SReid Kleckner    StringRef GuardReg = M->getStackProtectorGuardReg();
26a73082SReid Kleckner    if (GuardReg == "fs")
26a73082SReid Kleckner      AddressSpace = X86AS::FS;
26a73082SReid Kleckner    else if (GuardReg == "gs")
26a73082SReid Kleckner      AddressSpace = X86AS::GS;
26a73082SReid Kleckner
26a73082SReid Kleckner    // Use symbol guard if user specify.
26a73082SReid Kleckner    StringRef GuardSymb = M->getStackProtectorGuardSymbol();
26a73082SReid Kleckner    if (!GuardSymb.empty()) {
26a73082SReid Kleckner      GlobalVariable *GV = M->getGlobalVariable(GuardSymb);
26a73082SReid Kleckner      if (!GV) {
26a73082SReid Kleckner        Type *Ty = Subtarget.is64Bit() ? Type::getInt64Ty(M->getContext())
26a73082SReid Kleckner                                       : Type::getInt32Ty(M->getContext());
26a73082SReid Kleckner        GV = new GlobalVariable(*M, Ty, false, GlobalValue::ExternalLinkage,
26a73082SReid Kleckner                                nullptr, GuardSymb, nullptr,
26a73082SReid Kleckner                                GlobalValue::NotThreadLocal, AddressSpace);
26a73082SReid Kleckner        if (!Subtarget.isTargetDarwin())
26a73082SReid Kleckner          GV->setDSOLocal(M->getDirectAccessExternalData());
26a73082SReid Kleckner      }
26a73082SReid Kleckner      return GV;
26a73082SReid Kleckner    }
26a73082SReid Kleckner
26a73082SReid Kleckner    return SegmentOffset(IRB, Offset, AddressSpace);
26a73082SReid Kleckner  }
26a73082SReid Kleckner  return TargetLowering::getIRStackGuard(IRB);
26a73082SReid Kleckner}
26a73082SReid Kleckner
26a73082SReid Klecknervoid X86TargetLowering::insertSSPDeclarations(Module &M) const {
26a73082SReid Kleckner  // MSVC CRT provides functionalities for stack protection.
26a73082SReid Kleckner  if (Subtarget.getTargetTriple().isWindowsMSVCEnvironment() ||
26a73082SReid Kleckner      Subtarget.getTargetTriple().isWindowsItaniumEnvironment()) {
26a73082SReid Kleckner    // MSVC CRT has a global variable holding security cookie.
26a73082SReid Kleckner    M.getOrInsertGlobal("__security_cookie",
7b9d73c2SPaulo Matos                        PointerType::getUnqual(M.getContext()));
26a73082SReid Kleckner
26a73082SReid Kleckner    // MSVC CRT has a function to validate security cookie.
26a73082SReid Kleckner    FunctionCallee SecurityCheckCookie = M.getOrInsertFunction(
26a73082SReid Kleckner        "__security_check_cookie", Type::getVoidTy(M.getContext()),
7b9d73c2SPaulo Matos        PointerType::getUnqual(M.getContext()));
26a73082SReid Kleckner    if (Function *F = dyn_cast<Function>(SecurityCheckCookie.getCallee())) {
26a73082SReid Kleckner      F->setCallingConv(CallingConv::X86_FastCall);
26a73082SReid Kleckner      F->addParamAttr(0, Attribute::AttrKind::InReg);
26a73082SReid Kleckner    }
26a73082SReid Kleckner    return;
26a73082SReid Kleckner  }
26a73082SReid Kleckner
26a73082SReid Kleckner  StringRef GuardMode = M.getStackProtectorGuard();
26a73082SReid Kleckner
26a73082SReid Kleckner  // glibc, bionic, and Fuchsia have a special slot for the stack guard.
26a73082SReid Kleckner  if ((GuardMode == "tls" || GuardMode.empty()) &&
26a73082SReid Kleckner      hasStackGuardSlotTLS(Subtarget.getTargetTriple()))
26a73082SReid Kleckner    return;
26a73082SReid Kleckner  TargetLowering::insertSSPDeclarations(M);
26a73082SReid Kleckner}
26a73082SReid Kleckner
26a73082SReid KlecknerValue *X86TargetLowering::getSDagStackGuard(const Module &M) const {
26a73082SReid Kleckner  // MSVC CRT has a global variable holding security cookie.
26a73082SReid Kleckner  if (Subtarget.getTargetTriple().isWindowsMSVCEnvironment() ||
26a73082SReid Kleckner      Subtarget.getTargetTriple().isWindowsItaniumEnvironment()) {
26a73082SReid Kleckner    return M.getGlobalVariable("__security_cookie");
26a73082SReid Kleckner  }
26a73082SReid Kleckner  return TargetLowering::getSDagStackGuard(M);
26a73082SReid Kleckner}
26a73082SReid Kleckner
26a73082SReid KlecknerFunction *X86TargetLowering::getSSPStackGuardCheck(const Module &M) const {
26a73082SReid Kleckner  // MSVC CRT has a function to validate security cookie.
26a73082SReid Kleckner  if (Subtarget.getTargetTriple().isWindowsMSVCEnvironment() ||
26a73082SReid Kleckner      Subtarget.getTargetTriple().isWindowsItaniumEnvironment()) {
26a73082SReid Kleckner    return M.getFunction("__security_check_cookie");
26a73082SReid Kleckner  }
26a73082SReid Kleckner  return TargetLowering::getSSPStackGuardCheck(M);
26a73082SReid Kleckner}
26a73082SReid Kleckner
26a73082SReid KlecknerValue *
26a73082SReid KlecknerX86TargetLowering::getSafeStackPointerLocation(IRBuilderBase &IRB) const {
26a73082SReid Kleckner  // Android provides a fixed TLS slot for the SafeStack pointer. See the
26a73082SReid Kleckner  // definition of TLS_SLOT_SAFESTACK in
26a73082SReid Kleckner  // https://android.googlesource.com/platform/bionic/+/master/libc/private/bionic_tls.h
26a73082SReid Kleckner  if (Subtarget.isTargetAndroid()) {
26a73082SReid Kleckner    // %fs:0x48, unless we're using a Kernel code model, in which case it's %gs:
26a73082SReid Kleckner    // %gs:0x24 on i386
26a73082SReid Kleckner    int Offset = (Subtarget.is64Bit()) ? 0x48 : 0x24;
26a73082SReid Kleckner    return SegmentOffset(IRB, Offset, getAddressSpace());
26a73082SReid Kleckner  }
26a73082SReid Kleckner
26a73082SReid Kleckner  // Fuchsia is similar.
26a73082SReid Kleckner  if (Subtarget.isTargetFuchsia()) {
26a73082SReid Kleckner    // <zircon/tls.h> defines ZX_TLS_UNSAFE_SP_OFFSET with this value.
26a73082SReid Kleckner    return SegmentOffset(IRB, 0x18, getAddressSpace());
26a73082SReid Kleckner  }
26a73082SReid Kleckner
26a73082SReid Kleckner  return TargetLowering::getSafeStackPointerLocation(IRB);
26a73082SReid Kleckner}
26a73082SReid Kleckner
26a73082SReid Kleckner//===----------------------------------------------------------------------===//
26a73082SReid Kleckner//               Return Value Calling Convention Implementation
26a73082SReid Kleckner//===----------------------------------------------------------------------===//
26a73082SReid Kleckner
26a73082SReid Klecknerbool X86TargetLowering::CanLowerReturn(
26a73082SReid Kleckner    CallingConv::ID CallConv, MachineFunction &MF, bool isVarArg,
754ed95bSyingopq    const SmallVectorImpl<ISD::OutputArg> &Outs, LLVMContext &Context,
754ed95bSyingopq    const Type *RetTy) const {
26a73082SReid Kleckner  SmallVector<CCValAssign, 16> RVLocs;
26a73082SReid Kleckner  CCState CCInfo(CallConv, isVarArg, MF, RVLocs, Context);
26a73082SReid Kleckner  return CCInfo.CheckReturn(Outs, RetCC_X86);
26a73082SReid Kleckner}
26a73082SReid Kleckner
26a73082SReid Klecknerconst MCPhysReg *X86TargetLowering::getScratchRegisters(CallingConv::ID) const {
26a73082SReid Kleckner  static const MCPhysReg ScratchRegs[] = { X86::R11, 0 };
26a73082SReid Kleckner  return ScratchRegs;
26a73082SReid Kleckner}
26a73082SReid Kleckner
26a73082SReid KlecknerArrayRef<MCPhysReg> X86TargetLowering::getRoundingControlRegisters() const {
3e40c96dSAtariDreams  static const MCPhysReg RCRegs[] = {X86::FPCW, X86::MXCSR};
26a73082SReid Kleckner  return RCRegs;
26a73082SReid Kleckner}
26a73082SReid Kleckner
26a73082SReid Kleckner/// Lowers masks values (v*i1) to the local register values
26a73082SReid Kleckner/// \returns DAG node after lowering to register type
26a73082SReid Klecknerstatic SDValue lowerMasksToReg(const SDValue &ValArg, const EVT &ValLoc,
26a73082SReid Kleckner                               const SDLoc &DL, SelectionDAG &DAG) {
26a73082SReid Kleckner  EVT ValVT = ValArg.getValueType();
26a73082SReid Kleckner
26a73082SReid Kleckner  if (ValVT == MVT::v1i1)
26a73082SReid Kleckner    return DAG.getNode(ISD::EXTRACT_VECTOR_ELT, DL, ValLoc, ValArg,
26a73082SReid Kleckner                       DAG.getIntPtrConstant(0, DL));
26a73082SReid Kleckner
26a73082SReid Kleckner  if ((ValVT == MVT::v8i1 && (ValLoc == MVT::i8 || ValLoc == MVT::i32)) ||
26a73082SReid Kleckner      (ValVT == MVT::v16i1 && (ValLoc == MVT::i16 || ValLoc == MVT::i32))) {
26a73082SReid Kleckner    // Two stage lowering might be required
26a73082SReid Kleckner    // bitcast:   v8i1 -> i8 / v16i1 -> i16
26a73082SReid Kleckner    // anyextend: i8   -> i32 / i16   -> i32
26a73082SReid Kleckner    EVT TempValLoc = ValVT == MVT::v8i1 ? MVT::i8 : MVT::i16;
26a73082SReid Kleckner    SDValue ValToCopy = DAG.getBitcast(TempValLoc, ValArg);
26a73082SReid Kleckner    if (ValLoc == MVT::i32)
26a73082SReid Kleckner      ValToCopy = DAG.getNode(ISD::ANY_EXTEND, DL, ValLoc, ValToCopy);
26a73082SReid Kleckner    return ValToCopy;
26a73082SReid Kleckner  }
26a73082SReid Kleckner
26a73082SReid Kleckner  if ((ValVT == MVT::v32i1 && ValLoc == MVT::i32) ||
26a73082SReid Kleckner      (ValVT == MVT::v64i1 && ValLoc == MVT::i64)) {
26a73082SReid Kleckner    // One stage lowering is required
26a73082SReid Kleckner    // bitcast:   v32i1 -> i32 / v64i1 -> i64
26a73082SReid Kleckner    return DAG.getBitcast(ValLoc, ValArg);
26a73082SReid Kleckner  }
26a73082SReid Kleckner
26a73082SReid Kleckner  return DAG.getNode(ISD::ANY_EXTEND, DL, ValLoc, ValArg);
26a73082SReid Kleckner}
26a73082SReid Kleckner
26a73082SReid Kleckner/// Breaks v64i1 value into two registers and adds the new node to the DAG
26a73082SReid Klecknerstatic void Passv64i1ArgInRegs(
26a73082SReid Kleckner    const SDLoc &DL, SelectionDAG &DAG, SDValue &Arg,
26a73082SReid Kleckner    SmallVectorImpl<std::pair<Register, SDValue>> &RegsToPass, CCValAssign &VA,
26a73082SReid Kleckner    CCValAssign &NextVA, const X86Subtarget &Subtarget) {
26a73082SReid Kleckner  assert(Subtarget.hasBWI() && "Expected AVX512BW target!");
26a73082SReid Kleckner  assert(Subtarget.is32Bit() && "Expecting 32 bit target");
26a73082SReid Kleckner  assert(Arg.getValueType() == MVT::i64 && "Expecting 64 bit value");
26a73082SReid Kleckner  assert(VA.isRegLoc() && NextVA.isRegLoc() &&
26a73082SReid Kleckner         "The value should reside in two registers");
26a73082SReid Kleckner
26a73082SReid Kleckner  // Before splitting the value we cast it to i64
26a73082SReid Kleckner  Arg = DAG.getBitcast(MVT::i64, Arg);
26a73082SReid Kleckner
26a73082SReid Kleckner  // Splitting the value into two i32 types
26a73082SReid Kleckner  SDValue Lo, Hi;
26a73082SReid Kleckner  std::tie(Lo, Hi) = DAG.SplitScalar(Arg, DL, MVT::i32, MVT::i32);
26a73082SReid Kleckner
26a73082SReid Kleckner  // Attach the two i32 types into corresponding registers
26a73082SReid Kleckner  RegsToPass.push_back(std::make_pair(VA.getLocReg(), Lo));
26a73082SReid Kleckner  RegsToPass.push_back(std::make_pair(NextVA.getLocReg(), Hi));
26a73082SReid Kleckner}
26a73082SReid Kleckner
26a73082SReid KlecknerSDValue
26a73082SReid KlecknerX86TargetLowering::LowerReturn(SDValue Chain, CallingConv::ID CallConv,
26a73082SReid Kleckner                               bool isVarArg,
26a73082SReid Kleckner                               const SmallVectorImpl<ISD::OutputArg> &Outs,
26a73082SReid Kleckner                               const SmallVectorImpl<SDValue> &OutVals,
26a73082SReid Kleckner                               const SDLoc &dl, SelectionDAG &DAG) const {
26a73082SReid Kleckner  MachineFunction &MF = DAG.getMachineFunction();
26a73082SReid Kleckner  X86MachineFunctionInfo *FuncInfo = MF.getInfo<X86MachineFunctionInfo>();
26a73082SReid Kleckner
26a73082SReid Kleckner  // In some cases we need to disable registers from the default CSR list.
26a73082SReid Kleckner  // For example, when they are used as return registers (preserve_* and X86's
26a73082SReid Kleckner  // regcall) or for argument passing (X86's regcall).
26a73082SReid Kleckner  bool ShouldDisableCalleeSavedRegister =
26a73082SReid Kleckner      shouldDisableRetRegFromCSR(CallConv) ||
26a73082SReid Kleckner      MF.getFunction().hasFnAttribute("no_caller_saved_registers");
26a73082SReid Kleckner
26a73082SReid Kleckner  if (CallConv == CallingConv::X86_INTR && !Outs.empty())
26a73082SReid Kleckner    report_fatal_error("X86 interrupts may not return any value");
26a73082SReid Kleckner
26a73082SReid Kleckner  SmallVector<CCValAssign, 16> RVLocs;
26a73082SReid Kleckner  CCState CCInfo(CallConv, isVarArg, MF, RVLocs, *DAG.getContext());
26a73082SReid Kleckner  CCInfo.AnalyzeReturn(Outs, RetCC_X86);
26a73082SReid Kleckner
26a73082SReid Kleckner  SmallVector<std::pair<Register, SDValue>, 4> RetVals;
26a73082SReid Kleckner  for (unsigned I = 0, OutsIndex = 0, E = RVLocs.size(); I != E;
26a73082SReid Kleckner       ++I, ++OutsIndex) {
26a73082SReid Kleckner    CCValAssign &VA = RVLocs[I];
26a73082SReid Kleckner    assert(VA.isRegLoc() && "Can only return in registers!");
26a73082SReid Kleckner
26a73082SReid Kleckner    // Add the register to the CalleeSaveDisableRegs list.
26a73082SReid Kleckner    if (ShouldDisableCalleeSavedRegister)
26a73082SReid Kleckner      MF.getRegInfo().disableCalleeSavedRegister(VA.getLocReg());
26a73082SReid Kleckner
26a73082SReid Kleckner    SDValue ValToCopy = OutVals[OutsIndex];
26a73082SReid Kleckner    EVT ValVT = ValToCopy.getValueType();
26a73082SReid Kleckner
26a73082SReid Kleckner    // Promote values to the appropriate types.
26a73082SReid Kleckner    if (VA.getLocInfo() == CCValAssign::SExt)
26a73082SReid Kleckner      ValToCopy = DAG.getNode(ISD::SIGN_EXTEND, dl, VA.getLocVT(), ValToCopy);
26a73082SReid Kleckner    else if (VA.getLocInfo() == CCValAssign::ZExt)
26a73082SReid Kleckner      ValToCopy = DAG.getNode(ISD::ZERO_EXTEND, dl, VA.getLocVT(), ValToCopy);
26a73082SReid Kleckner    else if (VA.getLocInfo() == CCValAssign::AExt) {
26a73082SReid Kleckner      if (ValVT.isVector() && ValVT.getVectorElementType() == MVT::i1)
26a73082SReid Kleckner        ValToCopy = lowerMasksToReg(ValToCopy, VA.getLocVT(), dl, DAG);
26a73082SReid Kleckner      else
26a73082SReid Kleckner        ValToCopy = DAG.getNode(ISD::ANY_EXTEND, dl, VA.getLocVT(), ValToCopy);
26a73082SReid Kleckner    }
26a73082SReid Kleckner    else if (VA.getLocInfo() == CCValAssign::BCvt)
26a73082SReid Kleckner      ValToCopy = DAG.getBitcast(VA.getLocVT(), ValToCopy);
26a73082SReid Kleckner
26a73082SReid Kleckner    assert(VA.getLocInfo() != CCValAssign::FPExt &&
26a73082SReid Kleckner           "Unexpected FP-extend for return value.");
26a73082SReid Kleckner
26a73082SReid Kleckner    // Report an error if we have attempted to return a value via an XMM
26a73082SReid Kleckner    // register and SSE was disabled.
26a73082SReid Kleckner    if (!Subtarget.hasSSE1() && X86::FR32XRegClass.contains(VA.getLocReg())) {
26a73082SReid Kleckner      errorUnsupported(DAG, dl, "SSE register return with SSE disabled");
26a73082SReid Kleckner      VA.convertToReg(X86::FP0); // Set reg to FP0, avoid hitting asserts.
26a73082SReid Kleckner    } else if (!Subtarget.hasSSE2() &&
26a73082SReid Kleckner               X86::FR64XRegClass.contains(VA.getLocReg()) &&
26a73082SReid Kleckner               ValVT == MVT::f64) {
26a73082SReid Kleckner      // When returning a double via an XMM register, report an error if SSE2 is
26a73082SReid Kleckner      // not enabled.
26a73082SReid Kleckner      errorUnsupported(DAG, dl, "SSE2 register return with SSE2 disabled");
26a73082SReid Kleckner      VA.convertToReg(X86::FP0); // Set reg to FP0, avoid hitting asserts.
26a73082SReid Kleckner    }
26a73082SReid Kleckner
26a73082SReid Kleckner    // Returns in ST0/ST1 are handled specially: these are pushed as operands to
26a73082SReid Kleckner    // the RET instruction and handled by the FP Stackifier.
26a73082SReid Kleckner    if (VA.getLocReg() == X86::FP0 ||
26a73082SReid Kleckner        VA.getLocReg() == X86::FP1) {
26a73082SReid Kleckner      // If this is a copy from an xmm register to ST(0), use an FPExtend to
26a73082SReid Kleckner      // change the value to the FP stack register class.
26a73082SReid Kleckner      if (isScalarFPTypeInSSEReg(VA.getValVT()))
26a73082SReid Kleckner        ValToCopy = DAG.getNode(ISD::FP_EXTEND, dl, MVT::f80, ValToCopy);
26a73082SReid Kleckner      RetVals.push_back(std::make_pair(VA.getLocReg(), ValToCopy));
26a73082SReid Kleckner      // Don't emit a copytoreg.
26a73082SReid Kleckner      continue;
26a73082SReid Kleckner    }
26a73082SReid Kleckner
26a73082SReid Kleckner    // 64-bit vector (MMX) values are returned in XMM0 / XMM1 except for v1i64
26a73082SReid Kleckner    // which is returned in RAX / RDX.
26a73082SReid Kleckner    if (Subtarget.is64Bit()) {
26a73082SReid Kleckner      if (ValVT == MVT::x86mmx) {
26a73082SReid Kleckner        if (VA.getLocReg() == X86::XMM0 || VA.getLocReg() == X86::XMM1) {
26a73082SReid Kleckner          ValToCopy = DAG.getBitcast(MVT::i64, ValToCopy);
26a73082SReid Kleckner          ValToCopy = DAG.getNode(ISD::SCALAR_TO_VECTOR, dl, MVT::v2i64,
26a73082SReid Kleckner                                  ValToCopy);
26a73082SReid Kleckner          // If we don't have SSE2 available, convert to v4f32 so the generated
26a73082SReid Kleckner          // register is legal.
26a73082SReid Kleckner          if (!Subtarget.hasSSE2())
26a73082SReid Kleckner            ValToCopy = DAG.getBitcast(MVT::v4f32, ValToCopy);
26a73082SReid Kleckner        }
26a73082SReid Kleckner      }
26a73082SReid Kleckner    }
26a73082SReid Kleckner
26a73082SReid Kleckner    if (VA.needsCustom()) {
26a73082SReid Kleckner      assert(VA.getValVT() == MVT::v64i1 &&
26a73082SReid Kleckner             "Currently the only custom case is when we split v64i1 to 2 regs");
26a73082SReid Kleckner
26a73082SReid Kleckner      Passv64i1ArgInRegs(dl, DAG, ValToCopy, RetVals, VA, RVLocs[++I],
26a73082SReid Kleckner                         Subtarget);
26a73082SReid Kleckner
26a73082SReid Kleckner      // Add the second register to the CalleeSaveDisableRegs list.
26a73082SReid Kleckner      if (ShouldDisableCalleeSavedRegister)
26a73082SReid Kleckner        MF.getRegInfo().disableCalleeSavedRegister(RVLocs[I].getLocReg());
26a73082SReid Kleckner    } else {
26a73082SReid Kleckner      RetVals.push_back(std::make_pair(VA.getLocReg(), ValToCopy));
26a73082SReid Kleckner    }
26a73082SReid Kleckner  }
26a73082SReid Kleckner
26a73082SReid Kleckner  SDValue Glue;
26a73082SReid Kleckner  SmallVector<SDValue, 6> RetOps;
26a73082SReid Kleckner  RetOps.push_back(Chain); // Operand #0 = Chain (updated below)
26a73082SReid Kleckner  // Operand #1 = Bytes To Pop
26a73082SReid Kleckner  RetOps.push_back(DAG.getTargetConstant(FuncInfo->getBytesToPopOnReturn(), dl,
26a73082SReid Kleckner                   MVT::i32));
26a73082SReid Kleckner
26a73082SReid Kleckner  // Copy the result values into the output registers.
26a73082SReid Kleckner  for (auto &RetVal : RetVals) {
26a73082SReid Kleckner    if (RetVal.first == X86::FP0 || RetVal.first == X86::FP1) {
26a73082SReid Kleckner      RetOps.push_back(RetVal.second);
26a73082SReid Kleckner      continue; // Don't emit a copytoreg.
26a73082SReid Kleckner    }
26a73082SReid Kleckner
26a73082SReid Kleckner    Chain = DAG.getCopyToReg(Chain, dl, RetVal.first, RetVal.second, Glue);
26a73082SReid Kleckner    Glue = Chain.getValue(1);
26a73082SReid Kleckner    RetOps.push_back(
26a73082SReid Kleckner        DAG.getRegister(RetVal.first, RetVal.second.getValueType()));
26a73082SReid Kleckner  }
26a73082SReid Kleckner
26a73082SReid Kleckner  // Swift calling convention does not require we copy the sret argument
26a73082SReid Kleckner  // into %rax/%eax for the return, and SRetReturnReg is not set for Swift.
26a73082SReid Kleckner
26a73082SReid Kleckner  // All x86 ABIs require that for returning structs by value we copy
26a73082SReid Kleckner  // the sret argument into %rax/%eax (depending on ABI) for the return.
26a73082SReid Kleckner  // We saved the argument into a virtual register in the entry block,
26a73082SReid Kleckner  // so now we copy the value out and into %rax/%eax.
26a73082SReid Kleckner  //
26a73082SReid Kleckner  // Checking Function.hasStructRetAttr() here is insufficient because the IR
26a73082SReid Kleckner  // may not have an explicit sret argument. If FuncInfo.CanLowerReturn is
26a73082SReid Kleckner  // false, then an sret argument may be implicitly inserted in the SelDAG. In
26a73082SReid Kleckner  // either case FuncInfo->setSRetReturnReg() will have been called.
26a73082SReid Kleckner  if (Register SRetReg = FuncInfo->getSRetReturnReg()) {
26a73082SReid Kleckner    // When we have both sret and another return value, we should use the
26a73082SReid Kleckner    // original Chain stored in RetOps[0], instead of the current Chain updated
26a73082SReid Kleckner    // in the above loop. If we only have sret, RetOps[0] equals to Chain.
26a73082SReid Kleckner
26a73082SReid Kleckner    // For the case of sret and another return value, we have
26a73082SReid Kleckner    //   Chain_0 at the function entry
26a73082SReid Kleckner    //   Chain_1 = getCopyToReg(Chain_0) in the above loop
26a73082SReid Kleckner    // If we use Chain_1 in getCopyFromReg, we will have
26a73082SReid Kleckner    //   Val = getCopyFromReg(Chain_1)
26a73082SReid Kleckner    //   Chain_2 = getCopyToReg(Chain_1, Val) from below
26a73082SReid Kleckner
26a73082SReid Kleckner    // getCopyToReg(Chain_0) will be glued together with
26a73082SReid Kleckner    // getCopyToReg(Chain_1, Val) into Unit A, getCopyFromReg(Chain_1) will be
26a73082SReid Kleckner    // in Unit B, and we will have cyclic dependency between Unit A and Unit B:
26a73082SReid Kleckner    //   Data dependency from Unit B to Unit A due to usage of Val in
26a73082SReid Kleckner    //     getCopyToReg(Chain_1, Val)
26a73082SReid Kleckner    //   Chain dependency from Unit A to Unit B
26a73082SReid Kleckner
26a73082SReid Kleckner    // So here, we use RetOps[0] (i.e Chain_0) for getCopyFromReg.
26a73082SReid Kleckner    SDValue Val = DAG.getCopyFromReg(RetOps[0], dl, SRetReg,
26a73082SReid Kleckner                                     getPointerTy(MF.getDataLayout()));
26a73082SReid Kleckner
26a73082SReid Kleckner    Register RetValReg
26a73082SReid Kleckner        = (Subtarget.is64Bit() && !Subtarget.isTarget64BitILP32()) ?
26a73082SReid Kleckner          X86::RAX : X86::EAX;
26a73082SReid Kleckner    Chain = DAG.getCopyToReg(Chain, dl, RetValReg, Val, Glue);
26a73082SReid Kleckner    Glue = Chain.getValue(1);
26a73082SReid Kleckner
26a73082SReid Kleckner    // RAX/EAX now acts like a return value.
26a73082SReid Kleckner    RetOps.push_back(
26a73082SReid Kleckner        DAG.getRegister(RetValReg, getPointerTy(DAG.getDataLayout())));
26a73082SReid Kleckner
26a73082SReid Kleckner    // Add the returned register to the CalleeSaveDisableRegs list. Don't do
26a73082SReid Kleckner    // this however for preserve_most/preserve_all to minimize the number of
26a73082SReid Kleckner    // callee-saved registers for these CCs.
26a73082SReid Kleckner    if (ShouldDisableCalleeSavedRegister &&
26a73082SReid Kleckner        CallConv != CallingConv::PreserveAll &&
26a73082SReid Kleckner        CallConv != CallingConv::PreserveMost)
26a73082SReid Kleckner      MF.getRegInfo().disableCalleeSavedRegister(RetValReg);
26a73082SReid Kleckner  }
26a73082SReid Kleckner
26a73082SReid Kleckner  const X86RegisterInfo *TRI = Subtarget.getRegisterInfo();
26a73082SReid Kleckner  const MCPhysReg *I =
26a73082SReid Kleckner      TRI->getCalleeSavedRegsViaCopy(&DAG.getMachineFunction());
26a73082SReid Kleckner  if (I) {
26a73082SReid Kleckner    for (; *I; ++I) {
26a73082SReid Kleckner      if (X86::GR64RegClass.contains(*I))
26a73082SReid Kleckner        RetOps.push_back(DAG.getRegister(*I, MVT::i64));
26a73082SReid Kleckner      else
26a73082SReid Kleckner        llvm_unreachable("Unexpected register class in CSRsViaCopy!");
26a73082SReid Kleckner    }
26a73082SReid Kleckner  }
26a73082SReid Kleckner
26a73082SReid Kleckner  RetOps[0] = Chain;  // Update chain.
26a73082SReid Kleckner
26a73082SReid Kleckner  // Add the glue if we have it.
26a73082SReid Kleckner  if (Glue.getNode())
26a73082SReid Kleckner    RetOps.push_back(Glue);
26a73082SReid Kleckner
26a73082SReid Kleckner  X86ISD::NodeType opcode = X86ISD::RET_GLUE;
26a73082SReid Kleckner  if (CallConv == CallingConv::X86_INTR)
26a73082SReid Kleckner    opcode = X86ISD::IRET;
26a73082SReid Kleckner  return DAG.getNode(opcode, dl, MVT::Other, RetOps);
26a73082SReid Kleckner}
26a73082SReid Kleckner
26a73082SReid Klecknerbool X86TargetLowering::isUsedByReturnOnly(SDNode *N, SDValue &Chain) const {
26a73082SReid Kleckner  if (N->getNumValues() != 1 || !N->hasNUsesOfValue(1, 0))
26a73082SReid Kleckner    return false;
26a73082SReid Kleckner
26a73082SReid Kleckner  SDValue TCChain = Chain;
bd261eccSCraig Topper  SDNode *Copy = *N->user_begin();
26a73082SReid Kleckner  if (Copy->getOpcode() == ISD::CopyToReg) {
26a73082SReid Kleckner    // If the copy has a glue operand, we conservatively assume it isn't safe to
26a73082SReid Kleckner    // perform a tail call.
26a73082SReid Kleckner    if (Copy->getOperand(Copy->getNumOperands()-1).getValueType() == MVT::Glue)
26a73082SReid Kleckner      return false;
26a73082SReid Kleckner    TCChain = Copy->getOperand(0);
26a73082SReid Kleckner  } else if (Copy->getOpcode() != ISD::FP_EXTEND)
26a73082SReid Kleckner    return false;
26a73082SReid Kleckner
26a73082SReid Kleckner  bool HasRet = false;
104ad925SCraig Topper  for (const SDNode *U : Copy->users()) {
26a73082SReid Kleckner    if (U->getOpcode() != X86ISD::RET_GLUE)
26a73082SReid Kleckner      return false;
26a73082SReid Kleckner    // If we are returning more than one value, we can definitely
26a73082SReid Kleckner    // not make a tail call see PR19530
26a73082SReid Kleckner    if (U->getNumOperands() > 4)
26a73082SReid Kleckner      return false;
26a73082SReid Kleckner    if (U->getNumOperands() == 4 &&
26a73082SReid Kleckner        U->getOperand(U->getNumOperands() - 1).getValueType() != MVT::Glue)
26a73082SReid Kleckner      return false;
26a73082SReid Kleckner    HasRet = true;
26a73082SReid Kleckner  }
26a73082SReid Kleckner
26a73082SReid Kleckner  if (!HasRet)
26a73082SReid Kleckner    return false;
26a73082SReid Kleckner
26a73082SReid Kleckner  Chain = TCChain;
26a73082SReid Kleckner  return true;
26a73082SReid Kleckner}
26a73082SReid Kleckner
26a73082SReid KlecknerEVT X86TargetLowering::getTypeForExtReturn(LLVMContext &Context, EVT VT,
26a73082SReid Kleckner                                           ISD::NodeType ExtendKind) const {
26a73082SReid Kleckner  MVT ReturnMVT = MVT::i32;
26a73082SReid Kleckner
26a73082SReid Kleckner  bool Darwin = Subtarget.getTargetTriple().isOSDarwin();
26a73082SReid Kleckner  if (VT == MVT::i1 || (!Darwin && (VT == MVT::i8 || VT == MVT::i16))) {
26a73082SReid Kleckner    // The ABI does not require i1, i8 or i16 to be extended.
26a73082SReid Kleckner    //
26a73082SReid Kleckner    // On Darwin, there is code in the wild relying on Clang's old behaviour of
26a73082SReid Kleckner    // always extending i8/i16 return values, so keep doing that for now.
26a73082SReid Kleckner    // (PR26665).
26a73082SReid Kleckner    ReturnMVT = MVT::i8;
26a73082SReid Kleckner  }
26a73082SReid Kleckner
26a73082SReid Kleckner  EVT MinVT = getRegisterType(Context, ReturnMVT);
26a73082SReid Kleckner  return VT.bitsLT(MinVT) ? MinVT : VT;
26a73082SReid Kleckner}
26a73082SReid Kleckner
26a73082SReid Kleckner/// Reads two 32 bit registers and creates a 64 bit mask value.
26a73082SReid Kleckner/// \param VA The current 32 bit value that need to be assigned.
26a73082SReid Kleckner/// \param NextVA The next 32 bit value that need to be assigned.
26a73082SReid Kleckner/// \param Root The parent DAG node.
26a73082SReid Kleckner/// \param [in,out] InGlue Represents SDvalue in the parent DAG node for
26a73082SReid Kleckner///                        glue purposes. In the case the DAG is already using
26a73082SReid Kleckner///                        physical register instead of virtual, we should glue
26a73082SReid Kleckner///                        our new SDValue to InGlue SDvalue.
26a73082SReid Kleckner/// \return a new SDvalue of size 64bit.
26a73082SReid Klecknerstatic SDValue getv64i1Argument(CCValAssign &VA, CCValAssign &NextVA,
26a73082SReid Kleckner                                SDValue &Root, SelectionDAG &DAG,
26a73082SReid Kleckner                                const SDLoc &DL, const X86Subtarget &Subtarget,
26a73082SReid Kleckner                                SDValue *InGlue = nullptr) {
26a73082SReid Kleckner  assert((Subtarget.hasBWI()) && "Expected AVX512BW target!");
26a73082SReid Kleckner  assert(Subtarget.is32Bit() && "Expecting 32 bit target");
26a73082SReid Kleckner  assert(VA.getValVT() == MVT::v64i1 &&
26a73082SReid Kleckner         "Expecting first location of 64 bit width type");
26a73082SReid Kleckner  assert(NextVA.getValVT() == VA.getValVT() &&
26a73082SReid Kleckner         "The locations should have the same type");
26a73082SReid Kleckner  assert(VA.isRegLoc() && NextVA.isRegLoc() &&
26a73082SReid Kleckner         "The values should reside in two registers");
26a73082SReid Kleckner
26a73082SReid Kleckner  SDValue Lo, Hi;
26a73082SReid Kleckner  SDValue ArgValueLo, ArgValueHi;
26a73082SReid Kleckner
26a73082SReid Kleckner  MachineFunction &MF = DAG.getMachineFunction();
26a73082SReid Kleckner  const TargetRegisterClass *RC = &X86::GR32RegClass;
26a73082SReid Kleckner
26a73082SReid Kleckner  // Read a 32 bit value from the registers.
26a73082SReid Kleckner  if (nullptr == InGlue) {
26a73082SReid Kleckner    // When no physical register is present,
26a73082SReid Kleckner    // create an intermediate virtual register.
26a73082SReid Kleckner    Register Reg = MF.addLiveIn(VA.getLocReg(), RC);
26a73082SReid Kleckner    ArgValueLo = DAG.getCopyFromReg(Root, DL, Reg, MVT::i32);
26a73082SReid Kleckner    Reg = MF.addLiveIn(NextVA.getLocReg(), RC);
26a73082SReid Kleckner    ArgValueHi = DAG.getCopyFromReg(Root, DL, Reg, MVT::i32);
26a73082SReid Kleckner  } else {
26a73082SReid Kleckner    // When a physical register is available read the value from it and glue
26a73082SReid Kleckner    // the reads together.
26a73082SReid Kleckner    ArgValueLo =
26a73082SReid Kleckner      DAG.getCopyFromReg(Root, DL, VA.getLocReg(), MVT::i32, *InGlue);
26a73082SReid Kleckner    *InGlue = ArgValueLo.getValue(2);
26a73082SReid Kleckner    ArgValueHi =
26a73082SReid Kleckner      DAG.getCopyFromReg(Root, DL, NextVA.getLocReg(), MVT::i32, *InGlue);
26a73082SReid Kleckner    *InGlue = ArgValueHi.getValue(2);
26a73082SReid Kleckner  }
26a73082SReid Kleckner
26a73082SReid Kleckner  // Convert the i32 type into v32i1 type.
26a73082SReid Kleckner  Lo = DAG.getBitcast(MVT::v32i1, ArgValueLo);
26a73082SReid Kleckner
26a73082SReid Kleckner  // Convert the i32 type into v32i1 type.
26a73082SReid Kleckner  Hi = DAG.getBitcast(MVT::v32i1, ArgValueHi);
26a73082SReid Kleckner
26a73082SReid Kleckner  // Concatenate the two values together.
26a73082SReid Kleckner  return DAG.getNode(ISD::CONCAT_VECTORS, DL, MVT::v64i1, Lo, Hi);
26a73082SReid Kleckner}
26a73082SReid Kleckner
26a73082SReid Kleckner/// The function will lower a register of various sizes (8/16/32/64)
26a73082SReid Kleckner/// to a mask value of the expected size (v8i1/v16i1/v32i1/v64i1)
26a73082SReid Kleckner/// \returns a DAG node contains the operand after lowering to mask type.
26a73082SReid Klecknerstatic SDValue lowerRegToMasks(const SDValue &ValArg, const EVT &ValVT,
26a73082SReid Kleckner                               const EVT &ValLoc, const SDLoc &DL,
26a73082SReid Kleckner                               SelectionDAG &DAG) {
26a73082SReid Kleckner  SDValue ValReturned = ValArg;
26a73082SReid Kleckner
26a73082SReid Kleckner  if (ValVT == MVT::v1i1)
26a73082SReid Kleckner    return DAG.getNode(ISD::SCALAR_TO_VECTOR, DL, MVT::v1i1, ValReturned);
26a73082SReid Kleckner
26a73082SReid Kleckner  if (ValVT == MVT::v64i1) {
26a73082SReid Kleckner    // In 32 bit machine, this case is handled by getv64i1Argument
26a73082SReid Kleckner    assert(ValLoc == MVT::i64 && "Expecting only i64 locations");
26a73082SReid Kleckner    // In 64 bit machine, There is no need to truncate the value only bitcast
26a73082SReid Kleckner  } else {
26a73082SReid Kleckner    MVT MaskLenVT;
26a73082SReid Kleckner    switch (ValVT.getSimpleVT().SimpleTy) {
26a73082SReid Kleckner    case MVT::v8i1:
26a73082SReid Kleckner      MaskLenVT = MVT::i8;
26a73082SReid Kleckner      break;
26a73082SReid Kleckner    case MVT::v16i1:
26a73082SReid Kleckner      MaskLenVT = MVT::i16;
26a73082SReid Kleckner      break;
26a73082SReid Kleckner    case MVT::v32i1:
26a73082SReid Kleckner      MaskLenVT = MVT::i32;
26a73082SReid Kleckner      break;
26a73082SReid Kleckner    default:
26a73082SReid Kleckner      llvm_unreachable("Expecting a vector of i1 types");
26a73082SReid Kleckner    }
26a73082SReid Kleckner
26a73082SReid Kleckner    ValReturned = DAG.getNode(ISD::TRUNCATE, DL, MaskLenVT, ValReturned);
26a73082SReid Kleckner  }
26a73082SReid Kleckner  return DAG.getBitcast(ValVT, ValReturned);
26a73082SReid Kleckner}
26a73082SReid Kleckner
26a73082SReid Kleckner/// Lower the result values of a call into the
26a73082SReid Kleckner/// appropriate copies out of appropriate physical registers.
26a73082SReid Kleckner///
26a73082SReid KlecknerSDValue X86TargetLowering::LowerCallResult(
26a73082SReid Kleckner    SDValue Chain, SDValue InGlue, CallingConv::ID CallConv, bool isVarArg,
26a73082SReid Kleckner    const SmallVectorImpl<ISD::InputArg> &Ins, const SDLoc &dl,
26a73082SReid Kleckner    SelectionDAG &DAG, SmallVectorImpl<SDValue> &InVals,
26a73082SReid Kleckner    uint32_t *RegMask) const {
26a73082SReid Kleckner
26a73082SReid Kleckner  const TargetRegisterInfo *TRI = Subtarget.getRegisterInfo();
26a73082SReid Kleckner  // Assign locations to each value returned by this call.
26a73082SReid Kleckner  SmallVector<CCValAssign, 16> RVLocs;
26a73082SReid Kleckner  CCState CCInfo(CallConv, isVarArg, DAG.getMachineFunction(), RVLocs,
26a73082SReid Kleckner                 *DAG.getContext());
26a73082SReid Kleckner  CCInfo.AnalyzeCallResult(Ins, RetCC_X86);
26a73082SReid Kleckner
26a73082SReid Kleckner  // Copy all of the result registers out of their specified physreg.
26a73082SReid Kleckner  for (unsigned I = 0, InsIndex = 0, E = RVLocs.size(); I != E;
26a73082SReid Kleckner       ++I, ++InsIndex) {
26a73082SReid Kleckner    CCValAssign &VA = RVLocs[I];
26a73082SReid Kleckner    EVT CopyVT = VA.getLocVT();
26a73082SReid Kleckner
26a73082SReid Kleckner    // In some calling conventions we need to remove the used registers
26a73082SReid Kleckner    // from the register mask.
26a73082SReid Kleckner    if (RegMask) {
26a73082SReid Kleckner      for (MCPhysReg SubReg : TRI->subregs_inclusive(VA.getLocReg()))
26a73082SReid Kleckner        RegMask[SubReg / 32] &= ~(1u << (SubReg % 32));
26a73082SReid Kleckner    }
26a73082SReid Kleckner
26a73082SReid Kleckner    // Report an error if there was an attempt to return FP values via XMM
26a73082SReid Kleckner    // registers.
26a73082SReid Kleckner    if (!Subtarget.hasSSE1() && X86::FR32XRegClass.contains(VA.getLocReg())) {
26a73082SReid Kleckner      errorUnsupported(DAG, dl, "SSE register return with SSE disabled");
26a73082SReid Kleckner      if (VA.getLocReg() == X86::XMM1)
26a73082SReid Kleckner        VA.convertToReg(X86::FP1); // Set reg to FP1, avoid hitting asserts.
26a73082SReid Kleckner      else
26a73082SReid Kleckner        VA.convertToReg(X86::FP0); // Set reg to FP0, avoid hitting asserts.
26a73082SReid Kleckner    } else if (!Subtarget.hasSSE2() &&
26a73082SReid Kleckner               X86::FR64XRegClass.contains(VA.getLocReg()) &&
26a73082SReid Kleckner               CopyVT == MVT::f64) {
26a73082SReid Kleckner      errorUnsupported(DAG, dl, "SSE2 register return with SSE2 disabled");
26a73082SReid Kleckner      if (VA.getLocReg() == X86::XMM1)
26a73082SReid Kleckner        VA.convertToReg(X86::FP1); // Set reg to FP1, avoid hitting asserts.
26a73082SReid Kleckner      else
26a73082SReid Kleckner        VA.convertToReg(X86::FP0); // Set reg to FP0, avoid hitting asserts.
26a73082SReid Kleckner    }
26a73082SReid Kleckner
26a73082SReid Kleckner    // If we prefer to use the value in xmm registers, copy it out as f80 and
26a73082SReid Kleckner    // use a truncate to move it from fp stack reg to xmm reg.
26a73082SReid Kleckner    bool RoundAfterCopy = false;
26a73082SReid Kleckner    if ((VA.getLocReg() == X86::FP0 || VA.getLocReg() == X86::FP1) &&
26a73082SReid Kleckner        isScalarFPTypeInSSEReg(VA.getValVT())) {
26a73082SReid Kleckner      if (!Subtarget.hasX87())
26a73082SReid Kleckner        report_fatal_error("X87 register return with X87 disabled");
26a73082SReid Kleckner      CopyVT = MVT::f80;
26a73082SReid Kleckner      RoundAfterCopy = (CopyVT != VA.getLocVT());
26a73082SReid Kleckner    }
26a73082SReid Kleckner
26a73082SReid Kleckner    SDValue Val;
26a73082SReid Kleckner    if (VA.needsCustom()) {
26a73082SReid Kleckner      assert(VA.getValVT() == MVT::v64i1 &&
26a73082SReid Kleckner             "Currently the only custom case is when we split v64i1 to 2 regs");
26a73082SReid Kleckner      Val =
26a73082SReid Kleckner          getv64i1Argument(VA, RVLocs[++I], Chain, DAG, dl, Subtarget, &InGlue);
26a73082SReid Kleckner    } else {
26a73082SReid Kleckner      Chain = DAG.getCopyFromReg(Chain, dl, VA.getLocReg(), CopyVT, InGlue)
26a73082SReid Kleckner                  .getValue(1);
26a73082SReid Kleckner      Val = Chain.getValue(0);
26a73082SReid Kleckner      InGlue = Chain.getValue(2);
26a73082SReid Kleckner    }
26a73082SReid Kleckner
26a73082SReid Kleckner    if (RoundAfterCopy)
26a73082SReid Kleckner      Val = DAG.getNode(ISD::FP_ROUND, dl, VA.getValVT(), Val,
26a73082SReid Kleckner                        // This truncation won't change the value.
26a73082SReid Kleckner                        DAG.getIntPtrConstant(1, dl, /*isTarget=*/true));
26a73082SReid Kleckner
26a73082SReid Kleckner    if (VA.isExtInLoc()) {
26a73082SReid Kleckner      if (VA.getValVT().isVector() &&
26a73082SReid Kleckner          VA.getValVT().getScalarType() == MVT::i1 &&
26a73082SReid Kleckner          ((VA.getLocVT() == MVT::i64) || (VA.getLocVT() == MVT::i32) ||
26a73082SReid Kleckner           (VA.getLocVT() == MVT::i16) || (VA.getLocVT() == MVT::i8))) {
26a73082SReid Kleckner        // promoting a mask type (v*i1) into a register of type i64/i32/i16/i8
26a73082SReid Kleckner        Val = lowerRegToMasks(Val, VA.getValVT(), VA.getLocVT(), dl, DAG);
26a73082SReid Kleckner      } else
26a73082SReid Kleckner        Val = DAG.getNode(ISD::TRUNCATE, dl, VA.getValVT(), Val);
26a73082SReid Kleckner    }
26a73082SReid Kleckner
26a73082SReid Kleckner    if (VA.getLocInfo() == CCValAssign::BCvt)
26a73082SReid Kleckner      Val = DAG.getBitcast(VA.getValVT(), Val);
26a73082SReid Kleckner
26a73082SReid Kleckner    InVals.push_back(Val);
26a73082SReid Kleckner  }
26a73082SReid Kleckner
26a73082SReid Kleckner  return Chain;
26a73082SReid Kleckner}
26a73082SReid Kleckner
26a73082SReid Kleckner//===----------------------------------------------------------------------===//
26a73082SReid Kleckner//                C & StdCall & Fast Calling Convention implementation
26a73082SReid Kleckner//===----------------------------------------------------------------------===//
26a73082SReid Kleckner//  StdCall calling convention seems to be standard for many Windows' API
26a73082SReid Kleckner//  routines and around. It differs from C calling convention just a little:
26a73082SReid Kleckner//  callee should clean up the stack, not caller. Symbols should be also
26a73082SReid Kleckner//  decorated in some fancy way :) It doesn't support any vector arguments.
26a73082SReid Kleckner//  For info on fast calling convention see Fast Calling Convention (tail call)
26a73082SReid Kleckner//  implementation LowerX86_32FastCCCallTo.
26a73082SReid Kleckner
26a73082SReid Kleckner/// Determines whether Args, either a set of outgoing arguments to a call, or a
26a73082SReid Kleckner/// set of incoming args of a call, contains an sret pointer that the callee
26a73082SReid Kleckner/// pops
26a73082SReid Klecknertemplate <typename T>
26a73082SReid Klecknerstatic bool hasCalleePopSRet(const SmallVectorImpl<T> &Args,
26a73082SReid Kleckner                             const X86Subtarget &Subtarget) {
26a73082SReid Kleckner  // Not C++20 (yet), so no concepts available.
26a73082SReid Kleckner  static_assert(std::is_same_v<T, ISD::OutputArg> ||
26a73082SReid Kleckner                    std::is_same_v<T, ISD::InputArg>,
26a73082SReid Kleckner                "requires ISD::OutputArg or ISD::InputArg");
26a73082SReid Kleckner
26a73082SReid Kleckner  // Only 32-bit pops the sret.  It's a 64-bit world these days, so early-out
26a73082SReid Kleckner  // for most compilations.
26a73082SReid Kleckner  if (!Subtarget.is32Bit())
26a73082SReid Kleckner    return false;
26a73082SReid Kleckner
26a73082SReid Kleckner  if (Args.empty())
26a73082SReid Kleckner    return false;
26a73082SReid Kleckner
26a73082SReid Kleckner  // Most calls do not have an sret argument, check the arg next.
26a73082SReid Kleckner  const ISD::ArgFlagsTy &Flags = Args[0].Flags;
26a73082SReid Kleckner  if (!Flags.isSRet() || Flags.isInReg())
26a73082SReid Kleckner    return false;
26a73082SReid Kleckner
26a73082SReid Kleckner  // The MSVCabi does not pop the sret.
26a73082SReid Kleckner  if (Subtarget.getTargetTriple().isOSMSVCRT())
26a73082SReid Kleckner    return false;
26a73082SReid Kleckner
26a73082SReid Kleckner  // MCUs don't pop the sret
26a73082SReid Kleckner  if (Subtarget.isTargetMCU())
26a73082SReid Kleckner    return false;
26a73082SReid Kleckner
26a73082SReid Kleckner  // Callee pops argument
26a73082SReid Kleckner  return true;
26a73082SReid Kleckner}
26a73082SReid Kleckner
26a73082SReid Kleckner/// Make a copy of an aggregate at address specified by "Src" to address
26a73082SReid Kleckner/// "Dst" with size and alignment information specified by the specific
26a73082SReid Kleckner/// parameter attribute. The copy will be passed as a byval function parameter.
26a73082SReid Klecknerstatic SDValue CreateCopyOfByValArgument(SDValue Src, SDValue Dst,
26a73082SReid Kleckner                                         SDValue Chain, ISD::ArgFlagsTy Flags,
26a73082SReid Kleckner                                         SelectionDAG &DAG, const SDLoc &dl) {
26a73082SReid Kleckner  SDValue SizeNode = DAG.getIntPtrConstant(Flags.getByValSize(), dl);
26a73082SReid Kleckner
26a73082SReid Kleckner  return DAG.getMemcpy(
26a73082SReid Kleckner      Chain, dl, Dst, Src, SizeNode, Flags.getNonZeroByValAlign(),
26a73082SReid Kleckner      /*isVolatile*/ false, /*AlwaysInline=*/true,
f270a4ddSAmara Emerson      /*CI=*/nullptr, std::nullopt, MachinePointerInfo(), MachinePointerInfo());
26a73082SReid Kleckner}
26a73082SReid Kleckner
26a73082SReid Kleckner/// Return true if the calling convention is one that we can guarantee TCO for.
26a73082SReid Klecknerstatic bool canGuaranteeTCO(CallingConv::ID CC) {
26a73082SReid Kleckner  return (CC == CallingConv::Fast || CC == CallingConv::GHC ||
26a73082SReid Kleckner          CC == CallingConv::X86_RegCall || CC == CallingConv::HiPE ||
26a73082SReid Kleckner          CC == CallingConv::Tail || CC == CallingConv::SwiftTail);
26a73082SReid Kleckner}
26a73082SReid Kleckner
26a73082SReid Kleckner/// Return true if we might ever do TCO for calls with this calling convention.
26a73082SReid Klecknerstatic bool mayTailCallThisCC(CallingConv::ID CC) {
26a73082SReid Kleckner  switch (CC) {
26a73082SReid Kleckner  // C calling conventions:
26a73082SReid Kleckner  case CallingConv::C:
26a73082SReid Kleckner  case CallingConv::Win64:
26a73082SReid Kleckner  case CallingConv::X86_64_SysV:
c166a43cSweiguozhi  case CallingConv::PreserveNone:
26a73082SReid Kleckner  // Callee pop conventions:
26a73082SReid Kleckner  case CallingConv::X86_ThisCall:
26a73082SReid Kleckner  case CallingConv::X86_StdCall:
26a73082SReid Kleckner  case CallingConv::X86_VectorCall:
26a73082SReid Kleckner  case CallingConv::X86_FastCall:
26a73082SReid Kleckner  // Swift:
26a73082SReid Kleckner  case CallingConv::Swift:
26a73082SReid Kleckner    return true;
26a73082SReid Kleckner  default:
26a73082SReid Kleckner    return canGuaranteeTCO(CC);
26a73082SReid Kleckner  }
26a73082SReid Kleckner}
26a73082SReid Kleckner
26a73082SReid Kleckner/// Return true if the function is being made into a tailcall target by
26a73082SReid Kleckner/// changing its ABI.
26a73082SReid Klecknerstatic bool shouldGuaranteeTCO(CallingConv::ID CC, bool GuaranteedTailCallOpt) {
26a73082SReid Kleckner  return (GuaranteedTailCallOpt && canGuaranteeTCO(CC)) ||
26a73082SReid Kleckner         CC == CallingConv::Tail || CC == CallingConv::SwiftTail;
26a73082SReid Kleckner}
26a73082SReid Kleckner
26a73082SReid Klecknerbool X86TargetLowering::mayBeEmittedAsTailCall(const CallInst *CI) const {
26a73082SReid Kleckner  if (!CI->isTailCall())
26a73082SReid Kleckner    return false;
26a73082SReid Kleckner
26a73082SReid Kleckner  CallingConv::ID CalleeCC = CI->getCallingConv();
26a73082SReid Kleckner  if (!mayTailCallThisCC(CalleeCC))
26a73082SReid Kleckner    return false;
26a73082SReid Kleckner
26a73082SReid Kleckner  return true;
26a73082SReid Kleckner}
26a73082SReid Kleckner
26a73082SReid KlecknerSDValue
26a73082SReid KlecknerX86TargetLowering::LowerMemArgument(SDValue Chain, CallingConv::ID CallConv,
26a73082SReid Kleckner                                    const SmallVectorImpl<ISD::InputArg> &Ins,
26a73082SReid Kleckner                                    const SDLoc &dl, SelectionDAG &DAG,
26a73082SReid Kleckner                                    const CCValAssign &VA,
26a73082SReid Kleckner                                    MachineFrameInfo &MFI, unsigned i) const {
26a73082SReid Kleckner  // Create the nodes corresponding to a load from this parameter slot.
26a73082SReid Kleckner  ISD::ArgFlagsTy Flags = Ins[i].Flags;
26a73082SReid Kleckner  bool AlwaysUseMutable = shouldGuaranteeTCO(
26a73082SReid Kleckner      CallConv, DAG.getTarget().Options.GuaranteedTailCallOpt);
26a73082SReid Kleckner  bool isImmutable = !AlwaysUseMutable && !Flags.isByVal();
26a73082SReid Kleckner  EVT ValVT;
26a73082SReid Kleckner  MVT PtrVT = getPointerTy(DAG.getDataLayout());
26a73082SReid Kleckner
26a73082SReid Kleckner  // If value is passed by pointer we have address passed instead of the value
26a73082SReid Kleckner  // itself. No need to extend if the mask value and location share the same
26a73082SReid Kleckner  // absolute size.
26a73082SReid Kleckner  bool ExtendedInMem =
26a73082SReid Kleckner      VA.isExtInLoc() && VA.getValVT().getScalarType() == MVT::i1 &&
26a73082SReid Kleckner      VA.getValVT().getSizeInBits() != VA.getLocVT().getSizeInBits();
26a73082SReid Kleckner
26a73082SReid Kleckner  if (VA.getLocInfo() == CCValAssign::Indirect || ExtendedInMem)
26a73082SReid Kleckner    ValVT = VA.getLocVT();
26a73082SReid Kleckner  else
26a73082SReid Kleckner    ValVT = VA.getValVT();
26a73082SReid Kleckner
26a73082SReid Kleckner  // FIXME: For now, all byval parameter objects are marked mutable. This can be
26a73082SReid Kleckner  // changed with more analysis.
26a73082SReid Kleckner  // In case of tail call optimization mark all arguments mutable. Since they
26a73082SReid Kleckner  // could be overwritten by lowering of arguments in case of a tail call.
26a73082SReid Kleckner  if (Flags.isByVal()) {
26a73082SReid Kleckner    unsigned Bytes = Flags.getByValSize();
26a73082SReid Kleckner    if (Bytes == 0) Bytes = 1; // Don't create zero-sized stack objects.
26a73082SReid Kleckner
26a73082SReid Kleckner    // FIXME: For now, all byval parameter objects are marked as aliasing. This
26a73082SReid Kleckner    // can be improved with deeper analysis.
26a73082SReid Kleckner    int FI = MFI.CreateFixedObject(Bytes, VA.getLocMemOffset(), isImmutable,
26a73082SReid Kleckner                                   /*isAliased=*/true);
26a73082SReid Kleckner    return DAG.getFrameIndex(FI, PtrVT);
26a73082SReid Kleckner  }
26a73082SReid Kleckner
26a73082SReid Kleckner  EVT ArgVT = Ins[i].ArgVT;
26a73082SReid Kleckner
26a73082SReid Kleckner  // If this is a vector that has been split into multiple parts, don't elide
26a73082SReid Kleckner  // the copy. The layout on the stack may not match the packed in-memory
26a73082SReid Kleckner  // layout.
26a73082SReid Kleckner  bool ScalarizedVector = ArgVT.isVector() && !VA.getLocVT().isVector();
26a73082SReid Kleckner
26a73082SReid Kleckner  // This is an argument in memory. We might be able to perform copy elision.
26a73082SReid Kleckner  // If the argument is passed directly in memory without any extension, then we
26a73082SReid Kleckner  // can perform copy elision. Large vector types, for example, may be passed
26a73082SReid Kleckner  // indirectly by pointer.
26a73082SReid Kleckner  if (Flags.isCopyElisionCandidate() &&
26a73082SReid Kleckner      VA.getLocInfo() != CCValAssign::Indirect && !ExtendedInMem &&
26a73082SReid Kleckner      !ScalarizedVector) {
26a73082SReid Kleckner    SDValue PartAddr;
26a73082SReid Kleckner    if (Ins[i].PartOffset == 0) {
26a73082SReid Kleckner      // If this is a one-part value or the first part of a multi-part value,
26a73082SReid Kleckner      // create a stack object for the entire argument value type and return a
26a73082SReid Kleckner      // load from our portion of it. This assumes that if the first part of an
26a73082SReid Kleckner      // argument is in memory, the rest will also be in memory.
26a73082SReid Kleckner      int FI = MFI.CreateFixedObject(ArgVT.getStoreSize(), VA.getLocMemOffset(),
26a73082SReid Kleckner                                     /*IsImmutable=*/false);
26a73082SReid Kleckner      PartAddr = DAG.getFrameIndex(FI, PtrVT);
26a73082SReid Kleckner      return DAG.getLoad(
26a73082SReid Kleckner          ValVT, dl, Chain, PartAddr,
26a73082SReid Kleckner          MachinePointerInfo::getFixedStack(DAG.getMachineFunction(), FI));
26a73082SReid Kleckner    }
26a73082SReid Kleckner
26a73082SReid Kleckner    // This is not the first piece of an argument in memory. See if there is
26a73082SReid Kleckner    // already a fixed stack object including this offset. If so, assume it
26a73082SReid Kleckner    // was created by the PartOffset == 0 branch above and create a load from
26a73082SReid Kleckner    // the appropriate offset into it.
26a73082SReid Kleckner    int64_t PartBegin = VA.getLocMemOffset();
26a73082SReid Kleckner    int64_t PartEnd = PartBegin + ValVT.getSizeInBits() / 8;
26a73082SReid Kleckner    int FI = MFI.getObjectIndexBegin();
26a73082SReid Kleckner    for (; MFI.isFixedObjectIndex(FI); ++FI) {
26a73082SReid Kleckner      int64_t ObjBegin = MFI.getObjectOffset(FI);
26a73082SReid Kleckner      int64_t ObjEnd = ObjBegin + MFI.getObjectSize(FI);
26a73082SReid Kleckner      if (ObjBegin <= PartBegin && PartEnd <= ObjEnd)
26a73082SReid Kleckner        break;
26a73082SReid Kleckner    }
26a73082SReid Kleckner    if (MFI.isFixedObjectIndex(FI)) {
26a73082SReid Kleckner      SDValue Addr =
26a73082SReid Kleckner          DAG.getNode(ISD::ADD, dl, PtrVT, DAG.getFrameIndex(FI, PtrVT),
26a73082SReid Kleckner                      DAG.getIntPtrConstant(Ins[i].PartOffset, dl));
26a73082SReid Kleckner      return DAG.getLoad(ValVT, dl, Chain, Addr,
26a73082SReid Kleckner                         MachinePointerInfo::getFixedStack(
26a73082SReid Kleckner                             DAG.getMachineFunction(), FI, Ins[i].PartOffset));
26a73082SReid Kleckner    }
26a73082SReid Kleckner  }
26a73082SReid Kleckner
26a73082SReid Kleckner  int FI = MFI.CreateFixedObject(ValVT.getSizeInBits() / 8,
26a73082SReid Kleckner                                 VA.getLocMemOffset(), isImmutable);
26a73082SReid Kleckner
26a73082SReid Kleckner  // Set SExt or ZExt flag.
26a73082SReid Kleckner  if (VA.getLocInfo() == CCValAssign::ZExt) {
26a73082SReid Kleckner    MFI.setObjectZExt(FI, true);
26a73082SReid Kleckner  } else if (VA.getLocInfo() == CCValAssign::SExt) {
26a73082SReid Kleckner    MFI.setObjectSExt(FI, true);
26a73082SReid Kleckner  }
26a73082SReid Kleckner
26a73082SReid Kleckner  MaybeAlign Alignment;
26a73082SReid Kleckner  if (Subtarget.isTargetWindowsMSVC() && !Subtarget.is64Bit() &&
26a73082SReid Kleckner      ValVT != MVT::f80)
26a73082SReid Kleckner    Alignment = MaybeAlign(4);
26a73082SReid Kleckner  SDValue FIN = DAG.getFrameIndex(FI, PtrVT);
26a73082SReid Kleckner  SDValue Val = DAG.getLoad(
26a73082SReid Kleckner      ValVT, dl, Chain, FIN,
26a73082SReid Kleckner      MachinePointerInfo::getFixedStack(DAG.getMachineFunction(), FI),
26a73082SReid Kleckner      Alignment);
26a73082SReid Kleckner  return ExtendedInMem
26a73082SReid Kleckner             ? (VA.getValVT().isVector()
26a73082SReid Kleckner                    ? DAG.getNode(ISD::SCALAR_TO_VECTOR, dl, VA.getValVT(), Val)
26a73082SReid Kleckner                    : DAG.getNode(ISD::TRUNCATE, dl, VA.getValVT(), Val))
26a73082SReid Kleckner             : Val;
26a73082SReid Kleckner}
26a73082SReid Kleckner
26a73082SReid Kleckner// FIXME: Get this from tablegen.
26a73082SReid Klecknerstatic ArrayRef<MCPhysReg> get64BitArgumentGPRs(CallingConv::ID CallConv,
26a73082SReid Kleckner                                                const X86Subtarget &Subtarget) {
26a73082SReid Kleckner  assert(Subtarget.is64Bit());
26a73082SReid Kleckner
26a73082SReid Kleckner  if (Subtarget.isCallingConvWin64(CallConv)) {
26a73082SReid Kleckner    static const MCPhysReg GPR64ArgRegsWin64[] = {
26a73082SReid Kleckner      X86::RCX, X86::RDX, X86::R8,  X86::R9
26a73082SReid Kleckner    };
13d09dfaSCraig Topper    return GPR64ArgRegsWin64;
26a73082SReid Kleckner  }
26a73082SReid Kleckner
26a73082SReid Kleckner  static const MCPhysReg GPR64ArgRegs64Bit[] = {
26a73082SReid Kleckner    X86::RDI, X86::RSI, X86::RDX, X86::RCX, X86::R8, X86::R9
26a73082SReid Kleckner  };
13d09dfaSCraig Topper  return GPR64ArgRegs64Bit;
26a73082SReid Kleckner}
26a73082SReid Kleckner
26a73082SReid Kleckner// FIXME: Get this from tablegen.
26a73082SReid Klecknerstatic ArrayRef<MCPhysReg> get64BitArgumentXMMs(MachineFunction &MF,
26a73082SReid Kleckner                                                CallingConv::ID CallConv,
26a73082SReid Kleckner                                                const X86Subtarget &Subtarget) {
26a73082SReid Kleckner  assert(Subtarget.is64Bit());
26a73082SReid Kleckner  if (Subtarget.isCallingConvWin64(CallConv)) {
26a73082SReid Kleckner    // The XMM registers which might contain var arg parameters are shadowed
26a73082SReid Kleckner    // in their paired GPR.  So we only need to save the GPR to their home
26a73082SReid Kleckner    // slots.
26a73082SReid Kleckner    // TODO: __vectorcall will change this.
e03f4271SJay Foad    return {};
26a73082SReid Kleckner  }
26a73082SReid Kleckner
26a73082SReid Kleckner  bool isSoftFloat = Subtarget.useSoftFloat();
26a73082SReid Kleckner  if (isSoftFloat || !Subtarget.hasSSE1())
26a73082SReid Kleckner    // Kernel mode asks for SSE to be disabled, so there are no XMM argument
26a73082SReid Kleckner    // registers.
e03f4271SJay Foad    return {};
26a73082SReid Kleckner
26a73082SReid Kleckner  static const MCPhysReg XMMArgRegs64Bit[] = {
26a73082SReid Kleckner    X86::XMM0, X86::XMM1, X86::XMM2, X86::XMM3,
26a73082SReid Kleckner    X86::XMM4, X86::XMM5, X86::XMM6, X86::XMM7
26a73082SReid Kleckner  };
13d09dfaSCraig Topper  return XMMArgRegs64Bit;
26a73082SReid Kleckner}
26a73082SReid Kleckner
26a73082SReid Kleckner#ifndef NDEBUG
26a73082SReid Klecknerstatic bool isSortedByValueNo(ArrayRef<CCValAssign> ArgLocs) {
26a73082SReid Kleckner  return llvm::is_sorted(
26a73082SReid Kleckner      ArgLocs, [](const CCValAssign &A, const CCValAssign &B) -> bool {
26a73082SReid Kleckner        return A.getValNo() < B.getValNo();
26a73082SReid Kleckner      });
26a73082SReid Kleckner}
26a73082SReid Kleckner#endif
26a73082SReid Kleckner
26a73082SReid Klecknernamespace {
26a73082SReid Kleckner/// This is a helper class for lowering variable arguments parameters.
26a73082SReid Klecknerclass VarArgsLoweringHelper {
26a73082SReid Klecknerpublic:
26a73082SReid Kleckner  VarArgsLoweringHelper(X86MachineFunctionInfo *FuncInfo, const SDLoc &Loc,
26a73082SReid Kleckner                        SelectionDAG &DAG, const X86Subtarget &Subtarget,
26a73082SReid Kleckner                        CallingConv::ID CallConv, CCState &CCInfo)
26a73082SReid Kleckner      : FuncInfo(FuncInfo), DL(Loc), DAG(DAG), Subtarget(Subtarget),
26a73082SReid Kleckner        TheMachineFunction(DAG.getMachineFunction()),
26a73082SReid Kleckner        TheFunction(TheMachineFunction.getFunction()),
26a73082SReid Kleckner        FrameInfo(TheMachineFunction.getFrameInfo()),
26a73082SReid Kleckner        FrameLowering(*Subtarget.getFrameLowering()),
26a73082SReid Kleckner        TargLowering(DAG.getTargetLoweringInfo()), CallConv(CallConv),
26a73082SReid Kleckner        CCInfo(CCInfo) {}
26a73082SReid Kleckner
26a73082SReid Kleckner  // Lower variable arguments parameters.
26a73082SReid Kleckner  void lowerVarArgsParameters(SDValue &Chain, unsigned StackSize);
26a73082SReid Kleckner
26a73082SReid Klecknerprivate:
26a73082SReid Kleckner  void createVarArgAreaAndStoreRegisters(SDValue &Chain, unsigned StackSize);
26a73082SReid Kleckner
26a73082SReid Kleckner  void forwardMustTailParameters(SDValue &Chain);
26a73082SReid Kleckner
26a73082SReid Kleckner  bool is64Bit() const { return Subtarget.is64Bit(); }
26a73082SReid Kleckner  bool isWin64() const { return Subtarget.isCallingConvWin64(CallConv); }
26a73082SReid Kleckner
26a73082SReid Kleckner  X86MachineFunctionInfo *FuncInfo;
26a73082SReid Kleckner  const SDLoc &DL;
26a73082SReid Kleckner  SelectionDAG &DAG;
26a73082SReid Kleckner  const X86Subtarget &Subtarget;
26a73082SReid Kleckner  MachineFunction &TheMachineFunction;
26a73082SReid Kleckner  const Function &TheFunction;
26a73082SReid Kleckner  MachineFrameInfo &FrameInfo;
26a73082SReid Kleckner  const TargetFrameLowering &FrameLowering;
26a73082SReid Kleckner  const TargetLowering &TargLowering;
26a73082SReid Kleckner  CallingConv::ID CallConv;
26a73082SReid Kleckner  CCState &CCInfo;
26a73082SReid Kleckner};
26a73082SReid Kleckner} // namespace
26a73082SReid Kleckner
26a73082SReid Klecknervoid VarArgsLoweringHelper::createVarArgAreaAndStoreRegisters(
26a73082SReid Kleckner    SDValue &Chain, unsigned StackSize) {
26a73082SReid Kleckner  // If the function takes variable number of arguments, make a frame index for
26a73082SReid Kleckner  // the start of the first vararg value... for expansion of llvm.va_start. We
26a73082SReid Kleckner  // can skip this if there are no va_start calls.
26a73082SReid Kleckner  if (is64Bit() || (CallConv != CallingConv::X86_FastCall &&
26a73082SReid Kleckner                    CallConv != CallingConv::X86_ThisCall)) {
26a73082SReid Kleckner    FuncInfo->setVarArgsFrameIndex(
26a73082SReid Kleckner        FrameInfo.CreateFixedObject(1, StackSize, true));
26a73082SReid Kleckner  }
26a73082SReid Kleckner
26a73082SReid Kleckner  // 64-bit calling conventions support varargs and register parameters, so we
26a73082SReid Kleckner  // have to do extra work to spill them in the prologue.
26a73082SReid Kleckner  if (is64Bit()) {
26a73082SReid Kleckner    // Find the first unallocated argument registers.
26a73082SReid Kleckner    ArrayRef<MCPhysReg> ArgGPRs = get64BitArgumentGPRs(CallConv, Subtarget);
26a73082SReid Kleckner    ArrayRef<MCPhysReg> ArgXMMs =
26a73082SReid Kleckner        get64BitArgumentXMMs(TheMachineFunction, CallConv, Subtarget);
26a73082SReid Kleckner    unsigned NumIntRegs = CCInfo.getFirstUnallocated(ArgGPRs);
26a73082SReid Kleckner    unsigned NumXMMRegs = CCInfo.getFirstUnallocated(ArgXMMs);
26a73082SReid Kleckner
26a73082SReid Kleckner    assert(!(NumXMMRegs && !Subtarget.hasSSE1()) &&
26a73082SReid Kleckner           "SSE register cannot be used when SSE is disabled!");
26a73082SReid Kleckner
26a73082SReid Kleckner    if (isWin64()) {
26a73082SReid Kleckner      // Get to the caller-allocated home save location.  Add 8 to account
26a73082SReid Kleckner      // for the return address.
26a73082SReid Kleckner      int HomeOffset = FrameLowering.getOffsetOfLocalArea() + 8;
26a73082SReid Kleckner      FuncInfo->setRegSaveFrameIndex(
26a73082SReid Kleckner          FrameInfo.CreateFixedObject(1, NumIntRegs * 8 + HomeOffset, false));
26a73082SReid Kleckner      // Fixup to set vararg frame on shadow area (4 x i64).
26a73082SReid Kleckner      if (NumIntRegs < 4)
26a73082SReid Kleckner        FuncInfo->setVarArgsFrameIndex(FuncInfo->getRegSaveFrameIndex());
26a73082SReid Kleckner    } else {
26a73082SReid Kleckner      // For X86-64, if there are vararg parameters that are passed via
26a73082SReid Kleckner      // registers, then we must store them to their spots on the stack so
26a73082SReid Kleckner      // they may be loaded by dereferencing the result of va_next.
26a73082SReid Kleckner      FuncInfo->setVarArgsGPOffset(NumIntRegs * 8);
26a73082SReid Kleckner      FuncInfo->setVarArgsFPOffset(ArgGPRs.size() * 8 + NumXMMRegs * 16);
26a73082SReid Kleckner      FuncInfo->setRegSaveFrameIndex(FrameInfo.CreateStackObject(
26a73082SReid Kleckner          ArgGPRs.size() * 8 + ArgXMMs.size() * 16, Align(16), false));
26a73082SReid Kleckner    }
26a73082SReid Kleckner
26a73082SReid Kleckner    SmallVector<SDValue, 6>
26a73082SReid Kleckner        LiveGPRs; // list of SDValue for GPR registers keeping live input value
26a73082SReid Kleckner    SmallVector<SDValue, 8> LiveXMMRegs; // list of SDValue for XMM registers
26a73082SReid Kleckner                                         // keeping live input value
26a73082SReid Kleckner    SDValue ALVal; // if applicable keeps SDValue for %al register
26a73082SReid Kleckner
26a73082SReid Kleckner    // Gather all the live in physical registers.
26a73082SReid Kleckner    for (MCPhysReg Reg : ArgGPRs.slice(NumIntRegs)) {
26a73082SReid Kleckner      Register GPR = TheMachineFunction.addLiveIn(Reg, &X86::GR64RegClass);
26a73082SReid Kleckner      LiveGPRs.push_back(DAG.getCopyFromReg(Chain, DL, GPR, MVT::i64));
26a73082SReid Kleckner    }
26a73082SReid Kleckner    const auto &AvailableXmms = ArgXMMs.slice(NumXMMRegs);
26a73082SReid Kleckner    if (!AvailableXmms.empty()) {
26a73082SReid Kleckner      Register AL = TheMachineFunction.addLiveIn(X86::AL, &X86::GR8RegClass);
26a73082SReid Kleckner      ALVal = DAG.getCopyFromReg(Chain, DL, AL, MVT::i8);
26a73082SReid Kleckner      for (MCPhysReg Reg : AvailableXmms) {
26a73082SReid Kleckner        // FastRegisterAllocator spills virtual registers at basic
26a73082SReid Kleckner        // block boundary. That leads to usages of xmm registers
26a73082SReid Kleckner        // outside of check for %al. Pass physical registers to
26a73082SReid Kleckner        // VASTART_SAVE_XMM_REGS to avoid unneccessary spilling.
26a73082SReid Kleckner        TheMachineFunction.getRegInfo().addLiveIn(Reg);
26a73082SReid Kleckner        LiveXMMRegs.push_back(DAG.getRegister(Reg, MVT::v4f32));
26a73082SReid Kleckner      }
26a73082SReid Kleckner    }
26a73082SReid Kleckner
26a73082SReid Kleckner    // Store the integer parameter registers.
26a73082SReid Kleckner    SmallVector<SDValue, 8> MemOps;
26a73082SReid Kleckner    SDValue RSFIN =
26a73082SReid Kleckner        DAG.getFrameIndex(FuncInfo->getRegSaveFrameIndex(),
26a73082SReid Kleckner                          TargLowering.getPointerTy(DAG.getDataLayout()));
26a73082SReid Kleckner    unsigned Offset = FuncInfo->getVarArgsGPOffset();
26a73082SReid Kleckner    for (SDValue Val : LiveGPRs) {
26a73082SReid Kleckner      SDValue FIN = DAG.getNode(ISD::ADD, DL,
26a73082SReid Kleckner                                TargLowering.getPointerTy(DAG.getDataLayout()),
26a73082SReid Kleckner                                RSFIN, DAG.getIntPtrConstant(Offset, DL));
26a73082SReid Kleckner      SDValue Store =
26a73082SReid Kleckner          DAG.getStore(Val.getValue(1), DL, Val, FIN,
26a73082SReid Kleckner                       MachinePointerInfo::getFixedStack(
26a73082SReid Kleckner                           DAG.getMachineFunction(),
26a73082SReid Kleckner                           FuncInfo->getRegSaveFrameIndex(), Offset));
26a73082SReid Kleckner      MemOps.push_back(Store);
26a73082SReid Kleckner      Offset += 8;
26a73082SReid Kleckner    }
26a73082SReid Kleckner
26a73082SReid Kleckner    // Now store the XMM (fp + vector) parameter registers.
26a73082SReid Kleckner    if (!LiveXMMRegs.empty()) {
26a73082SReid Kleckner      SmallVector<SDValue, 12> SaveXMMOps;
26a73082SReid Kleckner      SaveXMMOps.push_back(Chain);
26a73082SReid Kleckner      SaveXMMOps.push_back(ALVal);
26a73082SReid Kleckner      SaveXMMOps.push_back(RSFIN);
26a73082SReid Kleckner      SaveXMMOps.push_back(
26a73082SReid Kleckner          DAG.getTargetConstant(FuncInfo->getVarArgsFPOffset(), DL, MVT::i32));
26a73082SReid Kleckner      llvm::append_range(SaveXMMOps, LiveXMMRegs);
26a73082SReid Kleckner      MachineMemOperand *StoreMMO =
26a73082SReid Kleckner          DAG.getMachineFunction().getMachineMemOperand(
26a73082SReid Kleckner              MachinePointerInfo::getFixedStack(
26a73082SReid Kleckner                  DAG.getMachineFunction(), FuncInfo->getRegSaveFrameIndex(),
26a73082SReid Kleckner                  Offset),
26a73082SReid Kleckner              MachineMemOperand::MOStore, 128, Align(16));
26a73082SReid Kleckner      MemOps.push_back(DAG.getMemIntrinsicNode(X86ISD::VASTART_SAVE_XMM_REGS,
26a73082SReid Kleckner                                               DL, DAG.getVTList(MVT::Other),
26a73082SReid Kleckner                                               SaveXMMOps, MVT::i8, StoreMMO));
26a73082SReid Kleckner    }
26a73082SReid Kleckner
26a73082SReid Kleckner    if (!MemOps.empty())
26a73082SReid Kleckner      Chain = DAG.getNode(ISD::TokenFactor, DL, MVT::Other, MemOps);
26a73082SReid Kleckner  }
26a73082SReid Kleckner}
26a73082SReid Kleckner
26a73082SReid Klecknervoid VarArgsLoweringHelper::forwardMustTailParameters(SDValue &Chain) {
26a73082SReid Kleckner  // Find the largest legal vector type.
26a73082SReid Kleckner  MVT VecVT = MVT::Other;
26a73082SReid Kleckner  // FIXME: Only some x86_32 calling conventions support AVX512.
26a73082SReid Kleckner  if (Subtarget.useAVX512Regs() &&
26a73082SReid Kleckner      (is64Bit() || (CallConv == CallingConv::X86_VectorCall ||
26a73082SReid Kleckner                     CallConv == CallingConv::Intel_OCL_BI)))
26a73082SReid Kleckner    VecVT = MVT::v16f32;
26a73082SReid Kleckner  else if (Subtarget.hasAVX())
26a73082SReid Kleckner    VecVT = MVT::v8f32;
26a73082SReid Kleckner  else if (Subtarget.hasSSE2())
26a73082SReid Kleckner    VecVT = MVT::v4f32;
26a73082SReid Kleckner
26a73082SReid Kleckner  // We forward some GPRs and some vector types.
26a73082SReid Kleckner  SmallVector<MVT, 2> RegParmTypes;
26a73082SReid Kleckner  MVT IntVT = is64Bit() ? MVT::i64 : MVT::i32;
26a73082SReid Kleckner  RegParmTypes.push_back(IntVT);
26a73082SReid Kleckner  if (VecVT != MVT::Other)
26a73082SReid Kleckner    RegParmTypes.push_back(VecVT);
26a73082SReid Kleckner
26a73082SReid Kleckner  // Compute the set of forwarded registers. The rest are scratch.
26a73082SReid Kleckner  SmallVectorImpl<ForwardedRegister> &Forwards =
26a73082SReid Kleckner      FuncInfo->getForwardedMustTailRegParms();
26a73082SReid Kleckner  CCInfo.analyzeMustTailForwardedRegisters(Forwards, RegParmTypes, CC_X86);
26a73082SReid Kleckner
26a73082SReid Kleckner  // Forward AL for SysV x86_64 targets, since it is used for varargs.
26a73082SReid Kleckner  if (is64Bit() && !isWin64() && !CCInfo.isAllocated(X86::AL)) {
26a73082SReid Kleckner    Register ALVReg = TheMachineFunction.addLiveIn(X86::AL, &X86::GR8RegClass);
26a73082SReid Kleckner    Forwards.push_back(ForwardedRegister(ALVReg, X86::AL, MVT::i8));
26a73082SReid Kleckner  }
26a73082SReid Kleckner
26a73082SReid Kleckner  // Copy all forwards from physical to virtual registers.
26a73082SReid Kleckner  for (ForwardedRegister &FR : Forwards) {
26a73082SReid Kleckner    // FIXME: Can we use a less constrained schedule?
26a73082SReid Kleckner    SDValue RegVal = DAG.getCopyFromReg(Chain, DL, FR.VReg, FR.VT);
26a73082SReid Kleckner    FR.VReg = TheMachineFunction.getRegInfo().createVirtualRegister(
26a73082SReid Kleckner        TargLowering.getRegClassFor(FR.VT));
26a73082SReid Kleckner    Chain = DAG.getCopyToReg(Chain, DL, FR.VReg, RegVal);
26a73082SReid Kleckner  }
26a73082SReid Kleckner}
26a73082SReid Kleckner
26a73082SReid Klecknervoid VarArgsLoweringHelper::lowerVarArgsParameters(SDValue &Chain,
26a73082SReid Kleckner                                                   unsigned StackSize) {
26a73082SReid Kleckner  // Set FrameIndex to the 0xAAAAAAA value to mark unset state.
26a73082SReid Kleckner  // If necessary, it would be set into the correct value later.
26a73082SReid Kleckner  FuncInfo->setVarArgsFrameIndex(0xAAAAAAA);
26a73082SReid Kleckner  FuncInfo->setRegSaveFrameIndex(0xAAAAAAA);
26a73082SReid Kleckner
26a73082SReid Kleckner  if (FrameInfo.hasVAStart())
26a73082SReid Kleckner    createVarArgAreaAndStoreRegisters(Chain, StackSize);
26a73082SReid Kleckner
26a73082SReid Kleckner  if (FrameInfo.hasMustTailInVarArgFunc())
26a73082SReid Kleckner    forwardMustTailParameters(Chain);
26a73082SReid Kleckner}
26a73082SReid Kleckner
26a73082SReid KlecknerSDValue X86TargetLowering::LowerFormalArguments(
26a73082SReid Kleckner    SDValue Chain, CallingConv::ID CallConv, bool IsVarArg,
26a73082SReid Kleckner    const SmallVectorImpl<ISD::InputArg> &Ins, const SDLoc &dl,
26a73082SReid Kleckner    SelectionDAG &DAG, SmallVectorImpl<SDValue> &InVals) const {
26a73082SReid Kleckner  MachineFunction &MF = DAG.getMachineFunction();
26a73082SReid Kleckner  X86MachineFunctionInfo *FuncInfo = MF.getInfo<X86MachineFunctionInfo>();
26a73082SReid Kleckner
26a73082SReid Kleckner  const Function &F = MF.getFunction();
26a73082SReid Kleckner  if (F.hasExternalLinkage() && Subtarget.isTargetCygMing() &&
26a73082SReid Kleckner      F.getName() == "main")
26a73082SReid Kleckner    FuncInfo->setForceFramePointer(true);
26a73082SReid Kleckner
26a73082SReid Kleckner  MachineFrameInfo &MFI = MF.getFrameInfo();
26a73082SReid Kleckner  bool Is64Bit = Subtarget.is64Bit();
26a73082SReid Kleckner  bool IsWin64 = Subtarget.isCallingConvWin64(CallConv);
26a73082SReid Kleckner
26a73082SReid Kleckner  assert(
26a73082SReid Kleckner      !(IsVarArg && canGuaranteeTCO(CallConv)) &&
26a73082SReid Kleckner      "Var args not supported with calling conv' regcall, fastcc, ghc or hipe");
26a73082SReid Kleckner
26a73082SReid Kleckner  // Assign locations to all of the incoming arguments.
26a73082SReid Kleckner  SmallVector<CCValAssign, 16> ArgLocs;
26a73082SReid Kleckner  CCState CCInfo(CallConv, IsVarArg, MF, ArgLocs, *DAG.getContext());
26a73082SReid Kleckner
26a73082SReid Kleckner  // Allocate shadow area for Win64.
26a73082SReid Kleckner  if (IsWin64)
26a73082SReid Kleckner    CCInfo.AllocateStack(32, Align(8));
26a73082SReid Kleckner
26a73082SReid Kleckner  CCInfo.AnalyzeArguments(Ins, CC_X86);
26a73082SReid Kleckner
26a73082SReid Kleckner  // In vectorcall calling convention a second pass is required for the HVA
26a73082SReid Kleckner  // types.
26a73082SReid Kleckner  if (CallingConv::X86_VectorCall == CallConv) {
26a73082SReid Kleckner    CCInfo.AnalyzeArgumentsSecondPass(Ins, CC_X86);
26a73082SReid Kleckner  }
26a73082SReid Kleckner
26a73082SReid Kleckner  // The next loop assumes that the locations are in the same order of the
26a73082SReid Kleckner  // input arguments.
26a73082SReid Kleckner  assert(isSortedByValueNo(ArgLocs) &&
26a73082SReid Kleckner         "Argument Location list must be sorted before lowering");
26a73082SReid Kleckner
26a73082SReid Kleckner  SDValue ArgValue;
26a73082SReid Kleckner  for (unsigned I = 0, InsIndex = 0, E = ArgLocs.size(); I != E;
26a73082SReid Kleckner       ++I, ++InsIndex) {
26a73082SReid Kleckner    assert(InsIndex < Ins.size() && "Invalid Ins index");
26a73082SReid Kleckner    CCValAssign &VA = ArgLocs[I];
26a73082SReid Kleckner
26a73082SReid Kleckner    if (VA.isRegLoc()) {
26a73082SReid Kleckner      EVT RegVT = VA.getLocVT();
26a73082SReid Kleckner      if (VA.needsCustom()) {
26a73082SReid Kleckner        assert(
26a73082SReid Kleckner            VA.getValVT() == MVT::v64i1 &&
26a73082SReid Kleckner            "Currently the only custom case is when we split v64i1 to 2 regs");
26a73082SReid Kleckner
26a73082SReid Kleckner        // v64i1 values, in regcall calling convention, that are
26a73082SReid Kleckner        // compiled to 32 bit arch, are split up into two registers.
26a73082SReid Kleckner        ArgValue =
26a73082SReid Kleckner            getv64i1Argument(VA, ArgLocs[++I], Chain, DAG, dl, Subtarget);
26a73082SReid Kleckner      } else {
26a73082SReid Kleckner        const TargetRegisterClass *RC;
26a73082SReid Kleckner        if (RegVT == MVT::i8)
26a73082SReid Kleckner          RC = &X86::GR8RegClass;
26a73082SReid Kleckner        else if (RegVT == MVT::i16)
26a73082SReid Kleckner          RC = &X86::GR16RegClass;
26a73082SReid Kleckner        else if (RegVT == MVT::i32)
26a73082SReid Kleckner          RC = &X86::GR32RegClass;
26a73082SReid Kleckner        else if (Is64Bit && RegVT == MVT::i64)
26a73082SReid Kleckner          RC = &X86::GR64RegClass;
26a73082SReid Kleckner        else if (RegVT == MVT::f16)
26a73082SReid Kleckner          RC = Subtarget.hasAVX512() ? &X86::FR16XRegClass : &X86::FR16RegClass;
26a73082SReid Kleckner        else if (RegVT == MVT::f32)
26a73082SReid Kleckner          RC = Subtarget.hasAVX512() ? &X86::FR32XRegClass : &X86::FR32RegClass;
26a73082SReid Kleckner        else if (RegVT == MVT::f64)
26a73082SReid Kleckner          RC = Subtarget.hasAVX512() ? &X86::FR64XRegClass : &X86::FR64RegClass;
26a73082SReid Kleckner        else if (RegVT == MVT::f80)
26a73082SReid Kleckner          RC = &X86::RFP80RegClass;
26a73082SReid Kleckner        else if (RegVT == MVT::f128)
26a73082SReid Kleckner          RC = &X86::VR128RegClass;
26a73082SReid Kleckner        else if (RegVT.is512BitVector())
26a73082SReid Kleckner          RC = &X86::VR512RegClass;
26a73082SReid Kleckner        else if (RegVT.is256BitVector())
26a73082SReid Kleckner          RC = Subtarget.hasVLX() ? &X86::VR256XRegClass : &X86::VR256RegClass;
26a73082SReid Kleckner        else if (RegVT.is128BitVector())
26a73082SReid Kleckner          RC = Subtarget.hasVLX() ? &X86::VR128XRegClass : &X86::VR128RegClass;
26a73082SReid Kleckner        else if (RegVT == MVT::x86mmx)
26a73082SReid Kleckner          RC = &X86::VR64RegClass;
26a73082SReid Kleckner        else if (RegVT == MVT::v1i1)
26a73082SReid Kleckner          RC = &X86::VK1RegClass;
26a73082SReid Kleckner        else if (RegVT == MVT::v8i1)
26a73082SReid Kleckner          RC = &X86::VK8RegClass;
26a73082SReid Kleckner        else if (RegVT == MVT::v16i1)
26a73082SReid Kleckner          RC = &X86::VK16RegClass;
26a73082SReid Kleckner        else if (RegVT == MVT::v32i1)
26a73082SReid Kleckner          RC = &X86::VK32RegClass;
26a73082SReid Kleckner        else if (RegVT == MVT::v64i1)
26a73082SReid Kleckner          RC = &X86::VK64RegClass;
26a73082SReid Kleckner        else
26a73082SReid Kleckner          llvm_unreachable("Unknown argument type!");
26a73082SReid Kleckner
26a73082SReid Kleckner        Register Reg = MF.addLiveIn(VA.getLocReg(), RC);
26a73082SReid Kleckner        ArgValue = DAG.getCopyFromReg(Chain, dl, Reg, RegVT);
26a73082SReid Kleckner      }
26a73082SReid Kleckner
26a73082SReid Kleckner      // If this is an 8 or 16-bit value, it is really passed promoted to 32
26a73082SReid Kleckner      // bits.  Insert an assert[sz]ext to capture this, then truncate to the
26a73082SReid Kleckner      // right size.
26a73082SReid Kleckner      if (VA.getLocInfo() == CCValAssign::SExt)
26a73082SReid Kleckner        ArgValue = DAG.getNode(ISD::AssertSext, dl, RegVT, ArgValue,
26a73082SReid Kleckner                               DAG.getValueType(VA.getValVT()));
26a73082SReid Kleckner      else if (VA.getLocInfo() == CCValAssign::ZExt)
26a73082SReid Kleckner        ArgValue = DAG.getNode(ISD::AssertZext, dl, RegVT, ArgValue,
26a73082SReid Kleckner                               DAG.getValueType(VA.getValVT()));
26a73082SReid Kleckner      else if (VA.getLocInfo() == CCValAssign::BCvt)
26a73082SReid Kleckner        ArgValue = DAG.getBitcast(VA.getValVT(), ArgValue);
26a73082SReid Kleckner
26a73082SReid Kleckner      if (VA.isExtInLoc()) {
26a73082SReid Kleckner        // Handle MMX values passed in XMM regs.
26a73082SReid Kleckner        if (RegVT.isVector() && VA.getValVT().getScalarType() != MVT::i1)
26a73082SReid Kleckner          ArgValue = DAG.getNode(X86ISD::MOVDQ2Q, dl, VA.getValVT(), ArgValue);
26a73082SReid Kleckner        else if (VA.getValVT().isVector() &&
26a73082SReid Kleckner                 VA.getValVT().getScalarType() == MVT::i1 &&
26a73082SReid Kleckner                 ((VA.getLocVT() == MVT::i64) || (VA.getLocVT() == MVT::i32) ||
26a73082SReid Kleckner                  (VA.getLocVT() == MVT::i16) || (VA.getLocVT() == MVT::i8))) {
26a73082SReid Kleckner          // Promoting a mask type (v*i1) into a register of type i64/i32/i16/i8
26a73082SReid Kleckner          ArgValue = lowerRegToMasks(ArgValue, VA.getValVT(), RegVT, dl, DAG);
26a73082SReid Kleckner        } else
26a73082SReid Kleckner          ArgValue = DAG.getNode(ISD::TRUNCATE, dl, VA.getValVT(), ArgValue);
26a73082SReid Kleckner      }
26a73082SReid Kleckner    } else {
26a73082SReid Kleckner      assert(VA.isMemLoc());
26a73082SReid Kleckner      ArgValue =
26a73082SReid Kleckner          LowerMemArgument(Chain, CallConv, Ins, dl, DAG, VA, MFI, InsIndex);
26a73082SReid Kleckner    }
26a73082SReid Kleckner
26a73082SReid Kleckner    // If value is passed via pointer - do a load.
26a73082SReid Kleckner    if (VA.getLocInfo() == CCValAssign::Indirect &&
26a73082SReid Kleckner        !(Ins[I].Flags.isByVal() && VA.isRegLoc())) {
26a73082SReid Kleckner      ArgValue =
26a73082SReid Kleckner          DAG.getLoad(VA.getValVT(), dl, Chain, ArgValue, MachinePointerInfo());
26a73082SReid Kleckner    }
26a73082SReid Kleckner
26a73082SReid Kleckner    InVals.push_back(ArgValue);
26a73082SReid Kleckner  }
26a73082SReid Kleckner
26a73082SReid Kleckner  for (unsigned I = 0, E = Ins.size(); I != E; ++I) {
26a73082SReid Kleckner    if (Ins[I].Flags.isSwiftAsync()) {
26a73082SReid Kleckner      auto X86FI = MF.getInfo<X86MachineFunctionInfo>();
dd70aef0SAlex Lorenz      if (X86::isExtendedSwiftAsyncFrameSupported(Subtarget, MF))
26a73082SReid Kleckner        X86FI->setHasSwiftAsyncContext(true);
26a73082SReid Kleckner      else {
dd70aef0SAlex Lorenz        int PtrSize = Subtarget.is64Bit() ? 8 : 4;
dd70aef0SAlex Lorenz        int FI =
dd70aef0SAlex Lorenz            MF.getFrameInfo().CreateStackObject(PtrSize, Align(PtrSize), false);
26a73082SReid Kleckner        X86FI->setSwiftAsyncContextFrameIdx(FI);
dd70aef0SAlex Lorenz        SDValue St = DAG.getStore(
dd70aef0SAlex Lorenz            DAG.getEntryNode(), dl, InVals[I],
dd70aef0SAlex Lorenz            DAG.getFrameIndex(FI, PtrSize == 8 ? MVT::i64 : MVT::i32),
26a73082SReid Kleckner            MachinePointerInfo::getFixedStack(MF, FI));
26a73082SReid Kleckner        Chain = DAG.getNode(ISD::TokenFactor, dl, MVT::Other, St, Chain);
26a73082SReid Kleckner      }
26a73082SReid Kleckner    }
26a73082SReid Kleckner
26a73082SReid Kleckner    // Swift calling convention does not require we copy the sret argument
26a73082SReid Kleckner    // into %rax/%eax for the return. We don't set SRetReturnReg for Swift.
26a73082SReid Kleckner    if (CallConv == CallingConv::Swift || CallConv == CallingConv::SwiftTail)
26a73082SReid Kleckner      continue;
26a73082SReid Kleckner
26a73082SReid Kleckner    // All x86 ABIs require that for returning structs by value we copy the
26a73082SReid Kleckner    // sret argument into %rax/%eax (depending on ABI) for the return. Save
26a73082SReid Kleckner    // the argument into a virtual register so that we can access it from the
26a73082SReid Kleckner    // return points.
26a73082SReid Kleckner    if (Ins[I].Flags.isSRet()) {
26a73082SReid Kleckner      assert(!FuncInfo->getSRetReturnReg() &&
26a73082SReid Kleckner             "SRet return has already been set");
26a73082SReid Kleckner      MVT PtrTy = getPointerTy(DAG.getDataLayout());
26a73082SReid Kleckner      Register Reg =
26a73082SReid Kleckner          MF.getRegInfo().createVirtualRegister(getRegClassFor(PtrTy));
26a73082SReid Kleckner      FuncInfo->setSRetReturnReg(Reg);
26a73082SReid Kleckner      SDValue Copy = DAG.getCopyToReg(DAG.getEntryNode(), dl, Reg, InVals[I]);
26a73082SReid Kleckner      Chain = DAG.getNode(ISD::TokenFactor, dl, MVT::Other, Copy, Chain);
26a73082SReid Kleckner      break;
26a73082SReid Kleckner    }
26a73082SReid Kleckner  }
26a73082SReid Kleckner
26a73082SReid Kleckner  unsigned StackSize = CCInfo.getStackSize();
26a73082SReid Kleckner  // Align stack specially for tail calls.
26a73082SReid Kleckner  if (shouldGuaranteeTCO(CallConv,
26a73082SReid Kleckner                         MF.getTarget().Options.GuaranteedTailCallOpt))
26a73082SReid Kleckner    StackSize = GetAlignedArgumentStackSize(StackSize, DAG);
26a73082SReid Kleckner
26a73082SReid Kleckner  if (IsVarArg)
26a73082SReid Kleckner    VarArgsLoweringHelper(FuncInfo, dl, DAG, Subtarget, CallConv, CCInfo)
26a73082SReid Kleckner        .lowerVarArgsParameters(Chain, StackSize);
26a73082SReid Kleckner
26a73082SReid Kleckner  // Some CCs need callee pop.
26a73082SReid Kleckner  if (X86::isCalleePop(CallConv, Is64Bit, IsVarArg,
26a73082SReid Kleckner                       MF.getTarget().Options.GuaranteedTailCallOpt)) {
26a73082SReid Kleckner    FuncInfo->setBytesToPopOnReturn(StackSize); // Callee pops everything.
26a73082SReid Kleckner  } else if (CallConv == CallingConv::X86_INTR && Ins.size() == 2) {
26a73082SReid Kleckner    // X86 interrupts must pop the error code (and the alignment padding) if
26a73082SReid Kleckner    // present.
26a73082SReid Kleckner    FuncInfo->setBytesToPopOnReturn(Is64Bit ? 16 : 4);
26a73082SReid Kleckner  } else {
26a73082SReid Kleckner    FuncInfo->setBytesToPopOnReturn(0); // Callee pops nothing.
26a73082SReid Kleckner    // If this is an sret function, the return should pop the hidden pointer.
26a73082SReid Kleckner    if (!canGuaranteeTCO(CallConv) && hasCalleePopSRet(Ins, Subtarget))
26a73082SReid Kleckner      FuncInfo->setBytesToPopOnReturn(4);
26a73082SReid Kleckner  }
26a73082SReid Kleckner
26a73082SReid Kleckner  if (!Is64Bit) {
26a73082SReid Kleckner    // RegSaveFrameIndex is X86-64 only.
26a73082SReid Kleckner    FuncInfo->setRegSaveFrameIndex(0xAAAAAAA);
26a73082SReid Kleckner  }
26a73082SReid Kleckner
26a73082SReid Kleckner  FuncInfo->setArgumentStackSize(StackSize);
26a73082SReid Kleckner
26a73082SReid Kleckner  if (WinEHFuncInfo *EHInfo = MF.getWinEHFuncInfo()) {
26a73082SReid Kleckner    EHPersonality Personality = classifyEHPersonality(F.getPersonalityFn());
26a73082SReid Kleckner    if (Personality == EHPersonality::CoreCLR) {
26a73082SReid Kleckner      assert(Is64Bit);
26a73082SReid Kleckner      // TODO: Add a mechanism to frame lowering that will allow us to indicate
26a73082SReid Kleckner      // that we'd prefer this slot be allocated towards the bottom of the frame
26a73082SReid Kleckner      // (i.e. near the stack pointer after allocating the frame).  Every
26a73082SReid Kleckner      // funclet needs a copy of this slot in its (mostly empty) frame, and the
26a73082SReid Kleckner      // offset from the bottom of this and each funclet's frame must be the
26a73082SReid Kleckner      // same, so the size of funclets' (mostly empty) frames is dictated by
26a73082SReid Kleckner      // how far this slot is from the bottom (since they allocate just enough
26a73082SReid Kleckner      // space to accommodate holding this slot at the correct offset).
26a73082SReid Kleckner      int PSPSymFI = MFI.CreateStackObject(8, Align(8), /*isSpillSlot=*/false);
26a73082SReid Kleckner      EHInfo->PSPSymFrameIdx = PSPSymFI;
26a73082SReid Kleckner    }
26a73082SReid Kleckner  }
26a73082SReid Kleckner
26a73082SReid Kleckner  if (shouldDisableArgRegFromCSR(CallConv) ||
26a73082SReid Kleckner      F.hasFnAttribute("no_caller_saved_registers")) {
26a73082SReid Kleckner    MachineRegisterInfo &MRI = MF.getRegInfo();
c503758aSCraig Topper    for (std::pair<MCRegister, Register> Pair : MRI.liveins())
26a73082SReid Kleckner      MRI.disableCalleeSavedRegister(Pair.first);
26a73082SReid Kleckner  }
26a73082SReid Kleckner
c166a43cSweiguozhi  if (CallingConv::PreserveNone == CallConv)
c166a43cSweiguozhi    for (unsigned I = 0, E = Ins.size(); I != E; ++I) {
c166a43cSweiguozhi      if (Ins[I].Flags.isSwiftSelf() || Ins[I].Flags.isSwiftAsync() ||
c166a43cSweiguozhi          Ins[I].Flags.isSwiftError()) {
c166a43cSweiguozhi        errorUnsupported(DAG, dl,
c166a43cSweiguozhi                         "Swift attributes can't be used with preserve_none");
c166a43cSweiguozhi        break;
c166a43cSweiguozhi      }
c166a43cSweiguozhi    }
c166a43cSweiguozhi
26a73082SReid Kleckner  return Chain;
26a73082SReid Kleckner}
26a73082SReid Kleckner
26a73082SReid KlecknerSDValue X86TargetLowering::LowerMemOpCallTo(SDValue Chain, SDValue StackPtr,
26a73082SReid Kleckner                                            SDValue Arg, const SDLoc &dl,
26a73082SReid Kleckner                                            SelectionDAG &DAG,
26a73082SReid Kleckner                                            const CCValAssign &VA,
26a73082SReid Kleckner                                            ISD::ArgFlagsTy Flags,
26a73082SReid Kleckner                                            bool isByVal) const {
26a73082SReid Kleckner  unsigned LocMemOffset = VA.getLocMemOffset();
26a73082SReid Kleckner  SDValue PtrOff = DAG.getIntPtrConstant(LocMemOffset, dl);
26a73082SReid Kleckner  PtrOff = DAG.getNode(ISD::ADD, dl, getPointerTy(DAG.getDataLayout()),
26a73082SReid Kleckner                       StackPtr, PtrOff);
26a73082SReid Kleckner  if (isByVal)
26a73082SReid Kleckner    return CreateCopyOfByValArgument(Arg, PtrOff, Chain, Flags, DAG, dl);
26a73082SReid Kleckner
26a73082SReid Kleckner  MaybeAlign Alignment;
26a73082SReid Kleckner  if (Subtarget.isTargetWindowsMSVC() && !Subtarget.is64Bit() &&
26a73082SReid Kleckner      Arg.getSimpleValueType() != MVT::f80)
26a73082SReid Kleckner    Alignment = MaybeAlign(4);
26a73082SReid Kleckner  return DAG.getStore(
26a73082SReid Kleckner      Chain, dl, Arg, PtrOff,
26a73082SReid Kleckner      MachinePointerInfo::getStack(DAG.getMachineFunction(), LocMemOffset),
26a73082SReid Kleckner      Alignment);
26a73082SReid Kleckner}
26a73082SReid Kleckner
26a73082SReid Kleckner/// Emit a load of return address if tail call
26a73082SReid Kleckner/// optimization is performed and it is required.
26a73082SReid KlecknerSDValue X86TargetLowering::EmitTailCallLoadRetAddr(
26a73082SReid Kleckner    SelectionDAG &DAG, SDValue &OutRetAddr, SDValue Chain, bool IsTailCall,
26a73082SReid Kleckner    bool Is64Bit, int FPDiff, const SDLoc &dl) const {
26a73082SReid Kleckner  // Adjust the Return address stack slot.
26a73082SReid Kleckner  EVT VT = getPointerTy(DAG.getDataLayout());
26a73082SReid Kleckner  OutRetAddr = getReturnAddressFrameIndex(DAG);
26a73082SReid Kleckner
26a73082SReid Kleckner  // Load the "old" Return address.
26a73082SReid Kleckner  OutRetAddr = DAG.getLoad(VT, dl, Chain, OutRetAddr, MachinePointerInfo());
26a73082SReid Kleckner  return SDValue(OutRetAddr.getNode(), 1);
26a73082SReid Kleckner}
26a73082SReid Kleckner
26a73082SReid Kleckner/// Emit a store of the return address if tail call
26a73082SReid Kleckner/// optimization is performed and it is required (FPDiff!=0).
26a73082SReid Klecknerstatic SDValue EmitTailCallStoreRetAddr(SelectionDAG &DAG, MachineFunction &MF,
26a73082SReid Kleckner                                        SDValue Chain, SDValue RetAddrFrIdx,
26a73082SReid Kleckner                                        EVT PtrVT, unsigned SlotSize,
26a73082SReid Kleckner                                        int FPDiff, const SDLoc &dl) {
26a73082SReid Kleckner  // Store the return address to the appropriate stack slot.
26a73082SReid Kleckner  if (!FPDiff) return Chain;
26a73082SReid Kleckner  // Calculate the new stack slot for the return address.
26a73082SReid Kleckner  int NewReturnAddrFI =
26a73082SReid Kleckner    MF.getFrameInfo().CreateFixedObject(SlotSize, (int64_t)FPDiff - SlotSize,
26a73082SReid Kleckner                                         false);
26a73082SReid Kleckner  SDValue NewRetAddrFrIdx = DAG.getFrameIndex(NewReturnAddrFI, PtrVT);
26a73082SReid Kleckner  Chain = DAG.getStore(Chain, dl, RetAddrFrIdx, NewRetAddrFrIdx,
26a73082SReid Kleckner                       MachinePointerInfo::getFixedStack(
26a73082SReid Kleckner                           DAG.getMachineFunction(), NewReturnAddrFI));
26a73082SReid Kleckner  return Chain;
26a73082SReid Kleckner}
26a73082SReid Kleckner
26a73082SReid Kleckner/// Returns a vector_shuffle mask for an movs{s|d}, movd
26a73082SReid Kleckner/// operation of specified width.
26a73082SReid KlecknerSDValue X86TargetLowering::getMOVL(SelectionDAG &DAG, const SDLoc &dl, MVT VT,
26a73082SReid Kleckner                                   SDValue V1, SDValue V2) const {
26a73082SReid Kleckner  unsigned NumElems = VT.getVectorNumElements();
26a73082SReid Kleckner  SmallVector<int, 8> Mask;
26a73082SReid Kleckner  Mask.push_back(NumElems);
26a73082SReid Kleckner  for (unsigned i = 1; i != NumElems; ++i)
26a73082SReid Kleckner    Mask.push_back(i);
26a73082SReid Kleckner  return DAG.getVectorShuffle(VT, dl, V1, V2, Mask);
26a73082SReid Kleckner}
26a73082SReid Kleckner
26a73082SReid KlecknerSDValue
26a73082SReid KlecknerX86TargetLowering::LowerCall(TargetLowering::CallLoweringInfo &CLI,
26a73082SReid Kleckner                             SmallVectorImpl<SDValue> &InVals) const {
26a73082SReid Kleckner  SelectionDAG &DAG                     = CLI.DAG;
26a73082SReid Kleckner  SDLoc &dl                             = CLI.DL;
26a73082SReid Kleckner  SmallVectorImpl<ISD::OutputArg> &Outs = CLI.Outs;
26a73082SReid Kleckner  SmallVectorImpl<SDValue> &OutVals     = CLI.OutVals;
26a73082SReid Kleckner  SmallVectorImpl<ISD::InputArg> &Ins   = CLI.Ins;
26a73082SReid Kleckner  SDValue Chain                         = CLI.Chain;
26a73082SReid Kleckner  SDValue Callee                        = CLI.Callee;
26a73082SReid Kleckner  CallingConv::ID CallConv              = CLI.CallConv;
26a73082SReid Kleckner  bool &isTailCall                      = CLI.IsTailCall;
26a73082SReid Kleckner  bool isVarArg                         = CLI.IsVarArg;
26a73082SReid Kleckner  const auto *CB                        = CLI.CB;
26a73082SReid Kleckner
26a73082SReid Kleckner  MachineFunction &MF = DAG.getMachineFunction();
26a73082SReid Kleckner  bool Is64Bit        = Subtarget.is64Bit();
26a73082SReid Kleckner  bool IsWin64        = Subtarget.isCallingConvWin64(CallConv);
26a73082SReid Kleckner  bool IsSibcall      = false;
26a73082SReid Kleckner  bool IsGuaranteeTCO = MF.getTarget().Options.GuaranteedTailCallOpt ||
26a73082SReid Kleckner      CallConv == CallingConv::Tail || CallConv == CallingConv::SwiftTail;
26a73082SReid Kleckner  bool IsCalleePopSRet = !IsGuaranteeTCO && hasCalleePopSRet(Outs, Subtarget);
26a73082SReid Kleckner  X86MachineFunctionInfo *X86Info = MF.getInfo<X86MachineFunctionInfo>();
26a73082SReid Kleckner  bool HasNCSR = (CB && isa<CallInst>(CB) &&
26a73082SReid Kleckner                  CB->hasFnAttr("no_caller_saved_registers"));
26a73082SReid Kleckner  bool HasNoCfCheck = (CB && CB->doesNoCfCheck());
26a73082SReid Kleckner  bool IsIndirectCall = (CB && isa<CallInst>(CB) && CB->isIndirectCall());
26a73082SReid Kleckner  bool IsCFICall = IsIndirectCall && CLI.CFIType;
0f0cfcffSMatt Arsenault  const Module *M = MF.getFunction().getParent();
26a73082SReid Kleckner  Metadata *IsCFProtectionSupported = M->getModuleFlag("cf-protection-branch");
26a73082SReid Kleckner
26a73082SReid Kleckner  MachineFunction::CallSiteInfo CSInfo;
26a73082SReid Kleckner  if (CallConv == CallingConv::X86_INTR)
26a73082SReid Kleckner    report_fatal_error("X86 interrupts may not be called directly");
26a73082SReid Kleckner
385faf9cSReid Kleckner  // Analyze operands of the call, assigning locations to each operand.
385faf9cSReid Kleckner  SmallVector<CCValAssign, 16> ArgLocs;
385faf9cSReid Kleckner  CCState CCInfo(CallConv, isVarArg, MF, ArgLocs, *DAG.getContext());
385faf9cSReid Kleckner
385faf9cSReid Kleckner  // Allocate shadow area for Win64.
385faf9cSReid Kleckner  if (IsWin64)
385faf9cSReid Kleckner    CCInfo.AllocateStack(32, Align(8));
385faf9cSReid Kleckner
385faf9cSReid Kleckner  CCInfo.AnalyzeArguments(Outs, CC_X86);
385faf9cSReid Kleckner
385faf9cSReid Kleckner  // In vectorcall calling convention a second pass is required for the HVA
385faf9cSReid Kleckner  // types.
385faf9cSReid Kleckner  if (CallingConv::X86_VectorCall == CallConv) {
385faf9cSReid Kleckner    CCInfo.AnalyzeArgumentsSecondPass(Outs, CC_X86);
385faf9cSReid Kleckner  }
385faf9cSReid Kleckner
26a73082SReid Kleckner  bool IsMustTail = CLI.CB && CLI.CB->isMustTailCall();
26a73082SReid Kleckner  if (Subtarget.isPICStyleGOT() && !IsGuaranteeTCO && !IsMustTail) {
26a73082SReid Kleckner    // If we are using a GOT, disable tail calls to external symbols with
26a73082SReid Kleckner    // default visibility. Tail calling such a symbol requires using a GOT
26a73082SReid Kleckner    // relocation, which forces early binding of the symbol. This breaks code
26a73082SReid Kleckner    // that require lazy function symbol resolution. Using musttail or
26a73082SReid Kleckner    // GuaranteedTailCallOpt will override this.
26a73082SReid Kleckner    GlobalAddressSDNode *G = dyn_cast<GlobalAddressSDNode>(Callee);
26a73082SReid Kleckner    if (!G || (!G->getGlobal()->hasLocalLinkage() &&
26a73082SReid Kleckner               G->getGlobal()->hasDefaultVisibility()))
26a73082SReid Kleckner      isTailCall = false;
26a73082SReid Kleckner  }
26a73082SReid Kleckner
26a73082SReid Kleckner  if (isTailCall && !IsMustTail) {
26a73082SReid Kleckner    // Check if it's really possible to do a tail call.
385faf9cSReid Kleckner    isTailCall = IsEligibleForTailCallOptimization(CLI, CCInfo, ArgLocs,
385faf9cSReid Kleckner                                                   IsCalleePopSRet);
26a73082SReid Kleckner
26a73082SReid Kleckner    // Sibcalls are automatically detected tailcalls which do not require
26a73082SReid Kleckner    // ABI changes.
26a73082SReid Kleckner    if (!IsGuaranteeTCO && isTailCall)
26a73082SReid Kleckner      IsSibcall = true;
26a73082SReid Kleckner
26a73082SReid Kleckner    if (isTailCall)
26a73082SReid Kleckner      ++NumTailCalls;
26a73082SReid Kleckner  }
26a73082SReid Kleckner
26a73082SReid Kleckner  if (IsMustTail && !isTailCall)
26a73082SReid Kleckner    report_fatal_error("failed to perform tail call elimination on a call "
26a73082SReid Kleckner                       "site marked musttail");
26a73082SReid Kleckner
26a73082SReid Kleckner  assert(!(isVarArg && canGuaranteeTCO(CallConv)) &&
26a73082SReid Kleckner         "Var args not supported with calling convention fastcc, ghc or hipe");
26a73082SReid Kleckner
26a73082SReid Kleckner  // Get a count of how many bytes are to be pushed on the stack.
26a73082SReid Kleckner  unsigned NumBytes = CCInfo.getAlignedCallFrameSize();
26a73082SReid Kleckner  if (IsSibcall)
26a73082SReid Kleckner    // This is a sibcall. The memory operands are available in caller's
26a73082SReid Kleckner    // own caller's stack.
26a73082SReid Kleckner    NumBytes = 0;
26a73082SReid Kleckner  else if (IsGuaranteeTCO && canGuaranteeTCO(CallConv))
26a73082SReid Kleckner    NumBytes = GetAlignedArgumentStackSize(NumBytes, DAG);
26a73082SReid Kleckner
26a73082SReid Kleckner  int FPDiff = 0;
26a73082SReid Kleckner  if (isTailCall &&
26a73082SReid Kleckner      shouldGuaranteeTCO(CallConv,
26a73082SReid Kleckner                         MF.getTarget().Options.GuaranteedTailCallOpt)) {
26a73082SReid Kleckner    // Lower arguments at fp - stackoffset + fpdiff.
26a73082SReid Kleckner    unsigned NumBytesCallerPushed = X86Info->getBytesToPopOnReturn();
26a73082SReid Kleckner
26a73082SReid Kleckner    FPDiff = NumBytesCallerPushed - NumBytes;
26a73082SReid Kleckner
26a73082SReid Kleckner    // Set the delta of movement of the returnaddr stackslot.
26a73082SReid Kleckner    // But only set if delta is greater than previous delta.
26a73082SReid Kleckner    if (FPDiff < X86Info->getTCReturnAddrDelta())
26a73082SReid Kleckner      X86Info->setTCReturnAddrDelta(FPDiff);
26a73082SReid Kleckner  }
26a73082SReid Kleckner
26a73082SReid Kleckner  unsigned NumBytesToPush = NumBytes;
26a73082SReid Kleckner  unsigned NumBytesToPop = NumBytes;
26a73082SReid Kleckner
26a73082SReid Kleckner  // If we have an inalloca argument, all stack space has already been allocated
26a73082SReid Kleckner  // for us and be right at the top of the stack.  We don't support multiple
26a73082SReid Kleckner  // arguments passed in memory when using inalloca.
26a73082SReid Kleckner  if (!Outs.empty() && Outs.back().Flags.isInAlloca()) {
26a73082SReid Kleckner    NumBytesToPush = 0;
26a73082SReid Kleckner    if (!ArgLocs.back().isMemLoc())
26a73082SReid Kleckner      report_fatal_error("cannot use inalloca attribute on a register "
26a73082SReid Kleckner                         "parameter");
26a73082SReid Kleckner    if (ArgLocs.back().getLocMemOffset() != 0)
26a73082SReid Kleckner      report_fatal_error("any parameter with the inalloca attribute must be "
26a73082SReid Kleckner                         "the only memory argument");
26a73082SReid Kleckner  } else if (CLI.IsPreallocated) {
26a73082SReid Kleckner    assert(ArgLocs.back().isMemLoc() &&
26a73082SReid Kleckner           "cannot use preallocated attribute on a register "
26a73082SReid Kleckner           "parameter");
26a73082SReid Kleckner    SmallVector<size_t, 4> PreallocatedOffsets;
26a73082SReid Kleckner    for (size_t i = 0; i < CLI.OutVals.size(); ++i) {
26a73082SReid Kleckner      if (CLI.CB->paramHasAttr(i, Attribute::Preallocated)) {
26a73082SReid Kleckner        PreallocatedOffsets.push_back(ArgLocs[i].getLocMemOffset());
26a73082SReid Kleckner      }
26a73082SReid Kleckner    }
26a73082SReid Kleckner    auto *MFI = DAG.getMachineFunction().getInfo<X86MachineFunctionInfo>();
26a73082SReid Kleckner    size_t PreallocatedId = MFI->getPreallocatedIdForCallSite(CLI.CB);
26a73082SReid Kleckner    MFI->setPreallocatedStackSize(PreallocatedId, NumBytes);
26a73082SReid Kleckner    MFI->setPreallocatedArgOffsets(PreallocatedId, PreallocatedOffsets);
26a73082SReid Kleckner    NumBytesToPush = 0;
26a73082SReid Kleckner  }
26a73082SReid Kleckner
26a73082SReid Kleckner  if (!IsSibcall && !IsMustTail)
26a73082SReid Kleckner    Chain = DAG.getCALLSEQ_START(Chain, NumBytesToPush,
26a73082SReid Kleckner                                 NumBytes - NumBytesToPush, dl);
26a73082SReid Kleckner
26a73082SReid Kleckner  SDValue RetAddrFrIdx;
26a73082SReid Kleckner  // Load return address for tail calls.
26a73082SReid Kleckner  if (isTailCall && FPDiff)
26a73082SReid Kleckner    Chain = EmitTailCallLoadRetAddr(DAG, RetAddrFrIdx, Chain, isTailCall,
26a73082SReid Kleckner                                    Is64Bit, FPDiff, dl);
26a73082SReid Kleckner
26a73082SReid Kleckner  SmallVector<std::pair<Register, SDValue>, 8> RegsToPass;
26a73082SReid Kleckner  SmallVector<SDValue, 8> MemOpChains;
26a73082SReid Kleckner  SDValue StackPtr;
26a73082SReid Kleckner
26a73082SReid Kleckner  // The next loop assumes that the locations are in the same order of the
26a73082SReid Kleckner  // input arguments.
26a73082SReid Kleckner  assert(isSortedByValueNo(ArgLocs) &&
26a73082SReid Kleckner         "Argument Location list must be sorted before lowering");
26a73082SReid Kleckner
26a73082SReid Kleckner  // Walk the register/memloc assignments, inserting copies/loads.  In the case
26a73082SReid Kleckner  // of tail call optimization arguments are handle later.
26a73082SReid Kleckner  const X86RegisterInfo *RegInfo = Subtarget.getRegisterInfo();
26a73082SReid Kleckner  for (unsigned I = 0, OutIndex = 0, E = ArgLocs.size(); I != E;
26a73082SReid Kleckner       ++I, ++OutIndex) {
26a73082SReid Kleckner    assert(OutIndex < Outs.size() && "Invalid Out index");
26a73082SReid Kleckner    // Skip inalloca/preallocated arguments, they have already been written.
26a73082SReid Kleckner    ISD::ArgFlagsTy Flags = Outs[OutIndex].Flags;
26a73082SReid Kleckner    if (Flags.isInAlloca() || Flags.isPreallocated())
26a73082SReid Kleckner      continue;
26a73082SReid Kleckner
26a73082SReid Kleckner    CCValAssign &VA = ArgLocs[I];
26a73082SReid Kleckner    EVT RegVT = VA.getLocVT();
26a73082SReid Kleckner    SDValue Arg = OutVals[OutIndex];
26a73082SReid Kleckner    bool isByVal = Flags.isByVal();
26a73082SReid Kleckner
26a73082SReid Kleckner    // Promote the value if needed.
26a73082SReid Kleckner    switch (VA.getLocInfo()) {
26a73082SReid Kleckner    default: llvm_unreachable("Unknown loc info!");
26a73082SReid Kleckner    case CCValAssign::Full: break;
26a73082SReid Kleckner    case CCValAssign::SExt:
26a73082SReid Kleckner      Arg = DAG.getNode(ISD::SIGN_EXTEND, dl, RegVT, Arg);
26a73082SReid Kleckner      break;
26a73082SReid Kleckner    case CCValAssign::ZExt:
26a73082SReid Kleckner      Arg = DAG.getNode(ISD::ZERO_EXTEND, dl, RegVT, Arg);
26a73082SReid Kleckner      break;
26a73082SReid Kleckner    case CCValAssign::AExt:
26a73082SReid Kleckner      if (Arg.getValueType().isVector() &&
26a73082SReid Kleckner          Arg.getValueType().getVectorElementType() == MVT::i1)
26a73082SReid Kleckner        Arg = lowerMasksToReg(Arg, RegVT, dl, DAG);
26a73082SReid Kleckner      else if (RegVT.is128BitVector()) {
26a73082SReid Kleckner        // Special case: passing MMX values in XMM registers.
26a73082SReid Kleckner        Arg = DAG.getBitcast(MVT::i64, Arg);
26a73082SReid Kleckner        Arg = DAG.getNode(ISD::SCALAR_TO_VECTOR, dl, MVT::v2i64, Arg);
26a73082SReid Kleckner        Arg = getMOVL(DAG, dl, MVT::v2i64, DAG.getUNDEF(MVT::v2i64), Arg);
26a73082SReid Kleckner      } else
26a73082SReid Kleckner        Arg = DAG.getNode(ISD::ANY_EXTEND, dl, RegVT, Arg);
26a73082SReid Kleckner      break;
26a73082SReid Kleckner    case CCValAssign::BCvt:
26a73082SReid Kleckner      Arg = DAG.getBitcast(RegVT, Arg);
26a73082SReid Kleckner      break;
26a73082SReid Kleckner    case CCValAssign::Indirect: {
26a73082SReid Kleckner      if (isByVal) {
26a73082SReid Kleckner        // Memcpy the argument to a temporary stack slot to prevent
26a73082SReid Kleckner        // the caller from seeing any modifications the callee may make
26a73082SReid Kleckner        // as guaranteed by the `byval` attribute.
26a73082SReid Kleckner        int FrameIdx = MF.getFrameInfo().CreateStackObject(
26a73082SReid Kleckner            Flags.getByValSize(),
26a73082SReid Kleckner            std::max(Align(16), Flags.getNonZeroByValAlign()), false);
26a73082SReid Kleckner        SDValue StackSlot =
26a73082SReid Kleckner            DAG.getFrameIndex(FrameIdx, getPointerTy(DAG.getDataLayout()));
26a73082SReid Kleckner        Chain =
26a73082SReid Kleckner            CreateCopyOfByValArgument(Arg, StackSlot, Chain, Flags, DAG, dl);
26a73082SReid Kleckner        // From now on treat this as a regular pointer
26a73082SReid Kleckner        Arg = StackSlot;
26a73082SReid Kleckner        isByVal = false;
26a73082SReid Kleckner      } else {
26a73082SReid Kleckner        // Store the argument.
26a73082SReid Kleckner        SDValue SpillSlot = DAG.CreateStackTemporary(VA.getValVT());
26a73082SReid Kleckner        int FI = cast<FrameIndexSDNode>(SpillSlot)->getIndex();
26a73082SReid Kleckner        Chain = DAG.getStore(
26a73082SReid Kleckner            Chain, dl, Arg, SpillSlot,
26a73082SReid Kleckner            MachinePointerInfo::getFixedStack(DAG.getMachineFunction(), FI));
26a73082SReid Kleckner        Arg = SpillSlot;
26a73082SReid Kleckner      }
26a73082SReid Kleckner      break;
26a73082SReid Kleckner    }
26a73082SReid Kleckner    }
26a73082SReid Kleckner
26a73082SReid Kleckner    if (VA.needsCustom()) {
26a73082SReid Kleckner      assert(VA.getValVT() == MVT::v64i1 &&
26a73082SReid Kleckner             "Currently the only custom case is when we split v64i1 to 2 regs");
26a73082SReid Kleckner      // Split v64i1 value into two registers
26a73082SReid Kleckner      Passv64i1ArgInRegs(dl, DAG, Arg, RegsToPass, VA, ArgLocs[++I], Subtarget);
26a73082SReid Kleckner    } else if (VA.isRegLoc()) {
26a73082SReid Kleckner      RegsToPass.push_back(std::make_pair(VA.getLocReg(), Arg));
26a73082SReid Kleckner      const TargetOptions &Options = DAG.getTarget().Options;
26a73082SReid Kleckner      if (Options.EmitCallSiteInfo)
212b1a84SPrabhuk        CSInfo.ArgRegPairs.emplace_back(VA.getLocReg(), I);
26a73082SReid Kleckner      if (isVarArg && IsWin64) {
26a73082SReid Kleckner        // Win64 ABI requires argument XMM reg to be copied to the corresponding
26a73082SReid Kleckner        // shadow reg if callee is a varargs function.
26a73082SReid Kleckner        Register ShadowReg;
26a73082SReid Kleckner        switch (VA.getLocReg()) {
26a73082SReid Kleckner        case X86::XMM0: ShadowReg = X86::RCX; break;
26a73082SReid Kleckner        case X86::XMM1: ShadowReg = X86::RDX; break;
26a73082SReid Kleckner        case X86::XMM2: ShadowReg = X86::R8; break;
26a73082SReid Kleckner        case X86::XMM3: ShadowReg = X86::R9; break;
26a73082SReid Kleckner        }
26a73082SReid Kleckner        if (ShadowReg)
26a73082SReid Kleckner          RegsToPass.push_back(std::make_pair(ShadowReg, Arg));
26a73082SReid Kleckner      }
26a73082SReid Kleckner    } else if (!IsSibcall && (!isTailCall || isByVal)) {
26a73082SReid Kleckner      assert(VA.isMemLoc());
26a73082SReid Kleckner      if (!StackPtr.getNode())
26a73082SReid Kleckner        StackPtr = DAG.getCopyFromReg(Chain, dl, RegInfo->getStackRegister(),
26a73082SReid Kleckner                                      getPointerTy(DAG.getDataLayout()));
26a73082SReid Kleckner      MemOpChains.push_back(LowerMemOpCallTo(Chain, StackPtr, Arg,
26a73082SReid Kleckner                                             dl, DAG, VA, Flags, isByVal));
26a73082SReid Kleckner    }
26a73082SReid Kleckner  }
26a73082SReid Kleckner
26a73082SReid Kleckner  if (!MemOpChains.empty())
26a73082SReid Kleckner    Chain = DAG.getNode(ISD::TokenFactor, dl, MVT::Other, MemOpChains);
26a73082SReid Kleckner
26a73082SReid Kleckner  if (Subtarget.isPICStyleGOT()) {
26a73082SReid Kleckner    // ELF / PIC requires GOT in the EBX register before function calls via PLT
26a73082SReid Kleckner    // GOT pointer (except regcall).
26a73082SReid Kleckner    if (!isTailCall) {
26a73082SReid Kleckner      // Indirect call with RegCall calling convertion may use up all the
26a73082SReid Kleckner      // general registers, so it is not suitable to bind EBX reister for
26a73082SReid Kleckner      // GOT address, just let register allocator handle it.
26a73082SReid Kleckner      if (CallConv != CallingConv::X86_RegCall)
26a73082SReid Kleckner        RegsToPass.push_back(std::make_pair(
26a73082SReid Kleckner          Register(X86::EBX), DAG.getNode(X86ISD::GlobalBaseReg, SDLoc(),
26a73082SReid Kleckner                                          getPointerTy(DAG.getDataLayout()))));
26a73082SReid Kleckner    } else {
26a73082SReid Kleckner      // If we are tail calling and generating PIC/GOT style code load the
26a73082SReid Kleckner      // address of the callee into ECX. The value in ecx is used as target of
26a73082SReid Kleckner      // the tail jump. This is done to circumvent the ebx/callee-saved problem
26a73082SReid Kleckner      // for tail calls on PIC/GOT architectures. Normally we would just put the
26a73082SReid Kleckner      // address of GOT into ebx and then call target@PLT. But for tail calls
26a73082SReid Kleckner      // ebx would be restored (since ebx is callee saved) before jumping to the
26a73082SReid Kleckner      // target@PLT.
26a73082SReid Kleckner
26a73082SReid Kleckner      // Note: The actual moving to ECX is done further down.
26a73082SReid Kleckner      GlobalAddressSDNode *G = dyn_cast<GlobalAddressSDNode>(Callee);
26a73082SReid Kleckner      if (G && !G->getGlobal()->hasLocalLinkage() &&
26a73082SReid Kleckner          G->getGlobal()->hasDefaultVisibility())
26a73082SReid Kleckner        Callee = LowerGlobalAddress(Callee, DAG);
26a73082SReid Kleckner      else if (isa<ExternalSymbolSDNode>(Callee))
26a73082SReid Kleckner        Callee = LowerExternalSymbol(Callee, DAG);
26a73082SReid Kleckner    }
26a73082SReid Kleckner  }
26a73082SReid Kleckner
26a73082SReid Kleckner  if (Is64Bit && isVarArg && !IsWin64 && !IsMustTail &&
26a73082SReid Kleckner      (Subtarget.hasSSE1() || !M->getModuleFlag("SkipRaxSetup"))) {
26a73082SReid Kleckner    // From AMD64 ABI document:
26a73082SReid Kleckner    // For calls that may call functions that use varargs or stdargs
26a73082SReid Kleckner    // (prototype-less calls or calls to functions containing ellipsis (...) in
26a73082SReid Kleckner    // the declaration) %al is used as hidden argument to specify the number
26a73082SReid Kleckner    // of SSE registers used. The contents of %al do not need to match exactly
26a73082SReid Kleckner    // the number of registers, but must be an ubound on the number of SSE
26a73082SReid Kleckner    // registers used and is in the range 0 - 8 inclusive.
26a73082SReid Kleckner
26a73082SReid Kleckner    // Count the number of XMM registers allocated.
26a73082SReid Kleckner    static const MCPhysReg XMMArgRegs[] = {
26a73082SReid Kleckner      X86::XMM0, X86::XMM1, X86::XMM2, X86::XMM3,
26a73082SReid Kleckner      X86::XMM4, X86::XMM5, X86::XMM6, X86::XMM7
26a73082SReid Kleckner    };
26a73082SReid Kleckner    unsigned NumXMMRegs = CCInfo.getFirstUnallocated(XMMArgRegs);
26a73082SReid Kleckner    assert((Subtarget.hasSSE1() || !NumXMMRegs)
26a73082SReid Kleckner           && "SSE registers cannot be used when SSE is disabled");
26a73082SReid Kleckner    RegsToPass.push_back(std::make_pair(Register(X86::AL),
26a73082SReid Kleckner                                        DAG.getConstant(NumXMMRegs, dl,
26a73082SReid Kleckner                                                        MVT::i8)));
26a73082SReid Kleckner  }
26a73082SReid Kleckner
26a73082SReid Kleckner  if (isVarArg && IsMustTail) {
26a73082SReid Kleckner    const auto &Forwards = X86Info->getForwardedMustTailRegParms();
26a73082SReid Kleckner    for (const auto &F : Forwards) {
26a73082SReid Kleckner      SDValue Val = DAG.getCopyFromReg(Chain, dl, F.VReg, F.VT);
26a73082SReid Kleckner      RegsToPass.push_back(std::make_pair(F.PReg, Val));
26a73082SReid Kleckner    }
26a73082SReid Kleckner  }
26a73082SReid Kleckner
26a73082SReid Kleckner  // For tail calls lower the arguments to the 'real' stack slots.  Sibcalls
26a73082SReid Kleckner  // don't need this because the eligibility check rejects calls that require
26a73082SReid Kleckner  // shuffling arguments passed in memory.
26a73082SReid Kleckner  if (!IsSibcall && isTailCall) {
26a73082SReid Kleckner    // Force all the incoming stack arguments to be loaded from the stack
26a73082SReid Kleckner    // before any new outgoing arguments are stored to the stack, because the
26a73082SReid Kleckner    // outgoing stack slots may alias the incoming argument stack slots, and
26a73082SReid Kleckner    // the alias isn't otherwise explicit. This is slightly more conservative
26a73082SReid Kleckner    // than necessary, because it means that each store effectively depends
26a73082SReid Kleckner    // on every argument instead of just those arguments it would clobber.
26a73082SReid Kleckner    SDValue ArgChain = DAG.getStackArgumentTokenFactor(Chain);
26a73082SReid Kleckner
26a73082SReid Kleckner    SmallVector<SDValue, 8> MemOpChains2;
26a73082SReid Kleckner    SDValue FIN;
26a73082SReid Kleckner    int FI = 0;
26a73082SReid Kleckner    for (unsigned I = 0, OutsIndex = 0, E = ArgLocs.size(); I != E;
26a73082SReid Kleckner         ++I, ++OutsIndex) {
26a73082SReid Kleckner      CCValAssign &VA = ArgLocs[I];
26a73082SReid Kleckner
26a73082SReid Kleckner      if (VA.isRegLoc()) {
26a73082SReid Kleckner        if (VA.needsCustom()) {
26a73082SReid Kleckner          assert((CallConv == CallingConv::X86_RegCall) &&
26a73082SReid Kleckner                 "Expecting custom case only in regcall calling convention");
26a73082SReid Kleckner          // This means that we are in special case where one argument was
26a73082SReid Kleckner          // passed through two register locations - Skip the next location
26a73082SReid Kleckner          ++I;
26a73082SReid Kleckner        }
26a73082SReid Kleckner
26a73082SReid Kleckner        continue;
26a73082SReid Kleckner      }
26a73082SReid Kleckner
26a73082SReid Kleckner      assert(VA.isMemLoc());
26a73082SReid Kleckner      SDValue Arg = OutVals[OutsIndex];
26a73082SReid Kleckner      ISD::ArgFlagsTy Flags = Outs[OutsIndex].Flags;
26a73082SReid Kleckner      // Skip inalloca/preallocated arguments.  They don't require any work.
26a73082SReid Kleckner      if (Flags.isInAlloca() || Flags.isPreallocated())
26a73082SReid Kleckner        continue;
26a73082SReid Kleckner      // Create frame index.
26a73082SReid Kleckner      int32_t Offset = VA.getLocMemOffset()+FPDiff;
26a73082SReid Kleckner      uint32_t OpSize = (VA.getLocVT().getSizeInBits()+7)/8;
26a73082SReid Kleckner      FI = MF.getFrameInfo().CreateFixedObject(OpSize, Offset, true);
26a73082SReid Kleckner      FIN = DAG.getFrameIndex(FI, getPointerTy(DAG.getDataLayout()));
26a73082SReid Kleckner
26a73082SReid Kleckner      if (Flags.isByVal()) {
26a73082SReid Kleckner        // Copy relative to framepointer.
26a73082SReid Kleckner        SDValue Source = DAG.getIntPtrConstant(VA.getLocMemOffset(), dl);
26a73082SReid Kleckner        if (!StackPtr.getNode())
26a73082SReid Kleckner          StackPtr = DAG.getCopyFromReg(Chain, dl, RegInfo->getStackRegister(),
26a73082SReid Kleckner                                        getPointerTy(DAG.getDataLayout()));
26a73082SReid Kleckner        Source = DAG.getNode(ISD::ADD, dl, getPointerTy(DAG.getDataLayout()),
26a73082SReid Kleckner                             StackPtr, Source);
26a73082SReid Kleckner
26a73082SReid Kleckner        MemOpChains2.push_back(CreateCopyOfByValArgument(Source, FIN,
26a73082SReid Kleckner                                                         ArgChain,
26a73082SReid Kleckner                                                         Flags, DAG, dl));
26a73082SReid Kleckner      } else {
26a73082SReid Kleckner        // Store relative to framepointer.
26a73082SReid Kleckner        MemOpChains2.push_back(DAG.getStore(
26a73082SReid Kleckner            ArgChain, dl, Arg, FIN,
26a73082SReid Kleckner            MachinePointerInfo::getFixedStack(DAG.getMachineFunction(), FI)));
26a73082SReid Kleckner      }
26a73082SReid Kleckner    }
26a73082SReid Kleckner
26a73082SReid Kleckner    if (!MemOpChains2.empty())
26a73082SReid Kleckner      Chain = DAG.getNode(ISD::TokenFactor, dl, MVT::Other, MemOpChains2);
26a73082SReid Kleckner
26a73082SReid Kleckner    // Store the return address to the appropriate stack slot.
26a73082SReid Kleckner    Chain = EmitTailCallStoreRetAddr(DAG, MF, Chain, RetAddrFrIdx,
26a73082SReid Kleckner                                     getPointerTy(DAG.getDataLayout()),
26a73082SReid Kleckner                                     RegInfo->getSlotSize(), FPDiff, dl);
26a73082SReid Kleckner  }
26a73082SReid Kleckner
26a73082SReid Kleckner  // Build a sequence of copy-to-reg nodes chained together with token chain
26a73082SReid Kleckner  // and glue operands which copy the outgoing args into registers.
26a73082SReid Kleckner  SDValue InGlue;
26a73082SReid Kleckner  for (unsigned i = 0, e = RegsToPass.size(); i != e; ++i) {
26a73082SReid Kleckner    Chain = DAG.getCopyToReg(Chain, dl, RegsToPass[i].first,
26a73082SReid Kleckner                             RegsToPass[i].second, InGlue);
26a73082SReid Kleckner    InGlue = Chain.getValue(1);
26a73082SReid Kleckner  }
26a73082SReid Kleckner
26a73082SReid Kleckner  if (DAG.getTarget().getCodeModel() == CodeModel::Large) {
26a73082SReid Kleckner    assert(Is64Bit && "Large code model is only legal in 64-bit mode.");
26a73082SReid Kleckner    // In the 64-bit large code model, we have to make all calls
26a73082SReid Kleckner    // through a register, since the call instruction's 32-bit
26a73082SReid Kleckner    // pc-relative offset may not be large enough to hold the whole
26a73082SReid Kleckner    // address.
26a73082SReid Kleckner  } else if (Callee->getOpcode() == ISD::GlobalAddress ||
26a73082SReid Kleckner             Callee->getOpcode() == ISD::ExternalSymbol) {
26a73082SReid Kleckner    // Lower direct calls to global addresses and external symbols. Setting
26a73082SReid Kleckner    // ForCall to true here has the effect of removing WrapperRIP when possible
26a73082SReid Kleckner    // to allow direct calls to be selected without first materializing the
26a73082SReid Kleckner    // address into a register.
26a73082SReid Kleckner    Callee = LowerGlobalOrExternal(Callee, DAG, /*ForCall=*/true);
26a73082SReid Kleckner  } else if (Subtarget.isTarget64BitILP32() &&
26a73082SReid Kleckner             Callee.getValueType() == MVT::i32) {
26a73082SReid Kleckner    // Zero-extend the 32-bit Callee address into a 64-bit according to x32 ABI
26a73082SReid Kleckner    Callee = DAG.getNode(ISD::ZERO_EXTEND, dl, MVT::i64, Callee);
26a73082SReid Kleckner  }
26a73082SReid Kleckner
26a73082SReid Kleckner  SmallVector<SDValue, 8> Ops;
26a73082SReid Kleckner
26a73082SReid Kleckner  if (!IsSibcall && isTailCall && !IsMustTail) {
26a73082SReid Kleckner    Chain = DAG.getCALLSEQ_END(Chain, NumBytesToPop, 0, InGlue, dl);
26a73082SReid Kleckner    InGlue = Chain.getValue(1);
26a73082SReid Kleckner  }
26a73082SReid Kleckner
26a73082SReid Kleckner  Ops.push_back(Chain);
26a73082SReid Kleckner  Ops.push_back(Callee);
26a73082SReid Kleckner
26a73082SReid Kleckner  if (isTailCall)
ce0cc8e9SCraig Topper    Ops.push_back(DAG.getSignedTargetConstant(FPDiff, dl, MVT::i32));
26a73082SReid Kleckner
26a73082SReid Kleckner  // Add argument registers to the end of the list so that they are known live
26a73082SReid Kleckner  // into the call.
26a73082SReid Kleckner  for (unsigned i = 0, e = RegsToPass.size(); i != e; ++i)
26a73082SReid Kleckner    Ops.push_back(DAG.getRegister(RegsToPass[i].first,
26a73082SReid Kleckner                                  RegsToPass[i].second.getValueType()));
26a73082SReid Kleckner
26a73082SReid Kleckner  // Add a register mask operand representing the call-preserved registers.
26a73082SReid Kleckner  const uint32_t *Mask = [&]() {
26a73082SReid Kleckner    auto AdaptedCC = CallConv;
26a73082SReid Kleckner    // If HasNCSR is asserted (attribute NoCallerSavedRegisters exists),
26a73082SReid Kleckner    // use X86_INTR calling convention because it has the same CSR mask
26a73082SReid Kleckner    // (same preserved registers).
26a73082SReid Kleckner    if (HasNCSR)
26a73082SReid Kleckner      AdaptedCC = (CallingConv::ID)CallingConv::X86_INTR;
26a73082SReid Kleckner    // If NoCalleeSavedRegisters is requested, than use GHC since it happens
26a73082SReid Kleckner    // to use the CSR_NoRegs_RegMask.
26a73082SReid Kleckner    if (CB && CB->hasFnAttr("no_callee_saved_registers"))
26a73082SReid Kleckner      AdaptedCC = (CallingConv::ID)CallingConv::GHC;
26a73082SReid Kleckner    return RegInfo->getCallPreservedMask(MF, AdaptedCC);
26a73082SReid Kleckner  }();
26a73082SReid Kleckner  assert(Mask && "Missing call preserved mask for calling convention");
26a73082SReid Kleckner
2c12c1e7Sweiguozhi  if (MachineOperand::clobbersPhysReg(Mask, RegInfo->getFramePtr())) {
7e5fe697Sweiguozhi    X86Info->setFPClobberedByCall(true);
2c12c1e7Sweiguozhi    if (CLI.CB && isa<InvokeInst>(CLI.CB))
2c12c1e7Sweiguozhi      X86Info->setFPClobberedByInvoke(true);
2c12c1e7Sweiguozhi  }
2c12c1e7Sweiguozhi  if (MachineOperand::clobbersPhysReg(Mask, RegInfo->getBaseRegister())) {
7e5fe697Sweiguozhi    X86Info->setBPClobberedByCall(true);
2c12c1e7Sweiguozhi    if (CLI.CB && isa<InvokeInst>(CLI.CB))
2c12c1e7Sweiguozhi      X86Info->setBPClobberedByInvoke(true);
2c12c1e7Sweiguozhi  }
7e5fe697Sweiguozhi
26a73082SReid Kleckner  // If this is an invoke in a 32-bit function using a funclet-based
26a73082SReid Kleckner  // personality, assume the function clobbers all registers. If an exception
26a73082SReid Kleckner  // is thrown, the runtime will not restore CSRs.
26a73082SReid Kleckner  // FIXME: Model this more precisely so that we can register allocate across
26a73082SReid Kleckner  // the normal edge and spill and fill across the exceptional edge.
26a73082SReid Kleckner  if (!Is64Bit && CLI.CB && isa<InvokeInst>(CLI.CB)) {
26a73082SReid Kleckner    const Function &CallerFn = MF.getFunction();
26a73082SReid Kleckner    EHPersonality Pers =
26a73082SReid Kleckner        CallerFn.hasPersonalityFn()
26a73082SReid Kleckner            ? classifyEHPersonality(CallerFn.getPersonalityFn())
26a73082SReid Kleckner            : EHPersonality::Unknown;
26a73082SReid Kleckner    if (isFuncletEHPersonality(Pers))
26a73082SReid Kleckner      Mask = RegInfo->getNoPreservedMask();
26a73082SReid Kleckner  }
26a73082SReid Kleckner
26a73082SReid Kleckner  // Define a new register mask from the existing mask.
26a73082SReid Kleckner  uint32_t *RegMask = nullptr;
26a73082SReid Kleckner
26a73082SReid Kleckner  // In some calling conventions we need to remove the used physical registers
26a73082SReid Kleckner  // from the reg mask. Create a new RegMask for such calling conventions.
26a73082SReid Kleckner  // RegMask for calling conventions that disable only return registers (e.g.
26a73082SReid Kleckner  // preserve_most) will be modified later in LowerCallResult.
26a73082SReid Kleckner  bool ShouldDisableArgRegs = shouldDisableArgRegFromCSR(CallConv) || HasNCSR;
26a73082SReid Kleckner  if (ShouldDisableArgRegs || shouldDisableRetRegFromCSR(CallConv)) {
26a73082SReid Kleckner    const TargetRegisterInfo *TRI = Subtarget.getRegisterInfo();
26a73082SReid Kleckner
26a73082SReid Kleckner    // Allocate a new Reg Mask and copy Mask.
26a73082SReid Kleckner    RegMask = MF.allocateRegMask();
26a73082SReid Kleckner    unsigned RegMaskSize = MachineOperand::getRegMaskSize(TRI->getNumRegs());
26a73082SReid Kleckner    memcpy(RegMask, Mask, sizeof(RegMask[0]) * RegMaskSize);
26a73082SReid Kleckner
26a73082SReid Kleckner    // Make sure all sub registers of the argument registers are reset
26a73082SReid Kleckner    // in the RegMask.
26a73082SReid Kleckner    if (ShouldDisableArgRegs) {
26a73082SReid Kleckner      for (auto const &RegPair : RegsToPass)
26a73082SReid Kleckner        for (MCPhysReg SubReg : TRI->subregs_inclusive(RegPair.first))
26a73082SReid Kleckner          RegMask[SubReg / 32] &= ~(1u << (SubReg % 32));
26a73082SReid Kleckner    }
26a73082SReid Kleckner
26a73082SReid Kleckner    // Create the RegMask Operand according to our updated mask.
26a73082SReid Kleckner    Ops.push_back(DAG.getRegisterMask(RegMask));
26a73082SReid Kleckner  } else {
26a73082SReid Kleckner    // Create the RegMask Operand according to the static mask.
26a73082SReid Kleckner    Ops.push_back(DAG.getRegisterMask(Mask));
26a73082SReid Kleckner  }
26a73082SReid Kleckner
26a73082SReid Kleckner  if (InGlue.getNode())
26a73082SReid Kleckner    Ops.push_back(InGlue);
26a73082SReid Kleckner
26a73082SReid Kleckner  if (isTailCall) {
26a73082SReid Kleckner    // We used to do:
26a73082SReid Kleckner    //// If this is the first return lowered for this function, add the regs
26a73082SReid Kleckner    //// to the liveout set for the function.
26a73082SReid Kleckner    // This isn't right, although it's probably harmless on x86; liveouts
26a73082SReid Kleckner    // should be computed from returns not tail calls.  Consider a void
26a73082SReid Kleckner    // function making a tail call to a function returning int.
26a73082SReid Kleckner    MF.getFrameInfo().setHasTailCall();
baf59be8SSergei Barannikov    SDValue Ret = DAG.getNode(X86ISD::TC_RETURN, dl, MVT::Other, Ops);
26a73082SReid Kleckner
26a73082SReid Kleckner    if (IsCFICall)
26a73082SReid Kleckner      Ret.getNode()->setCFIType(CLI.CFIType->getZExtValue());
26a73082SReid Kleckner
26a73082SReid Kleckner    DAG.addNoMergeSiteInfo(Ret.getNode(), CLI.NoMerge);
26a73082SReid Kleckner    DAG.addCallSiteInfo(Ret.getNode(), std::move(CSInfo));
26a73082SReid Kleckner    return Ret;
26a73082SReid Kleckner  }
26a73082SReid Kleckner
baf59be8SSergei Barannikov  // Returns a chain & a glue for retval copy to use.
baf59be8SSergei Barannikov  SDVTList NodeTys = DAG.getVTList(MVT::Other, MVT::Glue);
26a73082SReid Kleckner  if (HasNoCfCheck && IsCFProtectionSupported && IsIndirectCall) {
26a73082SReid Kleckner    Chain = DAG.getNode(X86ISD::NT_CALL, dl, NodeTys, Ops);
26a73082SReid Kleckner  } else if (CLI.CB && objcarc::hasAttachedCallOpBundle(CLI.CB)) {
26a73082SReid Kleckner    // Calls with a "clang.arc.attachedcall" bundle are special. They should be
26a73082SReid Kleckner    // expanded to the call, directly followed by a special marker sequence and
26a73082SReid Kleckner    // a call to a ObjC library function. Use the CALL_RVMARKER to do that.
26a73082SReid Kleckner    assert(!isTailCall &&
26a73082SReid Kleckner           "tail calls cannot be marked with clang.arc.attachedcall");
26a73082SReid Kleckner    assert(Is64Bit && "clang.arc.attachedcall is only supported in 64bit mode");
26a73082SReid Kleckner
26a73082SReid Kleckner    // Add a target global address for the retainRV/claimRV runtime function
26a73082SReid Kleckner    // just before the call target.
26a73082SReid Kleckner    Function *ARCFn = *objcarc::getAttachedARCFunction(CLI.CB);
26a73082SReid Kleckner    auto PtrVT = getPointerTy(DAG.getDataLayout());
26a73082SReid Kleckner    auto GA = DAG.getTargetGlobalAddress(ARCFn, dl, PtrVT);
26a73082SReid Kleckner    Ops.insert(Ops.begin() + 1, GA);
26a73082SReid Kleckner    Chain = DAG.getNode(X86ISD::CALL_RVMARKER, dl, NodeTys, Ops);
26a73082SReid Kleckner  } else {
26a73082SReid Kleckner    Chain = DAG.getNode(X86ISD::CALL, dl, NodeTys, Ops);
26a73082SReid Kleckner  }
26a73082SReid Kleckner
26a73082SReid Kleckner  if (IsCFICall)
26a73082SReid Kleckner    Chain.getNode()->setCFIType(CLI.CFIType->getZExtValue());
26a73082SReid Kleckner
26a73082SReid Kleckner  InGlue = Chain.getValue(1);
26a73082SReid Kleckner  DAG.addNoMergeSiteInfo(Chain.getNode(), CLI.NoMerge);
26a73082SReid Kleckner  DAG.addCallSiteInfo(Chain.getNode(), std::move(CSInfo));
26a73082SReid Kleckner
26a73082SReid Kleckner  // Save heapallocsite metadata.
26a73082SReid Kleckner  if (CLI.CB)
26a73082SReid Kleckner    if (MDNode *HeapAlloc = CLI.CB->getMetadata("heapallocsite"))
26a73082SReid Kleckner      DAG.addHeapAllocSite(Chain.getNode(), HeapAlloc);
26a73082SReid Kleckner
26a73082SReid Kleckner  // Create the CALLSEQ_END node.
26a73082SReid Kleckner  unsigned NumBytesForCalleeToPop = 0; // Callee pops nothing.
26a73082SReid Kleckner  if (X86::isCalleePop(CallConv, Is64Bit, isVarArg,
26a73082SReid Kleckner                       DAG.getTarget().Options.GuaranteedTailCallOpt))
26a73082SReid Kleckner    NumBytesForCalleeToPop = NumBytes;    // Callee pops everything
26a73082SReid Kleckner  else if (!canGuaranteeTCO(CallConv) && IsCalleePopSRet)
26a73082SReid Kleckner    // If this call passes a struct-return pointer, the callee
26a73082SReid Kleckner    // pops that struct pointer.
26a73082SReid Kleckner    NumBytesForCalleeToPop = 4;
26a73082SReid Kleckner
26a73082SReid Kleckner  // Returns a glue for retval copy to use.
26a73082SReid Kleckner  if (!IsSibcall) {
26a73082SReid Kleckner    Chain = DAG.getCALLSEQ_END(Chain, NumBytesToPop, NumBytesForCalleeToPop,
26a73082SReid Kleckner                               InGlue, dl);
26a73082SReid Kleckner    InGlue = Chain.getValue(1);
26a73082SReid Kleckner  }
26a73082SReid Kleckner
c166a43cSweiguozhi  if (CallingConv::PreserveNone == CallConv)
c166a43cSweiguozhi    for (unsigned I = 0, E = Outs.size(); I != E; ++I) {
c166a43cSweiguozhi      if (Outs[I].Flags.isSwiftSelf() || Outs[I].Flags.isSwiftAsync() ||
c166a43cSweiguozhi          Outs[I].Flags.isSwiftError()) {
c166a43cSweiguozhi        errorUnsupported(DAG, dl,
c166a43cSweiguozhi                         "Swift attributes can't be used with preserve_none");
c166a43cSweiguozhi        break;
c166a43cSweiguozhi      }
c166a43cSweiguozhi    }
c166a43cSweiguozhi
26a73082SReid Kleckner  // Handle result values, copying them out of physregs into vregs that we
26a73082SReid Kleckner  // return.
26a73082SReid Kleckner  return LowerCallResult(Chain, InGlue, CallConv, isVarArg, Ins, dl, DAG,
26a73082SReid Kleckner                         InVals, RegMask);
26a73082SReid Kleckner}
26a73082SReid Kleckner
26a73082SReid Kleckner//===----------------------------------------------------------------------===//
26a73082SReid Kleckner//                Fast Calling Convention (tail call) implementation
26a73082SReid Kleckner//===----------------------------------------------------------------------===//
26a73082SReid Kleckner
26a73082SReid Kleckner//  Like std call, callee cleans arguments, convention except that ECX is
26a73082SReid Kleckner//  reserved for storing the tail called function address. Only 2 registers are
26a73082SReid Kleckner//  free for argument passing (inreg). Tail call optimization is performed
26a73082SReid Kleckner//  provided:
26a73082SReid Kleckner//                * tailcallopt is enabled
26a73082SReid Kleckner//                * caller/callee are fastcc
26a73082SReid Kleckner//  On X86_64 architecture with GOT-style position independent code only local
26a73082SReid Kleckner//  (within module) calls are supported at the moment.
26a73082SReid Kleckner//  To keep the stack aligned according to platform abi the function
26a73082SReid Kleckner//  GetAlignedArgumentStackSize ensures that argument delta is always multiples
26a73082SReid Kleckner//  of stack alignment. (Dynamic linkers need this - Darwin's dyld for example)
26a73082SReid Kleckner//  If a tail called function callee has more arguments than the caller the
26a73082SReid Kleckner//  caller needs to make sure that there is room to move the RETADDR to. This is
26a73082SReid Kleckner//  achieved by reserving an area the size of the argument delta right after the
26a73082SReid Kleckner//  original RETADDR, but before the saved framepointer or the spilled registers
26a73082SReid Kleckner//  e.g. caller(arg1, arg2) calls callee(arg1, arg2,arg3,arg4)
26a73082SReid Kleckner//  stack layout:
26a73082SReid Kleckner//    arg1
26a73082SReid Kleckner//    arg2
26a73082SReid Kleckner//    RETADDR
26a73082SReid Kleckner//    [ new RETADDR
26a73082SReid Kleckner//      move area ]
26a73082SReid Kleckner//    (possible EBP)
26a73082SReid Kleckner//    ESI
26a73082SReid Kleckner//    EDI
26a73082SReid Kleckner//    local1 ..
26a73082SReid Kleckner
26a73082SReid Kleckner/// Make the stack size align e.g 16n + 12 aligned for a 16-byte align
26a73082SReid Kleckner/// requirement.
26a73082SReid Klecknerunsigned
26a73082SReid KlecknerX86TargetLowering::GetAlignedArgumentStackSize(const unsigned StackSize,
26a73082SReid Kleckner                                               SelectionDAG &DAG) const {
26a73082SReid Kleckner  const Align StackAlignment = Subtarget.getFrameLowering()->getStackAlign();
26a73082SReid Kleckner  const uint64_t SlotSize = Subtarget.getRegisterInfo()->getSlotSize();
26a73082SReid Kleckner  assert(StackSize % SlotSize == 0 &&
26a73082SReid Kleckner         "StackSize must be a multiple of SlotSize");
26a73082SReid Kleckner  return alignTo(StackSize + SlotSize, StackAlignment) - SlotSize;
26a73082SReid Kleckner}
26a73082SReid Kleckner
26a73082SReid Kleckner/// Return true if the given stack call argument is already available in the
26a73082SReid Kleckner/// same position (relatively) of the caller's incoming argument stack.
26a73082SReid Klecknerstatic
26a73082SReid Klecknerbool MatchingStackOffset(SDValue Arg, unsigned Offset, ISD::ArgFlagsTy Flags,
26a73082SReid Kleckner                         MachineFrameInfo &MFI, const MachineRegisterInfo *MRI,
26a73082SReid Kleckner                         const X86InstrInfo *TII, const CCValAssign &VA) {
26a73082SReid Kleckner  unsigned Bytes = Arg.getValueSizeInBits() / 8;
26a73082SReid Kleckner
26a73082SReid Kleckner  for (;;) {
26a73082SReid Kleckner    // Look through nodes that don't alter the bits of the incoming value.
26a73082SReid Kleckner    unsigned Op = Arg.getOpcode();
b61b2426SSimon Pilgrim    if (Op == ISD::ZERO_EXTEND || Op == ISD::ANY_EXTEND || Op == ISD::BITCAST ||
b61b2426SSimon Pilgrim        Op == ISD::AssertZext) {
26a73082SReid Kleckner      Arg = Arg.getOperand(0);
26a73082SReid Kleckner      continue;
26a73082SReid Kleckner    }
26a73082SReid Kleckner    if (Op == ISD::TRUNCATE) {
26a73082SReid Kleckner      const SDValue &TruncInput = Arg.getOperand(0);
26a73082SReid Kleckner      if (TruncInput.getOpcode() == ISD::AssertZext &&
26a73082SReid Kleckner          cast<VTSDNode>(TruncInput.getOperand(1))->getVT() ==
26a73082SReid Kleckner              Arg.getValueType()) {
26a73082SReid Kleckner        Arg = TruncInput.getOperand(0);
26a73082SReid Kleckner        continue;
26a73082SReid Kleckner      }
26a73082SReid Kleckner    }
26a73082SReid Kleckner    break;
26a73082SReid Kleckner  }
26a73082SReid Kleckner
26a73082SReid Kleckner  int FI = INT_MAX;
26a73082SReid Kleckner  if (Arg.getOpcode() == ISD::CopyFromReg) {
26a73082SReid Kleckner    Register VR = cast<RegisterSDNode>(Arg.getOperand(1))->getReg();
26a73082SReid Kleckner    if (!VR.isVirtual())
26a73082SReid Kleckner      return false;
26a73082SReid Kleckner    MachineInstr *Def = MRI->getVRegDef(VR);
26a73082SReid Kleckner    if (!Def)
26a73082SReid Kleckner      return false;
26a73082SReid Kleckner    if (!Flags.isByVal()) {
26a73082SReid Kleckner      if (!TII->isLoadFromStackSlot(*Def, FI))
26a73082SReid Kleckner        return false;
26a73082SReid Kleckner    } else {
26a73082SReid Kleckner      unsigned Opcode = Def->getOpcode();
26a73082SReid Kleckner      if ((Opcode == X86::LEA32r || Opcode == X86::LEA64r ||
26a73082SReid Kleckner           Opcode == X86::LEA64_32r) &&
26a73082SReid Kleckner          Def->getOperand(1).isFI()) {
26a73082SReid Kleckner        FI = Def->getOperand(1).getIndex();
26a73082SReid Kleckner        Bytes = Flags.getByValSize();
26a73082SReid Kleckner      } else
26a73082SReid Kleckner        return false;
26a73082SReid Kleckner    }
26a73082SReid Kleckner  } else if (LoadSDNode *Ld = dyn_cast<LoadSDNode>(Arg)) {
26a73082SReid Kleckner    if (Flags.isByVal())
26a73082SReid Kleckner      // ByVal argument is passed in as a pointer but it's now being
26a73082SReid Kleckner      // dereferenced. e.g.
26a73082SReid Kleckner      // define @foo(%struct.X* %A) {
26a73082SReid Kleckner      //   tail call @bar(%struct.X* byval %A)
26a73082SReid Kleckner      // }
26a73082SReid Kleckner      return false;
26a73082SReid Kleckner    SDValue Ptr = Ld->getBasePtr();
26a73082SReid Kleckner    FrameIndexSDNode *FINode = dyn_cast<FrameIndexSDNode>(Ptr);
26a73082SReid Kleckner    if (!FINode)
26a73082SReid Kleckner      return false;
26a73082SReid Kleckner    FI = FINode->getIndex();
26a73082SReid Kleckner  } else if (Arg.getOpcode() == ISD::FrameIndex && Flags.isByVal()) {
26a73082SReid Kleckner    FrameIndexSDNode *FINode = cast<FrameIndexSDNode>(Arg);
26a73082SReid Kleckner    FI = FINode->getIndex();
26a73082SReid Kleckner    Bytes = Flags.getByValSize();
26a73082SReid Kleckner  } else
26a73082SReid Kleckner    return false;
26a73082SReid Kleckner
26a73082SReid Kleckner  assert(FI != INT_MAX);
26a73082SReid Kleckner  if (!MFI.isFixedObjectIndex(FI))
26a73082SReid Kleckner    return false;
26a73082SReid Kleckner
26a73082SReid Kleckner  if (Offset != MFI.getObjectOffset(FI))
26a73082SReid Kleckner    return false;
26a73082SReid Kleckner
26a73082SReid Kleckner  // If this is not byval, check that the argument stack object is immutable.
26a73082SReid Kleckner  // inalloca and argument copy elision can create mutable argument stack
26a73082SReid Kleckner  // objects. Byval objects can be mutated, but a byval call intends to pass the
26a73082SReid Kleckner  // mutated memory.
26a73082SReid Kleckner  if (!Flags.isByVal() && !MFI.isImmutableObjectIndex(FI))
26a73082SReid Kleckner    return false;
26a73082SReid Kleckner
26a73082SReid Kleckner  if (VA.getLocVT().getFixedSizeInBits() >
26a73082SReid Kleckner      Arg.getValueSizeInBits().getFixedValue()) {
26a73082SReid Kleckner    // If the argument location is wider than the argument type, check that any
26a73082SReid Kleckner    // extension flags match.
26a73082SReid Kleckner    if (Flags.isZExt() != MFI.isObjectZExt(FI) ||
26a73082SReid Kleckner        Flags.isSExt() != MFI.isObjectSExt(FI)) {
26a73082SReid Kleckner      return false;
26a73082SReid Kleckner    }
26a73082SReid Kleckner  }
26a73082SReid Kleckner
26a73082SReid Kleckner  return Bytes == MFI.getObjectSize(FI);
26a73082SReid Kleckner}
26a73082SReid Kleckner
26a73082SReid Kleckner/// Check whether the call is eligible for tail call optimization. Targets
26a73082SReid Kleckner/// that want to do tail call optimization should implement this function.
385faf9cSReid Kleckner/// Note that the x86 backend does not check musttail calls for eligibility! The
385faf9cSReid Kleckner/// rest of x86 tail call lowering must be prepared to forward arguments of any
385faf9cSReid Kleckner/// type.
26a73082SReid Klecknerbool X86TargetLowering::IsEligibleForTailCallOptimization(
385faf9cSReid Kleckner    TargetLowering::CallLoweringInfo &CLI, CCState &CCInfo,
385faf9cSReid Kleckner    SmallVectorImpl<CCValAssign> &ArgLocs, bool IsCalleePopSRet) const {
385faf9cSReid Kleckner  SelectionDAG &DAG = CLI.DAG;
385faf9cSReid Kleckner  const SmallVectorImpl<ISD::OutputArg> &Outs = CLI.Outs;
385faf9cSReid Kleckner  const SmallVectorImpl<SDValue> &OutVals = CLI.OutVals;
385faf9cSReid Kleckner  const SmallVectorImpl<ISD::InputArg> &Ins = CLI.Ins;
385faf9cSReid Kleckner  SDValue Callee = CLI.Callee;
385faf9cSReid Kleckner  CallingConv::ID CalleeCC = CLI.CallConv;
385faf9cSReid Kleckner  bool isVarArg = CLI.IsVarArg;
385faf9cSReid Kleckner
26a73082SReid Kleckner  if (!mayTailCallThisCC(CalleeCC))
26a73082SReid Kleckner    return false;
26a73082SReid Kleckner
26a73082SReid Kleckner  // If -tailcallopt is specified, make fastcc functions tail-callable.
26a73082SReid Kleckner  MachineFunction &MF = DAG.getMachineFunction();
26a73082SReid Kleckner  const Function &CallerF = MF.getFunction();
26a73082SReid Kleckner
26a73082SReid Kleckner  // If the function return type is x86_fp80 and the callee return type is not,
26a73082SReid Kleckner  // then the FP_EXTEND of the call result is not a nop. It's not safe to
26a73082SReid Kleckner  // perform a tailcall optimization here.
385faf9cSReid Kleckner  if (CallerF.getReturnType()->isX86_FP80Ty() && !CLI.RetTy->isX86_FP80Ty())
26a73082SReid Kleckner    return false;
26a73082SReid Kleckner
26a73082SReid Kleckner  CallingConv::ID CallerCC = CallerF.getCallingConv();
26a73082SReid Kleckner  bool CCMatch = CallerCC == CalleeCC;
26a73082SReid Kleckner  bool IsCalleeWin64 = Subtarget.isCallingConvWin64(CalleeCC);
26a73082SReid Kleckner  bool IsCallerWin64 = Subtarget.isCallingConvWin64(CallerCC);
26a73082SReid Kleckner  bool IsGuaranteeTCO = DAG.getTarget().Options.GuaranteedTailCallOpt ||
26a73082SReid Kleckner      CalleeCC == CallingConv::Tail || CalleeCC == CallingConv::SwiftTail;
26a73082SReid Kleckner
26a73082SReid Kleckner  // Win64 functions have extra shadow space for argument homing. Don't do the
26a73082SReid Kleckner  // sibcall if the caller and callee have mismatched expectations for this
26a73082SReid Kleckner  // space.
26a73082SReid Kleckner  if (IsCalleeWin64 != IsCallerWin64)
26a73082SReid Kleckner    return false;
26a73082SReid Kleckner
26a73082SReid Kleckner  if (IsGuaranteeTCO) {
26a73082SReid Kleckner    if (canGuaranteeTCO(CalleeCC) && CCMatch)
26a73082SReid Kleckner      return true;
26a73082SReid Kleckner    return false;
26a73082SReid Kleckner  }
26a73082SReid Kleckner
26a73082SReid Kleckner  // Look for obvious safe cases to perform tail call optimization that do not
26a73082SReid Kleckner  // require ABI changes. This is what gcc calls sibcall.
26a73082SReid Kleckner
26a73082SReid Kleckner  // Can't do sibcall if stack needs to be dynamically re-aligned. PEI needs to
26a73082SReid Kleckner  // emit a special epilogue.
26a73082SReid Kleckner  const X86RegisterInfo *RegInfo = Subtarget.getRegisterInfo();
26a73082SReid Kleckner  if (RegInfo->hasStackRealignment(MF))
26a73082SReid Kleckner    return false;
26a73082SReid Kleckner
26a73082SReid Kleckner  // Also avoid sibcall optimization if we're an sret return fn and the callee
26a73082SReid Kleckner  // is incompatible. See comment in LowerReturn about why hasStructRetAttr is
26a73082SReid Kleckner  // insufficient.
26a73082SReid Kleckner  if (MF.getInfo<X86MachineFunctionInfo>()->getSRetReturnReg()) {
26a73082SReid Kleckner    // For a compatible tail call the callee must return our sret pointer. So it
26a73082SReid Kleckner    // needs to be (a) an sret function itself and (b) we pass our sret as its
26a73082SReid Kleckner    // sret. Condition #b is harder to determine.
26a73082SReid Kleckner    return false;
26a73082SReid Kleckner  } else if (IsCalleePopSRet)
26a73082SReid Kleckner    // The callee pops an sret, so we cannot tail-call, as our caller doesn't
26a73082SReid Kleckner    // expect that.
26a73082SReid Kleckner    return false;
26a73082SReid Kleckner
26a73082SReid Kleckner  // Do not sibcall optimize vararg calls unless all arguments are passed via
26a73082SReid Kleckner  // registers.
26a73082SReid Kleckner  LLVMContext &C = *DAG.getContext();
26a73082SReid Kleckner  if (isVarArg && !Outs.empty()) {
26a73082SReid Kleckner    // Optimizing for varargs on Win64 is unlikely to be safe without
26a73082SReid Kleckner    // additional testing.
26a73082SReid Kleckner    if (IsCalleeWin64 || IsCallerWin64)
26a73082SReid Kleckner      return false;
26a73082SReid Kleckner
26a73082SReid Kleckner    for (const auto &VA : ArgLocs)
26a73082SReid Kleckner      if (!VA.isRegLoc())
26a73082SReid Kleckner        return false;
26a73082SReid Kleckner  }
26a73082SReid Kleckner
26a73082SReid Kleckner  // If the call result is in ST0 / ST1, it needs to be popped off the x87
26a73082SReid Kleckner  // stack.  Therefore, if it's not used by the call it is not safe to optimize
26a73082SReid Kleckner  // this into a sibcall.
26a73082SReid Kleckner  bool Unused = false;
26a73082SReid Kleckner  for (const auto &In : Ins) {
26a73082SReid Kleckner    if (!In.Used) {
26a73082SReid Kleckner      Unused = true;
26a73082SReid Kleckner      break;
26a73082SReid Kleckner    }
26a73082SReid Kleckner  }
26a73082SReid Kleckner  if (Unused) {
26a73082SReid Kleckner    SmallVector<CCValAssign, 16> RVLocs;
385faf9cSReid Kleckner    CCState RVCCInfo(CalleeCC, false, MF, RVLocs, C);
385faf9cSReid Kleckner    RVCCInfo.AnalyzeCallResult(Ins, RetCC_X86);
26a73082SReid Kleckner    for (const auto &VA : RVLocs) {
26a73082SReid Kleckner      if (VA.getLocReg() == X86::FP0 || VA.getLocReg() == X86::FP1)
26a73082SReid Kleckner        return false;
26a73082SReid Kleckner    }
26a73082SReid Kleckner  }
26a73082SReid Kleckner
26a73082SReid Kleckner  // Check that the call results are passed in the same way.
26a73082SReid Kleckner  if (!CCState::resultsCompatible(CalleeCC, CallerCC, MF, C, Ins,
26a73082SReid Kleckner                                  RetCC_X86, RetCC_X86))
26a73082SReid Kleckner    return false;
26a73082SReid Kleckner  // The callee has to preserve all registers the caller needs to preserve.
26a73082SReid Kleckner  const X86RegisterInfo *TRI = Subtarget.getRegisterInfo();
26a73082SReid Kleckner  const uint32_t *CallerPreserved = TRI->getCallPreservedMask(MF, CallerCC);
26a73082SReid Kleckner  if (!CCMatch) {
26a73082SReid Kleckner    const uint32_t *CalleePreserved = TRI->getCallPreservedMask(MF, CalleeCC);
26a73082SReid Kleckner    if (!TRI->regmaskSubsetEqual(CallerPreserved, CalleePreserved))
26a73082SReid Kleckner      return false;
26a73082SReid Kleckner  }
26a73082SReid Kleckner
d3a8363bSAntonio Frighetto  // The stack frame of the caller cannot be replaced by the tail-callee one's
d3a8363bSAntonio Frighetto  // if the function is required to preserve all the registers. Conservatively
d3a8363bSAntonio Frighetto  // prevent tail optimization even if hypothetically all the registers are used
d3a8363bSAntonio Frighetto  // for passing formal parameters or returning values.
d3a8363bSAntonio Frighetto  if (CallerF.hasFnAttribute("no_caller_saved_registers"))
d3a8363bSAntonio Frighetto    return false;
d3a8363bSAntonio Frighetto
385faf9cSReid Kleckner  unsigned StackArgsSize = CCInfo.getStackSize();
26a73082SReid Kleckner
26a73082SReid Kleckner  // If the callee takes no arguments then go on to check the results of the
26a73082SReid Kleckner  // call.
26a73082SReid Kleckner  if (!Outs.empty()) {
385faf9cSReid Kleckner    if (StackArgsSize > 0) {
26a73082SReid Kleckner      // Check if the arguments are already laid out in the right way as
26a73082SReid Kleckner      // the caller's fixed stack objects.
26a73082SReid Kleckner      MachineFrameInfo &MFI = MF.getFrameInfo();
26a73082SReid Kleckner      const MachineRegisterInfo *MRI = &MF.getRegInfo();
26a73082SReid Kleckner      const X86InstrInfo *TII = Subtarget.getInstrInfo();
26a73082SReid Kleckner      for (unsigned I = 0, E = ArgLocs.size(); I != E; ++I) {
26a73082SReid Kleckner        const CCValAssign &VA = ArgLocs[I];
26a73082SReid Kleckner        SDValue Arg = OutVals[I];
26a73082SReid Kleckner        ISD::ArgFlagsTy Flags = Outs[I].Flags;
26a73082SReid Kleckner        if (VA.getLocInfo() == CCValAssign::Indirect)
26a73082SReid Kleckner          return false;
26a73082SReid Kleckner        if (!VA.isRegLoc()) {
26a73082SReid Kleckner          if (!MatchingStackOffset(Arg, VA.getLocMemOffset(), Flags, MFI, MRI,
26a73082SReid Kleckner                                   TII, VA))
26a73082SReid Kleckner            return false;
26a73082SReid Kleckner        }
26a73082SReid Kleckner      }
26a73082SReid Kleckner    }
26a73082SReid Kleckner
26a73082SReid Kleckner    bool PositionIndependent = isPositionIndependent();
26a73082SReid Kleckner    // If the tailcall address may be in a register, then make sure it's
26a73082SReid Kleckner    // possible to register allocate for it. In 32-bit, the call address can
26a73082SReid Kleckner    // only target EAX, EDX, or ECX since the tail call must be scheduled after
26a73082SReid Kleckner    // callee-saved registers are restored. These happen to be the same
26a73082SReid Kleckner    // registers used to pass 'inreg' arguments so watch out for those.
26a73082SReid Kleckner    if (!Subtarget.is64Bit() && ((!isa<GlobalAddressSDNode>(Callee) &&
26a73082SReid Kleckner                                  !isa<ExternalSymbolSDNode>(Callee)) ||
26a73082SReid Kleckner                                 PositionIndependent)) {
26a73082SReid Kleckner      unsigned NumInRegs = 0;
26a73082SReid Kleckner      // In PIC we need an extra register to formulate the address computation
26a73082SReid Kleckner      // for the callee.
26a73082SReid Kleckner      unsigned MaxInRegs = PositionIndependent ? 2 : 3;
26a73082SReid Kleckner
26a73082SReid Kleckner      for (const auto &VA : ArgLocs) {
26a73082SReid Kleckner        if (!VA.isRegLoc())
26a73082SReid Kleckner          continue;
26a73082SReid Kleckner        Register Reg = VA.getLocReg();
26a73082SReid Kleckner        switch (Reg) {
26a73082SReid Kleckner        default: break;
26a73082SReid Kleckner        case X86::EAX: case X86::EDX: case X86::ECX:
26a73082SReid Kleckner          if (++NumInRegs == MaxInRegs)
26a73082SReid Kleckner            return false;
26a73082SReid Kleckner          break;
26a73082SReid Kleckner        }
26a73082SReid Kleckner      }
26a73082SReid Kleckner    }
26a73082SReid Kleckner
26a73082SReid Kleckner    const MachineRegisterInfo &MRI = MF.getRegInfo();
26a73082SReid Kleckner    if (!parametersInCSRMatch(MRI, CallerPreserved, ArgLocs, OutVals))
26a73082SReid Kleckner      return false;
26a73082SReid Kleckner  }
26a73082SReid Kleckner
26a73082SReid Kleckner  bool CalleeWillPop =
26a73082SReid Kleckner      X86::isCalleePop(CalleeCC, Subtarget.is64Bit(), isVarArg,
26a73082SReid Kleckner                       MF.getTarget().Options.GuaranteedTailCallOpt);
26a73082SReid Kleckner
26a73082SReid Kleckner  if (unsigned BytesToPop =
26a73082SReid Kleckner          MF.getInfo<X86MachineFunctionInfo>()->getBytesToPopOnReturn()) {
26a73082SReid Kleckner    // If we have bytes to pop, the callee must pop them.
26a73082SReid Kleckner    bool CalleePopMatches = CalleeWillPop && BytesToPop == StackArgsSize;
26a73082SReid Kleckner    if (!CalleePopMatches)
26a73082SReid Kleckner      return false;
26a73082SReid Kleckner  } else if (CalleeWillPop && StackArgsSize > 0) {
26a73082SReid Kleckner    // If we don't have bytes to pop, make sure the callee doesn't pop any.
26a73082SReid Kleckner    return false;
26a73082SReid Kleckner  }
26a73082SReid Kleckner
26a73082SReid Kleckner  return true;
26a73082SReid Kleckner}
26a73082SReid Kleckner
26a73082SReid Kleckner/// Determines whether the callee is required to pop its own arguments.
26a73082SReid Kleckner/// Callee pop is necessary to support tail calls.
26a73082SReid Klecknerbool X86::isCalleePop(CallingConv::ID CallingConv,
26a73082SReid Kleckner                      bool is64Bit, bool IsVarArg, bool GuaranteeTCO) {
26a73082SReid Kleckner  // If GuaranteeTCO is true, we force some calls to be callee pop so that we
26a73082SReid Kleckner  // can guarantee TCO.
26a73082SReid Kleckner  if (!IsVarArg && shouldGuaranteeTCO(CallingConv, GuaranteeTCO))
26a73082SReid Kleckner    return true;
26a73082SReid Kleckner
26a73082SReid Kleckner  switch (CallingConv) {
26a73082SReid Kleckner  default:
26a73082SReid Kleckner    return false;
26a73082SReid Kleckner  case CallingConv::X86_StdCall:
26a73082SReid Kleckner  case CallingConv::X86_FastCall:
26a73082SReid Kleckner  case CallingConv::X86_ThisCall:
26a73082SReid Kleckner  case CallingConv::X86_VectorCall:
26a73082SReid Kleckner    return !is64Bit;
26a73082SReid Kleckner  }
26a73082SReid Kleckner}