Transforms/Instrumentation/NumericalStabilitySanitizer.cpp

*0fca6ea1SDimitry Andric//===-- NumericalStabilitySanitizer.cpp -----------------------------------===//
*0fca6ea1SDimitry Andric//
*0fca6ea1SDimitry Andric// Part of the LLVM Project, under the Apache License v2.0 with LLVM Exceptions.
*0fca6ea1SDimitry Andric// See https://llvm.org/LICENSE.txt for license information.
*0fca6ea1SDimitry Andric// SPDX-License-Identifier: Apache-2.0 WITH LLVM-exception
*0fca6ea1SDimitry Andric//
*0fca6ea1SDimitry Andric//===----------------------------------------------------------------------===//
*0fca6ea1SDimitry Andric//
*0fca6ea1SDimitry Andric// This file contains the instrumentation pass for the numerical sanitizer.
*0fca6ea1SDimitry Andric// Conceptually the pass injects shadow computations using higher precision
*0fca6ea1SDimitry Andric// types and inserts consistency checks. For details see the paper
*0fca6ea1SDimitry Andric// https://arxiv.org/abs/2102.12782.
*0fca6ea1SDimitry Andric//
*0fca6ea1SDimitry Andric//===----------------------------------------------------------------------===//
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric#include "llvm/Transforms/Instrumentation/NumericalStabilitySanitizer.h"
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric#include "llvm/ADT/DenseMap.h"
*0fca6ea1SDimitry Andric#include "llvm/ADT/SmallString.h"
*0fca6ea1SDimitry Andric#include "llvm/ADT/SmallVector.h"
*0fca6ea1SDimitry Andric#include "llvm/ADT/Statistic.h"
*0fca6ea1SDimitry Andric#include "llvm/ADT/StringExtras.h"
*0fca6ea1SDimitry Andric#include "llvm/Analysis/TargetLibraryInfo.h"
*0fca6ea1SDimitry Andric#include "llvm/Analysis/ValueTracking.h"
*0fca6ea1SDimitry Andric#include "llvm/IR/DataLayout.h"
*0fca6ea1SDimitry Andric#include "llvm/IR/Function.h"
*0fca6ea1SDimitry Andric#include "llvm/IR/IRBuilder.h"
*0fca6ea1SDimitry Andric#include "llvm/IR/IntrinsicInst.h"
*0fca6ea1SDimitry Andric#include "llvm/IR/Intrinsics.h"
*0fca6ea1SDimitry Andric#include "llvm/IR/LLVMContext.h"
*0fca6ea1SDimitry Andric#include "llvm/IR/MDBuilder.h"
*0fca6ea1SDimitry Andric#include "llvm/IR/Metadata.h"
*0fca6ea1SDimitry Andric#include "llvm/IR/Module.h"
*0fca6ea1SDimitry Andric#include "llvm/IR/Type.h"
*0fca6ea1SDimitry Andric#include "llvm/InitializePasses.h"
*0fca6ea1SDimitry Andric#include "llvm/Support/CommandLine.h"
*0fca6ea1SDimitry Andric#include "llvm/Support/Debug.h"
*0fca6ea1SDimitry Andric#include "llvm/Support/MathExtras.h"
*0fca6ea1SDimitry Andric#include "llvm/Support/Regex.h"
*0fca6ea1SDimitry Andric#include "llvm/Support/raw_ostream.h"
*0fca6ea1SDimitry Andric#include "llvm/Transforms/Instrumentation.h"
*0fca6ea1SDimitry Andric#include "llvm/Transforms/Utils/BasicBlockUtils.h"
*0fca6ea1SDimitry Andric#include "llvm/Transforms/Utils/EscapeEnumerator.h"
*0fca6ea1SDimitry Andric#include "llvm/Transforms/Utils/Local.h"
*0fca6ea1SDimitry Andric#include "llvm/Transforms/Utils/ModuleUtils.h"
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric#include <cstdint>
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andricusing namespace llvm;
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric#define DEBUG_TYPE "nsan"
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry AndricSTATISTIC(NumInstrumentedFTLoads,
*0fca6ea1SDimitry Andric          "Number of instrumented floating-point loads");
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry AndricSTATISTIC(NumInstrumentedFTCalls,
*0fca6ea1SDimitry Andric          "Number of instrumented floating-point calls");
*0fca6ea1SDimitry AndricSTATISTIC(NumInstrumentedFTRets,
*0fca6ea1SDimitry Andric          "Number of instrumented floating-point returns");
*0fca6ea1SDimitry AndricSTATISTIC(NumInstrumentedFTStores,
*0fca6ea1SDimitry Andric          "Number of instrumented floating-point stores");
*0fca6ea1SDimitry AndricSTATISTIC(NumInstrumentedNonFTStores,
*0fca6ea1SDimitry Andric          "Number of instrumented non floating-point stores");
*0fca6ea1SDimitry AndricSTATISTIC(
*0fca6ea1SDimitry Andric    NumInstrumentedNonFTMemcpyStores,
*0fca6ea1SDimitry Andric    "Number of instrumented non floating-point stores with memcpy semantics");
*0fca6ea1SDimitry AndricSTATISTIC(NumInstrumentedFCmp, "Number of instrumented fcmps");
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric// Using smaller shadow types types can help improve speed. For example, `dlq`
*0fca6ea1SDimitry Andric// is 3x slower to 5x faster in opt mode and 2-6x faster in dbg mode compared to
*0fca6ea1SDimitry Andric// `dqq`.
*0fca6ea1SDimitry Andricstatic cl::opt<std::string> ClShadowMapping(
*0fca6ea1SDimitry Andric    "nsan-shadow-type-mapping", cl::init("dqq"),
*0fca6ea1SDimitry Andric    cl::desc("One shadow type id for each of `float`, `double`, `long double`. "
*0fca6ea1SDimitry Andric             "`d`,`l`,`q`,`e` mean double, x86_fp80, fp128 (quad) and "
*0fca6ea1SDimitry Andric             "ppc_fp128 (extended double) respectively. The default is to "
*0fca6ea1SDimitry Andric             "shadow `float` as `double`, and `double` and `x86_fp80` as "
*0fca6ea1SDimitry Andric             "`fp128`"),
*0fca6ea1SDimitry Andric    cl::Hidden);
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andricstatic cl::opt<bool>
*0fca6ea1SDimitry Andric    ClInstrumentFCmp("nsan-instrument-fcmp", cl::init(true),
*0fca6ea1SDimitry Andric                     cl::desc("Instrument floating-point comparisons"),
*0fca6ea1SDimitry Andric                     cl::Hidden);
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andricstatic cl::opt<std::string> ClCheckFunctionsFilter(
*0fca6ea1SDimitry Andric    "check-functions-filter",
*0fca6ea1SDimitry Andric    cl::desc("Only emit checks for arguments of functions "
*0fca6ea1SDimitry Andric             "whose names match the given regular expression"),
*0fca6ea1SDimitry Andric    cl::value_desc("regex"));
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andricstatic cl::opt<bool> ClTruncateFCmpEq(
*0fca6ea1SDimitry Andric    "nsan-truncate-fcmp-eq", cl::init(true),
*0fca6ea1SDimitry Andric    cl::desc(
*0fca6ea1SDimitry Andric        "This flag controls the behaviour of fcmp equality comparisons."
*0fca6ea1SDimitry Andric        "For equality comparisons such as `x == 0.0f`, we can perform the "
*0fca6ea1SDimitry Andric        "shadow check in the shadow (`x_shadow == 0.0) == (x == 0.0f)`) or app "
*0fca6ea1SDimitry Andric        " domain (`(trunc(x_shadow) == 0.0f) == (x == 0.0f)`). This helps "
*0fca6ea1SDimitry Andric        "catch the case when `x_shadow` is accurate enough (and therefore "
*0fca6ea1SDimitry Andric        "close enough to zero) so that `trunc(x_shadow)` is zero even though "
*0fca6ea1SDimitry Andric        "both `x` and `x_shadow` are not"),
*0fca6ea1SDimitry Andric    cl::Hidden);
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric// When there is external, uninstrumented code writing to memory, the shadow
*0fca6ea1SDimitry Andric// memory can get out of sync with the application memory. Enabling this flag
*0fca6ea1SDimitry Andric// emits consistency checks for loads to catch this situation.
*0fca6ea1SDimitry Andric// When everything is instrumented, this is not strictly necessary because any
*0fca6ea1SDimitry Andric// load should have a corresponding store, but can help debug cases when the
*0fca6ea1SDimitry Andric// framework did a bad job at tracking shadow memory modifications by failing on
*0fca6ea1SDimitry Andric// load rather than store.
*0fca6ea1SDimitry Andric// TODO: provide a way to resume computations from the FT value when the load
*0fca6ea1SDimitry Andric// is inconsistent. This ensures that further computations are not polluted.
*0fca6ea1SDimitry Andricstatic cl::opt<bool> ClCheckLoads("nsan-check-loads",
*0fca6ea1SDimitry Andric                                  cl::desc("Check floating-point load"),
*0fca6ea1SDimitry Andric                                  cl::Hidden);
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andricstatic cl::opt<bool> ClCheckStores("nsan-check-stores", cl::init(true),
*0fca6ea1SDimitry Andric                                   cl::desc("Check floating-point stores"),
*0fca6ea1SDimitry Andric                                   cl::Hidden);
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andricstatic cl::opt<bool> ClCheckRet("nsan-check-ret", cl::init(true),
*0fca6ea1SDimitry Andric                                cl::desc("Check floating-point return values"),
*0fca6ea1SDimitry Andric                                cl::Hidden);
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric// LLVM may store constant floats as bitcasted ints.
*0fca6ea1SDimitry Andric// It's not really necessary to shadow such stores,
*0fca6ea1SDimitry Andric// if the shadow value is unknown the framework will re-extend it on load
*0fca6ea1SDimitry Andric// anyway. Moreover, because of size collisions (e.g. bf16 vs f16) it is
*0fca6ea1SDimitry Andric// impossible to determine the floating-point type based on the size.
*0fca6ea1SDimitry Andric// However, for debugging purposes it can be useful to model such stores.
*0fca6ea1SDimitry Andricstatic cl::opt<bool> ClPropagateNonFTConstStoresAsFT(
*0fca6ea1SDimitry Andric    "nsan-propagate-non-ft-const-stores-as-ft",
*0fca6ea1SDimitry Andric    cl::desc(
*0fca6ea1SDimitry Andric        "Propagate non floating-point const stores as floating point values."
*0fca6ea1SDimitry Andric        "For debugging purposes only"),
*0fca6ea1SDimitry Andric    cl::Hidden);
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andricconstexpr StringLiteral kNsanModuleCtorName("nsan.module_ctor");
*0fca6ea1SDimitry Andricconstexpr StringLiteral kNsanInitName("__nsan_init");
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric// The following values must be kept in sync with the runtime.
*0fca6ea1SDimitry Andricconstexpr int kShadowScale = 2;
*0fca6ea1SDimitry Andricconstexpr int kMaxVectorWidth = 8;
*0fca6ea1SDimitry Andricconstexpr int kMaxNumArgs = 128;
*0fca6ea1SDimitry Andricconstexpr int kMaxShadowTypeSizeBytes = 16; // fp128
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andricnamespace {
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric// Defines the characteristics (type id, type, and floating-point semantics)
*0fca6ea1SDimitry Andric// attached for all possible shadow types.
*0fca6ea1SDimitry Andricclass ShadowTypeConfig {
*0fca6ea1SDimitry Andricpublic:
*0fca6ea1SDimitry Andric  static std::unique_ptr<ShadowTypeConfig> fromNsanTypeId(char TypeId);
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric  // The LLVM Type corresponding to the shadow type.
*0fca6ea1SDimitry Andric  virtual Type *getType(LLVMContext &Context) const = 0;
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric  // The nsan type id of the shadow type (`d`, `l`, `q`, ...).
*0fca6ea1SDimitry Andric  virtual char getNsanTypeId() const = 0;
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric  virtual ~ShadowTypeConfig() = default;
*0fca6ea1SDimitry Andric};
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andrictemplate <char NsanTypeId>
*0fca6ea1SDimitry Andricclass ShadowTypeConfigImpl : public ShadowTypeConfig {
*0fca6ea1SDimitry Andricpublic:
*0fca6ea1SDimitry Andric  char getNsanTypeId() const override { return NsanTypeId; }
*0fca6ea1SDimitry Andric  static constexpr const char kNsanTypeId = NsanTypeId;
*0fca6ea1SDimitry Andric};
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric// `double` (`d`) shadow type.
*0fca6ea1SDimitry Andricclass F64ShadowConfig : public ShadowTypeConfigImpl<'d'> {
*0fca6ea1SDimitry Andric  Type *getType(LLVMContext &Context) const override {
*0fca6ea1SDimitry Andric    return Type::getDoubleTy(Context);
*0fca6ea1SDimitry Andric  }
*0fca6ea1SDimitry Andric};
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric// `x86_fp80` (`l`) shadow type: X86 long double.
*0fca6ea1SDimitry Andricclass F80ShadowConfig : public ShadowTypeConfigImpl<'l'> {
*0fca6ea1SDimitry Andric  Type *getType(LLVMContext &Context) const override {
*0fca6ea1SDimitry Andric    return Type::getX86_FP80Ty(Context);
*0fca6ea1SDimitry Andric  }
*0fca6ea1SDimitry Andric};
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric// `fp128` (`q`) shadow type.
*0fca6ea1SDimitry Andricclass F128ShadowConfig : public ShadowTypeConfigImpl<'q'> {
*0fca6ea1SDimitry Andric  Type *getType(LLVMContext &Context) const override {
*0fca6ea1SDimitry Andric    return Type::getFP128Ty(Context);
*0fca6ea1SDimitry Andric  }
*0fca6ea1SDimitry Andric};
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric// `ppc_fp128` (`e`) shadow type: IBM extended double with 106 bits of mantissa.
*0fca6ea1SDimitry Andricclass PPC128ShadowConfig : public ShadowTypeConfigImpl<'e'> {
*0fca6ea1SDimitry Andric  Type *getType(LLVMContext &Context) const override {
*0fca6ea1SDimitry Andric    return Type::getPPC_FP128Ty(Context);
*0fca6ea1SDimitry Andric  }
*0fca6ea1SDimitry Andric};
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric// Creates a ShadowTypeConfig given its type id.
*0fca6ea1SDimitry Andricstd::unique_ptr<ShadowTypeConfig>
*0fca6ea1SDimitry AndricShadowTypeConfig::fromNsanTypeId(const char TypeId) {
*0fca6ea1SDimitry Andric  switch (TypeId) {
*0fca6ea1SDimitry Andric  case F64ShadowConfig::kNsanTypeId:
*0fca6ea1SDimitry Andric    return std::make_unique<F64ShadowConfig>();
*0fca6ea1SDimitry Andric  case F80ShadowConfig::kNsanTypeId:
*0fca6ea1SDimitry Andric    return std::make_unique<F80ShadowConfig>();
*0fca6ea1SDimitry Andric  case F128ShadowConfig::kNsanTypeId:
*0fca6ea1SDimitry Andric    return std::make_unique<F128ShadowConfig>();
*0fca6ea1SDimitry Andric  case PPC128ShadowConfig::kNsanTypeId:
*0fca6ea1SDimitry Andric    return std::make_unique<PPC128ShadowConfig>();
*0fca6ea1SDimitry Andric  }
*0fca6ea1SDimitry Andric  report_fatal_error("nsan: invalid shadow type id '" + Twine(TypeId) + "'");
*0fca6ea1SDimitry Andric}
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric// An enum corresponding to shadow value types. Used as indices in arrays, so
*0fca6ea1SDimitry Andric// not an `enum class`.
*0fca6ea1SDimitry Andricenum FTValueType { kFloat, kDouble, kLongDouble, kNumValueTypes };
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric// If `FT` corresponds to a primitive FTValueType, return it.
*0fca6ea1SDimitry Andricstatic std::optional<FTValueType> ftValueTypeFromType(Type *FT) {
*0fca6ea1SDimitry Andric  if (FT->isFloatTy())
*0fca6ea1SDimitry Andric    return kFloat;
*0fca6ea1SDimitry Andric  if (FT->isDoubleTy())
*0fca6ea1SDimitry Andric    return kDouble;
*0fca6ea1SDimitry Andric  if (FT->isX86_FP80Ty())
*0fca6ea1SDimitry Andric    return kLongDouble;
*0fca6ea1SDimitry Andric  return {};
*0fca6ea1SDimitry Andric}
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric// Returns the LLVM type for an FTValueType.
*0fca6ea1SDimitry Andricstatic Type *typeFromFTValueType(FTValueType VT, LLVMContext &Context) {
*0fca6ea1SDimitry Andric  switch (VT) {
*0fca6ea1SDimitry Andric  case kFloat:
*0fca6ea1SDimitry Andric    return Type::getFloatTy(Context);
*0fca6ea1SDimitry Andric  case kDouble:
*0fca6ea1SDimitry Andric    return Type::getDoubleTy(Context);
*0fca6ea1SDimitry Andric  case kLongDouble:
*0fca6ea1SDimitry Andric    return Type::getX86_FP80Ty(Context);
*0fca6ea1SDimitry Andric  case kNumValueTypes:
*0fca6ea1SDimitry Andric    return nullptr;
*0fca6ea1SDimitry Andric  }
*0fca6ea1SDimitry Andric  llvm_unreachable("Unhandled FTValueType enum");
*0fca6ea1SDimitry Andric}
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric// Returns the type name for an FTValueType.
*0fca6ea1SDimitry Andricstatic const char *typeNameFromFTValueType(FTValueType VT) {
*0fca6ea1SDimitry Andric  switch (VT) {
*0fca6ea1SDimitry Andric  case kFloat:
*0fca6ea1SDimitry Andric    return "float";
*0fca6ea1SDimitry Andric  case kDouble:
*0fca6ea1SDimitry Andric    return "double";
*0fca6ea1SDimitry Andric  case kLongDouble:
*0fca6ea1SDimitry Andric    return "longdouble";
*0fca6ea1SDimitry Andric  case kNumValueTypes:
*0fca6ea1SDimitry Andric    return nullptr;
*0fca6ea1SDimitry Andric  }
*0fca6ea1SDimitry Andric  llvm_unreachable("Unhandled FTValueType enum");
*0fca6ea1SDimitry Andric}
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric// A specific mapping configuration of application type to shadow type for nsan
*0fca6ea1SDimitry Andric// (see -nsan-shadow-mapping flag).
*0fca6ea1SDimitry Andricclass MappingConfig {
*0fca6ea1SDimitry Andricpublic:
*0fca6ea1SDimitry Andric  explicit MappingConfig(LLVMContext &C) : Context(C) {
*0fca6ea1SDimitry Andric    if (ClShadowMapping.size() != 3)
*0fca6ea1SDimitry Andric      report_fatal_error("Invalid nsan mapping: " + Twine(ClShadowMapping));
*0fca6ea1SDimitry Andric    unsigned ShadowTypeSizeBits[kNumValueTypes];
*0fca6ea1SDimitry Andric    for (int VT = 0; VT < kNumValueTypes; ++VT) {
*0fca6ea1SDimitry Andric      auto Config = ShadowTypeConfig::fromNsanTypeId(ClShadowMapping[VT]);
*0fca6ea1SDimitry Andric      if (!Config)
*0fca6ea1SDimitry Andric        report_fatal_error("Failed to get ShadowTypeConfig for " +
*0fca6ea1SDimitry Andric                           Twine(ClShadowMapping[VT]));
*0fca6ea1SDimitry Andric      const unsigned AppTypeSize =
*0fca6ea1SDimitry Andric          typeFromFTValueType(static_cast<FTValueType>(VT), Context)
*0fca6ea1SDimitry Andric              ->getScalarSizeInBits();
*0fca6ea1SDimitry Andric      const unsigned ShadowTypeSize =
*0fca6ea1SDimitry Andric          Config->getType(Context)->getScalarSizeInBits();
*0fca6ea1SDimitry Andric      // Check that the shadow type size is at most kShadowScale times the
*0fca6ea1SDimitry Andric      // application type size, so that shadow memory compoutations are valid.
*0fca6ea1SDimitry Andric      if (ShadowTypeSize > kShadowScale * AppTypeSize)
*0fca6ea1SDimitry Andric        report_fatal_error("Invalid nsan mapping f" + Twine(AppTypeSize) +
*0fca6ea1SDimitry Andric                           "->f" + Twine(ShadowTypeSize) +
*0fca6ea1SDimitry Andric                           ": The shadow type size should be at most " +
*0fca6ea1SDimitry Andric                           Twine(kShadowScale) +
*0fca6ea1SDimitry Andric                           " times the application type size");
*0fca6ea1SDimitry Andric      ShadowTypeSizeBits[VT] = ShadowTypeSize;
*0fca6ea1SDimitry Andric      Configs[VT] = std::move(Config);
*0fca6ea1SDimitry Andric    }
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric    // Check that the mapping is monotonous. This is required because if one
*0fca6ea1SDimitry Andric    // does an fpextend of `float->long double` in application code, nsan is
*0fca6ea1SDimitry Andric    // going to do an fpextend of `shadow(float) -> shadow(long double)` in
*0fca6ea1SDimitry Andric    // shadow code. This will fail in `qql` mode, since nsan would be
*0fca6ea1SDimitry Andric    // fpextending `f128->long`, which is invalid.
*0fca6ea1SDimitry Andric    // TODO: Relax this.
*0fca6ea1SDimitry Andric    if (ShadowTypeSizeBits[kFloat] > ShadowTypeSizeBits[kDouble] ||
*0fca6ea1SDimitry Andric        ShadowTypeSizeBits[kDouble] > ShadowTypeSizeBits[kLongDouble])
*0fca6ea1SDimitry Andric      report_fatal_error("Invalid nsan mapping: { float->f" +
*0fca6ea1SDimitry Andric                         Twine(ShadowTypeSizeBits[kFloat]) + "; double->f" +
*0fca6ea1SDimitry Andric                         Twine(ShadowTypeSizeBits[kDouble]) +
*0fca6ea1SDimitry Andric                         "; long double->f" +
*0fca6ea1SDimitry Andric                         Twine(ShadowTypeSizeBits[kLongDouble]) + " }");
*0fca6ea1SDimitry Andric  }
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric  const ShadowTypeConfig &byValueType(FTValueType VT) const {
*0fca6ea1SDimitry Andric    assert(VT < FTValueType::kNumValueTypes && "invalid value type");
*0fca6ea1SDimitry Andric    return *Configs[VT];
*0fca6ea1SDimitry Andric  }
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric  // Returns the extended shadow type for a given application type.
*0fca6ea1SDimitry Andric  Type *getExtendedFPType(Type *FT) const {
*0fca6ea1SDimitry Andric    if (const auto VT = ftValueTypeFromType(FT))
*0fca6ea1SDimitry Andric      return Configs[*VT]->getType(Context);
*0fca6ea1SDimitry Andric    if (FT->isVectorTy()) {
*0fca6ea1SDimitry Andric      auto *VecTy = cast<VectorType>(FT);
*0fca6ea1SDimitry Andric      // TODO: add support for scalable vector types.
*0fca6ea1SDimitry Andric      if (VecTy->isScalableTy())
*0fca6ea1SDimitry Andric        return nullptr;
*0fca6ea1SDimitry Andric      Type *ExtendedScalar = getExtendedFPType(VecTy->getElementType());
*0fca6ea1SDimitry Andric      return ExtendedScalar
*0fca6ea1SDimitry Andric                 ? VectorType::get(ExtendedScalar, VecTy->getElementCount())
*0fca6ea1SDimitry Andric                 : nullptr;
*0fca6ea1SDimitry Andric    }
*0fca6ea1SDimitry Andric    return nullptr;
*0fca6ea1SDimitry Andric  }
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andricprivate:
*0fca6ea1SDimitry Andric  LLVMContext &Context;
*0fca6ea1SDimitry Andric  std::unique_ptr<ShadowTypeConfig> Configs[FTValueType::kNumValueTypes];
*0fca6ea1SDimitry Andric};
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric// The memory extents of a type specifies how many elements of a given
*0fca6ea1SDimitry Andric// FTValueType needs to be stored when storing this type.
*0fca6ea1SDimitry Andricstruct MemoryExtents {
*0fca6ea1SDimitry Andric  FTValueType ValueType;
*0fca6ea1SDimitry Andric  uint64_t NumElts;
*0fca6ea1SDimitry Andric};
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andricstatic MemoryExtents getMemoryExtentsOrDie(Type *FT) {
*0fca6ea1SDimitry Andric  if (const auto VT = ftValueTypeFromType(FT))
*0fca6ea1SDimitry Andric    return {*VT, 1};
*0fca6ea1SDimitry Andric  if (auto *VecTy = dyn_cast<VectorType>(FT)) {
*0fca6ea1SDimitry Andric    const auto ScalarExtents = getMemoryExtentsOrDie(VecTy->getElementType());
*0fca6ea1SDimitry Andric    return {ScalarExtents.ValueType,
*0fca6ea1SDimitry Andric            ScalarExtents.NumElts * VecTy->getElementCount().getFixedValue()};
*0fca6ea1SDimitry Andric  }
*0fca6ea1SDimitry Andric  llvm_unreachable("invalid value type");
*0fca6ea1SDimitry Andric}
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric// The location of a check. Passed as parameters to runtime checking functions.
*0fca6ea1SDimitry Andricclass CheckLoc {
*0fca6ea1SDimitry Andricpublic:
*0fca6ea1SDimitry Andric  // Creates a location that references an application memory location.
*0fca6ea1SDimitry Andric  static CheckLoc makeStore(Value *Address) {
*0fca6ea1SDimitry Andric    CheckLoc Result(kStore);
*0fca6ea1SDimitry Andric    Result.Address = Address;
*0fca6ea1SDimitry Andric    return Result;
*0fca6ea1SDimitry Andric  }
*0fca6ea1SDimitry Andric  static CheckLoc makeLoad(Value *Address) {
*0fca6ea1SDimitry Andric    CheckLoc Result(kLoad);
*0fca6ea1SDimitry Andric    Result.Address = Address;
*0fca6ea1SDimitry Andric    return Result;
*0fca6ea1SDimitry Andric  }
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric  // Creates a location that references an argument, given by id.
*0fca6ea1SDimitry Andric  static CheckLoc makeArg(int ArgId) {
*0fca6ea1SDimitry Andric    CheckLoc Result(kArg);
*0fca6ea1SDimitry Andric    Result.ArgId = ArgId;
*0fca6ea1SDimitry Andric    return Result;
*0fca6ea1SDimitry Andric  }
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric  // Creates a location that references the return value of a function.
*0fca6ea1SDimitry Andric  static CheckLoc makeRet() { return CheckLoc(kRet); }
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric  // Creates a location that references a vector insert.
*0fca6ea1SDimitry Andric  static CheckLoc makeInsert() { return CheckLoc(kInsert); }
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric  // Returns the CheckType of location this refers to, as an integer-typed LLVM
*0fca6ea1SDimitry Andric  // IR value.
*0fca6ea1SDimitry Andric  Value *getType(LLVMContext &C) const {
*0fca6ea1SDimitry Andric    return ConstantInt::get(Type::getInt32Ty(C), static_cast<int>(CheckTy));
*0fca6ea1SDimitry Andric  }
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric  // Returns a CheckType-specific value representing details of the location
*0fca6ea1SDimitry Andric  // (e.g. application address for loads or stores), as an `IntptrTy`-typed LLVM
*0fca6ea1SDimitry Andric  // IR value.
*0fca6ea1SDimitry Andric  Value *getValue(Type *IntptrTy, IRBuilder<> &Builder) const {
*0fca6ea1SDimitry Andric    switch (CheckTy) {
*0fca6ea1SDimitry Andric    case kUnknown:
*0fca6ea1SDimitry Andric      llvm_unreachable("unknown type");
*0fca6ea1SDimitry Andric    case kRet:
*0fca6ea1SDimitry Andric    case kInsert:
*0fca6ea1SDimitry Andric      return ConstantInt::get(IntptrTy, 0);
*0fca6ea1SDimitry Andric    case kArg:
*0fca6ea1SDimitry Andric      return ConstantInt::get(IntptrTy, ArgId);
*0fca6ea1SDimitry Andric    case kLoad:
*0fca6ea1SDimitry Andric    case kStore:
*0fca6ea1SDimitry Andric      return Builder.CreatePtrToInt(Address, IntptrTy);
*0fca6ea1SDimitry Andric    }
*0fca6ea1SDimitry Andric    llvm_unreachable("Unhandled CheckType enum");
*0fca6ea1SDimitry Andric  }
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andricprivate:
*0fca6ea1SDimitry Andric  // Must be kept in sync with the runtime,
*0fca6ea1SDimitry Andric  // see compiler-rt/lib/nsan/nsan_stats.h
*0fca6ea1SDimitry Andric  enum CheckType {
*0fca6ea1SDimitry Andric    kUnknown = 0,
*0fca6ea1SDimitry Andric    kRet,
*0fca6ea1SDimitry Andric    kArg,
*0fca6ea1SDimitry Andric    kLoad,
*0fca6ea1SDimitry Andric    kStore,
*0fca6ea1SDimitry Andric    kInsert,
*0fca6ea1SDimitry Andric  };
*0fca6ea1SDimitry Andric  explicit CheckLoc(CheckType CheckTy) : CheckTy(CheckTy) {}
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric  Value *Address = nullptr;
*0fca6ea1SDimitry Andric  const CheckType CheckTy;
*0fca6ea1SDimitry Andric  int ArgId = -1;
*0fca6ea1SDimitry Andric};
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric// A map of LLVM IR values to shadow LLVM IR values.
*0fca6ea1SDimitry Andricclass ValueToShadowMap {
*0fca6ea1SDimitry Andricpublic:
*0fca6ea1SDimitry Andric  explicit ValueToShadowMap(const MappingConfig &Config) : Config(Config) {}
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric  ValueToShadowMap(const ValueToShadowMap &) = delete;
*0fca6ea1SDimitry Andric  ValueToShadowMap &operator=(const ValueToShadowMap &) = delete;
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric  // Sets the shadow value for a value. Asserts that the value does not already
*0fca6ea1SDimitry Andric  // have a value.
*0fca6ea1SDimitry Andric  void setShadow(Value &V, Value &Shadow) {
*0fca6ea1SDimitry Andric    [[maybe_unused]] const bool Inserted = Map.try_emplace(&V, &Shadow).second;
*0fca6ea1SDimitry Andric    LLVM_DEBUG({
*0fca6ea1SDimitry Andric      if (!Inserted) {
*0fca6ea1SDimitry Andric        if (auto *I = dyn_cast<Instruction>(&V))
*0fca6ea1SDimitry Andric          errs() << I->getFunction()->getName() << ": ";
*0fca6ea1SDimitry Andric        errs() << "duplicate shadow (" << &V << "): ";
*0fca6ea1SDimitry Andric        V.dump();
*0fca6ea1SDimitry Andric      }
*0fca6ea1SDimitry Andric    });
*0fca6ea1SDimitry Andric    assert(Inserted && "duplicate shadow");
*0fca6ea1SDimitry Andric  }
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric  // Returns true if the value already has a shadow (including if the value is a
*0fca6ea1SDimitry Andric  // constant). If true, calling getShadow() is valid.
*0fca6ea1SDimitry Andric  bool hasShadow(Value *V) const {
*0fca6ea1SDimitry Andric    return isa<Constant>(V) || (Map.find(V) != Map.end());
*0fca6ea1SDimitry Andric  }
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric  // Returns the shadow value for a given value. Asserts that the value has
*0fca6ea1SDimitry Andric  // a shadow value. Lazily creates shadows for constant values.
*0fca6ea1SDimitry Andric  Value *getShadow(Value *V) const {
*0fca6ea1SDimitry Andric    if (Constant *C = dyn_cast<Constant>(V))
*0fca6ea1SDimitry Andric      return getShadowConstant(C);
*0fca6ea1SDimitry Andric    return Map.find(V)->second;
*0fca6ea1SDimitry Andric  }
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric  bool empty() const { return Map.empty(); }
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andricprivate:
*0fca6ea1SDimitry Andric  // Extends a constant application value to its shadow counterpart.
*0fca6ea1SDimitry Andric  APFloat extendConstantFP(APFloat CV, const fltSemantics &To) const {
*0fca6ea1SDimitry Andric    bool LosesInfo = false;
*0fca6ea1SDimitry Andric    CV.convert(To, APFloatBase::rmTowardZero, &LosesInfo);
*0fca6ea1SDimitry Andric    return CV;
*0fca6ea1SDimitry Andric  }
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric  // Returns the shadow constant for the given application constant.
*0fca6ea1SDimitry Andric  Constant *getShadowConstant(Constant *C) const {
*0fca6ea1SDimitry Andric    if (UndefValue *U = dyn_cast<UndefValue>(C)) {
*0fca6ea1SDimitry Andric      return UndefValue::get(Config.getExtendedFPType(U->getType()));
*0fca6ea1SDimitry Andric    }
*0fca6ea1SDimitry Andric    if (ConstantFP *CFP = dyn_cast<ConstantFP>(C)) {
*0fca6ea1SDimitry Andric      // Floating-point constants.
*0fca6ea1SDimitry Andric      Type *Ty = Config.getExtendedFPType(CFP->getType());
*0fca6ea1SDimitry Andric      return ConstantFP::get(
*0fca6ea1SDimitry Andric          Ty, extendConstantFP(CFP->getValueAPF(), Ty->getFltSemantics()));
*0fca6ea1SDimitry Andric    }
*0fca6ea1SDimitry Andric    // Vector, array, or aggregate constants.
*0fca6ea1SDimitry Andric    if (C->getType()->isVectorTy()) {
*0fca6ea1SDimitry Andric      SmallVector<Constant *, 8> Elements;
*0fca6ea1SDimitry Andric      for (int I = 0, E = cast<VectorType>(C->getType())
*0fca6ea1SDimitry Andric                              ->getElementCount()
*0fca6ea1SDimitry Andric                              .getFixedValue();
*0fca6ea1SDimitry Andric           I < E; ++I)
*0fca6ea1SDimitry Andric        Elements.push_back(getShadowConstant(C->getAggregateElement(I)));
*0fca6ea1SDimitry Andric      return ConstantVector::get(Elements);
*0fca6ea1SDimitry Andric    }
*0fca6ea1SDimitry Andric    llvm_unreachable("unimplemented");
*0fca6ea1SDimitry Andric  }
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric  const MappingConfig &Config;
*0fca6ea1SDimitry Andric  DenseMap<Value *, Value *> Map;
*0fca6ea1SDimitry Andric};
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric/// Instantiating NumericalStabilitySanitizer inserts the nsan runtime library
*0fca6ea1SDimitry Andric/// API function declarations into the module if they don't exist already.
*0fca6ea1SDimitry Andric/// Instantiating ensures the __nsan_init function is in the list of global
*0fca6ea1SDimitry Andric/// constructors for the module.
*0fca6ea1SDimitry Andricclass NumericalStabilitySanitizer {
*0fca6ea1SDimitry Andricpublic:
*0fca6ea1SDimitry Andric  NumericalStabilitySanitizer(Module &M);
*0fca6ea1SDimitry Andric  bool sanitizeFunction(Function &F, const TargetLibraryInfo &TLI);
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andricprivate:
*0fca6ea1SDimitry Andric  bool instrumentMemIntrinsic(MemIntrinsic *MI);
*0fca6ea1SDimitry Andric  void maybeAddSuffixForNsanInterface(CallBase *CI);
*0fca6ea1SDimitry Andric  bool addrPointsToConstantData(Value *Addr);
*0fca6ea1SDimitry Andric  void maybeCreateShadowValue(Instruction &Root, const TargetLibraryInfo &TLI,
*0fca6ea1SDimitry Andric                              ValueToShadowMap &Map);
*0fca6ea1SDimitry Andric  Value *createShadowValueWithOperandsAvailable(Instruction &Inst,
*0fca6ea1SDimitry Andric                                                const TargetLibraryInfo &TLI,
*0fca6ea1SDimitry Andric                                                const ValueToShadowMap &Map);
*0fca6ea1SDimitry Andric  PHINode *maybeCreateShadowPhi(PHINode &Phi, const TargetLibraryInfo &TLI);
*0fca6ea1SDimitry Andric  void createShadowArguments(Function &F, const TargetLibraryInfo &TLI,
*0fca6ea1SDimitry Andric                             ValueToShadowMap &Map);
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric  void populateShadowStack(CallBase &CI, const TargetLibraryInfo &TLI,
*0fca6ea1SDimitry Andric                           const ValueToShadowMap &Map);
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric  void propagateShadowValues(Instruction &Inst, const TargetLibraryInfo &TLI,
*0fca6ea1SDimitry Andric                             const ValueToShadowMap &Map);
*0fca6ea1SDimitry Andric  Value *emitCheck(Value *V, Value *ShadowV, IRBuilder<> &Builder,
*0fca6ea1SDimitry Andric                   CheckLoc Loc);
*0fca6ea1SDimitry Andric  Value *emitCheckInternal(Value *V, Value *ShadowV, IRBuilder<> &Builder,
*0fca6ea1SDimitry Andric                           CheckLoc Loc);
*0fca6ea1SDimitry Andric  void emitFCmpCheck(FCmpInst &FCmp, const ValueToShadowMap &Map);
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric  // Value creation handlers.
*0fca6ea1SDimitry Andric  Value *handleLoad(LoadInst &Load, Type *VT, Type *ExtendedVT);
*0fca6ea1SDimitry Andric  Value *handleCallBase(CallBase &Call, Type *VT, Type *ExtendedVT,
*0fca6ea1SDimitry Andric                        const TargetLibraryInfo &TLI,
*0fca6ea1SDimitry Andric                        const ValueToShadowMap &Map, IRBuilder<> &Builder);
*0fca6ea1SDimitry Andric  Value *maybeHandleKnownCallBase(CallBase &Call, Type *VT, Type *ExtendedVT,
*0fca6ea1SDimitry Andric                                  const TargetLibraryInfo &TLI,
*0fca6ea1SDimitry Andric                                  const ValueToShadowMap &Map,
*0fca6ea1SDimitry Andric                                  IRBuilder<> &Builder);
*0fca6ea1SDimitry Andric  Value *handleTrunc(const FPTruncInst &Trunc, Type *VT, Type *ExtendedVT,
*0fca6ea1SDimitry Andric                     const ValueToShadowMap &Map, IRBuilder<> &Builder);
*0fca6ea1SDimitry Andric  Value *handleExt(const FPExtInst &Ext, Type *VT, Type *ExtendedVT,
*0fca6ea1SDimitry Andric                   const ValueToShadowMap &Map, IRBuilder<> &Builder);
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric  // Value propagation handlers.
*0fca6ea1SDimitry Andric  void propagateFTStore(StoreInst &Store, Type *VT, Type *ExtendedVT,
*0fca6ea1SDimitry Andric                        const ValueToShadowMap &Map);
*0fca6ea1SDimitry Andric  void propagateNonFTStore(StoreInst &Store, Type *VT,
*0fca6ea1SDimitry Andric                           const ValueToShadowMap &Map);
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric  const DataLayout &DL;
*0fca6ea1SDimitry Andric  LLVMContext &Context;
*0fca6ea1SDimitry Andric  MappingConfig Config;
*0fca6ea1SDimitry Andric  IntegerType *IntptrTy = nullptr;
*0fca6ea1SDimitry Andric  FunctionCallee NsanGetShadowPtrForStore[FTValueType::kNumValueTypes] = {};
*0fca6ea1SDimitry Andric  FunctionCallee NsanGetShadowPtrForLoad[FTValueType::kNumValueTypes] = {};
*0fca6ea1SDimitry Andric  FunctionCallee NsanCheckValue[FTValueType::kNumValueTypes] = {};
*0fca6ea1SDimitry Andric  FunctionCallee NsanFCmpFail[FTValueType::kNumValueTypes] = {};
*0fca6ea1SDimitry Andric  FunctionCallee NsanCopyValues;
*0fca6ea1SDimitry Andric  FunctionCallee NsanSetValueUnknown;
*0fca6ea1SDimitry Andric  FunctionCallee NsanGetRawShadowTypePtr;
*0fca6ea1SDimitry Andric  FunctionCallee NsanGetRawShadowPtr;
*0fca6ea1SDimitry Andric  GlobalValue *NsanShadowRetTag = nullptr;
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric  Type *NsanShadowRetType = nullptr;
*0fca6ea1SDimitry Andric  GlobalValue *NsanShadowRetPtr = nullptr;
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric  GlobalValue *NsanShadowArgsTag = nullptr;
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric  Type *NsanShadowArgsType = nullptr;
*0fca6ea1SDimitry Andric  GlobalValue *NsanShadowArgsPtr = nullptr;
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric  std::optional<Regex> CheckFunctionsFilter;
*0fca6ea1SDimitry Andric};
*0fca6ea1SDimitry Andric} // end anonymous namespace
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry AndricPreservedAnalyses
*0fca6ea1SDimitry AndricNumericalStabilitySanitizerPass::run(Module &M, ModuleAnalysisManager &MAM) {
*0fca6ea1SDimitry Andric  getOrCreateSanitizerCtorAndInitFunctions(
*0fca6ea1SDimitry Andric      M, kNsanModuleCtorName, kNsanInitName, /*InitArgTypes=*/{},
*0fca6ea1SDimitry Andric      /*InitArgs=*/{},
*0fca6ea1SDimitry Andric      // This callback is invoked when the functions are created the first
*0fca6ea1SDimitry Andric      // time. Hook them into the global ctors list in that case:
*0fca6ea1SDimitry Andric      [&](Function *Ctor, FunctionCallee) { appendToGlobalCtors(M, Ctor, 0); });
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric  NumericalStabilitySanitizer Nsan(M);
*0fca6ea1SDimitry Andric  auto &FAM = MAM.getResult<FunctionAnalysisManagerModuleProxy>(M).getManager();
*0fca6ea1SDimitry Andric  for (Function &F : M)
*0fca6ea1SDimitry Andric    Nsan.sanitizeFunction(F, FAM.getResult<TargetLibraryAnalysis>(F));
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric  return PreservedAnalyses::none();
*0fca6ea1SDimitry Andric}
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andricstatic GlobalValue *createThreadLocalGV(const char *Name, Module &M, Type *Ty) {
*0fca6ea1SDimitry Andric  return dyn_cast<GlobalValue>(M.getOrInsertGlobal(Name, Ty, [&M, Ty, Name] {
*0fca6ea1SDimitry Andric    return new GlobalVariable(M, Ty, false, GlobalVariable::ExternalLinkage,
*0fca6ea1SDimitry Andric                              nullptr, Name, nullptr,
*0fca6ea1SDimitry Andric                              GlobalVariable::InitialExecTLSModel);
*0fca6ea1SDimitry Andric  }));
*0fca6ea1SDimitry Andric}
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry AndricNumericalStabilitySanitizer::NumericalStabilitySanitizer(Module &M)
*0fca6ea1SDimitry Andric    : DL(M.getDataLayout()), Context(M.getContext()), Config(Context) {
*0fca6ea1SDimitry Andric  IntptrTy = DL.getIntPtrType(Context);
*0fca6ea1SDimitry Andric  Type *PtrTy = PointerType::getUnqual(Context);
*0fca6ea1SDimitry Andric  Type *Int32Ty = Type::getInt32Ty(Context);
*0fca6ea1SDimitry Andric  Type *Int1Ty = Type::getInt1Ty(Context);
*0fca6ea1SDimitry Andric  Type *VoidTy = Type::getVoidTy(Context);
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric  AttributeList Attr;
*0fca6ea1SDimitry Andric  Attr = Attr.addFnAttribute(Context, Attribute::NoUnwind);
*0fca6ea1SDimitry Andric  // Initialize the runtime values (functions and global variables).
*0fca6ea1SDimitry Andric  for (int I = 0; I < kNumValueTypes; ++I) {
*0fca6ea1SDimitry Andric    const FTValueType VT = static_cast<FTValueType>(I);
*0fca6ea1SDimitry Andric    const char *VTName = typeNameFromFTValueType(VT);
*0fca6ea1SDimitry Andric    Type *VTTy = typeFromFTValueType(VT, Context);
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric    // Load/store.
*0fca6ea1SDimitry Andric    const std::string GetterPrefix =
*0fca6ea1SDimitry Andric        std::string("__nsan_get_shadow_ptr_for_") + VTName;
*0fca6ea1SDimitry Andric    NsanGetShadowPtrForStore[VT] = M.getOrInsertFunction(
*0fca6ea1SDimitry Andric        GetterPrefix + "_store", Attr, PtrTy, PtrTy, IntptrTy);
*0fca6ea1SDimitry Andric    NsanGetShadowPtrForLoad[VT] = M.getOrInsertFunction(
*0fca6ea1SDimitry Andric        GetterPrefix + "_load", Attr, PtrTy, PtrTy, IntptrTy);
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric    // Check.
*0fca6ea1SDimitry Andric    const auto &ShadowConfig = Config.byValueType(VT);
*0fca6ea1SDimitry Andric    Type *ShadowTy = ShadowConfig.getType(Context);
*0fca6ea1SDimitry Andric    NsanCheckValue[VT] =
*0fca6ea1SDimitry Andric        M.getOrInsertFunction(std::string("__nsan_internal_check_") + VTName +
*0fca6ea1SDimitry Andric                                  "_" + ShadowConfig.getNsanTypeId(),
*0fca6ea1SDimitry Andric                              Attr, Int32Ty, VTTy, ShadowTy, Int32Ty, IntptrTy);
*0fca6ea1SDimitry Andric    NsanFCmpFail[VT] = M.getOrInsertFunction(
*0fca6ea1SDimitry Andric        std::string("__nsan_fcmp_fail_") + VTName + "_" +
*0fca6ea1SDimitry Andric            ShadowConfig.getNsanTypeId(),
*0fca6ea1SDimitry Andric        Attr, VoidTy, VTTy, VTTy, ShadowTy, ShadowTy, Int32Ty, Int1Ty, Int1Ty);
*0fca6ea1SDimitry Andric  }
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric  NsanCopyValues = M.getOrInsertFunction("__nsan_copy_values", Attr, VoidTy,
*0fca6ea1SDimitry Andric                                         PtrTy, PtrTy, IntptrTy);
*0fca6ea1SDimitry Andric  NsanSetValueUnknown = M.getOrInsertFunction("__nsan_set_value_unknown", Attr,
*0fca6ea1SDimitry Andric                                              VoidTy, PtrTy, IntptrTy);
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric  // TODO: Add attributes nofree, nosync, readnone, readonly,
*0fca6ea1SDimitry Andric  NsanGetRawShadowTypePtr = M.getOrInsertFunction(
*0fca6ea1SDimitry Andric      "__nsan_internal_get_raw_shadow_type_ptr", Attr, PtrTy, PtrTy);
*0fca6ea1SDimitry Andric  NsanGetRawShadowPtr = M.getOrInsertFunction(
*0fca6ea1SDimitry Andric      "__nsan_internal_get_raw_shadow_ptr", Attr, PtrTy, PtrTy);
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric  NsanShadowRetTag = createThreadLocalGV("__nsan_shadow_ret_tag", M, IntptrTy);
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric  NsanShadowRetType = ArrayType::get(Type::getInt8Ty(Context),
*0fca6ea1SDimitry Andric                                     kMaxVectorWidth * kMaxShadowTypeSizeBytes);
*0fca6ea1SDimitry Andric  NsanShadowRetPtr =
*0fca6ea1SDimitry Andric      createThreadLocalGV("__nsan_shadow_ret_ptr", M, NsanShadowRetType);
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric  NsanShadowArgsTag =
*0fca6ea1SDimitry Andric      createThreadLocalGV("__nsan_shadow_args_tag", M, IntptrTy);
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric  NsanShadowArgsType =
*0fca6ea1SDimitry Andric      ArrayType::get(Type::getInt8Ty(Context),
*0fca6ea1SDimitry Andric                     kMaxVectorWidth * kMaxNumArgs * kMaxShadowTypeSizeBytes);
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric  NsanShadowArgsPtr =
*0fca6ea1SDimitry Andric      createThreadLocalGV("__nsan_shadow_args_ptr", M, NsanShadowArgsType);
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric  if (!ClCheckFunctionsFilter.empty()) {
*0fca6ea1SDimitry Andric    Regex R = Regex(ClCheckFunctionsFilter);
*0fca6ea1SDimitry Andric    std::string RegexError;
*0fca6ea1SDimitry Andric    assert(R.isValid(RegexError));
*0fca6ea1SDimitry Andric    CheckFunctionsFilter = std::move(R);
*0fca6ea1SDimitry Andric  }
*0fca6ea1SDimitry Andric}
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric// Returns true if the given LLVM Value points to constant data (typically, a
*0fca6ea1SDimitry Andric// global variable reference).
*0fca6ea1SDimitry Andricbool NumericalStabilitySanitizer::addrPointsToConstantData(Value *Addr) {
*0fca6ea1SDimitry Andric  // If this is a GEP, just analyze its pointer operand.
*0fca6ea1SDimitry Andric  if (GetElementPtrInst *GEP = dyn_cast<GetElementPtrInst>(Addr))
*0fca6ea1SDimitry Andric    Addr = GEP->getPointerOperand();
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric  if (GlobalVariable *GV = dyn_cast<GlobalVariable>(Addr))
*0fca6ea1SDimitry Andric    return GV->isConstant();
*0fca6ea1SDimitry Andric  return false;
*0fca6ea1SDimitry Andric}
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric// This instruments the function entry to create shadow arguments.
*0fca6ea1SDimitry Andric// Pseudocode:
*0fca6ea1SDimitry Andric//   if (this_fn_ptr == __nsan_shadow_args_tag) {
*0fca6ea1SDimitry Andric//     s(arg0) = LOAD<sizeof(arg0)>(__nsan_shadow_args);
*0fca6ea1SDimitry Andric//     s(arg1) = LOAD<sizeof(arg1)>(__nsan_shadow_args + sizeof(arg0));
*0fca6ea1SDimitry Andric//     ...
*0fca6ea1SDimitry Andric//     __nsan_shadow_args_tag = 0;
*0fca6ea1SDimitry Andric//   } else {
*0fca6ea1SDimitry Andric//     s(arg0) = fext(arg0);
*0fca6ea1SDimitry Andric//     s(arg1) = fext(arg1);
*0fca6ea1SDimitry Andric//     ...
*0fca6ea1SDimitry Andric//   }
*0fca6ea1SDimitry Andricvoid NumericalStabilitySanitizer::createShadowArguments(
*0fca6ea1SDimitry Andric    Function &F, const TargetLibraryInfo &TLI, ValueToShadowMap &Map) {
*0fca6ea1SDimitry Andric  assert(!F.getIntrinsicID() && "found a definition of an intrinsic");
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric  // Do not bother if there are no FP args.
*0fca6ea1SDimitry Andric  if (all_of(F.args(), [this](const Argument &Arg) {
*0fca6ea1SDimitry Andric        return Config.getExtendedFPType(Arg.getType()) == nullptr;
*0fca6ea1SDimitry Andric      }))
*0fca6ea1SDimitry Andric    return;
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric  IRBuilder<> Builder(F.getEntryBlock().getFirstNonPHI());
*0fca6ea1SDimitry Andric  // The function has shadow args if the shadow args tag matches the function
*0fca6ea1SDimitry Andric  // address.
*0fca6ea1SDimitry Andric  Value *HasShadowArgs = Builder.CreateICmpEQ(
*0fca6ea1SDimitry Andric      Builder.CreateLoad(IntptrTy, NsanShadowArgsTag, /*isVolatile=*/false),
*0fca6ea1SDimitry Andric      Builder.CreatePtrToInt(&F, IntptrTy));
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric  unsigned ShadowArgsOffsetBytes = 0;
*0fca6ea1SDimitry Andric  for (Argument &Arg : F.args()) {
*0fca6ea1SDimitry Andric    Type *VT = Arg.getType();
*0fca6ea1SDimitry Andric    Type *ExtendedVT = Config.getExtendedFPType(VT);
*0fca6ea1SDimitry Andric    if (ExtendedVT == nullptr)
*0fca6ea1SDimitry Andric      continue; // Not an FT value.
*0fca6ea1SDimitry Andric    Value *L = Builder.CreateAlignedLoad(
*0fca6ea1SDimitry Andric        ExtendedVT,
*0fca6ea1SDimitry Andric        Builder.CreateConstGEP2_64(NsanShadowArgsType, NsanShadowArgsPtr, 0,
*0fca6ea1SDimitry Andric                                   ShadowArgsOffsetBytes),
*0fca6ea1SDimitry Andric        Align(1), /*isVolatile=*/false);
*0fca6ea1SDimitry Andric    Value *Shadow = Builder.CreateSelect(HasShadowArgs, L,
*0fca6ea1SDimitry Andric                                         Builder.CreateFPExt(&Arg, ExtendedVT));
*0fca6ea1SDimitry Andric    Map.setShadow(Arg, *Shadow);
*0fca6ea1SDimitry Andric    TypeSize SlotSize = DL.getTypeStoreSize(ExtendedVT);
*0fca6ea1SDimitry Andric    assert(!SlotSize.isScalable() && "unsupported");
*0fca6ea1SDimitry Andric    ShadowArgsOffsetBytes += SlotSize;
*0fca6ea1SDimitry Andric  }
*0fca6ea1SDimitry Andric  Builder.CreateStore(ConstantInt::get(IntptrTy, 0), NsanShadowArgsTag);
*0fca6ea1SDimitry Andric}
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric// Returns true if the instrumentation should emit code to check arguments
*0fca6ea1SDimitry Andric// before a function call.
*0fca6ea1SDimitry Andricstatic bool shouldCheckArgs(CallBase &CI, const TargetLibraryInfo &TLI,
*0fca6ea1SDimitry Andric                            const std::optional<Regex> &CheckFunctionsFilter) {
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric  Function *Fn = CI.getCalledFunction();
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric  if (CheckFunctionsFilter) {
*0fca6ea1SDimitry Andric    // Skip checking args of indirect calls.
*0fca6ea1SDimitry Andric    if (Fn == nullptr)
*0fca6ea1SDimitry Andric      return false;
*0fca6ea1SDimitry Andric    if (CheckFunctionsFilter->match(Fn->getName()))
*0fca6ea1SDimitry Andric      return true;
*0fca6ea1SDimitry Andric    return false;
*0fca6ea1SDimitry Andric  }
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric  if (Fn == nullptr)
*0fca6ea1SDimitry Andric    return true; // Always check args of indirect calls.
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric  // Never check nsan functions, the user called them for a reason.
*0fca6ea1SDimitry Andric  if (Fn->getName().starts_with("__nsan_"))
*0fca6ea1SDimitry Andric    return false;
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric  const auto ID = Fn->getIntrinsicID();
*0fca6ea1SDimitry Andric  LibFunc LFunc = LibFunc::NumLibFuncs;
*0fca6ea1SDimitry Andric  // Always check args of unknown functions.
*0fca6ea1SDimitry Andric  if (ID == Intrinsic::ID() && !TLI.getLibFunc(*Fn, LFunc))
*0fca6ea1SDimitry Andric    return true;
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric  // Do not check args of an `fabs` call that is used for a comparison.
*0fca6ea1SDimitry Andric  // This is typically used for `fabs(a-b) < tolerance`, where what matters is
*0fca6ea1SDimitry Andric  // the result of the comparison, which is already caught be the fcmp checks.
*0fca6ea1SDimitry Andric  if (ID == Intrinsic::fabs || LFunc == LibFunc_fabsf ||
*0fca6ea1SDimitry Andric      LFunc == LibFunc_fabs || LFunc == LibFunc_fabsl)
*0fca6ea1SDimitry Andric    for (const auto &U : CI.users())
*0fca6ea1SDimitry Andric      if (isa<CmpInst>(U))
*0fca6ea1SDimitry Andric        return false;
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric  return true; // Default is check.
*0fca6ea1SDimitry Andric}
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric// Populates the shadow call stack (which contains shadow values for every
*0fca6ea1SDimitry Andric// floating-point parameter to the function).
*0fca6ea1SDimitry Andricvoid NumericalStabilitySanitizer::populateShadowStack(
*0fca6ea1SDimitry Andric    CallBase &CI, const TargetLibraryInfo &TLI, const ValueToShadowMap &Map) {
*0fca6ea1SDimitry Andric  // Do not create a shadow stack for inline asm.
*0fca6ea1SDimitry Andric  if (CI.isInlineAsm())
*0fca6ea1SDimitry Andric    return;
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric  // Do not bother if there are no FP args.
*0fca6ea1SDimitry Andric  if (all_of(CI.operands(), [this](const Value *Arg) {
*0fca6ea1SDimitry Andric        return Config.getExtendedFPType(Arg->getType()) == nullptr;
*0fca6ea1SDimitry Andric      }))
*0fca6ea1SDimitry Andric    return;
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric  IRBuilder<> Builder(&CI);
*0fca6ea1SDimitry Andric  SmallVector<Value *, 8> ArgShadows;
*0fca6ea1SDimitry Andric  const bool ShouldCheckArgs = shouldCheckArgs(CI, TLI, CheckFunctionsFilter);
*0fca6ea1SDimitry Andric  for (auto [ArgIdx, Arg] : enumerate(CI.operands())) {
*0fca6ea1SDimitry Andric    if (Config.getExtendedFPType(Arg->getType()) == nullptr)
*0fca6ea1SDimitry Andric      continue; // Not an FT value.
*0fca6ea1SDimitry Andric    Value *ArgShadow = Map.getShadow(Arg);
*0fca6ea1SDimitry Andric    ArgShadows.push_back(ShouldCheckArgs ? emitCheck(Arg, ArgShadow, Builder,
*0fca6ea1SDimitry Andric                                                     CheckLoc::makeArg(ArgIdx))
*0fca6ea1SDimitry Andric                                         : ArgShadow);
*0fca6ea1SDimitry Andric  }
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric  // Do not create shadow stacks for intrinsics/known lib funcs.
*0fca6ea1SDimitry Andric  if (Function *Fn = CI.getCalledFunction()) {
*0fca6ea1SDimitry Andric    LibFunc LFunc;
*0fca6ea1SDimitry Andric    if (Fn->isIntrinsic() || TLI.getLibFunc(*Fn, LFunc))
*0fca6ea1SDimitry Andric      return;
*0fca6ea1SDimitry Andric  }
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric  // Set the shadow stack tag.
*0fca6ea1SDimitry Andric  Builder.CreateStore(CI.getCalledOperand(), NsanShadowArgsTag);
*0fca6ea1SDimitry Andric  TypeSize ShadowArgsOffsetBytes = TypeSize::getFixed(0);
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric  unsigned ShadowArgId = 0;
*0fca6ea1SDimitry Andric  for (const Value *Arg : CI.operands()) {
*0fca6ea1SDimitry Andric    Type *VT = Arg->getType();
*0fca6ea1SDimitry Andric    Type *ExtendedVT = Config.getExtendedFPType(VT);
*0fca6ea1SDimitry Andric    if (ExtendedVT == nullptr)
*0fca6ea1SDimitry Andric      continue; // Not an FT value.
*0fca6ea1SDimitry Andric    Builder.CreateAlignedStore(
*0fca6ea1SDimitry Andric        ArgShadows[ShadowArgId++],
*0fca6ea1SDimitry Andric        Builder.CreateConstGEP2_64(NsanShadowArgsType, NsanShadowArgsPtr, 0,
*0fca6ea1SDimitry Andric                                   ShadowArgsOffsetBytes),
*0fca6ea1SDimitry Andric        Align(1), /*isVolatile=*/false);
*0fca6ea1SDimitry Andric    TypeSize SlotSize = DL.getTypeStoreSize(ExtendedVT);
*0fca6ea1SDimitry Andric    assert(!SlotSize.isScalable() && "unsupported");
*0fca6ea1SDimitry Andric    ShadowArgsOffsetBytes += SlotSize;
*0fca6ea1SDimitry Andric  }
*0fca6ea1SDimitry Andric}
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric// Internal part of emitCheck(). Returns a value that indicates whether
*0fca6ea1SDimitry Andric// computation should continue with the shadow or resume by re-fextending the
*0fca6ea1SDimitry Andric// value.
*0fca6ea1SDimitry Andricenum class ContinuationType { // Keep in sync with runtime.
*0fca6ea1SDimitry Andric  ContinueWithShadow = 0,
*0fca6ea1SDimitry Andric  ResumeFromValue = 1,
*0fca6ea1SDimitry Andric};
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry AndricValue *NumericalStabilitySanitizer::emitCheckInternal(Value *V, Value *ShadowV,
*0fca6ea1SDimitry Andric                                                      IRBuilder<> &Builder,
*0fca6ea1SDimitry Andric                                                      CheckLoc Loc) {
*0fca6ea1SDimitry Andric  // Do not emit checks for constant values, this is redundant.
*0fca6ea1SDimitry Andric  if (isa<Constant>(V))
*0fca6ea1SDimitry Andric    return ConstantInt::get(
*0fca6ea1SDimitry Andric        Builder.getInt32Ty(),
*0fca6ea1SDimitry Andric        static_cast<int>(ContinuationType::ContinueWithShadow));
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric  Type *Ty = V->getType();
*0fca6ea1SDimitry Andric  if (const auto VT = ftValueTypeFromType(Ty))
*0fca6ea1SDimitry Andric    return Builder.CreateCall(
*0fca6ea1SDimitry Andric        NsanCheckValue[*VT],
*0fca6ea1SDimitry Andric        {V, ShadowV, Loc.getType(Context), Loc.getValue(IntptrTy, Builder)});
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric  if (Ty->isVectorTy()) {
*0fca6ea1SDimitry Andric    auto *VecTy = cast<VectorType>(Ty);
*0fca6ea1SDimitry Andric    // We currently skip scalable vector types in MappingConfig,
*0fca6ea1SDimitry Andric    // thus we should not encounter any such types here.
*0fca6ea1SDimitry Andric    assert(!VecTy->isScalableTy() &&
*0fca6ea1SDimitry Andric           "Scalable vector types are not supported yet");
*0fca6ea1SDimitry Andric    Value *CheckResult = nullptr;
*0fca6ea1SDimitry Andric    for (int I = 0, E = VecTy->getElementCount().getFixedValue(); I < E; ++I) {
*0fca6ea1SDimitry Andric      // We resume if any element resumes. Another option would be to create a
*0fca6ea1SDimitry Andric      // vector shuffle with the array of ContinueWithShadow, but that is too
*0fca6ea1SDimitry Andric      // complex.
*0fca6ea1SDimitry Andric      Value *ExtractV = Builder.CreateExtractElement(V, I);
*0fca6ea1SDimitry Andric      Value *ExtractShadowV = Builder.CreateExtractElement(ShadowV, I);
*0fca6ea1SDimitry Andric      Value *ComponentCheckResult =
*0fca6ea1SDimitry Andric          emitCheckInternal(ExtractV, ExtractShadowV, Builder, Loc);
*0fca6ea1SDimitry Andric      CheckResult = CheckResult
*0fca6ea1SDimitry Andric                        ? Builder.CreateOr(CheckResult, ComponentCheckResult)
*0fca6ea1SDimitry Andric                        : ComponentCheckResult;
*0fca6ea1SDimitry Andric    }
*0fca6ea1SDimitry Andric    return CheckResult;
*0fca6ea1SDimitry Andric  }
*0fca6ea1SDimitry Andric  if (Ty->isArrayTy()) {
*0fca6ea1SDimitry Andric    Value *CheckResult = nullptr;
*0fca6ea1SDimitry Andric    for (auto I : seq(Ty->getArrayNumElements())) {
*0fca6ea1SDimitry Andric      Value *ExtractV = Builder.CreateExtractElement(V, I);
*0fca6ea1SDimitry Andric      Value *ExtractShadowV = Builder.CreateExtractElement(ShadowV, I);
*0fca6ea1SDimitry Andric      Value *ComponentCheckResult =
*0fca6ea1SDimitry Andric          emitCheckInternal(ExtractV, ExtractShadowV, Builder, Loc);
*0fca6ea1SDimitry Andric      CheckResult = CheckResult
*0fca6ea1SDimitry Andric                        ? Builder.CreateOr(CheckResult, ComponentCheckResult)
*0fca6ea1SDimitry Andric                        : ComponentCheckResult;
*0fca6ea1SDimitry Andric    }
*0fca6ea1SDimitry Andric    return CheckResult;
*0fca6ea1SDimitry Andric  }
*0fca6ea1SDimitry Andric  if (Ty->isStructTy()) {
*0fca6ea1SDimitry Andric    Value *CheckResult = nullptr;
*0fca6ea1SDimitry Andric    for (auto I : seq(Ty->getStructNumElements())) {
*0fca6ea1SDimitry Andric      if (Config.getExtendedFPType(Ty->getStructElementType(I)) == nullptr)
*0fca6ea1SDimitry Andric        continue; // Only check FT values.
*0fca6ea1SDimitry Andric      Value *ExtractV = Builder.CreateExtractValue(V, I);
*0fca6ea1SDimitry Andric      Value *ExtractShadowV = Builder.CreateExtractElement(ShadowV, I);
*0fca6ea1SDimitry Andric      Value *ComponentCheckResult =
*0fca6ea1SDimitry Andric          emitCheckInternal(ExtractV, ExtractShadowV, Builder, Loc);
*0fca6ea1SDimitry Andric      CheckResult = CheckResult
*0fca6ea1SDimitry Andric                        ? Builder.CreateOr(CheckResult, ComponentCheckResult)
*0fca6ea1SDimitry Andric                        : ComponentCheckResult;
*0fca6ea1SDimitry Andric    }
*0fca6ea1SDimitry Andric    if (!CheckResult)
*0fca6ea1SDimitry Andric      return ConstantInt::get(
*0fca6ea1SDimitry Andric          Builder.getInt32Ty(),
*0fca6ea1SDimitry Andric          static_cast<int>(ContinuationType::ContinueWithShadow));
*0fca6ea1SDimitry Andric    return CheckResult;
*0fca6ea1SDimitry Andric  }
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric  llvm_unreachable("not implemented");
*0fca6ea1SDimitry Andric}
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric// Inserts a runtime check of V against its shadow value ShadowV.
*0fca6ea1SDimitry Andric// We check values whenever they escape: on return, call, stores, and
*0fca6ea1SDimitry Andric// insertvalue.
*0fca6ea1SDimitry Andric// Returns the shadow value that should be used to continue the computations,
*0fca6ea1SDimitry Andric// depending on the answer from the runtime.
*0fca6ea1SDimitry Andric// TODO: Should we check on select ? phi ?
*0fca6ea1SDimitry AndricValue *NumericalStabilitySanitizer::emitCheck(Value *V, Value *ShadowV,
*0fca6ea1SDimitry Andric                                              IRBuilder<> &Builder,
*0fca6ea1SDimitry Andric                                              CheckLoc Loc) {
*0fca6ea1SDimitry Andric  // Do not emit checks for constant values, this is redundant.
*0fca6ea1SDimitry Andric  if (isa<Constant>(V))
*0fca6ea1SDimitry Andric    return ShadowV;
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric  if (Instruction *Inst = dyn_cast<Instruction>(V)) {
*0fca6ea1SDimitry Andric    Function *F = Inst->getFunction();
*0fca6ea1SDimitry Andric    if (CheckFunctionsFilter && !CheckFunctionsFilter->match(F->getName())) {
*0fca6ea1SDimitry Andric      return ShadowV;
*0fca6ea1SDimitry Andric    }
*0fca6ea1SDimitry Andric  }
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric  Value *CheckResult = emitCheckInternal(V, ShadowV, Builder, Loc);
*0fca6ea1SDimitry Andric  Value *ICmpEQ = Builder.CreateICmpEQ(
*0fca6ea1SDimitry Andric      CheckResult,
*0fca6ea1SDimitry Andric      ConstantInt::get(Builder.getInt32Ty(),
*0fca6ea1SDimitry Andric                       static_cast<int>(ContinuationType::ResumeFromValue)));
*0fca6ea1SDimitry Andric  return Builder.CreateSelect(
*0fca6ea1SDimitry Andric      ICmpEQ, Builder.CreateFPExt(V, Config.getExtendedFPType(V->getType())),
*0fca6ea1SDimitry Andric      ShadowV);
*0fca6ea1SDimitry Andric}
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric// Inserts a check that fcmp on shadow values are consistent with that on base
*0fca6ea1SDimitry Andric// values.
*0fca6ea1SDimitry Andricvoid NumericalStabilitySanitizer::emitFCmpCheck(FCmpInst &FCmp,
*0fca6ea1SDimitry Andric                                                const ValueToShadowMap &Map) {
*0fca6ea1SDimitry Andric  if (!ClInstrumentFCmp)
*0fca6ea1SDimitry Andric    return;
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric  Function *F = FCmp.getFunction();
*0fca6ea1SDimitry Andric  if (CheckFunctionsFilter && !CheckFunctionsFilter->match(F->getName()))
*0fca6ea1SDimitry Andric    return;
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric  Value *LHS = FCmp.getOperand(0);
*0fca6ea1SDimitry Andric  if (Config.getExtendedFPType(LHS->getType()) == nullptr)
*0fca6ea1SDimitry Andric    return;
*0fca6ea1SDimitry Andric  Value *RHS = FCmp.getOperand(1);
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric  // Split the basic block. On mismatch, we'll jump to the new basic block with
*0fca6ea1SDimitry Andric  // a call to the runtime for error reporting.
*0fca6ea1SDimitry Andric  BasicBlock *FCmpBB = FCmp.getParent();
*0fca6ea1SDimitry Andric  BasicBlock *NextBB = FCmpBB->splitBasicBlock(FCmp.getNextNode());
*0fca6ea1SDimitry Andric  // Remove the newly created terminator unconditional branch.
*0fca6ea1SDimitry Andric  FCmpBB->back().eraseFromParent();
*0fca6ea1SDimitry Andric  BasicBlock *FailBB =
*0fca6ea1SDimitry Andric      BasicBlock::Create(Context, "", FCmpBB->getParent(), NextBB);
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric  // Create the shadow fcmp and comparison between the fcmps.
*0fca6ea1SDimitry Andric  IRBuilder<> FCmpBuilder(FCmpBB);
*0fca6ea1SDimitry Andric  FCmpBuilder.SetCurrentDebugLocation(FCmp.getDebugLoc());
*0fca6ea1SDimitry Andric  Value *ShadowLHS = Map.getShadow(LHS);
*0fca6ea1SDimitry Andric  Value *ShadowRHS = Map.getShadow(RHS);
*0fca6ea1SDimitry Andric  // See comment on ClTruncateFCmpEq.
*0fca6ea1SDimitry Andric  if (FCmp.isEquality() && ClTruncateFCmpEq) {
*0fca6ea1SDimitry Andric    Type *Ty = ShadowLHS->getType();
*0fca6ea1SDimitry Andric    ShadowLHS = FCmpBuilder.CreateFPExt(
*0fca6ea1SDimitry Andric        FCmpBuilder.CreateFPTrunc(ShadowLHS, LHS->getType()), Ty);
*0fca6ea1SDimitry Andric    ShadowRHS = FCmpBuilder.CreateFPExt(
*0fca6ea1SDimitry Andric        FCmpBuilder.CreateFPTrunc(ShadowRHS, RHS->getType()), Ty);
*0fca6ea1SDimitry Andric  }
*0fca6ea1SDimitry Andric  Value *ShadowFCmp =
*0fca6ea1SDimitry Andric      FCmpBuilder.CreateFCmp(FCmp.getPredicate(), ShadowLHS, ShadowRHS);
*0fca6ea1SDimitry Andric  Value *OriginalAndShadowFcmpMatch =
*0fca6ea1SDimitry Andric      FCmpBuilder.CreateICmpEQ(&FCmp, ShadowFCmp);
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric  if (OriginalAndShadowFcmpMatch->getType()->isVectorTy()) {
*0fca6ea1SDimitry Andric    // If we have a vector type, `OriginalAndShadowFcmpMatch` is a vector of i1,
*0fca6ea1SDimitry Andric    // where an element is true if the corresponding elements in original and
*0fca6ea1SDimitry Andric    // shadow are the same. We want all elements to be 1.
*0fca6ea1SDimitry Andric    OriginalAndShadowFcmpMatch =
*0fca6ea1SDimitry Andric        FCmpBuilder.CreateAndReduce(OriginalAndShadowFcmpMatch);
*0fca6ea1SDimitry Andric  }
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric  // Use MDBuilder(*C).createLikelyBranchWeights() because "match" is the common
*0fca6ea1SDimitry Andric  // case.
*0fca6ea1SDimitry Andric  FCmpBuilder.CreateCondBr(OriginalAndShadowFcmpMatch, NextBB, FailBB,
*0fca6ea1SDimitry Andric                           MDBuilder(Context).createLikelyBranchWeights());
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric  // Fill in FailBB.
*0fca6ea1SDimitry Andric  IRBuilder<> FailBuilder(FailBB);
*0fca6ea1SDimitry Andric  FailBuilder.SetCurrentDebugLocation(FCmp.getDebugLoc());
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric  const auto EmitFailCall = [this, &FCmp, &FCmpBuilder,
*0fca6ea1SDimitry Andric                             &FailBuilder](Value *L, Value *R, Value *ShadowL,
*0fca6ea1SDimitry Andric                                           Value *ShadowR, Value *Result,
*0fca6ea1SDimitry Andric                                           Value *ShadowResult) {
*0fca6ea1SDimitry Andric    Type *FT = L->getType();
*0fca6ea1SDimitry Andric    FunctionCallee *Callee = nullptr;
*0fca6ea1SDimitry Andric    if (FT->isFloatTy()) {
*0fca6ea1SDimitry Andric      Callee = &(NsanFCmpFail[kFloat]);
*0fca6ea1SDimitry Andric    } else if (FT->isDoubleTy()) {
*0fca6ea1SDimitry Andric      Callee = &(NsanFCmpFail[kDouble]);
*0fca6ea1SDimitry Andric    } else if (FT->isX86_FP80Ty()) {
*0fca6ea1SDimitry Andric      // TODO: make NsanFCmpFailLongDouble work.
*0fca6ea1SDimitry Andric      Callee = &(NsanFCmpFail[kDouble]);
*0fca6ea1SDimitry Andric      L = FailBuilder.CreateFPTrunc(L, Type::getDoubleTy(Context));
*0fca6ea1SDimitry Andric      R = FailBuilder.CreateFPTrunc(L, Type::getDoubleTy(Context));
*0fca6ea1SDimitry Andric    } else {
*0fca6ea1SDimitry Andric      llvm_unreachable("not implemented");
*0fca6ea1SDimitry Andric    }
*0fca6ea1SDimitry Andric    FailBuilder.CreateCall(*Callee, {L, R, ShadowL, ShadowR,
*0fca6ea1SDimitry Andric                                     ConstantInt::get(FCmpBuilder.getInt32Ty(),
*0fca6ea1SDimitry Andric                                                      FCmp.getPredicate()),
*0fca6ea1SDimitry Andric                                     Result, ShadowResult});
*0fca6ea1SDimitry Andric  };
*0fca6ea1SDimitry Andric  if (LHS->getType()->isVectorTy()) {
*0fca6ea1SDimitry Andric    for (int I = 0, E = cast<VectorType>(LHS->getType())
*0fca6ea1SDimitry Andric                            ->getElementCount()
*0fca6ea1SDimitry Andric                            .getFixedValue();
*0fca6ea1SDimitry Andric         I < E; ++I) {
*0fca6ea1SDimitry Andric      Value *ExtractLHS = FailBuilder.CreateExtractElement(LHS, I);
*0fca6ea1SDimitry Andric      Value *ExtractRHS = FailBuilder.CreateExtractElement(RHS, I);
*0fca6ea1SDimitry Andric      Value *ExtractShaodwLHS = FailBuilder.CreateExtractElement(ShadowLHS, I);
*0fca6ea1SDimitry Andric      Value *ExtractShaodwRHS = FailBuilder.CreateExtractElement(ShadowRHS, I);
*0fca6ea1SDimitry Andric      Value *ExtractFCmp = FailBuilder.CreateExtractElement(&FCmp, I);
*0fca6ea1SDimitry Andric      Value *ExtractShadowFCmp =
*0fca6ea1SDimitry Andric          FailBuilder.CreateExtractElement(ShadowFCmp, I);
*0fca6ea1SDimitry Andric      EmitFailCall(ExtractLHS, ExtractRHS, ExtractShaodwLHS, ExtractShaodwRHS,
*0fca6ea1SDimitry Andric                   ExtractFCmp, ExtractShadowFCmp);
*0fca6ea1SDimitry Andric    }
*0fca6ea1SDimitry Andric  } else {
*0fca6ea1SDimitry Andric    EmitFailCall(LHS, RHS, ShadowLHS, ShadowRHS, &FCmp, ShadowFCmp);
*0fca6ea1SDimitry Andric  }
*0fca6ea1SDimitry Andric  FailBuilder.CreateBr(NextBB);
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric  ++NumInstrumentedFCmp;
*0fca6ea1SDimitry Andric}
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric// Creates a shadow phi value for any phi that defines a value of FT type.
*0fca6ea1SDimitry AndricPHINode *NumericalStabilitySanitizer::maybeCreateShadowPhi(
*0fca6ea1SDimitry Andric    PHINode &Phi, const TargetLibraryInfo &TLI) {
*0fca6ea1SDimitry Andric  Type *VT = Phi.getType();
*0fca6ea1SDimitry Andric  Type *ExtendedVT = Config.getExtendedFPType(VT);
*0fca6ea1SDimitry Andric  if (ExtendedVT == nullptr)
*0fca6ea1SDimitry Andric    return nullptr; // Not an FT value.
*0fca6ea1SDimitry Andric  // The phi operands are shadow values and are not available when the phi is
*0fca6ea1SDimitry Andric  // created. They will be populated in a final phase, once all shadow values
*0fca6ea1SDimitry Andric  // have been created.
*0fca6ea1SDimitry Andric  PHINode *Shadow = PHINode::Create(ExtendedVT, Phi.getNumIncomingValues());
*0fca6ea1SDimitry Andric  Shadow->insertAfter(&Phi);
*0fca6ea1SDimitry Andric  return Shadow;
*0fca6ea1SDimitry Andric}
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry AndricValue *NumericalStabilitySanitizer::handleLoad(LoadInst &Load, Type *VT,
*0fca6ea1SDimitry Andric                                               Type *ExtendedVT) {
*0fca6ea1SDimitry Andric  IRBuilder<> Builder(Load.getNextNode());
*0fca6ea1SDimitry Andric  Builder.SetCurrentDebugLocation(Load.getDebugLoc());
*0fca6ea1SDimitry Andric  if (addrPointsToConstantData(Load.getPointerOperand())) {
*0fca6ea1SDimitry Andric    // No need to look into the shadow memory, the value is a constant. Just
*0fca6ea1SDimitry Andric    // convert from FT to 2FT.
*0fca6ea1SDimitry Andric    return Builder.CreateFPExt(&Load, ExtendedVT);
*0fca6ea1SDimitry Andric  }
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric  // if (%shadowptr == &)
*0fca6ea1SDimitry Andric  //    %shadow = fpext %v
*0fca6ea1SDimitry Andric  // else
*0fca6ea1SDimitry Andric  //    %shadow = load (ptrcast %shadow_ptr))
*0fca6ea1SDimitry Andric  // Considered options here:
*0fca6ea1SDimitry Andric  //  - Have `NsanGetShadowPtrForLoad` return a fixed address
*0fca6ea1SDimitry Andric  //    &__nsan_unknown_value_shadow_address that is valid to load from, and
*0fca6ea1SDimitry Andric  //    use a select. This has the advantage that the generated IR is simpler.
*0fca6ea1SDimitry Andric  //  - Have `NsanGetShadowPtrForLoad` return nullptr.  Because `select` does
*0fca6ea1SDimitry Andric  //    not short-circuit, dereferencing the returned pointer is no longer an
*0fca6ea1SDimitry Andric  //    option, have to split and create a separate basic block. This has the
*0fca6ea1SDimitry Andric  //    advantage of being easier to debug because it crashes if we ever mess
*0fca6ea1SDimitry Andric  //    up.
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric  const auto Extents = getMemoryExtentsOrDie(VT);
*0fca6ea1SDimitry Andric  Value *ShadowPtr = Builder.CreateCall(
*0fca6ea1SDimitry Andric      NsanGetShadowPtrForLoad[Extents.ValueType],
*0fca6ea1SDimitry Andric      {Load.getPointerOperand(), ConstantInt::get(IntptrTy, Extents.NumElts)});
*0fca6ea1SDimitry Andric  ++NumInstrumentedFTLoads;
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric  // Split the basic block.
*0fca6ea1SDimitry Andric  BasicBlock *LoadBB = Load.getParent();
*0fca6ea1SDimitry Andric  BasicBlock *NextBB = LoadBB->splitBasicBlock(Builder.GetInsertPoint());
*0fca6ea1SDimitry Andric  // Create the two options for creating the shadow value.
*0fca6ea1SDimitry Andric  BasicBlock *ShadowLoadBB =
*0fca6ea1SDimitry Andric      BasicBlock::Create(Context, "", LoadBB->getParent(), NextBB);
*0fca6ea1SDimitry Andric  BasicBlock *FExtBB =
*0fca6ea1SDimitry Andric      BasicBlock::Create(Context, "", LoadBB->getParent(), NextBB);
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric  // Replace the newly created terminator unconditional branch by a conditional
*0fca6ea1SDimitry Andric  // branch to one of the options.
*0fca6ea1SDimitry Andric  {
*0fca6ea1SDimitry Andric    LoadBB->back().eraseFromParent();
*0fca6ea1SDimitry Andric    IRBuilder<> LoadBBBuilder(LoadBB); // The old builder has been invalidated.
*0fca6ea1SDimitry Andric    LoadBBBuilder.SetCurrentDebugLocation(Load.getDebugLoc());
*0fca6ea1SDimitry Andric    LoadBBBuilder.CreateCondBr(LoadBBBuilder.CreateIsNull(ShadowPtr), FExtBB,
*0fca6ea1SDimitry Andric                               ShadowLoadBB);
*0fca6ea1SDimitry Andric  }
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric  // Fill in ShadowLoadBB.
*0fca6ea1SDimitry Andric  IRBuilder<> ShadowLoadBBBuilder(ShadowLoadBB);
*0fca6ea1SDimitry Andric  ShadowLoadBBBuilder.SetCurrentDebugLocation(Load.getDebugLoc());
*0fca6ea1SDimitry Andric  Value *ShadowLoad = ShadowLoadBBBuilder.CreateAlignedLoad(
*0fca6ea1SDimitry Andric      ExtendedVT, ShadowPtr, Align(1), Load.isVolatile());
*0fca6ea1SDimitry Andric  if (ClCheckLoads) {
*0fca6ea1SDimitry Andric    ShadowLoad = emitCheck(&Load, ShadowLoad, ShadowLoadBBBuilder,
*0fca6ea1SDimitry Andric                           CheckLoc::makeLoad(Load.getPointerOperand()));
*0fca6ea1SDimitry Andric  }
*0fca6ea1SDimitry Andric  ShadowLoadBBBuilder.CreateBr(NextBB);
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric  // Fill in FExtBB.
*0fca6ea1SDimitry Andric  IRBuilder<> FExtBBBuilder(FExtBB);
*0fca6ea1SDimitry Andric  FExtBBBuilder.SetCurrentDebugLocation(Load.getDebugLoc());
*0fca6ea1SDimitry Andric  Value *FExt = FExtBBBuilder.CreateFPExt(&Load, ExtendedVT);
*0fca6ea1SDimitry Andric  FExtBBBuilder.CreateBr(NextBB);
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric  // The shadow value come from any of the options.
*0fca6ea1SDimitry Andric  IRBuilder<> NextBBBuilder(&*NextBB->begin());
*0fca6ea1SDimitry Andric  NextBBBuilder.SetCurrentDebugLocation(Load.getDebugLoc());
*0fca6ea1SDimitry Andric  PHINode *ShadowPhi = NextBBBuilder.CreatePHI(ExtendedVT, 2);
*0fca6ea1SDimitry Andric  ShadowPhi->addIncoming(ShadowLoad, ShadowLoadBB);
*0fca6ea1SDimitry Andric  ShadowPhi->addIncoming(FExt, FExtBB);
*0fca6ea1SDimitry Andric  return ShadowPhi;
*0fca6ea1SDimitry Andric}
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry AndricValue *NumericalStabilitySanitizer::handleTrunc(const FPTruncInst &Trunc,
*0fca6ea1SDimitry Andric                                                Type *VT, Type *ExtendedVT,
*0fca6ea1SDimitry Andric                                                const ValueToShadowMap &Map,
*0fca6ea1SDimitry Andric                                                IRBuilder<> &Builder) {
*0fca6ea1SDimitry Andric  Value *OrigSource = Trunc.getOperand(0);
*0fca6ea1SDimitry Andric  Type *OrigSourceTy = OrigSource->getType();
*0fca6ea1SDimitry Andric  Type *ExtendedSourceTy = Config.getExtendedFPType(OrigSourceTy);
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric  // When truncating:
*0fca6ea1SDimitry Andric  //  - (A) If the source has a shadow, we truncate from the shadow, else we
*0fca6ea1SDimitry Andric  //    truncate from the original source.
*0fca6ea1SDimitry Andric  //  - (B) If the shadow of the source is larger than the shadow of the dest,
*0fca6ea1SDimitry Andric  //    we still need a truncate. Else, the shadow of the source is the same
*0fca6ea1SDimitry Andric  //    type as the shadow of the dest (because mappings are non-decreasing), so
*0fca6ea1SDimitry Andric  //   we don't need to emit a truncate.
*0fca6ea1SDimitry Andric  // Examples,
*0fca6ea1SDimitry Andric  //   with a mapping of {f32->f64;f64->f80;f80->f128}
*0fca6ea1SDimitry Andric  //     fptrunc double   %1 to float     ->  fptrunc x86_fp80 s(%1) to double
*0fca6ea1SDimitry Andric  //     fptrunc x86_fp80 %1 to float     ->  fptrunc fp128    s(%1) to double
*0fca6ea1SDimitry Andric  //     fptrunc fp128    %1 to float     ->  fptrunc fp128    %1    to double
*0fca6ea1SDimitry Andric  //     fptrunc x86_fp80 %1 to double    ->  x86_fp80 s(%1)
*0fca6ea1SDimitry Andric  //     fptrunc fp128    %1 to double    ->  fptrunc fp128 %1 to x86_fp80
*0fca6ea1SDimitry Andric  //     fptrunc fp128    %1 to x86_fp80  ->  fp128 %1
*0fca6ea1SDimitry Andric  //   with a mapping of {f32->f64;f64->f128;f80->f128}
*0fca6ea1SDimitry Andric  //     fptrunc double   %1 to float     ->  fptrunc fp128    s(%1) to double
*0fca6ea1SDimitry Andric  //     fptrunc x86_fp80 %1 to float     ->  fptrunc fp128    s(%1) to double
*0fca6ea1SDimitry Andric  //     fptrunc fp128    %1 to float     ->  fptrunc fp128    %1    to double
*0fca6ea1SDimitry Andric  //     fptrunc x86_fp80 %1 to double    ->  fp128 %1
*0fca6ea1SDimitry Andric  //     fptrunc fp128    %1 to double    ->  fp128 %1
*0fca6ea1SDimitry Andric  //     fptrunc fp128    %1 to x86_fp80  ->  fp128 %1
*0fca6ea1SDimitry Andric  //   with a mapping of {f32->f32;f64->f32;f80->f64}
*0fca6ea1SDimitry Andric  //     fptrunc double   %1 to float     ->  float s(%1)
*0fca6ea1SDimitry Andric  //     fptrunc x86_fp80 %1 to float     ->  fptrunc double    s(%1) to float
*0fca6ea1SDimitry Andric  //     fptrunc fp128    %1 to float     ->  fptrunc fp128     %1    to float
*0fca6ea1SDimitry Andric  //     fptrunc x86_fp80 %1 to double    ->  fptrunc double    s(%1) to float
*0fca6ea1SDimitry Andric  //     fptrunc fp128    %1 to double    ->  fptrunc fp128     %1    to float
*0fca6ea1SDimitry Andric  //     fptrunc fp128    %1 to x86_fp80  ->  fptrunc fp128     %1    to double
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric  // See (A) above.
*0fca6ea1SDimitry Andric  Value *Source = ExtendedSourceTy ? Map.getShadow(OrigSource) : OrigSource;
*0fca6ea1SDimitry Andric  Type *SourceTy = ExtendedSourceTy ? ExtendedSourceTy : OrigSourceTy;
*0fca6ea1SDimitry Andric  // See (B) above.
*0fca6ea1SDimitry Andric  if (SourceTy == ExtendedVT)
*0fca6ea1SDimitry Andric    return Source;
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric  return Builder.CreateFPTrunc(Source, ExtendedVT);
*0fca6ea1SDimitry Andric}
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry AndricValue *NumericalStabilitySanitizer::handleExt(const FPExtInst &Ext, Type *VT,
*0fca6ea1SDimitry Andric                                              Type *ExtendedVT,
*0fca6ea1SDimitry Andric                                              const ValueToShadowMap &Map,
*0fca6ea1SDimitry Andric                                              IRBuilder<> &Builder) {
*0fca6ea1SDimitry Andric  Value *OrigSource = Ext.getOperand(0);
*0fca6ea1SDimitry Andric  Type *OrigSourceTy = OrigSource->getType();
*0fca6ea1SDimitry Andric  Type *ExtendedSourceTy = Config.getExtendedFPType(OrigSourceTy);
*0fca6ea1SDimitry Andric  // When extending:
*0fca6ea1SDimitry Andric  //  - (A) If the source has a shadow, we extend from the shadow, else we
*0fca6ea1SDimitry Andric  //    extend from the original source.
*0fca6ea1SDimitry Andric  //  - (B) If the shadow of the dest is larger than the shadow of the source,
*0fca6ea1SDimitry Andric  //    we still need an extend. Else, the shadow of the source is the same
*0fca6ea1SDimitry Andric  //    type as the shadow of the dest (because mappings are non-decreasing), so
*0fca6ea1SDimitry Andric  //    we don't need to emit an extend.
*0fca6ea1SDimitry Andric  // Examples,
*0fca6ea1SDimitry Andric  //   with a mapping of {f32->f64;f64->f80;f80->f128}
*0fca6ea1SDimitry Andric  //     fpext half    %1 to float     ->  fpext half     %1    to double
*0fca6ea1SDimitry Andric  //     fpext half    %1 to double    ->  fpext half     %1    to x86_fp80
*0fca6ea1SDimitry Andric  //     fpext half    %1 to x86_fp80  ->  fpext half     %1    to fp128
*0fca6ea1SDimitry Andric  //     fpext float   %1 to double    ->  double s(%1)
*0fca6ea1SDimitry Andric  //     fpext float   %1 to x86_fp80  ->  fpext double   s(%1) to fp128
*0fca6ea1SDimitry Andric  //     fpext double  %1 to x86_fp80  ->  fpext x86_fp80 s(%1) to fp128
*0fca6ea1SDimitry Andric  //   with a mapping of {f32->f64;f64->f128;f80->f128}
*0fca6ea1SDimitry Andric  //     fpext half    %1 to float     ->  fpext half     %1    to double
*0fca6ea1SDimitry Andric  //     fpext half    %1 to double    ->  fpext half     %1    to fp128
*0fca6ea1SDimitry Andric  //     fpext half    %1 to x86_fp80  ->  fpext half     %1    to fp128
*0fca6ea1SDimitry Andric  //     fpext float   %1 to double    ->  fpext double   s(%1) to fp128
*0fca6ea1SDimitry Andric  //     fpext float   %1 to x86_fp80  ->  fpext double   s(%1) to fp128
*0fca6ea1SDimitry Andric  //     fpext double  %1 to x86_fp80  ->  fp128 s(%1)
*0fca6ea1SDimitry Andric  //   with a mapping of {f32->f32;f64->f32;f80->f64}
*0fca6ea1SDimitry Andric  //     fpext half    %1 to float     ->  fpext half     %1    to float
*0fca6ea1SDimitry Andric  //     fpext half    %1 to double    ->  fpext half     %1    to float
*0fca6ea1SDimitry Andric  //     fpext half    %1 to x86_fp80  ->  fpext half     %1    to double
*0fca6ea1SDimitry Andric  //     fpext float   %1 to double    ->  s(%1)
*0fca6ea1SDimitry Andric  //     fpext float   %1 to x86_fp80  ->  fpext float    s(%1) to double
*0fca6ea1SDimitry Andric  //     fpext double  %1 to x86_fp80  ->  fpext float    s(%1) to double
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric  // See (A) above.
*0fca6ea1SDimitry Andric  Value *Source = ExtendedSourceTy ? Map.getShadow(OrigSource) : OrigSource;
*0fca6ea1SDimitry Andric  Type *SourceTy = ExtendedSourceTy ? ExtendedSourceTy : OrigSourceTy;
*0fca6ea1SDimitry Andric  // See (B) above.
*0fca6ea1SDimitry Andric  if (SourceTy == ExtendedVT)
*0fca6ea1SDimitry Andric    return Source;
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric  return Builder.CreateFPExt(Source, ExtendedVT);
*0fca6ea1SDimitry Andric}
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andricnamespace {
*0fca6ea1SDimitry Andric// TODO: This should be tablegen-ed.
*0fca6ea1SDimitry Andricstruct KnownIntrinsic {
*0fca6ea1SDimitry Andric  struct WidenedIntrinsic {
*0fca6ea1SDimitry Andric    const char *NarrowName;
*0fca6ea1SDimitry Andric    Intrinsic::ID ID; // wide id.
*0fca6ea1SDimitry Andric    using FnTypeFactory = FunctionType *(*)(LLVMContext &);
*0fca6ea1SDimitry Andric    FnTypeFactory MakeFnTy;
*0fca6ea1SDimitry Andric  };
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric  static const char *get(LibFunc LFunc);
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric  // Given an intrinsic with an `FT` argument, try to find a wider intrinsic
*0fca6ea1SDimitry Andric  // that applies the same operation on the shadow argument.
*0fca6ea1SDimitry Andric  // Options are:
*0fca6ea1SDimitry Andric  //  - pass in the ID and full function type,
*0fca6ea1SDimitry Andric  //  - pass in the name, which includes the function type through mangling.
*0fca6ea1SDimitry Andric  static const WidenedIntrinsic *widen(StringRef Name);
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andricprivate:
*0fca6ea1SDimitry Andric  struct LFEntry {
*0fca6ea1SDimitry Andric    LibFunc LFunc;
*0fca6ea1SDimitry Andric    const char *IntrinsicName;
*0fca6ea1SDimitry Andric  };
*0fca6ea1SDimitry Andric  static const LFEntry kLibfuncIntrinsics[];
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric  static const WidenedIntrinsic kWidenedIntrinsics[];
*0fca6ea1SDimitry Andric};
*0fca6ea1SDimitry Andric} // namespace
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andricstatic FunctionType *makeDoubleDouble(LLVMContext &C) {
*0fca6ea1SDimitry Andric  return FunctionType::get(Type::getDoubleTy(C), {Type::getDoubleTy(C)}, false);
*0fca6ea1SDimitry Andric}
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andricstatic FunctionType *makeX86FP80X86FP80(LLVMContext &C) {
*0fca6ea1SDimitry Andric  return FunctionType::get(Type::getX86_FP80Ty(C), {Type::getX86_FP80Ty(C)},
*0fca6ea1SDimitry Andric                           false);
*0fca6ea1SDimitry Andric}
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andricstatic FunctionType *makeDoubleDoubleI32(LLVMContext &C) {
*0fca6ea1SDimitry Andric  return FunctionType::get(Type::getDoubleTy(C),
*0fca6ea1SDimitry Andric                           {Type::getDoubleTy(C), Type::getInt32Ty(C)}, false);
*0fca6ea1SDimitry Andric}
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andricstatic FunctionType *makeX86FP80X86FP80I32(LLVMContext &C) {
*0fca6ea1SDimitry Andric  return FunctionType::get(Type::getX86_FP80Ty(C),
*0fca6ea1SDimitry Andric                           {Type::getX86_FP80Ty(C), Type::getInt32Ty(C)},
*0fca6ea1SDimitry Andric                           false);
*0fca6ea1SDimitry Andric}
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andricstatic FunctionType *makeDoubleDoubleDouble(LLVMContext &C) {
*0fca6ea1SDimitry Andric  return FunctionType::get(Type::getDoubleTy(C),
*0fca6ea1SDimitry Andric                           {Type::getDoubleTy(C), Type::getDoubleTy(C)}, false);
*0fca6ea1SDimitry Andric}
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andricstatic FunctionType *makeX86FP80X86FP80X86FP80(LLVMContext &C) {
*0fca6ea1SDimitry Andric  return FunctionType::get(Type::getX86_FP80Ty(C),
*0fca6ea1SDimitry Andric                           {Type::getX86_FP80Ty(C), Type::getX86_FP80Ty(C)},
*0fca6ea1SDimitry Andric                           false);
*0fca6ea1SDimitry Andric}
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andricstatic FunctionType *makeDoubleDoubleDoubleDouble(LLVMContext &C) {
*0fca6ea1SDimitry Andric  return FunctionType::get(
*0fca6ea1SDimitry Andric      Type::getDoubleTy(C),
*0fca6ea1SDimitry Andric      {Type::getDoubleTy(C), Type::getDoubleTy(C), Type::getDoubleTy(C)},
*0fca6ea1SDimitry Andric      false);
*0fca6ea1SDimitry Andric}
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andricstatic FunctionType *makeX86FP80X86FP80X86FP80X86FP80(LLVMContext &C) {
*0fca6ea1SDimitry Andric  return FunctionType::get(
*0fca6ea1SDimitry Andric      Type::getX86_FP80Ty(C),
*0fca6ea1SDimitry Andric      {Type::getX86_FP80Ty(C), Type::getX86_FP80Ty(C), Type::getX86_FP80Ty(C)},
*0fca6ea1SDimitry Andric      false);
*0fca6ea1SDimitry Andric}
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andricconst KnownIntrinsic::WidenedIntrinsic KnownIntrinsic::kWidenedIntrinsics[] = {
*0fca6ea1SDimitry Andric    // TODO: Right now we ignore vector intrinsics.
*0fca6ea1SDimitry Andric    // This is hard because we have to model the semantics of the intrinsics,
*0fca6ea1SDimitry Andric    // e.g. llvm.x86.sse2.min.sd means extract first element, min, insert back.
*0fca6ea1SDimitry Andric    // Intrinsics that take any non-vector FT types:
*0fca6ea1SDimitry Andric    // NOTE: Right now because of
*0fca6ea1SDimitry Andric    // https://github.com/llvm/llvm-project/issues/44744
*0fca6ea1SDimitry Andric    // for f128 we need to use makeX86FP80X86FP80 (go to a lower precision and
*0fca6ea1SDimitry Andric    // come back).
*0fca6ea1SDimitry Andric    {"llvm.sqrt.f32", Intrinsic::sqrt, makeDoubleDouble},
*0fca6ea1SDimitry Andric    {"llvm.sqrt.f64", Intrinsic::sqrt, makeX86FP80X86FP80},
*0fca6ea1SDimitry Andric    {"llvm.sqrt.f80", Intrinsic::sqrt, makeX86FP80X86FP80},
*0fca6ea1SDimitry Andric    {"llvm.powi.f32", Intrinsic::powi, makeDoubleDoubleI32},
*0fca6ea1SDimitry Andric    {"llvm.powi.f64", Intrinsic::powi, makeX86FP80X86FP80I32},
*0fca6ea1SDimitry Andric    {"llvm.powi.f80", Intrinsic::powi, makeX86FP80X86FP80I32},
*0fca6ea1SDimitry Andric    {"llvm.sin.f32", Intrinsic::sin, makeDoubleDouble},
*0fca6ea1SDimitry Andric    {"llvm.sin.f64", Intrinsic::sin, makeX86FP80X86FP80},
*0fca6ea1SDimitry Andric    {"llvm.sin.f80", Intrinsic::sin, makeX86FP80X86FP80},
*0fca6ea1SDimitry Andric    {"llvm.cos.f32", Intrinsic::cos, makeDoubleDouble},
*0fca6ea1SDimitry Andric    {"llvm.cos.f64", Intrinsic::cos, makeX86FP80X86FP80},
*0fca6ea1SDimitry Andric    {"llvm.cos.f80", Intrinsic::cos, makeX86FP80X86FP80},
*0fca6ea1SDimitry Andric    {"llvm.pow.f32", Intrinsic::pow, makeDoubleDoubleDouble},
*0fca6ea1SDimitry Andric    {"llvm.pow.f64", Intrinsic::pow, makeX86FP80X86FP80X86FP80},
*0fca6ea1SDimitry Andric    {"llvm.pow.f80", Intrinsic::pow, makeX86FP80X86FP80X86FP80},
*0fca6ea1SDimitry Andric    {"llvm.exp.f32", Intrinsic::exp, makeDoubleDouble},
*0fca6ea1SDimitry Andric    {"llvm.exp.f64", Intrinsic::exp, makeX86FP80X86FP80},
*0fca6ea1SDimitry Andric    {"llvm.exp.f80", Intrinsic::exp, makeX86FP80X86FP80},
*0fca6ea1SDimitry Andric    {"llvm.exp2.f32", Intrinsic::exp2, makeDoubleDouble},
*0fca6ea1SDimitry Andric    {"llvm.exp2.f64", Intrinsic::exp2, makeX86FP80X86FP80},
*0fca6ea1SDimitry Andric    {"llvm.exp2.f80", Intrinsic::exp2, makeX86FP80X86FP80},
*0fca6ea1SDimitry Andric    {"llvm.log.f32", Intrinsic::log, makeDoubleDouble},
*0fca6ea1SDimitry Andric    {"llvm.log.f64", Intrinsic::log, makeX86FP80X86FP80},
*0fca6ea1SDimitry Andric    {"llvm.log.f80", Intrinsic::log, makeX86FP80X86FP80},
*0fca6ea1SDimitry Andric    {"llvm.log10.f32", Intrinsic::log10, makeDoubleDouble},
*0fca6ea1SDimitry Andric    {"llvm.log10.f64", Intrinsic::log10, makeX86FP80X86FP80},
*0fca6ea1SDimitry Andric    {"llvm.log10.f80", Intrinsic::log10, makeX86FP80X86FP80},
*0fca6ea1SDimitry Andric    {"llvm.log2.f32", Intrinsic::log2, makeDoubleDouble},
*0fca6ea1SDimitry Andric    {"llvm.log2.f64", Intrinsic::log2, makeX86FP80X86FP80},
*0fca6ea1SDimitry Andric    {"llvm.log2.f80", Intrinsic::log2, makeX86FP80X86FP80},
*0fca6ea1SDimitry Andric    {"llvm.fma.f32", Intrinsic::fma, makeDoubleDoubleDoubleDouble},
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric    {"llvm.fmuladd.f32", Intrinsic::fmuladd, makeDoubleDoubleDoubleDouble},
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric    {"llvm.fma.f64", Intrinsic::fma, makeX86FP80X86FP80X86FP80X86FP80},
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric    {"llvm.fmuladd.f64", Intrinsic::fma, makeX86FP80X86FP80X86FP80X86FP80},
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric    {"llvm.fma.f80", Intrinsic::fma, makeX86FP80X86FP80X86FP80X86FP80},
*0fca6ea1SDimitry Andric    {"llvm.fabs.f32", Intrinsic::fabs, makeDoubleDouble},
*0fca6ea1SDimitry Andric    {"llvm.fabs.f64", Intrinsic::fabs, makeX86FP80X86FP80},
*0fca6ea1SDimitry Andric    {"llvm.fabs.f80", Intrinsic::fabs, makeX86FP80X86FP80},
*0fca6ea1SDimitry Andric    {"llvm.minnum.f32", Intrinsic::minnum, makeDoubleDoubleDouble},
*0fca6ea1SDimitry Andric    {"llvm.minnum.f64", Intrinsic::minnum, makeX86FP80X86FP80X86FP80},
*0fca6ea1SDimitry Andric    {"llvm.minnum.f80", Intrinsic::minnum, makeX86FP80X86FP80X86FP80},
*0fca6ea1SDimitry Andric    {"llvm.maxnum.f32", Intrinsic::maxnum, makeDoubleDoubleDouble},
*0fca6ea1SDimitry Andric    {"llvm.maxnum.f64", Intrinsic::maxnum, makeX86FP80X86FP80X86FP80},
*0fca6ea1SDimitry Andric    {"llvm.maxnum.f80", Intrinsic::maxnum, makeX86FP80X86FP80X86FP80},
*0fca6ea1SDimitry Andric    {"llvm.minimum.f32", Intrinsic::minimum, makeDoubleDoubleDouble},
*0fca6ea1SDimitry Andric    {"llvm.minimum.f64", Intrinsic::minimum, makeX86FP80X86FP80X86FP80},
*0fca6ea1SDimitry Andric    {"llvm.minimum.f80", Intrinsic::minimum, makeX86FP80X86FP80X86FP80},
*0fca6ea1SDimitry Andric    {"llvm.maximum.f32", Intrinsic::maximum, makeDoubleDoubleDouble},
*0fca6ea1SDimitry Andric    {"llvm.maximum.f64", Intrinsic::maximum, makeX86FP80X86FP80X86FP80},
*0fca6ea1SDimitry Andric    {"llvm.maximum.f80", Intrinsic::maximum, makeX86FP80X86FP80X86FP80},
*0fca6ea1SDimitry Andric    {"llvm.copysign.f32", Intrinsic::copysign, makeDoubleDoubleDouble},
*0fca6ea1SDimitry Andric    {"llvm.copysign.f64", Intrinsic::copysign, makeX86FP80X86FP80X86FP80},
*0fca6ea1SDimitry Andric    {"llvm.copysign.f80", Intrinsic::copysign, makeX86FP80X86FP80X86FP80},
*0fca6ea1SDimitry Andric    {"llvm.floor.f32", Intrinsic::floor, makeDoubleDouble},
*0fca6ea1SDimitry Andric    {"llvm.floor.f64", Intrinsic::floor, makeX86FP80X86FP80},
*0fca6ea1SDimitry Andric    {"llvm.floor.f80", Intrinsic::floor, makeX86FP80X86FP80},
*0fca6ea1SDimitry Andric    {"llvm.ceil.f32", Intrinsic::ceil, makeDoubleDouble},
*0fca6ea1SDimitry Andric    {"llvm.ceil.f64", Intrinsic::ceil, makeX86FP80X86FP80},
*0fca6ea1SDimitry Andric    {"llvm.ceil.f80", Intrinsic::ceil, makeX86FP80X86FP80},
*0fca6ea1SDimitry Andric    {"llvm.trunc.f32", Intrinsic::trunc, makeDoubleDouble},
*0fca6ea1SDimitry Andric    {"llvm.trunc.f64", Intrinsic::trunc, makeX86FP80X86FP80},
*0fca6ea1SDimitry Andric    {"llvm.trunc.f80", Intrinsic::trunc, makeX86FP80X86FP80},
*0fca6ea1SDimitry Andric    {"llvm.rint.f32", Intrinsic::rint, makeDoubleDouble},
*0fca6ea1SDimitry Andric    {"llvm.rint.f64", Intrinsic::rint, makeX86FP80X86FP80},
*0fca6ea1SDimitry Andric    {"llvm.rint.f80", Intrinsic::rint, makeX86FP80X86FP80},
*0fca6ea1SDimitry Andric    {"llvm.nearbyint.f32", Intrinsic::nearbyint, makeDoubleDouble},
*0fca6ea1SDimitry Andric    {"llvm.nearbyint.f64", Intrinsic::nearbyint, makeX86FP80X86FP80},
*0fca6ea1SDimitry Andric    {"llvm.nearbyin80f64", Intrinsic::nearbyint, makeX86FP80X86FP80},
*0fca6ea1SDimitry Andric    {"llvm.round.f32", Intrinsic::round, makeDoubleDouble},
*0fca6ea1SDimitry Andric    {"llvm.round.f64", Intrinsic::round, makeX86FP80X86FP80},
*0fca6ea1SDimitry Andric    {"llvm.round.f80", Intrinsic::round, makeX86FP80X86FP80},
*0fca6ea1SDimitry Andric    {"llvm.lround.f32", Intrinsic::lround, makeDoubleDouble},
*0fca6ea1SDimitry Andric    {"llvm.lround.f64", Intrinsic::lround, makeX86FP80X86FP80},
*0fca6ea1SDimitry Andric    {"llvm.lround.f80", Intrinsic::lround, makeX86FP80X86FP80},
*0fca6ea1SDimitry Andric    {"llvm.llround.f32", Intrinsic::llround, makeDoubleDouble},
*0fca6ea1SDimitry Andric    {"llvm.llround.f64", Intrinsic::llround, makeX86FP80X86FP80},
*0fca6ea1SDimitry Andric    {"llvm.llround.f80", Intrinsic::llround, makeX86FP80X86FP80},
*0fca6ea1SDimitry Andric    {"llvm.lrint.f32", Intrinsic::lrint, makeDoubleDouble},
*0fca6ea1SDimitry Andric    {"llvm.lrint.f64", Intrinsic::lrint, makeX86FP80X86FP80},
*0fca6ea1SDimitry Andric    {"llvm.lrint.f80", Intrinsic::lrint, makeX86FP80X86FP80},
*0fca6ea1SDimitry Andric    {"llvm.llrint.f32", Intrinsic::llrint, makeDoubleDouble},
*0fca6ea1SDimitry Andric    {"llvm.llrint.f64", Intrinsic::llrint, makeX86FP80X86FP80},
*0fca6ea1SDimitry Andric    {"llvm.llrint.f80", Intrinsic::llrint, makeX86FP80X86FP80},
*0fca6ea1SDimitry Andric};
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andricconst KnownIntrinsic::LFEntry KnownIntrinsic::kLibfuncIntrinsics[] = {
*0fca6ea1SDimitry Andric    {LibFunc_sqrtf, "llvm.sqrt.f32"},
*0fca6ea1SDimitry Andric    {LibFunc_sqrt, "llvm.sqrt.f64"},
*0fca6ea1SDimitry Andric    {LibFunc_sqrtl, "llvm.sqrt.f80"},
*0fca6ea1SDimitry Andric    {LibFunc_sinf, "llvm.sin.f32"},
*0fca6ea1SDimitry Andric    {LibFunc_sin, "llvm.sin.f64"},
*0fca6ea1SDimitry Andric    {LibFunc_sinl, "llvm.sin.f80"},
*0fca6ea1SDimitry Andric    {LibFunc_cosf, "llvm.cos.f32"},
*0fca6ea1SDimitry Andric    {LibFunc_cos, "llvm.cos.f64"},
*0fca6ea1SDimitry Andric    {LibFunc_cosl, "llvm.cos.f80"},
*0fca6ea1SDimitry Andric    {LibFunc_powf, "llvm.pow.f32"},
*0fca6ea1SDimitry Andric    {LibFunc_pow, "llvm.pow.f64"},
*0fca6ea1SDimitry Andric    {LibFunc_powl, "llvm.pow.f80"},
*0fca6ea1SDimitry Andric    {LibFunc_expf, "llvm.exp.f32"},
*0fca6ea1SDimitry Andric    {LibFunc_exp, "llvm.exp.f64"},
*0fca6ea1SDimitry Andric    {LibFunc_expl, "llvm.exp.f80"},
*0fca6ea1SDimitry Andric    {LibFunc_exp2f, "llvm.exp2.f32"},
*0fca6ea1SDimitry Andric    {LibFunc_exp2, "llvm.exp2.f64"},
*0fca6ea1SDimitry Andric    {LibFunc_exp2l, "llvm.exp2.f80"},
*0fca6ea1SDimitry Andric    {LibFunc_logf, "llvm.log.f32"},
*0fca6ea1SDimitry Andric    {LibFunc_log, "llvm.log.f64"},
*0fca6ea1SDimitry Andric    {LibFunc_logl, "llvm.log.f80"},
*0fca6ea1SDimitry Andric    {LibFunc_log10f, "llvm.log10.f32"},
*0fca6ea1SDimitry Andric    {LibFunc_log10, "llvm.log10.f64"},
*0fca6ea1SDimitry Andric    {LibFunc_log10l, "llvm.log10.f80"},
*0fca6ea1SDimitry Andric    {LibFunc_log2f, "llvm.log2.f32"},
*0fca6ea1SDimitry Andric    {LibFunc_log2, "llvm.log2.f64"},
*0fca6ea1SDimitry Andric    {LibFunc_log2l, "llvm.log2.f80"},
*0fca6ea1SDimitry Andric    {LibFunc_fabsf, "llvm.fabs.f32"},
*0fca6ea1SDimitry Andric    {LibFunc_fabs, "llvm.fabs.f64"},
*0fca6ea1SDimitry Andric    {LibFunc_fabsl, "llvm.fabs.f80"},
*0fca6ea1SDimitry Andric    {LibFunc_copysignf, "llvm.copysign.f32"},
*0fca6ea1SDimitry Andric    {LibFunc_copysign, "llvm.copysign.f64"},
*0fca6ea1SDimitry Andric    {LibFunc_copysignl, "llvm.copysign.f80"},
*0fca6ea1SDimitry Andric    {LibFunc_floorf, "llvm.floor.f32"},
*0fca6ea1SDimitry Andric    {LibFunc_floor, "llvm.floor.f64"},
*0fca6ea1SDimitry Andric    {LibFunc_floorl, "llvm.floor.f80"},
*0fca6ea1SDimitry Andric    {LibFunc_fmaxf, "llvm.maxnum.f32"},
*0fca6ea1SDimitry Andric    {LibFunc_fmax, "llvm.maxnum.f64"},
*0fca6ea1SDimitry Andric    {LibFunc_fmaxl, "llvm.maxnum.f80"},
*0fca6ea1SDimitry Andric    {LibFunc_fminf, "llvm.minnum.f32"},
*0fca6ea1SDimitry Andric    {LibFunc_fmin, "llvm.minnum.f64"},
*0fca6ea1SDimitry Andric    {LibFunc_fminl, "llvm.minnum.f80"},
*0fca6ea1SDimitry Andric    {LibFunc_ceilf, "llvm.ceil.f32"},
*0fca6ea1SDimitry Andric    {LibFunc_ceil, "llvm.ceil.f64"},
*0fca6ea1SDimitry Andric    {LibFunc_ceill, "llvm.ceil.f80"},
*0fca6ea1SDimitry Andric    {LibFunc_truncf, "llvm.trunc.f32"},
*0fca6ea1SDimitry Andric    {LibFunc_trunc, "llvm.trunc.f64"},
*0fca6ea1SDimitry Andric    {LibFunc_truncl, "llvm.trunc.f80"},
*0fca6ea1SDimitry Andric    {LibFunc_rintf, "llvm.rint.f32"},
*0fca6ea1SDimitry Andric    {LibFunc_rint, "llvm.rint.f64"},
*0fca6ea1SDimitry Andric    {LibFunc_rintl, "llvm.rint.f80"},
*0fca6ea1SDimitry Andric    {LibFunc_nearbyintf, "llvm.nearbyint.f32"},
*0fca6ea1SDimitry Andric    {LibFunc_nearbyint, "llvm.nearbyint.f64"},
*0fca6ea1SDimitry Andric    {LibFunc_nearbyintl, "llvm.nearbyint.f80"},
*0fca6ea1SDimitry Andric    {LibFunc_roundf, "llvm.round.f32"},
*0fca6ea1SDimitry Andric    {LibFunc_round, "llvm.round.f64"},
*0fca6ea1SDimitry Andric    {LibFunc_roundl, "llvm.round.f80"},
*0fca6ea1SDimitry Andric};
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andricconst char *KnownIntrinsic::get(LibFunc LFunc) {
*0fca6ea1SDimitry Andric  for (const auto &E : kLibfuncIntrinsics) {
*0fca6ea1SDimitry Andric    if (E.LFunc == LFunc)
*0fca6ea1SDimitry Andric      return E.IntrinsicName;
*0fca6ea1SDimitry Andric  }
*0fca6ea1SDimitry Andric  return nullptr;
*0fca6ea1SDimitry Andric}
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andricconst KnownIntrinsic::WidenedIntrinsic *KnownIntrinsic::widen(StringRef Name) {
*0fca6ea1SDimitry Andric  for (const auto &E : kWidenedIntrinsics) {
*0fca6ea1SDimitry Andric    if (E.NarrowName == Name)
*0fca6ea1SDimitry Andric      return &E;
*0fca6ea1SDimitry Andric  }
*0fca6ea1SDimitry Andric  return nullptr;
*0fca6ea1SDimitry Andric}
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric// Returns the name of the LLVM intrinsic corresponding to the given function.
*0fca6ea1SDimitry Andricstatic const char *getIntrinsicFromLibfunc(Function &Fn, Type *VT,
*0fca6ea1SDimitry Andric                                           const TargetLibraryInfo &TLI) {
*0fca6ea1SDimitry Andric  LibFunc LFunc;
*0fca6ea1SDimitry Andric  if (!TLI.getLibFunc(Fn, LFunc))
*0fca6ea1SDimitry Andric    return nullptr;
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric  if (const char *Name = KnownIntrinsic::get(LFunc))
*0fca6ea1SDimitry Andric    return Name;
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric  LLVM_DEBUG(errs() << "TODO: LibFunc: " << TLI.getName(LFunc) << "\n");
*0fca6ea1SDimitry Andric  return nullptr;
*0fca6ea1SDimitry Andric}
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric// Try to handle a known function call.
*0fca6ea1SDimitry AndricValue *NumericalStabilitySanitizer::maybeHandleKnownCallBase(
*0fca6ea1SDimitry Andric    CallBase &Call, Type *VT, Type *ExtendedVT, const TargetLibraryInfo &TLI,
*0fca6ea1SDimitry Andric    const ValueToShadowMap &Map, IRBuilder<> &Builder) {
*0fca6ea1SDimitry Andric  Function *Fn = Call.getCalledFunction();
*0fca6ea1SDimitry Andric  if (Fn == nullptr)
*0fca6ea1SDimitry Andric    return nullptr;
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric  Intrinsic::ID WidenedId = Intrinsic::ID();
*0fca6ea1SDimitry Andric  FunctionType *WidenedFnTy = nullptr;
*0fca6ea1SDimitry Andric  if (const auto ID = Fn->getIntrinsicID()) {
*0fca6ea1SDimitry Andric    const auto *Widened = KnownIntrinsic::widen(Fn->getName());
*0fca6ea1SDimitry Andric    if (Widened) {
*0fca6ea1SDimitry Andric      WidenedId = Widened->ID;
*0fca6ea1SDimitry Andric      WidenedFnTy = Widened->MakeFnTy(Context);
*0fca6ea1SDimitry Andric    } else {
*0fca6ea1SDimitry Andric      // If we don't know how to widen the intrinsic, we have no choice but to
*0fca6ea1SDimitry Andric      // call the non-wide version on a truncated shadow and extend again
*0fca6ea1SDimitry Andric      // afterwards.
*0fca6ea1SDimitry Andric      WidenedId = ID;
*0fca6ea1SDimitry Andric      WidenedFnTy = Fn->getFunctionType();
*0fca6ea1SDimitry Andric    }
*0fca6ea1SDimitry Andric  } else if (const char *Name = getIntrinsicFromLibfunc(*Fn, VT, TLI)) {
*0fca6ea1SDimitry Andric    // We might have a call to a library function that we can replace with a
*0fca6ea1SDimitry Andric    // wider Intrinsic.
*0fca6ea1SDimitry Andric    const auto *Widened = KnownIntrinsic::widen(Name);
*0fca6ea1SDimitry Andric    assert(Widened && "make sure KnownIntrinsic entries are consistent");
*0fca6ea1SDimitry Andric    WidenedId = Widened->ID;
*0fca6ea1SDimitry Andric    WidenedFnTy = Widened->MakeFnTy(Context);
*0fca6ea1SDimitry Andric  } else {
*0fca6ea1SDimitry Andric    // This is not a known library function or intrinsic.
*0fca6ea1SDimitry Andric    return nullptr;
*0fca6ea1SDimitry Andric  }
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric  // Check that the widened intrinsic is valid.
*0fca6ea1SDimitry Andric  SmallVector<Intrinsic::IITDescriptor, 8> Table;
*0fca6ea1SDimitry Andric  getIntrinsicInfoTableEntries(WidenedId, Table);
*0fca6ea1SDimitry Andric  SmallVector<Type *, 4> ArgTys;
*0fca6ea1SDimitry Andric  ArrayRef<Intrinsic::IITDescriptor> TableRef = Table;
*0fca6ea1SDimitry Andric  [[maybe_unused]] Intrinsic::MatchIntrinsicTypesResult MatchResult =
*0fca6ea1SDimitry Andric      Intrinsic::matchIntrinsicSignature(WidenedFnTy, TableRef, ArgTys);
*0fca6ea1SDimitry Andric  assert(MatchResult == Intrinsic::MatchIntrinsicTypes_Match &&
*0fca6ea1SDimitry Andric         "invalid widened intrinsic");
*0fca6ea1SDimitry Andric  // For known intrinsic functions, we create a second call to the same
*0fca6ea1SDimitry Andric  // intrinsic with a different type.
*0fca6ea1SDimitry Andric  SmallVector<Value *, 4> Args;
*0fca6ea1SDimitry Andric  // The last operand is the intrinsic itself, skip it.
*0fca6ea1SDimitry Andric  for (unsigned I = 0, E = Call.getNumOperands() - 1; I < E; ++I) {
*0fca6ea1SDimitry Andric    Value *Arg = Call.getOperand(I);
*0fca6ea1SDimitry Andric    Type *OrigArgTy = Arg->getType();
*0fca6ea1SDimitry Andric    Type *IntrinsicArgTy = WidenedFnTy->getParamType(I);
*0fca6ea1SDimitry Andric    if (OrigArgTy == IntrinsicArgTy) {
*0fca6ea1SDimitry Andric      Args.push_back(Arg); // The arg is passed as is.
*0fca6ea1SDimitry Andric      continue;
*0fca6ea1SDimitry Andric    }
*0fca6ea1SDimitry Andric    Type *ShadowArgTy = Config.getExtendedFPType(Arg->getType());
*0fca6ea1SDimitry Andric    assert(ShadowArgTy &&
*0fca6ea1SDimitry Andric           "don't know how to get the shadow value for a non-FT");
*0fca6ea1SDimitry Andric    Value *Shadow = Map.getShadow(Arg);
*0fca6ea1SDimitry Andric    if (ShadowArgTy == IntrinsicArgTy) {
*0fca6ea1SDimitry Andric      // The shadow is the right type for the intrinsic.
*0fca6ea1SDimitry Andric      assert(Shadow->getType() == ShadowArgTy);
*0fca6ea1SDimitry Andric      Args.push_back(Shadow);
*0fca6ea1SDimitry Andric      continue;
*0fca6ea1SDimitry Andric    }
*0fca6ea1SDimitry Andric    // There is no intrinsic with his level of precision, truncate the shadow.
*0fca6ea1SDimitry Andric    Args.push_back(Builder.CreateFPTrunc(Shadow, IntrinsicArgTy));
*0fca6ea1SDimitry Andric  }
*0fca6ea1SDimitry Andric  Value *IntrinsicCall = Builder.CreateIntrinsic(WidenedId, ArgTys, Args);
*0fca6ea1SDimitry Andric  return WidenedFnTy->getReturnType() == ExtendedVT
*0fca6ea1SDimitry Andric             ? IntrinsicCall
*0fca6ea1SDimitry Andric             : Builder.CreateFPExt(IntrinsicCall, ExtendedVT);
*0fca6ea1SDimitry Andric}
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric// Handle a CallBase, i.e. a function call, an inline asm sequence, or an
*0fca6ea1SDimitry Andric// invoke.
*0fca6ea1SDimitry AndricValue *NumericalStabilitySanitizer::handleCallBase(CallBase &Call, Type *VT,
*0fca6ea1SDimitry Andric                                                   Type *ExtendedVT,
*0fca6ea1SDimitry Andric                                                   const TargetLibraryInfo &TLI,
*0fca6ea1SDimitry Andric                                                   const ValueToShadowMap &Map,
*0fca6ea1SDimitry Andric                                                   IRBuilder<> &Builder) {
*0fca6ea1SDimitry Andric  // We cannot look inside inline asm, just expand the result again.
*0fca6ea1SDimitry Andric  if (Call.isInlineAsm())
*0fca6ea1SDimitry Andric    return Builder.CreateFPExt(&Call, ExtendedVT);
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric  // Intrinsics and library functions (e.g. sin, exp) are handled
*0fca6ea1SDimitry Andric  // specifically, because we know their semantics and can do better than
*0fca6ea1SDimitry Andric  // blindly calling them (e.g. compute the sinus in the actual shadow domain).
*0fca6ea1SDimitry Andric  if (Value *V =
*0fca6ea1SDimitry Andric          maybeHandleKnownCallBase(Call, VT, ExtendedVT, TLI, Map, Builder))
*0fca6ea1SDimitry Andric    return V;
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric  // If the return tag matches that of the called function, read the extended
*0fca6ea1SDimitry Andric  // return value from the shadow ret ptr. Else, just extend the return value.
*0fca6ea1SDimitry Andric  Value *L =
*0fca6ea1SDimitry Andric      Builder.CreateLoad(IntptrTy, NsanShadowRetTag, /*isVolatile=*/false);
*0fca6ea1SDimitry Andric  Value *HasShadowRet = Builder.CreateICmpEQ(
*0fca6ea1SDimitry Andric      L, Builder.CreatePtrToInt(Call.getCalledOperand(), IntptrTy));
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric  Value *ShadowRetVal = Builder.CreateLoad(
*0fca6ea1SDimitry Andric      ExtendedVT,
*0fca6ea1SDimitry Andric      Builder.CreateConstGEP2_64(NsanShadowRetType, NsanShadowRetPtr, 0, 0),
*0fca6ea1SDimitry Andric      /*isVolatile=*/false);
*0fca6ea1SDimitry Andric  Value *Shadow = Builder.CreateSelect(HasShadowRet, ShadowRetVal,
*0fca6ea1SDimitry Andric                                       Builder.CreateFPExt(&Call, ExtendedVT));
*0fca6ea1SDimitry Andric  ++NumInstrumentedFTCalls;
*0fca6ea1SDimitry Andric  return Shadow;
*0fca6ea1SDimitry Andric}
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric// Creates a shadow value for the given FT value. At that point all operands are
*0fca6ea1SDimitry Andric// guaranteed to be available.
*0fca6ea1SDimitry AndricValue *NumericalStabilitySanitizer::createShadowValueWithOperandsAvailable(
*0fca6ea1SDimitry Andric    Instruction &Inst, const TargetLibraryInfo &TLI,
*0fca6ea1SDimitry Andric    const ValueToShadowMap &Map) {
*0fca6ea1SDimitry Andric  Type *VT = Inst.getType();
*0fca6ea1SDimitry Andric  Type *ExtendedVT = Config.getExtendedFPType(VT);
*0fca6ea1SDimitry Andric  assert(ExtendedVT != nullptr && "trying to create a shadow for a non-FT");
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric  if (auto *Load = dyn_cast<LoadInst>(&Inst))
*0fca6ea1SDimitry Andric    return handleLoad(*Load, VT, ExtendedVT);
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric  if (auto *Call = dyn_cast<CallInst>(&Inst)) {
*0fca6ea1SDimitry Andric    // Insert after the call.
*0fca6ea1SDimitry Andric    BasicBlock::iterator It(Inst);
*0fca6ea1SDimitry Andric    IRBuilder<> Builder(Call->getParent(), ++It);
*0fca6ea1SDimitry Andric    Builder.SetCurrentDebugLocation(Call->getDebugLoc());
*0fca6ea1SDimitry Andric    return handleCallBase(*Call, VT, ExtendedVT, TLI, Map, Builder);
*0fca6ea1SDimitry Andric  }
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric  if (auto *Invoke = dyn_cast<InvokeInst>(&Inst)) {
*0fca6ea1SDimitry Andric    // The Invoke terminates the basic block, create a new basic block in
*0fca6ea1SDimitry Andric    // between the successful invoke and the next block.
*0fca6ea1SDimitry Andric    BasicBlock *InvokeBB = Invoke->getParent();
*0fca6ea1SDimitry Andric    BasicBlock *NextBB = Invoke->getNormalDest();
*0fca6ea1SDimitry Andric    BasicBlock *NewBB =
*0fca6ea1SDimitry Andric        BasicBlock::Create(Context, "", NextBB->getParent(), NextBB);
*0fca6ea1SDimitry Andric    Inst.replaceSuccessorWith(NextBB, NewBB);
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric    IRBuilder<> Builder(NewBB);
*0fca6ea1SDimitry Andric    Builder.SetCurrentDebugLocation(Invoke->getDebugLoc());
*0fca6ea1SDimitry Andric    Value *Shadow = handleCallBase(*Invoke, VT, ExtendedVT, TLI, Map, Builder);
*0fca6ea1SDimitry Andric    Builder.CreateBr(NextBB);
*0fca6ea1SDimitry Andric    NewBB->replaceSuccessorsPhiUsesWith(InvokeBB, NewBB);
*0fca6ea1SDimitry Andric    return Shadow;
*0fca6ea1SDimitry Andric  }
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric  IRBuilder<> Builder(Inst.getNextNode());
*0fca6ea1SDimitry Andric  Builder.SetCurrentDebugLocation(Inst.getDebugLoc());
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric  if (auto *Trunc = dyn_cast<FPTruncInst>(&Inst))
*0fca6ea1SDimitry Andric    return handleTrunc(*Trunc, VT, ExtendedVT, Map, Builder);
*0fca6ea1SDimitry Andric  if (auto *Ext = dyn_cast<FPExtInst>(&Inst))
*0fca6ea1SDimitry Andric    return handleExt(*Ext, VT, ExtendedVT, Map, Builder);
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric  if (auto *UnaryOp = dyn_cast<UnaryOperator>(&Inst))
*0fca6ea1SDimitry Andric    return Builder.CreateUnOp(UnaryOp->getOpcode(),
*0fca6ea1SDimitry Andric                              Map.getShadow(UnaryOp->getOperand(0)));
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric  if (auto *BinOp = dyn_cast<BinaryOperator>(&Inst))
*0fca6ea1SDimitry Andric    return Builder.CreateBinOp(BinOp->getOpcode(),
*0fca6ea1SDimitry Andric                               Map.getShadow(BinOp->getOperand(0)),
*0fca6ea1SDimitry Andric                               Map.getShadow(BinOp->getOperand(1)));
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric  if (isa<UIToFPInst>(&Inst) || isa<SIToFPInst>(&Inst)) {
*0fca6ea1SDimitry Andric    auto *Cast = dyn_cast<CastInst>(&Inst);
*0fca6ea1SDimitry Andric    return Builder.CreateCast(Cast->getOpcode(), Cast->getOperand(0),
*0fca6ea1SDimitry Andric                              ExtendedVT);
*0fca6ea1SDimitry Andric  }
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric  if (auto *S = dyn_cast<SelectInst>(&Inst))
*0fca6ea1SDimitry Andric    return Builder.CreateSelect(S->getCondition(),
*0fca6ea1SDimitry Andric                                Map.getShadow(S->getTrueValue()),
*0fca6ea1SDimitry Andric                                Map.getShadow(S->getFalseValue()));
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric  if (auto *Extract = dyn_cast<ExtractElementInst>(&Inst))
*0fca6ea1SDimitry Andric    return Builder.CreateExtractElement(
*0fca6ea1SDimitry Andric        Map.getShadow(Extract->getVectorOperand()), Extract->getIndexOperand());
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric  if (auto *Insert = dyn_cast<InsertElementInst>(&Inst))
*0fca6ea1SDimitry Andric    return Builder.CreateInsertElement(Map.getShadow(Insert->getOperand(0)),
*0fca6ea1SDimitry Andric                                       Map.getShadow(Insert->getOperand(1)),
*0fca6ea1SDimitry Andric                                       Insert->getOperand(2));
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric  if (auto *Shuffle = dyn_cast<ShuffleVectorInst>(&Inst))
*0fca6ea1SDimitry Andric    return Builder.CreateShuffleVector(Map.getShadow(Shuffle->getOperand(0)),
*0fca6ea1SDimitry Andric                                       Map.getShadow(Shuffle->getOperand(1)),
*0fca6ea1SDimitry Andric                                       Shuffle->getShuffleMask());
*0fca6ea1SDimitry Andric  // TODO: We could make aggregate object first class citizens. For now we
*0fca6ea1SDimitry Andric  // just extend the extracted value.
*0fca6ea1SDimitry Andric  if (auto *Extract = dyn_cast<ExtractValueInst>(&Inst))
*0fca6ea1SDimitry Andric    return Builder.CreateFPExt(Extract, ExtendedVT);
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric  if (auto *BC = dyn_cast<BitCastInst>(&Inst))
*0fca6ea1SDimitry Andric    return Builder.CreateFPExt(BC, ExtendedVT);
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric  report_fatal_error("Unimplemented support for " +
*0fca6ea1SDimitry Andric                     Twine(Inst.getOpcodeName()));
*0fca6ea1SDimitry Andric}
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric// Creates a shadow value for an instruction that defines a value of FT type.
*0fca6ea1SDimitry Andric// FT operands that do not already have shadow values are created recursively.
*0fca6ea1SDimitry Andric// The DFS is guaranteed to not loop as phis and arguments already have
*0fca6ea1SDimitry Andric// shadows.
*0fca6ea1SDimitry Andricvoid NumericalStabilitySanitizer::maybeCreateShadowValue(
*0fca6ea1SDimitry Andric    Instruction &Root, const TargetLibraryInfo &TLI, ValueToShadowMap &Map) {
*0fca6ea1SDimitry Andric  Type *VT = Root.getType();
*0fca6ea1SDimitry Andric  Type *ExtendedVT = Config.getExtendedFPType(VT);
*0fca6ea1SDimitry Andric  if (ExtendedVT == nullptr)
*0fca6ea1SDimitry Andric    return; // Not an FT value.
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric  if (Map.hasShadow(&Root))
*0fca6ea1SDimitry Andric    return; // Shadow already exists.
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric  assert(!isa<PHINode>(Root) && "phi nodes should already have shadows");
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric  std::vector<Instruction *> DfsStack(1, &Root);
*0fca6ea1SDimitry Andric  while (!DfsStack.empty()) {
*0fca6ea1SDimitry Andric    // Ensure that all operands to the instruction have shadows before
*0fca6ea1SDimitry Andric    // proceeding.
*0fca6ea1SDimitry Andric    Instruction *I = DfsStack.back();
*0fca6ea1SDimitry Andric    // The shadow for the instruction might have been created deeper in the DFS,
*0fca6ea1SDimitry Andric    // see `forward_use_with_two_uses` test.
*0fca6ea1SDimitry Andric    if (Map.hasShadow(I)) {
*0fca6ea1SDimitry Andric      DfsStack.pop_back();
*0fca6ea1SDimitry Andric      continue;
*0fca6ea1SDimitry Andric    }
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric    bool MissingShadow = false;
*0fca6ea1SDimitry Andric    for (Value *Op : I->operands()) {
*0fca6ea1SDimitry Andric      Type *VT = Op->getType();
*0fca6ea1SDimitry Andric      if (!Config.getExtendedFPType(VT))
*0fca6ea1SDimitry Andric        continue; // Not an FT value.
*0fca6ea1SDimitry Andric      if (Map.hasShadow(Op))
*0fca6ea1SDimitry Andric        continue; // Shadow is already available.
*0fca6ea1SDimitry Andric      MissingShadow = true;
*0fca6ea1SDimitry Andric      DfsStack.push_back(cast<Instruction>(Op));
*0fca6ea1SDimitry Andric    }
*0fca6ea1SDimitry Andric    if (MissingShadow)
*0fca6ea1SDimitry Andric      continue; // Process operands and come back to this instruction later.
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric    // All operands have shadows. Create a shadow for the current value.
*0fca6ea1SDimitry Andric    Value *Shadow = createShadowValueWithOperandsAvailable(*I, TLI, Map);
*0fca6ea1SDimitry Andric    Map.setShadow(*I, *Shadow);
*0fca6ea1SDimitry Andric    DfsStack.pop_back();
*0fca6ea1SDimitry Andric  }
*0fca6ea1SDimitry Andric}
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric// A floating-point store needs its value and type written to shadow memory.
*0fca6ea1SDimitry Andricvoid NumericalStabilitySanitizer::propagateFTStore(
*0fca6ea1SDimitry Andric    StoreInst &Store, Type *VT, Type *ExtendedVT, const ValueToShadowMap &Map) {
*0fca6ea1SDimitry Andric  Value *StoredValue = Store.getValueOperand();
*0fca6ea1SDimitry Andric  IRBuilder<> Builder(&Store);
*0fca6ea1SDimitry Andric  Builder.SetCurrentDebugLocation(Store.getDebugLoc());
*0fca6ea1SDimitry Andric  const auto Extents = getMemoryExtentsOrDie(VT);
*0fca6ea1SDimitry Andric  Value *ShadowPtr = Builder.CreateCall(
*0fca6ea1SDimitry Andric      NsanGetShadowPtrForStore[Extents.ValueType],
*0fca6ea1SDimitry Andric      {Store.getPointerOperand(), ConstantInt::get(IntptrTy, Extents.NumElts)});
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric  Value *StoredShadow = Map.getShadow(StoredValue);
*0fca6ea1SDimitry Andric  if (!Store.getParent()->getParent()->hasOptNone()) {
*0fca6ea1SDimitry Andric    // Only check stores when optimizing, because non-optimized code generates
*0fca6ea1SDimitry Andric    // too many stores to the stack, creating false positives.
*0fca6ea1SDimitry Andric    if (ClCheckStores) {
*0fca6ea1SDimitry Andric      StoredShadow = emitCheck(StoredValue, StoredShadow, Builder,
*0fca6ea1SDimitry Andric                               CheckLoc::makeStore(Store.getPointerOperand()));
*0fca6ea1SDimitry Andric      ++NumInstrumentedFTStores;
*0fca6ea1SDimitry Andric    }
*0fca6ea1SDimitry Andric  }
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric  Builder.CreateAlignedStore(StoredShadow, ShadowPtr, Align(1),
*0fca6ea1SDimitry Andric                             Store.isVolatile());
*0fca6ea1SDimitry Andric}
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric// A non-ft store needs to invalidate shadow memory. Exceptions are:
*0fca6ea1SDimitry Andric//   - memory transfers of floating-point data through other pointer types (llvm
*0fca6ea1SDimitry Andric//     optimization passes transform `*(float*)a = *(float*)b` into
*0fca6ea1SDimitry Andric//     `*(i32*)a = *(i32*)b` ). These have the same semantics as memcpy.
*0fca6ea1SDimitry Andric//   - Writes of FT-sized constants. LLVM likes to do float stores as bitcasted
*0fca6ea1SDimitry Andric//     ints. Note that this is not really necessary because if the value is
*0fca6ea1SDimitry Andric//     unknown the framework will re-extend it on load anyway. It just felt
*0fca6ea1SDimitry Andric//     easier to debug tests with vectors of FTs.
*0fca6ea1SDimitry Andricvoid NumericalStabilitySanitizer::propagateNonFTStore(
*0fca6ea1SDimitry Andric    StoreInst &Store, Type *VT, const ValueToShadowMap &Map) {
*0fca6ea1SDimitry Andric  Value *PtrOp = Store.getPointerOperand();
*0fca6ea1SDimitry Andric  IRBuilder<> Builder(Store.getNextNode());
*0fca6ea1SDimitry Andric  Builder.SetCurrentDebugLocation(Store.getDebugLoc());
*0fca6ea1SDimitry Andric  Value *Dst = PtrOp;
*0fca6ea1SDimitry Andric  TypeSize SlotSize = DL.getTypeStoreSize(VT);
*0fca6ea1SDimitry Andric  assert(!SlotSize.isScalable() && "unsupported");
*0fca6ea1SDimitry Andric  const auto LoadSizeBytes = SlotSize.getFixedValue();
*0fca6ea1SDimitry Andric  Value *ValueSize = Constant::getIntegerValue(
*0fca6ea1SDimitry Andric      IntptrTy, APInt(IntptrTy->getPrimitiveSizeInBits(), LoadSizeBytes));
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric  ++NumInstrumentedNonFTStores;
*0fca6ea1SDimitry Andric  Value *StoredValue = Store.getValueOperand();
*0fca6ea1SDimitry Andric  if (LoadInst *Load = dyn_cast<LoadInst>(StoredValue)) {
*0fca6ea1SDimitry Andric    // TODO: Handle the case when the value is from a phi.
*0fca6ea1SDimitry Andric    // This is a memory transfer with memcpy semantics. Copy the type and
*0fca6ea1SDimitry Andric    // value from the source. Note that we cannot use __nsan_copy_values()
*0fca6ea1SDimitry Andric    // here, because that will not work when there is a write to memory in
*0fca6ea1SDimitry Andric    // between the load and the store, e.g. in the case of a swap.
*0fca6ea1SDimitry Andric    Type *ShadowTypeIntTy = Type::getIntNTy(Context, 8 * LoadSizeBytes);
*0fca6ea1SDimitry Andric    Type *ShadowValueIntTy =
*0fca6ea1SDimitry Andric        Type::getIntNTy(Context, 8 * kShadowScale * LoadSizeBytes);
*0fca6ea1SDimitry Andric    IRBuilder<> LoadBuilder(Load->getNextNode());
*0fca6ea1SDimitry Andric    Builder.SetCurrentDebugLocation(Store.getDebugLoc());
*0fca6ea1SDimitry Andric    Value *LoadSrc = Load->getPointerOperand();
*0fca6ea1SDimitry Andric    // Read the shadow type and value at load time. The type has the same size
*0fca6ea1SDimitry Andric    // as the FT value, the value has twice its size.
*0fca6ea1SDimitry Andric    // TODO: cache them to avoid re-creating them when a load is used by
*0fca6ea1SDimitry Andric    // several stores. Maybe create them like the FT shadows when a load is
*0fca6ea1SDimitry Andric    // encountered.
*0fca6ea1SDimitry Andric    Value *RawShadowType = LoadBuilder.CreateAlignedLoad(
*0fca6ea1SDimitry Andric        ShadowTypeIntTy,
*0fca6ea1SDimitry Andric        LoadBuilder.CreateCall(NsanGetRawShadowTypePtr, {LoadSrc}), Align(1),
*0fca6ea1SDimitry Andric        /*isVolatile=*/false);
*0fca6ea1SDimitry Andric    Value *RawShadowValue = LoadBuilder.CreateAlignedLoad(
*0fca6ea1SDimitry Andric        ShadowValueIntTy,
*0fca6ea1SDimitry Andric        LoadBuilder.CreateCall(NsanGetRawShadowPtr, {LoadSrc}), Align(1),
*0fca6ea1SDimitry Andric        /*isVolatile=*/false);
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric    // Write back the shadow type and value at store time.
*0fca6ea1SDimitry Andric    Builder.CreateAlignedStore(
*0fca6ea1SDimitry Andric        RawShadowType, Builder.CreateCall(NsanGetRawShadowTypePtr, {Dst}),
*0fca6ea1SDimitry Andric        Align(1),
*0fca6ea1SDimitry Andric        /*isVolatile=*/false);
*0fca6ea1SDimitry Andric    Builder.CreateAlignedStore(RawShadowValue,
*0fca6ea1SDimitry Andric                               Builder.CreateCall(NsanGetRawShadowPtr, {Dst}),
*0fca6ea1SDimitry Andric                               Align(1),
*0fca6ea1SDimitry Andric                               /*isVolatile=*/false);
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric    ++NumInstrumentedNonFTMemcpyStores;
*0fca6ea1SDimitry Andric    return;
*0fca6ea1SDimitry Andric  }
*0fca6ea1SDimitry Andric  // ClPropagateNonFTConstStoresAsFT is by default false.
*0fca6ea1SDimitry Andric  if (Constant *C; ClPropagateNonFTConstStoresAsFT &&
*0fca6ea1SDimitry Andric                   (C = dyn_cast<Constant>(StoredValue))) {
*0fca6ea1SDimitry Andric    // This might be a fp constant stored as an int. Bitcast and store if it has
*0fca6ea1SDimitry Andric    // appropriate size.
*0fca6ea1SDimitry Andric    Type *BitcastTy = nullptr; // The FT type to bitcast to.
*0fca6ea1SDimitry Andric    if (auto *CInt = dyn_cast<ConstantInt>(C)) {
*0fca6ea1SDimitry Andric      switch (CInt->getType()->getScalarSizeInBits()) {
*0fca6ea1SDimitry Andric      case 32:
*0fca6ea1SDimitry Andric        BitcastTy = Type::getFloatTy(Context);
*0fca6ea1SDimitry Andric        break;
*0fca6ea1SDimitry Andric      case 64:
*0fca6ea1SDimitry Andric        BitcastTy = Type::getDoubleTy(Context);
*0fca6ea1SDimitry Andric        break;
*0fca6ea1SDimitry Andric      case 80:
*0fca6ea1SDimitry Andric        BitcastTy = Type::getX86_FP80Ty(Context);
*0fca6ea1SDimitry Andric        break;
*0fca6ea1SDimitry Andric      default:
*0fca6ea1SDimitry Andric        break;
*0fca6ea1SDimitry Andric      }
*0fca6ea1SDimitry Andric    } else if (auto *CDV = dyn_cast<ConstantDataVector>(C)) {
*0fca6ea1SDimitry Andric      const int NumElements =
*0fca6ea1SDimitry Andric          cast<VectorType>(CDV->getType())->getElementCount().getFixedValue();
*0fca6ea1SDimitry Andric      switch (CDV->getType()->getScalarSizeInBits()) {
*0fca6ea1SDimitry Andric      case 32:
*0fca6ea1SDimitry Andric        BitcastTy =
*0fca6ea1SDimitry Andric            VectorType::get(Type::getFloatTy(Context), NumElements, false);
*0fca6ea1SDimitry Andric        break;
*0fca6ea1SDimitry Andric      case 64:
*0fca6ea1SDimitry Andric        BitcastTy =
*0fca6ea1SDimitry Andric            VectorType::get(Type::getDoubleTy(Context), NumElements, false);
*0fca6ea1SDimitry Andric        break;
*0fca6ea1SDimitry Andric      case 80:
*0fca6ea1SDimitry Andric        BitcastTy =
*0fca6ea1SDimitry Andric            VectorType::get(Type::getX86_FP80Ty(Context), NumElements, false);
*0fca6ea1SDimitry Andric        break;
*0fca6ea1SDimitry Andric      default:
*0fca6ea1SDimitry Andric        break;
*0fca6ea1SDimitry Andric      }
*0fca6ea1SDimitry Andric    }
*0fca6ea1SDimitry Andric    if (BitcastTy) {
*0fca6ea1SDimitry Andric      const MemoryExtents Extents = getMemoryExtentsOrDie(BitcastTy);
*0fca6ea1SDimitry Andric      Value *ShadowPtr = Builder.CreateCall(
*0fca6ea1SDimitry Andric          NsanGetShadowPtrForStore[Extents.ValueType],
*0fca6ea1SDimitry Andric          {PtrOp, ConstantInt::get(IntptrTy, Extents.NumElts)});
*0fca6ea1SDimitry Andric      // Bitcast the integer value to the appropriate FT type and extend to 2FT.
*0fca6ea1SDimitry Andric      Type *ExtVT = Config.getExtendedFPType(BitcastTy);
*0fca6ea1SDimitry Andric      Value *Shadow =
*0fca6ea1SDimitry Andric          Builder.CreateFPExt(Builder.CreateBitCast(C, BitcastTy), ExtVT);
*0fca6ea1SDimitry Andric      Builder.CreateAlignedStore(Shadow, ShadowPtr, Align(1),
*0fca6ea1SDimitry Andric                                 Store.isVolatile());
*0fca6ea1SDimitry Andric      return;
*0fca6ea1SDimitry Andric    }
*0fca6ea1SDimitry Andric  }
*0fca6ea1SDimitry Andric  // All other stores just reset the shadow value to unknown.
*0fca6ea1SDimitry Andric  Builder.CreateCall(NsanSetValueUnknown, {Dst, ValueSize});
*0fca6ea1SDimitry Andric}
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andricvoid NumericalStabilitySanitizer::propagateShadowValues(
*0fca6ea1SDimitry Andric    Instruction &Inst, const TargetLibraryInfo &TLI,
*0fca6ea1SDimitry Andric    const ValueToShadowMap &Map) {
*0fca6ea1SDimitry Andric  if (auto *Store = dyn_cast<StoreInst>(&Inst)) {
*0fca6ea1SDimitry Andric    Value *StoredValue = Store->getValueOperand();
*0fca6ea1SDimitry Andric    Type *VT = StoredValue->getType();
*0fca6ea1SDimitry Andric    Type *ExtendedVT = Config.getExtendedFPType(VT);
*0fca6ea1SDimitry Andric    if (ExtendedVT == nullptr)
*0fca6ea1SDimitry Andric      return propagateNonFTStore(*Store, VT, Map);
*0fca6ea1SDimitry Andric    return propagateFTStore(*Store, VT, ExtendedVT, Map);
*0fca6ea1SDimitry Andric  }
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric  if (auto *FCmp = dyn_cast<FCmpInst>(&Inst)) {
*0fca6ea1SDimitry Andric    emitFCmpCheck(*FCmp, Map);
*0fca6ea1SDimitry Andric    return;
*0fca6ea1SDimitry Andric  }
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric  if (auto *CB = dyn_cast<CallBase>(&Inst)) {
*0fca6ea1SDimitry Andric    maybeAddSuffixForNsanInterface(CB);
*0fca6ea1SDimitry Andric    if (CallInst *CI = dyn_cast<CallInst>(&Inst))
*0fca6ea1SDimitry Andric      maybeMarkSanitizerLibraryCallNoBuiltin(CI, &TLI);
*0fca6ea1SDimitry Andric    if (MemIntrinsic *MI = dyn_cast<MemIntrinsic>(&Inst)) {
*0fca6ea1SDimitry Andric      instrumentMemIntrinsic(MI);
*0fca6ea1SDimitry Andric      return;
*0fca6ea1SDimitry Andric    }
*0fca6ea1SDimitry Andric    populateShadowStack(*CB, TLI, Map);
*0fca6ea1SDimitry Andric    return;
*0fca6ea1SDimitry Andric  }
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric  if (auto *RetInst = dyn_cast<ReturnInst>(&Inst)) {
*0fca6ea1SDimitry Andric    if (!ClCheckRet)
*0fca6ea1SDimitry Andric      return;
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric    Value *RV = RetInst->getReturnValue();
*0fca6ea1SDimitry Andric    if (RV == nullptr)
*0fca6ea1SDimitry Andric      return; // This is a `ret void`.
*0fca6ea1SDimitry Andric    Type *VT = RV->getType();
*0fca6ea1SDimitry Andric    Type *ExtendedVT = Config.getExtendedFPType(VT);
*0fca6ea1SDimitry Andric    if (ExtendedVT == nullptr)
*0fca6ea1SDimitry Andric      return; // Not an FT ret.
*0fca6ea1SDimitry Andric    Value *RVShadow = Map.getShadow(RV);
*0fca6ea1SDimitry Andric    IRBuilder<> Builder(RetInst);
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric    RVShadow = emitCheck(RV, RVShadow, Builder, CheckLoc::makeRet());
*0fca6ea1SDimitry Andric    ++NumInstrumentedFTRets;
*0fca6ea1SDimitry Andric    // Store tag.
*0fca6ea1SDimitry Andric    Value *FnAddr =
*0fca6ea1SDimitry Andric        Builder.CreatePtrToInt(Inst.getParent()->getParent(), IntptrTy);
*0fca6ea1SDimitry Andric    Builder.CreateStore(FnAddr, NsanShadowRetTag);
*0fca6ea1SDimitry Andric    // Store value.
*0fca6ea1SDimitry Andric    Value *ShadowRetValPtr =
*0fca6ea1SDimitry Andric        Builder.CreateConstGEP2_64(NsanShadowRetType, NsanShadowRetPtr, 0, 0);
*0fca6ea1SDimitry Andric    Builder.CreateStore(RVShadow, ShadowRetValPtr);
*0fca6ea1SDimitry Andric    return;
*0fca6ea1SDimitry Andric  }
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric  if (InsertValueInst *Insert = dyn_cast<InsertValueInst>(&Inst)) {
*0fca6ea1SDimitry Andric    Value *V = Insert->getOperand(1);
*0fca6ea1SDimitry Andric    Type *VT = V->getType();
*0fca6ea1SDimitry Andric    Type *ExtendedVT = Config.getExtendedFPType(VT);
*0fca6ea1SDimitry Andric    if (ExtendedVT == nullptr)
*0fca6ea1SDimitry Andric      return;
*0fca6ea1SDimitry Andric    IRBuilder<> Builder(Insert);
*0fca6ea1SDimitry Andric    emitCheck(V, Map.getShadow(V), Builder, CheckLoc::makeInsert());
*0fca6ea1SDimitry Andric    return;
*0fca6ea1SDimitry Andric  }
*0fca6ea1SDimitry Andric}
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric// Moves fast math flags from the function to individual instructions, and
*0fca6ea1SDimitry Andric// removes the attribute from the function.
*0fca6ea1SDimitry Andric// TODO: Make this controllable with a flag.
*0fca6ea1SDimitry Andricstatic void moveFastMathFlags(Function &F,
*0fca6ea1SDimitry Andric                              std::vector<Instruction *> &Instructions) {
*0fca6ea1SDimitry Andric  FastMathFlags FMF;
*0fca6ea1SDimitry Andric#define MOVE_FLAG(attr, setter)                                                \
*0fca6ea1SDimitry Andric  if (F.getFnAttribute(attr).getValueAsString() == "true") {                   \
*0fca6ea1SDimitry Andric    F.removeFnAttr(attr);                                                      \
*0fca6ea1SDimitry Andric    FMF.set##setter();                                                         \
*0fca6ea1SDimitry Andric  }
*0fca6ea1SDimitry Andric  MOVE_FLAG("unsafe-fp-math", Fast)
*0fca6ea1SDimitry Andric  MOVE_FLAG("no-infs-fp-math", NoInfs)
*0fca6ea1SDimitry Andric  MOVE_FLAG("no-nans-fp-math", NoNaNs)
*0fca6ea1SDimitry Andric  MOVE_FLAG("no-signed-zeros-fp-math", NoSignedZeros)
*0fca6ea1SDimitry Andric#undef MOVE_FLAG
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric  for (Instruction *I : Instructions)
*0fca6ea1SDimitry Andric    if (isa<FPMathOperator>(I))
*0fca6ea1SDimitry Andric      I->setFastMathFlags(FMF);
*0fca6ea1SDimitry Andric}
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andricbool NumericalStabilitySanitizer::sanitizeFunction(
*0fca6ea1SDimitry Andric    Function &F, const TargetLibraryInfo &TLI) {
*0fca6ea1SDimitry Andric  if (!F.hasFnAttribute(Attribute::SanitizeNumericalStability))
*0fca6ea1SDimitry Andric    return false;
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric  // This is required to prevent instrumenting call to __nsan_init from within
*0fca6ea1SDimitry Andric  // the module constructor.
*0fca6ea1SDimitry Andric  if (F.getName() == kNsanModuleCtorName)
*0fca6ea1SDimitry Andric    return false;
*0fca6ea1SDimitry Andric  SmallVector<Instruction *, 8> AllLoadsAndStores;
*0fca6ea1SDimitry Andric  SmallVector<Instruction *, 8> LocalLoadsAndStores;
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric  // The instrumentation maintains:
*0fca6ea1SDimitry Andric  //  - for each IR value `v` of floating-point (or vector floating-point) type
*0fca6ea1SDimitry Andric  //    FT, a shadow IR value `s(v)` with twice the precision 2FT (e.g.
*0fca6ea1SDimitry Andric  //    double for float and f128 for double).
*0fca6ea1SDimitry Andric  //  - A shadow memory, which stores `s(v)` for any `v` that has been stored,
*0fca6ea1SDimitry Andric  //    along with a shadow memory tag, which stores whether the value in the
*0fca6ea1SDimitry Andric  //    corresponding shadow memory is valid. Note that this might be
*0fca6ea1SDimitry Andric  //    incorrect if a non-instrumented function stores to memory, or if
*0fca6ea1SDimitry Andric  //    memory is stored to through a char pointer.
*0fca6ea1SDimitry Andric  //  - A shadow stack, which holds `s(v)` for any floating-point argument `v`
*0fca6ea1SDimitry Andric  //    of a call to an instrumented function. This allows
*0fca6ea1SDimitry Andric  //    instrumented functions to retrieve the shadow values for their
*0fca6ea1SDimitry Andric  //    arguments.
*0fca6ea1SDimitry Andric  //    Because instrumented functions can be called from non-instrumented
*0fca6ea1SDimitry Andric  //    functions, the stack needs to include a tag so that the instrumented
*0fca6ea1SDimitry Andric  //    function knows whether shadow values are available for their
*0fca6ea1SDimitry Andric  //    parameters (i.e. whether is was called by an instrumented function).
*0fca6ea1SDimitry Andric  //    When shadow arguments are not available, they have to be recreated by
*0fca6ea1SDimitry Andric  //    extending the precision of the non-shadow arguments to the non-shadow
*0fca6ea1SDimitry Andric  //    value. Non-instrumented functions do not modify (or even know about) the
*0fca6ea1SDimitry Andric  //    shadow stack. The shadow stack pointer is __nsan_shadow_args. The shadow
*0fca6ea1SDimitry Andric  //    stack tag is __nsan_shadow_args_tag. The tag is any unique identifier
*0fca6ea1SDimitry Andric  //    for the function (we use the address of the function). Both variables
*0fca6ea1SDimitry Andric  //    are thread local.
*0fca6ea1SDimitry Andric  //    Example:
*0fca6ea1SDimitry Andric  //     calls                             shadow stack tag      shadow stack
*0fca6ea1SDimitry Andric  //     =======================================================================
*0fca6ea1SDimitry Andric  //     non_instrumented_1()              0                     0
*0fca6ea1SDimitry Andric  //             |
*0fca6ea1SDimitry Andric  //             v
*0fca6ea1SDimitry Andric  //     instrumented_2(float a)           0                     0
*0fca6ea1SDimitry Andric  //             |
*0fca6ea1SDimitry Andric  //             v
*0fca6ea1SDimitry Andric  //     instrumented_3(float b, double c) &instrumented_3       s(b),s(c)
*0fca6ea1SDimitry Andric  //             |
*0fca6ea1SDimitry Andric  //             v
*0fca6ea1SDimitry Andric  //     instrumented_4(float d)           &instrumented_4       s(d)
*0fca6ea1SDimitry Andric  //             |
*0fca6ea1SDimitry Andric  //             v
*0fca6ea1SDimitry Andric  //     non_instrumented_5(float e)       &non_instrumented_5   s(e)
*0fca6ea1SDimitry Andric  //             |
*0fca6ea1SDimitry Andric  //             v
*0fca6ea1SDimitry Andric  //     instrumented_6(float f)           &non_instrumented_5   s(e)
*0fca6ea1SDimitry Andric  //
*0fca6ea1SDimitry Andric  //   On entry, instrumented_2 checks whether the tag corresponds to its
*0fca6ea1SDimitry Andric  //   function ptr.
*0fca6ea1SDimitry Andric  //   Note that functions reset the tag to 0 after reading shadow parameters.
*0fca6ea1SDimitry Andric  //   This ensures that the function does not erroneously read invalid data if
*0fca6ea1SDimitry Andric  //   called twice in the same stack, once from an instrumented function and
*0fca6ea1SDimitry Andric  //   once from an uninstrumented one. For example, in the following example,
*0fca6ea1SDimitry Andric  //   resetting the tag in (A) ensures that (B) does not reuse the same the
*0fca6ea1SDimitry Andric  //   shadow arguments (which would be incorrect).
*0fca6ea1SDimitry Andric  //      instrumented_1(float a)
*0fca6ea1SDimitry Andric  //             |
*0fca6ea1SDimitry Andric  //             v
*0fca6ea1SDimitry Andric  //      instrumented_2(float b)  (A)
*0fca6ea1SDimitry Andric  //             |
*0fca6ea1SDimitry Andric  //             v
*0fca6ea1SDimitry Andric  //      non_instrumented_3()
*0fca6ea1SDimitry Andric  //             |
*0fca6ea1SDimitry Andric  //             v
*0fca6ea1SDimitry Andric  //      instrumented_2(float b)  (B)
*0fca6ea1SDimitry Andric  //
*0fca6ea1SDimitry Andric  //  - A shadow return slot. Any function that returns a floating-point value
*0fca6ea1SDimitry Andric  //    places a shadow return value in __nsan_shadow_ret_val. Again, because
*0fca6ea1SDimitry Andric  //    we might be calling non-instrumented functions, this value is guarded
*0fca6ea1SDimitry Andric  //    by __nsan_shadow_ret_tag marker indicating which instrumented function
*0fca6ea1SDimitry Andric  //    placed the value in __nsan_shadow_ret_val, so that the caller can check
*0fca6ea1SDimitry Andric  //    that this corresponds to the callee. Both variables are thread local.
*0fca6ea1SDimitry Andric  //
*0fca6ea1SDimitry Andric  //    For example, in the following example, the instrumentation in
*0fca6ea1SDimitry Andric  //    `instrumented_1` rejects the shadow return value from `instrumented_3`
*0fca6ea1SDimitry Andric  //    because is is not tagged as expected (`&instrumented_3` instead of
*0fca6ea1SDimitry Andric  //    `non_instrumented_2`):
*0fca6ea1SDimitry Andric  //
*0fca6ea1SDimitry Andric  //        instrumented_1()
*0fca6ea1SDimitry Andric  //            |
*0fca6ea1SDimitry Andric  //            v
*0fca6ea1SDimitry Andric  //        float non_instrumented_2()
*0fca6ea1SDimitry Andric  //            |
*0fca6ea1SDimitry Andric  //            v
*0fca6ea1SDimitry Andric  //        float instrumented_3()
*0fca6ea1SDimitry Andric  //
*0fca6ea1SDimitry Andric  // Calls of known math functions (sin, cos, exp, ...) are duplicated to call
*0fca6ea1SDimitry Andric  // their overload on the shadow type.
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric  // Collect all instructions before processing, as creating shadow values
*0fca6ea1SDimitry Andric  // creates new instructions inside the function.
*0fca6ea1SDimitry Andric  std::vector<Instruction *> OriginalInstructions;
*0fca6ea1SDimitry Andric  for (BasicBlock &BB : F)
*0fca6ea1SDimitry Andric    for (Instruction &Inst : BB)
*0fca6ea1SDimitry Andric      OriginalInstructions.emplace_back(&Inst);
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric  moveFastMathFlags(F, OriginalInstructions);
*0fca6ea1SDimitry Andric  ValueToShadowMap ValueToShadow(Config);
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric  // In the first pass, we create shadow values for all FT function arguments
*0fca6ea1SDimitry Andric  // and all phis. This ensures that the DFS of the next pass does not have
*0fca6ea1SDimitry Andric  // any loops.
*0fca6ea1SDimitry Andric  std::vector<PHINode *> OriginalPhis;
*0fca6ea1SDimitry Andric  createShadowArguments(F, TLI, ValueToShadow);
*0fca6ea1SDimitry Andric  for (Instruction *I : OriginalInstructions) {
*0fca6ea1SDimitry Andric    if (PHINode *Phi = dyn_cast<PHINode>(I)) {
*0fca6ea1SDimitry Andric      if (PHINode *Shadow = maybeCreateShadowPhi(*Phi, TLI)) {
*0fca6ea1SDimitry Andric        OriginalPhis.push_back(Phi);
*0fca6ea1SDimitry Andric        ValueToShadow.setShadow(*Phi, *Shadow);
*0fca6ea1SDimitry Andric      }
*0fca6ea1SDimitry Andric    }
*0fca6ea1SDimitry Andric  }
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric  // Create shadow values for all instructions creating FT values.
*0fca6ea1SDimitry Andric  for (Instruction *I : OriginalInstructions)
*0fca6ea1SDimitry Andric    maybeCreateShadowValue(*I, TLI, ValueToShadow);
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric  // Propagate shadow values across stores, calls and rets.
*0fca6ea1SDimitry Andric  for (Instruction *I : OriginalInstructions)
*0fca6ea1SDimitry Andric    propagateShadowValues(*I, TLI, ValueToShadow);
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric  // The last pass populates shadow phis with shadow values.
*0fca6ea1SDimitry Andric  for (PHINode *Phi : OriginalPhis) {
*0fca6ea1SDimitry Andric    PHINode *ShadowPhi = dyn_cast<PHINode>(ValueToShadow.getShadow(Phi));
*0fca6ea1SDimitry Andric    for (unsigned I : seq(Phi->getNumOperands())) {
*0fca6ea1SDimitry Andric      Value *V = Phi->getOperand(I);
*0fca6ea1SDimitry Andric      Value *Shadow = ValueToShadow.getShadow(V);
*0fca6ea1SDimitry Andric      BasicBlock *IncomingBB = Phi->getIncomingBlock(I);
*0fca6ea1SDimitry Andric      // For some instructions (e.g. invoke), we create the shadow in a separate
*0fca6ea1SDimitry Andric      // block, different from the block where the original value is created.
*0fca6ea1SDimitry Andric      // In that case, the shadow phi might need to refer to this block instead
*0fca6ea1SDimitry Andric      // of the original block.
*0fca6ea1SDimitry Andric      // Note that this can only happen for instructions as constant shadows are
*0fca6ea1SDimitry Andric      // always created in the same block.
*0fca6ea1SDimitry Andric      ShadowPhi->addIncoming(Shadow, IncomingBB);
*0fca6ea1SDimitry Andric    }
*0fca6ea1SDimitry Andric  }
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric  return !ValueToShadow.empty();
*0fca6ea1SDimitry Andric}
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric// Instrument the memory intrinsics so that they properly modify the shadow
*0fca6ea1SDimitry Andric// memory.
*0fca6ea1SDimitry Andricbool NumericalStabilitySanitizer::instrumentMemIntrinsic(MemIntrinsic *MI) {
*0fca6ea1SDimitry Andric  IRBuilder<> Builder(MI);
*0fca6ea1SDimitry Andric  if (auto *M = dyn_cast<MemSetInst>(MI)) {
*0fca6ea1SDimitry Andric    Builder.CreateCall(
*0fca6ea1SDimitry Andric        NsanSetValueUnknown,
*0fca6ea1SDimitry Andric        {/*Address=*/M->getArgOperand(0),
*0fca6ea1SDimitry Andric         /*Size=*/Builder.CreateIntCast(M->getArgOperand(2), IntptrTy, false)});
*0fca6ea1SDimitry Andric  } else if (auto *M = dyn_cast<MemTransferInst>(MI)) {
*0fca6ea1SDimitry Andric    Builder.CreateCall(
*0fca6ea1SDimitry Andric        NsanCopyValues,
*0fca6ea1SDimitry Andric        {/*Destination=*/M->getArgOperand(0),
*0fca6ea1SDimitry Andric         /*Source=*/M->getArgOperand(1),
*0fca6ea1SDimitry Andric         /*Size=*/Builder.CreateIntCast(M->getArgOperand(2), IntptrTy, false)});
*0fca6ea1SDimitry Andric  }
*0fca6ea1SDimitry Andric  return false;
*0fca6ea1SDimitry Andric}
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andricvoid NumericalStabilitySanitizer::maybeAddSuffixForNsanInterface(CallBase *CI) {
*0fca6ea1SDimitry Andric  Function *Fn = CI->getCalledFunction();
*0fca6ea1SDimitry Andric  if (Fn == nullptr)
*0fca6ea1SDimitry Andric    return;
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric  if (!Fn->getName().starts_with("__nsan_"))
*0fca6ea1SDimitry Andric    return;
*0fca6ea1SDimitry Andric
*0fca6ea1SDimitry Andric  if (Fn->getName() == "__nsan_dump_shadow_mem") {
*0fca6ea1SDimitry Andric    assert(CI->arg_size() == 4 &&
*0fca6ea1SDimitry Andric           "invalid prototype for __nsan_dump_shadow_mem");
*0fca6ea1SDimitry Andric    // __nsan_dump_shadow_mem requires an extra parameter with the dynamic
*0fca6ea1SDimitry Andric    // configuration:
*0fca6ea1SDimitry Andric    // (shadow_type_id_for_long_double << 16) | (shadow_type_id_for_double << 8)
*0fca6ea1SDimitry Andric    // | shadow_type_id_for_double
*0fca6ea1SDimitry Andric    const uint64_t shadow_value_type_ids =
*0fca6ea1SDimitry Andric        (static_cast<size_t>(Config.byValueType(kLongDouble).getNsanTypeId())
*0fca6ea1SDimitry Andric         << 16) |
*0fca6ea1SDimitry Andric        (static_cast<size_t>(Config.byValueType(kDouble).getNsanTypeId())
*0fca6ea1SDimitry Andric         << 8) |
*0fca6ea1SDimitry Andric        static_cast<size_t>(Config.byValueType(kFloat).getNsanTypeId());
*0fca6ea1SDimitry Andric    CI->setArgOperand(3, ConstantInt::get(IntptrTy, shadow_value_type_ids));
*0fca6ea1SDimitry Andric  }
*0fca6ea1SDimitry Andric}