src/ryu/d2s.cpp

abb5dd6eSMark de Wever//===----------------------------------------------------------------------===//
abb5dd6eSMark de Wever//
abb5dd6eSMark de Wever// Part of the LLVM Project, under the Apache License v2.0 with LLVM Exceptions.
abb5dd6eSMark de Wever// See https://llvm.org/LICENSE.txt for license information.
abb5dd6eSMark de Wever// SPDX-License-Identifier: Apache-2.0 WITH LLVM-exception
abb5dd6eSMark de Wever//
abb5dd6eSMark de Wever//===----------------------------------------------------------------------===//
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever// Copyright (c) Microsoft Corporation.
abb5dd6eSMark de Wever// SPDX-License-Identifier: Apache-2.0 WITH LLVM-exception
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever// Copyright 2018 Ulf Adams
abb5dd6eSMark de Wever// Copyright (c) Microsoft Corporation. All rights reserved.
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever// Boost Software License - Version 1.0 - August 17th, 2003
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever// Permission is hereby granted, free of charge, to any person or organization
abb5dd6eSMark de Wever// obtaining a copy of the software and accompanying documentation covered by
abb5dd6eSMark de Wever// this license (the "Software") to use, reproduce, display, distribute,
abb5dd6eSMark de Wever// execute, and transmit the Software, and to prepare derivative works of the
abb5dd6eSMark de Wever// Software, and to permit third-parties to whom the Software is furnished to
abb5dd6eSMark de Wever// do so, all subject to the following:
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever// The copyright notices in the Software and this entire statement, including
abb5dd6eSMark de Wever// the above license grant, this restriction and the following disclaimer,
abb5dd6eSMark de Wever// must be included in all copies of the Software, in whole or in part, and
abb5dd6eSMark de Wever// all derivative works of the Software, unless such copies or derivative
abb5dd6eSMark de Wever// works are solely in the form of machine-executable object code generated by
abb5dd6eSMark de Wever// a source language processor.
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever// THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND, EXPRESS OR
abb5dd6eSMark de Wever// IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF MERCHANTABILITY,
abb5dd6eSMark de Wever// FITNESS FOR A PARTICULAR PURPOSE, TITLE AND NON-INFRINGEMENT. IN NO EVENT
abb5dd6eSMark de Wever// SHALL THE COPYRIGHT HOLDERS OR ANYONE DISTRIBUTING THE SOFTWARE BE LIABLE
abb5dd6eSMark de Wever// FOR ANY DAMAGES OR OTHER LIABILITY, WHETHER IN CONTRACT, TORT OR OTHERWISE,
abb5dd6eSMark de Wever// ARISING FROM, OUT OF OR IN CONNECTION WITH THE SOFTWARE OR THE USE OR OTHER
abb5dd6eSMark de Wever// DEALINGS IN THE SOFTWARE.
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever// Avoid formatting to keep the changes with the original code minimal.
abb5dd6eSMark de Wever// clang-format off
abb5dd6eSMark de Wever
f87aa19bSLouis Dionne#include <__assert>
bbb0f2c7SArthur O'Dwyer#include <__config>
bbb0f2c7SArthur O'Dwyer#include <charconv>
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever#include "include/ryu/common.h"
abb5dd6eSMark de Wever#include "include/ryu/d2fixed.h"
abb5dd6eSMark de Wever#include "include/ryu/d2s.h"
abb5dd6eSMark de Wever#include "include/ryu/d2s_full_table.h"
abb5dd6eSMark de Wever#include "include/ryu/d2s_intrinsics.h"
abb5dd6eSMark de Wever#include "include/ryu/digit_table.h"
abb5dd6eSMark de Wever#include "include/ryu/ryu.h"
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever_LIBCPP_BEGIN_NAMESPACE_STD
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever// We need a 64x128-bit multiplication and a subsequent 128-bit shift.
abb5dd6eSMark de Wever// Multiplication:
abb5dd6eSMark de Wever//   The 64-bit factor is variable and passed in, the 128-bit factor comes
abb5dd6eSMark de Wever//   from a lookup table. We know that the 64-bit factor only has 55
abb5dd6eSMark de Wever//   significant bits (i.e., the 9 topmost bits are zeros). The 128-bit
abb5dd6eSMark de Wever//   factor only has 124 significant bits (i.e., the 4 topmost bits are
abb5dd6eSMark de Wever//   zeros).
abb5dd6eSMark de Wever// Shift:
abb5dd6eSMark de Wever//   In principle, the multiplication result requires 55 + 124 = 179 bits to
abb5dd6eSMark de Wever//   represent. However, we then shift this value to the right by __j, which is
abb5dd6eSMark de Wever//   at least __j >= 115, so the result is guaranteed to fit into 179 - 115 = 64
abb5dd6eSMark de Wever//   bits. This means that we only need the topmost 64 significant bits of
abb5dd6eSMark de Wever//   the 64x128-bit multiplication.
abb5dd6eSMark de Wever//
abb5dd6eSMark de Wever// There are several ways to do this:
abb5dd6eSMark de Wever// 1. Best case: the compiler exposes a 128-bit type.
abb5dd6eSMark de Wever//    We perform two 64x64-bit multiplications, add the higher 64 bits of the
abb5dd6eSMark de Wever//    lower result to the higher result, and shift by __j - 64 bits.
abb5dd6eSMark de Wever//
abb5dd6eSMark de Wever//    We explicitly cast from 64-bit to 128-bit, so the compiler can tell
abb5dd6eSMark de Wever//    that these are only 64-bit inputs, and can map these to the best
abb5dd6eSMark de Wever//    possible sequence of assembly instructions.
abb5dd6eSMark de Wever//    x64 machines happen to have matching assembly instructions for
abb5dd6eSMark de Wever//    64x64-bit multiplications and 128-bit shifts.
abb5dd6eSMark de Wever//
abb5dd6eSMark de Wever// 2. Second best case: the compiler exposes intrinsics for the x64 assembly
abb5dd6eSMark de Wever//    instructions mentioned in 1.
abb5dd6eSMark de Wever//
abb5dd6eSMark de Wever// 3. We only have 64x64 bit instructions that return the lower 64 bits of
abb5dd6eSMark de Wever//    the result, i.e., we have to use plain C.
abb5dd6eSMark de Wever//    Our inputs are less than the full width, so we have three options:
abb5dd6eSMark de Wever//    a. Ignore this fact and just implement the intrinsics manually.
abb5dd6eSMark de Wever//    b. Split both into 31-bit pieces, which guarantees no internal overflow,
abb5dd6eSMark de Wever//       but requires extra work upfront (unless we change the lookup table).
abb5dd6eSMark de Wever//    c. Split only the first factor into 31-bit pieces, which also guarantees
abb5dd6eSMark de Wever//       no internal overflow, but requires extra work since the intermediate
abb5dd6eSMark de Wever//       results are not perfectly aligned.
abb5dd6eSMark de Wever#ifdef _LIBCPP_INTRINSIC128
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever[[nodiscard]] _LIBCPP_HIDE_FROM_ABI inline uint64_t __mulShift(const uint64_t __m, const uint64_t* const __mul, const int32_t __j) {
abb5dd6eSMark de Wever  // __m is maximum 55 bits
abb5dd6eSMark de Wever  uint64_t __high1;                                               // 128
abb5dd6eSMark de Wever  const uint64_t __low1 = __ryu_umul128(__m, __mul[1], &__high1); // 64
abb5dd6eSMark de Wever  uint64_t __high0;                                               // 64
abb5dd6eSMark de Wever  (void) __ryu_umul128(__m, __mul[0], &__high0);                  // 0
abb5dd6eSMark de Wever  const uint64_t __sum = __high0 + __low1;
abb5dd6eSMark de Wever  if (__sum < __high0) {
abb5dd6eSMark de Wever    ++__high1; // overflow into __high1
abb5dd6eSMark de Wever  }
abb5dd6eSMark de Wever  return __ryu_shiftright128(__sum, __high1, static_cast<uint32_t>(__j - 64));
abb5dd6eSMark de Wever}
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever[[nodiscard]] _LIBCPP_HIDE_FROM_ABI inline uint64_t __mulShiftAll(const uint64_t __m, const uint64_t* const __mul, const int32_t __j,
abb5dd6eSMark de Wever  uint64_t* const __vp, uint64_t* const __vm, const uint32_t __mmShift) {
abb5dd6eSMark de Wever  *__vp = __mulShift(4 * __m + 2, __mul, __j);
abb5dd6eSMark de Wever  *__vm = __mulShift(4 * __m - 1 - __mmShift, __mul, __j);
abb5dd6eSMark de Wever  return __mulShift(4 * __m, __mul, __j);
abb5dd6eSMark de Wever}
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever#else // ^^^ intrinsics available ^^^ / vvv intrinsics unavailable vvv
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever[[nodiscard]] _LIBCPP_HIDE_FROM_ABI inline _LIBCPP_ALWAYS_INLINE uint64_t __mulShiftAll(uint64_t __m, const uint64_t* const __mul, const int32_t __j,
abb5dd6eSMark de Wever  uint64_t* const __vp, uint64_t* const __vm, const uint32_t __mmShift) { // TRANSITION, VSO-634761
abb5dd6eSMark de Wever  __m <<= 1;
abb5dd6eSMark de Wever  // __m is maximum 55 bits
abb5dd6eSMark de Wever  uint64_t __tmp;
abb5dd6eSMark de Wever  const uint64_t __lo = __ryu_umul128(__m, __mul[0], &__tmp);
abb5dd6eSMark de Wever  uint64_t __hi;
abb5dd6eSMark de Wever  const uint64_t __mid = __tmp + __ryu_umul128(__m, __mul[1], &__hi);
abb5dd6eSMark de Wever  __hi += __mid < __tmp; // overflow into __hi
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever  const uint64_t __lo2 = __lo + __mul[0];
abb5dd6eSMark de Wever  const uint64_t __mid2 = __mid + __mul[1] + (__lo2 < __lo);
abb5dd6eSMark de Wever  const uint64_t __hi2 = __hi + (__mid2 < __mid);
abb5dd6eSMark de Wever  *__vp = __ryu_shiftright128(__mid2, __hi2, static_cast<uint32_t>(__j - 64 - 1));
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever  if (__mmShift == 1) {
abb5dd6eSMark de Wever    const uint64_t __lo3 = __lo - __mul[0];
abb5dd6eSMark de Wever    const uint64_t __mid3 = __mid - __mul[1] - (__lo3 > __lo);
abb5dd6eSMark de Wever    const uint64_t __hi3 = __hi - (__mid3 > __mid);
abb5dd6eSMark de Wever    *__vm = __ryu_shiftright128(__mid3, __hi3, static_cast<uint32_t>(__j - 64 - 1));
abb5dd6eSMark de Wever  } else {
abb5dd6eSMark de Wever    const uint64_t __lo3 = __lo + __lo;
abb5dd6eSMark de Wever    const uint64_t __mid3 = __mid + __mid + (__lo3 < __lo);
abb5dd6eSMark de Wever    const uint64_t __hi3 = __hi + __hi + (__mid3 < __mid);
abb5dd6eSMark de Wever    const uint64_t __lo4 = __lo3 - __mul[0];
abb5dd6eSMark de Wever    const uint64_t __mid4 = __mid3 - __mul[1] - (__lo4 > __lo3);
abb5dd6eSMark de Wever    const uint64_t __hi4 = __hi3 - (__mid4 > __mid3);
abb5dd6eSMark de Wever    *__vm = __ryu_shiftright128(__mid4, __hi4, static_cast<uint32_t>(__j - 64));
abb5dd6eSMark de Wever  }
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever  return __ryu_shiftright128(__mid, __hi, static_cast<uint32_t>(__j - 64 - 1));
abb5dd6eSMark de Wever}
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever#endif // ^^^ intrinsics unavailable ^^^
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever[[nodiscard]] _LIBCPP_HIDE_FROM_ABI inline uint32_t __decimalLength17(const uint64_t __v) {
abb5dd6eSMark de Wever  // This is slightly faster than a loop.
abb5dd6eSMark de Wever  // The average output length is 16.38 digits, so we check high-to-low.
abb5dd6eSMark de Wever  // Function precondition: __v is not an 18, 19, or 20-digit number.
abb5dd6eSMark de Wever  // (17 digits are sufficient for round-tripping.)
bed1a5b3SKonstantin Varlamov  _LIBCPP_ASSERT_INTERNAL(__v < 100000000000000000u, "");
abb5dd6eSMark de Wever  if (__v >= 10000000000000000u) { return 17; }
abb5dd6eSMark de Wever  if (__v >= 1000000000000000u) { return 16; }
abb5dd6eSMark de Wever  if (__v >= 100000000000000u) { return 15; }
abb5dd6eSMark de Wever  if (__v >= 10000000000000u) { return 14; }
abb5dd6eSMark de Wever  if (__v >= 1000000000000u) { return 13; }
abb5dd6eSMark de Wever  if (__v >= 100000000000u) { return 12; }
abb5dd6eSMark de Wever  if (__v >= 10000000000u) { return 11; }
abb5dd6eSMark de Wever  if (__v >= 1000000000u) { return 10; }
abb5dd6eSMark de Wever  if (__v >= 100000000u) { return 9; }
abb5dd6eSMark de Wever  if (__v >= 10000000u) { return 8; }
abb5dd6eSMark de Wever  if (__v >= 1000000u) { return 7; }
abb5dd6eSMark de Wever  if (__v >= 100000u) { return 6; }
abb5dd6eSMark de Wever  if (__v >= 10000u) { return 5; }
abb5dd6eSMark de Wever  if (__v >= 1000u) { return 4; }
abb5dd6eSMark de Wever  if (__v >= 100u) { return 3; }
abb5dd6eSMark de Wever  if (__v >= 10u) { return 2; }
abb5dd6eSMark de Wever  return 1;
abb5dd6eSMark de Wever}
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever// A floating decimal representing m * 10^e.
abb5dd6eSMark de Weverstruct __floating_decimal_64 {
abb5dd6eSMark de Wever  uint64_t __mantissa;
abb5dd6eSMark de Wever  int32_t __exponent;
abb5dd6eSMark de Wever};
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever[[nodiscard]] _LIBCPP_HIDE_FROM_ABI inline __floating_decimal_64 __d2d(const uint64_t __ieeeMantissa, const uint32_t __ieeeExponent) {
abb5dd6eSMark de Wever  int32_t __e2;
abb5dd6eSMark de Wever  uint64_t __m2;
abb5dd6eSMark de Wever  if (__ieeeExponent == 0) {
abb5dd6eSMark de Wever    // We subtract 2 so that the bounds computation has 2 additional bits.
abb5dd6eSMark de Wever    __e2 = 1 - __DOUBLE_BIAS - __DOUBLE_MANTISSA_BITS - 2;
abb5dd6eSMark de Wever    __m2 = __ieeeMantissa;
abb5dd6eSMark de Wever  } else {
abb5dd6eSMark de Wever    __e2 = static_cast<int32_t>(__ieeeExponent) - __DOUBLE_BIAS - __DOUBLE_MANTISSA_BITS - 2;
abb5dd6eSMark de Wever    __m2 = (1ull << __DOUBLE_MANTISSA_BITS) | __ieeeMantissa;
abb5dd6eSMark de Wever  }
abb5dd6eSMark de Wever  const bool __even = (__m2 & 1) == 0;
abb5dd6eSMark de Wever  const bool __acceptBounds = __even;
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever  // Step 2: Determine the interval of valid decimal representations.
abb5dd6eSMark de Wever  const uint64_t __mv = 4 * __m2;
abb5dd6eSMark de Wever  // Implicit bool -> int conversion. True is 1, false is 0.
abb5dd6eSMark de Wever  const uint32_t __mmShift = __ieeeMantissa != 0 || __ieeeExponent <= 1;
abb5dd6eSMark de Wever  // We would compute __mp and __mm like this:
abb5dd6eSMark de Wever  // uint64_t __mp = 4 * __m2 + 2;
abb5dd6eSMark de Wever  // uint64_t __mm = __mv - 1 - __mmShift;
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever  // Step 3: Convert to a decimal power base using 128-bit arithmetic.
abb5dd6eSMark de Wever  uint64_t __vr, __vp, __vm;
abb5dd6eSMark de Wever  int32_t __e10;
abb5dd6eSMark de Wever  bool __vmIsTrailingZeros = false;
abb5dd6eSMark de Wever  bool __vrIsTrailingZeros = false;
abb5dd6eSMark de Wever  if (__e2 >= 0) {
abb5dd6eSMark de Wever    // I tried special-casing __q == 0, but there was no effect on performance.
abb5dd6eSMark de Wever    // This expression is slightly faster than max(0, __log10Pow2(__e2) - 1).
abb5dd6eSMark de Wever    const uint32_t __q = __log10Pow2(__e2) - (__e2 > 3);
abb5dd6eSMark de Wever    __e10 = static_cast<int32_t>(__q);
abb5dd6eSMark de Wever    const int32_t __k = __DOUBLE_POW5_INV_BITCOUNT + __pow5bits(static_cast<int32_t>(__q)) - 1;
abb5dd6eSMark de Wever    const int32_t __i = -__e2 + static_cast<int32_t>(__q) + __k;
abb5dd6eSMark de Wever    __vr = __mulShiftAll(__m2, __DOUBLE_POW5_INV_SPLIT[__q], __i, &__vp, &__vm, __mmShift);
abb5dd6eSMark de Wever    if (__q <= 21) {
abb5dd6eSMark de Wever      // This should use __q <= 22, but I think 21 is also safe. Smaller values
abb5dd6eSMark de Wever      // may still be safe, but it's more difficult to reason about them.
abb5dd6eSMark de Wever      // Only one of __mp, __mv, and __mm can be a multiple of 5, if any.
abb5dd6eSMark de Wever      const uint32_t __mvMod5 = static_cast<uint32_t>(__mv) - 5 * static_cast<uint32_t>(__div5(__mv));
abb5dd6eSMark de Wever      if (__mvMod5 == 0) {
abb5dd6eSMark de Wever        __vrIsTrailingZeros = __multipleOfPowerOf5(__mv, __q);
abb5dd6eSMark de Wever      } else if (__acceptBounds) {
abb5dd6eSMark de Wever        // Same as min(__e2 + (~__mm & 1), __pow5Factor(__mm)) >= __q
abb5dd6eSMark de Wever        // <=> __e2 + (~__mm & 1) >= __q && __pow5Factor(__mm) >= __q
abb5dd6eSMark de Wever        // <=> true && __pow5Factor(__mm) >= __q, since __e2 >= __q.
abb5dd6eSMark de Wever        __vmIsTrailingZeros = __multipleOfPowerOf5(__mv - 1 - __mmShift, __q);
abb5dd6eSMark de Wever      } else {
abb5dd6eSMark de Wever        // Same as min(__e2 + 1, __pow5Factor(__mp)) >= __q.
abb5dd6eSMark de Wever        __vp -= __multipleOfPowerOf5(__mv + 2, __q);
abb5dd6eSMark de Wever      }
abb5dd6eSMark de Wever    }
abb5dd6eSMark de Wever  } else {
abb5dd6eSMark de Wever    // This expression is slightly faster than max(0, __log10Pow5(-__e2) - 1).
abb5dd6eSMark de Wever    const uint32_t __q = __log10Pow5(-__e2) - (-__e2 > 1);
abb5dd6eSMark de Wever    __e10 = static_cast<int32_t>(__q) + __e2;
abb5dd6eSMark de Wever    const int32_t __i = -__e2 - static_cast<int32_t>(__q);
abb5dd6eSMark de Wever    const int32_t __k = __pow5bits(__i) - __DOUBLE_POW5_BITCOUNT;
abb5dd6eSMark de Wever    const int32_t __j = static_cast<int32_t>(__q) - __k;
abb5dd6eSMark de Wever    __vr = __mulShiftAll(__m2, __DOUBLE_POW5_SPLIT[__i], __j, &__vp, &__vm, __mmShift);
abb5dd6eSMark de Wever    if (__q <= 1) {
abb5dd6eSMark de Wever      // {__vr,__vp,__vm} is trailing zeros if {__mv,__mp,__mm} has at least __q trailing 0 bits.
abb5dd6eSMark de Wever      // __mv = 4 * __m2, so it always has at least two trailing 0 bits.
abb5dd6eSMark de Wever      __vrIsTrailingZeros = true;
abb5dd6eSMark de Wever      if (__acceptBounds) {
abb5dd6eSMark de Wever        // __mm = __mv - 1 - __mmShift, so it has 1 trailing 0 bit iff __mmShift == 1.
abb5dd6eSMark de Wever        __vmIsTrailingZeros = __mmShift == 1;
abb5dd6eSMark de Wever      } else {
abb5dd6eSMark de Wever        // __mp = __mv + 2, so it always has at least one trailing 0 bit.
abb5dd6eSMark de Wever        --__vp;
abb5dd6eSMark de Wever      }
abb5dd6eSMark de Wever    } else if (__q < 63) { // TRANSITION(ulfjack): Use a tighter bound here.
abb5dd6eSMark de Wever      // We need to compute min(ntz(__mv), __pow5Factor(__mv) - __e2) >= __q - 1
abb5dd6eSMark de Wever      // <=> ntz(__mv) >= __q - 1 && __pow5Factor(__mv) - __e2 >= __q - 1
abb5dd6eSMark de Wever      // <=> ntz(__mv) >= __q - 1 (__e2 is negative and -__e2 >= __q)
abb5dd6eSMark de Wever      // <=> (__mv & ((1 << (__q - 1)) - 1)) == 0
abb5dd6eSMark de Wever      // We also need to make sure that the left shift does not overflow.
abb5dd6eSMark de Wever      __vrIsTrailingZeros = __multipleOfPowerOf2(__mv, __q - 1);
abb5dd6eSMark de Wever    }
abb5dd6eSMark de Wever  }
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever  // Step 4: Find the shortest decimal representation in the interval of valid representations.
abb5dd6eSMark de Wever  int32_t __removed = 0;
abb5dd6eSMark de Wever  uint8_t __lastRemovedDigit = 0;
abb5dd6eSMark de Wever  uint64_t _Output;
abb5dd6eSMark de Wever  // On average, we remove ~2 digits.
abb5dd6eSMark de Wever  if (__vmIsTrailingZeros || __vrIsTrailingZeros) {
abb5dd6eSMark de Wever    // General case, which happens rarely (~0.7%).
abb5dd6eSMark de Wever    for (;;) {
abb5dd6eSMark de Wever      const uint64_t __vpDiv10 = __div10(__vp);
abb5dd6eSMark de Wever      const uint64_t __vmDiv10 = __div10(__vm);
abb5dd6eSMark de Wever      if (__vpDiv10 <= __vmDiv10) {
abb5dd6eSMark de Wever        break;
abb5dd6eSMark de Wever      }
abb5dd6eSMark de Wever      const uint32_t __vmMod10 = static_cast<uint32_t>(__vm) - 10 * static_cast<uint32_t>(__vmDiv10);
abb5dd6eSMark de Wever      const uint64_t __vrDiv10 = __div10(__vr);
abb5dd6eSMark de Wever      const uint32_t __vrMod10 = static_cast<uint32_t>(__vr) - 10 * static_cast<uint32_t>(__vrDiv10);
abb5dd6eSMark de Wever      __vmIsTrailingZeros &= __vmMod10 == 0;
abb5dd6eSMark de Wever      __vrIsTrailingZeros &= __lastRemovedDigit == 0;
abb5dd6eSMark de Wever      __lastRemovedDigit = static_cast<uint8_t>(__vrMod10);
abb5dd6eSMark de Wever      __vr = __vrDiv10;
abb5dd6eSMark de Wever      __vp = __vpDiv10;
abb5dd6eSMark de Wever      __vm = __vmDiv10;
abb5dd6eSMark de Wever      ++__removed;
abb5dd6eSMark de Wever    }
abb5dd6eSMark de Wever    if (__vmIsTrailingZeros) {
abb5dd6eSMark de Wever      for (;;) {
abb5dd6eSMark de Wever        const uint64_t __vmDiv10 = __div10(__vm);
abb5dd6eSMark de Wever        const uint32_t __vmMod10 = static_cast<uint32_t>(__vm) - 10 * static_cast<uint32_t>(__vmDiv10);
abb5dd6eSMark de Wever        if (__vmMod10 != 0) {
abb5dd6eSMark de Wever          break;
abb5dd6eSMark de Wever        }
abb5dd6eSMark de Wever        const uint64_t __vpDiv10 = __div10(__vp);
abb5dd6eSMark de Wever        const uint64_t __vrDiv10 = __div10(__vr);
abb5dd6eSMark de Wever        const uint32_t __vrMod10 = static_cast<uint32_t>(__vr) - 10 * static_cast<uint32_t>(__vrDiv10);
abb5dd6eSMark de Wever        __vrIsTrailingZeros &= __lastRemovedDigit == 0;
abb5dd6eSMark de Wever        __lastRemovedDigit = static_cast<uint8_t>(__vrMod10);
abb5dd6eSMark de Wever        __vr = __vrDiv10;
abb5dd6eSMark de Wever        __vp = __vpDiv10;
abb5dd6eSMark de Wever        __vm = __vmDiv10;
abb5dd6eSMark de Wever        ++__removed;
abb5dd6eSMark de Wever      }
abb5dd6eSMark de Wever    }
abb5dd6eSMark de Wever    if (__vrIsTrailingZeros && __lastRemovedDigit == 5 && __vr % 2 == 0) {
abb5dd6eSMark de Wever      // Round even if the exact number is .....50..0.
abb5dd6eSMark de Wever      __lastRemovedDigit = 4;
abb5dd6eSMark de Wever    }
abb5dd6eSMark de Wever    // We need to take __vr + 1 if __vr is outside bounds or we need to round up.
abb5dd6eSMark de Wever    _Output = __vr + ((__vr == __vm && (!__acceptBounds || !__vmIsTrailingZeros)) || __lastRemovedDigit >= 5);
abb5dd6eSMark de Wever  } else {
abb5dd6eSMark de Wever    // Specialized for the common case (~99.3%). Percentages below are relative to this.
abb5dd6eSMark de Wever    bool __roundUp = false;
abb5dd6eSMark de Wever    const uint64_t __vpDiv100 = __div100(__vp);
abb5dd6eSMark de Wever    const uint64_t __vmDiv100 = __div100(__vm);
abb5dd6eSMark de Wever    if (__vpDiv100 > __vmDiv100) { // Optimization: remove two digits at a time (~86.2%).
abb5dd6eSMark de Wever      const uint64_t __vrDiv100 = __div100(__vr);
abb5dd6eSMark de Wever      const uint32_t __vrMod100 = static_cast<uint32_t>(__vr) - 100 * static_cast<uint32_t>(__vrDiv100);
abb5dd6eSMark de Wever      __roundUp = __vrMod100 >= 50;
abb5dd6eSMark de Wever      __vr = __vrDiv100;
abb5dd6eSMark de Wever      __vp = __vpDiv100;
abb5dd6eSMark de Wever      __vm = __vmDiv100;
abb5dd6eSMark de Wever      __removed += 2;
abb5dd6eSMark de Wever    }
abb5dd6eSMark de Wever    // Loop iterations below (approximately), without optimization above:
abb5dd6eSMark de Wever    // 0: 0.03%, 1: 13.8%, 2: 70.6%, 3: 14.0%, 4: 1.40%, 5: 0.14%, 6+: 0.02%
abb5dd6eSMark de Wever    // Loop iterations below (approximately), with optimization above:
abb5dd6eSMark de Wever    // 0: 70.6%, 1: 27.8%, 2: 1.40%, 3: 0.14%, 4+: 0.02%
abb5dd6eSMark de Wever    for (;;) {
abb5dd6eSMark de Wever      const uint64_t __vpDiv10 = __div10(__vp);
abb5dd6eSMark de Wever      const uint64_t __vmDiv10 = __div10(__vm);
abb5dd6eSMark de Wever      if (__vpDiv10 <= __vmDiv10) {
abb5dd6eSMark de Wever        break;
abb5dd6eSMark de Wever      }
abb5dd6eSMark de Wever      const uint64_t __vrDiv10 = __div10(__vr);
abb5dd6eSMark de Wever      const uint32_t __vrMod10 = static_cast<uint32_t>(__vr) - 10 * static_cast<uint32_t>(__vrDiv10);
abb5dd6eSMark de Wever      __roundUp = __vrMod10 >= 5;
abb5dd6eSMark de Wever      __vr = __vrDiv10;
abb5dd6eSMark de Wever      __vp = __vpDiv10;
abb5dd6eSMark de Wever      __vm = __vmDiv10;
abb5dd6eSMark de Wever      ++__removed;
abb5dd6eSMark de Wever    }
abb5dd6eSMark de Wever    // We need to take __vr + 1 if __vr is outside bounds or we need to round up.
abb5dd6eSMark de Wever    _Output = __vr + (__vr == __vm || __roundUp);
abb5dd6eSMark de Wever  }
abb5dd6eSMark de Wever  const int32_t __exp = __e10 + __removed;
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever  __floating_decimal_64 __fd;
abb5dd6eSMark de Wever  __fd.__exponent = __exp;
abb5dd6eSMark de Wever  __fd.__mantissa = _Output;
abb5dd6eSMark de Wever  return __fd;
abb5dd6eSMark de Wever}
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever[[nodiscard]] _LIBCPP_HIDE_FROM_ABI inline to_chars_result __to_chars(char* const _First, char* const _Last, const __floating_decimal_64 __v,
abb5dd6eSMark de Wever  chars_format _Fmt, const double __f) {
abb5dd6eSMark de Wever  // Step 5: Print the decimal representation.
abb5dd6eSMark de Wever  uint64_t _Output = __v.__mantissa;
abb5dd6eSMark de Wever  int32_t _Ryu_exponent = __v.__exponent;
abb5dd6eSMark de Wever  const uint32_t __olength = __decimalLength17(_Output);
abb5dd6eSMark de Wever  int32_t _Scientific_exponent = _Ryu_exponent + static_cast<int32_t>(__olength) - 1;
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever  if (_Fmt == chars_format{}) {
abb5dd6eSMark de Wever    int32_t _Lower;
abb5dd6eSMark de Wever    int32_t _Upper;
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever    if (__olength == 1) {
abb5dd6eSMark de Wever      // Value | Fixed   | Scientific
abb5dd6eSMark de Wever      // 1e-3  | "0.001" | "1e-03"
abb5dd6eSMark de Wever      // 1e4   | "10000" | "1e+04"
abb5dd6eSMark de Wever      _Lower = -3;
abb5dd6eSMark de Wever      _Upper = 4;
abb5dd6eSMark de Wever    } else {
abb5dd6eSMark de Wever      // Value   | Fixed       | Scientific
abb5dd6eSMark de Wever      // 1234e-7 | "0.0001234" | "1.234e-04"
abb5dd6eSMark de Wever      // 1234e5  | "123400000" | "1.234e+08"
abb5dd6eSMark de Wever      _Lower = -static_cast<int32_t>(__olength + 3);
abb5dd6eSMark de Wever      _Upper = 5;
abb5dd6eSMark de Wever    }
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever    if (_Lower <= _Ryu_exponent && _Ryu_exponent <= _Upper) {
abb5dd6eSMark de Wever      _Fmt = chars_format::fixed;
abb5dd6eSMark de Wever    } else {
abb5dd6eSMark de Wever      _Fmt = chars_format::scientific;
abb5dd6eSMark de Wever    }
abb5dd6eSMark de Wever  } else if (_Fmt == chars_format::general) {
abb5dd6eSMark de Wever    // C11 7.21.6.1 "The fprintf function"/8:
abb5dd6eSMark de Wever    // "Let P equal [...] 6 if the precision is omitted [...].
abb5dd6eSMark de Wever    // Then, if a conversion with style E would have an exponent of X:
abb5dd6eSMark de Wever    // - if P > X >= -4, the conversion is with style f [...].
abb5dd6eSMark de Wever    // - otherwise, the conversion is with style e [...]."
abb5dd6eSMark de Wever    if (-4 <= _Scientific_exponent && _Scientific_exponent < 6) {
abb5dd6eSMark de Wever      _Fmt = chars_format::fixed;
abb5dd6eSMark de Wever    } else {
abb5dd6eSMark de Wever      _Fmt = chars_format::scientific;
abb5dd6eSMark de Wever    }
abb5dd6eSMark de Wever  }
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever  if (_Fmt == chars_format::fixed) {
abb5dd6eSMark de Wever    // Example: _Output == 1729, __olength == 4
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever    // _Ryu_exponent | Printed  | _Whole_digits | _Total_fixed_length  | Notes
abb5dd6eSMark de Wever    // --------------|----------|---------------|----------------------|---------------------------------------
abb5dd6eSMark de Wever    //             2 | 172900   |  6            | _Whole_digits        | Ryu can't be used for printing
abb5dd6eSMark de Wever    //             1 | 17290    |  5            | (sometimes adjusted) | when the trimmed digits are nonzero.
abb5dd6eSMark de Wever    // --------------|----------|---------------|----------------------|---------------------------------------
abb5dd6eSMark de Wever    //             0 | 1729     |  4            | _Whole_digits        | Unified length cases.
abb5dd6eSMark de Wever    // --------------|----------|---------------|----------------------|---------------------------------------
abb5dd6eSMark de Wever    //            -1 | 172.9    |  3            | __olength + 1        | This case can't happen for
abb5dd6eSMark de Wever    //            -2 | 17.29    |  2            |                      | __olength == 1, but no additional
abb5dd6eSMark de Wever    //            -3 | 1.729    |  1            |                      | code is needed to avoid it.
abb5dd6eSMark de Wever    // --------------|----------|---------------|----------------------|---------------------------------------
abb5dd6eSMark de Wever    //            -4 | 0.1729   |  0            | 2 - _Ryu_exponent    | C11 7.21.6.1 "The fprintf function"/8:
abb5dd6eSMark de Wever    //            -5 | 0.01729  | -1            |                      | "If a decimal-point character appears,
abb5dd6eSMark de Wever    //            -6 | 0.001729 | -2            |                      | at least one digit appears before it."
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever    const int32_t _Whole_digits = static_cast<int32_t>(__olength) + _Ryu_exponent;
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever    uint32_t _Total_fixed_length;
abb5dd6eSMark de Wever    if (_Ryu_exponent >= 0) { // cases "172900" and "1729"
abb5dd6eSMark de Wever      _Total_fixed_length = static_cast<uint32_t>(_Whole_digits);
abb5dd6eSMark de Wever      if (_Output == 1) {
abb5dd6eSMark de Wever        // Rounding can affect the number of digits.
abb5dd6eSMark de Wever        // For example, 1e23 is exactly "99999999999999991611392" which is 23 digits instead of 24.
abb5dd6eSMark de Wever        // We can use a lookup table to detect this and adjust the total length.
abb5dd6eSMark de Wever        static constexpr uint8_t _Adjustment[309] = {
abb5dd6eSMark de Wever          0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,1,1,0,0,0,1,1,0,1,0,1,1,1,0,1,1,1,0,0,0,0,0,
abb5dd6eSMark de Wever          1,1,0,0,1,0,1,1,1,0,0,0,0,1,1,1,1,0,0,0,1,1,1,1,0,0,0,1,1,1,1,0,1,0,1,0,1,1,0,0,0,0,1,1,1,
abb5dd6eSMark de Wever          1,0,0,0,0,0,0,0,1,1,0,1,1,0,0,1,0,1,0,1,0,1,1,0,0,0,0,0,1,1,1,0,0,1,1,1,1,1,0,1,0,1,1,0,1,
abb5dd6eSMark de Wever          1,0,0,0,0,0,0,0,0,0,1,1,1,0,0,1,0,0,1,0,0,1,1,1,1,0,0,1,1,0,1,1,0,1,1,0,1,0,0,0,1,0,0,0,1,
abb5dd6eSMark de Wever          0,1,0,1,0,1,1,1,0,0,0,0,0,0,1,1,1,1,0,0,1,0,1,1,1,0,0,0,1,0,1,1,1,1,1,1,0,1,0,1,1,0,0,0,1,
abb5dd6eSMark de Wever          1,1,0,1,1,0,0,0,1,0,0,0,1,0,1,0,0,0,0,0,0,0,1,0,1,1,0,0,1,1,1,0,0,0,1,0,1,0,0,0,0,0,1,1,0,
abb5dd6eSMark de Wever          0,1,0,1,1,1,0,0,1,0,0,0,0,1,0,1,0,0,0,0,0,1,0,1,0,1,1,0,1,0,0,0,0,0,1,1,0,1,0 };
abb5dd6eSMark de Wever        _Total_fixed_length -= _Adjustment[_Ryu_exponent];
abb5dd6eSMark de Wever        // _Whole_digits doesn't need to be adjusted because these cases won't refer to it later.
abb5dd6eSMark de Wever      }
abb5dd6eSMark de Wever    } else if (_Whole_digits > 0) { // case "17.29"
abb5dd6eSMark de Wever      _Total_fixed_length = __olength + 1;
abb5dd6eSMark de Wever    } else { // case "0.001729"
abb5dd6eSMark de Wever      _Total_fixed_length = static_cast<uint32_t>(2 - _Ryu_exponent);
abb5dd6eSMark de Wever    }
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever    if (_Last - _First < static_cast<ptrdiff_t>(_Total_fixed_length)) {
abb5dd6eSMark de Wever      return { _Last, errc::value_too_large };
abb5dd6eSMark de Wever    }
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever    char* _Mid;
abb5dd6eSMark de Wever    if (_Ryu_exponent > 0) { // case "172900"
abb5dd6eSMark de Wever      bool _Can_use_ryu;
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever      if (_Ryu_exponent > 22) { // 10^22 is the largest power of 10 that's exactly representable as a double.
abb5dd6eSMark de Wever        _Can_use_ryu = false;
abb5dd6eSMark de Wever      } else {
abb5dd6eSMark de Wever        // Ryu generated X: __v.__mantissa * 10^_Ryu_exponent
abb5dd6eSMark de Wever        // __v.__mantissa == 2^_Trailing_zero_bits * (__v.__mantissa >> _Trailing_zero_bits)
abb5dd6eSMark de Wever        // 10^_Ryu_exponent == 2^_Ryu_exponent * 5^_Ryu_exponent
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever        // _Trailing_zero_bits is [0, 56] (aside: because 2^56 is the largest power of 2
abb5dd6eSMark de Wever        // with 17 decimal digits, which is double's round-trip limit.)
abb5dd6eSMark de Wever        // _Ryu_exponent is [1, 22].
abb5dd6eSMark de Wever        // Normalization adds [2, 52] (aside: at least 2 because the pre-normalized mantissa is at least 5).
abb5dd6eSMark de Wever        // This adds up to [3, 130], which is well below double's maximum binary exponent 1023.
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever        // Therefore, we just need to consider (__v.__mantissa >> _Trailing_zero_bits) * 5^_Ryu_exponent.
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever        // If that product would exceed 53 bits, then X can't be exactly represented as a double.
abb5dd6eSMark de Wever        // (That's not a problem for round-tripping, because X is close enough to the original double,
abb5dd6eSMark de Wever        // but X isn't mathematically equal to the original double.) This requires a high-precision fallback.
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever        // If the product is 53 bits or smaller, then X can be exactly represented as a double (and we don't
abb5dd6eSMark de Wever        // need to re-synthesize it; the original double must have been X, because Ryu wouldn't produce the
abb5dd6eSMark de Wever        // same output for two different doubles X and Y). This allows Ryu's output to be used (zero-filled).
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever        // (2^53 - 1) / 5^0 (for indexing), (2^53 - 1) / 5^1, ..., (2^53 - 1) / 5^22
abb5dd6eSMark de Wever        static constexpr uint64_t _Max_shifted_mantissa[23] = {
abb5dd6eSMark de Wever          9007199254740991u, 1801439850948198u, 360287970189639u, 72057594037927u, 14411518807585u,
abb5dd6eSMark de Wever          2882303761517u, 576460752303u, 115292150460u, 23058430092u, 4611686018u, 922337203u, 184467440u,
abb5dd6eSMark de Wever          36893488u, 7378697u, 1475739u, 295147u, 59029u, 11805u, 2361u, 472u, 94u, 18u, 3u };
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever        unsigned long _Trailing_zero_bits;
*ba87515fSNikolas Klauser#if _LIBCPP_HAS_BITSCAN64
abb5dd6eSMark de Wever        (void) _BitScanForward64(&_Trailing_zero_bits, __v.__mantissa); // __v.__mantissa is guaranteed nonzero
abb5dd6eSMark de Wever#else // ^^^ 64-bit ^^^ / vvv 32-bit vvv
abb5dd6eSMark de Wever        const uint32_t _Low_mantissa = static_cast<uint32_t>(__v.__mantissa);
abb5dd6eSMark de Wever        if (_Low_mantissa != 0) {
abb5dd6eSMark de Wever          (void) _BitScanForward(&_Trailing_zero_bits, _Low_mantissa);
abb5dd6eSMark de Wever        } else {
abb5dd6eSMark de Wever          const uint32_t _High_mantissa = static_cast<uint32_t>(__v.__mantissa >> 32); // nonzero here
abb5dd6eSMark de Wever          (void) _BitScanForward(&_Trailing_zero_bits, _High_mantissa);
abb5dd6eSMark de Wever          _Trailing_zero_bits += 32;
abb5dd6eSMark de Wever        }
abb5dd6eSMark de Wever#endif // ^^^ 32-bit ^^^
abb5dd6eSMark de Wever        const uint64_t _Shifted_mantissa = __v.__mantissa >> _Trailing_zero_bits;
abb5dd6eSMark de Wever        _Can_use_ryu = _Shifted_mantissa <= _Max_shifted_mantissa[_Ryu_exponent];
abb5dd6eSMark de Wever      }
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever      if (!_Can_use_ryu) {
abb5dd6eSMark de Wever        // Print the integer exactly.
abb5dd6eSMark de Wever        // Performance note: This will redundantly perform bounds checking.
abb5dd6eSMark de Wever        // Performance note: This will redundantly decompose the IEEE representation.
abb5dd6eSMark de Wever        return __d2fixed_buffered_n(_First, _Last, __f, 0);
abb5dd6eSMark de Wever      }
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever      // _Can_use_ryu
abb5dd6eSMark de Wever      // Print the decimal digits, left-aligned within [_First, _First + _Total_fixed_length).
abb5dd6eSMark de Wever      _Mid = _First + __olength;
abb5dd6eSMark de Wever    } else { // cases "1729", "17.29", and "0.001729"
abb5dd6eSMark de Wever      // Print the decimal digits, right-aligned within [_First, _First + _Total_fixed_length).
abb5dd6eSMark de Wever      _Mid = _First + _Total_fixed_length;
abb5dd6eSMark de Wever    }
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever    // We prefer 32-bit operations, even on 64-bit platforms.
abb5dd6eSMark de Wever    // We have at most 17 digits, and uint32_t can store 9 digits.
abb5dd6eSMark de Wever    // If _Output doesn't fit into uint32_t, we cut off 8 digits,
abb5dd6eSMark de Wever    // so the rest will fit into uint32_t.
abb5dd6eSMark de Wever    if ((_Output >> 32) != 0) {
abb5dd6eSMark de Wever      // Expensive 64-bit division.
abb5dd6eSMark de Wever      const uint64_t __q = __div1e8(_Output);
abb5dd6eSMark de Wever      uint32_t __output2 = static_cast<uint32_t>(_Output - 100000000 * __q);
abb5dd6eSMark de Wever      _Output = __q;
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever      const uint32_t __c = __output2 % 10000;
abb5dd6eSMark de Wever      __output2 /= 10000;
abb5dd6eSMark de Wever      const uint32_t __d = __output2 % 10000;
abb5dd6eSMark de Wever      const uint32_t __c0 = (__c % 100) << 1;
abb5dd6eSMark de Wever      const uint32_t __c1 = (__c / 100) << 1;
abb5dd6eSMark de Wever      const uint32_t __d0 = (__d % 100) << 1;
abb5dd6eSMark de Wever      const uint32_t __d1 = (__d / 100) << 1;
abb5dd6eSMark de Wever
6e679286SLouis Dionne      std::memcpy(_Mid -= 2, __DIGIT_TABLE + __c0, 2);
6e679286SLouis Dionne      std::memcpy(_Mid -= 2, __DIGIT_TABLE + __c1, 2);
6e679286SLouis Dionne      std::memcpy(_Mid -= 2, __DIGIT_TABLE + __d0, 2);
6e679286SLouis Dionne      std::memcpy(_Mid -= 2, __DIGIT_TABLE + __d1, 2);
abb5dd6eSMark de Wever    }
abb5dd6eSMark de Wever    uint32_t __output2 = static_cast<uint32_t>(_Output);
abb5dd6eSMark de Wever    while (__output2 >= 10000) {
abb5dd6eSMark de Wever#ifdef __clang__ // TRANSITION, LLVM-38217
abb5dd6eSMark de Wever      const uint32_t __c = __output2 - 10000 * (__output2 / 10000);
abb5dd6eSMark de Wever#else
abb5dd6eSMark de Wever      const uint32_t __c = __output2 % 10000;
abb5dd6eSMark de Wever#endif
abb5dd6eSMark de Wever      __output2 /= 10000;
abb5dd6eSMark de Wever      const uint32_t __c0 = (__c % 100) << 1;
abb5dd6eSMark de Wever      const uint32_t __c1 = (__c / 100) << 1;
6e679286SLouis Dionne      std::memcpy(_Mid -= 2, __DIGIT_TABLE + __c0, 2);
6e679286SLouis Dionne      std::memcpy(_Mid -= 2, __DIGIT_TABLE + __c1, 2);
abb5dd6eSMark de Wever    }
abb5dd6eSMark de Wever    if (__output2 >= 100) {
abb5dd6eSMark de Wever      const uint32_t __c = (__output2 % 100) << 1;
abb5dd6eSMark de Wever      __output2 /= 100;
6e679286SLouis Dionne      std::memcpy(_Mid -= 2, __DIGIT_TABLE + __c, 2);
abb5dd6eSMark de Wever    }
abb5dd6eSMark de Wever    if (__output2 >= 10) {
abb5dd6eSMark de Wever      const uint32_t __c = __output2 << 1;
6e679286SLouis Dionne      std::memcpy(_Mid -= 2, __DIGIT_TABLE + __c, 2);
abb5dd6eSMark de Wever    } else {
abb5dd6eSMark de Wever      *--_Mid = static_cast<char>('0' + __output2);
abb5dd6eSMark de Wever    }
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever    if (_Ryu_exponent > 0) { // case "172900" with _Can_use_ryu
abb5dd6eSMark de Wever      // Performance note: it might be more efficient to do this immediately after setting _Mid.
6e679286SLouis Dionne      std::memset(_First + __olength, '0', static_cast<size_t>(_Ryu_exponent));
abb5dd6eSMark de Wever    } else if (_Ryu_exponent == 0) { // case "1729"
abb5dd6eSMark de Wever      // Done!
abb5dd6eSMark de Wever    } else if (_Whole_digits > 0) { // case "17.29"
abb5dd6eSMark de Wever      // Performance note: moving digits might not be optimal.
6e679286SLouis Dionne      std::memmove(_First, _First + 1, static_cast<size_t>(_Whole_digits));
abb5dd6eSMark de Wever      _First[_Whole_digits] = '.';
abb5dd6eSMark de Wever    } else { // case "0.001729"
abb5dd6eSMark de Wever      // Performance note: a larger memset() followed by overwriting '.' might be more efficient.
abb5dd6eSMark de Wever      _First[0] = '0';
abb5dd6eSMark de Wever      _First[1] = '.';
6e679286SLouis Dionne      std::memset(_First + 2, '0', static_cast<size_t>(-_Whole_digits));
abb5dd6eSMark de Wever    }
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever    return { _First + _Total_fixed_length, errc{} };
abb5dd6eSMark de Wever  }
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever  const uint32_t _Total_scientific_length = __olength + (__olength > 1) // digits + possible decimal point
abb5dd6eSMark de Wever    + (-100 < _Scientific_exponent && _Scientific_exponent < 100 ? 4 : 5); // + scientific exponent
abb5dd6eSMark de Wever  if (_Last - _First < static_cast<ptrdiff_t>(_Total_scientific_length)) {
abb5dd6eSMark de Wever    return { _Last, errc::value_too_large };
abb5dd6eSMark de Wever  }
abb5dd6eSMark de Wever  char* const __result = _First;
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever  // Print the decimal digits.
abb5dd6eSMark de Wever  uint32_t __i = 0;
abb5dd6eSMark de Wever  // We prefer 32-bit operations, even on 64-bit platforms.
abb5dd6eSMark de Wever  // We have at most 17 digits, and uint32_t can store 9 digits.
abb5dd6eSMark de Wever  // If _Output doesn't fit into uint32_t, we cut off 8 digits,
abb5dd6eSMark de Wever  // so the rest will fit into uint32_t.
abb5dd6eSMark de Wever  if ((_Output >> 32) != 0) {
abb5dd6eSMark de Wever    // Expensive 64-bit division.
abb5dd6eSMark de Wever    const uint64_t __q = __div1e8(_Output);
abb5dd6eSMark de Wever    uint32_t __output2 = static_cast<uint32_t>(_Output) - 100000000 * static_cast<uint32_t>(__q);
abb5dd6eSMark de Wever    _Output = __q;
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever    const uint32_t __c = __output2 % 10000;
abb5dd6eSMark de Wever    __output2 /= 10000;
abb5dd6eSMark de Wever    const uint32_t __d = __output2 % 10000;
abb5dd6eSMark de Wever    const uint32_t __c0 = (__c % 100) << 1;
abb5dd6eSMark de Wever    const uint32_t __c1 = (__c / 100) << 1;
abb5dd6eSMark de Wever    const uint32_t __d0 = (__d % 100) << 1;
abb5dd6eSMark de Wever    const uint32_t __d1 = (__d / 100) << 1;
6e679286SLouis Dionne    std::memcpy(__result + __olength - __i - 1, __DIGIT_TABLE + __c0, 2);
6e679286SLouis Dionne    std::memcpy(__result + __olength - __i - 3, __DIGIT_TABLE + __c1, 2);
6e679286SLouis Dionne    std::memcpy(__result + __olength - __i - 5, __DIGIT_TABLE + __d0, 2);
6e679286SLouis Dionne    std::memcpy(__result + __olength - __i - 7, __DIGIT_TABLE + __d1, 2);
abb5dd6eSMark de Wever    __i += 8;
abb5dd6eSMark de Wever  }
abb5dd6eSMark de Wever  uint32_t __output2 = static_cast<uint32_t>(_Output);
abb5dd6eSMark de Wever  while (__output2 >= 10000) {
abb5dd6eSMark de Wever#ifdef __clang__ // TRANSITION, LLVM-38217
abb5dd6eSMark de Wever    const uint32_t __c = __output2 - 10000 * (__output2 / 10000);
abb5dd6eSMark de Wever#else
abb5dd6eSMark de Wever    const uint32_t __c = __output2 % 10000;
abb5dd6eSMark de Wever#endif
abb5dd6eSMark de Wever    __output2 /= 10000;
abb5dd6eSMark de Wever    const uint32_t __c0 = (__c % 100) << 1;
abb5dd6eSMark de Wever    const uint32_t __c1 = (__c / 100) << 1;
6e679286SLouis Dionne    std::memcpy(__result + __olength - __i - 1, __DIGIT_TABLE + __c0, 2);
6e679286SLouis Dionne    std::memcpy(__result + __olength - __i - 3, __DIGIT_TABLE + __c1, 2);
abb5dd6eSMark de Wever    __i += 4;
abb5dd6eSMark de Wever  }
abb5dd6eSMark de Wever  if (__output2 >= 100) {
abb5dd6eSMark de Wever    const uint32_t __c = (__output2 % 100) << 1;
abb5dd6eSMark de Wever    __output2 /= 100;
6e679286SLouis Dionne    std::memcpy(__result + __olength - __i - 1, __DIGIT_TABLE + __c, 2);
abb5dd6eSMark de Wever    __i += 2;
abb5dd6eSMark de Wever  }
abb5dd6eSMark de Wever  if (__output2 >= 10) {
abb5dd6eSMark de Wever    const uint32_t __c = __output2 << 1;
abb5dd6eSMark de Wever    // We can't use memcpy here: the decimal dot goes between these two digits.
abb5dd6eSMark de Wever    __result[2] = __DIGIT_TABLE[__c + 1];
abb5dd6eSMark de Wever    __result[0] = __DIGIT_TABLE[__c];
abb5dd6eSMark de Wever  } else {
abb5dd6eSMark de Wever    __result[0] = static_cast<char>('0' + __output2);
abb5dd6eSMark de Wever  }
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever  // Print decimal point if needed.
abb5dd6eSMark de Wever  uint32_t __index;
abb5dd6eSMark de Wever  if (__olength > 1) {
abb5dd6eSMark de Wever    __result[1] = '.';
abb5dd6eSMark de Wever    __index = __olength + 1;
abb5dd6eSMark de Wever  } else {
abb5dd6eSMark de Wever    __index = 1;
abb5dd6eSMark de Wever  }
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever  // Print the exponent.
abb5dd6eSMark de Wever  __result[__index++] = 'e';
abb5dd6eSMark de Wever  if (_Scientific_exponent < 0) {
abb5dd6eSMark de Wever    __result[__index++] = '-';
abb5dd6eSMark de Wever    _Scientific_exponent = -_Scientific_exponent;
abb5dd6eSMark de Wever  } else {
abb5dd6eSMark de Wever    __result[__index++] = '+';
abb5dd6eSMark de Wever  }
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever  if (_Scientific_exponent >= 100) {
abb5dd6eSMark de Wever    const int32_t __c = _Scientific_exponent % 10;
6e679286SLouis Dionne    std::memcpy(__result + __index, __DIGIT_TABLE + 2 * (_Scientific_exponent / 10), 2);
abb5dd6eSMark de Wever    __result[__index + 2] = static_cast<char>('0' + __c);
abb5dd6eSMark de Wever    __index += 3;
abb5dd6eSMark de Wever  } else {
6e679286SLouis Dionne    std::memcpy(__result + __index, __DIGIT_TABLE + 2 * _Scientific_exponent, 2);
abb5dd6eSMark de Wever    __index += 2;
abb5dd6eSMark de Wever  }
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever  return { _First + _Total_scientific_length, errc{} };
abb5dd6eSMark de Wever}
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever[[nodiscard]] _LIBCPP_HIDE_FROM_ABI inline bool __d2d_small_int(const uint64_t __ieeeMantissa, const uint32_t __ieeeExponent,
abb5dd6eSMark de Wever  __floating_decimal_64* const __v) {
abb5dd6eSMark de Wever  const uint64_t __m2 = (1ull << __DOUBLE_MANTISSA_BITS) | __ieeeMantissa;
abb5dd6eSMark de Wever  const int32_t __e2 = static_cast<int32_t>(__ieeeExponent) - __DOUBLE_BIAS - __DOUBLE_MANTISSA_BITS;
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever  if (__e2 > 0) {
abb5dd6eSMark de Wever    // f = __m2 * 2^__e2 >= 2^53 is an integer.
abb5dd6eSMark de Wever    // Ignore this case for now.
abb5dd6eSMark de Wever    return false;
abb5dd6eSMark de Wever  }
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever  if (__e2 < -52) {
abb5dd6eSMark de Wever    // f < 1.
abb5dd6eSMark de Wever    return false;
abb5dd6eSMark de Wever  }
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever  // Since 2^52 <= __m2 < 2^53 and 0 <= -__e2 <= 52: 1 <= f = __m2 / 2^-__e2 < 2^53.
abb5dd6eSMark de Wever  // Test if the lower -__e2 bits of the significand are 0, i.e. whether the fraction is 0.
abb5dd6eSMark de Wever  const uint64_t __mask = (1ull << -__e2) - 1;
abb5dd6eSMark de Wever  const uint64_t __fraction = __m2 & __mask;
abb5dd6eSMark de Wever  if (__fraction != 0) {
abb5dd6eSMark de Wever    return false;
abb5dd6eSMark de Wever  }
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever  // f is an integer in the range [1, 2^53).
abb5dd6eSMark de Wever  // Note: __mantissa might contain trailing (decimal) 0's.
abb5dd6eSMark de Wever  // Note: since 2^53 < 10^16, there is no need to adjust __decimalLength17().
abb5dd6eSMark de Wever  __v->__mantissa = __m2 >> -__e2;
abb5dd6eSMark de Wever  __v->__exponent = 0;
abb5dd6eSMark de Wever  return true;
abb5dd6eSMark de Wever}
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever[[nodiscard]] to_chars_result __d2s_buffered_n(char* const _First, char* const _Last, const double __f,
abb5dd6eSMark de Wever  const chars_format _Fmt) {
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever  // Step 1: Decode the floating-point number, and unify normalized and subnormal cases.
abb5dd6eSMark de Wever  const uint64_t __bits = __double_to_bits(__f);
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever  // Case distinction; exit early for the easy cases.
abb5dd6eSMark de Wever  if (__bits == 0) {
abb5dd6eSMark de Wever    if (_Fmt == chars_format::scientific) {
abb5dd6eSMark de Wever      if (_Last - _First < 5) {
abb5dd6eSMark de Wever        return { _Last, errc::value_too_large };
abb5dd6eSMark de Wever      }
abb5dd6eSMark de Wever
6e679286SLouis Dionne      std::memcpy(_First, "0e+00", 5);
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever      return { _First + 5, errc{} };
abb5dd6eSMark de Wever    }
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever    // Print "0" for chars_format::fixed, chars_format::general, and chars_format{}.
abb5dd6eSMark de Wever    if (_First == _Last) {
abb5dd6eSMark de Wever      return { _Last, errc::value_too_large };
abb5dd6eSMark de Wever    }
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever    *_First = '0';
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever    return { _First + 1, errc{} };
abb5dd6eSMark de Wever  }
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever  // Decode __bits into mantissa and exponent.
abb5dd6eSMark de Wever  const uint64_t __ieeeMantissa = __bits & ((1ull << __DOUBLE_MANTISSA_BITS) - 1);
abb5dd6eSMark de Wever  const uint32_t __ieeeExponent = static_cast<uint32_t>(__bits >> __DOUBLE_MANTISSA_BITS);
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever  if (_Fmt == chars_format::fixed) {
abb5dd6eSMark de Wever    // const uint64_t _Mantissa2 = __ieeeMantissa | (1ull << __DOUBLE_MANTISSA_BITS); // restore implicit bit
abb5dd6eSMark de Wever    const int32_t _Exponent2 = static_cast<int32_t>(__ieeeExponent)
abb5dd6eSMark de Wever      - __DOUBLE_BIAS - __DOUBLE_MANTISSA_BITS; // bias and normalization
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever    // Normal values are equal to _Mantissa2 * 2^_Exponent2.
abb5dd6eSMark de Wever    // (Subnormals are different, but they'll be rejected by the _Exponent2 test here, so they can be ignored.)
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever    // For nonzero integers, _Exponent2 >= -52. (The minimum value occurs when _Mantissa2 * 2^_Exponent2 is 1.
abb5dd6eSMark de Wever    // In that case, _Mantissa2 is the implicit 1 bit followed by 52 zeros, so _Exponent2 is -52 to shift away
abb5dd6eSMark de Wever    // the zeros.) The dense range of exactly representable integers has negative or zero exponents
abb5dd6eSMark de Wever    // (as positive exponents make the range non-dense). For that dense range, Ryu will always be used:
abb5dd6eSMark de Wever    // every digit is necessary to uniquely identify the value, so Ryu must print them all.
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever    // Positive exponents are the non-dense range of exactly representable integers. This contains all of the values
abb5dd6eSMark de Wever    // for which Ryu can't be used (and a few Ryu-friendly values). We can save time by detecting positive
abb5dd6eSMark de Wever    // exponents here and skipping Ryu. Calling __d2fixed_buffered_n() with precision 0 is valid for all integers
abb5dd6eSMark de Wever    // (so it's okay if we call it with a Ryu-friendly value).
abb5dd6eSMark de Wever    if (_Exponent2 > 0) {
abb5dd6eSMark de Wever      return __d2fixed_buffered_n(_First, _Last, __f, 0);
abb5dd6eSMark de Wever    }
abb5dd6eSMark de Wever  }
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever  __floating_decimal_64 __v;
abb5dd6eSMark de Wever  const bool __isSmallInt = __d2d_small_int(__ieeeMantissa, __ieeeExponent, &__v);
abb5dd6eSMark de Wever  if (__isSmallInt) {
abb5dd6eSMark de Wever    // For small integers in the range [1, 2^53), __v.__mantissa might contain trailing (decimal) zeros.
abb5dd6eSMark de Wever    // For scientific notation we need to move these zeros into the exponent.
abb5dd6eSMark de Wever    // (This is not needed for fixed-point notation, so it might be beneficial to trim
abb5dd6eSMark de Wever    // trailing zeros in __to_chars only if needed - once fixed-point notation output is implemented.)
abb5dd6eSMark de Wever    for (;;) {
abb5dd6eSMark de Wever      const uint64_t __q = __div10(__v.__mantissa);
abb5dd6eSMark de Wever      const uint32_t __r = static_cast<uint32_t>(__v.__mantissa) - 10 * static_cast<uint32_t>(__q);
abb5dd6eSMark de Wever      if (__r != 0) {
abb5dd6eSMark de Wever        break;
abb5dd6eSMark de Wever      }
abb5dd6eSMark de Wever      __v.__mantissa = __q;
abb5dd6eSMark de Wever      ++__v.__exponent;
abb5dd6eSMark de Wever    }
abb5dd6eSMark de Wever  } else {
abb5dd6eSMark de Wever    __v = __d2d(__ieeeMantissa, __ieeeExponent);
abb5dd6eSMark de Wever  }
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever  return __to_chars(_First, _Last, __v, _Fmt, __f);
abb5dd6eSMark de Wever}
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever_LIBCPP_END_NAMESPACE_STD
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever// clang-format on