src/ryu/f2s.cpp

abb5dd6eSMark de Wever//===----------------------------------------------------------------------===//
abb5dd6eSMark de Wever//
abb5dd6eSMark de Wever// Part of the LLVM Project, under the Apache License v2.0 with LLVM Exceptions.
abb5dd6eSMark de Wever// See https://llvm.org/LICENSE.txt for license information.
abb5dd6eSMark de Wever// SPDX-License-Identifier: Apache-2.0 WITH LLVM-exception
abb5dd6eSMark de Wever//
abb5dd6eSMark de Wever//===----------------------------------------------------------------------===//
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever// Copyright (c) Microsoft Corporation.
abb5dd6eSMark de Wever// SPDX-License-Identifier: Apache-2.0 WITH LLVM-exception
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever// Copyright 2018 Ulf Adams
abb5dd6eSMark de Wever// Copyright (c) Microsoft Corporation. All rights reserved.
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever// Boost Software License - Version 1.0 - August 17th, 2003
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever// Permission is hereby granted, free of charge, to any person or organization
abb5dd6eSMark de Wever// obtaining a copy of the software and accompanying documentation covered by
abb5dd6eSMark de Wever// this license (the "Software") to use, reproduce, display, distribute,
abb5dd6eSMark de Wever// execute, and transmit the Software, and to prepare derivative works of the
abb5dd6eSMark de Wever// Software, and to permit third-parties to whom the Software is furnished to
abb5dd6eSMark de Wever// do so, all subject to the following:
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever// The copyright notices in the Software and this entire statement, including
abb5dd6eSMark de Wever// the above license grant, this restriction and the following disclaimer,
abb5dd6eSMark de Wever// must be included in all copies of the Software, in whole or in part, and
abb5dd6eSMark de Wever// all derivative works of the Software, unless such copies or derivative
abb5dd6eSMark de Wever// works are solely in the form of machine-executable object code generated by
abb5dd6eSMark de Wever// a source language processor.
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever// THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND, EXPRESS OR
abb5dd6eSMark de Wever// IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF MERCHANTABILITY,
abb5dd6eSMark de Wever// FITNESS FOR A PARTICULAR PURPOSE, TITLE AND NON-INFRINGEMENT. IN NO EVENT
abb5dd6eSMark de Wever// SHALL THE COPYRIGHT HOLDERS OR ANYONE DISTRIBUTING THE SOFTWARE BE LIABLE
abb5dd6eSMark de Wever// FOR ANY DAMAGES OR OTHER LIABILITY, WHETHER IN CONTRACT, TORT OR OTHERWISE,
abb5dd6eSMark de Wever// ARISING FROM, OUT OF OR IN CONNECTION WITH THE SOFTWARE OR THE USE OR OTHER
abb5dd6eSMark de Wever// DEALINGS IN THE SOFTWARE.
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever// Avoid formatting to keep the changes with the original code minimal.
abb5dd6eSMark de Wever// clang-format off
abb5dd6eSMark de Wever
f87aa19bSLouis Dionne#include <__assert>
bbb0f2c7SArthur O'Dwyer#include <__config>
bbb0f2c7SArthur O'Dwyer#include <charconv>
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever#include "include/ryu/common.h"
abb5dd6eSMark de Wever#include "include/ryu/d2fixed.h"
abb5dd6eSMark de Wever#include "include/ryu/d2s_intrinsics.h"
abb5dd6eSMark de Wever#include "include/ryu/digit_table.h"
abb5dd6eSMark de Wever#include "include/ryu/f2s.h"
abb5dd6eSMark de Wever#include "include/ryu/ryu.h"
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever_LIBCPP_BEGIN_NAMESPACE_STD
abb5dd6eSMark de Wever
abb5dd6eSMark de Weverinline constexpr int __FLOAT_MANTISSA_BITS = 23;
abb5dd6eSMark de Weverinline constexpr int __FLOAT_EXPONENT_BITS = 8;
abb5dd6eSMark de Weverinline constexpr int __FLOAT_BIAS = 127;
abb5dd6eSMark de Wever
abb5dd6eSMark de Weverinline constexpr int __FLOAT_POW5_INV_BITCOUNT = 59;
abb5dd6eSMark de Weverinline constexpr uint64_t __FLOAT_POW5_INV_SPLIT[31] = {
abb5dd6eSMark de Wever  576460752303423489u, 461168601842738791u, 368934881474191033u, 295147905179352826u,
abb5dd6eSMark de Wever  472236648286964522u, 377789318629571618u, 302231454903657294u, 483570327845851670u,
abb5dd6eSMark de Wever  386856262276681336u, 309485009821345069u, 495176015714152110u, 396140812571321688u,
abb5dd6eSMark de Wever  316912650057057351u, 507060240091291761u, 405648192073033409u, 324518553658426727u,
abb5dd6eSMark de Wever  519229685853482763u, 415383748682786211u, 332306998946228969u, 531691198313966350u,
abb5dd6eSMark de Wever  425352958651173080u, 340282366920938464u, 544451787073501542u, 435561429658801234u,
abb5dd6eSMark de Wever  348449143727040987u, 557518629963265579u, 446014903970612463u, 356811923176489971u,
abb5dd6eSMark de Wever  570899077082383953u, 456719261665907162u, 365375409332725730u
abb5dd6eSMark de Wever};
abb5dd6eSMark de Weverinline constexpr int __FLOAT_POW5_BITCOUNT = 61;
abb5dd6eSMark de Weverinline constexpr uint64_t __FLOAT_POW5_SPLIT[47] = {
abb5dd6eSMark de Wever  1152921504606846976u, 1441151880758558720u, 1801439850948198400u, 2251799813685248000u,
abb5dd6eSMark de Wever  1407374883553280000u, 1759218604441600000u, 2199023255552000000u, 1374389534720000000u,
abb5dd6eSMark de Wever  1717986918400000000u, 2147483648000000000u, 1342177280000000000u, 1677721600000000000u,
abb5dd6eSMark de Wever  2097152000000000000u, 1310720000000000000u, 1638400000000000000u, 2048000000000000000u,
abb5dd6eSMark de Wever  1280000000000000000u, 1600000000000000000u, 2000000000000000000u, 1250000000000000000u,
abb5dd6eSMark de Wever  1562500000000000000u, 1953125000000000000u, 1220703125000000000u, 1525878906250000000u,
abb5dd6eSMark de Wever  1907348632812500000u, 1192092895507812500u, 1490116119384765625u, 1862645149230957031u,
abb5dd6eSMark de Wever  1164153218269348144u, 1455191522836685180u, 1818989403545856475u, 2273736754432320594u,
abb5dd6eSMark de Wever  1421085471520200371u, 1776356839400250464u, 2220446049250313080u, 1387778780781445675u,
abb5dd6eSMark de Wever  1734723475976807094u, 2168404344971008868u, 1355252715606880542u, 1694065894508600678u,
abb5dd6eSMark de Wever  2117582368135750847u, 1323488980084844279u, 1654361225106055349u, 2067951531382569187u,
abb5dd6eSMark de Wever  1292469707114105741u, 1615587133892632177u, 2019483917365790221u
abb5dd6eSMark de Wever};
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever[[nodiscard]] _LIBCPP_HIDE_FROM_ABI inline uint32_t __pow5Factor(uint32_t __value) {
abb5dd6eSMark de Wever  uint32_t __count = 0;
abb5dd6eSMark de Wever  for (;;) {
*bed1a5b3SKonstantin Varlamov    _LIBCPP_ASSERT_INTERNAL(__value != 0, "");
abb5dd6eSMark de Wever    const uint32_t __q = __value / 5;
abb5dd6eSMark de Wever    const uint32_t __r = __value % 5;
abb5dd6eSMark de Wever    if (__r != 0) {
abb5dd6eSMark de Wever      break;
abb5dd6eSMark de Wever    }
abb5dd6eSMark de Wever    __value = __q;
abb5dd6eSMark de Wever    ++__count;
abb5dd6eSMark de Wever  }
abb5dd6eSMark de Wever  return __count;
abb5dd6eSMark de Wever}
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever// Returns true if __value is divisible by 5^__p.
abb5dd6eSMark de Wever[[nodiscard]] _LIBCPP_HIDE_FROM_ABI inline bool __multipleOfPowerOf5(const uint32_t __value, const uint32_t __p) {
abb5dd6eSMark de Wever  return __pow5Factor(__value) >= __p;
abb5dd6eSMark de Wever}
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever// Returns true if __value is divisible by 2^__p.
abb5dd6eSMark de Wever[[nodiscard]] _LIBCPP_HIDE_FROM_ABI inline bool __multipleOfPowerOf2(const uint32_t __value, const uint32_t __p) {
*bed1a5b3SKonstantin Varlamov  _LIBCPP_ASSERT_INTERNAL(__value != 0, "");
*bed1a5b3SKonstantin Varlamov  _LIBCPP_ASSERT_INTERNAL(__p < 32, "");
abb5dd6eSMark de Wever  // __builtin_ctz doesn't appear to be faster here.
abb5dd6eSMark de Wever  return (__value & ((1u << __p) - 1)) == 0;
abb5dd6eSMark de Wever}
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever[[nodiscard]] _LIBCPP_HIDE_FROM_ABI inline uint32_t __mulShift(const uint32_t __m, const uint64_t __factor, const int32_t __shift) {
*bed1a5b3SKonstantin Varlamov  _LIBCPP_ASSERT_INTERNAL(__shift > 32, "");
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever  // The casts here help MSVC to avoid calls to the __allmul library
abb5dd6eSMark de Wever  // function.
abb5dd6eSMark de Wever  const uint32_t __factorLo = static_cast<uint32_t>(__factor);
abb5dd6eSMark de Wever  const uint32_t __factorHi = static_cast<uint32_t>(__factor >> 32);
abb5dd6eSMark de Wever  const uint64_t __bits0 = static_cast<uint64_t>(__m) * __factorLo;
abb5dd6eSMark de Wever  const uint64_t __bits1 = static_cast<uint64_t>(__m) * __factorHi;
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever#ifndef _LIBCPP_64_BIT
abb5dd6eSMark de Wever  // On 32-bit platforms we can avoid a 64-bit shift-right since we only
abb5dd6eSMark de Wever  // need the upper 32 bits of the result and the shift value is > 32.
abb5dd6eSMark de Wever  const uint32_t __bits0Hi = static_cast<uint32_t>(__bits0 >> 32);
abb5dd6eSMark de Wever  uint32_t __bits1Lo = static_cast<uint32_t>(__bits1);
abb5dd6eSMark de Wever  uint32_t __bits1Hi = static_cast<uint32_t>(__bits1 >> 32);
abb5dd6eSMark de Wever  __bits1Lo += __bits0Hi;
abb5dd6eSMark de Wever  __bits1Hi += (__bits1Lo < __bits0Hi);
abb5dd6eSMark de Wever  const int32_t __s = __shift - 32;
abb5dd6eSMark de Wever  return (__bits1Hi << (32 - __s)) | (__bits1Lo >> __s);
abb5dd6eSMark de Wever#else // ^^^ 32-bit ^^^ / vvv 64-bit vvv
abb5dd6eSMark de Wever  const uint64_t __sum = (__bits0 >> 32) + __bits1;
abb5dd6eSMark de Wever  const uint64_t __shiftedSum = __sum >> (__shift - 32);
*bed1a5b3SKonstantin Varlamov  _LIBCPP_ASSERT_INTERNAL(__shiftedSum <= UINT32_MAX, "");
abb5dd6eSMark de Wever  return static_cast<uint32_t>(__shiftedSum);
abb5dd6eSMark de Wever#endif // ^^^ 64-bit ^^^
abb5dd6eSMark de Wever}
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever[[nodiscard]] _LIBCPP_HIDE_FROM_ABI inline uint32_t __mulPow5InvDivPow2(const uint32_t __m, const uint32_t __q, const int32_t __j) {
abb5dd6eSMark de Wever  return __mulShift(__m, __FLOAT_POW5_INV_SPLIT[__q], __j);
abb5dd6eSMark de Wever}
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever[[nodiscard]] _LIBCPP_HIDE_FROM_ABI inline uint32_t __mulPow5divPow2(const uint32_t __m, const uint32_t __i, const int32_t __j) {
abb5dd6eSMark de Wever  return __mulShift(__m, __FLOAT_POW5_SPLIT[__i], __j);
abb5dd6eSMark de Wever}
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever// A floating decimal representing m * 10^e.
abb5dd6eSMark de Weverstruct __floating_decimal_32 {
abb5dd6eSMark de Wever  uint32_t __mantissa;
abb5dd6eSMark de Wever  int32_t __exponent;
abb5dd6eSMark de Wever};
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever[[nodiscard]] _LIBCPP_HIDE_FROM_ABI inline __floating_decimal_32 __f2d(const uint32_t __ieeeMantissa, const uint32_t __ieeeExponent) {
abb5dd6eSMark de Wever  int32_t __e2;
abb5dd6eSMark de Wever  uint32_t __m2;
abb5dd6eSMark de Wever  if (__ieeeExponent == 0) {
abb5dd6eSMark de Wever    // We subtract 2 so that the bounds computation has 2 additional bits.
abb5dd6eSMark de Wever    __e2 = 1 - __FLOAT_BIAS - __FLOAT_MANTISSA_BITS - 2;
abb5dd6eSMark de Wever    __m2 = __ieeeMantissa;
abb5dd6eSMark de Wever  } else {
abb5dd6eSMark de Wever    __e2 = static_cast<int32_t>(__ieeeExponent) - __FLOAT_BIAS - __FLOAT_MANTISSA_BITS - 2;
abb5dd6eSMark de Wever    __m2 = (1u << __FLOAT_MANTISSA_BITS) | __ieeeMantissa;
abb5dd6eSMark de Wever  }
abb5dd6eSMark de Wever  const bool __even = (__m2 & 1) == 0;
abb5dd6eSMark de Wever  const bool __acceptBounds = __even;
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever  // Step 2: Determine the interval of valid decimal representations.
abb5dd6eSMark de Wever  const uint32_t __mv = 4 * __m2;
abb5dd6eSMark de Wever  const uint32_t __mp = 4 * __m2 + 2;
abb5dd6eSMark de Wever  // Implicit bool -> int conversion. True is 1, false is 0.
abb5dd6eSMark de Wever  const uint32_t __mmShift = __ieeeMantissa != 0 || __ieeeExponent <= 1;
abb5dd6eSMark de Wever  const uint32_t __mm = 4 * __m2 - 1 - __mmShift;
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever  // Step 3: Convert to a decimal power base using 64-bit arithmetic.
abb5dd6eSMark de Wever  uint32_t __vr, __vp, __vm;
abb5dd6eSMark de Wever  int32_t __e10;
abb5dd6eSMark de Wever  bool __vmIsTrailingZeros = false;
abb5dd6eSMark de Wever  bool __vrIsTrailingZeros = false;
abb5dd6eSMark de Wever  uint8_t __lastRemovedDigit = 0;
abb5dd6eSMark de Wever  if (__e2 >= 0) {
abb5dd6eSMark de Wever    const uint32_t __q = __log10Pow2(__e2);
abb5dd6eSMark de Wever    __e10 = static_cast<int32_t>(__q);
abb5dd6eSMark de Wever    const int32_t __k = __FLOAT_POW5_INV_BITCOUNT + __pow5bits(static_cast<int32_t>(__q)) - 1;
abb5dd6eSMark de Wever    const int32_t __i = -__e2 + static_cast<int32_t>(__q) + __k;
abb5dd6eSMark de Wever    __vr = __mulPow5InvDivPow2(__mv, __q, __i);
abb5dd6eSMark de Wever    __vp = __mulPow5InvDivPow2(__mp, __q, __i);
abb5dd6eSMark de Wever    __vm = __mulPow5InvDivPow2(__mm, __q, __i);
abb5dd6eSMark de Wever    if (__q != 0 && (__vp - 1) / 10 <= __vm / 10) {
abb5dd6eSMark de Wever      // We need to know one removed digit even if we are not going to loop below. We could use
abb5dd6eSMark de Wever      // __q = X - 1 above, except that would require 33 bits for the result, and we've found that
abb5dd6eSMark de Wever      // 32-bit arithmetic is faster even on 64-bit machines.
abb5dd6eSMark de Wever      const int32_t __l = __FLOAT_POW5_INV_BITCOUNT + __pow5bits(static_cast<int32_t>(__q - 1)) - 1;
abb5dd6eSMark de Wever      __lastRemovedDigit = static_cast<uint8_t>(__mulPow5InvDivPow2(__mv, __q - 1,
abb5dd6eSMark de Wever        -__e2 + static_cast<int32_t>(__q) - 1 + __l) % 10);
abb5dd6eSMark de Wever    }
abb5dd6eSMark de Wever    if (__q <= 9) {
abb5dd6eSMark de Wever      // The largest power of 5 that fits in 24 bits is 5^10, but __q <= 9 seems to be safe as well.
abb5dd6eSMark de Wever      // Only one of __mp, __mv, and __mm can be a multiple of 5, if any.
abb5dd6eSMark de Wever      if (__mv % 5 == 0) {
abb5dd6eSMark de Wever        __vrIsTrailingZeros = __multipleOfPowerOf5(__mv, __q);
abb5dd6eSMark de Wever      } else if (__acceptBounds) {
abb5dd6eSMark de Wever        __vmIsTrailingZeros = __multipleOfPowerOf5(__mm, __q);
abb5dd6eSMark de Wever      } else {
abb5dd6eSMark de Wever        __vp -= __multipleOfPowerOf5(__mp, __q);
abb5dd6eSMark de Wever      }
abb5dd6eSMark de Wever    }
abb5dd6eSMark de Wever  } else {
abb5dd6eSMark de Wever    const uint32_t __q = __log10Pow5(-__e2);
abb5dd6eSMark de Wever    __e10 = static_cast<int32_t>(__q) + __e2;
abb5dd6eSMark de Wever    const int32_t __i = -__e2 - static_cast<int32_t>(__q);
abb5dd6eSMark de Wever    const int32_t __k = __pow5bits(__i) - __FLOAT_POW5_BITCOUNT;
abb5dd6eSMark de Wever    int32_t __j = static_cast<int32_t>(__q) - __k;
abb5dd6eSMark de Wever    __vr = __mulPow5divPow2(__mv, static_cast<uint32_t>(__i), __j);
abb5dd6eSMark de Wever    __vp = __mulPow5divPow2(__mp, static_cast<uint32_t>(__i), __j);
abb5dd6eSMark de Wever    __vm = __mulPow5divPow2(__mm, static_cast<uint32_t>(__i), __j);
abb5dd6eSMark de Wever    if (__q != 0 && (__vp - 1) / 10 <= __vm / 10) {
abb5dd6eSMark de Wever      __j = static_cast<int32_t>(__q) - 1 - (__pow5bits(__i + 1) - __FLOAT_POW5_BITCOUNT);
abb5dd6eSMark de Wever      __lastRemovedDigit = static_cast<uint8_t>(__mulPow5divPow2(__mv, static_cast<uint32_t>(__i + 1), __j) % 10);
abb5dd6eSMark de Wever    }
abb5dd6eSMark de Wever    if (__q <= 1) {
abb5dd6eSMark de Wever      // {__vr,__vp,__vm} is trailing zeros if {__mv,__mp,__mm} has at least __q trailing 0 bits.
abb5dd6eSMark de Wever      // __mv = 4 * __m2, so it always has at least two trailing 0 bits.
abb5dd6eSMark de Wever      __vrIsTrailingZeros = true;
abb5dd6eSMark de Wever      if (__acceptBounds) {
abb5dd6eSMark de Wever        // __mm = __mv - 1 - __mmShift, so it has 1 trailing 0 bit iff __mmShift == 1.
abb5dd6eSMark de Wever        __vmIsTrailingZeros = __mmShift == 1;
abb5dd6eSMark de Wever      } else {
abb5dd6eSMark de Wever        // __mp = __mv + 2, so it always has at least one trailing 0 bit.
abb5dd6eSMark de Wever        --__vp;
abb5dd6eSMark de Wever      }
abb5dd6eSMark de Wever    } else if (__q < 31) { // TRANSITION(ulfjack): Use a tighter bound here.
abb5dd6eSMark de Wever      __vrIsTrailingZeros = __multipleOfPowerOf2(__mv, __q - 1);
abb5dd6eSMark de Wever    }
abb5dd6eSMark de Wever  }
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever  // Step 4: Find the shortest decimal representation in the interval of valid representations.
abb5dd6eSMark de Wever  int32_t __removed = 0;
abb5dd6eSMark de Wever  uint32_t _Output;
abb5dd6eSMark de Wever  if (__vmIsTrailingZeros || __vrIsTrailingZeros) {
abb5dd6eSMark de Wever    // General case, which happens rarely (~4.0%).
abb5dd6eSMark de Wever    while (__vp / 10 > __vm / 10) {
abb5dd6eSMark de Wever#ifdef __clang__ // TRANSITION, LLVM-23106
abb5dd6eSMark de Wever      __vmIsTrailingZeros &= __vm - (__vm / 10) * 10 == 0;
abb5dd6eSMark de Wever#else
abb5dd6eSMark de Wever      __vmIsTrailingZeros &= __vm % 10 == 0;
abb5dd6eSMark de Wever#endif
abb5dd6eSMark de Wever      __vrIsTrailingZeros &= __lastRemovedDigit == 0;
abb5dd6eSMark de Wever      __lastRemovedDigit = static_cast<uint8_t>(__vr % 10);
abb5dd6eSMark de Wever      __vr /= 10;
abb5dd6eSMark de Wever      __vp /= 10;
abb5dd6eSMark de Wever      __vm /= 10;
abb5dd6eSMark de Wever      ++__removed;
abb5dd6eSMark de Wever    }
abb5dd6eSMark de Wever    if (__vmIsTrailingZeros) {
abb5dd6eSMark de Wever      while (__vm % 10 == 0) {
abb5dd6eSMark de Wever        __vrIsTrailingZeros &= __lastRemovedDigit == 0;
abb5dd6eSMark de Wever        __lastRemovedDigit = static_cast<uint8_t>(__vr % 10);
abb5dd6eSMark de Wever        __vr /= 10;
abb5dd6eSMark de Wever        __vp /= 10;
abb5dd6eSMark de Wever        __vm /= 10;
abb5dd6eSMark de Wever        ++__removed;
abb5dd6eSMark de Wever      }
abb5dd6eSMark de Wever    }
abb5dd6eSMark de Wever    if (__vrIsTrailingZeros && __lastRemovedDigit == 5 && __vr % 2 == 0) {
abb5dd6eSMark de Wever      // Round even if the exact number is .....50..0.
abb5dd6eSMark de Wever      __lastRemovedDigit = 4;
abb5dd6eSMark de Wever    }
abb5dd6eSMark de Wever    // We need to take __vr + 1 if __vr is outside bounds or we need to round up.
abb5dd6eSMark de Wever    _Output = __vr + ((__vr == __vm && (!__acceptBounds || !__vmIsTrailingZeros)) || __lastRemovedDigit >= 5);
abb5dd6eSMark de Wever  } else {
abb5dd6eSMark de Wever    // Specialized for the common case (~96.0%). Percentages below are relative to this.
abb5dd6eSMark de Wever    // Loop iterations below (approximately):
abb5dd6eSMark de Wever    // 0: 13.6%, 1: 70.7%, 2: 14.1%, 3: 1.39%, 4: 0.14%, 5+: 0.01%
abb5dd6eSMark de Wever    while (__vp / 10 > __vm / 10) {
abb5dd6eSMark de Wever      __lastRemovedDigit = static_cast<uint8_t>(__vr % 10);
abb5dd6eSMark de Wever      __vr /= 10;
abb5dd6eSMark de Wever      __vp /= 10;
abb5dd6eSMark de Wever      __vm /= 10;
abb5dd6eSMark de Wever      ++__removed;
abb5dd6eSMark de Wever    }
abb5dd6eSMark de Wever    // We need to take __vr + 1 if __vr is outside bounds or we need to round up.
abb5dd6eSMark de Wever    _Output = __vr + (__vr == __vm || __lastRemovedDigit >= 5);
abb5dd6eSMark de Wever  }
abb5dd6eSMark de Wever  const int32_t __exp = __e10 + __removed;
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever  __floating_decimal_32 __fd;
abb5dd6eSMark de Wever  __fd.__exponent = __exp;
abb5dd6eSMark de Wever  __fd.__mantissa = _Output;
abb5dd6eSMark de Wever  return __fd;
abb5dd6eSMark de Wever}
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever[[nodiscard]] _LIBCPP_HIDE_FROM_ABI inline to_chars_result _Large_integer_to_chars(char* const _First, char* const _Last,
abb5dd6eSMark de Wever  const uint32_t _Mantissa2, const int32_t _Exponent2) {
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever  // Print the integer _Mantissa2 * 2^_Exponent2 exactly.
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever  // For nonzero integers, _Exponent2 >= -23. (The minimum value occurs when _Mantissa2 * 2^_Exponent2 is 1.
abb5dd6eSMark de Wever  // In that case, _Mantissa2 is the implicit 1 bit followed by 23 zeros, so _Exponent2 is -23 to shift away
abb5dd6eSMark de Wever  // the zeros.) The dense range of exactly representable integers has negative or zero exponents
abb5dd6eSMark de Wever  // (as positive exponents make the range non-dense). For that dense range, Ryu will always be used:
abb5dd6eSMark de Wever  // every digit is necessary to uniquely identify the value, so Ryu must print them all.
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever  // Positive exponents are the non-dense range of exactly representable integers.
abb5dd6eSMark de Wever  // This contains all of the values for which Ryu can't be used (and a few Ryu-friendly values).
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever  // Performance note: Long division appears to be faster than losslessly widening float to double and calling
abb5dd6eSMark de Wever  // __d2fixed_buffered_n(). If __f2fixed_buffered_n() is implemented, it might be faster than long division.
abb5dd6eSMark de Wever
*bed1a5b3SKonstantin Varlamov  _LIBCPP_ASSERT_INTERNAL(_Exponent2 > 0, "");
*bed1a5b3SKonstantin Varlamov  _LIBCPP_ASSERT_INTERNAL(_Exponent2 <= 104, ""); // because __ieeeExponent <= 254
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever  // Manually represent _Mantissa2 * 2^_Exponent2 as a large integer. _Mantissa2 is always 24 bits
abb5dd6eSMark de Wever  // (due to the implicit bit), while _Exponent2 indicates a shift of at most 104 bits.
abb5dd6eSMark de Wever  // 24 + 104 equals 128 equals 4 * 32, so we need exactly 4 32-bit elements.
abb5dd6eSMark de Wever  // We use a little-endian representation, visualized like this:
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever  // << left shift <<
abb5dd6eSMark de Wever  // most significant
abb5dd6eSMark de Wever  // _Data[3] _Data[2] _Data[1] _Data[0]
abb5dd6eSMark de Wever  //                   least significant
abb5dd6eSMark de Wever  //                   >> right shift >>
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever  constexpr uint32_t _Data_size = 4;
abb5dd6eSMark de Wever  uint32_t _Data[_Data_size]{};
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever  // _Maxidx is the index of the most significant nonzero element.
abb5dd6eSMark de Wever  uint32_t _Maxidx = ((24 + static_cast<uint32_t>(_Exponent2) + 31) / 32) - 1;
*bed1a5b3SKonstantin Varlamov  _LIBCPP_ASSERT_INTERNAL(_Maxidx < _Data_size, "");
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever  const uint32_t _Bit_shift = static_cast<uint32_t>(_Exponent2) % 32;
abb5dd6eSMark de Wever  if (_Bit_shift <= 8) { // _Mantissa2's 24 bits don't cross an element boundary
abb5dd6eSMark de Wever    _Data[_Maxidx] = _Mantissa2 << _Bit_shift;
abb5dd6eSMark de Wever  } else { // _Mantissa2's 24 bits cross an element boundary
abb5dd6eSMark de Wever    _Data[_Maxidx - 1] = _Mantissa2 << _Bit_shift;
abb5dd6eSMark de Wever    _Data[_Maxidx] = _Mantissa2 >> (32 - _Bit_shift);
abb5dd6eSMark de Wever  }
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever  // If Ryu hasn't determined the total output length, we need to buffer the digits generated from right to left
abb5dd6eSMark de Wever  // by long division. The largest possible float is: 340'282346638'528859811'704183484'516925440
abb5dd6eSMark de Wever  uint32_t _Blocks[4];
abb5dd6eSMark de Wever  int32_t _Filled_blocks = 0;
abb5dd6eSMark de Wever  // From left to right, we're going to print:
abb5dd6eSMark de Wever  // _Data[0] will be [1, 10] digits.
abb5dd6eSMark de Wever  // Then if _Filled_blocks > 0:
abb5dd6eSMark de Wever  // _Blocks[_Filled_blocks - 1], ..., _Blocks[0] will be 0-filled 9-digit blocks.
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever  if (_Maxidx != 0) { // If the integer is actually large, perform long division.
abb5dd6eSMark de Wever                      // Otherwise, skip to printing _Data[0].
abb5dd6eSMark de Wever    for (;;) {
abb5dd6eSMark de Wever      // Loop invariant: _Maxidx != 0 (i.e. the integer is actually large)
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever      const uint32_t _Most_significant_elem = _Data[_Maxidx];
abb5dd6eSMark de Wever      const uint32_t _Initial_remainder = _Most_significant_elem % 1000000000;
abb5dd6eSMark de Wever      const uint32_t _Initial_quotient = _Most_significant_elem / 1000000000;
abb5dd6eSMark de Wever      _Data[_Maxidx] = _Initial_quotient;
abb5dd6eSMark de Wever      uint64_t _Remainder = _Initial_remainder;
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever      // Process less significant elements.
abb5dd6eSMark de Wever      uint32_t _Idx = _Maxidx;
abb5dd6eSMark de Wever      do {
abb5dd6eSMark de Wever        --_Idx; // Initially, _Remainder is at most 10^9 - 1.
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever        // Now, _Remainder is at most (10^9 - 1) * 2^32 + 2^32 - 1, simplified to 10^9 * 2^32 - 1.
abb5dd6eSMark de Wever        _Remainder = (_Remainder << 32) | _Data[_Idx];
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever        // floor((10^9 * 2^32 - 1) / 10^9) == 2^32 - 1, so uint32_t _Quotient is lossless.
abb5dd6eSMark de Wever        const uint32_t _Quotient = static_cast<uint32_t>(__div1e9(_Remainder));
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever        // _Remainder is at most 10^9 - 1 again.
abb5dd6eSMark de Wever        // For uint32_t truncation, see the __mod1e9() comment in d2s_intrinsics.h.
abb5dd6eSMark de Wever        _Remainder = static_cast<uint32_t>(_Remainder) - 1000000000u * _Quotient;
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever        _Data[_Idx] = _Quotient;
abb5dd6eSMark de Wever      } while (_Idx != 0);
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever      // Store a 0-filled 9-digit block.
abb5dd6eSMark de Wever      _Blocks[_Filled_blocks++] = static_cast<uint32_t>(_Remainder);
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever      if (_Initial_quotient == 0) { // Is the large integer shrinking?
abb5dd6eSMark de Wever        --_Maxidx; // log2(10^9) is 29.9, so we can't shrink by more than one element.
abb5dd6eSMark de Wever        if (_Maxidx == 0) {
abb5dd6eSMark de Wever          break; // We've finished long division. Now we need to print _Data[0].
abb5dd6eSMark de Wever        }
abb5dd6eSMark de Wever      }
abb5dd6eSMark de Wever    }
abb5dd6eSMark de Wever  }
abb5dd6eSMark de Wever
*bed1a5b3SKonstantin Varlamov  _LIBCPP_ASSERT_INTERNAL(_Data[0] != 0, "");
abb5dd6eSMark de Wever  for (uint32_t _Idx = 1; _Idx < _Data_size; ++_Idx) {
*bed1a5b3SKonstantin Varlamov    _LIBCPP_ASSERT_INTERNAL(_Data[_Idx] == 0, "");
abb5dd6eSMark de Wever  }
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever  const uint32_t _Data_olength = _Data[0] >= 1000000000 ? 10 : __decimalLength9(_Data[0]);
abb5dd6eSMark de Wever  const uint32_t _Total_fixed_length = _Data_olength + 9 * _Filled_blocks;
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever  if (_Last - _First < static_cast<ptrdiff_t>(_Total_fixed_length)) {
abb5dd6eSMark de Wever    return { _Last, errc::value_too_large };
abb5dd6eSMark de Wever  }
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever  char* _Result = _First;
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever  // Print _Data[0]. While it's up to 10 digits,
abb5dd6eSMark de Wever  // which is more than Ryu generates, the code below can handle this.
abb5dd6eSMark de Wever  __append_n_digits(_Data_olength, _Data[0], _Result);
abb5dd6eSMark de Wever  _Result += _Data_olength;
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever  // Print 0-filled 9-digit blocks.
abb5dd6eSMark de Wever  for (int32_t _Idx = _Filled_blocks - 1; _Idx >= 0; --_Idx) {
abb5dd6eSMark de Wever    __append_nine_digits(_Blocks[_Idx], _Result);
abb5dd6eSMark de Wever    _Result += 9;
abb5dd6eSMark de Wever  }
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever  return { _Result, errc{} };
abb5dd6eSMark de Wever}
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever[[nodiscard]] _LIBCPP_HIDE_FROM_ABI inline to_chars_result __to_chars(char* const _First, char* const _Last, const __floating_decimal_32 __v,
abb5dd6eSMark de Wever  chars_format _Fmt, const uint32_t __ieeeMantissa, const uint32_t __ieeeExponent) {
abb5dd6eSMark de Wever  // Step 5: Print the decimal representation.
abb5dd6eSMark de Wever  uint32_t _Output = __v.__mantissa;
abb5dd6eSMark de Wever  int32_t _Ryu_exponent = __v.__exponent;
abb5dd6eSMark de Wever  const uint32_t __olength = __decimalLength9(_Output);
abb5dd6eSMark de Wever  int32_t _Scientific_exponent = _Ryu_exponent + static_cast<int32_t>(__olength) - 1;
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever  if (_Fmt == chars_format{}) {
abb5dd6eSMark de Wever    int32_t _Lower;
abb5dd6eSMark de Wever    int32_t _Upper;
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever    if (__olength == 1) {
abb5dd6eSMark de Wever      // Value | Fixed   | Scientific
abb5dd6eSMark de Wever      // 1e-3  | "0.001" | "1e-03"
abb5dd6eSMark de Wever      // 1e4   | "10000" | "1e+04"
abb5dd6eSMark de Wever      _Lower = -3;
abb5dd6eSMark de Wever      _Upper = 4;
abb5dd6eSMark de Wever    } else {
abb5dd6eSMark de Wever      // Value   | Fixed       | Scientific
abb5dd6eSMark de Wever      // 1234e-7 | "0.0001234" | "1.234e-04"
abb5dd6eSMark de Wever      // 1234e5  | "123400000" | "1.234e+08"
abb5dd6eSMark de Wever      _Lower = -static_cast<int32_t>(__olength + 3);
abb5dd6eSMark de Wever      _Upper = 5;
abb5dd6eSMark de Wever    }
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever    if (_Lower <= _Ryu_exponent && _Ryu_exponent <= _Upper) {
abb5dd6eSMark de Wever      _Fmt = chars_format::fixed;
abb5dd6eSMark de Wever    } else {
abb5dd6eSMark de Wever      _Fmt = chars_format::scientific;
abb5dd6eSMark de Wever    }
abb5dd6eSMark de Wever  } else if (_Fmt == chars_format::general) {
abb5dd6eSMark de Wever    // C11 7.21.6.1 "The fprintf function"/8:
abb5dd6eSMark de Wever    // "Let P equal [...] 6 if the precision is omitted [...].
abb5dd6eSMark de Wever    // Then, if a conversion with style E would have an exponent of X:
abb5dd6eSMark de Wever    // - if P > X >= -4, the conversion is with style f [...].
abb5dd6eSMark de Wever    // - otherwise, the conversion is with style e [...]."
abb5dd6eSMark de Wever    if (-4 <= _Scientific_exponent && _Scientific_exponent < 6) {
abb5dd6eSMark de Wever      _Fmt = chars_format::fixed;
abb5dd6eSMark de Wever    } else {
abb5dd6eSMark de Wever      _Fmt = chars_format::scientific;
abb5dd6eSMark de Wever    }
abb5dd6eSMark de Wever  }
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever  if (_Fmt == chars_format::fixed) {
abb5dd6eSMark de Wever    // Example: _Output == 1729, __olength == 4
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever    // _Ryu_exponent | Printed  | _Whole_digits | _Total_fixed_length  | Notes
abb5dd6eSMark de Wever    // --------------|----------|---------------|----------------------|---------------------------------------
abb5dd6eSMark de Wever    //             2 | 172900   |  6            | _Whole_digits        | Ryu can't be used for printing
abb5dd6eSMark de Wever    //             1 | 17290    |  5            | (sometimes adjusted) | when the trimmed digits are nonzero.
abb5dd6eSMark de Wever    // --------------|----------|---------------|----------------------|---------------------------------------
abb5dd6eSMark de Wever    //             0 | 1729     |  4            | _Whole_digits        | Unified length cases.
abb5dd6eSMark de Wever    // --------------|----------|---------------|----------------------|---------------------------------------
abb5dd6eSMark de Wever    //            -1 | 172.9    |  3            | __olength + 1        | This case can't happen for
abb5dd6eSMark de Wever    //            -2 | 17.29    |  2            |                      | __olength == 1, but no additional
abb5dd6eSMark de Wever    //            -3 | 1.729    |  1            |                      | code is needed to avoid it.
abb5dd6eSMark de Wever    // --------------|----------|---------------|----------------------|---------------------------------------
abb5dd6eSMark de Wever    //            -4 | 0.1729   |  0            | 2 - _Ryu_exponent    | C11 7.21.6.1 "The fprintf function"/8:
abb5dd6eSMark de Wever    //            -5 | 0.01729  | -1            |                      | "If a decimal-point character appears,
abb5dd6eSMark de Wever    //            -6 | 0.001729 | -2            |                      | at least one digit appears before it."
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever    const int32_t _Whole_digits = static_cast<int32_t>(__olength) + _Ryu_exponent;
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever    uint32_t _Total_fixed_length;
abb5dd6eSMark de Wever    if (_Ryu_exponent >= 0) { // cases "172900" and "1729"
abb5dd6eSMark de Wever      _Total_fixed_length = static_cast<uint32_t>(_Whole_digits);
abb5dd6eSMark de Wever      if (_Output == 1) {
abb5dd6eSMark de Wever        // Rounding can affect the number of digits.
abb5dd6eSMark de Wever        // For example, 1e11f is exactly "99999997952" which is 11 digits instead of 12.
abb5dd6eSMark de Wever        // We can use a lookup table to detect this and adjust the total length.
abb5dd6eSMark de Wever        static constexpr uint8_t _Adjustment[39] = {
abb5dd6eSMark de Wever          0,0,0,0,0,0,0,0,0,0,0,1,1,1,0,1,0,1,1,1,0,0,1,1,0,1,0,1,1,0,0,1,0,1,1,0,1,1,1 };
abb5dd6eSMark de Wever        _Total_fixed_length -= _Adjustment[_Ryu_exponent];
abb5dd6eSMark de Wever        // _Whole_digits doesn't need to be adjusted because these cases won't refer to it later.
abb5dd6eSMark de Wever      }
abb5dd6eSMark de Wever    } else if (_Whole_digits > 0) { // case "17.29"
abb5dd6eSMark de Wever      _Total_fixed_length = __olength + 1;
abb5dd6eSMark de Wever    } else { // case "0.001729"
abb5dd6eSMark de Wever      _Total_fixed_length = static_cast<uint32_t>(2 - _Ryu_exponent);
abb5dd6eSMark de Wever    }
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever    if (_Last - _First < static_cast<ptrdiff_t>(_Total_fixed_length)) {
abb5dd6eSMark de Wever      return { _Last, errc::value_too_large };
abb5dd6eSMark de Wever    }
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever    char* _Mid;
abb5dd6eSMark de Wever    if (_Ryu_exponent > 0) { // case "172900"
abb5dd6eSMark de Wever      bool _Can_use_ryu;
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever      if (_Ryu_exponent > 10) { // 10^10 is the largest power of 10 that's exactly representable as a float.
abb5dd6eSMark de Wever        _Can_use_ryu = false;
abb5dd6eSMark de Wever      } else {
abb5dd6eSMark de Wever        // Ryu generated X: __v.__mantissa * 10^_Ryu_exponent
abb5dd6eSMark de Wever        // __v.__mantissa == 2^_Trailing_zero_bits * (__v.__mantissa >> _Trailing_zero_bits)
abb5dd6eSMark de Wever        // 10^_Ryu_exponent == 2^_Ryu_exponent * 5^_Ryu_exponent
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever        // _Trailing_zero_bits is [0, 29] (aside: because 2^29 is the largest power of 2
abb5dd6eSMark de Wever        // with 9 decimal digits, which is float's round-trip limit.)
abb5dd6eSMark de Wever        // _Ryu_exponent is [1, 10].
abb5dd6eSMark de Wever        // Normalization adds [2, 23] (aside: at least 2 because the pre-normalized mantissa is at least 5).
abb5dd6eSMark de Wever        // This adds up to [3, 62], which is well below float's maximum binary exponent 127.
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever        // Therefore, we just need to consider (__v.__mantissa >> _Trailing_zero_bits) * 5^_Ryu_exponent.
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever        // If that product would exceed 24 bits, then X can't be exactly represented as a float.
abb5dd6eSMark de Wever        // (That's not a problem for round-tripping, because X is close enough to the original float,
abb5dd6eSMark de Wever        // but X isn't mathematically equal to the original float.) This requires a high-precision fallback.
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever        // If the product is 24 bits or smaller, then X can be exactly represented as a float (and we don't
abb5dd6eSMark de Wever        // need to re-synthesize it; the original float must have been X, because Ryu wouldn't produce the
abb5dd6eSMark de Wever        // same output for two different floats X and Y). This allows Ryu's output to be used (zero-filled).
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever        // (2^24 - 1) / 5^0 (for indexing), (2^24 - 1) / 5^1, ..., (2^24 - 1) / 5^10
abb5dd6eSMark de Wever        static constexpr uint32_t _Max_shifted_mantissa[11] = {
abb5dd6eSMark de Wever          16777215, 3355443, 671088, 134217, 26843, 5368, 1073, 214, 42, 8, 1 };
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever        unsigned long _Trailing_zero_bits;
abb5dd6eSMark de Wever        (void) _BitScanForward(&_Trailing_zero_bits, __v.__mantissa); // __v.__mantissa is guaranteed nonzero
abb5dd6eSMark de Wever        const uint32_t _Shifted_mantissa = __v.__mantissa >> _Trailing_zero_bits;
abb5dd6eSMark de Wever        _Can_use_ryu = _Shifted_mantissa <= _Max_shifted_mantissa[_Ryu_exponent];
abb5dd6eSMark de Wever      }
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever      if (!_Can_use_ryu) {
abb5dd6eSMark de Wever        const uint32_t _Mantissa2 = __ieeeMantissa | (1u << __FLOAT_MANTISSA_BITS); // restore implicit bit
abb5dd6eSMark de Wever        const int32_t _Exponent2 = static_cast<int32_t>(__ieeeExponent)
abb5dd6eSMark de Wever          - __FLOAT_BIAS - __FLOAT_MANTISSA_BITS; // bias and normalization
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever        // Performance note: We've already called Ryu, so this will redundantly perform buffering and bounds checking.
abb5dd6eSMark de Wever        return _Large_integer_to_chars(_First, _Last, _Mantissa2, _Exponent2);
abb5dd6eSMark de Wever      }
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever      // _Can_use_ryu
abb5dd6eSMark de Wever      // Print the decimal digits, left-aligned within [_First, _First + _Total_fixed_length).
abb5dd6eSMark de Wever      _Mid = _First + __olength;
abb5dd6eSMark de Wever    } else { // cases "1729", "17.29", and "0.001729"
abb5dd6eSMark de Wever      // Print the decimal digits, right-aligned within [_First, _First + _Total_fixed_length).
abb5dd6eSMark de Wever      _Mid = _First + _Total_fixed_length;
abb5dd6eSMark de Wever    }
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever    while (_Output >= 10000) {
abb5dd6eSMark de Wever#ifdef __clang__ // TRANSITION, LLVM-38217
abb5dd6eSMark de Wever      const uint32_t __c = _Output - 10000 * (_Output / 10000);
abb5dd6eSMark de Wever#else
abb5dd6eSMark de Wever      const uint32_t __c = _Output % 10000;
abb5dd6eSMark de Wever#endif
abb5dd6eSMark de Wever      _Output /= 10000;
abb5dd6eSMark de Wever      const uint32_t __c0 = (__c % 100) << 1;
abb5dd6eSMark de Wever      const uint32_t __c1 = (__c / 100) << 1;
6e679286SLouis Dionne      std::memcpy(_Mid -= 2, __DIGIT_TABLE + __c0, 2);
6e679286SLouis Dionne      std::memcpy(_Mid -= 2, __DIGIT_TABLE + __c1, 2);
abb5dd6eSMark de Wever    }
abb5dd6eSMark de Wever    if (_Output >= 100) {
abb5dd6eSMark de Wever      const uint32_t __c = (_Output % 100) << 1;
abb5dd6eSMark de Wever      _Output /= 100;
6e679286SLouis Dionne      std::memcpy(_Mid -= 2, __DIGIT_TABLE + __c, 2);
abb5dd6eSMark de Wever    }
abb5dd6eSMark de Wever    if (_Output >= 10) {
abb5dd6eSMark de Wever      const uint32_t __c = _Output << 1;
6e679286SLouis Dionne      std::memcpy(_Mid -= 2, __DIGIT_TABLE + __c, 2);
abb5dd6eSMark de Wever    } else {
abb5dd6eSMark de Wever      *--_Mid = static_cast<char>('0' + _Output);
abb5dd6eSMark de Wever    }
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever    if (_Ryu_exponent > 0) { // case "172900" with _Can_use_ryu
abb5dd6eSMark de Wever      // Performance note: it might be more efficient to do this immediately after setting _Mid.
6e679286SLouis Dionne      std::memset(_First + __olength, '0', static_cast<size_t>(_Ryu_exponent));
abb5dd6eSMark de Wever    } else if (_Ryu_exponent == 0) { // case "1729"
abb5dd6eSMark de Wever      // Done!
abb5dd6eSMark de Wever    } else if (_Whole_digits > 0) { // case "17.29"
abb5dd6eSMark de Wever      // Performance note: moving digits might not be optimal.
6e679286SLouis Dionne      std::memmove(_First, _First + 1, static_cast<size_t>(_Whole_digits));
abb5dd6eSMark de Wever      _First[_Whole_digits] = '.';
abb5dd6eSMark de Wever    } else { // case "0.001729"
abb5dd6eSMark de Wever      // Performance note: a larger memset() followed by overwriting '.' might be more efficient.
abb5dd6eSMark de Wever      _First[0] = '0';
abb5dd6eSMark de Wever      _First[1] = '.';
6e679286SLouis Dionne      std::memset(_First + 2, '0', static_cast<size_t>(-_Whole_digits));
abb5dd6eSMark de Wever    }
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever    return { _First + _Total_fixed_length, errc{} };
abb5dd6eSMark de Wever  }
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever  const uint32_t _Total_scientific_length =
abb5dd6eSMark de Wever    __olength + (__olength > 1) + 4; // digits + possible decimal point + scientific exponent
abb5dd6eSMark de Wever  if (_Last - _First < static_cast<ptrdiff_t>(_Total_scientific_length)) {
abb5dd6eSMark de Wever    return { _Last, errc::value_too_large };
abb5dd6eSMark de Wever  }
abb5dd6eSMark de Wever  char* const __result = _First;
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever  // Print the decimal digits.
abb5dd6eSMark de Wever  uint32_t __i = 0;
abb5dd6eSMark de Wever  while (_Output >= 10000) {
abb5dd6eSMark de Wever#ifdef __clang__ // TRANSITION, LLVM-38217
abb5dd6eSMark de Wever    const uint32_t __c = _Output - 10000 * (_Output / 10000);
abb5dd6eSMark de Wever#else
abb5dd6eSMark de Wever    const uint32_t __c = _Output % 10000;
abb5dd6eSMark de Wever#endif
abb5dd6eSMark de Wever    _Output /= 10000;
abb5dd6eSMark de Wever    const uint32_t __c0 = (__c % 100) << 1;
abb5dd6eSMark de Wever    const uint32_t __c1 = (__c / 100) << 1;
6e679286SLouis Dionne    std::memcpy(__result + __olength - __i - 1, __DIGIT_TABLE + __c0, 2);
6e679286SLouis Dionne    std::memcpy(__result + __olength - __i - 3, __DIGIT_TABLE + __c1, 2);
abb5dd6eSMark de Wever    __i += 4;
abb5dd6eSMark de Wever  }
abb5dd6eSMark de Wever  if (_Output >= 100) {
abb5dd6eSMark de Wever    const uint32_t __c = (_Output % 100) << 1;
abb5dd6eSMark de Wever    _Output /= 100;
6e679286SLouis Dionne    std::memcpy(__result + __olength - __i - 1, __DIGIT_TABLE + __c, 2);
abb5dd6eSMark de Wever    __i += 2;
abb5dd6eSMark de Wever  }
abb5dd6eSMark de Wever  if (_Output >= 10) {
abb5dd6eSMark de Wever    const uint32_t __c = _Output << 1;
abb5dd6eSMark de Wever    // We can't use memcpy here: the decimal dot goes between these two digits.
abb5dd6eSMark de Wever    __result[2] = __DIGIT_TABLE[__c + 1];
abb5dd6eSMark de Wever    __result[0] = __DIGIT_TABLE[__c];
abb5dd6eSMark de Wever  } else {
abb5dd6eSMark de Wever    __result[0] = static_cast<char>('0' + _Output);
abb5dd6eSMark de Wever  }
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever  // Print decimal point if needed.
abb5dd6eSMark de Wever  uint32_t __index;
abb5dd6eSMark de Wever  if (__olength > 1) {
abb5dd6eSMark de Wever    __result[1] = '.';
abb5dd6eSMark de Wever    __index = __olength + 1;
abb5dd6eSMark de Wever  } else {
abb5dd6eSMark de Wever    __index = 1;
abb5dd6eSMark de Wever  }
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever  // Print the exponent.
abb5dd6eSMark de Wever  __result[__index++] = 'e';
abb5dd6eSMark de Wever  if (_Scientific_exponent < 0) {
abb5dd6eSMark de Wever    __result[__index++] = '-';
abb5dd6eSMark de Wever    _Scientific_exponent = -_Scientific_exponent;
abb5dd6eSMark de Wever  } else {
abb5dd6eSMark de Wever    __result[__index++] = '+';
abb5dd6eSMark de Wever  }
abb5dd6eSMark de Wever
6e679286SLouis Dionne  std::memcpy(__result + __index, __DIGIT_TABLE + 2 * _Scientific_exponent, 2);
abb5dd6eSMark de Wever  __index += 2;
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever  return { _First + _Total_scientific_length, errc{} };
abb5dd6eSMark de Wever}
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever[[nodiscard]] to_chars_result __f2s_buffered_n(char* const _First, char* const _Last, const float __f,
abb5dd6eSMark de Wever  const chars_format _Fmt) {
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever  // Step 1: Decode the floating-point number, and unify normalized and subnormal cases.
abb5dd6eSMark de Wever  const uint32_t __bits = __float_to_bits(__f);
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever  // Case distinction; exit early for the easy cases.
abb5dd6eSMark de Wever  if (__bits == 0) {
abb5dd6eSMark de Wever    if (_Fmt == chars_format::scientific) {
abb5dd6eSMark de Wever      if (_Last - _First < 5) {
abb5dd6eSMark de Wever        return { _Last, errc::value_too_large };
abb5dd6eSMark de Wever      }
abb5dd6eSMark de Wever
6e679286SLouis Dionne      std::memcpy(_First, "0e+00", 5);
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever      return { _First + 5, errc{} };
abb5dd6eSMark de Wever    }
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever    // Print "0" for chars_format::fixed, chars_format::general, and chars_format{}.
abb5dd6eSMark de Wever    if (_First == _Last) {
abb5dd6eSMark de Wever      return { _Last, errc::value_too_large };
abb5dd6eSMark de Wever    }
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever    *_First = '0';
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever    return { _First + 1, errc{} };
abb5dd6eSMark de Wever  }
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever  // Decode __bits into mantissa and exponent.
abb5dd6eSMark de Wever  const uint32_t __ieeeMantissa = __bits & ((1u << __FLOAT_MANTISSA_BITS) - 1);
abb5dd6eSMark de Wever  const uint32_t __ieeeExponent = __bits >> __FLOAT_MANTISSA_BITS;
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever  // When _Fmt == chars_format::fixed and the floating-point number is a large integer,
abb5dd6eSMark de Wever  // it's faster to skip Ryu and immediately print the integer exactly.
abb5dd6eSMark de Wever  if (_Fmt == chars_format::fixed) {
abb5dd6eSMark de Wever    const uint32_t _Mantissa2 = __ieeeMantissa | (1u << __FLOAT_MANTISSA_BITS); // restore implicit bit
abb5dd6eSMark de Wever    const int32_t _Exponent2 = static_cast<int32_t>(__ieeeExponent)
abb5dd6eSMark de Wever      - __FLOAT_BIAS - __FLOAT_MANTISSA_BITS; // bias and normalization
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever    // Normal values are equal to _Mantissa2 * 2^_Exponent2.
abb5dd6eSMark de Wever    // (Subnormals are different, but they'll be rejected by the _Exponent2 test here, so they can be ignored.)
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever    if (_Exponent2 > 0) {
abb5dd6eSMark de Wever      return _Large_integer_to_chars(_First, _Last, _Mantissa2, _Exponent2);
abb5dd6eSMark de Wever    }
abb5dd6eSMark de Wever  }
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever  const __floating_decimal_32 __v = __f2d(__ieeeMantissa, __ieeeExponent);
abb5dd6eSMark de Wever  return __to_chars(_First, _Last, __v, _Fmt, __ieeeMantissa, __ieeeExponent);
abb5dd6eSMark de Wever}
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever_LIBCPP_END_NAMESPACE_STD
abb5dd6eSMark de Wever
abb5dd6eSMark de Wever// clang-format on