src/ryu/d2fixed.cpp

*4bdff4beSrobert//===----------------------------------------------------------------------===//
*4bdff4beSrobert//
*4bdff4beSrobert// Part of the LLVM Project, under the Apache License v2.0 with LLVM Exceptions.
*4bdff4beSrobert// See https://llvm.org/LICENSE.txt for license information.
*4bdff4beSrobert// SPDX-License-Identifier: Apache-2.0 WITH LLVM-exception
*4bdff4beSrobert//
*4bdff4beSrobert//===----------------------------------------------------------------------===//
*4bdff4beSrobert
*4bdff4beSrobert// Copyright (c) Microsoft Corporation.
*4bdff4beSrobert// SPDX-License-Identifier: Apache-2.0 WITH LLVM-exception
*4bdff4beSrobert
*4bdff4beSrobert// Copyright 2018 Ulf Adams
*4bdff4beSrobert// Copyright (c) Microsoft Corporation. All rights reserved.
*4bdff4beSrobert
*4bdff4beSrobert// Boost Software License - Version 1.0 - August 17th, 2003
*4bdff4beSrobert
*4bdff4beSrobert// Permission is hereby granted, free of charge, to any person or organization
*4bdff4beSrobert// obtaining a copy of the software and accompanying documentation covered by
*4bdff4beSrobert// this license (the "Software") to use, reproduce, display, distribute,
*4bdff4beSrobert// execute, and transmit the Software, and to prepare derivative works of the
*4bdff4beSrobert// Software, and to permit third-parties to whom the Software is furnished to
*4bdff4beSrobert// do so, all subject to the following:
*4bdff4beSrobert
*4bdff4beSrobert// The copyright notices in the Software and this entire statement, including
*4bdff4beSrobert// the above license grant, this restriction and the following disclaimer,
*4bdff4beSrobert// must be included in all copies of the Software, in whole or in part, and
*4bdff4beSrobert// all derivative works of the Software, unless such copies or derivative
*4bdff4beSrobert// works are solely in the form of machine-executable object code generated by
*4bdff4beSrobert// a source language processor.
*4bdff4beSrobert
*4bdff4beSrobert// THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND, EXPRESS OR
*4bdff4beSrobert// IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF MERCHANTABILITY,
*4bdff4beSrobert// FITNESS FOR A PARTICULAR PURPOSE, TITLE AND NON-INFRINGEMENT. IN NO EVENT
*4bdff4beSrobert// SHALL THE COPYRIGHT HOLDERS OR ANYONE DISTRIBUTING THE SOFTWARE BE LIABLE
*4bdff4beSrobert// FOR ANY DAMAGES OR OTHER LIABILITY, WHETHER IN CONTRACT, TORT OR OTHERWISE,
*4bdff4beSrobert// ARISING FROM, OUT OF OR IN CONNECTION WITH THE SOFTWARE OR THE USE OR OTHER
*4bdff4beSrobert// DEALINGS IN THE SOFTWARE.
*4bdff4beSrobert
*4bdff4beSrobert// Avoid formatting to keep the changes with the original code minimal.
*4bdff4beSrobert// clang-format off
*4bdff4beSrobert
*4bdff4beSrobert#include <__assert>
*4bdff4beSrobert#include <__config>
*4bdff4beSrobert#include <charconv>
*4bdff4beSrobert#include <cstring>
*4bdff4beSrobert#include <system_error>
*4bdff4beSrobert
*4bdff4beSrobert#include "include/ryu/common.h"
*4bdff4beSrobert#include "include/ryu/d2fixed.h"
*4bdff4beSrobert#include "include/ryu/d2fixed_full_table.h"
*4bdff4beSrobert#include "include/ryu/d2s.h"
*4bdff4beSrobert#include "include/ryu/d2s_intrinsics.h"
*4bdff4beSrobert#include "include/ryu/digit_table.h"
*4bdff4beSrobert
*4bdff4beSrobert_LIBCPP_BEGIN_NAMESPACE_STD
*4bdff4beSrobert
*4bdff4beSrobertinline constexpr int __POW10_ADDITIONAL_BITS = 120;
*4bdff4beSrobert
*4bdff4beSrobert#ifdef _LIBCPP_INTRINSIC128
*4bdff4beSrobert// Returns the low 64 bits of the high 128 bits of the 256-bit product of a and b.
*4bdff4beSrobert[[nodiscard]] _LIBCPP_HIDE_FROM_ABI inline uint64_t __umul256_hi128_lo64(
*4bdff4beSrobert  const uint64_t __aHi, const uint64_t __aLo, const uint64_t __bHi, const uint64_t __bLo) {
*4bdff4beSrobert  uint64_t __b00Hi;
*4bdff4beSrobert  const uint64_t __b00Lo = __ryu_umul128(__aLo, __bLo, &__b00Hi);
*4bdff4beSrobert  uint64_t __b01Hi;
*4bdff4beSrobert  const uint64_t __b01Lo = __ryu_umul128(__aLo, __bHi, &__b01Hi);
*4bdff4beSrobert  uint64_t __b10Hi;
*4bdff4beSrobert  const uint64_t __b10Lo = __ryu_umul128(__aHi, __bLo, &__b10Hi);
*4bdff4beSrobert  uint64_t __b11Hi;
*4bdff4beSrobert  const uint64_t __b11Lo = __ryu_umul128(__aHi, __bHi, &__b11Hi);
*4bdff4beSrobert  (void) __b00Lo; // unused
*4bdff4beSrobert  (void) __b11Hi; // unused
*4bdff4beSrobert  const uint64_t __temp1Lo = __b10Lo + __b00Hi;
*4bdff4beSrobert  const uint64_t __temp1Hi = __b10Hi + (__temp1Lo < __b10Lo);
*4bdff4beSrobert  const uint64_t __temp2Lo = __b01Lo + __temp1Lo;
*4bdff4beSrobert  const uint64_t __temp2Hi = __b01Hi + (__temp2Lo < __b01Lo);
*4bdff4beSrobert  return __b11Lo + __temp1Hi + __temp2Hi;
*4bdff4beSrobert}
*4bdff4beSrobert
*4bdff4beSrobert[[nodiscard]] _LIBCPP_HIDE_FROM_ABI inline uint32_t __uint128_mod1e9(const uint64_t __vHi, const uint64_t __vLo) {
*4bdff4beSrobert  // After multiplying, we're going to shift right by 29, then truncate to uint32_t.
*4bdff4beSrobert  // This means that we need only 29 + 32 = 61 bits, so we can truncate to uint64_t before shifting.
*4bdff4beSrobert  const uint64_t __multiplied = __umul256_hi128_lo64(__vHi, __vLo, 0x89705F4136B4A597u, 0x31680A88F8953031u);
*4bdff4beSrobert
*4bdff4beSrobert  // For uint32_t truncation, see the __mod1e9() comment in d2s_intrinsics.h.
*4bdff4beSrobert  const uint32_t __shifted = static_cast<uint32_t>(__multiplied >> 29);
*4bdff4beSrobert
*4bdff4beSrobert  return static_cast<uint32_t>(__vLo) - 1000000000 * __shifted;
*4bdff4beSrobert}
*4bdff4beSrobert#endif // ^^^ intrinsics available ^^^
*4bdff4beSrobert
*4bdff4beSrobert[[nodiscard]] _LIBCPP_HIDE_FROM_ABI inline uint32_t __mulShift_mod1e9(const uint64_t __m, const uint64_t* const __mul, const int32_t __j) {
*4bdff4beSrobert  uint64_t __high0;                                               // 64
*4bdff4beSrobert  const uint64_t __low0 = __ryu_umul128(__m, __mul[0], &__high0); // 0
*4bdff4beSrobert  uint64_t __high1;                                               // 128
*4bdff4beSrobert  const uint64_t __low1 = __ryu_umul128(__m, __mul[1], &__high1); // 64
*4bdff4beSrobert  uint64_t __high2;                                               // 192
*4bdff4beSrobert  const uint64_t __low2 = __ryu_umul128(__m, __mul[2], &__high2); // 128
*4bdff4beSrobert  const uint64_t __s0low = __low0;                  // 0
*4bdff4beSrobert  (void) __s0low; // unused
*4bdff4beSrobert  const uint64_t __s0high = __low1 + __high0;       // 64
*4bdff4beSrobert  const uint32_t __c1 = __s0high < __low1;
*4bdff4beSrobert  const uint64_t __s1low = __low2 + __high1 + __c1; // 128
*4bdff4beSrobert  const uint32_t __c2 = __s1low < __low2; // __high1 + __c1 can't overflow, so compare against __low2
*4bdff4beSrobert  const uint64_t __s1high = __high2 + __c2;         // 192
*4bdff4beSrobert  _LIBCPP_ASSERT(__j >= 128, "");
*4bdff4beSrobert  _LIBCPP_ASSERT(__j <= 180, "");
*4bdff4beSrobert#ifdef _LIBCPP_INTRINSIC128
*4bdff4beSrobert  const uint32_t __dist = static_cast<uint32_t>(__j - 128); // __dist: [0, 52]
*4bdff4beSrobert  const uint64_t __shiftedhigh = __s1high >> __dist;
*4bdff4beSrobert  const uint64_t __shiftedlow = __ryu_shiftright128(__s1low, __s1high, __dist);
*4bdff4beSrobert  return __uint128_mod1e9(__shiftedhigh, __shiftedlow);
*4bdff4beSrobert#else // ^^^ intrinsics available ^^^ / vvv intrinsics unavailable vvv
*4bdff4beSrobert  if (__j < 160) { // __j: [128, 160)
*4bdff4beSrobert    const uint64_t __r0 = __mod1e9(__s1high);
*4bdff4beSrobert    const uint64_t __r1 = __mod1e9((__r0 << 32) | (__s1low >> 32));
*4bdff4beSrobert    const uint64_t __r2 = ((__r1 << 32) | (__s1low & 0xffffffff));
*4bdff4beSrobert    return __mod1e9(__r2 >> (__j - 128));
*4bdff4beSrobert  } else { // __j: [160, 192)
*4bdff4beSrobert    const uint64_t __r0 = __mod1e9(__s1high);
*4bdff4beSrobert    const uint64_t __r1 = ((__r0 << 32) | (__s1low >> 32));
*4bdff4beSrobert    return __mod1e9(__r1 >> (__j - 160));
*4bdff4beSrobert  }
*4bdff4beSrobert#endif // ^^^ intrinsics unavailable ^^^
*4bdff4beSrobert}
*4bdff4beSrobert
*4bdff4beSrobertvoid __append_n_digits(const uint32_t __olength, uint32_t __digits, char* const __result) {
*4bdff4beSrobert  uint32_t __i = 0;
*4bdff4beSrobert  while (__digits >= 10000) {
*4bdff4beSrobert#ifdef __clang__ // TRANSITION, LLVM-38217
*4bdff4beSrobert    const uint32_t __c = __digits - 10000 * (__digits / 10000);
*4bdff4beSrobert#else
*4bdff4beSrobert    const uint32_t __c = __digits % 10000;
*4bdff4beSrobert#endif
*4bdff4beSrobert    __digits /= 10000;
*4bdff4beSrobert    const uint32_t __c0 = (__c % 100) << 1;
*4bdff4beSrobert    const uint32_t __c1 = (__c / 100) << 1;
*4bdff4beSrobert    _VSTD::memcpy(__result + __olength - __i - 2, __DIGIT_TABLE + __c0, 2);
*4bdff4beSrobert    _VSTD::memcpy(__result + __olength - __i - 4, __DIGIT_TABLE + __c1, 2);
*4bdff4beSrobert    __i += 4;
*4bdff4beSrobert  }
*4bdff4beSrobert  if (__digits >= 100) {
*4bdff4beSrobert    const uint32_t __c = (__digits % 100) << 1;
*4bdff4beSrobert    __digits /= 100;
*4bdff4beSrobert    _VSTD::memcpy(__result + __olength - __i - 2, __DIGIT_TABLE + __c, 2);
*4bdff4beSrobert    __i += 2;
*4bdff4beSrobert  }
*4bdff4beSrobert  if (__digits >= 10) {
*4bdff4beSrobert    const uint32_t __c = __digits << 1;
*4bdff4beSrobert    _VSTD::memcpy(__result + __olength - __i - 2, __DIGIT_TABLE + __c, 2);
*4bdff4beSrobert  } else {
*4bdff4beSrobert    __result[0] = static_cast<char>('0' + __digits);
*4bdff4beSrobert  }
*4bdff4beSrobert}
*4bdff4beSrobert
*4bdff4beSrobert_LIBCPP_HIDE_FROM_ABI inline void __append_d_digits(const uint32_t __olength, uint32_t __digits, char* const __result) {
*4bdff4beSrobert  uint32_t __i = 0;
*4bdff4beSrobert  while (__digits >= 10000) {
*4bdff4beSrobert#ifdef __clang__ // TRANSITION, LLVM-38217
*4bdff4beSrobert    const uint32_t __c = __digits - 10000 * (__digits / 10000);
*4bdff4beSrobert#else
*4bdff4beSrobert    const uint32_t __c = __digits % 10000;
*4bdff4beSrobert#endif
*4bdff4beSrobert    __digits /= 10000;
*4bdff4beSrobert    const uint32_t __c0 = (__c % 100) << 1;
*4bdff4beSrobert    const uint32_t __c1 = (__c / 100) << 1;
*4bdff4beSrobert    _VSTD::memcpy(__result + __olength + 1 - __i - 2, __DIGIT_TABLE + __c0, 2);
*4bdff4beSrobert    _VSTD::memcpy(__result + __olength + 1 - __i - 4, __DIGIT_TABLE + __c1, 2);
*4bdff4beSrobert    __i += 4;
*4bdff4beSrobert  }
*4bdff4beSrobert  if (__digits >= 100) {
*4bdff4beSrobert    const uint32_t __c = (__digits % 100) << 1;
*4bdff4beSrobert    __digits /= 100;
*4bdff4beSrobert    _VSTD::memcpy(__result + __olength + 1 - __i - 2, __DIGIT_TABLE + __c, 2);
*4bdff4beSrobert    __i += 2;
*4bdff4beSrobert  }
*4bdff4beSrobert  if (__digits >= 10) {
*4bdff4beSrobert    const uint32_t __c = __digits << 1;
*4bdff4beSrobert    __result[2] = __DIGIT_TABLE[__c + 1];
*4bdff4beSrobert    __result[1] = '.';
*4bdff4beSrobert    __result[0] = __DIGIT_TABLE[__c];
*4bdff4beSrobert  } else {
*4bdff4beSrobert    __result[1] = '.';
*4bdff4beSrobert    __result[0] = static_cast<char>('0' + __digits);
*4bdff4beSrobert  }
*4bdff4beSrobert}
*4bdff4beSrobert
*4bdff4beSrobert_LIBCPP_HIDE_FROM_ABI inline void __append_c_digits(const uint32_t __count, uint32_t __digits, char* const __result) {
*4bdff4beSrobert  uint32_t __i = 0;
*4bdff4beSrobert  for (; __i < __count - 1; __i += 2) {
*4bdff4beSrobert    const uint32_t __c = (__digits % 100) << 1;
*4bdff4beSrobert    __digits /= 100;
*4bdff4beSrobert    _VSTD::memcpy(__result + __count - __i - 2, __DIGIT_TABLE + __c, 2);
*4bdff4beSrobert  }
*4bdff4beSrobert  if (__i < __count) {
*4bdff4beSrobert    const char __c = static_cast<char>('0' + (__digits % 10));
*4bdff4beSrobert    __result[__count - __i - 1] = __c;
*4bdff4beSrobert  }
*4bdff4beSrobert}
*4bdff4beSrobert
*4bdff4beSrobertvoid __append_nine_digits(uint32_t __digits, char* const __result) {
*4bdff4beSrobert  if (__digits == 0) {
*4bdff4beSrobert    _VSTD::memset(__result, '0', 9);
*4bdff4beSrobert    return;
*4bdff4beSrobert  }
*4bdff4beSrobert
*4bdff4beSrobert  for (uint32_t __i = 0; __i < 5; __i += 4) {
*4bdff4beSrobert#ifdef __clang__ // TRANSITION, LLVM-38217
*4bdff4beSrobert    const uint32_t __c = __digits - 10000 * (__digits / 10000);
*4bdff4beSrobert#else
*4bdff4beSrobert    const uint32_t __c = __digits % 10000;
*4bdff4beSrobert#endif
*4bdff4beSrobert    __digits /= 10000;
*4bdff4beSrobert    const uint32_t __c0 = (__c % 100) << 1;
*4bdff4beSrobert    const uint32_t __c1 = (__c / 100) << 1;
*4bdff4beSrobert    _VSTD::memcpy(__result + 7 - __i, __DIGIT_TABLE + __c0, 2);
*4bdff4beSrobert    _VSTD::memcpy(__result + 5 - __i, __DIGIT_TABLE + __c1, 2);
*4bdff4beSrobert  }
*4bdff4beSrobert  __result[0] = static_cast<char>('0' + __digits);
*4bdff4beSrobert}
*4bdff4beSrobert
*4bdff4beSrobert[[nodiscard]] _LIBCPP_HIDE_FROM_ABI inline uint32_t __indexForExponent(const uint32_t __e) {
*4bdff4beSrobert  return (__e + 15) / 16;
*4bdff4beSrobert}
*4bdff4beSrobert
*4bdff4beSrobert[[nodiscard]] _LIBCPP_HIDE_FROM_ABI inline uint32_t __pow10BitsForIndex(const uint32_t __idx) {
*4bdff4beSrobert  return 16 * __idx + __POW10_ADDITIONAL_BITS;
*4bdff4beSrobert}
*4bdff4beSrobert
*4bdff4beSrobert[[nodiscard]] _LIBCPP_HIDE_FROM_ABI inline uint32_t __lengthForIndex(const uint32_t __idx) {
*4bdff4beSrobert  // +1 for ceil, +16 for mantissa, +8 to round up when dividing by 9
*4bdff4beSrobert  return (__log10Pow2(16 * static_cast<int32_t>(__idx)) + 1 + 16 + 8) / 9;
*4bdff4beSrobert}
*4bdff4beSrobert
*4bdff4beSrobert[[nodiscard]] to_chars_result __d2fixed_buffered_n(char* _First, char* const _Last, const double __d,
*4bdff4beSrobert  const uint32_t __precision) {
*4bdff4beSrobert  char* const _Original_first = _First;
*4bdff4beSrobert
*4bdff4beSrobert  const uint64_t __bits = __double_to_bits(__d);
*4bdff4beSrobert
*4bdff4beSrobert  // Case distinction; exit early for the easy cases.
*4bdff4beSrobert  if (__bits == 0) {
*4bdff4beSrobert    const int32_t _Total_zero_length = 1 // leading zero
*4bdff4beSrobert      + static_cast<int32_t>(__precision != 0) // possible decimal point
*4bdff4beSrobert      + static_cast<int32_t>(__precision); // zeroes after decimal point
*4bdff4beSrobert
*4bdff4beSrobert    if (_Last - _First < _Total_zero_length) {
*4bdff4beSrobert      return { _Last, errc::value_too_large };
*4bdff4beSrobert    }
*4bdff4beSrobert
*4bdff4beSrobert    *_First++ = '0';
*4bdff4beSrobert    if (__precision > 0) {
*4bdff4beSrobert      *_First++ = '.';
*4bdff4beSrobert      _VSTD::memset(_First, '0', __precision);
*4bdff4beSrobert      _First += __precision;
*4bdff4beSrobert    }
*4bdff4beSrobert    return { _First, errc{} };
*4bdff4beSrobert  }
*4bdff4beSrobert
*4bdff4beSrobert  // Decode __bits into mantissa and exponent.
*4bdff4beSrobert  const uint64_t __ieeeMantissa = __bits & ((1ull << __DOUBLE_MANTISSA_BITS) - 1);
*4bdff4beSrobert  const uint32_t __ieeeExponent = static_cast<uint32_t>(__bits >> __DOUBLE_MANTISSA_BITS);
*4bdff4beSrobert
*4bdff4beSrobert  int32_t __e2;
*4bdff4beSrobert  uint64_t __m2;
*4bdff4beSrobert  if (__ieeeExponent == 0) {
*4bdff4beSrobert    __e2 = 1 - __DOUBLE_BIAS - __DOUBLE_MANTISSA_BITS;
*4bdff4beSrobert    __m2 = __ieeeMantissa;
*4bdff4beSrobert  } else {
*4bdff4beSrobert    __e2 = static_cast<int32_t>(__ieeeExponent) - __DOUBLE_BIAS - __DOUBLE_MANTISSA_BITS;
*4bdff4beSrobert    __m2 = (1ull << __DOUBLE_MANTISSA_BITS) | __ieeeMantissa;
*4bdff4beSrobert  }
*4bdff4beSrobert
*4bdff4beSrobert  bool __nonzero = false;
*4bdff4beSrobert  if (__e2 >= -52) {
*4bdff4beSrobert    const uint32_t __idx = __e2 < 0 ? 0 : __indexForExponent(static_cast<uint32_t>(__e2));
*4bdff4beSrobert    const uint32_t __p10bits = __pow10BitsForIndex(__idx);
*4bdff4beSrobert    const int32_t __len = static_cast<int32_t>(__lengthForIndex(__idx));
*4bdff4beSrobert    for (int32_t __i = __len - 1; __i >= 0; --__i) {
*4bdff4beSrobert      const uint32_t __j = __p10bits - __e2;
*4bdff4beSrobert      // Temporary: __j is usually around 128, and by shifting a bit, we push it to 128 or above, which is
*4bdff4beSrobert      // a slightly faster code path in __mulShift_mod1e9. Instead, we can just increase the multipliers.
*4bdff4beSrobert      const uint32_t __digits = __mulShift_mod1e9(__m2 << 8, __POW10_SPLIT[__POW10_OFFSET[__idx] + __i],
*4bdff4beSrobert        static_cast<int32_t>(__j + 8));
*4bdff4beSrobert      if (__nonzero) {
*4bdff4beSrobert        if (_Last - _First < 9) {
*4bdff4beSrobert          return { _Last, errc::value_too_large };
*4bdff4beSrobert        }
*4bdff4beSrobert        __append_nine_digits(__digits, _First);
*4bdff4beSrobert        _First += 9;
*4bdff4beSrobert      } else if (__digits != 0) {
*4bdff4beSrobert        const uint32_t __olength = __decimalLength9(__digits);
*4bdff4beSrobert        if (_Last - _First < static_cast<ptrdiff_t>(__olength)) {
*4bdff4beSrobert          return { _Last, errc::value_too_large };
*4bdff4beSrobert        }
*4bdff4beSrobert        __append_n_digits(__olength, __digits, _First);
*4bdff4beSrobert        _First += __olength;
*4bdff4beSrobert        __nonzero = true;
*4bdff4beSrobert      }
*4bdff4beSrobert    }
*4bdff4beSrobert  }
*4bdff4beSrobert  if (!__nonzero) {
*4bdff4beSrobert    if (_First == _Last) {
*4bdff4beSrobert      return { _Last, errc::value_too_large };
*4bdff4beSrobert    }
*4bdff4beSrobert    *_First++ = '0';
*4bdff4beSrobert  }
*4bdff4beSrobert  if (__precision > 0) {
*4bdff4beSrobert    if (_First == _Last) {
*4bdff4beSrobert      return { _Last, errc::value_too_large };
*4bdff4beSrobert    }
*4bdff4beSrobert    *_First++ = '.';
*4bdff4beSrobert  }
*4bdff4beSrobert  if (__e2 < 0) {
*4bdff4beSrobert    const int32_t __idx = -__e2 / 16;
*4bdff4beSrobert    const uint32_t __blocks = __precision / 9 + 1;
*4bdff4beSrobert    // 0 = don't round up; 1 = round up unconditionally; 2 = round up if odd.
*4bdff4beSrobert    int __roundUp = 0;
*4bdff4beSrobert    uint32_t __i = 0;
*4bdff4beSrobert    if (__blocks <= __MIN_BLOCK_2[__idx]) {
*4bdff4beSrobert      __i = __blocks;
*4bdff4beSrobert      if (_Last - _First < static_cast<ptrdiff_t>(__precision)) {
*4bdff4beSrobert        return { _Last, errc::value_too_large };
*4bdff4beSrobert      }
*4bdff4beSrobert      _VSTD::memset(_First, '0', __precision);
*4bdff4beSrobert      _First += __precision;
*4bdff4beSrobert    } else if (__i < __MIN_BLOCK_2[__idx]) {
*4bdff4beSrobert      __i = __MIN_BLOCK_2[__idx];
*4bdff4beSrobert      if (_Last - _First < static_cast<ptrdiff_t>(9 * __i)) {
*4bdff4beSrobert        return { _Last, errc::value_too_large };
*4bdff4beSrobert      }
*4bdff4beSrobert      _VSTD::memset(_First, '0', 9 * __i);
*4bdff4beSrobert      _First += 9 * __i;
*4bdff4beSrobert    }
*4bdff4beSrobert    for (; __i < __blocks; ++__i) {
*4bdff4beSrobert      const int32_t __j = __ADDITIONAL_BITS_2 + (-__e2 - 16 * __idx);
*4bdff4beSrobert      const uint32_t __p = __POW10_OFFSET_2[__idx] + __i - __MIN_BLOCK_2[__idx];
*4bdff4beSrobert      if (__p >= __POW10_OFFSET_2[__idx + 1]) {
*4bdff4beSrobert        // If the remaining digits are all 0, then we might as well use memset.
*4bdff4beSrobert        // No rounding required in this case.
*4bdff4beSrobert        const uint32_t __fill = __precision - 9 * __i;
*4bdff4beSrobert        if (_Last - _First < static_cast<ptrdiff_t>(__fill)) {
*4bdff4beSrobert          return { _Last, errc::value_too_large };
*4bdff4beSrobert        }
*4bdff4beSrobert        _VSTD::memset(_First, '0', __fill);
*4bdff4beSrobert        _First += __fill;
*4bdff4beSrobert        break;
*4bdff4beSrobert      }
*4bdff4beSrobert      // Temporary: __j is usually around 128, and by shifting a bit, we push it to 128 or above, which is
*4bdff4beSrobert      // a slightly faster code path in __mulShift_mod1e9. Instead, we can just increase the multipliers.
*4bdff4beSrobert      uint32_t __digits = __mulShift_mod1e9(__m2 << 8, __POW10_SPLIT_2[__p], __j + 8);
*4bdff4beSrobert      if (__i < __blocks - 1) {
*4bdff4beSrobert        if (_Last - _First < 9) {
*4bdff4beSrobert          return { _Last, errc::value_too_large };
*4bdff4beSrobert        }
*4bdff4beSrobert        __append_nine_digits(__digits, _First);
*4bdff4beSrobert        _First += 9;
*4bdff4beSrobert      } else {
*4bdff4beSrobert        const uint32_t __maximum = __precision - 9 * __i;
*4bdff4beSrobert        uint32_t __lastDigit = 0;
*4bdff4beSrobert        for (uint32_t __k = 0; __k < 9 - __maximum; ++__k) {
*4bdff4beSrobert          __lastDigit = __digits % 10;
*4bdff4beSrobert          __digits /= 10;
*4bdff4beSrobert        }
*4bdff4beSrobert        if (__lastDigit != 5) {
*4bdff4beSrobert          __roundUp = __lastDigit > 5;
*4bdff4beSrobert        } else {
*4bdff4beSrobert          // Is m * 10^(additionalDigits + 1) / 2^(-__e2) integer?
*4bdff4beSrobert          const int32_t __requiredTwos = -__e2 - static_cast<int32_t>(__precision) - 1;
*4bdff4beSrobert          const bool __trailingZeros = __requiredTwos <= 0
*4bdff4beSrobert            || (__requiredTwos < 60 && __multipleOfPowerOf2(__m2, static_cast<uint32_t>(__requiredTwos)));
*4bdff4beSrobert          __roundUp = __trailingZeros ? 2 : 1;
*4bdff4beSrobert        }
*4bdff4beSrobert        if (__maximum > 0) {
*4bdff4beSrobert          if (_Last - _First < static_cast<ptrdiff_t>(__maximum)) {
*4bdff4beSrobert            return { _Last, errc::value_too_large };
*4bdff4beSrobert          }
*4bdff4beSrobert          __append_c_digits(__maximum, __digits, _First);
*4bdff4beSrobert          _First += __maximum;
*4bdff4beSrobert        }
*4bdff4beSrobert        break;
*4bdff4beSrobert      }
*4bdff4beSrobert    }
*4bdff4beSrobert    if (__roundUp != 0) {
*4bdff4beSrobert      char* _Round = _First;
*4bdff4beSrobert      char* _Dot = _Last;
*4bdff4beSrobert      while (true) {
*4bdff4beSrobert        if (_Round == _Original_first) {
*4bdff4beSrobert          _Round[0] = '1';
*4bdff4beSrobert          if (_Dot != _Last) {
*4bdff4beSrobert            _Dot[0] = '0';
*4bdff4beSrobert            _Dot[1] = '.';
*4bdff4beSrobert          }
*4bdff4beSrobert          if (_First == _Last) {
*4bdff4beSrobert            return { _Last, errc::value_too_large };
*4bdff4beSrobert          }
*4bdff4beSrobert          *_First++ = '0';
*4bdff4beSrobert          break;
*4bdff4beSrobert        }
*4bdff4beSrobert        --_Round;
*4bdff4beSrobert        const char __c = _Round[0];
*4bdff4beSrobert        if (__c == '.') {
*4bdff4beSrobert          _Dot = _Round;
*4bdff4beSrobert        } else if (__c == '9') {
*4bdff4beSrobert          _Round[0] = '0';
*4bdff4beSrobert          __roundUp = 1;
*4bdff4beSrobert        } else {
*4bdff4beSrobert          if (__roundUp == 1 || __c % 2 != 0) {
*4bdff4beSrobert            _Round[0] = __c + 1;
*4bdff4beSrobert          }
*4bdff4beSrobert          break;
*4bdff4beSrobert        }
*4bdff4beSrobert      }
*4bdff4beSrobert    }
*4bdff4beSrobert  } else {
*4bdff4beSrobert    if (_Last - _First < static_cast<ptrdiff_t>(__precision)) {
*4bdff4beSrobert      return { _Last, errc::value_too_large };
*4bdff4beSrobert    }
*4bdff4beSrobert    _VSTD::memset(_First, '0', __precision);
*4bdff4beSrobert    _First += __precision;
*4bdff4beSrobert  }
*4bdff4beSrobert  return { _First, errc{} };
*4bdff4beSrobert}
*4bdff4beSrobert
*4bdff4beSrobert[[nodiscard]] to_chars_result __d2exp_buffered_n(char* _First, char* const _Last, const double __d,
*4bdff4beSrobert  uint32_t __precision) {
*4bdff4beSrobert  char* const _Original_first = _First;
*4bdff4beSrobert
*4bdff4beSrobert  const uint64_t __bits = __double_to_bits(__d);
*4bdff4beSrobert
*4bdff4beSrobert  // Case distinction; exit early for the easy cases.
*4bdff4beSrobert  if (__bits == 0) {
*4bdff4beSrobert    const int32_t _Total_zero_length = 1 // leading zero
*4bdff4beSrobert      + static_cast<int32_t>(__precision != 0) // possible decimal point
*4bdff4beSrobert      + static_cast<int32_t>(__precision) // zeroes after decimal point
*4bdff4beSrobert      + 4; // "e+00"
*4bdff4beSrobert    if (_Last - _First < _Total_zero_length) {
*4bdff4beSrobert      return { _Last, errc::value_too_large };
*4bdff4beSrobert    }
*4bdff4beSrobert    *_First++ = '0';
*4bdff4beSrobert    if (__precision > 0) {
*4bdff4beSrobert      *_First++ = '.';
*4bdff4beSrobert      _VSTD::memset(_First, '0', __precision);
*4bdff4beSrobert      _First += __precision;
*4bdff4beSrobert    }
*4bdff4beSrobert    _VSTD::memcpy(_First, "e+00", 4);
*4bdff4beSrobert    _First += 4;
*4bdff4beSrobert    return { _First, errc{} };
*4bdff4beSrobert  }
*4bdff4beSrobert
*4bdff4beSrobert  // Decode __bits into mantissa and exponent.
*4bdff4beSrobert  const uint64_t __ieeeMantissa = __bits & ((1ull << __DOUBLE_MANTISSA_BITS) - 1);
*4bdff4beSrobert  const uint32_t __ieeeExponent = static_cast<uint32_t>(__bits >> __DOUBLE_MANTISSA_BITS);
*4bdff4beSrobert
*4bdff4beSrobert  int32_t __e2;
*4bdff4beSrobert  uint64_t __m2;
*4bdff4beSrobert  if (__ieeeExponent == 0) {
*4bdff4beSrobert    __e2 = 1 - __DOUBLE_BIAS - __DOUBLE_MANTISSA_BITS;
*4bdff4beSrobert    __m2 = __ieeeMantissa;
*4bdff4beSrobert  } else {
*4bdff4beSrobert    __e2 = static_cast<int32_t>(__ieeeExponent) - __DOUBLE_BIAS - __DOUBLE_MANTISSA_BITS;
*4bdff4beSrobert    __m2 = (1ull << __DOUBLE_MANTISSA_BITS) | __ieeeMantissa;
*4bdff4beSrobert  }
*4bdff4beSrobert
*4bdff4beSrobert  const bool __printDecimalPoint = __precision > 0;
*4bdff4beSrobert  ++__precision;
*4bdff4beSrobert  uint32_t __digits = 0;
*4bdff4beSrobert  uint32_t __printedDigits = 0;
*4bdff4beSrobert  uint32_t __availableDigits = 0;
*4bdff4beSrobert  int32_t __exp = 0;
*4bdff4beSrobert  if (__e2 >= -52) {
*4bdff4beSrobert    const uint32_t __idx = __e2 < 0 ? 0 : __indexForExponent(static_cast<uint32_t>(__e2));
*4bdff4beSrobert    const uint32_t __p10bits = __pow10BitsForIndex(__idx);
*4bdff4beSrobert    const int32_t __len = static_cast<int32_t>(__lengthForIndex(__idx));
*4bdff4beSrobert    for (int32_t __i = __len - 1; __i >= 0; --__i) {
*4bdff4beSrobert      const uint32_t __j = __p10bits - __e2;
*4bdff4beSrobert      // Temporary: __j is usually around 128, and by shifting a bit, we push it to 128 or above, which is
*4bdff4beSrobert      // a slightly faster code path in __mulShift_mod1e9. Instead, we can just increase the multipliers.
*4bdff4beSrobert      __digits = __mulShift_mod1e9(__m2 << 8, __POW10_SPLIT[__POW10_OFFSET[__idx] + __i],
*4bdff4beSrobert        static_cast<int32_t>(__j + 8));
*4bdff4beSrobert      if (__printedDigits != 0) {
*4bdff4beSrobert        if (__printedDigits + 9 > __precision) {
*4bdff4beSrobert          __availableDigits = 9;
*4bdff4beSrobert          break;
*4bdff4beSrobert        }
*4bdff4beSrobert        if (_Last - _First < 9) {
*4bdff4beSrobert          return { _Last, errc::value_too_large };
*4bdff4beSrobert        }
*4bdff4beSrobert        __append_nine_digits(__digits, _First);
*4bdff4beSrobert        _First += 9;
*4bdff4beSrobert        __printedDigits += 9;
*4bdff4beSrobert      } else if (__digits != 0) {
*4bdff4beSrobert        __availableDigits = __decimalLength9(__digits);
*4bdff4beSrobert        __exp = __i * 9 + static_cast<int32_t>(__availableDigits) - 1;
*4bdff4beSrobert        if (__availableDigits > __precision) {
*4bdff4beSrobert          break;
*4bdff4beSrobert        }
*4bdff4beSrobert        if (__printDecimalPoint) {
*4bdff4beSrobert          if (_Last - _First < static_cast<ptrdiff_t>(__availableDigits + 1)) {
*4bdff4beSrobert            return { _Last, errc::value_too_large };
*4bdff4beSrobert          }
*4bdff4beSrobert          __append_d_digits(__availableDigits, __digits, _First);
*4bdff4beSrobert          _First += __availableDigits + 1; // +1 for decimal point
*4bdff4beSrobert        } else {
*4bdff4beSrobert          if (_First == _Last) {
*4bdff4beSrobert            return { _Last, errc::value_too_large };
*4bdff4beSrobert          }
*4bdff4beSrobert          *_First++ = static_cast<char>('0' + __digits);
*4bdff4beSrobert        }
*4bdff4beSrobert        __printedDigits = __availableDigits;
*4bdff4beSrobert        __availableDigits = 0;
*4bdff4beSrobert      }
*4bdff4beSrobert    }
*4bdff4beSrobert  }
*4bdff4beSrobert
*4bdff4beSrobert  if (__e2 < 0 && __availableDigits == 0) {
*4bdff4beSrobert    const int32_t __idx = -__e2 / 16;
*4bdff4beSrobert    for (int32_t __i = __MIN_BLOCK_2[__idx]; __i < 200; ++__i) {
*4bdff4beSrobert      const int32_t __j = __ADDITIONAL_BITS_2 + (-__e2 - 16 * __idx);
*4bdff4beSrobert      const uint32_t __p = __POW10_OFFSET_2[__idx] + static_cast<uint32_t>(__i) - __MIN_BLOCK_2[__idx];
*4bdff4beSrobert      // Temporary: __j is usually around 128, and by shifting a bit, we push it to 128 or above, which is
*4bdff4beSrobert      // a slightly faster code path in __mulShift_mod1e9. Instead, we can just increase the multipliers.
*4bdff4beSrobert      __digits = (__p >= __POW10_OFFSET_2[__idx + 1]) ? 0 : __mulShift_mod1e9(__m2 << 8, __POW10_SPLIT_2[__p], __j + 8);
*4bdff4beSrobert      if (__printedDigits != 0) {
*4bdff4beSrobert        if (__printedDigits + 9 > __precision) {
*4bdff4beSrobert          __availableDigits = 9;
*4bdff4beSrobert          break;
*4bdff4beSrobert        }
*4bdff4beSrobert        if (_Last - _First < 9) {
*4bdff4beSrobert          return { _Last, errc::value_too_large };
*4bdff4beSrobert        }
*4bdff4beSrobert        __append_nine_digits(__digits, _First);
*4bdff4beSrobert        _First += 9;
*4bdff4beSrobert        __printedDigits += 9;
*4bdff4beSrobert      } else if (__digits != 0) {
*4bdff4beSrobert        __availableDigits = __decimalLength9(__digits);
*4bdff4beSrobert        __exp = -(__i + 1) * 9 + static_cast<int32_t>(__availableDigits) - 1;
*4bdff4beSrobert        if (__availableDigits > __precision) {
*4bdff4beSrobert          break;
*4bdff4beSrobert        }
*4bdff4beSrobert        if (__printDecimalPoint) {
*4bdff4beSrobert          if (_Last - _First < static_cast<ptrdiff_t>(__availableDigits + 1)) {
*4bdff4beSrobert            return { _Last, errc::value_too_large };
*4bdff4beSrobert          }
*4bdff4beSrobert          __append_d_digits(__availableDigits, __digits, _First);
*4bdff4beSrobert          _First += __availableDigits + 1; // +1 for decimal point
*4bdff4beSrobert        } else {
*4bdff4beSrobert          if (_First == _Last) {
*4bdff4beSrobert            return { _Last, errc::value_too_large };
*4bdff4beSrobert          }
*4bdff4beSrobert          *_First++ = static_cast<char>('0' + __digits);
*4bdff4beSrobert        }
*4bdff4beSrobert        __printedDigits = __availableDigits;
*4bdff4beSrobert        __availableDigits = 0;
*4bdff4beSrobert      }
*4bdff4beSrobert    }
*4bdff4beSrobert  }
*4bdff4beSrobert
*4bdff4beSrobert  const uint32_t __maximum = __precision - __printedDigits;
*4bdff4beSrobert  if (__availableDigits == 0) {
*4bdff4beSrobert    __digits = 0;
*4bdff4beSrobert  }
*4bdff4beSrobert  uint32_t __lastDigit = 0;
*4bdff4beSrobert  if (__availableDigits > __maximum) {
*4bdff4beSrobert    for (uint32_t __k = 0; __k < __availableDigits - __maximum; ++__k) {
*4bdff4beSrobert      __lastDigit = __digits % 10;
*4bdff4beSrobert      __digits /= 10;
*4bdff4beSrobert    }
*4bdff4beSrobert  }
*4bdff4beSrobert  // 0 = don't round up; 1 = round up unconditionally; 2 = round up if odd.
*4bdff4beSrobert  int __roundUp = 0;
*4bdff4beSrobert  if (__lastDigit != 5) {
*4bdff4beSrobert    __roundUp = __lastDigit > 5;
*4bdff4beSrobert  } else {
*4bdff4beSrobert    // Is m * 2^__e2 * 10^(__precision + 1 - __exp) integer?
*4bdff4beSrobert    // __precision was already increased by 1, so we don't need to write + 1 here.
*4bdff4beSrobert    const int32_t __rexp = static_cast<int32_t>(__precision) - __exp;
*4bdff4beSrobert    const int32_t __requiredTwos = -__e2 - __rexp;
*4bdff4beSrobert    bool __trailingZeros = __requiredTwos <= 0
*4bdff4beSrobert      || (__requiredTwos < 60 && __multipleOfPowerOf2(__m2, static_cast<uint32_t>(__requiredTwos)));
*4bdff4beSrobert    if (__rexp < 0) {
*4bdff4beSrobert      const int32_t __requiredFives = -__rexp;
*4bdff4beSrobert      __trailingZeros = __trailingZeros && __multipleOfPowerOf5(__m2, static_cast<uint32_t>(__requiredFives));
*4bdff4beSrobert    }
*4bdff4beSrobert    __roundUp = __trailingZeros ? 2 : 1;
*4bdff4beSrobert  }
*4bdff4beSrobert  if (__printedDigits != 0) {
*4bdff4beSrobert    if (_Last - _First < static_cast<ptrdiff_t>(__maximum)) {
*4bdff4beSrobert      return { _Last, errc::value_too_large };
*4bdff4beSrobert    }
*4bdff4beSrobert    if (__digits == 0) {
*4bdff4beSrobert      _VSTD::memset(_First, '0', __maximum);
*4bdff4beSrobert    } else {
*4bdff4beSrobert      __append_c_digits(__maximum, __digits, _First);
*4bdff4beSrobert    }
*4bdff4beSrobert    _First += __maximum;
*4bdff4beSrobert  } else {
*4bdff4beSrobert    if (__printDecimalPoint) {
*4bdff4beSrobert      if (_Last - _First < static_cast<ptrdiff_t>(__maximum + 1)) {
*4bdff4beSrobert        return { _Last, errc::value_too_large };
*4bdff4beSrobert      }
*4bdff4beSrobert      __append_d_digits(__maximum, __digits, _First);
*4bdff4beSrobert      _First += __maximum + 1; // +1 for decimal point
*4bdff4beSrobert    } else {
*4bdff4beSrobert      if (_First == _Last) {
*4bdff4beSrobert        return { _Last, errc::value_too_large };
*4bdff4beSrobert      }
*4bdff4beSrobert      *_First++ = static_cast<char>('0' + __digits);
*4bdff4beSrobert    }
*4bdff4beSrobert  }
*4bdff4beSrobert  if (__roundUp != 0) {
*4bdff4beSrobert    char* _Round = _First;
*4bdff4beSrobert    while (true) {
*4bdff4beSrobert      if (_Round == _Original_first) {
*4bdff4beSrobert        _Round[0] = '1';
*4bdff4beSrobert        ++__exp;
*4bdff4beSrobert        break;
*4bdff4beSrobert      }
*4bdff4beSrobert      --_Round;
*4bdff4beSrobert      const char __c = _Round[0];
*4bdff4beSrobert      if (__c == '.') {
*4bdff4beSrobert        // Keep going.
*4bdff4beSrobert      } else if (__c == '9') {
*4bdff4beSrobert        _Round[0] = '0';
*4bdff4beSrobert        __roundUp = 1;
*4bdff4beSrobert      } else {
*4bdff4beSrobert        if (__roundUp == 1 || __c % 2 != 0) {
*4bdff4beSrobert          _Round[0] = __c + 1;
*4bdff4beSrobert        }
*4bdff4beSrobert        break;
*4bdff4beSrobert      }
*4bdff4beSrobert    }
*4bdff4beSrobert  }
*4bdff4beSrobert
*4bdff4beSrobert  char _Sign_character;
*4bdff4beSrobert
*4bdff4beSrobert  if (__exp < 0) {
*4bdff4beSrobert    _Sign_character = '-';
*4bdff4beSrobert    __exp = -__exp;
*4bdff4beSrobert  } else {
*4bdff4beSrobert    _Sign_character = '+';
*4bdff4beSrobert  }
*4bdff4beSrobert
*4bdff4beSrobert  const int _Exponent_part_length = __exp >= 100
*4bdff4beSrobert    ? 5 // "e+NNN"
*4bdff4beSrobert    : 4; // "e+NN"
*4bdff4beSrobert
*4bdff4beSrobert  if (_Last - _First < _Exponent_part_length) {
*4bdff4beSrobert    return { _Last, errc::value_too_large };
*4bdff4beSrobert  }
*4bdff4beSrobert
*4bdff4beSrobert  *_First++ = 'e';
*4bdff4beSrobert  *_First++ = _Sign_character;
*4bdff4beSrobert
*4bdff4beSrobert  if (__exp >= 100) {
*4bdff4beSrobert    const int32_t __c = __exp % 10;
*4bdff4beSrobert    _VSTD::memcpy(_First, __DIGIT_TABLE + 2 * (__exp / 10), 2);
*4bdff4beSrobert    _First[2] = static_cast<char>('0' + __c);
*4bdff4beSrobert    _First += 3;
*4bdff4beSrobert  } else {
*4bdff4beSrobert    _VSTD::memcpy(_First, __DIGIT_TABLE + 2 * __exp, 2);
*4bdff4beSrobert    _First += 2;
*4bdff4beSrobert  }
*4bdff4beSrobert
*4bdff4beSrobert  return { _First, errc{} };
*4bdff4beSrobert}
*4bdff4beSrobert
*4bdff4beSrobert_LIBCPP_END_NAMESPACE_STD
*4bdff4beSrobert
*4bdff4beSrobert// clang-format on