config/libbid/bid128_quantize.c

*8feb0f0bSmrg/* Copyright (C) 2007-2020 Free Software Foundation, Inc.
36ac495dSmrg
36ac495dSmrgThis file is part of GCC.
36ac495dSmrg
36ac495dSmrgGCC is free software; you can redistribute it and/or modify it under
36ac495dSmrgthe terms of the GNU General Public License as published by the Free
36ac495dSmrgSoftware Foundation; either version 3, or (at your option) any later
36ac495dSmrgversion.
36ac495dSmrg
36ac495dSmrgGCC is distributed in the hope that it will be useful, but WITHOUT ANY
36ac495dSmrgWARRANTY; without even the implied warranty of MERCHANTABILITY or
36ac495dSmrgFITNESS FOR A PARTICULAR PURPOSE.  See the GNU General Public License
36ac495dSmrgfor more details.
36ac495dSmrg
36ac495dSmrgUnder Section 7 of GPL version 3, you are granted additional
36ac495dSmrgpermissions described in the GCC Runtime Library Exception, version
36ac495dSmrg3.1, as published by the Free Software Foundation.
36ac495dSmrg
36ac495dSmrgYou should have received a copy of the GNU General Public License and
36ac495dSmrga copy of the GCC Runtime Library Exception along with this program;
36ac495dSmrgsee the files COPYING3 and COPYING.RUNTIME respectively.  If not, see
36ac495dSmrg<http://www.gnu.org/licenses/>.  */
36ac495dSmrg
36ac495dSmrg#define BID_128RES
36ac495dSmrg#include "bid_internal.h"
36ac495dSmrg
36ac495dSmrgBID128_FUNCTION_ARG2 (bid128_quantize, x, y)
36ac495dSmrg
36ac495dSmrg     UINT256 CT;
36ac495dSmrg     UINT128 CX, CY, T, CX2, CR, Stemp, res, REM_H, C2N;
36ac495dSmrg     UINT64 sign_x, sign_y, remainder_h, carry, CY64, valid_x;
36ac495dSmrg     int_float tempx;
36ac495dSmrg     int exponent_x, exponent_y, digits_x, extra_digits, amount;
36ac495dSmrg     int expon_diff, total_digits, bin_expon_cx, rmode, status;
36ac495dSmrg
36ac495dSmrgvalid_x = unpack_BID128_value (&sign_x, &exponent_x, &CX, x);
36ac495dSmrg
36ac495dSmrg  // unpack arguments, check for NaN or Infinity
36ac495dSmrgif (!unpack_BID128_value (&sign_y, &exponent_y, &CY, y)) {
36ac495dSmrg    // y is Inf. or NaN
36ac495dSmrg#ifdef SET_STATUS_FLAGS
36ac495dSmrgif ((x.w[1] & SNAN_MASK64) == SNAN_MASK64)	// y is sNaN
36ac495dSmrg  __set_status_flags (pfpsf, INVALID_EXCEPTION);
36ac495dSmrg#endif
36ac495dSmrg
36ac495dSmrg    // test if y is NaN
36ac495dSmrgif ((y.w[1] & 0x7c00000000000000ull) == 0x7c00000000000000ull) {
36ac495dSmrg#ifdef SET_STATUS_FLAGS
36ac495dSmrg  if ((y.w[1] & 0x7e00000000000000ull) == 0x7e00000000000000ull) {
36ac495dSmrg    // set status flags
36ac495dSmrg    __set_status_flags (pfpsf, INVALID_EXCEPTION);
36ac495dSmrg  }
36ac495dSmrg#endif
36ac495dSmrg  if ((x.w[1] & 0x7c00000000000000ull) != 0x7c00000000000000ull) {
36ac495dSmrg    res.w[1] = CY.w[1] & QUIET_MASK64;
36ac495dSmrg    res.w[0] = CY.w[0];
36ac495dSmrg  } else {
36ac495dSmrg    res.w[1] = CX.w[1] & QUIET_MASK64;
36ac495dSmrg    res.w[0] = CX.w[0];
36ac495dSmrg  }
36ac495dSmrg  BID_RETURN (res);
36ac495dSmrg}
36ac495dSmrg    // y is Infinity?
36ac495dSmrgif ((y.w[1] & 0x7800000000000000ull) == 0x7800000000000000ull) {
36ac495dSmrg  // check if x is not Inf.
36ac495dSmrg  if (((x.w[1] & 0x7c00000000000000ull) < 0x7800000000000000ull)) {
36ac495dSmrg    // return NaN
36ac495dSmrg#ifdef SET_STATUS_FLAGS
36ac495dSmrg    // set status flags
36ac495dSmrg    __set_status_flags (pfpsf, INVALID_EXCEPTION);
36ac495dSmrg#endif
36ac495dSmrg    res.w[1] = 0x7c00000000000000ull;
36ac495dSmrg    res.w[0] = 0;
36ac495dSmrg    BID_RETURN (res);
36ac495dSmrg  } else
36ac495dSmrg    if (((x.w[1] & 0x7c00000000000000ull) <= 0x7800000000000000ull)) {
36ac495dSmrg    res.w[1] = CX.w[1] & QUIET_MASK64;
36ac495dSmrg    res.w[0] = CX.w[0];
36ac495dSmrg    BID_RETURN (res);
36ac495dSmrg  }
36ac495dSmrg}
36ac495dSmrg
36ac495dSmrg}
36ac495dSmrg
36ac495dSmrgif (!valid_x) {
36ac495dSmrg  // test if x is NaN or Inf
36ac495dSmrg  if ((x.w[1] & 0x7c00000000000000ull) == 0x7800000000000000ull) {
36ac495dSmrg#ifdef SET_STATUS_FLAGS
36ac495dSmrg    // set status flags
36ac495dSmrg    __set_status_flags (pfpsf, INVALID_EXCEPTION);
36ac495dSmrg#endif
36ac495dSmrg    res.w[1] = 0x7c00000000000000ull;
36ac495dSmrg    res.w[0] = 0;
36ac495dSmrg    BID_RETURN (res);
36ac495dSmrg  } else if ((x.w[1] & 0x7c00000000000000ull) == 0x7c00000000000000ull) {
36ac495dSmrg    if ((x.w[1] & 0x7e00000000000000ull) == 0x7e00000000000000ull) {
36ac495dSmrg#ifdef SET_STATUS_FLAGS
36ac495dSmrg      // set status flags
36ac495dSmrg      __set_status_flags (pfpsf, INVALID_EXCEPTION);
36ac495dSmrg#endif
36ac495dSmrg    }
36ac495dSmrg    res.w[1] = CX.w[1] & QUIET_MASK64;
36ac495dSmrg    res.w[0] = CX.w[0];
36ac495dSmrg    BID_RETURN (res);
36ac495dSmrg  }
36ac495dSmrg  if (!CX.w[1] && !CX.w[0]) {
36ac495dSmrg    get_BID128_very_fast (&res, sign_x, exponent_y, CX);
36ac495dSmrg    BID_RETURN (res);
36ac495dSmrg  }
36ac495dSmrg}
36ac495dSmrg  // get number of decimal digits in coefficient_x
36ac495dSmrgif (CX.w[1]) {
36ac495dSmrg  tempx.d = (float) CX.w[1];
36ac495dSmrg  bin_expon_cx = ((tempx.i >> 23) & 0xff) - 0x7f + 64;
36ac495dSmrg} else {
36ac495dSmrg  tempx.d = (float) CX.w[0];
36ac495dSmrg  bin_expon_cx = ((tempx.i >> 23) & 0xff) - 0x7f;
36ac495dSmrg}
36ac495dSmrg
36ac495dSmrgdigits_x = estimate_decimal_digits[bin_expon_cx];
36ac495dSmrgif (CX.w[1] > power10_table_128[digits_x].w[1]
36ac495dSmrg    || (CX.w[1] == power10_table_128[digits_x].w[1]
36ac495dSmrg	&& CX.w[0] >= power10_table_128[digits_x].w[0]))
36ac495dSmrg  digits_x++;
36ac495dSmrg
36ac495dSmrgexpon_diff = exponent_x - exponent_y;
36ac495dSmrgtotal_digits = digits_x + expon_diff;
36ac495dSmrg
36ac495dSmrgif ((UINT32) total_digits <= 34) {
36ac495dSmrg  if (expon_diff >= 0) {
36ac495dSmrg    T = power10_table_128[expon_diff];
36ac495dSmrg    __mul_128x128_low (CX2, T, CX);
36ac495dSmrg    get_BID128_very_fast (&res, sign_x, exponent_y, CX2);
36ac495dSmrg    BID_RETURN (res);
36ac495dSmrg  }
36ac495dSmrg#ifndef IEEE_ROUND_NEAREST_TIES_AWAY
36ac495dSmrg#ifndef IEEE_ROUND_NEAREST
36ac495dSmrg  rmode = rnd_mode;
36ac495dSmrg  if (sign_x && (unsigned) (rmode - 1) < 2)
36ac495dSmrg    rmode = 3 - rmode;
36ac495dSmrg#else
36ac495dSmrg  rmode = 0;
36ac495dSmrg#endif
36ac495dSmrg#else
36ac495dSmrg  rmode = 0;
36ac495dSmrg#endif
36ac495dSmrg  // must round off -expon_diff digits
36ac495dSmrg  extra_digits = -expon_diff;
36ac495dSmrg  __add_128_128 (CX, CX, round_const_table_128[rmode][extra_digits]);
36ac495dSmrg
36ac495dSmrg  // get P*(2^M[extra_digits])/10^extra_digits
36ac495dSmrg  __mul_128x128_to_256 (CT, CX, reciprocals10_128[extra_digits]);
36ac495dSmrg
36ac495dSmrg  // now get P/10^extra_digits: shift C64 right by M[extra_digits]-128
36ac495dSmrg  amount = recip_scale[extra_digits];
36ac495dSmrg  CX2.w[0] = CT.w[2];
36ac495dSmrg  CX2.w[1] = CT.w[3];
36ac495dSmrg  if (amount >= 64) {
36ac495dSmrg    CR.w[1] = 0;
36ac495dSmrg    CR.w[0] = CX2.w[1] >> (amount - 64);
36ac495dSmrg  } else {
36ac495dSmrg    __shr_128 (CR, CX2, amount);
36ac495dSmrg  }
36ac495dSmrg
36ac495dSmrg#ifndef IEEE_ROUND_NEAREST_TIES_AWAY
36ac495dSmrg#ifndef IEEE_ROUND_NEAREST
36ac495dSmrg  if (rnd_mode == 0)
36ac495dSmrg#endif
36ac495dSmrg    if (CR.w[0] & 1) {
36ac495dSmrg      // check whether fractional part of initial_P/10^extra_digits is
36ac495dSmrg      // exactly .5 this is the same as fractional part of
36ac495dSmrg      // (initial_P + 0.5*10^extra_digits)/10^extra_digits is exactly zero
36ac495dSmrg
36ac495dSmrg      // get remainder
36ac495dSmrg      if (amount >= 64) {
36ac495dSmrg	remainder_h = CX2.w[0] | (CX2.w[1] << (128 - amount));
36ac495dSmrg      } else
36ac495dSmrg	remainder_h = CX2.w[0] << (64 - amount);
36ac495dSmrg
36ac495dSmrg      // test whether fractional part is 0
36ac495dSmrg      if (!remainder_h
36ac495dSmrg	  && (CT.w[1] < reciprocals10_128[extra_digits].w[1]
36ac495dSmrg	      || (CT.w[1] == reciprocals10_128[extra_digits].w[1]
36ac495dSmrg		  && CT.w[0] < reciprocals10_128[extra_digits].w[0]))) {
36ac495dSmrg	CR.w[0]--;
36ac495dSmrg      }
36ac495dSmrg    }
36ac495dSmrg#endif
36ac495dSmrg
36ac495dSmrg#ifdef SET_STATUS_FLAGS
36ac495dSmrg  status = INEXACT_EXCEPTION;
36ac495dSmrg
36ac495dSmrg  // get remainder
36ac495dSmrg  if (amount >= 64) {
36ac495dSmrg    REM_H.w[1] = (CX2.w[1] << (128 - amount));
36ac495dSmrg    REM_H.w[0] = CX2.w[0];
36ac495dSmrg  } else {
36ac495dSmrg    REM_H.w[1] = CX2.w[0] << (64 - amount);
36ac495dSmrg    REM_H.w[0] = 0;
36ac495dSmrg  }
36ac495dSmrg
36ac495dSmrg  switch (rmode) {
36ac495dSmrg  case ROUNDING_TO_NEAREST:
36ac495dSmrg  case ROUNDING_TIES_AWAY:
36ac495dSmrg    // test whether fractional part is 0
36ac495dSmrg    if (REM_H.w[1] == 0x8000000000000000ull && !REM_H.w[0]
36ac495dSmrg	&& (CT.w[1] < reciprocals10_128[extra_digits].w[1]
36ac495dSmrg	    || (CT.w[1] == reciprocals10_128[extra_digits].w[1]
36ac495dSmrg		&& CT.w[0] < reciprocals10_128[extra_digits].w[0])))
36ac495dSmrg      status = EXACT_STATUS;
36ac495dSmrg    break;
36ac495dSmrg  case ROUNDING_DOWN:
36ac495dSmrg  case ROUNDING_TO_ZERO:
36ac495dSmrg    if (!(REM_H.w[1] | REM_H.w[0])
36ac495dSmrg	&& (CT.w[1] < reciprocals10_128[extra_digits].w[1]
36ac495dSmrg	    || (CT.w[1] == reciprocals10_128[extra_digits].w[1]
36ac495dSmrg		&& CT.w[0] < reciprocals10_128[extra_digits].w[0])))
36ac495dSmrg      status = EXACT_STATUS;
36ac495dSmrg    break;
36ac495dSmrg  default:
36ac495dSmrg    // round up
36ac495dSmrg    __add_carry_out (Stemp.w[0], CY64, CT.w[0],
36ac495dSmrg		     reciprocals10_128[extra_digits].w[0]);
36ac495dSmrg    __add_carry_in_out (Stemp.w[1], carry, CT.w[1],
36ac495dSmrg			reciprocals10_128[extra_digits].w[1], CY64);
36ac495dSmrg    if (amount < 64) {
36ac495dSmrg      C2N.w[1] = 0;
36ac495dSmrg      C2N.w[0] = ((UINT64) 1) << amount;
36ac495dSmrg      REM_H.w[0] = REM_H.w[1] >> (64 - amount);
36ac495dSmrg      REM_H.w[1] = 0;
36ac495dSmrg    } else {
36ac495dSmrg      C2N.w[1] = ((UINT64) 1) << (amount - 64);
36ac495dSmrg      C2N.w[0] = 0;
36ac495dSmrg      REM_H.w[1] >>= (128 - amount);
36ac495dSmrg    }
36ac495dSmrg    REM_H.w[0] += carry;
36ac495dSmrg    if (REM_H.w[0] < carry)
36ac495dSmrg      REM_H.w[1]++;
36ac495dSmrg    if (__unsigned_compare_ge_128 (REM_H, C2N))
36ac495dSmrg      status = EXACT_STATUS;
36ac495dSmrg  }
36ac495dSmrg
36ac495dSmrg  __set_status_flags (pfpsf, status);
36ac495dSmrg
36ac495dSmrg#endif
36ac495dSmrg  get_BID128_very_fast (&res, sign_x, exponent_y, CR);
36ac495dSmrg  BID_RETURN (res);
36ac495dSmrg}
36ac495dSmrgif (total_digits < 0) {
36ac495dSmrg  CR.w[1] = CR.w[0] = 0;
36ac495dSmrg#ifndef IEEE_ROUND_NEAREST_TIES_AWAY
36ac495dSmrg#ifndef IEEE_ROUND_NEAREST
36ac495dSmrg  rmode = rnd_mode;
36ac495dSmrg  if (sign_x && (unsigned) (rmode - 1) < 2)
36ac495dSmrg    rmode = 3 - rmode;
36ac495dSmrg  if (rmode == ROUNDING_UP)
36ac495dSmrg    CR.w[0] = 1;
36ac495dSmrg#endif
36ac495dSmrg#endif
36ac495dSmrg#ifdef SET_STATUS_FLAGS
36ac495dSmrg  __set_status_flags (pfpsf, INEXACT_EXCEPTION);
36ac495dSmrg#endif
36ac495dSmrg  get_BID128_very_fast (&res, sign_x, exponent_y, CR);
36ac495dSmrg  BID_RETURN (res);
36ac495dSmrg}
36ac495dSmrg  // else  more than 34 digits in coefficient
36ac495dSmrg#ifdef SET_STATUS_FLAGS
36ac495dSmrg__set_status_flags (pfpsf, INVALID_EXCEPTION);
36ac495dSmrg#endif
36ac495dSmrgres.w[1] = 0x7c00000000000000ull;
36ac495dSmrgres.w[0] = 0;
36ac495dSmrgBID_RETURN (res);
36ac495dSmrg
36ac495dSmrg}