softfloat/bits64/softfloat.c

*84d9c625SLionel Sambuc/* $NetBSD: softfloat.c,v 1.13 2013/11/22 17:04:24 martin Exp $ */
2fe8fb19SBen Gras
2fe8fb19SBen Gras/*
2fe8fb19SBen Gras * This version hacked for use with gcc -msoft-float by bjh21.
2fe8fb19SBen Gras * (Mostly a case of #ifdefing out things GCC doesn't need or provides
2fe8fb19SBen Gras *  itself).
2fe8fb19SBen Gras */
2fe8fb19SBen Gras
2fe8fb19SBen Gras/*
2fe8fb19SBen Gras * Things you may want to define:
2fe8fb19SBen Gras *
2fe8fb19SBen Gras * SOFTFLOAT_FOR_GCC - build only those functions necessary for GCC (with
2fe8fb19SBen Gras *   -msoft-float) to work.  Include "softfloat-for-gcc.h" to get them
2fe8fb19SBen Gras *   properly renamed.
2fe8fb19SBen Gras */
2fe8fb19SBen Gras
2fe8fb19SBen Gras/*
2fe8fb19SBen Gras===============================================================================
2fe8fb19SBen Gras
2fe8fb19SBen GrasThis C source file is part of the SoftFloat IEC/IEEE Floating-point
2fe8fb19SBen GrasArithmetic Package, Release 2a.
2fe8fb19SBen Gras
2fe8fb19SBen GrasWritten by John R. Hauser.  This work was made possible in part by the
2fe8fb19SBen GrasInternational Computer Science Institute, located at Suite 600, 1947 Center
2fe8fb19SBen GrasStreet, Berkeley, California 94704.  Funding was partially provided by the
2fe8fb19SBen GrasNational Science Foundation under grant MIP-9311980.  The original version
2fe8fb19SBen Grasof this code was written as part of a project to build a fixed-point vector
2fe8fb19SBen Grasprocessor in collaboration with the University of California at Berkeley,
2fe8fb19SBen Grasoverseen by Profs. Nelson Morgan and John Wawrzynek.  More information
2fe8fb19SBen Grasis available through the Web page `http://HTTP.CS.Berkeley.EDU/~jhauser/
2fe8fb19SBen Grasarithmetic/SoftFloat.html'.
2fe8fb19SBen Gras
2fe8fb19SBen GrasTHIS SOFTWARE IS DISTRIBUTED AS IS, FOR FREE.  Although reasonable effort
2fe8fb19SBen Grashas been made to avoid it, THIS SOFTWARE MAY CONTAIN FAULTS THAT WILL AT
2fe8fb19SBen GrasTIMES RESULT IN INCORRECT BEHAVIOR.  USE OF THIS SOFTWARE IS RESTRICTED TO
2fe8fb19SBen GrasPERSONS AND ORGANIZATIONS WHO CAN AND WILL TAKE FULL RESPONSIBILITY FOR ANY
2fe8fb19SBen GrasAND ALL LOSSES, COSTS, OR OTHER PROBLEMS ARISING FROM ITS USE.
2fe8fb19SBen Gras
2fe8fb19SBen GrasDerivative works are acceptable, even for commercial purposes, so long as
2fe8fb19SBen Gras(1) they include prominent notice that the work is derivative, and (2) they
2fe8fb19SBen Grasinclude prominent notice akin to these four paragraphs for those parts of
2fe8fb19SBen Grasthis code that are retained.
2fe8fb19SBen Gras
2fe8fb19SBen Gras===============================================================================
2fe8fb19SBen Gras*/
2fe8fb19SBen Gras
2fe8fb19SBen Gras#include <sys/cdefs.h>
2fe8fb19SBen Gras#if defined(LIBC_SCCS) && !defined(lint)
*84d9c625SLionel Sambuc__RCSID("$NetBSD: softfloat.c,v 1.13 2013/11/22 17:04:24 martin Exp $");
2fe8fb19SBen Gras#endif /* LIBC_SCCS and not lint */
2fe8fb19SBen Gras
2fe8fb19SBen Gras#ifdef SOFTFLOAT_FOR_GCC
2fe8fb19SBen Gras#include "softfloat-for-gcc.h"
2fe8fb19SBen Gras#endif
2fe8fb19SBen Gras
2fe8fb19SBen Gras#include "milieu.h"
2fe8fb19SBen Gras#include "softfloat.h"
2fe8fb19SBen Gras
2fe8fb19SBen Gras/*
2fe8fb19SBen Gras * Conversions between floats as stored in memory and floats as
2fe8fb19SBen Gras * SoftFloat uses them
2fe8fb19SBen Gras */
2fe8fb19SBen Gras#ifndef FLOAT64_DEMANGLE
2fe8fb19SBen Gras#define FLOAT64_DEMANGLE(a)	(a)
2fe8fb19SBen Gras#endif
2fe8fb19SBen Gras#ifndef FLOAT64_MANGLE
2fe8fb19SBen Gras#define FLOAT64_MANGLE(a)	(a)
2fe8fb19SBen Gras#endif
2fe8fb19SBen Gras
2fe8fb19SBen Gras/*
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen GrasFloating-point rounding mode, extended double-precision rounding precision,
2fe8fb19SBen Grasand exception flags.
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen Gras*/
*84d9c625SLionel Sambuc#ifndef set_float_rounding_mode
2fe8fb19SBen Grasfp_rnd float_rounding_mode = float_round_nearest_even;
2fe8fb19SBen Grasfp_except float_exception_flags = 0;
*84d9c625SLionel Sambuc#endif
*84d9c625SLionel Sambuc#ifndef set_float_exception_inexact_flag
*84d9c625SLionel Sambuc#define	set_float_exception_inexact_flag() \
*84d9c625SLionel Sambuc	((void)(float_exception_flags |= float_flag_inexact))
*84d9c625SLionel Sambuc#endif
2fe8fb19SBen Gras#ifdef FLOATX80
2fe8fb19SBen Grasint8 floatx80_rounding_precision = 80;
2fe8fb19SBen Gras#endif
2fe8fb19SBen Gras
2fe8fb19SBen Gras/*
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen GrasPrimitive arithmetic functions, including multi-word arithmetic, and
2fe8fb19SBen Grasdivision and square root approximations.  (Can be specialized to target if
2fe8fb19SBen Grasdesired.)
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen Gras*/
2fe8fb19SBen Gras#include "softfloat-macros"
2fe8fb19SBen Gras
2fe8fb19SBen Gras/*
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen GrasFunctions and definitions to determine:  (1) whether tininess for underflow
2fe8fb19SBen Grasis detected before or after rounding by default, (2) what (if anything)
2fe8fb19SBen Grashappens when exceptions are raised, (3) how signaling NaNs are distinguished
2fe8fb19SBen Grasfrom quiet NaNs, (4) the default generated quiet NaNs, and (5) how NaNs
2fe8fb19SBen Grasare propagated from function inputs to output.  These details are target-
2fe8fb19SBen Grasspecific.
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen Gras*/
2fe8fb19SBen Gras#include "softfloat-specialize"
2fe8fb19SBen Gras
2fe8fb19SBen Gras#if !defined(SOFTFLOAT_FOR_GCC) || defined(FLOATX80) || defined(FLOAT128)
2fe8fb19SBen Gras/*
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen GrasTakes a 64-bit fixed-point value `absZ' with binary point between bits 6
2fe8fb19SBen Grasand 7, and returns the properly rounded 32-bit integer corresponding to the
2fe8fb19SBen Grasinput.  If `zSign' is 1, the input is negated before being converted to an
2fe8fb19SBen Grasinteger.  Bit 63 of `absZ' must be zero.  Ordinarily, the fixed-point input
2fe8fb19SBen Grasis simply rounded to an integer, with the inexact exception raised if the
2fe8fb19SBen Grasinput cannot be represented exactly as an integer.  However, if the fixed-
2fe8fb19SBen Graspoint input is too large, the invalid exception is raised and the largest
2fe8fb19SBen Graspositive or negative integer is returned.
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen Gras*/
2fe8fb19SBen Grasstatic int32 roundAndPackInt32( flag zSign, bits64 absZ )
2fe8fb19SBen Gras{
2fe8fb19SBen Gras    int8 roundingMode;
2fe8fb19SBen Gras    flag roundNearestEven;
2fe8fb19SBen Gras    int8 roundIncrement, roundBits;
2fe8fb19SBen Gras    int32 z;
2fe8fb19SBen Gras
2fe8fb19SBen Gras    roundingMode = float_rounding_mode;
2fe8fb19SBen Gras    roundNearestEven = ( roundingMode == float_round_nearest_even );
2fe8fb19SBen Gras    roundIncrement = 0x40;
2fe8fb19SBen Gras    if ( ! roundNearestEven ) {
2fe8fb19SBen Gras        if ( roundingMode == float_round_to_zero ) {
2fe8fb19SBen Gras            roundIncrement = 0;
2fe8fb19SBen Gras        }
2fe8fb19SBen Gras        else {
2fe8fb19SBen Gras            roundIncrement = 0x7F;
2fe8fb19SBen Gras            if ( zSign ) {
2fe8fb19SBen Gras                if ( roundingMode == float_round_up ) roundIncrement = 0;
2fe8fb19SBen Gras            }
2fe8fb19SBen Gras            else {
2fe8fb19SBen Gras                if ( roundingMode == float_round_down ) roundIncrement = 0;
2fe8fb19SBen Gras            }
2fe8fb19SBen Gras        }
2fe8fb19SBen Gras    }
f14fb602SLionel Sambuc    roundBits = (int8)(absZ & 0x7F);
2fe8fb19SBen Gras    absZ = ( absZ + roundIncrement )>>7;
2fe8fb19SBen Gras    absZ &= ~ ( ( ( roundBits ^ 0x40 ) == 0 ) & roundNearestEven );
f14fb602SLionel Sambuc    z = (int32)absZ;
2fe8fb19SBen Gras    if ( zSign ) z = - z;
2fe8fb19SBen Gras    if ( ( absZ>>32 ) || ( z && ( ( z < 0 ) ^ zSign ) ) ) {
2fe8fb19SBen Gras        float_raise( float_flag_invalid );
2fe8fb19SBen Gras        return zSign ? (sbits32) 0x80000000 : 0x7FFFFFFF;
2fe8fb19SBen Gras    }
*84d9c625SLionel Sambuc    if ( roundBits ) set_float_exception_inexact_flag();
2fe8fb19SBen Gras    return z;
2fe8fb19SBen Gras
2fe8fb19SBen Gras}
2fe8fb19SBen Gras
2fe8fb19SBen Gras/*
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen GrasTakes the 128-bit fixed-point value formed by concatenating `absZ0' and
2fe8fb19SBen Gras`absZ1', with binary point between bits 63 and 64 (between the input words),
2fe8fb19SBen Grasand returns the properly rounded 64-bit integer corresponding to the input.
2fe8fb19SBen GrasIf `zSign' is 1, the input is negated before being converted to an integer.
2fe8fb19SBen GrasOrdinarily, the fixed-point input is simply rounded to an integer, with
2fe8fb19SBen Grasthe inexact exception raised if the input cannot be represented exactly as
2fe8fb19SBen Grasan integer.  However, if the fixed-point input is too large, the invalid
2fe8fb19SBen Grasexception is raised and the largest positive or negative integer is
2fe8fb19SBen Grasreturned.
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen Gras*/
2fe8fb19SBen Grasstatic int64 roundAndPackInt64( flag zSign, bits64 absZ0, bits64 absZ1 )
2fe8fb19SBen Gras{
2fe8fb19SBen Gras    int8 roundingMode;
2fe8fb19SBen Gras    flag roundNearestEven, increment;
2fe8fb19SBen Gras    int64 z;
2fe8fb19SBen Gras
2fe8fb19SBen Gras    roundingMode = float_rounding_mode;
2fe8fb19SBen Gras    roundNearestEven = ( roundingMode == float_round_nearest_even );
2fe8fb19SBen Gras    increment = ( (sbits64) absZ1 < 0 );
2fe8fb19SBen Gras    if ( ! roundNearestEven ) {
2fe8fb19SBen Gras        if ( roundingMode == float_round_to_zero ) {
2fe8fb19SBen Gras            increment = 0;
2fe8fb19SBen Gras        }
2fe8fb19SBen Gras        else {
2fe8fb19SBen Gras            if ( zSign ) {
2fe8fb19SBen Gras                increment = ( roundingMode == float_round_down ) && absZ1;
2fe8fb19SBen Gras            }
2fe8fb19SBen Gras            else {
2fe8fb19SBen Gras                increment = ( roundingMode == float_round_up ) && absZ1;
2fe8fb19SBen Gras            }
2fe8fb19SBen Gras        }
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    if ( increment ) {
2fe8fb19SBen Gras        ++absZ0;
2fe8fb19SBen Gras        if ( absZ0 == 0 ) goto overflow;
2fe8fb19SBen Gras        absZ0 &= ~ ( ( (bits64) ( absZ1<<1 ) == 0 ) & roundNearestEven );
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    z = absZ0;
2fe8fb19SBen Gras    if ( zSign ) z = - z;
2fe8fb19SBen Gras    if ( z && ( ( z < 0 ) ^ zSign ) ) {
2fe8fb19SBen Gras overflow:
2fe8fb19SBen Gras        float_raise( float_flag_invalid );
2fe8fb19SBen Gras        return
2fe8fb19SBen Gras              zSign ? (sbits64) LIT64( 0x8000000000000000 )
2fe8fb19SBen Gras            : LIT64( 0x7FFFFFFFFFFFFFFF );
2fe8fb19SBen Gras    }
*84d9c625SLionel Sambuc    if ( absZ1 ) set_float_exception_inexact_flag();
2fe8fb19SBen Gras    return z;
2fe8fb19SBen Gras
2fe8fb19SBen Gras}
2fe8fb19SBen Gras#endif
2fe8fb19SBen Gras
2fe8fb19SBen Gras/*
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen GrasReturns the fraction bits of the single-precision floating-point value `a'.
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen Gras*/
2fe8fb19SBen GrasINLINE bits32 extractFloat32Frac( float32 a )
2fe8fb19SBen Gras{
2fe8fb19SBen Gras
2fe8fb19SBen Gras    return a & 0x007FFFFF;
2fe8fb19SBen Gras
2fe8fb19SBen Gras}
2fe8fb19SBen Gras
2fe8fb19SBen Gras/*
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen GrasReturns the exponent bits of the single-precision floating-point value `a'.
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen Gras*/
2fe8fb19SBen GrasINLINE int16 extractFloat32Exp( float32 a )
2fe8fb19SBen Gras{
2fe8fb19SBen Gras
2fe8fb19SBen Gras    return ( a>>23 ) & 0xFF;
2fe8fb19SBen Gras
2fe8fb19SBen Gras}
2fe8fb19SBen Gras
2fe8fb19SBen Gras/*
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen GrasReturns the sign bit of the single-precision floating-point value `a'.
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen Gras*/
2fe8fb19SBen GrasINLINE flag extractFloat32Sign( float32 a )
2fe8fb19SBen Gras{
2fe8fb19SBen Gras
2fe8fb19SBen Gras    return a>>31;
2fe8fb19SBen Gras
2fe8fb19SBen Gras}
2fe8fb19SBen Gras
2fe8fb19SBen Gras/*
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen GrasNormalizes the subnormal single-precision floating-point value represented
2fe8fb19SBen Grasby the denormalized significand `aSig'.  The normalized exponent and
2fe8fb19SBen Grassignificand are stored at the locations pointed to by `zExpPtr' and
2fe8fb19SBen Gras`zSigPtr', respectively.
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen Gras*/
2fe8fb19SBen Grasstatic void
2fe8fb19SBen Gras normalizeFloat32Subnormal( bits32 aSig, int16 *zExpPtr, bits32 *zSigPtr )
2fe8fb19SBen Gras{
2fe8fb19SBen Gras    int8 shiftCount;
2fe8fb19SBen Gras
2fe8fb19SBen Gras    shiftCount = countLeadingZeros32( aSig ) - 8;
2fe8fb19SBen Gras    *zSigPtr = aSig<<shiftCount;
2fe8fb19SBen Gras    *zExpPtr = 1 - shiftCount;
2fe8fb19SBen Gras
2fe8fb19SBen Gras}
2fe8fb19SBen Gras
2fe8fb19SBen Gras/*
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen GrasPacks the sign `zSign', exponent `zExp', and significand `zSig' into a
2fe8fb19SBen Grassingle-precision floating-point value, returning the result.  After being
2fe8fb19SBen Grasshifted into the proper positions, the three fields are simply added
2fe8fb19SBen Grastogether to form the result.  This means that any integer portion of `zSig'
2fe8fb19SBen Graswill be added into the exponent.  Since a properly normalized significand
2fe8fb19SBen Graswill have an integer portion equal to 1, the `zExp' input should be 1 less
2fe8fb19SBen Grasthan the desired result exponent whenever `zSig' is a complete, normalized
2fe8fb19SBen Grassignificand.
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen Gras*/
2fe8fb19SBen GrasINLINE float32 packFloat32( flag zSign, int16 zExp, bits32 zSig )
2fe8fb19SBen Gras{
2fe8fb19SBen Gras
2fe8fb19SBen Gras    return ( ( (bits32) zSign )<<31 ) + ( ( (bits32) zExp )<<23 ) + zSig;
2fe8fb19SBen Gras
2fe8fb19SBen Gras}
2fe8fb19SBen Gras
2fe8fb19SBen Gras/*
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen GrasTakes an abstract floating-point value having sign `zSign', exponent `zExp',
2fe8fb19SBen Grasand significand `zSig', and returns the proper single-precision floating-
2fe8fb19SBen Graspoint value corresponding to the abstract input.  Ordinarily, the abstract
2fe8fb19SBen Grasvalue is simply rounded and packed into the single-precision format, with
2fe8fb19SBen Grasthe inexact exception raised if the abstract input cannot be represented
2fe8fb19SBen Grasexactly.  However, if the abstract value is too large, the overflow and
2fe8fb19SBen Grasinexact exceptions are raised and an infinity or maximal finite value is
2fe8fb19SBen Grasreturned.  If the abstract value is too small, the input value is rounded to
2fe8fb19SBen Grasa subnormal number, and the underflow and inexact exceptions are raised if
2fe8fb19SBen Grasthe abstract input cannot be represented exactly as a subnormal single-
2fe8fb19SBen Grasprecision floating-point number.
2fe8fb19SBen Gras    The input significand `zSig' has its binary point between bits 30
2fe8fb19SBen Grasand 29, which is 7 bits to the left of the usual location.  This shifted
2fe8fb19SBen Grassignificand must be normalized or smaller.  If `zSig' is not normalized,
2fe8fb19SBen Gras`zExp' must be 0; in that case, the result returned is a subnormal number,
2fe8fb19SBen Grasand it must not require rounding.  In the usual case that `zSig' is
2fe8fb19SBen Grasnormalized, `zExp' must be 1 less than the ``true'' floating-point exponent.
2fe8fb19SBen GrasThe handling of underflow and overflow follows the IEC/IEEE Standard for
2fe8fb19SBen GrasBinary Floating-Point Arithmetic.
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen Gras*/
2fe8fb19SBen Grasstatic float32 roundAndPackFloat32( flag zSign, int16 zExp, bits32 zSig )
2fe8fb19SBen Gras{
2fe8fb19SBen Gras    int8 roundingMode;
2fe8fb19SBen Gras    flag roundNearestEven;
2fe8fb19SBen Gras    int8 roundIncrement, roundBits;
2fe8fb19SBen Gras    flag isTiny;
2fe8fb19SBen Gras
2fe8fb19SBen Gras    roundingMode = float_rounding_mode;
2fe8fb19SBen Gras    roundNearestEven = ( roundingMode == float_round_nearest_even );
2fe8fb19SBen Gras    roundIncrement = 0x40;
2fe8fb19SBen Gras    if ( ! roundNearestEven ) {
2fe8fb19SBen Gras        if ( roundingMode == float_round_to_zero ) {
2fe8fb19SBen Gras            roundIncrement = 0;
2fe8fb19SBen Gras        }
2fe8fb19SBen Gras        else {
2fe8fb19SBen Gras            roundIncrement = 0x7F;
2fe8fb19SBen Gras            if ( zSign ) {
2fe8fb19SBen Gras                if ( roundingMode == float_round_up ) roundIncrement = 0;
2fe8fb19SBen Gras            }
2fe8fb19SBen Gras            else {
2fe8fb19SBen Gras                if ( roundingMode == float_round_down ) roundIncrement = 0;
2fe8fb19SBen Gras            }
2fe8fb19SBen Gras        }
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    roundBits = zSig & 0x7F;
2fe8fb19SBen Gras    if ( 0xFD <= (bits16) zExp ) {
2fe8fb19SBen Gras        if (    ( 0xFD < zExp )
2fe8fb19SBen Gras             || (    ( zExp == 0xFD )
2fe8fb19SBen Gras                  && ( (sbits32) ( zSig + roundIncrement ) < 0 ) )
2fe8fb19SBen Gras           ) {
2fe8fb19SBen Gras            float_raise( float_flag_overflow | float_flag_inexact );
2fe8fb19SBen Gras            return packFloat32( zSign, 0xFF, 0 ) - ( roundIncrement == 0 );
2fe8fb19SBen Gras        }
2fe8fb19SBen Gras        if ( zExp < 0 ) {
2fe8fb19SBen Gras            isTiny =
2fe8fb19SBen Gras                   ( float_detect_tininess == float_tininess_before_rounding )
2fe8fb19SBen Gras                || ( zExp < -1 )
f14fb602SLionel Sambuc                || ( zSig + roundIncrement < 0x80000000U );
2fe8fb19SBen Gras            shift32RightJamming( zSig, - zExp, &zSig );
2fe8fb19SBen Gras            zExp = 0;
2fe8fb19SBen Gras            roundBits = zSig & 0x7F;
2fe8fb19SBen Gras            if ( isTiny && roundBits ) float_raise( float_flag_underflow );
2fe8fb19SBen Gras        }
2fe8fb19SBen Gras    }
*84d9c625SLionel Sambuc    if ( roundBits ) set_float_exception_inexact_flag();
2fe8fb19SBen Gras    zSig = ( zSig + roundIncrement )>>7;
2fe8fb19SBen Gras    zSig &= ~ ( ( ( roundBits ^ 0x40 ) == 0 ) & roundNearestEven );
2fe8fb19SBen Gras    if ( zSig == 0 ) zExp = 0;
2fe8fb19SBen Gras    return packFloat32( zSign, zExp, zSig );
2fe8fb19SBen Gras
2fe8fb19SBen Gras}
2fe8fb19SBen Gras
2fe8fb19SBen Gras/*
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen GrasTakes an abstract floating-point value having sign `zSign', exponent `zExp',
2fe8fb19SBen Grasand significand `zSig', and returns the proper single-precision floating-
2fe8fb19SBen Graspoint value corresponding to the abstract input.  This routine is just like
2fe8fb19SBen Gras`roundAndPackFloat32' except that `zSig' does not have to be normalized.
2fe8fb19SBen GrasBit 31 of `zSig' must be zero, and `zExp' must be 1 less than the ``true''
2fe8fb19SBen Grasfloating-point exponent.
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen Gras*/
2fe8fb19SBen Grasstatic float32
2fe8fb19SBen Gras normalizeRoundAndPackFloat32( flag zSign, int16 zExp, bits32 zSig )
2fe8fb19SBen Gras{
2fe8fb19SBen Gras    int8 shiftCount;
2fe8fb19SBen Gras
2fe8fb19SBen Gras    shiftCount = countLeadingZeros32( zSig ) - 1;
2fe8fb19SBen Gras    return roundAndPackFloat32( zSign, zExp - shiftCount, zSig<<shiftCount );
2fe8fb19SBen Gras
2fe8fb19SBen Gras}
2fe8fb19SBen Gras
2fe8fb19SBen Gras/*
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen GrasReturns the fraction bits of the double-precision floating-point value `a'.
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen Gras*/
2fe8fb19SBen GrasINLINE bits64 extractFloat64Frac( float64 a )
2fe8fb19SBen Gras{
2fe8fb19SBen Gras
2fe8fb19SBen Gras    return FLOAT64_DEMANGLE(a) & LIT64( 0x000FFFFFFFFFFFFF );
2fe8fb19SBen Gras
2fe8fb19SBen Gras}
2fe8fb19SBen Gras
2fe8fb19SBen Gras/*
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen GrasReturns the exponent bits of the double-precision floating-point value `a'.
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen Gras*/
2fe8fb19SBen GrasINLINE int16 extractFloat64Exp( float64 a )
2fe8fb19SBen Gras{
2fe8fb19SBen Gras
f14fb602SLionel Sambuc    return (int16)((FLOAT64_DEMANGLE(a) >> 52) & 0x7FF);
2fe8fb19SBen Gras
2fe8fb19SBen Gras}
2fe8fb19SBen Gras
2fe8fb19SBen Gras/*
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen GrasReturns the sign bit of the double-precision floating-point value `a'.
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen Gras*/
2fe8fb19SBen GrasINLINE flag extractFloat64Sign( float64 a )
2fe8fb19SBen Gras{
2fe8fb19SBen Gras
f14fb602SLionel Sambuc    return (flag)(FLOAT64_DEMANGLE(a) >> 63);
2fe8fb19SBen Gras
2fe8fb19SBen Gras}
2fe8fb19SBen Gras
2fe8fb19SBen Gras/*
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen GrasNormalizes the subnormal double-precision floating-point value represented
2fe8fb19SBen Grasby the denormalized significand `aSig'.  The normalized exponent and
2fe8fb19SBen Grassignificand are stored at the locations pointed to by `zExpPtr' and
2fe8fb19SBen Gras`zSigPtr', respectively.
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen Gras*/
2fe8fb19SBen Grasstatic void
2fe8fb19SBen Gras normalizeFloat64Subnormal( bits64 aSig, int16 *zExpPtr, bits64 *zSigPtr )
2fe8fb19SBen Gras{
2fe8fb19SBen Gras    int8 shiftCount;
2fe8fb19SBen Gras
2fe8fb19SBen Gras    shiftCount = countLeadingZeros64( aSig ) - 11;
2fe8fb19SBen Gras    *zSigPtr = aSig<<shiftCount;
2fe8fb19SBen Gras    *zExpPtr = 1 - shiftCount;
2fe8fb19SBen Gras
2fe8fb19SBen Gras}
2fe8fb19SBen Gras
2fe8fb19SBen Gras/*
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen GrasPacks the sign `zSign', exponent `zExp', and significand `zSig' into a
2fe8fb19SBen Grasdouble-precision floating-point value, returning the result.  After being
2fe8fb19SBen Grasshifted into the proper positions, the three fields are simply added
2fe8fb19SBen Grastogether to form the result.  This means that any integer portion of `zSig'
2fe8fb19SBen Graswill be added into the exponent.  Since a properly normalized significand
2fe8fb19SBen Graswill have an integer portion equal to 1, the `zExp' input should be 1 less
2fe8fb19SBen Grasthan the desired result exponent whenever `zSig' is a complete, normalized
2fe8fb19SBen Grassignificand.
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen Gras*/
2fe8fb19SBen GrasINLINE float64 packFloat64( flag zSign, int16 zExp, bits64 zSig )
2fe8fb19SBen Gras{
2fe8fb19SBen Gras
2fe8fb19SBen Gras    return FLOAT64_MANGLE( ( ( (bits64) zSign )<<63 ) +
2fe8fb19SBen Gras			   ( ( (bits64) zExp )<<52 ) + zSig );
2fe8fb19SBen Gras
2fe8fb19SBen Gras}
2fe8fb19SBen Gras
2fe8fb19SBen Gras/*
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen GrasTakes an abstract floating-point value having sign `zSign', exponent `zExp',
2fe8fb19SBen Grasand significand `zSig', and returns the proper double-precision floating-
2fe8fb19SBen Graspoint value corresponding to the abstract input.  Ordinarily, the abstract
2fe8fb19SBen Grasvalue is simply rounded and packed into the double-precision format, with
2fe8fb19SBen Grasthe inexact exception raised if the abstract input cannot be represented
2fe8fb19SBen Grasexactly.  However, if the abstract value is too large, the overflow and
2fe8fb19SBen Grasinexact exceptions are raised and an infinity or maximal finite value is
2fe8fb19SBen Grasreturned.  If the abstract value is too small, the input value is rounded to
2fe8fb19SBen Grasa subnormal number, and the underflow and inexact exceptions are raised if
2fe8fb19SBen Grasthe abstract input cannot be represented exactly as a subnormal double-
2fe8fb19SBen Grasprecision floating-point number.
2fe8fb19SBen Gras    The input significand `zSig' has its binary point between bits 62
2fe8fb19SBen Grasand 61, which is 10 bits to the left of the usual location.  This shifted
2fe8fb19SBen Grassignificand must be normalized or smaller.  If `zSig' is not normalized,
2fe8fb19SBen Gras`zExp' must be 0; in that case, the result returned is a subnormal number,
2fe8fb19SBen Grasand it must not require rounding.  In the usual case that `zSig' is
2fe8fb19SBen Grasnormalized, `zExp' must be 1 less than the ``true'' floating-point exponent.
2fe8fb19SBen GrasThe handling of underflow and overflow follows the IEC/IEEE Standard for
2fe8fb19SBen GrasBinary Floating-Point Arithmetic.
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen Gras*/
2fe8fb19SBen Grasstatic float64 roundAndPackFloat64( flag zSign, int16 zExp, bits64 zSig )
2fe8fb19SBen Gras{
2fe8fb19SBen Gras    int8 roundingMode;
2fe8fb19SBen Gras    flag roundNearestEven;
2fe8fb19SBen Gras    int16 roundIncrement, roundBits;
2fe8fb19SBen Gras    flag isTiny;
2fe8fb19SBen Gras
2fe8fb19SBen Gras    roundingMode = float_rounding_mode;
2fe8fb19SBen Gras    roundNearestEven = ( roundingMode == float_round_nearest_even );
2fe8fb19SBen Gras    roundIncrement = 0x200;
2fe8fb19SBen Gras    if ( ! roundNearestEven ) {
2fe8fb19SBen Gras        if ( roundingMode == float_round_to_zero ) {
2fe8fb19SBen Gras            roundIncrement = 0;
2fe8fb19SBen Gras        }
2fe8fb19SBen Gras        else {
2fe8fb19SBen Gras            roundIncrement = 0x3FF;
2fe8fb19SBen Gras            if ( zSign ) {
2fe8fb19SBen Gras                if ( roundingMode == float_round_up ) roundIncrement = 0;
2fe8fb19SBen Gras            }
2fe8fb19SBen Gras            else {
2fe8fb19SBen Gras                if ( roundingMode == float_round_down ) roundIncrement = 0;
2fe8fb19SBen Gras            }
2fe8fb19SBen Gras        }
2fe8fb19SBen Gras    }
f14fb602SLionel Sambuc    roundBits = (int16)(zSig & 0x3FF);
2fe8fb19SBen Gras    if ( 0x7FD <= (bits16) zExp ) {
2fe8fb19SBen Gras        if (    ( 0x7FD < zExp )
2fe8fb19SBen Gras             || (    ( zExp == 0x7FD )
2fe8fb19SBen Gras                  && ( (sbits64) ( zSig + roundIncrement ) < 0 ) )
2fe8fb19SBen Gras           ) {
2fe8fb19SBen Gras            float_raise( float_flag_overflow | float_flag_inexact );
2fe8fb19SBen Gras            return FLOAT64_MANGLE(
2fe8fb19SBen Gras		FLOAT64_DEMANGLE(packFloat64( zSign, 0x7FF, 0 )) -
2fe8fb19SBen Gras		( roundIncrement == 0 ));
2fe8fb19SBen Gras        }
2fe8fb19SBen Gras        if ( zExp < 0 ) {
2fe8fb19SBen Gras            isTiny =
2fe8fb19SBen Gras                   ( float_detect_tininess == float_tininess_before_rounding )
2fe8fb19SBen Gras                || ( zExp < -1 )
f14fb602SLionel Sambuc                || ( zSig + roundIncrement < (bits64)LIT64( 0x8000000000000000 ) );
2fe8fb19SBen Gras            shift64RightJamming( zSig, - zExp, &zSig );
2fe8fb19SBen Gras            zExp = 0;
f14fb602SLionel Sambuc            roundBits = (int16)(zSig & 0x3FF);
2fe8fb19SBen Gras            if ( isTiny && roundBits ) float_raise( float_flag_underflow );
2fe8fb19SBen Gras        }
2fe8fb19SBen Gras    }
*84d9c625SLionel Sambuc    if ( roundBits ) set_float_exception_inexact_flag();
2fe8fb19SBen Gras    zSig = ( zSig + roundIncrement )>>10;
2fe8fb19SBen Gras    zSig &= ~ ( ( ( roundBits ^ 0x200 ) == 0 ) & roundNearestEven );
2fe8fb19SBen Gras    if ( zSig == 0 ) zExp = 0;
2fe8fb19SBen Gras    return packFloat64( zSign, zExp, zSig );
2fe8fb19SBen Gras
2fe8fb19SBen Gras}
2fe8fb19SBen Gras
2fe8fb19SBen Gras/*
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen GrasTakes an abstract floating-point value having sign `zSign', exponent `zExp',
2fe8fb19SBen Grasand significand `zSig', and returns the proper double-precision floating-
2fe8fb19SBen Graspoint value corresponding to the abstract input.  This routine is just like
2fe8fb19SBen Gras`roundAndPackFloat64' except that `zSig' does not have to be normalized.
2fe8fb19SBen GrasBit 63 of `zSig' must be zero, and `zExp' must be 1 less than the ``true''
2fe8fb19SBen Grasfloating-point exponent.
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen Gras*/
2fe8fb19SBen Grasstatic float64
2fe8fb19SBen Gras normalizeRoundAndPackFloat64( flag zSign, int16 zExp, bits64 zSig )
2fe8fb19SBen Gras{
2fe8fb19SBen Gras    int8 shiftCount;
2fe8fb19SBen Gras
2fe8fb19SBen Gras    shiftCount = countLeadingZeros64( zSig ) - 1;
2fe8fb19SBen Gras    return roundAndPackFloat64( zSign, zExp - shiftCount, zSig<<shiftCount );
2fe8fb19SBen Gras
2fe8fb19SBen Gras}
2fe8fb19SBen Gras
2fe8fb19SBen Gras#ifdef FLOATX80
2fe8fb19SBen Gras
2fe8fb19SBen Gras/*
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen GrasReturns the fraction bits of the extended double-precision floating-point
2fe8fb19SBen Grasvalue `a'.
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen Gras*/
2fe8fb19SBen GrasINLINE bits64 extractFloatx80Frac( floatx80 a )
2fe8fb19SBen Gras{
2fe8fb19SBen Gras
2fe8fb19SBen Gras    return a.low;
2fe8fb19SBen Gras
2fe8fb19SBen Gras}
2fe8fb19SBen Gras
2fe8fb19SBen Gras/*
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen GrasReturns the exponent bits of the extended double-precision floating-point
2fe8fb19SBen Grasvalue `a'.
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen Gras*/
2fe8fb19SBen GrasINLINE int32 extractFloatx80Exp( floatx80 a )
2fe8fb19SBen Gras{
2fe8fb19SBen Gras
2fe8fb19SBen Gras    return a.high & 0x7FFF;
2fe8fb19SBen Gras
2fe8fb19SBen Gras}
2fe8fb19SBen Gras
2fe8fb19SBen Gras/*
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen GrasReturns the sign bit of the extended double-precision floating-point value
2fe8fb19SBen Gras`a'.
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen Gras*/
2fe8fb19SBen GrasINLINE flag extractFloatx80Sign( floatx80 a )
2fe8fb19SBen Gras{
2fe8fb19SBen Gras
2fe8fb19SBen Gras    return a.high>>15;
2fe8fb19SBen Gras
2fe8fb19SBen Gras}
2fe8fb19SBen Gras
2fe8fb19SBen Gras/*
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen GrasNormalizes the subnormal extended double-precision floating-point value
2fe8fb19SBen Grasrepresented by the denormalized significand `aSig'.  The normalized exponent
2fe8fb19SBen Grasand significand are stored at the locations pointed to by `zExpPtr' and
2fe8fb19SBen Gras`zSigPtr', respectively.
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen Gras*/
2fe8fb19SBen Grasstatic void
2fe8fb19SBen Gras normalizeFloatx80Subnormal( bits64 aSig, int32 *zExpPtr, bits64 *zSigPtr )
2fe8fb19SBen Gras{
2fe8fb19SBen Gras    int8 shiftCount;
2fe8fb19SBen Gras
2fe8fb19SBen Gras    shiftCount = countLeadingZeros64( aSig );
2fe8fb19SBen Gras    *zSigPtr = aSig<<shiftCount;
2fe8fb19SBen Gras    *zExpPtr = 1 - shiftCount;
2fe8fb19SBen Gras
2fe8fb19SBen Gras}
2fe8fb19SBen Gras
2fe8fb19SBen Gras/*
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen GrasPacks the sign `zSign', exponent `zExp', and significand `zSig' into an
2fe8fb19SBen Grasextended double-precision floating-point value, returning the result.
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen Gras*/
2fe8fb19SBen GrasINLINE floatx80 packFloatx80( flag zSign, int32 zExp, bits64 zSig )
2fe8fb19SBen Gras{
2fe8fb19SBen Gras    floatx80 z;
2fe8fb19SBen Gras
2fe8fb19SBen Gras    z.low = zSig;
2fe8fb19SBen Gras    z.high = ( ( (bits16) zSign )<<15 ) + zExp;
2fe8fb19SBen Gras    return z;
2fe8fb19SBen Gras
2fe8fb19SBen Gras}
2fe8fb19SBen Gras
2fe8fb19SBen Gras/*
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen GrasTakes an abstract floating-point value having sign `zSign', exponent `zExp',
2fe8fb19SBen Grasand extended significand formed by the concatenation of `zSig0' and `zSig1',
2fe8fb19SBen Grasand returns the proper extended double-precision floating-point value
2fe8fb19SBen Grascorresponding to the abstract input.  Ordinarily, the abstract value is
2fe8fb19SBen Grasrounded and packed into the extended double-precision format, with the
2fe8fb19SBen Grasinexact exception raised if the abstract input cannot be represented
2fe8fb19SBen Grasexactly.  However, if the abstract value is too large, the overflow and
2fe8fb19SBen Grasinexact exceptions are raised and an infinity or maximal finite value is
2fe8fb19SBen Grasreturned.  If the abstract value is too small, the input value is rounded to
2fe8fb19SBen Grasa subnormal number, and the underflow and inexact exceptions are raised if
2fe8fb19SBen Grasthe abstract input cannot be represented exactly as a subnormal extended
2fe8fb19SBen Grasdouble-precision floating-point number.
2fe8fb19SBen Gras    If `roundingPrecision' is 32 or 64, the result is rounded to the same
2fe8fb19SBen Grasnumber of bits as single or double precision, respectively.  Otherwise, the
2fe8fb19SBen Grasresult is rounded to the full precision of the extended double-precision
2fe8fb19SBen Grasformat.
2fe8fb19SBen Gras    The input significand must be normalized or smaller.  If the input
2fe8fb19SBen Grassignificand is not normalized, `zExp' must be 0; in that case, the result
2fe8fb19SBen Grasreturned is a subnormal number, and it must not require rounding.  The
2fe8fb19SBen Grashandling of underflow and overflow follows the IEC/IEEE Standard for Binary
2fe8fb19SBen GrasFloating-Point Arithmetic.
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen Gras*/
2fe8fb19SBen Grasstatic floatx80
2fe8fb19SBen Gras roundAndPackFloatx80(
2fe8fb19SBen Gras     int8 roundingPrecision, flag zSign, int32 zExp, bits64 zSig0, bits64 zSig1
2fe8fb19SBen Gras )
2fe8fb19SBen Gras{
2fe8fb19SBen Gras    int8 roundingMode;
2fe8fb19SBen Gras    flag roundNearestEven, increment, isTiny;
2fe8fb19SBen Gras    int64 roundIncrement, roundMask, roundBits;
2fe8fb19SBen Gras
2fe8fb19SBen Gras    roundingMode = float_rounding_mode;
2fe8fb19SBen Gras    roundNearestEven = ( roundingMode == float_round_nearest_even );
2fe8fb19SBen Gras    if ( roundingPrecision == 80 ) goto precision80;
2fe8fb19SBen Gras    if ( roundingPrecision == 64 ) {
2fe8fb19SBen Gras        roundIncrement = LIT64( 0x0000000000000400 );
2fe8fb19SBen Gras        roundMask = LIT64( 0x00000000000007FF );
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    else if ( roundingPrecision == 32 ) {
2fe8fb19SBen Gras        roundIncrement = LIT64( 0x0000008000000000 );
2fe8fb19SBen Gras        roundMask = LIT64( 0x000000FFFFFFFFFF );
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    else {
2fe8fb19SBen Gras        goto precision80;
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    zSig0 |= ( zSig1 != 0 );
2fe8fb19SBen Gras    if ( ! roundNearestEven ) {
2fe8fb19SBen Gras        if ( roundingMode == float_round_to_zero ) {
2fe8fb19SBen Gras            roundIncrement = 0;
2fe8fb19SBen Gras        }
2fe8fb19SBen Gras        else {
2fe8fb19SBen Gras            roundIncrement = roundMask;
2fe8fb19SBen Gras            if ( zSign ) {
2fe8fb19SBen Gras                if ( roundingMode == float_round_up ) roundIncrement = 0;
2fe8fb19SBen Gras            }
2fe8fb19SBen Gras            else {
2fe8fb19SBen Gras                if ( roundingMode == float_round_down ) roundIncrement = 0;
2fe8fb19SBen Gras            }
2fe8fb19SBen Gras        }
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    roundBits = zSig0 & roundMask;
2fe8fb19SBen Gras    if ( 0x7FFD <= (bits32) ( zExp - 1 ) ) {
2fe8fb19SBen Gras        if (    ( 0x7FFE < zExp )
2fe8fb19SBen Gras             || ( ( zExp == 0x7FFE ) && ( zSig0 + roundIncrement < zSig0 ) )
2fe8fb19SBen Gras           ) {
2fe8fb19SBen Gras            goto overflow;
2fe8fb19SBen Gras        }
2fe8fb19SBen Gras        if ( zExp <= 0 ) {
2fe8fb19SBen Gras            isTiny =
2fe8fb19SBen Gras                   ( float_detect_tininess == float_tininess_before_rounding )
2fe8fb19SBen Gras                || ( zExp < 0 )
2fe8fb19SBen Gras                || ( zSig0 <= zSig0 + roundIncrement );
2fe8fb19SBen Gras            shift64RightJamming( zSig0, 1 - zExp, &zSig0 );
2fe8fb19SBen Gras            zExp = 0;
2fe8fb19SBen Gras            roundBits = zSig0 & roundMask;
2fe8fb19SBen Gras            if ( isTiny && roundBits ) float_raise( float_flag_underflow );
*84d9c625SLionel Sambuc            if ( roundBits ) set_float_exception_inexact_flag();
2fe8fb19SBen Gras            zSig0 += roundIncrement;
2fe8fb19SBen Gras            if ( (sbits64) zSig0 < 0 ) zExp = 1;
2fe8fb19SBen Gras            roundIncrement = roundMask + 1;
2fe8fb19SBen Gras            if ( roundNearestEven && ( roundBits<<1 == roundIncrement ) ) {
2fe8fb19SBen Gras                roundMask |= roundIncrement;
2fe8fb19SBen Gras            }
2fe8fb19SBen Gras            zSig0 &= ~ roundMask;
2fe8fb19SBen Gras            return packFloatx80( zSign, zExp, zSig0 );
2fe8fb19SBen Gras        }
2fe8fb19SBen Gras    }
*84d9c625SLionel Sambuc    if ( roundBits ) set_float_exception_inexact_flag();
2fe8fb19SBen Gras    zSig0 += roundIncrement;
2fe8fb19SBen Gras    if ( zSig0 < roundIncrement ) {
2fe8fb19SBen Gras        ++zExp;
2fe8fb19SBen Gras        zSig0 = LIT64( 0x8000000000000000 );
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    roundIncrement = roundMask + 1;
2fe8fb19SBen Gras    if ( roundNearestEven && ( roundBits<<1 == roundIncrement ) ) {
2fe8fb19SBen Gras        roundMask |= roundIncrement;
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    zSig0 &= ~ roundMask;
2fe8fb19SBen Gras    if ( zSig0 == 0 ) zExp = 0;
2fe8fb19SBen Gras    return packFloatx80( zSign, zExp, zSig0 );
2fe8fb19SBen Gras precision80:
2fe8fb19SBen Gras    increment = ( (sbits64) zSig1 < 0 );
2fe8fb19SBen Gras    if ( ! roundNearestEven ) {
2fe8fb19SBen Gras        if ( roundingMode == float_round_to_zero ) {
2fe8fb19SBen Gras            increment = 0;
2fe8fb19SBen Gras        }
2fe8fb19SBen Gras        else {
2fe8fb19SBen Gras            if ( zSign ) {
2fe8fb19SBen Gras                increment = ( roundingMode == float_round_down ) && zSig1;
2fe8fb19SBen Gras            }
2fe8fb19SBen Gras            else {
2fe8fb19SBen Gras                increment = ( roundingMode == float_round_up ) && zSig1;
2fe8fb19SBen Gras            }
2fe8fb19SBen Gras        }
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    if ( 0x7FFD <= (bits32) ( zExp - 1 ) ) {
2fe8fb19SBen Gras        if (    ( 0x7FFE < zExp )
2fe8fb19SBen Gras             || (    ( zExp == 0x7FFE )
2fe8fb19SBen Gras                  && ( zSig0 == LIT64( 0xFFFFFFFFFFFFFFFF ) )
2fe8fb19SBen Gras                  && increment
2fe8fb19SBen Gras                )
2fe8fb19SBen Gras           ) {
2fe8fb19SBen Gras            roundMask = 0;
2fe8fb19SBen Gras overflow:
2fe8fb19SBen Gras            float_raise( float_flag_overflow | float_flag_inexact );
2fe8fb19SBen Gras            if (    ( roundingMode == float_round_to_zero )
2fe8fb19SBen Gras                 || ( zSign && ( roundingMode == float_round_up ) )
2fe8fb19SBen Gras                 || ( ! zSign && ( roundingMode == float_round_down ) )
2fe8fb19SBen Gras               ) {
2fe8fb19SBen Gras                return packFloatx80( zSign, 0x7FFE, ~ roundMask );
2fe8fb19SBen Gras            }
2fe8fb19SBen Gras            return packFloatx80( zSign, 0x7FFF, LIT64( 0x8000000000000000 ) );
2fe8fb19SBen Gras        }
2fe8fb19SBen Gras        if ( zExp <= 0 ) {
2fe8fb19SBen Gras            isTiny =
2fe8fb19SBen Gras                   ( float_detect_tininess == float_tininess_before_rounding )
2fe8fb19SBen Gras                || ( zExp < 0 )
2fe8fb19SBen Gras                || ! increment
2fe8fb19SBen Gras                || ( zSig0 < LIT64( 0xFFFFFFFFFFFFFFFF ) );
2fe8fb19SBen Gras            shift64ExtraRightJamming( zSig0, zSig1, 1 - zExp, &zSig0, &zSig1 );
2fe8fb19SBen Gras            zExp = 0;
2fe8fb19SBen Gras            if ( isTiny && zSig1 ) float_raise( float_flag_underflow );
*84d9c625SLionel Sambuc            if ( zSig1 ) set_float_exception_inexact_flag();
2fe8fb19SBen Gras            if ( roundNearestEven ) {
2fe8fb19SBen Gras                increment = ( (sbits64) zSig1 < 0 );
2fe8fb19SBen Gras            }
2fe8fb19SBen Gras            else {
2fe8fb19SBen Gras                if ( zSign ) {
2fe8fb19SBen Gras                    increment = ( roundingMode == float_round_down ) && zSig1;
2fe8fb19SBen Gras                }
2fe8fb19SBen Gras                else {
2fe8fb19SBen Gras                    increment = ( roundingMode == float_round_up ) && zSig1;
2fe8fb19SBen Gras                }
2fe8fb19SBen Gras            }
2fe8fb19SBen Gras            if ( increment ) {
2fe8fb19SBen Gras                ++zSig0;
2fe8fb19SBen Gras                zSig0 &=
2fe8fb19SBen Gras                    ~ ( ( (bits64) ( zSig1<<1 ) == 0 ) & roundNearestEven );
2fe8fb19SBen Gras                if ( (sbits64) zSig0 < 0 ) zExp = 1;
2fe8fb19SBen Gras            }
2fe8fb19SBen Gras            return packFloatx80( zSign, zExp, zSig0 );
2fe8fb19SBen Gras        }
2fe8fb19SBen Gras    }
*84d9c625SLionel Sambuc    if ( zSig1 ) set_float_exception_inexact_flag();
2fe8fb19SBen Gras    if ( increment ) {
2fe8fb19SBen Gras        ++zSig0;
2fe8fb19SBen Gras        if ( zSig0 == 0 ) {
2fe8fb19SBen Gras            ++zExp;
2fe8fb19SBen Gras            zSig0 = LIT64( 0x8000000000000000 );
2fe8fb19SBen Gras        }
2fe8fb19SBen Gras        else {
2fe8fb19SBen Gras            zSig0 &= ~ ( ( (bits64) ( zSig1<<1 ) == 0 ) & roundNearestEven );
2fe8fb19SBen Gras        }
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    else {
2fe8fb19SBen Gras        if ( zSig0 == 0 ) zExp = 0;
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    return packFloatx80( zSign, zExp, zSig0 );
2fe8fb19SBen Gras
2fe8fb19SBen Gras}
2fe8fb19SBen Gras
2fe8fb19SBen Gras/*
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen GrasTakes an abstract floating-point value having sign `zSign', exponent
2fe8fb19SBen Gras`zExp', and significand formed by the concatenation of `zSig0' and `zSig1',
2fe8fb19SBen Grasand returns the proper extended double-precision floating-point value
2fe8fb19SBen Grascorresponding to the abstract input.  This routine is just like
2fe8fb19SBen Gras`roundAndPackFloatx80' except that the input significand does not have to be
2fe8fb19SBen Grasnormalized.
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen Gras*/
2fe8fb19SBen Grasstatic floatx80
2fe8fb19SBen Gras normalizeRoundAndPackFloatx80(
2fe8fb19SBen Gras     int8 roundingPrecision, flag zSign, int32 zExp, bits64 zSig0, bits64 zSig1
2fe8fb19SBen Gras )
2fe8fb19SBen Gras{
2fe8fb19SBen Gras    int8 shiftCount;
2fe8fb19SBen Gras
2fe8fb19SBen Gras    if ( zSig0 == 0 ) {
2fe8fb19SBen Gras        zSig0 = zSig1;
2fe8fb19SBen Gras        zSig1 = 0;
2fe8fb19SBen Gras        zExp -= 64;
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    shiftCount = countLeadingZeros64( zSig0 );
2fe8fb19SBen Gras    shortShift128Left( zSig0, zSig1, shiftCount, &zSig0, &zSig1 );
2fe8fb19SBen Gras    zExp -= shiftCount;
2fe8fb19SBen Gras    return
2fe8fb19SBen Gras        roundAndPackFloatx80( roundingPrecision, zSign, zExp, zSig0, zSig1 );
2fe8fb19SBen Gras
2fe8fb19SBen Gras}
2fe8fb19SBen Gras
2fe8fb19SBen Gras#endif
2fe8fb19SBen Gras
2fe8fb19SBen Gras#ifdef FLOAT128
2fe8fb19SBen Gras
2fe8fb19SBen Gras/*
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen GrasReturns the least-significant 64 fraction bits of the quadruple-precision
2fe8fb19SBen Grasfloating-point value `a'.
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen Gras*/
2fe8fb19SBen GrasINLINE bits64 extractFloat128Frac1( float128 a )
2fe8fb19SBen Gras{
2fe8fb19SBen Gras
2fe8fb19SBen Gras    return a.low;
2fe8fb19SBen Gras
2fe8fb19SBen Gras}
2fe8fb19SBen Gras
2fe8fb19SBen Gras/*
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen GrasReturns the most-significant 48 fraction bits of the quadruple-precision
2fe8fb19SBen Grasfloating-point value `a'.
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen Gras*/
2fe8fb19SBen GrasINLINE bits64 extractFloat128Frac0( float128 a )
2fe8fb19SBen Gras{
2fe8fb19SBen Gras
2fe8fb19SBen Gras    return a.high & LIT64( 0x0000FFFFFFFFFFFF );
2fe8fb19SBen Gras
2fe8fb19SBen Gras}
2fe8fb19SBen Gras
2fe8fb19SBen Gras/*
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen GrasReturns the exponent bits of the quadruple-precision floating-point value
2fe8fb19SBen Gras`a'.
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen Gras*/
2fe8fb19SBen GrasINLINE int32 extractFloat128Exp( float128 a )
2fe8fb19SBen Gras{
2fe8fb19SBen Gras
f14fb602SLionel Sambuc    return (int32)((a.high >> 48) & 0x7FFF);
2fe8fb19SBen Gras
2fe8fb19SBen Gras}
2fe8fb19SBen Gras
2fe8fb19SBen Gras/*
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen GrasReturns the sign bit of the quadruple-precision floating-point value `a'.
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen Gras*/
2fe8fb19SBen GrasINLINE flag extractFloat128Sign( float128 a )
2fe8fb19SBen Gras{
2fe8fb19SBen Gras
f14fb602SLionel Sambuc    return (flag)(a.high >> 63);
2fe8fb19SBen Gras
2fe8fb19SBen Gras}
2fe8fb19SBen Gras
2fe8fb19SBen Gras/*
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen GrasNormalizes the subnormal quadruple-precision floating-point value
2fe8fb19SBen Grasrepresented by the denormalized significand formed by the concatenation of
2fe8fb19SBen Gras`aSig0' and `aSig1'.  The normalized exponent is stored at the location
2fe8fb19SBen Graspointed to by `zExpPtr'.  The most significant 49 bits of the normalized
2fe8fb19SBen Grassignificand are stored at the location pointed to by `zSig0Ptr', and the
2fe8fb19SBen Grasleast significant 64 bits of the normalized significand are stored at the
2fe8fb19SBen Graslocation pointed to by `zSig1Ptr'.
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen Gras*/
2fe8fb19SBen Grasstatic void
2fe8fb19SBen Gras normalizeFloat128Subnormal(
2fe8fb19SBen Gras     bits64 aSig0,
2fe8fb19SBen Gras     bits64 aSig1,
2fe8fb19SBen Gras     int32 *zExpPtr,
2fe8fb19SBen Gras     bits64 *zSig0Ptr,
2fe8fb19SBen Gras     bits64 *zSig1Ptr
2fe8fb19SBen Gras )
2fe8fb19SBen Gras{
2fe8fb19SBen Gras    int8 shiftCount;
2fe8fb19SBen Gras
2fe8fb19SBen Gras    if ( aSig0 == 0 ) {
2fe8fb19SBen Gras        shiftCount = countLeadingZeros64( aSig1 ) - 15;
2fe8fb19SBen Gras        if ( shiftCount < 0 ) {
2fe8fb19SBen Gras            *zSig0Ptr = aSig1>>( - shiftCount );
2fe8fb19SBen Gras            *zSig1Ptr = aSig1<<( shiftCount & 63 );
2fe8fb19SBen Gras        }
2fe8fb19SBen Gras        else {
2fe8fb19SBen Gras            *zSig0Ptr = aSig1<<shiftCount;
2fe8fb19SBen Gras            *zSig1Ptr = 0;
2fe8fb19SBen Gras        }
2fe8fb19SBen Gras        *zExpPtr = - shiftCount - 63;
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    else {
2fe8fb19SBen Gras        shiftCount = countLeadingZeros64( aSig0 ) - 15;
2fe8fb19SBen Gras        shortShift128Left( aSig0, aSig1, shiftCount, zSig0Ptr, zSig1Ptr );
2fe8fb19SBen Gras        *zExpPtr = 1 - shiftCount;
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras
2fe8fb19SBen Gras}
2fe8fb19SBen Gras
2fe8fb19SBen Gras/*
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen GrasPacks the sign `zSign', the exponent `zExp', and the significand formed
2fe8fb19SBen Grasby the concatenation of `zSig0' and `zSig1' into a quadruple-precision
2fe8fb19SBen Grasfloating-point value, returning the result.  After being shifted into the
2fe8fb19SBen Grasproper positions, the three fields `zSign', `zExp', and `zSig0' are simply
2fe8fb19SBen Grasadded together to form the most significant 32 bits of the result.  This
2fe8fb19SBen Grasmeans that any integer portion of `zSig0' will be added into the exponent.
2fe8fb19SBen GrasSince a properly normalized significand will have an integer portion equal
2fe8fb19SBen Grasto 1, the `zExp' input should be 1 less than the desired result exponent
2fe8fb19SBen Graswhenever `zSig0' and `zSig1' concatenated form a complete, normalized
2fe8fb19SBen Grassignificand.
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen Gras*/
2fe8fb19SBen GrasINLINE float128
2fe8fb19SBen Gras packFloat128( flag zSign, int32 zExp, bits64 zSig0, bits64 zSig1 )
2fe8fb19SBen Gras{
2fe8fb19SBen Gras    float128 z;
2fe8fb19SBen Gras
2fe8fb19SBen Gras    z.low = zSig1;
2fe8fb19SBen Gras    z.high = ( ( (bits64) zSign )<<63 ) + ( ( (bits64) zExp )<<48 ) + zSig0;
2fe8fb19SBen Gras    return z;
2fe8fb19SBen Gras
2fe8fb19SBen Gras}
2fe8fb19SBen Gras
2fe8fb19SBen Gras/*
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen GrasTakes an abstract floating-point value having sign `zSign', exponent `zExp',
2fe8fb19SBen Grasand extended significand formed by the concatenation of `zSig0', `zSig1',
2fe8fb19SBen Grasand `zSig2', and returns the proper quadruple-precision floating-point value
2fe8fb19SBen Grascorresponding to the abstract input.  Ordinarily, the abstract value is
2fe8fb19SBen Grassimply rounded and packed into the quadruple-precision format, with the
2fe8fb19SBen Grasinexact exception raised if the abstract input cannot be represented
2fe8fb19SBen Grasexactly.  However, if the abstract value is too large, the overflow and
2fe8fb19SBen Grasinexact exceptions are raised and an infinity or maximal finite value is
2fe8fb19SBen Grasreturned.  If the abstract value is too small, the input value is rounded to
2fe8fb19SBen Grasa subnormal number, and the underflow and inexact exceptions are raised if
2fe8fb19SBen Grasthe abstract input cannot be represented exactly as a subnormal quadruple-
2fe8fb19SBen Grasprecision floating-point number.
2fe8fb19SBen Gras    The input significand must be normalized or smaller.  If the input
2fe8fb19SBen Grassignificand is not normalized, `zExp' must be 0; in that case, the result
2fe8fb19SBen Grasreturned is a subnormal number, and it must not require rounding.  In the
2fe8fb19SBen Grasusual case that the input significand is normalized, `zExp' must be 1 less
2fe8fb19SBen Grasthan the ``true'' floating-point exponent.  The handling of underflow and
2fe8fb19SBen Grasoverflow follows the IEC/IEEE Standard for Binary Floating-Point Arithmetic.
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen Gras*/
2fe8fb19SBen Grasstatic float128
2fe8fb19SBen Gras roundAndPackFloat128(
2fe8fb19SBen Gras     flag zSign, int32 zExp, bits64 zSig0, bits64 zSig1, bits64 zSig2 )
2fe8fb19SBen Gras{
2fe8fb19SBen Gras    int8 roundingMode;
2fe8fb19SBen Gras    flag roundNearestEven, increment, isTiny;
2fe8fb19SBen Gras
2fe8fb19SBen Gras    roundingMode = float_rounding_mode;
2fe8fb19SBen Gras    roundNearestEven = ( roundingMode == float_round_nearest_even );
2fe8fb19SBen Gras    increment = ( (sbits64) zSig2 < 0 );
2fe8fb19SBen Gras    if ( ! roundNearestEven ) {
2fe8fb19SBen Gras        if ( roundingMode == float_round_to_zero ) {
2fe8fb19SBen Gras            increment = 0;
2fe8fb19SBen Gras        }
2fe8fb19SBen Gras        else {
2fe8fb19SBen Gras            if ( zSign ) {
2fe8fb19SBen Gras                increment = ( roundingMode == float_round_down ) && zSig2;
2fe8fb19SBen Gras            }
2fe8fb19SBen Gras            else {
2fe8fb19SBen Gras                increment = ( roundingMode == float_round_up ) && zSig2;
2fe8fb19SBen Gras            }
2fe8fb19SBen Gras        }
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    if ( 0x7FFD <= (bits32) zExp ) {
2fe8fb19SBen Gras        if (    ( 0x7FFD < zExp )
2fe8fb19SBen Gras             || (    ( zExp == 0x7FFD )
2fe8fb19SBen Gras                  && eq128(
2fe8fb19SBen Gras                         LIT64( 0x0001FFFFFFFFFFFF ),
2fe8fb19SBen Gras                         LIT64( 0xFFFFFFFFFFFFFFFF ),
2fe8fb19SBen Gras                         zSig0,
2fe8fb19SBen Gras                         zSig1
2fe8fb19SBen Gras                     )
2fe8fb19SBen Gras                  && increment
2fe8fb19SBen Gras                )
2fe8fb19SBen Gras           ) {
2fe8fb19SBen Gras            float_raise( float_flag_overflow | float_flag_inexact );
2fe8fb19SBen Gras            if (    ( roundingMode == float_round_to_zero )
2fe8fb19SBen Gras                 || ( zSign && ( roundingMode == float_round_up ) )
2fe8fb19SBen Gras                 || ( ! zSign && ( roundingMode == float_round_down ) )
2fe8fb19SBen Gras               ) {
2fe8fb19SBen Gras                return
2fe8fb19SBen Gras                    packFloat128(
2fe8fb19SBen Gras                        zSign,
2fe8fb19SBen Gras                        0x7FFE,
2fe8fb19SBen Gras                        LIT64( 0x0000FFFFFFFFFFFF ),
2fe8fb19SBen Gras                        LIT64( 0xFFFFFFFFFFFFFFFF )
2fe8fb19SBen Gras                    );
2fe8fb19SBen Gras            }
2fe8fb19SBen Gras            return packFloat128( zSign, 0x7FFF, 0, 0 );
2fe8fb19SBen Gras        }
2fe8fb19SBen Gras        if ( zExp < 0 ) {
2fe8fb19SBen Gras            isTiny =
2fe8fb19SBen Gras                   ( float_detect_tininess == float_tininess_before_rounding )
2fe8fb19SBen Gras                || ( zExp < -1 )
2fe8fb19SBen Gras                || ! increment
2fe8fb19SBen Gras                || lt128(
2fe8fb19SBen Gras                       zSig0,
2fe8fb19SBen Gras                       zSig1,
2fe8fb19SBen Gras                       LIT64( 0x0001FFFFFFFFFFFF ),
2fe8fb19SBen Gras                       LIT64( 0xFFFFFFFFFFFFFFFF )
2fe8fb19SBen Gras                   );
2fe8fb19SBen Gras            shift128ExtraRightJamming(
2fe8fb19SBen Gras                zSig0, zSig1, zSig2, - zExp, &zSig0, &zSig1, &zSig2 );
2fe8fb19SBen Gras            zExp = 0;
2fe8fb19SBen Gras            if ( isTiny && zSig2 ) float_raise( float_flag_underflow );
2fe8fb19SBen Gras            if ( roundNearestEven ) {
2fe8fb19SBen Gras                increment = ( (sbits64) zSig2 < 0 );
2fe8fb19SBen Gras            }
2fe8fb19SBen Gras            else {
2fe8fb19SBen Gras                if ( zSign ) {
2fe8fb19SBen Gras                    increment = ( roundingMode == float_round_down ) && zSig2;
2fe8fb19SBen Gras                }
2fe8fb19SBen Gras                else {
2fe8fb19SBen Gras                    increment = ( roundingMode == float_round_up ) && zSig2;
2fe8fb19SBen Gras                }
2fe8fb19SBen Gras            }
2fe8fb19SBen Gras        }
2fe8fb19SBen Gras    }
*84d9c625SLionel Sambuc    if ( zSig2 ) set_float_exception_inexact_flag();
2fe8fb19SBen Gras    if ( increment ) {
2fe8fb19SBen Gras        add128( zSig0, zSig1, 0, 1, &zSig0, &zSig1 );
2fe8fb19SBen Gras        zSig1 &= ~ ( ( zSig2 + zSig2 == 0 ) & roundNearestEven );
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    else {
2fe8fb19SBen Gras        if ( ( zSig0 | zSig1 ) == 0 ) zExp = 0;
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    return packFloat128( zSign, zExp, zSig0, zSig1 );
2fe8fb19SBen Gras
2fe8fb19SBen Gras}
2fe8fb19SBen Gras
2fe8fb19SBen Gras/*
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen GrasTakes an abstract floating-point value having sign `zSign', exponent `zExp',
2fe8fb19SBen Grasand significand formed by the concatenation of `zSig0' and `zSig1', and
2fe8fb19SBen Grasreturns the proper quadruple-precision floating-point value corresponding
2fe8fb19SBen Grasto the abstract input.  This routine is just like `roundAndPackFloat128'
2fe8fb19SBen Grasexcept that the input significand has fewer bits and does not have to be
2fe8fb19SBen Grasnormalized.  In all cases, `zExp' must be 1 less than the ``true'' floating-
2fe8fb19SBen Graspoint exponent.
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen Gras*/
2fe8fb19SBen Grasstatic float128
2fe8fb19SBen Gras normalizeRoundAndPackFloat128(
2fe8fb19SBen Gras     flag zSign, int32 zExp, bits64 zSig0, bits64 zSig1 )
2fe8fb19SBen Gras{
2fe8fb19SBen Gras    int8 shiftCount;
2fe8fb19SBen Gras    bits64 zSig2;
2fe8fb19SBen Gras
2fe8fb19SBen Gras    if ( zSig0 == 0 ) {
2fe8fb19SBen Gras        zSig0 = zSig1;
2fe8fb19SBen Gras        zSig1 = 0;
2fe8fb19SBen Gras        zExp -= 64;
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    shiftCount = countLeadingZeros64( zSig0 ) - 15;
2fe8fb19SBen Gras    if ( 0 <= shiftCount ) {
2fe8fb19SBen Gras        zSig2 = 0;
2fe8fb19SBen Gras        shortShift128Left( zSig0, zSig1, shiftCount, &zSig0, &zSig1 );
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    else {
2fe8fb19SBen Gras        shift128ExtraRightJamming(
2fe8fb19SBen Gras            zSig0, zSig1, 0, - shiftCount, &zSig0, &zSig1, &zSig2 );
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    zExp -= shiftCount;
2fe8fb19SBen Gras    return roundAndPackFloat128( zSign, zExp, zSig0, zSig1, zSig2 );
2fe8fb19SBen Gras
2fe8fb19SBen Gras}
2fe8fb19SBen Gras
2fe8fb19SBen Gras#endif
2fe8fb19SBen Gras
2fe8fb19SBen Gras/*
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen GrasReturns the result of converting the 32-bit two's complement integer `a'
2fe8fb19SBen Grasto the single-precision floating-point format.  The conversion is performed
2fe8fb19SBen Grasaccording to the IEC/IEEE Standard for Binary Floating-Point Arithmetic.
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen Gras*/
2fe8fb19SBen Grasfloat32 int32_to_float32( int32 a )
2fe8fb19SBen Gras{
2fe8fb19SBen Gras    flag zSign;
2fe8fb19SBen Gras
2fe8fb19SBen Gras    if ( a == 0 ) return 0;
2fe8fb19SBen Gras    if ( a == (sbits32) 0x80000000 ) return packFloat32( 1, 0x9E, 0 );
2fe8fb19SBen Gras    zSign = ( a < 0 );
f14fb602SLionel Sambuc    return normalizeRoundAndPackFloat32(zSign, 0x9C, (uint32)(zSign ? - a : a));
2fe8fb19SBen Gras
2fe8fb19SBen Gras}
2fe8fb19SBen Gras
f14fb602SLionel Sambucfloat32 uint32_to_float32( uint32 a )
f14fb602SLionel Sambuc{
f14fb602SLionel Sambuc    if ( a == 0 ) return 0;
f14fb602SLionel Sambuc    if ( a & (bits32) 0x80000000 )
f14fb602SLionel Sambuc	return normalizeRoundAndPackFloat32( 0, 0x9D, a >> 1 );
f14fb602SLionel Sambuc    return normalizeRoundAndPackFloat32( 0, 0x9C, a );
f14fb602SLionel Sambuc}
f14fb602SLionel Sambuc
f14fb602SLionel Sambuc
2fe8fb19SBen Gras/*
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen GrasReturns the result of converting the 32-bit two's complement integer `a'
2fe8fb19SBen Grasto the double-precision floating-point format.  The conversion is performed
2fe8fb19SBen Grasaccording to the IEC/IEEE Standard for Binary Floating-Point Arithmetic.
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen Gras*/
2fe8fb19SBen Grasfloat64 int32_to_float64( int32 a )
2fe8fb19SBen Gras{
2fe8fb19SBen Gras    flag zSign;
2fe8fb19SBen Gras    uint32 absA;
2fe8fb19SBen Gras    int8 shiftCount;
2fe8fb19SBen Gras    bits64 zSig;
2fe8fb19SBen Gras
2fe8fb19SBen Gras    if ( a == 0 ) return 0;
2fe8fb19SBen Gras    zSign = ( a < 0 );
2fe8fb19SBen Gras    absA = zSign ? - a : a;
2fe8fb19SBen Gras    shiftCount = countLeadingZeros32( absA ) + 21;
2fe8fb19SBen Gras    zSig = absA;
2fe8fb19SBen Gras    return packFloat64( zSign, 0x432 - shiftCount, zSig<<shiftCount );
2fe8fb19SBen Gras
2fe8fb19SBen Gras}
2fe8fb19SBen Gras
f14fb602SLionel Sambucfloat64 uint32_to_float64( uint32 a )
f14fb602SLionel Sambuc{
f14fb602SLionel Sambuc    int8 shiftCount;
f14fb602SLionel Sambuc    bits64 zSig = a;
f14fb602SLionel Sambuc
f14fb602SLionel Sambuc    if ( a == 0 ) return 0;
f14fb602SLionel Sambuc    shiftCount = countLeadingZeros32( a ) + 21;
f14fb602SLionel Sambuc    return packFloat64( 0, 0x432 - shiftCount, zSig<<shiftCount );
f14fb602SLionel Sambuc
f14fb602SLionel Sambuc}
f14fb602SLionel Sambuc
2fe8fb19SBen Gras#ifdef FLOATX80
2fe8fb19SBen Gras
2fe8fb19SBen Gras/*
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen GrasReturns the result of converting the 32-bit two's complement integer `a'
2fe8fb19SBen Grasto the extended double-precision floating-point format.  The conversion
2fe8fb19SBen Grasis performed according to the IEC/IEEE Standard for Binary Floating-Point
2fe8fb19SBen GrasArithmetic.
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen Gras*/
2fe8fb19SBen Grasfloatx80 int32_to_floatx80( int32 a )
2fe8fb19SBen Gras{
2fe8fb19SBen Gras    flag zSign;
2fe8fb19SBen Gras    uint32 absA;
2fe8fb19SBen Gras    int8 shiftCount;
2fe8fb19SBen Gras    bits64 zSig;
2fe8fb19SBen Gras
2fe8fb19SBen Gras    if ( a == 0 ) return packFloatx80( 0, 0, 0 );
2fe8fb19SBen Gras    zSign = ( a < 0 );
2fe8fb19SBen Gras    absA = zSign ? - a : a;
2fe8fb19SBen Gras    shiftCount = countLeadingZeros32( absA ) + 32;
2fe8fb19SBen Gras    zSig = absA;
2fe8fb19SBen Gras    return packFloatx80( zSign, 0x403E - shiftCount, zSig<<shiftCount );
2fe8fb19SBen Gras
2fe8fb19SBen Gras}
2fe8fb19SBen Gras
f14fb602SLionel Sambucfloatx80 uint32_to_floatx80( uint32 a )
f14fb602SLionel Sambuc{
f14fb602SLionel Sambuc    int8 shiftCount;
f14fb602SLionel Sambuc    bits64 zSig = a;
f14fb602SLionel Sambuc
f14fb602SLionel Sambuc    if ( a == 0 ) return packFloatx80( 0, 0, 0 );
f14fb602SLionel Sambuc    shiftCount = countLeadingZeros32( a ) + 32;
f14fb602SLionel Sambuc    return packFloatx80( 0, 0x403E - shiftCount, zSig<<shiftCount );
f14fb602SLionel Sambuc
f14fb602SLionel Sambuc}
f14fb602SLionel Sambuc
2fe8fb19SBen Gras#endif
2fe8fb19SBen Gras
2fe8fb19SBen Gras#ifdef FLOAT128
2fe8fb19SBen Gras
2fe8fb19SBen Gras/*
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen GrasReturns the result of converting the 32-bit two's complement integer `a' to
2fe8fb19SBen Grasthe quadruple-precision floating-point format.  The conversion is performed
2fe8fb19SBen Grasaccording to the IEC/IEEE Standard for Binary Floating-Point Arithmetic.
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen Gras*/
2fe8fb19SBen Grasfloat128 int32_to_float128( int32 a )
2fe8fb19SBen Gras{
2fe8fb19SBen Gras    flag zSign;
2fe8fb19SBen Gras    uint32 absA;
2fe8fb19SBen Gras    int8 shiftCount;
2fe8fb19SBen Gras    bits64 zSig0;
2fe8fb19SBen Gras
2fe8fb19SBen Gras    if ( a == 0 ) return packFloat128( 0, 0, 0, 0 );
2fe8fb19SBen Gras    zSign = ( a < 0 );
2fe8fb19SBen Gras    absA = zSign ? - a : a;
2fe8fb19SBen Gras    shiftCount = countLeadingZeros32( absA ) + 17;
2fe8fb19SBen Gras    zSig0 = absA;
2fe8fb19SBen Gras    return packFloat128( zSign, 0x402E - shiftCount, zSig0<<shiftCount, 0 );
2fe8fb19SBen Gras
2fe8fb19SBen Gras}
2fe8fb19SBen Gras
f14fb602SLionel Sambucfloat128 uint32_to_float128( uint32 a )
f14fb602SLionel Sambuc{
f14fb602SLionel Sambuc    int8 shiftCount;
f14fb602SLionel Sambuc    bits64 zSig0 = a;
f14fb602SLionel Sambuc
f14fb602SLionel Sambuc    if ( a == 0 ) return packFloat128( 0, 0, 0, 0 );
f14fb602SLionel Sambuc    shiftCount = countLeadingZeros32( a ) + 17;
f14fb602SLionel Sambuc    return packFloat128( 0, 0x402E - shiftCount, zSig0<<shiftCount, 0 );
f14fb602SLionel Sambuc
f14fb602SLionel Sambuc}
f14fb602SLionel Sambuc
2fe8fb19SBen Gras#endif
2fe8fb19SBen Gras
2fe8fb19SBen Gras#ifndef SOFTFLOAT_FOR_GCC /* __floatdi?f is in libgcc2.c */
2fe8fb19SBen Gras/*
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen GrasReturns the result of converting the 64-bit two's complement integer `a'
2fe8fb19SBen Grasto the single-precision floating-point format.  The conversion is performed
2fe8fb19SBen Grasaccording to the IEC/IEEE Standard for Binary Floating-Point Arithmetic.
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen Gras*/
2fe8fb19SBen Grasfloat32 int64_to_float32( int64 a )
2fe8fb19SBen Gras{
2fe8fb19SBen Gras    flag zSign;
2fe8fb19SBen Gras    uint64 absA;
2fe8fb19SBen Gras    int8 shiftCount;
2fe8fb19SBen Gras
2fe8fb19SBen Gras    if ( a == 0 ) return 0;
2fe8fb19SBen Gras    zSign = ( a < 0 );
2fe8fb19SBen Gras    absA = zSign ? - a : a;
2fe8fb19SBen Gras    shiftCount = countLeadingZeros64( absA ) - 40;
2fe8fb19SBen Gras    if ( 0 <= shiftCount ) {
2fe8fb19SBen Gras        return packFloat32( zSign, 0x95 - shiftCount, absA<<shiftCount );
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    else {
2fe8fb19SBen Gras        shiftCount += 7;
2fe8fb19SBen Gras        if ( shiftCount < 0 ) {
2fe8fb19SBen Gras            shift64RightJamming( absA, - shiftCount, &absA );
2fe8fb19SBen Gras        }
2fe8fb19SBen Gras        else {
2fe8fb19SBen Gras            absA <<= shiftCount;
2fe8fb19SBen Gras        }
2fe8fb19SBen Gras        return roundAndPackFloat32( zSign, 0x9C - shiftCount, absA );
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras
2fe8fb19SBen Gras}
2fe8fb19SBen Gras
2fe8fb19SBen Gras/*
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen GrasReturns the result of converting the 64-bit two's complement integer `a'
2fe8fb19SBen Grasto the double-precision floating-point format.  The conversion is performed
2fe8fb19SBen Grasaccording to the IEC/IEEE Standard for Binary Floating-Point Arithmetic.
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen Gras*/
2fe8fb19SBen Grasfloat64 int64_to_float64( int64 a )
2fe8fb19SBen Gras{
2fe8fb19SBen Gras    flag zSign;
2fe8fb19SBen Gras
2fe8fb19SBen Gras    if ( a == 0 ) return 0;
2fe8fb19SBen Gras    if ( a == (sbits64) LIT64( 0x8000000000000000 ) ) {
2fe8fb19SBen Gras        return packFloat64( 1, 0x43E, 0 );
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    zSign = ( a < 0 );
2fe8fb19SBen Gras    return normalizeRoundAndPackFloat64( zSign, 0x43C, zSign ? - a : a );
2fe8fb19SBen Gras
2fe8fb19SBen Gras}
2fe8fb19SBen Gras
2fe8fb19SBen Gras#ifdef FLOATX80
2fe8fb19SBen Gras
2fe8fb19SBen Gras/*
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen GrasReturns the result of converting the 64-bit two's complement integer `a'
2fe8fb19SBen Grasto the extended double-precision floating-point format.  The conversion
2fe8fb19SBen Grasis performed according to the IEC/IEEE Standard for Binary Floating-Point
2fe8fb19SBen GrasArithmetic.
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen Gras*/
2fe8fb19SBen Grasfloatx80 int64_to_floatx80( int64 a )
2fe8fb19SBen Gras{
2fe8fb19SBen Gras    flag zSign;
2fe8fb19SBen Gras    uint64 absA;
2fe8fb19SBen Gras    int8 shiftCount;
2fe8fb19SBen Gras
2fe8fb19SBen Gras    if ( a == 0 ) return packFloatx80( 0, 0, 0 );
2fe8fb19SBen Gras    zSign = ( a < 0 );
2fe8fb19SBen Gras    absA = zSign ? - a : a;
2fe8fb19SBen Gras    shiftCount = countLeadingZeros64( absA );
2fe8fb19SBen Gras    return packFloatx80( zSign, 0x403E - shiftCount, absA<<shiftCount );
2fe8fb19SBen Gras
2fe8fb19SBen Gras}
2fe8fb19SBen Gras
2fe8fb19SBen Gras#endif
2fe8fb19SBen Gras
2fe8fb19SBen Gras#endif /* !SOFTFLOAT_FOR_GCC */
2fe8fb19SBen Gras
2fe8fb19SBen Gras#ifdef FLOAT128
2fe8fb19SBen Gras
2fe8fb19SBen Gras/*
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen GrasReturns the result of converting the 64-bit two's complement integer `a' to
2fe8fb19SBen Grasthe quadruple-precision floating-point format.  The conversion is performed
2fe8fb19SBen Grasaccording to the IEC/IEEE Standard for Binary Floating-Point Arithmetic.
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen Gras*/
2fe8fb19SBen Grasfloat128 int64_to_float128( int64 a )
2fe8fb19SBen Gras{
2fe8fb19SBen Gras    flag zSign;
2fe8fb19SBen Gras    uint64 absA;
2fe8fb19SBen Gras    int8 shiftCount;
2fe8fb19SBen Gras    int32 zExp;
2fe8fb19SBen Gras    bits64 zSig0, zSig1;
2fe8fb19SBen Gras
2fe8fb19SBen Gras    if ( a == 0 ) return packFloat128( 0, 0, 0, 0 );
2fe8fb19SBen Gras    zSign = ( a < 0 );
2fe8fb19SBen Gras    absA = zSign ? - a : a;
2fe8fb19SBen Gras    shiftCount = countLeadingZeros64( absA ) + 49;
2fe8fb19SBen Gras    zExp = 0x406E - shiftCount;
2fe8fb19SBen Gras    if ( 64 <= shiftCount ) {
2fe8fb19SBen Gras        zSig1 = 0;
2fe8fb19SBen Gras        zSig0 = absA;
2fe8fb19SBen Gras        shiftCount -= 64;
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    else {
2fe8fb19SBen Gras        zSig1 = absA;
2fe8fb19SBen Gras        zSig0 = 0;
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    shortShift128Left( zSig0, zSig1, shiftCount, &zSig0, &zSig1 );
2fe8fb19SBen Gras    return packFloat128( zSign, zExp, zSig0, zSig1 );
2fe8fb19SBen Gras
2fe8fb19SBen Gras}
2fe8fb19SBen Gras
2fe8fb19SBen Gras#endif
2fe8fb19SBen Gras
2fe8fb19SBen Gras#ifndef SOFTFLOAT_FOR_GCC /* Not needed */
2fe8fb19SBen Gras/*
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen GrasReturns the result of converting the single-precision floating-point value
2fe8fb19SBen Gras`a' to the 32-bit two's complement integer format.  The conversion is
2fe8fb19SBen Grasperformed according to the IEC/IEEE Standard for Binary Floating-Point
2fe8fb19SBen GrasArithmetic---which means in particular that the conversion is rounded
2fe8fb19SBen Grasaccording to the current rounding mode.  If `a' is a NaN, the largest
2fe8fb19SBen Graspositive integer is returned.  Otherwise, if the conversion overflows, the
2fe8fb19SBen Graslargest integer with the same sign as `a' is returned.
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen Gras*/
2fe8fb19SBen Grasint32 float32_to_int32( float32 a )
2fe8fb19SBen Gras{
2fe8fb19SBen Gras    flag aSign;
2fe8fb19SBen Gras    int16 aExp, shiftCount;
2fe8fb19SBen Gras    bits32 aSig;
2fe8fb19SBen Gras    bits64 aSig64;
2fe8fb19SBen Gras
2fe8fb19SBen Gras    aSig = extractFloat32Frac( a );
2fe8fb19SBen Gras    aExp = extractFloat32Exp( a );
2fe8fb19SBen Gras    aSign = extractFloat32Sign( a );
2fe8fb19SBen Gras    if ( ( aExp == 0xFF ) && aSig ) aSign = 0;
2fe8fb19SBen Gras    if ( aExp ) aSig |= 0x00800000;
2fe8fb19SBen Gras    shiftCount = 0xAF - aExp;
2fe8fb19SBen Gras    aSig64 = aSig;
2fe8fb19SBen Gras    aSig64 <<= 32;
2fe8fb19SBen Gras    if ( 0 < shiftCount ) shift64RightJamming( aSig64, shiftCount, &aSig64 );
2fe8fb19SBen Gras    return roundAndPackInt32( aSign, aSig64 );
2fe8fb19SBen Gras
2fe8fb19SBen Gras}
2fe8fb19SBen Gras#endif /* !SOFTFLOAT_FOR_GCC */
2fe8fb19SBen Gras
2fe8fb19SBen Gras/*
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen GrasReturns the result of converting the single-precision floating-point value
2fe8fb19SBen Gras`a' to the 32-bit two's complement integer format.  The conversion is
2fe8fb19SBen Grasperformed according to the IEC/IEEE Standard for Binary Floating-Point
2fe8fb19SBen GrasArithmetic, except that the conversion is always rounded toward zero.
2fe8fb19SBen GrasIf `a' is a NaN, the largest positive integer is returned.  Otherwise, if
2fe8fb19SBen Grasthe conversion overflows, the largest integer with the same sign as `a' is
2fe8fb19SBen Grasreturned.
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen Gras*/
2fe8fb19SBen Grasint32 float32_to_int32_round_to_zero( float32 a )
2fe8fb19SBen Gras{
2fe8fb19SBen Gras    flag aSign;
2fe8fb19SBen Gras    int16 aExp, shiftCount;
2fe8fb19SBen Gras    bits32 aSig;
2fe8fb19SBen Gras    int32 z;
2fe8fb19SBen Gras
2fe8fb19SBen Gras    aSig = extractFloat32Frac( a );
2fe8fb19SBen Gras    aExp = extractFloat32Exp( a );
2fe8fb19SBen Gras    aSign = extractFloat32Sign( a );
2fe8fb19SBen Gras    shiftCount = aExp - 0x9E;
2fe8fb19SBen Gras    if ( 0 <= shiftCount ) {
2fe8fb19SBen Gras        if ( a != 0xCF000000 ) {
2fe8fb19SBen Gras            float_raise( float_flag_invalid );
2fe8fb19SBen Gras            if ( ! aSign || ( ( aExp == 0xFF ) && aSig ) ) return 0x7FFFFFFF;
2fe8fb19SBen Gras        }
2fe8fb19SBen Gras        return (sbits32) 0x80000000;
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    else if ( aExp <= 0x7E ) {
*84d9c625SLionel Sambuc        if ( aExp | aSig ) set_float_exception_inexact_flag();
2fe8fb19SBen Gras        return 0;
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    aSig = ( aSig | 0x00800000 )<<8;
2fe8fb19SBen Gras    z = aSig>>( - shiftCount );
2fe8fb19SBen Gras    if ( (bits32) ( aSig<<( shiftCount & 31 ) ) ) {
*84d9c625SLionel Sambuc        set_float_exception_inexact_flag();
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    if ( aSign ) z = - z;
2fe8fb19SBen Gras    return z;
2fe8fb19SBen Gras
2fe8fb19SBen Gras}
2fe8fb19SBen Gras
2fe8fb19SBen Gras#ifndef SOFTFLOAT_FOR_GCC /* __fix?fdi provided by libgcc2.c */
2fe8fb19SBen Gras/*
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen GrasReturns the result of converting the single-precision floating-point value
2fe8fb19SBen Gras`a' to the 64-bit two's complement integer format.  The conversion is
2fe8fb19SBen Grasperformed according to the IEC/IEEE Standard for Binary Floating-Point
2fe8fb19SBen GrasArithmetic---which means in particular that the conversion is rounded
2fe8fb19SBen Grasaccording to the current rounding mode.  If `a' is a NaN, the largest
2fe8fb19SBen Graspositive integer is returned.  Otherwise, if the conversion overflows, the
2fe8fb19SBen Graslargest integer with the same sign as `a' is returned.
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen Gras*/
2fe8fb19SBen Grasint64 float32_to_int64( float32 a )
2fe8fb19SBen Gras{
2fe8fb19SBen Gras    flag aSign;
2fe8fb19SBen Gras    int16 aExp, shiftCount;
2fe8fb19SBen Gras    bits32 aSig;
2fe8fb19SBen Gras    bits64 aSig64, aSigExtra;
2fe8fb19SBen Gras
2fe8fb19SBen Gras    aSig = extractFloat32Frac( a );
2fe8fb19SBen Gras    aExp = extractFloat32Exp( a );
2fe8fb19SBen Gras    aSign = extractFloat32Sign( a );
2fe8fb19SBen Gras    shiftCount = 0xBE - aExp;
2fe8fb19SBen Gras    if ( shiftCount < 0 ) {
2fe8fb19SBen Gras        float_raise( float_flag_invalid );
2fe8fb19SBen Gras        if ( ! aSign || ( ( aExp == 0xFF ) && aSig ) ) {
2fe8fb19SBen Gras            return LIT64( 0x7FFFFFFFFFFFFFFF );
2fe8fb19SBen Gras        }
2fe8fb19SBen Gras        return (sbits64) LIT64( 0x8000000000000000 );
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    if ( aExp ) aSig |= 0x00800000;
2fe8fb19SBen Gras    aSig64 = aSig;
2fe8fb19SBen Gras    aSig64 <<= 40;
2fe8fb19SBen Gras    shift64ExtraRightJamming( aSig64, 0, shiftCount, &aSig64, &aSigExtra );
2fe8fb19SBen Gras    return roundAndPackInt64( aSign, aSig64, aSigExtra );
2fe8fb19SBen Gras
2fe8fb19SBen Gras}
2fe8fb19SBen Gras
2fe8fb19SBen Gras/*
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen GrasReturns the result of converting the single-precision floating-point value
2fe8fb19SBen Gras`a' to the 64-bit two's complement integer format.  The conversion is
2fe8fb19SBen Grasperformed according to the IEC/IEEE Standard for Binary Floating-Point
2fe8fb19SBen GrasArithmetic, except that the conversion is always rounded toward zero.  If
2fe8fb19SBen Gras`a' is a NaN, the largest positive integer is returned.  Otherwise, if the
2fe8fb19SBen Grasconversion overflows, the largest integer with the same sign as `a' is
2fe8fb19SBen Grasreturned.
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen Gras*/
2fe8fb19SBen Grasint64 float32_to_int64_round_to_zero( float32 a )
2fe8fb19SBen Gras{
2fe8fb19SBen Gras    flag aSign;
2fe8fb19SBen Gras    int16 aExp, shiftCount;
2fe8fb19SBen Gras    bits32 aSig;
2fe8fb19SBen Gras    bits64 aSig64;
2fe8fb19SBen Gras    int64 z;
2fe8fb19SBen Gras
2fe8fb19SBen Gras    aSig = extractFloat32Frac( a );
2fe8fb19SBen Gras    aExp = extractFloat32Exp( a );
2fe8fb19SBen Gras    aSign = extractFloat32Sign( a );
2fe8fb19SBen Gras    shiftCount = aExp - 0xBE;
2fe8fb19SBen Gras    if ( 0 <= shiftCount ) {
2fe8fb19SBen Gras        if ( a != 0xDF000000 ) {
2fe8fb19SBen Gras            float_raise( float_flag_invalid );
2fe8fb19SBen Gras            if ( ! aSign || ( ( aExp == 0xFF ) && aSig ) ) {
2fe8fb19SBen Gras                return LIT64( 0x7FFFFFFFFFFFFFFF );
2fe8fb19SBen Gras            }
2fe8fb19SBen Gras        }
2fe8fb19SBen Gras        return (sbits64) LIT64( 0x8000000000000000 );
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    else if ( aExp <= 0x7E ) {
*84d9c625SLionel Sambuc        if ( aExp | aSig ) set_float_exception_inexact_flag();
2fe8fb19SBen Gras        return 0;
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    aSig64 = aSig | 0x00800000;
2fe8fb19SBen Gras    aSig64 <<= 40;
2fe8fb19SBen Gras    z = aSig64>>( - shiftCount );
2fe8fb19SBen Gras    if ( (bits64) ( aSig64<<( shiftCount & 63 ) ) ) {
*84d9c625SLionel Sambuc        set_float_exception_inexact_flag();
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    if ( aSign ) z = - z;
2fe8fb19SBen Gras    return z;
2fe8fb19SBen Gras
2fe8fb19SBen Gras}
2fe8fb19SBen Gras#endif /* !SOFTFLOAT_FOR_GCC */
2fe8fb19SBen Gras
2fe8fb19SBen Gras/*
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen GrasReturns the result of converting the single-precision floating-point value
2fe8fb19SBen Gras`a' to the double-precision floating-point format.  The conversion is
2fe8fb19SBen Grasperformed according to the IEC/IEEE Standard for Binary Floating-Point
2fe8fb19SBen GrasArithmetic.
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen Gras*/
2fe8fb19SBen Grasfloat64 float32_to_float64( float32 a )
2fe8fb19SBen Gras{
2fe8fb19SBen Gras    flag aSign;
2fe8fb19SBen Gras    int16 aExp;
2fe8fb19SBen Gras    bits32 aSig;
2fe8fb19SBen Gras
2fe8fb19SBen Gras    aSig = extractFloat32Frac( a );
2fe8fb19SBen Gras    aExp = extractFloat32Exp( a );
2fe8fb19SBen Gras    aSign = extractFloat32Sign( a );
2fe8fb19SBen Gras    if ( aExp == 0xFF ) {
2fe8fb19SBen Gras        if ( aSig ) return commonNaNToFloat64( float32ToCommonNaN( a ) );
2fe8fb19SBen Gras        return packFloat64( aSign, 0x7FF, 0 );
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    if ( aExp == 0 ) {
2fe8fb19SBen Gras        if ( aSig == 0 ) return packFloat64( aSign, 0, 0 );
2fe8fb19SBen Gras        normalizeFloat32Subnormal( aSig, &aExp, &aSig );
2fe8fb19SBen Gras        --aExp;
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    return packFloat64( aSign, aExp + 0x380, ( (bits64) aSig )<<29 );
2fe8fb19SBen Gras
2fe8fb19SBen Gras}
2fe8fb19SBen Gras
2fe8fb19SBen Gras#ifdef FLOATX80
2fe8fb19SBen Gras
2fe8fb19SBen Gras/*
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen GrasReturns the result of converting the single-precision floating-point value
2fe8fb19SBen Gras`a' to the extended double-precision floating-point format.  The conversion
2fe8fb19SBen Grasis performed according to the IEC/IEEE Standard for Binary Floating-Point
2fe8fb19SBen GrasArithmetic.
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen Gras*/
2fe8fb19SBen Grasfloatx80 float32_to_floatx80( float32 a )
2fe8fb19SBen Gras{
2fe8fb19SBen Gras    flag aSign;
2fe8fb19SBen Gras    int16 aExp;
2fe8fb19SBen Gras    bits32 aSig;
2fe8fb19SBen Gras
2fe8fb19SBen Gras    aSig = extractFloat32Frac( a );
2fe8fb19SBen Gras    aExp = extractFloat32Exp( a );
2fe8fb19SBen Gras    aSign = extractFloat32Sign( a );
2fe8fb19SBen Gras    if ( aExp == 0xFF ) {
2fe8fb19SBen Gras        if ( aSig ) return commonNaNToFloatx80( float32ToCommonNaN( a ) );
2fe8fb19SBen Gras        return packFloatx80( aSign, 0x7FFF, LIT64( 0x8000000000000000 ) );
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    if ( aExp == 0 ) {
2fe8fb19SBen Gras        if ( aSig == 0 ) return packFloatx80( aSign, 0, 0 );
2fe8fb19SBen Gras        normalizeFloat32Subnormal( aSig, &aExp, &aSig );
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    aSig |= 0x00800000;
2fe8fb19SBen Gras    return packFloatx80( aSign, aExp + 0x3F80, ( (bits64) aSig )<<40 );
2fe8fb19SBen Gras
2fe8fb19SBen Gras}
2fe8fb19SBen Gras
2fe8fb19SBen Gras#endif
2fe8fb19SBen Gras
2fe8fb19SBen Gras#ifdef FLOAT128
2fe8fb19SBen Gras
2fe8fb19SBen Gras/*
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen GrasReturns the result of converting the single-precision floating-point value
2fe8fb19SBen Gras`a' to the double-precision floating-point format.  The conversion is
2fe8fb19SBen Grasperformed according to the IEC/IEEE Standard for Binary Floating-Point
2fe8fb19SBen GrasArithmetic.
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen Gras*/
2fe8fb19SBen Grasfloat128 float32_to_float128( float32 a )
2fe8fb19SBen Gras{
2fe8fb19SBen Gras    flag aSign;
2fe8fb19SBen Gras    int16 aExp;
2fe8fb19SBen Gras    bits32 aSig;
2fe8fb19SBen Gras
2fe8fb19SBen Gras    aSig = extractFloat32Frac( a );
2fe8fb19SBen Gras    aExp = extractFloat32Exp( a );
2fe8fb19SBen Gras    aSign = extractFloat32Sign( a );
2fe8fb19SBen Gras    if ( aExp == 0xFF ) {
2fe8fb19SBen Gras        if ( aSig ) return commonNaNToFloat128( float32ToCommonNaN( a ) );
2fe8fb19SBen Gras        return packFloat128( aSign, 0x7FFF, 0, 0 );
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    if ( aExp == 0 ) {
2fe8fb19SBen Gras        if ( aSig == 0 ) return packFloat128( aSign, 0, 0, 0 );
2fe8fb19SBen Gras        normalizeFloat32Subnormal( aSig, &aExp, &aSig );
2fe8fb19SBen Gras        --aExp;
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    return packFloat128( aSign, aExp + 0x3F80, ( (bits64) aSig )<<25, 0 );
2fe8fb19SBen Gras
2fe8fb19SBen Gras}
2fe8fb19SBen Gras
2fe8fb19SBen Gras#endif
2fe8fb19SBen Gras
2fe8fb19SBen Gras#ifndef SOFTFLOAT_FOR_GCC /* Not needed */
2fe8fb19SBen Gras/*
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen GrasRounds the single-precision floating-point value `a' to an integer, and
2fe8fb19SBen Grasreturns the result as a single-precision floating-point value.  The
2fe8fb19SBen Grasoperation is performed according to the IEC/IEEE Standard for Binary
2fe8fb19SBen GrasFloating-Point Arithmetic.
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen Gras*/
2fe8fb19SBen Grasfloat32 float32_round_to_int( float32 a )
2fe8fb19SBen Gras{
2fe8fb19SBen Gras    flag aSign;
2fe8fb19SBen Gras    int16 aExp;
2fe8fb19SBen Gras    bits32 lastBitMask, roundBitsMask;
2fe8fb19SBen Gras    int8 roundingMode;
2fe8fb19SBen Gras    float32 z;
2fe8fb19SBen Gras
2fe8fb19SBen Gras    aExp = extractFloat32Exp( a );
2fe8fb19SBen Gras    if ( 0x96 <= aExp ) {
2fe8fb19SBen Gras        if ( ( aExp == 0xFF ) && extractFloat32Frac( a ) ) {
2fe8fb19SBen Gras            return propagateFloat32NaN( a, a );
2fe8fb19SBen Gras        }
2fe8fb19SBen Gras        return a;
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    if ( aExp <= 0x7E ) {
2fe8fb19SBen Gras        if ( (bits32) ( a<<1 ) == 0 ) return a;
*84d9c625SLionel Sambuc        set_float_exception_inexact_flag();
2fe8fb19SBen Gras        aSign = extractFloat32Sign( a );
2fe8fb19SBen Gras        switch ( float_rounding_mode ) {
2fe8fb19SBen Gras         case float_round_nearest_even:
2fe8fb19SBen Gras            if ( ( aExp == 0x7E ) && extractFloat32Frac( a ) ) {
2fe8fb19SBen Gras                return packFloat32( aSign, 0x7F, 0 );
2fe8fb19SBen Gras            }
2fe8fb19SBen Gras            break;
2fe8fb19SBen Gras	 case float_round_to_zero:
2fe8fb19SBen Gras	    break;
2fe8fb19SBen Gras         case float_round_down:
2fe8fb19SBen Gras            return aSign ? 0xBF800000 : 0;
2fe8fb19SBen Gras         case float_round_up:
2fe8fb19SBen Gras            return aSign ? 0x80000000 : 0x3F800000;
2fe8fb19SBen Gras        }
2fe8fb19SBen Gras        return packFloat32( aSign, 0, 0 );
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    lastBitMask = 1;
2fe8fb19SBen Gras    lastBitMask <<= 0x96 - aExp;
2fe8fb19SBen Gras    roundBitsMask = lastBitMask - 1;
2fe8fb19SBen Gras    z = a;
2fe8fb19SBen Gras    roundingMode = float_rounding_mode;
2fe8fb19SBen Gras    if ( roundingMode == float_round_nearest_even ) {
2fe8fb19SBen Gras        z += lastBitMask>>1;
2fe8fb19SBen Gras        if ( ( z & roundBitsMask ) == 0 ) z &= ~ lastBitMask;
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    else if ( roundingMode != float_round_to_zero ) {
2fe8fb19SBen Gras        if ( extractFloat32Sign( z ) ^ ( roundingMode == float_round_up ) ) {
2fe8fb19SBen Gras            z += roundBitsMask;
2fe8fb19SBen Gras        }
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    z &= ~ roundBitsMask;
*84d9c625SLionel Sambuc    if ( z != a ) set_float_exception_inexact_flag();
2fe8fb19SBen Gras    return z;
2fe8fb19SBen Gras
2fe8fb19SBen Gras}
2fe8fb19SBen Gras#endif /* !SOFTFLOAT_FOR_GCC */
2fe8fb19SBen Gras
2fe8fb19SBen Gras/*
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen GrasReturns the result of adding the absolute values of the single-precision
2fe8fb19SBen Grasfloating-point values `a' and `b'.  If `zSign' is 1, the sum is negated
2fe8fb19SBen Grasbefore being returned.  `zSign' is ignored if the result is a NaN.
2fe8fb19SBen GrasThe addition is performed according to the IEC/IEEE Standard for Binary
2fe8fb19SBen GrasFloating-Point Arithmetic.
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen Gras*/
2fe8fb19SBen Grasstatic float32 addFloat32Sigs( float32 a, float32 b, flag zSign )
2fe8fb19SBen Gras{
2fe8fb19SBen Gras    int16 aExp, bExp, zExp;
2fe8fb19SBen Gras    bits32 aSig, bSig, zSig;
2fe8fb19SBen Gras    int16 expDiff;
2fe8fb19SBen Gras
2fe8fb19SBen Gras    aSig = extractFloat32Frac( a );
2fe8fb19SBen Gras    aExp = extractFloat32Exp( a );
2fe8fb19SBen Gras    bSig = extractFloat32Frac( b );
2fe8fb19SBen Gras    bExp = extractFloat32Exp( b );
2fe8fb19SBen Gras    expDiff = aExp - bExp;
2fe8fb19SBen Gras    aSig <<= 6;
2fe8fb19SBen Gras    bSig <<= 6;
2fe8fb19SBen Gras    if ( 0 < expDiff ) {
2fe8fb19SBen Gras        if ( aExp == 0xFF ) {
2fe8fb19SBen Gras            if ( aSig ) return propagateFloat32NaN( a, b );
2fe8fb19SBen Gras            return a;
2fe8fb19SBen Gras        }
2fe8fb19SBen Gras        if ( bExp == 0 ) {
2fe8fb19SBen Gras            --expDiff;
2fe8fb19SBen Gras        }
2fe8fb19SBen Gras        else {
2fe8fb19SBen Gras            bSig |= 0x20000000;
2fe8fb19SBen Gras        }
2fe8fb19SBen Gras        shift32RightJamming( bSig, expDiff, &bSig );
2fe8fb19SBen Gras        zExp = aExp;
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    else if ( expDiff < 0 ) {
2fe8fb19SBen Gras        if ( bExp == 0xFF ) {
2fe8fb19SBen Gras            if ( bSig ) return propagateFloat32NaN( a, b );
2fe8fb19SBen Gras            return packFloat32( zSign, 0xFF, 0 );
2fe8fb19SBen Gras        }
2fe8fb19SBen Gras        if ( aExp == 0 ) {
2fe8fb19SBen Gras            ++expDiff;
2fe8fb19SBen Gras        }
2fe8fb19SBen Gras        else {
2fe8fb19SBen Gras            aSig |= 0x20000000;
2fe8fb19SBen Gras        }
2fe8fb19SBen Gras        shift32RightJamming( aSig, - expDiff, &aSig );
2fe8fb19SBen Gras        zExp = bExp;
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    else {
2fe8fb19SBen Gras        if ( aExp == 0xFF ) {
2fe8fb19SBen Gras            if ( aSig | bSig ) return propagateFloat32NaN( a, b );
2fe8fb19SBen Gras            return a;
2fe8fb19SBen Gras        }
2fe8fb19SBen Gras        if ( aExp == 0 ) return packFloat32( zSign, 0, ( aSig + bSig )>>6 );
2fe8fb19SBen Gras        zSig = 0x40000000 + aSig + bSig;
2fe8fb19SBen Gras        zExp = aExp;
2fe8fb19SBen Gras        goto roundAndPack;
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    aSig |= 0x20000000;
2fe8fb19SBen Gras    zSig = ( aSig + bSig )<<1;
2fe8fb19SBen Gras    --zExp;
2fe8fb19SBen Gras    if ( (sbits32) zSig < 0 ) {
2fe8fb19SBen Gras        zSig = aSig + bSig;
2fe8fb19SBen Gras        ++zExp;
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras roundAndPack:
2fe8fb19SBen Gras    return roundAndPackFloat32( zSign, zExp, zSig );
2fe8fb19SBen Gras
2fe8fb19SBen Gras}
2fe8fb19SBen Gras
2fe8fb19SBen Gras/*
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen GrasReturns the result of subtracting the absolute values of the single-
2fe8fb19SBen Grasprecision floating-point values `a' and `b'.  If `zSign' is 1, the
2fe8fb19SBen Grasdifference is negated before being returned.  `zSign' is ignored if the
2fe8fb19SBen Grasresult is a NaN.  The subtraction is performed according to the IEC/IEEE
2fe8fb19SBen GrasStandard for Binary Floating-Point Arithmetic.
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen Gras*/
2fe8fb19SBen Grasstatic float32 subFloat32Sigs( float32 a, float32 b, flag zSign )
2fe8fb19SBen Gras{
2fe8fb19SBen Gras    int16 aExp, bExp, zExp;
2fe8fb19SBen Gras    bits32 aSig, bSig, zSig;
2fe8fb19SBen Gras    int16 expDiff;
2fe8fb19SBen Gras
2fe8fb19SBen Gras    aSig = extractFloat32Frac( a );
2fe8fb19SBen Gras    aExp = extractFloat32Exp( a );
2fe8fb19SBen Gras    bSig = extractFloat32Frac( b );
2fe8fb19SBen Gras    bExp = extractFloat32Exp( b );
2fe8fb19SBen Gras    expDiff = aExp - bExp;
2fe8fb19SBen Gras    aSig <<= 7;
2fe8fb19SBen Gras    bSig <<= 7;
2fe8fb19SBen Gras    if ( 0 < expDiff ) goto aExpBigger;
2fe8fb19SBen Gras    if ( expDiff < 0 ) goto bExpBigger;
2fe8fb19SBen Gras    if ( aExp == 0xFF ) {
2fe8fb19SBen Gras        if ( aSig | bSig ) return propagateFloat32NaN( a, b );
2fe8fb19SBen Gras        float_raise( float_flag_invalid );
2fe8fb19SBen Gras        return float32_default_nan;
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    if ( aExp == 0 ) {
2fe8fb19SBen Gras        aExp = 1;
2fe8fb19SBen Gras        bExp = 1;
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    if ( bSig < aSig ) goto aBigger;
2fe8fb19SBen Gras    if ( aSig < bSig ) goto bBigger;
2fe8fb19SBen Gras    return packFloat32( float_rounding_mode == float_round_down, 0, 0 );
2fe8fb19SBen Gras bExpBigger:
2fe8fb19SBen Gras    if ( bExp == 0xFF ) {
2fe8fb19SBen Gras        if ( bSig ) return propagateFloat32NaN( a, b );
2fe8fb19SBen Gras        return packFloat32( zSign ^ 1, 0xFF, 0 );
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    if ( aExp == 0 ) {
2fe8fb19SBen Gras        ++expDiff;
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    else {
2fe8fb19SBen Gras        aSig |= 0x40000000;
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    shift32RightJamming( aSig, - expDiff, &aSig );
2fe8fb19SBen Gras    bSig |= 0x40000000;
2fe8fb19SBen Gras bBigger:
2fe8fb19SBen Gras    zSig = bSig - aSig;
2fe8fb19SBen Gras    zExp = bExp;
2fe8fb19SBen Gras    zSign ^= 1;
2fe8fb19SBen Gras    goto normalizeRoundAndPack;
2fe8fb19SBen Gras aExpBigger:
2fe8fb19SBen Gras    if ( aExp == 0xFF ) {
2fe8fb19SBen Gras        if ( aSig ) return propagateFloat32NaN( a, b );
2fe8fb19SBen Gras        return a;
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    if ( bExp == 0 ) {
2fe8fb19SBen Gras        --expDiff;
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    else {
2fe8fb19SBen Gras        bSig |= 0x40000000;
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    shift32RightJamming( bSig, expDiff, &bSig );
2fe8fb19SBen Gras    aSig |= 0x40000000;
2fe8fb19SBen Gras aBigger:
2fe8fb19SBen Gras    zSig = aSig - bSig;
2fe8fb19SBen Gras    zExp = aExp;
2fe8fb19SBen Gras normalizeRoundAndPack:
2fe8fb19SBen Gras    --zExp;
2fe8fb19SBen Gras    return normalizeRoundAndPackFloat32( zSign, zExp, zSig );
2fe8fb19SBen Gras
2fe8fb19SBen Gras}
2fe8fb19SBen Gras
2fe8fb19SBen Gras/*
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen GrasReturns the result of adding the single-precision floating-point values `a'
2fe8fb19SBen Grasand `b'.  The operation is performed according to the IEC/IEEE Standard for
2fe8fb19SBen GrasBinary Floating-Point Arithmetic.
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen Gras*/
2fe8fb19SBen Grasfloat32 float32_add( float32 a, float32 b )
2fe8fb19SBen Gras{
2fe8fb19SBen Gras    flag aSign, bSign;
2fe8fb19SBen Gras
2fe8fb19SBen Gras    aSign = extractFloat32Sign( a );
2fe8fb19SBen Gras    bSign = extractFloat32Sign( b );
2fe8fb19SBen Gras    if ( aSign == bSign ) {
2fe8fb19SBen Gras        return addFloat32Sigs( a, b, aSign );
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    else {
2fe8fb19SBen Gras        return subFloat32Sigs( a, b, aSign );
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras
2fe8fb19SBen Gras}
2fe8fb19SBen Gras
2fe8fb19SBen Gras/*
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen GrasReturns the result of subtracting the single-precision floating-point values
2fe8fb19SBen Gras`a' and `b'.  The operation is performed according to the IEC/IEEE Standard
2fe8fb19SBen Grasfor Binary Floating-Point Arithmetic.
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen Gras*/
2fe8fb19SBen Grasfloat32 float32_sub( float32 a, float32 b )
2fe8fb19SBen Gras{
2fe8fb19SBen Gras    flag aSign, bSign;
2fe8fb19SBen Gras
2fe8fb19SBen Gras    aSign = extractFloat32Sign( a );
2fe8fb19SBen Gras    bSign = extractFloat32Sign( b );
2fe8fb19SBen Gras    if ( aSign == bSign ) {
2fe8fb19SBen Gras        return subFloat32Sigs( a, b, aSign );
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    else {
2fe8fb19SBen Gras        return addFloat32Sigs( a, b, aSign );
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras
2fe8fb19SBen Gras}
2fe8fb19SBen Gras
2fe8fb19SBen Gras/*
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen GrasReturns the result of multiplying the single-precision floating-point values
2fe8fb19SBen Gras`a' and `b'.  The operation is performed according to the IEC/IEEE Standard
2fe8fb19SBen Grasfor Binary Floating-Point Arithmetic.
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen Gras*/
2fe8fb19SBen Grasfloat32 float32_mul( float32 a, float32 b )
2fe8fb19SBen Gras{
2fe8fb19SBen Gras    flag aSign, bSign, zSign;
2fe8fb19SBen Gras    int16 aExp, bExp, zExp;
2fe8fb19SBen Gras    bits32 aSig, bSig;
2fe8fb19SBen Gras    bits64 zSig64;
2fe8fb19SBen Gras    bits32 zSig;
2fe8fb19SBen Gras
2fe8fb19SBen Gras    aSig = extractFloat32Frac( a );
2fe8fb19SBen Gras    aExp = extractFloat32Exp( a );
2fe8fb19SBen Gras    aSign = extractFloat32Sign( a );
2fe8fb19SBen Gras    bSig = extractFloat32Frac( b );
2fe8fb19SBen Gras    bExp = extractFloat32Exp( b );
2fe8fb19SBen Gras    bSign = extractFloat32Sign( b );
2fe8fb19SBen Gras    zSign = aSign ^ bSign;
2fe8fb19SBen Gras    if ( aExp == 0xFF ) {
2fe8fb19SBen Gras        if ( aSig || ( ( bExp == 0xFF ) && bSig ) ) {
2fe8fb19SBen Gras            return propagateFloat32NaN( a, b );
2fe8fb19SBen Gras        }
2fe8fb19SBen Gras        if ( ( bExp | bSig ) == 0 ) {
2fe8fb19SBen Gras            float_raise( float_flag_invalid );
2fe8fb19SBen Gras            return float32_default_nan;
2fe8fb19SBen Gras        }
2fe8fb19SBen Gras        return packFloat32( zSign, 0xFF, 0 );
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    if ( bExp == 0xFF ) {
2fe8fb19SBen Gras        if ( bSig ) return propagateFloat32NaN( a, b );
2fe8fb19SBen Gras        if ( ( aExp | aSig ) == 0 ) {
2fe8fb19SBen Gras            float_raise( float_flag_invalid );
2fe8fb19SBen Gras            return float32_default_nan;
2fe8fb19SBen Gras        }
2fe8fb19SBen Gras        return packFloat32( zSign, 0xFF, 0 );
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    if ( aExp == 0 ) {
2fe8fb19SBen Gras        if ( aSig == 0 ) return packFloat32( zSign, 0, 0 );
2fe8fb19SBen Gras        normalizeFloat32Subnormal( aSig, &aExp, &aSig );
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    if ( bExp == 0 ) {
2fe8fb19SBen Gras        if ( bSig == 0 ) return packFloat32( zSign, 0, 0 );
2fe8fb19SBen Gras        normalizeFloat32Subnormal( bSig, &bExp, &bSig );
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    zExp = aExp + bExp - 0x7F;
2fe8fb19SBen Gras    aSig = ( aSig | 0x00800000 )<<7;
2fe8fb19SBen Gras    bSig = ( bSig | 0x00800000 )<<8;
2fe8fb19SBen Gras    shift64RightJamming( ( (bits64) aSig ) * bSig, 32, &zSig64 );
f14fb602SLionel Sambuc    zSig = (bits32)zSig64;
2fe8fb19SBen Gras    if ( 0 <= (sbits32) ( zSig<<1 ) ) {
2fe8fb19SBen Gras        zSig <<= 1;
2fe8fb19SBen Gras        --zExp;
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    return roundAndPackFloat32( zSign, zExp, zSig );
2fe8fb19SBen Gras
2fe8fb19SBen Gras}
2fe8fb19SBen Gras
2fe8fb19SBen Gras/*
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen GrasReturns the result of dividing the single-precision floating-point value `a'
2fe8fb19SBen Grasby the corresponding value `b'.  The operation is performed according to the
2fe8fb19SBen GrasIEC/IEEE Standard for Binary Floating-Point Arithmetic.
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen Gras*/
2fe8fb19SBen Grasfloat32 float32_div( float32 a, float32 b )
2fe8fb19SBen Gras{
2fe8fb19SBen Gras    flag aSign, bSign, zSign;
2fe8fb19SBen Gras    int16 aExp, bExp, zExp;
2fe8fb19SBen Gras    bits32 aSig, bSig, zSig;
2fe8fb19SBen Gras
2fe8fb19SBen Gras    aSig = extractFloat32Frac( a );
2fe8fb19SBen Gras    aExp = extractFloat32Exp( a );
2fe8fb19SBen Gras    aSign = extractFloat32Sign( a );
2fe8fb19SBen Gras    bSig = extractFloat32Frac( b );
2fe8fb19SBen Gras    bExp = extractFloat32Exp( b );
2fe8fb19SBen Gras    bSign = extractFloat32Sign( b );
2fe8fb19SBen Gras    zSign = aSign ^ bSign;
2fe8fb19SBen Gras    if ( aExp == 0xFF ) {
2fe8fb19SBen Gras        if ( aSig ) return propagateFloat32NaN( a, b );
2fe8fb19SBen Gras        if ( bExp == 0xFF ) {
2fe8fb19SBen Gras            if ( bSig ) return propagateFloat32NaN( a, b );
2fe8fb19SBen Gras            float_raise( float_flag_invalid );
2fe8fb19SBen Gras            return float32_default_nan;
2fe8fb19SBen Gras        }
2fe8fb19SBen Gras        return packFloat32( zSign, 0xFF, 0 );
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    if ( bExp == 0xFF ) {
2fe8fb19SBen Gras        if ( bSig ) return propagateFloat32NaN( a, b );
2fe8fb19SBen Gras        return packFloat32( zSign, 0, 0 );
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    if ( bExp == 0 ) {
2fe8fb19SBen Gras        if ( bSig == 0 ) {
2fe8fb19SBen Gras            if ( ( aExp | aSig ) == 0 ) {
2fe8fb19SBen Gras                float_raise( float_flag_invalid );
2fe8fb19SBen Gras                return float32_default_nan;
2fe8fb19SBen Gras            }
2fe8fb19SBen Gras            float_raise( float_flag_divbyzero );
2fe8fb19SBen Gras            return packFloat32( zSign, 0xFF, 0 );
2fe8fb19SBen Gras        }
2fe8fb19SBen Gras        normalizeFloat32Subnormal( bSig, &bExp, &bSig );
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    if ( aExp == 0 ) {
2fe8fb19SBen Gras        if ( aSig == 0 ) return packFloat32( zSign, 0, 0 );
2fe8fb19SBen Gras        normalizeFloat32Subnormal( aSig, &aExp, &aSig );
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    zExp = aExp - bExp + 0x7D;
2fe8fb19SBen Gras    aSig = ( aSig | 0x00800000 )<<7;
2fe8fb19SBen Gras    bSig = ( bSig | 0x00800000 )<<8;
2fe8fb19SBen Gras    if ( bSig <= ( aSig + aSig ) ) {
2fe8fb19SBen Gras        aSig >>= 1;
2fe8fb19SBen Gras        ++zExp;
2fe8fb19SBen Gras    }
f14fb602SLionel Sambuc    zSig = (bits32)((((bits64) aSig) << 32) / bSig);
2fe8fb19SBen Gras    if ( ( zSig & 0x3F ) == 0 ) {
2fe8fb19SBen Gras        zSig |= ( (bits64) bSig * zSig != ( (bits64) aSig )<<32 );
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    return roundAndPackFloat32( zSign, zExp, zSig );
2fe8fb19SBen Gras
2fe8fb19SBen Gras}
2fe8fb19SBen Gras
2fe8fb19SBen Gras#ifndef SOFTFLOAT_FOR_GCC /* Not needed */
2fe8fb19SBen Gras/*
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen GrasReturns the remainder of the single-precision floating-point value `a'
2fe8fb19SBen Graswith respect to the corresponding value `b'.  The operation is performed
2fe8fb19SBen Grasaccording to the IEC/IEEE Standard for Binary Floating-Point Arithmetic.
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen Gras*/
2fe8fb19SBen Grasfloat32 float32_rem( float32 a, float32 b )
2fe8fb19SBen Gras{
2fe8fb19SBen Gras    flag aSign, bSign, zSign;
2fe8fb19SBen Gras    int16 aExp, bExp, expDiff;
2fe8fb19SBen Gras    bits32 aSig, bSig;
2fe8fb19SBen Gras    bits32 q;
2fe8fb19SBen Gras    bits64 aSig64, bSig64, q64;
2fe8fb19SBen Gras    bits32 alternateASig;
2fe8fb19SBen Gras    sbits32 sigMean;
2fe8fb19SBen Gras
2fe8fb19SBen Gras    aSig = extractFloat32Frac( a );
2fe8fb19SBen Gras    aExp = extractFloat32Exp( a );
2fe8fb19SBen Gras    aSign = extractFloat32Sign( a );
2fe8fb19SBen Gras    bSig = extractFloat32Frac( b );
2fe8fb19SBen Gras    bExp = extractFloat32Exp( b );
2fe8fb19SBen Gras    bSign = extractFloat32Sign( b );
2fe8fb19SBen Gras    if ( aExp == 0xFF ) {
2fe8fb19SBen Gras        if ( aSig || ( ( bExp == 0xFF ) && bSig ) ) {
2fe8fb19SBen Gras            return propagateFloat32NaN( a, b );
2fe8fb19SBen Gras        }
2fe8fb19SBen Gras        float_raise( float_flag_invalid );
2fe8fb19SBen Gras        return float32_default_nan;
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    if ( bExp == 0xFF ) {
2fe8fb19SBen Gras        if ( bSig ) return propagateFloat32NaN( a, b );
2fe8fb19SBen Gras        return a;
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    if ( bExp == 0 ) {
2fe8fb19SBen Gras        if ( bSig == 0 ) {
2fe8fb19SBen Gras            float_raise( float_flag_invalid );
2fe8fb19SBen Gras            return float32_default_nan;
2fe8fb19SBen Gras        }
2fe8fb19SBen Gras        normalizeFloat32Subnormal( bSig, &bExp, &bSig );
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    if ( aExp == 0 ) {
2fe8fb19SBen Gras        if ( aSig == 0 ) return a;
2fe8fb19SBen Gras        normalizeFloat32Subnormal( aSig, &aExp, &aSig );
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    expDiff = aExp - bExp;
2fe8fb19SBen Gras    aSig |= 0x00800000;
2fe8fb19SBen Gras    bSig |= 0x00800000;
2fe8fb19SBen Gras    if ( expDiff < 32 ) {
2fe8fb19SBen Gras        aSig <<= 8;
2fe8fb19SBen Gras        bSig <<= 8;
2fe8fb19SBen Gras        if ( expDiff < 0 ) {
2fe8fb19SBen Gras            if ( expDiff < -1 ) return a;
2fe8fb19SBen Gras            aSig >>= 1;
2fe8fb19SBen Gras        }
2fe8fb19SBen Gras        q = ( bSig <= aSig );
2fe8fb19SBen Gras        if ( q ) aSig -= bSig;
2fe8fb19SBen Gras        if ( 0 < expDiff ) {
2fe8fb19SBen Gras            q = ( ( (bits64) aSig )<<32 ) / bSig;
2fe8fb19SBen Gras            q >>= 32 - expDiff;
2fe8fb19SBen Gras            bSig >>= 2;
2fe8fb19SBen Gras            aSig = ( ( aSig>>1 )<<( expDiff - 1 ) ) - bSig * q;
2fe8fb19SBen Gras        }
2fe8fb19SBen Gras        else {
2fe8fb19SBen Gras            aSig >>= 2;
2fe8fb19SBen Gras            bSig >>= 2;
2fe8fb19SBen Gras        }
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    else {
2fe8fb19SBen Gras        if ( bSig <= aSig ) aSig -= bSig;
2fe8fb19SBen Gras        aSig64 = ( (bits64) aSig )<<40;
2fe8fb19SBen Gras        bSig64 = ( (bits64) bSig )<<40;
2fe8fb19SBen Gras        expDiff -= 64;
2fe8fb19SBen Gras        while ( 0 < expDiff ) {
2fe8fb19SBen Gras            q64 = estimateDiv128To64( aSig64, 0, bSig64 );
2fe8fb19SBen Gras            q64 = ( 2 < q64 ) ? q64 - 2 : 0;
2fe8fb19SBen Gras            aSig64 = - ( ( bSig * q64 )<<38 );
2fe8fb19SBen Gras            expDiff -= 62;
2fe8fb19SBen Gras        }
2fe8fb19SBen Gras        expDiff += 64;
2fe8fb19SBen Gras        q64 = estimateDiv128To64( aSig64, 0, bSig64 );
2fe8fb19SBen Gras        q64 = ( 2 < q64 ) ? q64 - 2 : 0;
2fe8fb19SBen Gras        q = q64>>( 64 - expDiff );
2fe8fb19SBen Gras        bSig <<= 6;
2fe8fb19SBen Gras        aSig = ( ( aSig64>>33 )<<( expDiff - 1 ) ) - bSig * q;
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    do {
2fe8fb19SBen Gras        alternateASig = aSig;
2fe8fb19SBen Gras        ++q;
2fe8fb19SBen Gras        aSig -= bSig;
2fe8fb19SBen Gras    } while ( 0 <= (sbits32) aSig );
2fe8fb19SBen Gras    sigMean = aSig + alternateASig;
2fe8fb19SBen Gras    if ( ( sigMean < 0 ) || ( ( sigMean == 0 ) && ( q & 1 ) ) ) {
2fe8fb19SBen Gras        aSig = alternateASig;
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    zSign = ( (sbits32) aSig < 0 );
2fe8fb19SBen Gras    if ( zSign ) aSig = - aSig;
2fe8fb19SBen Gras    return normalizeRoundAndPackFloat32( aSign ^ zSign, bExp, aSig );
2fe8fb19SBen Gras
2fe8fb19SBen Gras}
2fe8fb19SBen Gras#endif /* !SOFTFLOAT_FOR_GCC */
2fe8fb19SBen Gras
2fe8fb19SBen Gras#ifndef SOFTFLOAT_FOR_GCC /* Not needed */
2fe8fb19SBen Gras/*
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen GrasReturns the square root of the single-precision floating-point value `a'.
2fe8fb19SBen GrasThe operation is performed according to the IEC/IEEE Standard for Binary
2fe8fb19SBen GrasFloating-Point Arithmetic.
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen Gras*/
2fe8fb19SBen Grasfloat32 float32_sqrt( float32 a )
2fe8fb19SBen Gras{
2fe8fb19SBen Gras    flag aSign;
2fe8fb19SBen Gras    int16 aExp, zExp;
2fe8fb19SBen Gras    bits32 aSig, zSig;
2fe8fb19SBen Gras    bits64 rem, term;
2fe8fb19SBen Gras
2fe8fb19SBen Gras    aSig = extractFloat32Frac( a );
2fe8fb19SBen Gras    aExp = extractFloat32Exp( a );
2fe8fb19SBen Gras    aSign = extractFloat32Sign( a );
2fe8fb19SBen Gras    if ( aExp == 0xFF ) {
2fe8fb19SBen Gras        if ( aSig ) return propagateFloat32NaN( a, 0 );
2fe8fb19SBen Gras        if ( ! aSign ) return a;
2fe8fb19SBen Gras        float_raise( float_flag_invalid );
2fe8fb19SBen Gras        return float32_default_nan;
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    if ( aSign ) {
2fe8fb19SBen Gras        if ( ( aExp | aSig ) == 0 ) return a;
2fe8fb19SBen Gras        float_raise( float_flag_invalid );
2fe8fb19SBen Gras        return float32_default_nan;
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    if ( aExp == 0 ) {
2fe8fb19SBen Gras        if ( aSig == 0 ) return 0;
2fe8fb19SBen Gras        normalizeFloat32Subnormal( aSig, &aExp, &aSig );
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    zExp = ( ( aExp - 0x7F )>>1 ) + 0x7E;
2fe8fb19SBen Gras    aSig = ( aSig | 0x00800000 )<<8;
2fe8fb19SBen Gras    zSig = estimateSqrt32( aExp, aSig ) + 2;
2fe8fb19SBen Gras    if ( ( zSig & 0x7F ) <= 5 ) {
2fe8fb19SBen Gras        if ( zSig < 2 ) {
2fe8fb19SBen Gras            zSig = 0x7FFFFFFF;
2fe8fb19SBen Gras            goto roundAndPack;
2fe8fb19SBen Gras        }
2fe8fb19SBen Gras        aSig >>= aExp & 1;
2fe8fb19SBen Gras        term = ( (bits64) zSig ) * zSig;
2fe8fb19SBen Gras        rem = ( ( (bits64) aSig )<<32 ) - term;
2fe8fb19SBen Gras        while ( (sbits64) rem < 0 ) {
2fe8fb19SBen Gras            --zSig;
2fe8fb19SBen Gras            rem += ( ( (bits64) zSig )<<1 ) | 1;
2fe8fb19SBen Gras        }
2fe8fb19SBen Gras        zSig |= ( rem != 0 );
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    shift32RightJamming( zSig, 1, &zSig );
2fe8fb19SBen Gras roundAndPack:
2fe8fb19SBen Gras    return roundAndPackFloat32( 0, zExp, zSig );
2fe8fb19SBen Gras
2fe8fb19SBen Gras}
2fe8fb19SBen Gras#endif /* !SOFTFLOAT_FOR_GCC */
2fe8fb19SBen Gras
2fe8fb19SBen Gras/*
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen GrasReturns 1 if the single-precision floating-point value `a' is equal to
2fe8fb19SBen Grasthe corresponding value `b', and 0 otherwise.  The comparison is performed
2fe8fb19SBen Grasaccording to the IEC/IEEE Standard for Binary Floating-Point Arithmetic.
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen Gras*/
2fe8fb19SBen Grasflag float32_eq( float32 a, float32 b )
2fe8fb19SBen Gras{
2fe8fb19SBen Gras
2fe8fb19SBen Gras    if (    ( ( extractFloat32Exp( a ) == 0xFF ) && extractFloat32Frac( a ) )
2fe8fb19SBen Gras         || ( ( extractFloat32Exp( b ) == 0xFF ) && extractFloat32Frac( b ) )
2fe8fb19SBen Gras       ) {
2fe8fb19SBen Gras        if ( float32_is_signaling_nan( a ) || float32_is_signaling_nan( b ) ) {
2fe8fb19SBen Gras            float_raise( float_flag_invalid );
2fe8fb19SBen Gras        }
2fe8fb19SBen Gras        return 0;
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    return ( a == b ) || ( (bits32) ( ( a | b )<<1 ) == 0 );
2fe8fb19SBen Gras
2fe8fb19SBen Gras}
2fe8fb19SBen Gras
2fe8fb19SBen Gras/*
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen GrasReturns 1 if the single-precision floating-point value `a' is less than
2fe8fb19SBen Grasor equal to the corresponding value `b', and 0 otherwise.  The comparison
2fe8fb19SBen Grasis performed according to the IEC/IEEE Standard for Binary Floating-Point
2fe8fb19SBen GrasArithmetic.
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen Gras*/
2fe8fb19SBen Grasflag float32_le( float32 a, float32 b )
2fe8fb19SBen Gras{
2fe8fb19SBen Gras    flag aSign, bSign;
2fe8fb19SBen Gras
2fe8fb19SBen Gras    if (    ( ( extractFloat32Exp( a ) == 0xFF ) && extractFloat32Frac( a ) )
2fe8fb19SBen Gras         || ( ( extractFloat32Exp( b ) == 0xFF ) && extractFloat32Frac( b ) )
2fe8fb19SBen Gras       ) {
2fe8fb19SBen Gras        float_raise( float_flag_invalid );
2fe8fb19SBen Gras        return 0;
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    aSign = extractFloat32Sign( a );
2fe8fb19SBen Gras    bSign = extractFloat32Sign( b );
2fe8fb19SBen Gras    if ( aSign != bSign ) return aSign || ( (bits32) ( ( a | b )<<1 ) == 0 );
2fe8fb19SBen Gras    return ( a == b ) || ( aSign ^ ( a < b ) );
2fe8fb19SBen Gras
2fe8fb19SBen Gras}
2fe8fb19SBen Gras
2fe8fb19SBen Gras/*
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen GrasReturns 1 if the single-precision floating-point value `a' is less than
2fe8fb19SBen Grasthe corresponding value `b', and 0 otherwise.  The comparison is performed
2fe8fb19SBen Grasaccording to the IEC/IEEE Standard for Binary Floating-Point Arithmetic.
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen Gras*/
2fe8fb19SBen Grasflag float32_lt( float32 a, float32 b )
2fe8fb19SBen Gras{
2fe8fb19SBen Gras    flag aSign, bSign;
2fe8fb19SBen Gras
2fe8fb19SBen Gras    if (    ( ( extractFloat32Exp( a ) == 0xFF ) && extractFloat32Frac( a ) )
2fe8fb19SBen Gras         || ( ( extractFloat32Exp( b ) == 0xFF ) && extractFloat32Frac( b ) )
2fe8fb19SBen Gras       ) {
2fe8fb19SBen Gras        float_raise( float_flag_invalid );
2fe8fb19SBen Gras        return 0;
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    aSign = extractFloat32Sign( a );
2fe8fb19SBen Gras    bSign = extractFloat32Sign( b );
2fe8fb19SBen Gras    if ( aSign != bSign ) return aSign && ( (bits32) ( ( a | b )<<1 ) != 0 );
2fe8fb19SBen Gras    return ( a != b ) && ( aSign ^ ( a < b ) );
2fe8fb19SBen Gras
2fe8fb19SBen Gras}
2fe8fb19SBen Gras
2fe8fb19SBen Gras#ifndef SOFTFLOAT_FOR_GCC /* Not needed */
2fe8fb19SBen Gras/*
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen GrasReturns 1 if the single-precision floating-point value `a' is equal to
2fe8fb19SBen Grasthe corresponding value `b', and 0 otherwise.  The invalid exception is
2fe8fb19SBen Grasraised if either operand is a NaN.  Otherwise, the comparison is performed
2fe8fb19SBen Grasaccording to the IEC/IEEE Standard for Binary Floating-Point Arithmetic.
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen Gras*/
2fe8fb19SBen Grasflag float32_eq_signaling( float32 a, float32 b )
2fe8fb19SBen Gras{
2fe8fb19SBen Gras
2fe8fb19SBen Gras    if (    ( ( extractFloat32Exp( a ) == 0xFF ) && extractFloat32Frac( a ) )
2fe8fb19SBen Gras         || ( ( extractFloat32Exp( b ) == 0xFF ) && extractFloat32Frac( b ) )
2fe8fb19SBen Gras       ) {
2fe8fb19SBen Gras        float_raise( float_flag_invalid );
2fe8fb19SBen Gras        return 0;
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    return ( a == b ) || ( (bits32) ( ( a | b )<<1 ) == 0 );
2fe8fb19SBen Gras
2fe8fb19SBen Gras}
2fe8fb19SBen Gras
2fe8fb19SBen Gras/*
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen GrasReturns 1 if the single-precision floating-point value `a' is less than or
2fe8fb19SBen Grasequal to the corresponding value `b', and 0 otherwise.  Quiet NaNs do not
2fe8fb19SBen Grascause an exception.  Otherwise, the comparison is performed according to the
2fe8fb19SBen GrasIEC/IEEE Standard for Binary Floating-Point Arithmetic.
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen Gras*/
2fe8fb19SBen Grasflag float32_le_quiet( float32 a, float32 b )
2fe8fb19SBen Gras{
2fe8fb19SBen Gras    flag aSign, bSign;
2fe8fb19SBen Gras
2fe8fb19SBen Gras    if (    ( ( extractFloat32Exp( a ) == 0xFF ) && extractFloat32Frac( a ) )
2fe8fb19SBen Gras         || ( ( extractFloat32Exp( b ) == 0xFF ) && extractFloat32Frac( b ) )
2fe8fb19SBen Gras       ) {
2fe8fb19SBen Gras        if ( float32_is_signaling_nan( a ) || float32_is_signaling_nan( b ) ) {
2fe8fb19SBen Gras            float_raise( float_flag_invalid );
2fe8fb19SBen Gras        }
2fe8fb19SBen Gras        return 0;
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    aSign = extractFloat32Sign( a );
2fe8fb19SBen Gras    bSign = extractFloat32Sign( b );
2fe8fb19SBen Gras    if ( aSign != bSign ) return aSign || ( (bits32) ( ( a | b )<<1 ) == 0 );
2fe8fb19SBen Gras    return ( a == b ) || ( aSign ^ ( a < b ) );
2fe8fb19SBen Gras
2fe8fb19SBen Gras}
2fe8fb19SBen Gras
2fe8fb19SBen Gras/*
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen GrasReturns 1 if the single-precision floating-point value `a' is less than
2fe8fb19SBen Grasthe corresponding value `b', and 0 otherwise.  Quiet NaNs do not cause an
2fe8fb19SBen Grasexception.  Otherwise, the comparison is performed according to the IEC/IEEE
2fe8fb19SBen GrasStandard for Binary Floating-Point Arithmetic.
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen Gras*/
2fe8fb19SBen Grasflag float32_lt_quiet( float32 a, float32 b )
2fe8fb19SBen Gras{
2fe8fb19SBen Gras    flag aSign, bSign;
2fe8fb19SBen Gras
2fe8fb19SBen Gras    if (    ( ( extractFloat32Exp( a ) == 0xFF ) && extractFloat32Frac( a ) )
2fe8fb19SBen Gras         || ( ( extractFloat32Exp( b ) == 0xFF ) && extractFloat32Frac( b ) )
2fe8fb19SBen Gras       ) {
2fe8fb19SBen Gras        if ( float32_is_signaling_nan( a ) || float32_is_signaling_nan( b ) ) {
2fe8fb19SBen Gras            float_raise( float_flag_invalid );
2fe8fb19SBen Gras        }
2fe8fb19SBen Gras        return 0;
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    aSign = extractFloat32Sign( a );
2fe8fb19SBen Gras    bSign = extractFloat32Sign( b );
2fe8fb19SBen Gras    if ( aSign != bSign ) return aSign && ( (bits32) ( ( a | b )<<1 ) != 0 );
2fe8fb19SBen Gras    return ( a != b ) && ( aSign ^ ( a < b ) );
2fe8fb19SBen Gras
2fe8fb19SBen Gras}
2fe8fb19SBen Gras#endif /* !SOFTFLOAT_FOR_GCC */
2fe8fb19SBen Gras
2fe8fb19SBen Gras#ifndef SOFTFLOAT_FOR_GCC /* Not needed */
2fe8fb19SBen Gras/*
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen GrasReturns the result of converting the double-precision floating-point value
2fe8fb19SBen Gras`a' to the 32-bit two's complement integer format.  The conversion is
2fe8fb19SBen Grasperformed according to the IEC/IEEE Standard for Binary Floating-Point
2fe8fb19SBen GrasArithmetic---which means in particular that the conversion is rounded
2fe8fb19SBen Grasaccording to the current rounding mode.  If `a' is a NaN, the largest
2fe8fb19SBen Graspositive integer is returned.  Otherwise, if the conversion overflows, the
2fe8fb19SBen Graslargest integer with the same sign as `a' is returned.
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen Gras*/
2fe8fb19SBen Grasint32 float64_to_int32( float64 a )
2fe8fb19SBen Gras{
2fe8fb19SBen Gras    flag aSign;
2fe8fb19SBen Gras    int16 aExp, shiftCount;
2fe8fb19SBen Gras    bits64 aSig;
2fe8fb19SBen Gras
2fe8fb19SBen Gras    aSig = extractFloat64Frac( a );
2fe8fb19SBen Gras    aExp = extractFloat64Exp( a );
2fe8fb19SBen Gras    aSign = extractFloat64Sign( a );
2fe8fb19SBen Gras    if ( ( aExp == 0x7FF ) && aSig ) aSign = 0;
2fe8fb19SBen Gras    if ( aExp ) aSig |= LIT64( 0x0010000000000000 );
2fe8fb19SBen Gras    shiftCount = 0x42C - aExp;
2fe8fb19SBen Gras    if ( 0 < shiftCount ) shift64RightJamming( aSig, shiftCount, &aSig );
2fe8fb19SBen Gras    return roundAndPackInt32( aSign, aSig );
2fe8fb19SBen Gras
2fe8fb19SBen Gras}
2fe8fb19SBen Gras#endif /* !SOFTFLOAT_FOR_GCC */
2fe8fb19SBen Gras
2fe8fb19SBen Gras/*
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen GrasReturns the result of converting the double-precision floating-point value
2fe8fb19SBen Gras`a' to the 32-bit two's complement integer format.  The conversion is
2fe8fb19SBen Grasperformed according to the IEC/IEEE Standard for Binary Floating-Point
2fe8fb19SBen GrasArithmetic, except that the conversion is always rounded toward zero.
2fe8fb19SBen GrasIf `a' is a NaN, the largest positive integer is returned.  Otherwise, if
2fe8fb19SBen Grasthe conversion overflows, the largest integer with the same sign as `a' is
2fe8fb19SBen Grasreturned.
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen Gras*/
2fe8fb19SBen Grasint32 float64_to_int32_round_to_zero( float64 a )
2fe8fb19SBen Gras{
2fe8fb19SBen Gras    flag aSign;
2fe8fb19SBen Gras    int16 aExp, shiftCount;
2fe8fb19SBen Gras    bits64 aSig, savedASig;
2fe8fb19SBen Gras    int32 z;
2fe8fb19SBen Gras
2fe8fb19SBen Gras    aSig = extractFloat64Frac( a );
2fe8fb19SBen Gras    aExp = extractFloat64Exp( a );
2fe8fb19SBen Gras    aSign = extractFloat64Sign( a );
2fe8fb19SBen Gras    if ( 0x41E < aExp ) {
2fe8fb19SBen Gras        if ( ( aExp == 0x7FF ) && aSig ) aSign = 0;
2fe8fb19SBen Gras        goto invalid;
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    else if ( aExp < 0x3FF ) {
*84d9c625SLionel Sambuc        if ( aExp || aSig ) set_float_exception_inexact_flag();
2fe8fb19SBen Gras        return 0;
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    aSig |= LIT64( 0x0010000000000000 );
2fe8fb19SBen Gras    shiftCount = 0x433 - aExp;
2fe8fb19SBen Gras    savedASig = aSig;
2fe8fb19SBen Gras    aSig >>= shiftCount;
f14fb602SLionel Sambuc    z = (int32)aSig;
2fe8fb19SBen Gras    if ( aSign ) z = - z;
2fe8fb19SBen Gras    if ( ( z < 0 ) ^ aSign ) {
2fe8fb19SBen Gras invalid:
2fe8fb19SBen Gras        float_raise( float_flag_invalid );
2fe8fb19SBen Gras        return aSign ? (sbits32) 0x80000000 : 0x7FFFFFFF;
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    if ( ( aSig<<shiftCount ) != savedASig ) {
*84d9c625SLionel Sambuc        set_float_exception_inexact_flag();
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    return z;
2fe8fb19SBen Gras
2fe8fb19SBen Gras}
2fe8fb19SBen Gras
2fe8fb19SBen Gras#ifndef SOFTFLOAT_FOR_GCC /* Not needed */
2fe8fb19SBen Gras/*
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen GrasReturns the result of converting the double-precision floating-point value
2fe8fb19SBen Gras`a' to the 64-bit two's complement integer format.  The conversion is
2fe8fb19SBen Grasperformed according to the IEC/IEEE Standard for Binary Floating-Point
2fe8fb19SBen GrasArithmetic---which means in particular that the conversion is rounded
2fe8fb19SBen Grasaccording to the current rounding mode.  If `a' is a NaN, the largest
2fe8fb19SBen Graspositive integer is returned.  Otherwise, if the conversion overflows, the
2fe8fb19SBen Graslargest integer with the same sign as `a' is returned.
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen Gras*/
2fe8fb19SBen Grasint64 float64_to_int64( float64 a )
2fe8fb19SBen Gras{
2fe8fb19SBen Gras    flag aSign;
2fe8fb19SBen Gras    int16 aExp, shiftCount;
2fe8fb19SBen Gras    bits64 aSig, aSigExtra;
2fe8fb19SBen Gras
2fe8fb19SBen Gras    aSig = extractFloat64Frac( a );
2fe8fb19SBen Gras    aExp = extractFloat64Exp( a );
2fe8fb19SBen Gras    aSign = extractFloat64Sign( a );
2fe8fb19SBen Gras    if ( aExp ) aSig |= LIT64( 0x0010000000000000 );
2fe8fb19SBen Gras    shiftCount = 0x433 - aExp;
2fe8fb19SBen Gras    if ( shiftCount <= 0 ) {
2fe8fb19SBen Gras        if ( 0x43E < aExp ) {
2fe8fb19SBen Gras            float_raise( float_flag_invalid );
2fe8fb19SBen Gras            if (    ! aSign
2fe8fb19SBen Gras                 || (    ( aExp == 0x7FF )
2fe8fb19SBen Gras                      && ( aSig != LIT64( 0x0010000000000000 ) ) )
2fe8fb19SBen Gras               ) {
2fe8fb19SBen Gras                return LIT64( 0x7FFFFFFFFFFFFFFF );
2fe8fb19SBen Gras            }
2fe8fb19SBen Gras            return (sbits64) LIT64( 0x8000000000000000 );
2fe8fb19SBen Gras        }
2fe8fb19SBen Gras        aSigExtra = 0;
2fe8fb19SBen Gras        aSig <<= - shiftCount;
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    else {
2fe8fb19SBen Gras        shift64ExtraRightJamming( aSig, 0, shiftCount, &aSig, &aSigExtra );
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    return roundAndPackInt64( aSign, aSig, aSigExtra );
2fe8fb19SBen Gras
2fe8fb19SBen Gras}
2fe8fb19SBen Gras
2fe8fb19SBen Gras/*
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen GrasReturns the result of converting the double-precision floating-point value
2fe8fb19SBen Gras`a' to the 64-bit two's complement integer format.  The conversion is
2fe8fb19SBen Grasperformed according to the IEC/IEEE Standard for Binary Floating-Point
2fe8fb19SBen GrasArithmetic, except that the conversion is always rounded toward zero.
2fe8fb19SBen GrasIf `a' is a NaN, the largest positive integer is returned.  Otherwise, if
2fe8fb19SBen Grasthe conversion overflows, the largest integer with the same sign as `a' is
2fe8fb19SBen Grasreturned.
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen Gras*/
2fe8fb19SBen Grasint64 float64_to_int64_round_to_zero( float64 a )
2fe8fb19SBen Gras{
2fe8fb19SBen Gras    flag aSign;
2fe8fb19SBen Gras    int16 aExp, shiftCount;
2fe8fb19SBen Gras    bits64 aSig;
2fe8fb19SBen Gras    int64 z;
2fe8fb19SBen Gras
2fe8fb19SBen Gras    aSig = extractFloat64Frac( a );
2fe8fb19SBen Gras    aExp = extractFloat64Exp( a );
2fe8fb19SBen Gras    aSign = extractFloat64Sign( a );
2fe8fb19SBen Gras    if ( aExp ) aSig |= LIT64( 0x0010000000000000 );
2fe8fb19SBen Gras    shiftCount = aExp - 0x433;
2fe8fb19SBen Gras    if ( 0 <= shiftCount ) {
2fe8fb19SBen Gras        if ( 0x43E <= aExp ) {
2fe8fb19SBen Gras            if ( a != LIT64( 0xC3E0000000000000 ) ) {
2fe8fb19SBen Gras                float_raise( float_flag_invalid );
2fe8fb19SBen Gras                if (    ! aSign
2fe8fb19SBen Gras                     || (    ( aExp == 0x7FF )
2fe8fb19SBen Gras                          && ( aSig != LIT64( 0x0010000000000000 ) ) )
2fe8fb19SBen Gras                   ) {
2fe8fb19SBen Gras                    return LIT64( 0x7FFFFFFFFFFFFFFF );
2fe8fb19SBen Gras                }
2fe8fb19SBen Gras            }
2fe8fb19SBen Gras            return (sbits64) LIT64( 0x8000000000000000 );
2fe8fb19SBen Gras        }
2fe8fb19SBen Gras        z = aSig<<shiftCount;
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    else {
2fe8fb19SBen Gras        if ( aExp < 0x3FE ) {
*84d9c625SLionel Sambuc            if ( aExp | aSig ) set_float_exception_inexact_flag();
2fe8fb19SBen Gras            return 0;
2fe8fb19SBen Gras        }
2fe8fb19SBen Gras        z = aSig>>( - shiftCount );
2fe8fb19SBen Gras        if ( (bits64) ( aSig<<( shiftCount & 63 ) ) ) {
*84d9c625SLionel Sambuc            set_float_exception_inexact_flag();
2fe8fb19SBen Gras        }
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    if ( aSign ) z = - z;
2fe8fb19SBen Gras    return z;
2fe8fb19SBen Gras
2fe8fb19SBen Gras}
2fe8fb19SBen Gras#endif /* !SOFTFLOAT_FOR_GCC */
2fe8fb19SBen Gras
2fe8fb19SBen Gras/*
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen GrasReturns the result of converting the double-precision floating-point value
2fe8fb19SBen Gras`a' to the single-precision floating-point format.  The conversion is
2fe8fb19SBen Grasperformed according to the IEC/IEEE Standard for Binary Floating-Point
2fe8fb19SBen GrasArithmetic.
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen Gras*/
2fe8fb19SBen Grasfloat32 float64_to_float32( float64 a )
2fe8fb19SBen Gras{
2fe8fb19SBen Gras    flag aSign;
2fe8fb19SBen Gras    int16 aExp;
2fe8fb19SBen Gras    bits64 aSig;
2fe8fb19SBen Gras    bits32 zSig;
2fe8fb19SBen Gras
2fe8fb19SBen Gras    aSig = extractFloat64Frac( a );
2fe8fb19SBen Gras    aExp = extractFloat64Exp( a );
2fe8fb19SBen Gras    aSign = extractFloat64Sign( a );
2fe8fb19SBen Gras    if ( aExp == 0x7FF ) {
2fe8fb19SBen Gras        if ( aSig ) return commonNaNToFloat32( float64ToCommonNaN( a ) );
2fe8fb19SBen Gras        return packFloat32( aSign, 0xFF, 0 );
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    shift64RightJamming( aSig, 22, &aSig );
f14fb602SLionel Sambuc    zSig = (bits32)aSig;
2fe8fb19SBen Gras    if ( aExp || zSig ) {
2fe8fb19SBen Gras        zSig |= 0x40000000;
2fe8fb19SBen Gras        aExp -= 0x381;
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    return roundAndPackFloat32( aSign, aExp, zSig );
2fe8fb19SBen Gras
2fe8fb19SBen Gras}
2fe8fb19SBen Gras
2fe8fb19SBen Gras#ifdef FLOATX80
2fe8fb19SBen Gras
2fe8fb19SBen Gras/*
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen GrasReturns the result of converting the double-precision floating-point value
2fe8fb19SBen Gras`a' to the extended double-precision floating-point format.  The conversion
2fe8fb19SBen Grasis performed according to the IEC/IEEE Standard for Binary Floating-Point
2fe8fb19SBen GrasArithmetic.
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen Gras*/
2fe8fb19SBen Grasfloatx80 float64_to_floatx80( float64 a )
2fe8fb19SBen Gras{
2fe8fb19SBen Gras    flag aSign;
2fe8fb19SBen Gras    int16 aExp;
2fe8fb19SBen Gras    bits64 aSig;
2fe8fb19SBen Gras
2fe8fb19SBen Gras    aSig = extractFloat64Frac( a );
2fe8fb19SBen Gras    aExp = extractFloat64Exp( a );
2fe8fb19SBen Gras    aSign = extractFloat64Sign( a );
2fe8fb19SBen Gras    if ( aExp == 0x7FF ) {
2fe8fb19SBen Gras        if ( aSig ) return commonNaNToFloatx80( float64ToCommonNaN( a ) );
2fe8fb19SBen Gras        return packFloatx80( aSign, 0x7FFF, LIT64( 0x8000000000000000 ) );
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    if ( aExp == 0 ) {
2fe8fb19SBen Gras        if ( aSig == 0 ) return packFloatx80( aSign, 0, 0 );
2fe8fb19SBen Gras        normalizeFloat64Subnormal( aSig, &aExp, &aSig );
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    return
2fe8fb19SBen Gras        packFloatx80(
2fe8fb19SBen Gras            aSign, aExp + 0x3C00, ( aSig | LIT64( 0x0010000000000000 ) )<<11 );
2fe8fb19SBen Gras
2fe8fb19SBen Gras}
2fe8fb19SBen Gras
2fe8fb19SBen Gras#endif
2fe8fb19SBen Gras
2fe8fb19SBen Gras#ifdef FLOAT128
2fe8fb19SBen Gras
2fe8fb19SBen Gras/*
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen GrasReturns the result of converting the double-precision floating-point value
2fe8fb19SBen Gras`a' to the quadruple-precision floating-point format.  The conversion is
2fe8fb19SBen Grasperformed according to the IEC/IEEE Standard for Binary Floating-Point
2fe8fb19SBen GrasArithmetic.
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen Gras*/
2fe8fb19SBen Grasfloat128 float64_to_float128( float64 a )
2fe8fb19SBen Gras{
2fe8fb19SBen Gras    flag aSign;
2fe8fb19SBen Gras    int16 aExp;
2fe8fb19SBen Gras    bits64 aSig, zSig0, zSig1;
2fe8fb19SBen Gras
2fe8fb19SBen Gras    aSig = extractFloat64Frac( a );
2fe8fb19SBen Gras    aExp = extractFloat64Exp( a );
2fe8fb19SBen Gras    aSign = extractFloat64Sign( a );
2fe8fb19SBen Gras    if ( aExp == 0x7FF ) {
2fe8fb19SBen Gras        if ( aSig ) return commonNaNToFloat128( float64ToCommonNaN( a ) );
2fe8fb19SBen Gras        return packFloat128( aSign, 0x7FFF, 0, 0 );
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    if ( aExp == 0 ) {
2fe8fb19SBen Gras        if ( aSig == 0 ) return packFloat128( aSign, 0, 0, 0 );
2fe8fb19SBen Gras        normalizeFloat64Subnormal( aSig, &aExp, &aSig );
2fe8fb19SBen Gras        --aExp;
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    shift128Right( aSig, 0, 4, &zSig0, &zSig1 );
2fe8fb19SBen Gras    return packFloat128( aSign, aExp + 0x3C00, zSig0, zSig1 );
2fe8fb19SBen Gras
2fe8fb19SBen Gras}
2fe8fb19SBen Gras
2fe8fb19SBen Gras#endif
2fe8fb19SBen Gras
2fe8fb19SBen Gras#ifndef SOFTFLOAT_FOR_GCC
2fe8fb19SBen Gras/*
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen GrasRounds the double-precision floating-point value `a' to an integer, and
2fe8fb19SBen Grasreturns the result as a double-precision floating-point value.  The
2fe8fb19SBen Grasoperation is performed according to the IEC/IEEE Standard for Binary
2fe8fb19SBen GrasFloating-Point Arithmetic.
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen Gras*/
2fe8fb19SBen Grasfloat64 float64_round_to_int( float64 a )
2fe8fb19SBen Gras{
2fe8fb19SBen Gras    flag aSign;
2fe8fb19SBen Gras    int16 aExp;
2fe8fb19SBen Gras    bits64 lastBitMask, roundBitsMask;
2fe8fb19SBen Gras    int8 roundingMode;
2fe8fb19SBen Gras    float64 z;
2fe8fb19SBen Gras
2fe8fb19SBen Gras    aExp = extractFloat64Exp( a );
2fe8fb19SBen Gras    if ( 0x433 <= aExp ) {
2fe8fb19SBen Gras        if ( ( aExp == 0x7FF ) && extractFloat64Frac( a ) ) {
2fe8fb19SBen Gras            return propagateFloat64NaN( a, a );
2fe8fb19SBen Gras        }
2fe8fb19SBen Gras        return a;
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    if ( aExp < 0x3FF ) {
2fe8fb19SBen Gras        if ( (bits64) ( a<<1 ) == 0 ) return a;
*84d9c625SLionel Sambuc        set_float_exception_inexact_flag();
2fe8fb19SBen Gras        aSign = extractFloat64Sign( a );
2fe8fb19SBen Gras        switch ( float_rounding_mode ) {
2fe8fb19SBen Gras         case float_round_nearest_even:
2fe8fb19SBen Gras            if ( ( aExp == 0x3FE ) && extractFloat64Frac( a ) ) {
2fe8fb19SBen Gras                return packFloat64( aSign, 0x3FF, 0 );
2fe8fb19SBen Gras            }
2fe8fb19SBen Gras            break;
2fe8fb19SBen Gras	 case float_round_to_zero:
2fe8fb19SBen Gras	    break;
2fe8fb19SBen Gras         case float_round_down:
2fe8fb19SBen Gras            return aSign ? LIT64( 0xBFF0000000000000 ) : 0;
2fe8fb19SBen Gras         case float_round_up:
2fe8fb19SBen Gras            return
2fe8fb19SBen Gras            aSign ? LIT64( 0x8000000000000000 ) : LIT64( 0x3FF0000000000000 );
2fe8fb19SBen Gras        }
2fe8fb19SBen Gras        return packFloat64( aSign, 0, 0 );
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    lastBitMask = 1;
2fe8fb19SBen Gras    lastBitMask <<= 0x433 - aExp;
2fe8fb19SBen Gras    roundBitsMask = lastBitMask - 1;
2fe8fb19SBen Gras    z = a;
2fe8fb19SBen Gras    roundingMode = float_rounding_mode;
2fe8fb19SBen Gras    if ( roundingMode == float_round_nearest_even ) {
2fe8fb19SBen Gras        z += lastBitMask>>1;
2fe8fb19SBen Gras        if ( ( z & roundBitsMask ) == 0 ) z &= ~ lastBitMask;
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    else if ( roundingMode != float_round_to_zero ) {
2fe8fb19SBen Gras        if ( extractFloat64Sign( z ) ^ ( roundingMode == float_round_up ) ) {
2fe8fb19SBen Gras            z += roundBitsMask;
2fe8fb19SBen Gras        }
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    z &= ~ roundBitsMask;
*84d9c625SLionel Sambuc    if ( z != a ) set_float_exception_inexact_flag();
2fe8fb19SBen Gras    return z;
2fe8fb19SBen Gras
2fe8fb19SBen Gras}
2fe8fb19SBen Gras#endif
2fe8fb19SBen Gras
2fe8fb19SBen Gras/*
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen GrasReturns the result of adding the absolute values of the double-precision
2fe8fb19SBen Grasfloating-point values `a' and `b'.  If `zSign' is 1, the sum is negated
2fe8fb19SBen Grasbefore being returned.  `zSign' is ignored if the result is a NaN.
2fe8fb19SBen GrasThe addition is performed according to the IEC/IEEE Standard for Binary
2fe8fb19SBen GrasFloating-Point Arithmetic.
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen Gras*/
2fe8fb19SBen Grasstatic float64 addFloat64Sigs( float64 a, float64 b, flag zSign )
2fe8fb19SBen Gras{
2fe8fb19SBen Gras    int16 aExp, bExp, zExp;
2fe8fb19SBen Gras    bits64 aSig, bSig, zSig;
2fe8fb19SBen Gras    int16 expDiff;
2fe8fb19SBen Gras
2fe8fb19SBen Gras    aSig = extractFloat64Frac( a );
2fe8fb19SBen Gras    aExp = extractFloat64Exp( a );
2fe8fb19SBen Gras    bSig = extractFloat64Frac( b );
2fe8fb19SBen Gras    bExp = extractFloat64Exp( b );
2fe8fb19SBen Gras    expDiff = aExp - bExp;
2fe8fb19SBen Gras    aSig <<= 9;
2fe8fb19SBen Gras    bSig <<= 9;
2fe8fb19SBen Gras    if ( 0 < expDiff ) {
2fe8fb19SBen Gras        if ( aExp == 0x7FF ) {
2fe8fb19SBen Gras            if ( aSig ) return propagateFloat64NaN( a, b );
2fe8fb19SBen Gras            return a;
2fe8fb19SBen Gras        }
2fe8fb19SBen Gras        if ( bExp == 0 ) {
2fe8fb19SBen Gras            --expDiff;
2fe8fb19SBen Gras        }
2fe8fb19SBen Gras        else {
2fe8fb19SBen Gras            bSig |= LIT64( 0x2000000000000000 );
2fe8fb19SBen Gras        }
2fe8fb19SBen Gras        shift64RightJamming( bSig, expDiff, &bSig );
2fe8fb19SBen Gras        zExp = aExp;
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    else if ( expDiff < 0 ) {
2fe8fb19SBen Gras        if ( bExp == 0x7FF ) {
2fe8fb19SBen Gras            if ( bSig ) return propagateFloat64NaN( a, b );
2fe8fb19SBen Gras            return packFloat64( zSign, 0x7FF, 0 );
2fe8fb19SBen Gras        }
2fe8fb19SBen Gras        if ( aExp == 0 ) {
2fe8fb19SBen Gras            ++expDiff;
2fe8fb19SBen Gras        }
2fe8fb19SBen Gras        else {
2fe8fb19SBen Gras            aSig |= LIT64( 0x2000000000000000 );
2fe8fb19SBen Gras        }
2fe8fb19SBen Gras        shift64RightJamming( aSig, - expDiff, &aSig );
2fe8fb19SBen Gras        zExp = bExp;
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    else {
2fe8fb19SBen Gras        if ( aExp == 0x7FF ) {
2fe8fb19SBen Gras            if ( aSig | bSig ) return propagateFloat64NaN( a, b );
2fe8fb19SBen Gras            return a;
2fe8fb19SBen Gras        }
2fe8fb19SBen Gras        if ( aExp == 0 ) return packFloat64( zSign, 0, ( aSig + bSig )>>9 );
2fe8fb19SBen Gras        zSig = LIT64( 0x4000000000000000 ) + aSig + bSig;
2fe8fb19SBen Gras        zExp = aExp;
2fe8fb19SBen Gras        goto roundAndPack;
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    aSig |= LIT64( 0x2000000000000000 );
2fe8fb19SBen Gras    zSig = ( aSig + bSig )<<1;
2fe8fb19SBen Gras    --zExp;
2fe8fb19SBen Gras    if ( (sbits64) zSig < 0 ) {
2fe8fb19SBen Gras        zSig = aSig + bSig;
2fe8fb19SBen Gras        ++zExp;
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras roundAndPack:
2fe8fb19SBen Gras    return roundAndPackFloat64( zSign, zExp, zSig );
2fe8fb19SBen Gras
2fe8fb19SBen Gras}
2fe8fb19SBen Gras
2fe8fb19SBen Gras/*
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen GrasReturns the result of subtracting the absolute values of the double-
2fe8fb19SBen Grasprecision floating-point values `a' and `b'.  If `zSign' is 1, the
2fe8fb19SBen Grasdifference is negated before being returned.  `zSign' is ignored if the
2fe8fb19SBen Grasresult is a NaN.  The subtraction is performed according to the IEC/IEEE
2fe8fb19SBen GrasStandard for Binary Floating-Point Arithmetic.
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen Gras*/
2fe8fb19SBen Grasstatic float64 subFloat64Sigs( float64 a, float64 b, flag zSign )
2fe8fb19SBen Gras{
2fe8fb19SBen Gras    int16 aExp, bExp, zExp;
2fe8fb19SBen Gras    bits64 aSig, bSig, zSig;
2fe8fb19SBen Gras    int16 expDiff;
2fe8fb19SBen Gras
2fe8fb19SBen Gras    aSig = extractFloat64Frac( a );
2fe8fb19SBen Gras    aExp = extractFloat64Exp( a );
2fe8fb19SBen Gras    bSig = extractFloat64Frac( b );
2fe8fb19SBen Gras    bExp = extractFloat64Exp( b );
2fe8fb19SBen Gras    expDiff = aExp - bExp;
2fe8fb19SBen Gras    aSig <<= 10;
2fe8fb19SBen Gras    bSig <<= 10;
2fe8fb19SBen Gras    if ( 0 < expDiff ) goto aExpBigger;
2fe8fb19SBen Gras    if ( expDiff < 0 ) goto bExpBigger;
2fe8fb19SBen Gras    if ( aExp == 0x7FF ) {
2fe8fb19SBen Gras        if ( aSig | bSig ) return propagateFloat64NaN( a, b );
2fe8fb19SBen Gras        float_raise( float_flag_invalid );
2fe8fb19SBen Gras        return float64_default_nan;
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    if ( aExp == 0 ) {
2fe8fb19SBen Gras        aExp = 1;
2fe8fb19SBen Gras        bExp = 1;
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    if ( bSig < aSig ) goto aBigger;
2fe8fb19SBen Gras    if ( aSig < bSig ) goto bBigger;
2fe8fb19SBen Gras    return packFloat64( float_rounding_mode == float_round_down, 0, 0 );
2fe8fb19SBen Gras bExpBigger:
2fe8fb19SBen Gras    if ( bExp == 0x7FF ) {
2fe8fb19SBen Gras        if ( bSig ) return propagateFloat64NaN( a, b );
2fe8fb19SBen Gras        return packFloat64( zSign ^ 1, 0x7FF, 0 );
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    if ( aExp == 0 ) {
2fe8fb19SBen Gras        ++expDiff;
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    else {
2fe8fb19SBen Gras        aSig |= LIT64( 0x4000000000000000 );
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    shift64RightJamming( aSig, - expDiff, &aSig );
2fe8fb19SBen Gras    bSig |= LIT64( 0x4000000000000000 );
2fe8fb19SBen Gras bBigger:
2fe8fb19SBen Gras    zSig = bSig - aSig;
2fe8fb19SBen Gras    zExp = bExp;
2fe8fb19SBen Gras    zSign ^= 1;
2fe8fb19SBen Gras    goto normalizeRoundAndPack;
2fe8fb19SBen Gras aExpBigger:
2fe8fb19SBen Gras    if ( aExp == 0x7FF ) {
2fe8fb19SBen Gras        if ( aSig ) return propagateFloat64NaN( a, b );
2fe8fb19SBen Gras        return a;
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    if ( bExp == 0 ) {
2fe8fb19SBen Gras        --expDiff;
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    else {
2fe8fb19SBen Gras        bSig |= LIT64( 0x4000000000000000 );
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    shift64RightJamming( bSig, expDiff, &bSig );
2fe8fb19SBen Gras    aSig |= LIT64( 0x4000000000000000 );
2fe8fb19SBen Gras aBigger:
2fe8fb19SBen Gras    zSig = aSig - bSig;
2fe8fb19SBen Gras    zExp = aExp;
2fe8fb19SBen Gras normalizeRoundAndPack:
2fe8fb19SBen Gras    --zExp;
2fe8fb19SBen Gras    return normalizeRoundAndPackFloat64( zSign, zExp, zSig );
2fe8fb19SBen Gras
2fe8fb19SBen Gras}
2fe8fb19SBen Gras
2fe8fb19SBen Gras/*
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen GrasReturns the result of adding the double-precision floating-point values `a'
2fe8fb19SBen Grasand `b'.  The operation is performed according to the IEC/IEEE Standard for
2fe8fb19SBen GrasBinary Floating-Point Arithmetic.
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen Gras*/
2fe8fb19SBen Grasfloat64 float64_add( float64 a, float64 b )
2fe8fb19SBen Gras{
2fe8fb19SBen Gras    flag aSign, bSign;
2fe8fb19SBen Gras
2fe8fb19SBen Gras    aSign = extractFloat64Sign( a );
2fe8fb19SBen Gras    bSign = extractFloat64Sign( b );
2fe8fb19SBen Gras    if ( aSign == bSign ) {
2fe8fb19SBen Gras        return addFloat64Sigs( a, b, aSign );
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    else {
2fe8fb19SBen Gras        return subFloat64Sigs( a, b, aSign );
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras
2fe8fb19SBen Gras}
2fe8fb19SBen Gras
2fe8fb19SBen Gras/*
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen GrasReturns the result of subtracting the double-precision floating-point values
2fe8fb19SBen Gras`a' and `b'.  The operation is performed according to the IEC/IEEE Standard
2fe8fb19SBen Grasfor Binary Floating-Point Arithmetic.
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen Gras*/
2fe8fb19SBen Grasfloat64 float64_sub( float64 a, float64 b )
2fe8fb19SBen Gras{
2fe8fb19SBen Gras    flag aSign, bSign;
2fe8fb19SBen Gras
2fe8fb19SBen Gras    aSign = extractFloat64Sign( a );
2fe8fb19SBen Gras    bSign = extractFloat64Sign( b );
2fe8fb19SBen Gras    if ( aSign == bSign ) {
2fe8fb19SBen Gras        return subFloat64Sigs( a, b, aSign );
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    else {
2fe8fb19SBen Gras        return addFloat64Sigs( a, b, aSign );
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras
2fe8fb19SBen Gras}
2fe8fb19SBen Gras
2fe8fb19SBen Gras/*
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen GrasReturns the result of multiplying the double-precision floating-point values
2fe8fb19SBen Gras`a' and `b'.  The operation is performed according to the IEC/IEEE Standard
2fe8fb19SBen Grasfor Binary Floating-Point Arithmetic.
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen Gras*/
2fe8fb19SBen Grasfloat64 float64_mul( float64 a, float64 b )
2fe8fb19SBen Gras{
2fe8fb19SBen Gras    flag aSign, bSign, zSign;
2fe8fb19SBen Gras    int16 aExp, bExp, zExp;
2fe8fb19SBen Gras    bits64 aSig, bSig, zSig0, zSig1;
2fe8fb19SBen Gras
2fe8fb19SBen Gras    aSig = extractFloat64Frac( a );
2fe8fb19SBen Gras    aExp = extractFloat64Exp( a );
2fe8fb19SBen Gras    aSign = extractFloat64Sign( a );
2fe8fb19SBen Gras    bSig = extractFloat64Frac( b );
2fe8fb19SBen Gras    bExp = extractFloat64Exp( b );
2fe8fb19SBen Gras    bSign = extractFloat64Sign( b );
2fe8fb19SBen Gras    zSign = aSign ^ bSign;
2fe8fb19SBen Gras    if ( aExp == 0x7FF ) {
2fe8fb19SBen Gras        if ( aSig || ( ( bExp == 0x7FF ) && bSig ) ) {
2fe8fb19SBen Gras            return propagateFloat64NaN( a, b );
2fe8fb19SBen Gras        }
2fe8fb19SBen Gras        if ( ( bExp | bSig ) == 0 ) {
2fe8fb19SBen Gras            float_raise( float_flag_invalid );
2fe8fb19SBen Gras            return float64_default_nan;
2fe8fb19SBen Gras        }
2fe8fb19SBen Gras        return packFloat64( zSign, 0x7FF, 0 );
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    if ( bExp == 0x7FF ) {
2fe8fb19SBen Gras        if ( bSig ) return propagateFloat64NaN( a, b );
2fe8fb19SBen Gras        if ( ( aExp | aSig ) == 0 ) {
2fe8fb19SBen Gras            float_raise( float_flag_invalid );
2fe8fb19SBen Gras            return float64_default_nan;
2fe8fb19SBen Gras        }
2fe8fb19SBen Gras        return packFloat64( zSign, 0x7FF, 0 );
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    if ( aExp == 0 ) {
2fe8fb19SBen Gras        if ( aSig == 0 ) return packFloat64( zSign, 0, 0 );
2fe8fb19SBen Gras        normalizeFloat64Subnormal( aSig, &aExp, &aSig );
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    if ( bExp == 0 ) {
2fe8fb19SBen Gras        if ( bSig == 0 ) return packFloat64( zSign, 0, 0 );
2fe8fb19SBen Gras        normalizeFloat64Subnormal( bSig, &bExp, &bSig );
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    zExp = aExp + bExp - 0x3FF;
2fe8fb19SBen Gras    aSig = ( aSig | LIT64( 0x0010000000000000 ) )<<10;
2fe8fb19SBen Gras    bSig = ( bSig | LIT64( 0x0010000000000000 ) )<<11;
2fe8fb19SBen Gras    mul64To128( aSig, bSig, &zSig0, &zSig1 );
2fe8fb19SBen Gras    zSig0 |= ( zSig1 != 0 );
2fe8fb19SBen Gras    if ( 0 <= (sbits64) ( zSig0<<1 ) ) {
2fe8fb19SBen Gras        zSig0 <<= 1;
2fe8fb19SBen Gras        --zExp;
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    return roundAndPackFloat64( zSign, zExp, zSig0 );
2fe8fb19SBen Gras
2fe8fb19SBen Gras}
2fe8fb19SBen Gras
2fe8fb19SBen Gras/*
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen GrasReturns the result of dividing the double-precision floating-point value `a'
2fe8fb19SBen Grasby the corresponding value `b'.  The operation is performed according to
2fe8fb19SBen Grasthe IEC/IEEE Standard for Binary Floating-Point Arithmetic.
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen Gras*/
2fe8fb19SBen Grasfloat64 float64_div( float64 a, float64 b )
2fe8fb19SBen Gras{
2fe8fb19SBen Gras    flag aSign, bSign, zSign;
2fe8fb19SBen Gras    int16 aExp, bExp, zExp;
2fe8fb19SBen Gras    bits64 aSig, bSig, zSig;
2fe8fb19SBen Gras    bits64 rem0, rem1;
2fe8fb19SBen Gras    bits64 term0, term1;
2fe8fb19SBen Gras
2fe8fb19SBen Gras    aSig = extractFloat64Frac( a );
2fe8fb19SBen Gras    aExp = extractFloat64Exp( a );
2fe8fb19SBen Gras    aSign = extractFloat64Sign( a );
2fe8fb19SBen Gras    bSig = extractFloat64Frac( b );
2fe8fb19SBen Gras    bExp = extractFloat64Exp( b );
2fe8fb19SBen Gras    bSign = extractFloat64Sign( b );
2fe8fb19SBen Gras    zSign = aSign ^ bSign;
2fe8fb19SBen Gras    if ( aExp == 0x7FF ) {
2fe8fb19SBen Gras        if ( aSig ) return propagateFloat64NaN( a, b );
2fe8fb19SBen Gras        if ( bExp == 0x7FF ) {
2fe8fb19SBen Gras            if ( bSig ) return propagateFloat64NaN( a, b );
2fe8fb19SBen Gras            float_raise( float_flag_invalid );
2fe8fb19SBen Gras            return float64_default_nan;
2fe8fb19SBen Gras        }
2fe8fb19SBen Gras        return packFloat64( zSign, 0x7FF, 0 );
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    if ( bExp == 0x7FF ) {
2fe8fb19SBen Gras        if ( bSig ) return propagateFloat64NaN( a, b );
2fe8fb19SBen Gras        return packFloat64( zSign, 0, 0 );
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    if ( bExp == 0 ) {
2fe8fb19SBen Gras        if ( bSig == 0 ) {
2fe8fb19SBen Gras            if ( ( aExp | aSig ) == 0 ) {
2fe8fb19SBen Gras                float_raise( float_flag_invalid );
2fe8fb19SBen Gras                return float64_default_nan;
2fe8fb19SBen Gras            }
2fe8fb19SBen Gras            float_raise( float_flag_divbyzero );
2fe8fb19SBen Gras            return packFloat64( zSign, 0x7FF, 0 );
2fe8fb19SBen Gras        }
2fe8fb19SBen Gras        normalizeFloat64Subnormal( bSig, &bExp, &bSig );
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    if ( aExp == 0 ) {
2fe8fb19SBen Gras        if ( aSig == 0 ) return packFloat64( zSign, 0, 0 );
2fe8fb19SBen Gras        normalizeFloat64Subnormal( aSig, &aExp, &aSig );
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    zExp = aExp - bExp + 0x3FD;
2fe8fb19SBen Gras    aSig = ( aSig | LIT64( 0x0010000000000000 ) )<<10;
2fe8fb19SBen Gras    bSig = ( bSig | LIT64( 0x0010000000000000 ) )<<11;
2fe8fb19SBen Gras    if ( bSig <= ( aSig + aSig ) ) {
2fe8fb19SBen Gras        aSig >>= 1;
2fe8fb19SBen Gras        ++zExp;
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    zSig = estimateDiv128To64( aSig, 0, bSig );
2fe8fb19SBen Gras    if ( ( zSig & 0x1FF ) <= 2 ) {
2fe8fb19SBen Gras        mul64To128( bSig, zSig, &term0, &term1 );
2fe8fb19SBen Gras        sub128( aSig, 0, term0, term1, &rem0, &rem1 );
2fe8fb19SBen Gras        while ( (sbits64) rem0 < 0 ) {
2fe8fb19SBen Gras            --zSig;
2fe8fb19SBen Gras            add128( rem0, rem1, 0, bSig, &rem0, &rem1 );
2fe8fb19SBen Gras        }
2fe8fb19SBen Gras        zSig |= ( rem1 != 0 );
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    return roundAndPackFloat64( zSign, zExp, zSig );
2fe8fb19SBen Gras
2fe8fb19SBen Gras}
2fe8fb19SBen Gras
2fe8fb19SBen Gras#ifndef SOFTFLOAT_FOR_GCC
2fe8fb19SBen Gras/*
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen GrasReturns the remainder of the double-precision floating-point value `a'
2fe8fb19SBen Graswith respect to the corresponding value `b'.  The operation is performed
2fe8fb19SBen Grasaccording to the IEC/IEEE Standard for Binary Floating-Point Arithmetic.
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen Gras*/
2fe8fb19SBen Grasfloat64 float64_rem( float64 a, float64 b )
2fe8fb19SBen Gras{
2fe8fb19SBen Gras    flag aSign, bSign, zSign;
2fe8fb19SBen Gras    int16 aExp, bExp, expDiff;
2fe8fb19SBen Gras    bits64 aSig, bSig;
2fe8fb19SBen Gras    bits64 q, alternateASig;
2fe8fb19SBen Gras    sbits64 sigMean;
2fe8fb19SBen Gras
2fe8fb19SBen Gras    aSig = extractFloat64Frac( a );
2fe8fb19SBen Gras    aExp = extractFloat64Exp( a );
2fe8fb19SBen Gras    aSign = extractFloat64Sign( a );
2fe8fb19SBen Gras    bSig = extractFloat64Frac( b );
2fe8fb19SBen Gras    bExp = extractFloat64Exp( b );
2fe8fb19SBen Gras    bSign = extractFloat64Sign( b );
2fe8fb19SBen Gras    if ( aExp == 0x7FF ) {
2fe8fb19SBen Gras        if ( aSig || ( ( bExp == 0x7FF ) && bSig ) ) {
2fe8fb19SBen Gras            return propagateFloat64NaN( a, b );
2fe8fb19SBen Gras        }
2fe8fb19SBen Gras        float_raise( float_flag_invalid );
2fe8fb19SBen Gras        return float64_default_nan;
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    if ( bExp == 0x7FF ) {
2fe8fb19SBen Gras        if ( bSig ) return propagateFloat64NaN( a, b );
2fe8fb19SBen Gras        return a;
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    if ( bExp == 0 ) {
2fe8fb19SBen Gras        if ( bSig == 0 ) {
2fe8fb19SBen Gras            float_raise( float_flag_invalid );
2fe8fb19SBen Gras            return float64_default_nan;
2fe8fb19SBen Gras        }
2fe8fb19SBen Gras        normalizeFloat64Subnormal( bSig, &bExp, &bSig );
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    if ( aExp == 0 ) {
2fe8fb19SBen Gras        if ( aSig == 0 ) return a;
2fe8fb19SBen Gras        normalizeFloat64Subnormal( aSig, &aExp, &aSig );
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    expDiff = aExp - bExp;
2fe8fb19SBen Gras    aSig = ( aSig | LIT64( 0x0010000000000000 ) )<<11;
2fe8fb19SBen Gras    bSig = ( bSig | LIT64( 0x0010000000000000 ) )<<11;
2fe8fb19SBen Gras    if ( expDiff < 0 ) {
2fe8fb19SBen Gras        if ( expDiff < -1 ) return a;
2fe8fb19SBen Gras        aSig >>= 1;
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    q = ( bSig <= aSig );
2fe8fb19SBen Gras    if ( q ) aSig -= bSig;
2fe8fb19SBen Gras    expDiff -= 64;
2fe8fb19SBen Gras    while ( 0 < expDiff ) {
2fe8fb19SBen Gras        q = estimateDiv128To64( aSig, 0, bSig );
2fe8fb19SBen Gras        q = ( 2 < q ) ? q - 2 : 0;
2fe8fb19SBen Gras        aSig = - ( ( bSig>>2 ) * q );
2fe8fb19SBen Gras        expDiff -= 62;
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    expDiff += 64;
2fe8fb19SBen Gras    if ( 0 < expDiff ) {
2fe8fb19SBen Gras        q = estimateDiv128To64( aSig, 0, bSig );
2fe8fb19SBen Gras        q = ( 2 < q ) ? q - 2 : 0;
2fe8fb19SBen Gras        q >>= 64 - expDiff;
2fe8fb19SBen Gras        bSig >>= 2;
2fe8fb19SBen Gras        aSig = ( ( aSig>>1 )<<( expDiff - 1 ) ) - bSig * q;
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    else {
2fe8fb19SBen Gras        aSig >>= 2;
2fe8fb19SBen Gras        bSig >>= 2;
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    do {
2fe8fb19SBen Gras        alternateASig = aSig;
2fe8fb19SBen Gras        ++q;
2fe8fb19SBen Gras        aSig -= bSig;
2fe8fb19SBen Gras    } while ( 0 <= (sbits64) aSig );
2fe8fb19SBen Gras    sigMean = aSig + alternateASig;
2fe8fb19SBen Gras    if ( ( sigMean < 0 ) || ( ( sigMean == 0 ) && ( q & 1 ) ) ) {
2fe8fb19SBen Gras        aSig = alternateASig;
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    zSign = ( (sbits64) aSig < 0 );
2fe8fb19SBen Gras    if ( zSign ) aSig = - aSig;
2fe8fb19SBen Gras    return normalizeRoundAndPackFloat64( aSign ^ zSign, bExp, aSig );
2fe8fb19SBen Gras
2fe8fb19SBen Gras}
2fe8fb19SBen Gras
2fe8fb19SBen Gras/*
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen GrasReturns the square root of the double-precision floating-point value `a'.
2fe8fb19SBen GrasThe operation is performed according to the IEC/IEEE Standard for Binary
2fe8fb19SBen GrasFloating-Point Arithmetic.
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen Gras*/
2fe8fb19SBen Grasfloat64 float64_sqrt( float64 a )
2fe8fb19SBen Gras{
2fe8fb19SBen Gras    flag aSign;
2fe8fb19SBen Gras    int16 aExp, zExp;
2fe8fb19SBen Gras    bits64 aSig, zSig, doubleZSig;
2fe8fb19SBen Gras    bits64 rem0, rem1, term0, term1;
2fe8fb19SBen Gras
2fe8fb19SBen Gras    aSig = extractFloat64Frac( a );
2fe8fb19SBen Gras    aExp = extractFloat64Exp( a );
2fe8fb19SBen Gras    aSign = extractFloat64Sign( a );
2fe8fb19SBen Gras    if ( aExp == 0x7FF ) {
2fe8fb19SBen Gras        if ( aSig ) return propagateFloat64NaN( a, a );
2fe8fb19SBen Gras        if ( ! aSign ) return a;
2fe8fb19SBen Gras        float_raise( float_flag_invalid );
2fe8fb19SBen Gras        return float64_default_nan;
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    if ( aSign ) {
2fe8fb19SBen Gras        if ( ( aExp | aSig ) == 0 ) return a;
2fe8fb19SBen Gras        float_raise( float_flag_invalid );
2fe8fb19SBen Gras        return float64_default_nan;
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    if ( aExp == 0 ) {
2fe8fb19SBen Gras        if ( aSig == 0 ) return 0;
2fe8fb19SBen Gras        normalizeFloat64Subnormal( aSig, &aExp, &aSig );
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    zExp = ( ( aExp - 0x3FF )>>1 ) + 0x3FE;
2fe8fb19SBen Gras    aSig |= LIT64( 0x0010000000000000 );
2fe8fb19SBen Gras    zSig = estimateSqrt32( aExp, aSig>>21 );
2fe8fb19SBen Gras    aSig <<= 9 - ( aExp & 1 );
2fe8fb19SBen Gras    zSig = estimateDiv128To64( aSig, 0, zSig<<32 ) + ( zSig<<30 );
2fe8fb19SBen Gras    if ( ( zSig & 0x1FF ) <= 5 ) {
2fe8fb19SBen Gras        doubleZSig = zSig<<1;
2fe8fb19SBen Gras        mul64To128( zSig, zSig, &term0, &term1 );
2fe8fb19SBen Gras        sub128( aSig, 0, term0, term1, &rem0, &rem1 );
2fe8fb19SBen Gras        while ( (sbits64) rem0 < 0 ) {
2fe8fb19SBen Gras            --zSig;
2fe8fb19SBen Gras            doubleZSig -= 2;
2fe8fb19SBen Gras            add128( rem0, rem1, zSig>>63, doubleZSig | 1, &rem0, &rem1 );
2fe8fb19SBen Gras        }
2fe8fb19SBen Gras        zSig |= ( ( rem0 | rem1 ) != 0 );
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    return roundAndPackFloat64( 0, zExp, zSig );
2fe8fb19SBen Gras
2fe8fb19SBen Gras}
2fe8fb19SBen Gras#endif
2fe8fb19SBen Gras
2fe8fb19SBen Gras/*
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen GrasReturns 1 if the double-precision floating-point value `a' is equal to the
2fe8fb19SBen Grascorresponding value `b', and 0 otherwise.  The comparison is performed
2fe8fb19SBen Grasaccording to the IEC/IEEE Standard for Binary Floating-Point Arithmetic.
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen Gras*/
2fe8fb19SBen Grasflag float64_eq( float64 a, float64 b )
2fe8fb19SBen Gras{
2fe8fb19SBen Gras
2fe8fb19SBen Gras    if (    ( ( extractFloat64Exp( a ) == 0x7FF ) && extractFloat64Frac( a ) )
2fe8fb19SBen Gras         || ( ( extractFloat64Exp( b ) == 0x7FF ) && extractFloat64Frac( b ) )
2fe8fb19SBen Gras       ) {
2fe8fb19SBen Gras        if ( float64_is_signaling_nan( a ) || float64_is_signaling_nan( b ) ) {
2fe8fb19SBen Gras            float_raise( float_flag_invalid );
2fe8fb19SBen Gras        }
2fe8fb19SBen Gras        return 0;
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    return ( a == b ) ||
2fe8fb19SBen Gras	( (bits64) ( ( FLOAT64_DEMANGLE(a) | FLOAT64_DEMANGLE(b) )<<1 ) == 0 );
2fe8fb19SBen Gras
2fe8fb19SBen Gras}
2fe8fb19SBen Gras
2fe8fb19SBen Gras/*
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen GrasReturns 1 if the double-precision floating-point value `a' is less than or
2fe8fb19SBen Grasequal to the corresponding value `b', and 0 otherwise.  The comparison is
2fe8fb19SBen Grasperformed according to the IEC/IEEE Standard for Binary Floating-Point
2fe8fb19SBen GrasArithmetic.
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen Gras*/
2fe8fb19SBen Grasflag float64_le( float64 a, float64 b )
2fe8fb19SBen Gras{
2fe8fb19SBen Gras    flag aSign, bSign;
2fe8fb19SBen Gras
2fe8fb19SBen Gras    if (    ( ( extractFloat64Exp( a ) == 0x7FF ) && extractFloat64Frac( a ) )
2fe8fb19SBen Gras         || ( ( extractFloat64Exp( b ) == 0x7FF ) && extractFloat64Frac( b ) )
2fe8fb19SBen Gras       ) {
2fe8fb19SBen Gras        float_raise( float_flag_invalid );
2fe8fb19SBen Gras        return 0;
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    aSign = extractFloat64Sign( a );
2fe8fb19SBen Gras    bSign = extractFloat64Sign( b );
2fe8fb19SBen Gras    if ( aSign != bSign )
2fe8fb19SBen Gras	return aSign ||
2fe8fb19SBen Gras	    ( (bits64) ( ( FLOAT64_DEMANGLE(a) | FLOAT64_DEMANGLE(b) )<<1 ) ==
2fe8fb19SBen Gras	      0 );
2fe8fb19SBen Gras    return ( a == b ) ||
2fe8fb19SBen Gras	( aSign ^ ( FLOAT64_DEMANGLE(a) < FLOAT64_DEMANGLE(b) ) );
2fe8fb19SBen Gras
2fe8fb19SBen Gras}
2fe8fb19SBen Gras
2fe8fb19SBen Gras/*
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen GrasReturns 1 if the double-precision floating-point value `a' is less than
2fe8fb19SBen Grasthe corresponding value `b', and 0 otherwise.  The comparison is performed
2fe8fb19SBen Grasaccording to the IEC/IEEE Standard for Binary Floating-Point Arithmetic.
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen Gras*/
2fe8fb19SBen Grasflag float64_lt( float64 a, float64 b )
2fe8fb19SBen Gras{
2fe8fb19SBen Gras    flag aSign, bSign;
2fe8fb19SBen Gras
2fe8fb19SBen Gras    if (    ( ( extractFloat64Exp( a ) == 0x7FF ) && extractFloat64Frac( a ) )
2fe8fb19SBen Gras         || ( ( extractFloat64Exp( b ) == 0x7FF ) && extractFloat64Frac( b ) )
2fe8fb19SBen Gras       ) {
2fe8fb19SBen Gras        float_raise( float_flag_invalid );
2fe8fb19SBen Gras        return 0;
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    aSign = extractFloat64Sign( a );
2fe8fb19SBen Gras    bSign = extractFloat64Sign( b );
2fe8fb19SBen Gras    if ( aSign != bSign )
2fe8fb19SBen Gras	return aSign &&
2fe8fb19SBen Gras	    ( (bits64) ( ( FLOAT64_DEMANGLE(a) | FLOAT64_DEMANGLE(b) )<<1 ) !=
2fe8fb19SBen Gras	      0 );
2fe8fb19SBen Gras    return ( a != b ) &&
2fe8fb19SBen Gras	( aSign ^ ( FLOAT64_DEMANGLE(a) < FLOAT64_DEMANGLE(b) ) );
2fe8fb19SBen Gras
2fe8fb19SBen Gras}
2fe8fb19SBen Gras
2fe8fb19SBen Gras#ifndef SOFTFLOAT_FOR_GCC
2fe8fb19SBen Gras/*
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen GrasReturns 1 if the double-precision floating-point value `a' is equal to the
2fe8fb19SBen Grascorresponding value `b', and 0 otherwise.  The invalid exception is raised
2fe8fb19SBen Grasif either operand is a NaN.  Otherwise, the comparison is performed
2fe8fb19SBen Grasaccording to the IEC/IEEE Standard for Binary Floating-Point Arithmetic.
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen Gras*/
2fe8fb19SBen Grasflag float64_eq_signaling( float64 a, float64 b )
2fe8fb19SBen Gras{
2fe8fb19SBen Gras
2fe8fb19SBen Gras    if (    ( ( extractFloat64Exp( a ) == 0x7FF ) && extractFloat64Frac( a ) )
2fe8fb19SBen Gras         || ( ( extractFloat64Exp( b ) == 0x7FF ) && extractFloat64Frac( b ) )
2fe8fb19SBen Gras       ) {
2fe8fb19SBen Gras        float_raise( float_flag_invalid );
2fe8fb19SBen Gras        return 0;
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    return ( a == b ) || ( (bits64) ( ( a | b )<<1 ) == 0 );
2fe8fb19SBen Gras
2fe8fb19SBen Gras}
2fe8fb19SBen Gras
2fe8fb19SBen Gras/*
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen GrasReturns 1 if the double-precision floating-point value `a' is less than or
2fe8fb19SBen Grasequal to the corresponding value `b', and 0 otherwise.  Quiet NaNs do not
2fe8fb19SBen Grascause an exception.  Otherwise, the comparison is performed according to the
2fe8fb19SBen GrasIEC/IEEE Standard for Binary Floating-Point Arithmetic.
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen Gras*/
2fe8fb19SBen Grasflag float64_le_quiet( float64 a, float64 b )
2fe8fb19SBen Gras{
2fe8fb19SBen Gras    flag aSign, bSign;
2fe8fb19SBen Gras
2fe8fb19SBen Gras    if (    ( ( extractFloat64Exp( a ) == 0x7FF ) && extractFloat64Frac( a ) )
2fe8fb19SBen Gras         || ( ( extractFloat64Exp( b ) == 0x7FF ) && extractFloat64Frac( b ) )
2fe8fb19SBen Gras       ) {
2fe8fb19SBen Gras        if ( float64_is_signaling_nan( a ) || float64_is_signaling_nan( b ) ) {
2fe8fb19SBen Gras            float_raise( float_flag_invalid );
2fe8fb19SBen Gras        }
2fe8fb19SBen Gras        return 0;
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    aSign = extractFloat64Sign( a );
2fe8fb19SBen Gras    bSign = extractFloat64Sign( b );
2fe8fb19SBen Gras    if ( aSign != bSign ) return aSign || ( (bits64) ( ( a | b )<<1 ) == 0 );
2fe8fb19SBen Gras    return ( a == b ) || ( aSign ^ ( a < b ) );
2fe8fb19SBen Gras
2fe8fb19SBen Gras}
2fe8fb19SBen Gras
2fe8fb19SBen Gras/*
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen GrasReturns 1 if the double-precision floating-point value `a' is less than
2fe8fb19SBen Grasthe corresponding value `b', and 0 otherwise.  Quiet NaNs do not cause an
2fe8fb19SBen Grasexception.  Otherwise, the comparison is performed according to the IEC/IEEE
2fe8fb19SBen GrasStandard for Binary Floating-Point Arithmetic.
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen Gras*/
2fe8fb19SBen Grasflag float64_lt_quiet( float64 a, float64 b )
2fe8fb19SBen Gras{
2fe8fb19SBen Gras    flag aSign, bSign;
2fe8fb19SBen Gras
2fe8fb19SBen Gras    if (    ( ( extractFloat64Exp( a ) == 0x7FF ) && extractFloat64Frac( a ) )
2fe8fb19SBen Gras         || ( ( extractFloat64Exp( b ) == 0x7FF ) && extractFloat64Frac( b ) )
2fe8fb19SBen Gras       ) {
2fe8fb19SBen Gras        if ( float64_is_signaling_nan( a ) || float64_is_signaling_nan( b ) ) {
2fe8fb19SBen Gras            float_raise( float_flag_invalid );
2fe8fb19SBen Gras        }
2fe8fb19SBen Gras        return 0;
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    aSign = extractFloat64Sign( a );
2fe8fb19SBen Gras    bSign = extractFloat64Sign( b );
2fe8fb19SBen Gras    if ( aSign != bSign ) return aSign && ( (bits64) ( ( a | b )<<1 ) != 0 );
2fe8fb19SBen Gras    return ( a != b ) && ( aSign ^ ( a < b ) );
2fe8fb19SBen Gras
2fe8fb19SBen Gras}
2fe8fb19SBen Gras#endif
2fe8fb19SBen Gras
2fe8fb19SBen Gras#ifdef FLOATX80
2fe8fb19SBen Gras
2fe8fb19SBen Gras/*
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen GrasReturns the result of converting the extended double-precision floating-
2fe8fb19SBen Graspoint value `a' to the 32-bit two's complement integer format.  The
2fe8fb19SBen Grasconversion is performed according to the IEC/IEEE Standard for Binary
2fe8fb19SBen GrasFloating-Point Arithmetic---which means in particular that the conversion
2fe8fb19SBen Grasis rounded according to the current rounding mode.  If `a' is a NaN, the
2fe8fb19SBen Graslargest positive integer is returned.  Otherwise, if the conversion
2fe8fb19SBen Grasoverflows, the largest integer with the same sign as `a' is returned.
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen Gras*/
2fe8fb19SBen Grasint32 floatx80_to_int32( floatx80 a )
2fe8fb19SBen Gras{
2fe8fb19SBen Gras    flag aSign;
2fe8fb19SBen Gras    int32 aExp, shiftCount;
2fe8fb19SBen Gras    bits64 aSig;
2fe8fb19SBen Gras
2fe8fb19SBen Gras    aSig = extractFloatx80Frac( a );
2fe8fb19SBen Gras    aExp = extractFloatx80Exp( a );
2fe8fb19SBen Gras    aSign = extractFloatx80Sign( a );
2fe8fb19SBen Gras    if ( ( aExp == 0x7FFF ) && (bits64) ( aSig<<1 ) ) aSign = 0;
2fe8fb19SBen Gras    shiftCount = 0x4037 - aExp;
2fe8fb19SBen Gras    if ( shiftCount <= 0 ) shiftCount = 1;
2fe8fb19SBen Gras    shift64RightJamming( aSig, shiftCount, &aSig );
2fe8fb19SBen Gras    return roundAndPackInt32( aSign, aSig );
2fe8fb19SBen Gras
2fe8fb19SBen Gras}
2fe8fb19SBen Gras
2fe8fb19SBen Gras/*
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen GrasReturns the result of converting the extended double-precision floating-
2fe8fb19SBen Graspoint value `a' to the 32-bit two's complement integer format.  The
2fe8fb19SBen Grasconversion is performed according to the IEC/IEEE Standard for Binary
2fe8fb19SBen GrasFloating-Point Arithmetic, except that the conversion is always rounded
2fe8fb19SBen Grastoward zero.  If `a' is a NaN, the largest positive integer is returned.
2fe8fb19SBen GrasOtherwise, if the conversion overflows, the largest integer with the same
2fe8fb19SBen Grassign as `a' is returned.
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen Gras*/
2fe8fb19SBen Grasint32 floatx80_to_int32_round_to_zero( floatx80 a )
2fe8fb19SBen Gras{
2fe8fb19SBen Gras    flag aSign;
2fe8fb19SBen Gras    int32 aExp, shiftCount;
2fe8fb19SBen Gras    bits64 aSig, savedASig;
2fe8fb19SBen Gras    int32 z;
2fe8fb19SBen Gras
2fe8fb19SBen Gras    aSig = extractFloatx80Frac( a );
2fe8fb19SBen Gras    aExp = extractFloatx80Exp( a );
2fe8fb19SBen Gras    aSign = extractFloatx80Sign( a );
2fe8fb19SBen Gras    if ( 0x401E < aExp ) {
2fe8fb19SBen Gras        if ( ( aExp == 0x7FFF ) && (bits64) ( aSig<<1 ) ) aSign = 0;
2fe8fb19SBen Gras        goto invalid;
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    else if ( aExp < 0x3FFF ) {
*84d9c625SLionel Sambuc        if ( aExp || aSig ) set_float_exception_inexact_flag();
2fe8fb19SBen Gras        return 0;
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    shiftCount = 0x403E - aExp;
2fe8fb19SBen Gras    savedASig = aSig;
2fe8fb19SBen Gras    aSig >>= shiftCount;
2fe8fb19SBen Gras    z = aSig;
2fe8fb19SBen Gras    if ( aSign ) z = - z;
2fe8fb19SBen Gras    if ( ( z < 0 ) ^ aSign ) {
2fe8fb19SBen Gras invalid:
2fe8fb19SBen Gras        float_raise( float_flag_invalid );
2fe8fb19SBen Gras        return aSign ? (sbits32) 0x80000000 : 0x7FFFFFFF;
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    if ( ( aSig<<shiftCount ) != savedASig ) {
*84d9c625SLionel Sambuc        set_float_exception_inexact_flag();
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    return z;
2fe8fb19SBen Gras
2fe8fb19SBen Gras}
2fe8fb19SBen Gras
2fe8fb19SBen Gras/*
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen GrasReturns the result of converting the extended double-precision floating-
2fe8fb19SBen Graspoint value `a' to the 64-bit two's complement integer format.  The
2fe8fb19SBen Grasconversion is performed according to the IEC/IEEE Standard for Binary
2fe8fb19SBen GrasFloating-Point Arithmetic---which means in particular that the conversion
2fe8fb19SBen Grasis rounded according to the current rounding mode.  If `a' is a NaN,
2fe8fb19SBen Grasthe largest positive integer is returned.  Otherwise, if the conversion
2fe8fb19SBen Grasoverflows, the largest integer with the same sign as `a' is returned.
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen Gras*/
2fe8fb19SBen Grasint64 floatx80_to_int64( floatx80 a )
2fe8fb19SBen Gras{
2fe8fb19SBen Gras    flag aSign;
2fe8fb19SBen Gras    int32 aExp, shiftCount;
2fe8fb19SBen Gras    bits64 aSig, aSigExtra;
2fe8fb19SBen Gras
2fe8fb19SBen Gras    aSig = extractFloatx80Frac( a );
2fe8fb19SBen Gras    aExp = extractFloatx80Exp( a );
2fe8fb19SBen Gras    aSign = extractFloatx80Sign( a );
2fe8fb19SBen Gras    shiftCount = 0x403E - aExp;
2fe8fb19SBen Gras    if ( shiftCount <= 0 ) {
2fe8fb19SBen Gras        if ( shiftCount ) {
2fe8fb19SBen Gras            float_raise( float_flag_invalid );
2fe8fb19SBen Gras            if (    ! aSign
2fe8fb19SBen Gras                 || (    ( aExp == 0x7FFF )
2fe8fb19SBen Gras                      && ( aSig != LIT64( 0x8000000000000000 ) ) )
2fe8fb19SBen Gras               ) {
2fe8fb19SBen Gras                return LIT64( 0x7FFFFFFFFFFFFFFF );
2fe8fb19SBen Gras            }
2fe8fb19SBen Gras            return (sbits64) LIT64( 0x8000000000000000 );
2fe8fb19SBen Gras        }
2fe8fb19SBen Gras        aSigExtra = 0;
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    else {
2fe8fb19SBen Gras        shift64ExtraRightJamming( aSig, 0, shiftCount, &aSig, &aSigExtra );
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    return roundAndPackInt64( aSign, aSig, aSigExtra );
2fe8fb19SBen Gras
2fe8fb19SBen Gras}
2fe8fb19SBen Gras
2fe8fb19SBen Gras/*
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen GrasReturns the result of converting the extended double-precision floating-
2fe8fb19SBen Graspoint value `a' to the 64-bit two's complement integer format.  The
2fe8fb19SBen Grasconversion is performed according to the IEC/IEEE Standard for Binary
2fe8fb19SBen GrasFloating-Point Arithmetic, except that the conversion is always rounded
2fe8fb19SBen Grastoward zero.  If `a' is a NaN, the largest positive integer is returned.
2fe8fb19SBen GrasOtherwise, if the conversion overflows, the largest integer with the same
2fe8fb19SBen Grassign as `a' is returned.
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen Gras*/
2fe8fb19SBen Grasint64 floatx80_to_int64_round_to_zero( floatx80 a )
2fe8fb19SBen Gras{
2fe8fb19SBen Gras    flag aSign;
2fe8fb19SBen Gras    int32 aExp, shiftCount;
2fe8fb19SBen Gras    bits64 aSig;
2fe8fb19SBen Gras    int64 z;
2fe8fb19SBen Gras
2fe8fb19SBen Gras    aSig = extractFloatx80Frac( a );
2fe8fb19SBen Gras    aExp = extractFloatx80Exp( a );
2fe8fb19SBen Gras    aSign = extractFloatx80Sign( a );
2fe8fb19SBen Gras    shiftCount = aExp - 0x403E;
2fe8fb19SBen Gras    if ( 0 <= shiftCount ) {
2fe8fb19SBen Gras        aSig &= LIT64( 0x7FFFFFFFFFFFFFFF );
2fe8fb19SBen Gras        if ( ( a.high != 0xC03E ) || aSig ) {
2fe8fb19SBen Gras            float_raise( float_flag_invalid );
2fe8fb19SBen Gras            if ( ! aSign || ( ( aExp == 0x7FFF ) && aSig ) ) {
2fe8fb19SBen Gras                return LIT64( 0x7FFFFFFFFFFFFFFF );
2fe8fb19SBen Gras            }
2fe8fb19SBen Gras        }
2fe8fb19SBen Gras        return (sbits64) LIT64( 0x8000000000000000 );
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    else if ( aExp < 0x3FFF ) {
*84d9c625SLionel Sambuc        if ( aExp | aSig ) set_float_exception_inexact_flag();
2fe8fb19SBen Gras        return 0;
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    z = aSig>>( - shiftCount );
2fe8fb19SBen Gras    if ( (bits64) ( aSig<<( shiftCount & 63 ) ) ) {
*84d9c625SLionel Sambuc        set_float_exception_inexact_flag();
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    if ( aSign ) z = - z;
2fe8fb19SBen Gras    return z;
2fe8fb19SBen Gras
2fe8fb19SBen Gras}
2fe8fb19SBen Gras
2fe8fb19SBen Gras/*
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen GrasReturns the result of converting the extended double-precision floating-
2fe8fb19SBen Graspoint value `a' to the single-precision floating-point format.  The
2fe8fb19SBen Grasconversion is performed according to the IEC/IEEE Standard for Binary
2fe8fb19SBen GrasFloating-Point Arithmetic.
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen Gras*/
2fe8fb19SBen Grasfloat32 floatx80_to_float32( floatx80 a )
2fe8fb19SBen Gras{
2fe8fb19SBen Gras    flag aSign;
2fe8fb19SBen Gras    int32 aExp;
2fe8fb19SBen Gras    bits64 aSig;
2fe8fb19SBen Gras
2fe8fb19SBen Gras    aSig = extractFloatx80Frac( a );
2fe8fb19SBen Gras    aExp = extractFloatx80Exp( a );
2fe8fb19SBen Gras    aSign = extractFloatx80Sign( a );
2fe8fb19SBen Gras    if ( aExp == 0x7FFF ) {
2fe8fb19SBen Gras        if ( (bits64) ( aSig<<1 ) ) {
2fe8fb19SBen Gras            return commonNaNToFloat32( floatx80ToCommonNaN( a ) );
2fe8fb19SBen Gras        }
2fe8fb19SBen Gras        return packFloat32( aSign, 0xFF, 0 );
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    shift64RightJamming( aSig, 33, &aSig );
2fe8fb19SBen Gras    if ( aExp || aSig ) aExp -= 0x3F81;
2fe8fb19SBen Gras    return roundAndPackFloat32( aSign, aExp, aSig );
2fe8fb19SBen Gras
2fe8fb19SBen Gras}
2fe8fb19SBen Gras
2fe8fb19SBen Gras/*
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen GrasReturns the result of converting the extended double-precision floating-
2fe8fb19SBen Graspoint value `a' to the double-precision floating-point format.  The
2fe8fb19SBen Grasconversion is performed according to the IEC/IEEE Standard for Binary
2fe8fb19SBen GrasFloating-Point Arithmetic.
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen Gras*/
2fe8fb19SBen Grasfloat64 floatx80_to_float64( floatx80 a )
2fe8fb19SBen Gras{
2fe8fb19SBen Gras    flag aSign;
2fe8fb19SBen Gras    int32 aExp;
2fe8fb19SBen Gras    bits64 aSig, zSig;
2fe8fb19SBen Gras
2fe8fb19SBen Gras    aSig = extractFloatx80Frac( a );
2fe8fb19SBen Gras    aExp = extractFloatx80Exp( a );
2fe8fb19SBen Gras    aSign = extractFloatx80Sign( a );
2fe8fb19SBen Gras    if ( aExp == 0x7FFF ) {
2fe8fb19SBen Gras        if ( (bits64) ( aSig<<1 ) ) {
2fe8fb19SBen Gras            return commonNaNToFloat64( floatx80ToCommonNaN( a ) );
2fe8fb19SBen Gras        }
2fe8fb19SBen Gras        return packFloat64( aSign, 0x7FF, 0 );
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    shift64RightJamming( aSig, 1, &zSig );
2fe8fb19SBen Gras    if ( aExp || aSig ) aExp -= 0x3C01;
2fe8fb19SBen Gras    return roundAndPackFloat64( aSign, aExp, zSig );
2fe8fb19SBen Gras
2fe8fb19SBen Gras}
2fe8fb19SBen Gras
2fe8fb19SBen Gras#ifdef FLOAT128
2fe8fb19SBen Gras
2fe8fb19SBen Gras/*
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen GrasReturns the result of converting the extended double-precision floating-
2fe8fb19SBen Graspoint value `a' to the quadruple-precision floating-point format.  The
2fe8fb19SBen Grasconversion is performed according to the IEC/IEEE Standard for Binary
2fe8fb19SBen GrasFloating-Point Arithmetic.
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen Gras*/
2fe8fb19SBen Grasfloat128 floatx80_to_float128( floatx80 a )
2fe8fb19SBen Gras{
2fe8fb19SBen Gras    flag aSign;
2fe8fb19SBen Gras    int16 aExp;
2fe8fb19SBen Gras    bits64 aSig, zSig0, zSig1;
2fe8fb19SBen Gras
2fe8fb19SBen Gras    aSig = extractFloatx80Frac( a );
2fe8fb19SBen Gras    aExp = extractFloatx80Exp( a );
2fe8fb19SBen Gras    aSign = extractFloatx80Sign( a );
2fe8fb19SBen Gras    if ( ( aExp == 0x7FFF ) && (bits64) ( aSig<<1 ) ) {
2fe8fb19SBen Gras        return commonNaNToFloat128( floatx80ToCommonNaN( a ) );
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    shift128Right( aSig<<1, 0, 16, &zSig0, &zSig1 );
2fe8fb19SBen Gras    return packFloat128( aSign, aExp, zSig0, zSig1 );
2fe8fb19SBen Gras
2fe8fb19SBen Gras}
2fe8fb19SBen Gras
2fe8fb19SBen Gras#endif
2fe8fb19SBen Gras
2fe8fb19SBen Gras/*
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen GrasRounds the extended double-precision floating-point value `a' to an integer,
2fe8fb19SBen Grasand returns the result as an extended quadruple-precision floating-point
2fe8fb19SBen Grasvalue.  The operation is performed according to the IEC/IEEE Standard for
2fe8fb19SBen GrasBinary Floating-Point Arithmetic.
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen Gras*/
2fe8fb19SBen Grasfloatx80 floatx80_round_to_int( floatx80 a )
2fe8fb19SBen Gras{
2fe8fb19SBen Gras    flag aSign;
2fe8fb19SBen Gras    int32 aExp;
2fe8fb19SBen Gras    bits64 lastBitMask, roundBitsMask;
2fe8fb19SBen Gras    int8 roundingMode;
2fe8fb19SBen Gras    floatx80 z;
2fe8fb19SBen Gras
2fe8fb19SBen Gras    aExp = extractFloatx80Exp( a );
2fe8fb19SBen Gras    if ( 0x403E <= aExp ) {
2fe8fb19SBen Gras        if ( ( aExp == 0x7FFF ) && (bits64) ( extractFloatx80Frac( a )<<1 ) ) {
2fe8fb19SBen Gras            return propagateFloatx80NaN( a, a );
2fe8fb19SBen Gras        }
2fe8fb19SBen Gras        return a;
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    if ( aExp < 0x3FFF ) {
2fe8fb19SBen Gras        if (    ( aExp == 0 )
2fe8fb19SBen Gras             && ( (bits64) ( extractFloatx80Frac( a )<<1 ) == 0 ) ) {
2fe8fb19SBen Gras            return a;
2fe8fb19SBen Gras        }
*84d9c625SLionel Sambuc        set_float_exception_inexact_flag();
2fe8fb19SBen Gras        aSign = extractFloatx80Sign( a );
2fe8fb19SBen Gras        switch ( float_rounding_mode ) {
2fe8fb19SBen Gras         case float_round_nearest_even:
2fe8fb19SBen Gras            if ( ( aExp == 0x3FFE ) && (bits64) ( extractFloatx80Frac( a )<<1 )
2fe8fb19SBen Gras               ) {
2fe8fb19SBen Gras                return
2fe8fb19SBen Gras                    packFloatx80( aSign, 0x3FFF, LIT64( 0x8000000000000000 ) );
2fe8fb19SBen Gras            }
2fe8fb19SBen Gras            break;
2fe8fb19SBen Gras	 case float_round_to_zero:
2fe8fb19SBen Gras	    break;
2fe8fb19SBen Gras         case float_round_down:
2fe8fb19SBen Gras            return
2fe8fb19SBen Gras                  aSign ?
2fe8fb19SBen Gras                      packFloatx80( 1, 0x3FFF, LIT64( 0x8000000000000000 ) )
2fe8fb19SBen Gras                : packFloatx80( 0, 0, 0 );
2fe8fb19SBen Gras         case float_round_up:
2fe8fb19SBen Gras            return
2fe8fb19SBen Gras                  aSign ? packFloatx80( 1, 0, 0 )
2fe8fb19SBen Gras                : packFloatx80( 0, 0x3FFF, LIT64( 0x8000000000000000 ) );
2fe8fb19SBen Gras        }
2fe8fb19SBen Gras        return packFloatx80( aSign, 0, 0 );
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    lastBitMask = 1;
2fe8fb19SBen Gras    lastBitMask <<= 0x403E - aExp;
2fe8fb19SBen Gras    roundBitsMask = lastBitMask - 1;
2fe8fb19SBen Gras    z = a;
2fe8fb19SBen Gras    roundingMode = float_rounding_mode;
2fe8fb19SBen Gras    if ( roundingMode == float_round_nearest_even ) {
2fe8fb19SBen Gras        z.low += lastBitMask>>1;
2fe8fb19SBen Gras        if ( ( z.low & roundBitsMask ) == 0 ) z.low &= ~ lastBitMask;
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    else if ( roundingMode != float_round_to_zero ) {
2fe8fb19SBen Gras        if ( extractFloatx80Sign( z ) ^ ( roundingMode == float_round_up ) ) {
2fe8fb19SBen Gras            z.low += roundBitsMask;
2fe8fb19SBen Gras        }
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    z.low &= ~ roundBitsMask;
2fe8fb19SBen Gras    if ( z.low == 0 ) {
2fe8fb19SBen Gras        ++z.high;
2fe8fb19SBen Gras        z.low = LIT64( 0x8000000000000000 );
2fe8fb19SBen Gras    }
*84d9c625SLionel Sambuc    if ( z.low != a.low ) set_float_exception_inexact_flag();
2fe8fb19SBen Gras    return z;
2fe8fb19SBen Gras
2fe8fb19SBen Gras}
2fe8fb19SBen Gras
2fe8fb19SBen Gras/*
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen GrasReturns the result of adding the absolute values of the extended double-
2fe8fb19SBen Grasprecision floating-point values `a' and `b'.  If `zSign' is 1, the sum is
2fe8fb19SBen Grasnegated before being returned.  `zSign' is ignored if the result is a NaN.
2fe8fb19SBen GrasThe addition is performed according to the IEC/IEEE Standard for Binary
2fe8fb19SBen GrasFloating-Point Arithmetic.
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen Gras*/
2fe8fb19SBen Grasstatic floatx80 addFloatx80Sigs( floatx80 a, floatx80 b, flag zSign )
2fe8fb19SBen Gras{
2fe8fb19SBen Gras    int32 aExp, bExp, zExp;
2fe8fb19SBen Gras    bits64 aSig, bSig, zSig0, zSig1;
2fe8fb19SBen Gras    int32 expDiff;
2fe8fb19SBen Gras
2fe8fb19SBen Gras    aSig = extractFloatx80Frac( a );
2fe8fb19SBen Gras    aExp = extractFloatx80Exp( a );
2fe8fb19SBen Gras    bSig = extractFloatx80Frac( b );
2fe8fb19SBen Gras    bExp = extractFloatx80Exp( b );
2fe8fb19SBen Gras    expDiff = aExp - bExp;
2fe8fb19SBen Gras    if ( 0 < expDiff ) {
2fe8fb19SBen Gras        if ( aExp == 0x7FFF ) {
2fe8fb19SBen Gras            if ( (bits64) ( aSig<<1 ) ) return propagateFloatx80NaN( a, b );
2fe8fb19SBen Gras            return a;
2fe8fb19SBen Gras        }
2fe8fb19SBen Gras        if ( bExp == 0 ) --expDiff;
2fe8fb19SBen Gras        shift64ExtraRightJamming( bSig, 0, expDiff, &bSig, &zSig1 );
2fe8fb19SBen Gras        zExp = aExp;
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    else if ( expDiff < 0 ) {
2fe8fb19SBen Gras        if ( bExp == 0x7FFF ) {
2fe8fb19SBen Gras            if ( (bits64) ( bSig<<1 ) ) return propagateFloatx80NaN( a, b );
2fe8fb19SBen Gras            return packFloatx80( zSign, 0x7FFF, LIT64( 0x8000000000000000 ) );
2fe8fb19SBen Gras        }
2fe8fb19SBen Gras        if ( aExp == 0 ) ++expDiff;
2fe8fb19SBen Gras        shift64ExtraRightJamming( aSig, 0, - expDiff, &aSig, &zSig1 );
2fe8fb19SBen Gras        zExp = bExp;
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    else {
2fe8fb19SBen Gras        if ( aExp == 0x7FFF ) {
2fe8fb19SBen Gras            if ( (bits64) ( ( aSig | bSig )<<1 ) ) {
2fe8fb19SBen Gras                return propagateFloatx80NaN( a, b );
2fe8fb19SBen Gras            }
2fe8fb19SBen Gras            return a;
2fe8fb19SBen Gras        }
2fe8fb19SBen Gras        zSig1 = 0;
2fe8fb19SBen Gras        zSig0 = aSig + bSig;
2fe8fb19SBen Gras        if ( aExp == 0 ) {
2fe8fb19SBen Gras            normalizeFloatx80Subnormal( zSig0, &zExp, &zSig0 );
2fe8fb19SBen Gras            goto roundAndPack;
2fe8fb19SBen Gras        }
2fe8fb19SBen Gras        zExp = aExp;
2fe8fb19SBen Gras        goto shiftRight1;
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    zSig0 = aSig + bSig;
2fe8fb19SBen Gras    if ( (sbits64) zSig0 < 0 ) goto roundAndPack;
2fe8fb19SBen Gras shiftRight1:
2fe8fb19SBen Gras    shift64ExtraRightJamming( zSig0, zSig1, 1, &zSig0, &zSig1 );
2fe8fb19SBen Gras    zSig0 |= LIT64( 0x8000000000000000 );
2fe8fb19SBen Gras    ++zExp;
2fe8fb19SBen Gras roundAndPack:
2fe8fb19SBen Gras    return
2fe8fb19SBen Gras        roundAndPackFloatx80(
2fe8fb19SBen Gras            floatx80_rounding_precision, zSign, zExp, zSig0, zSig1 );
2fe8fb19SBen Gras
2fe8fb19SBen Gras}
2fe8fb19SBen Gras
2fe8fb19SBen Gras/*
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen GrasReturns the result of subtracting the absolute values of the extended
2fe8fb19SBen Grasdouble-precision floating-point values `a' and `b'.  If `zSign' is 1, the
2fe8fb19SBen Grasdifference is negated before being returned.  `zSign' is ignored if the
2fe8fb19SBen Grasresult is a NaN.  The subtraction is performed according to the IEC/IEEE
2fe8fb19SBen GrasStandard for Binary Floating-Point Arithmetic.
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen Gras*/
2fe8fb19SBen Grasstatic floatx80 subFloatx80Sigs( floatx80 a, floatx80 b, flag zSign )
2fe8fb19SBen Gras{
2fe8fb19SBen Gras    int32 aExp, bExp, zExp;
2fe8fb19SBen Gras    bits64 aSig, bSig, zSig0, zSig1;
2fe8fb19SBen Gras    int32 expDiff;
2fe8fb19SBen Gras    floatx80 z;
2fe8fb19SBen Gras
2fe8fb19SBen Gras    aSig = extractFloatx80Frac( a );
2fe8fb19SBen Gras    aExp = extractFloatx80Exp( a );
2fe8fb19SBen Gras    bSig = extractFloatx80Frac( b );
2fe8fb19SBen Gras    bExp = extractFloatx80Exp( b );
2fe8fb19SBen Gras    expDiff = aExp - bExp;
2fe8fb19SBen Gras    if ( 0 < expDiff ) goto aExpBigger;
2fe8fb19SBen Gras    if ( expDiff < 0 ) goto bExpBigger;
2fe8fb19SBen Gras    if ( aExp == 0x7FFF ) {
2fe8fb19SBen Gras        if ( (bits64) ( ( aSig | bSig )<<1 ) ) {
2fe8fb19SBen Gras            return propagateFloatx80NaN( a, b );
2fe8fb19SBen Gras        }
2fe8fb19SBen Gras        float_raise( float_flag_invalid );
2fe8fb19SBen Gras        z.low = floatx80_default_nan_low;
2fe8fb19SBen Gras        z.high = floatx80_default_nan_high;
2fe8fb19SBen Gras        return z;
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    if ( aExp == 0 ) {
2fe8fb19SBen Gras        aExp = 1;
2fe8fb19SBen Gras        bExp = 1;
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    zSig1 = 0;
2fe8fb19SBen Gras    if ( bSig < aSig ) goto aBigger;
2fe8fb19SBen Gras    if ( aSig < bSig ) goto bBigger;
2fe8fb19SBen Gras    return packFloatx80( float_rounding_mode == float_round_down, 0, 0 );
2fe8fb19SBen Gras bExpBigger:
2fe8fb19SBen Gras    if ( bExp == 0x7FFF ) {
2fe8fb19SBen Gras        if ( (bits64) ( bSig<<1 ) ) return propagateFloatx80NaN( a, b );
2fe8fb19SBen Gras        return packFloatx80( zSign ^ 1, 0x7FFF, LIT64( 0x8000000000000000 ) );
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    if ( aExp == 0 ) ++expDiff;
2fe8fb19SBen Gras    shift128RightJamming( aSig, 0, - expDiff, &aSig, &zSig1 );
2fe8fb19SBen Gras bBigger:
2fe8fb19SBen Gras    sub128( bSig, 0, aSig, zSig1, &zSig0, &zSig1 );
2fe8fb19SBen Gras    zExp = bExp;
2fe8fb19SBen Gras    zSign ^= 1;
2fe8fb19SBen Gras    goto normalizeRoundAndPack;
2fe8fb19SBen Gras aExpBigger:
2fe8fb19SBen Gras    if ( aExp == 0x7FFF ) {
2fe8fb19SBen Gras        if ( (bits64) ( aSig<<1 ) ) return propagateFloatx80NaN( a, b );
2fe8fb19SBen Gras        return a;
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    if ( bExp == 0 ) --expDiff;
2fe8fb19SBen Gras    shift128RightJamming( bSig, 0, expDiff, &bSig, &zSig1 );
2fe8fb19SBen Gras aBigger:
2fe8fb19SBen Gras    sub128( aSig, 0, bSig, zSig1, &zSig0, &zSig1 );
2fe8fb19SBen Gras    zExp = aExp;
2fe8fb19SBen Gras normalizeRoundAndPack:
2fe8fb19SBen Gras    return
2fe8fb19SBen Gras        normalizeRoundAndPackFloatx80(
2fe8fb19SBen Gras            floatx80_rounding_precision, zSign, zExp, zSig0, zSig1 );
2fe8fb19SBen Gras
2fe8fb19SBen Gras}
2fe8fb19SBen Gras
2fe8fb19SBen Gras/*
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen GrasReturns the result of adding the extended double-precision floating-point
2fe8fb19SBen Grasvalues `a' and `b'.  The operation is performed according to the IEC/IEEE
2fe8fb19SBen GrasStandard for Binary Floating-Point Arithmetic.
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen Gras*/
2fe8fb19SBen Grasfloatx80 floatx80_add( floatx80 a, floatx80 b )
2fe8fb19SBen Gras{
2fe8fb19SBen Gras    flag aSign, bSign;
2fe8fb19SBen Gras
2fe8fb19SBen Gras    aSign = extractFloatx80Sign( a );
2fe8fb19SBen Gras    bSign = extractFloatx80Sign( b );
2fe8fb19SBen Gras    if ( aSign == bSign ) {
2fe8fb19SBen Gras        return addFloatx80Sigs( a, b, aSign );
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    else {
2fe8fb19SBen Gras        return subFloatx80Sigs( a, b, aSign );
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras
2fe8fb19SBen Gras}
2fe8fb19SBen Gras
2fe8fb19SBen Gras/*
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen GrasReturns the result of subtracting the extended double-precision floating-
2fe8fb19SBen Graspoint values `a' and `b'.  The operation is performed according to the
2fe8fb19SBen GrasIEC/IEEE Standard for Binary Floating-Point Arithmetic.
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen Gras*/
2fe8fb19SBen Grasfloatx80 floatx80_sub( floatx80 a, floatx80 b )
2fe8fb19SBen Gras{
2fe8fb19SBen Gras    flag aSign, bSign;
2fe8fb19SBen Gras
2fe8fb19SBen Gras    aSign = extractFloatx80Sign( a );
2fe8fb19SBen Gras    bSign = extractFloatx80Sign( b );
2fe8fb19SBen Gras    if ( aSign == bSign ) {
2fe8fb19SBen Gras        return subFloatx80Sigs( a, b, aSign );
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    else {
2fe8fb19SBen Gras        return addFloatx80Sigs( a, b, aSign );
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras
2fe8fb19SBen Gras}
2fe8fb19SBen Gras
2fe8fb19SBen Gras/*
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen GrasReturns the result of multiplying the extended double-precision floating-
2fe8fb19SBen Graspoint values `a' and `b'.  The operation is performed according to the
2fe8fb19SBen GrasIEC/IEEE Standard for Binary Floating-Point Arithmetic.
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen Gras*/
2fe8fb19SBen Grasfloatx80 floatx80_mul( floatx80 a, floatx80 b )
2fe8fb19SBen Gras{
2fe8fb19SBen Gras    flag aSign, bSign, zSign;
2fe8fb19SBen Gras    int32 aExp, bExp, zExp;
2fe8fb19SBen Gras    bits64 aSig, bSig, zSig0, zSig1;
2fe8fb19SBen Gras    floatx80 z;
2fe8fb19SBen Gras
2fe8fb19SBen Gras    aSig = extractFloatx80Frac( a );
2fe8fb19SBen Gras    aExp = extractFloatx80Exp( a );
2fe8fb19SBen Gras    aSign = extractFloatx80Sign( a );
2fe8fb19SBen Gras    bSig = extractFloatx80Frac( b );
2fe8fb19SBen Gras    bExp = extractFloatx80Exp( b );
2fe8fb19SBen Gras    bSign = extractFloatx80Sign( b );
2fe8fb19SBen Gras    zSign = aSign ^ bSign;
2fe8fb19SBen Gras    if ( aExp == 0x7FFF ) {
2fe8fb19SBen Gras        if (    (bits64) ( aSig<<1 )
2fe8fb19SBen Gras             || ( ( bExp == 0x7FFF ) && (bits64) ( bSig<<1 ) ) ) {
2fe8fb19SBen Gras            return propagateFloatx80NaN( a, b );
2fe8fb19SBen Gras        }
2fe8fb19SBen Gras        if ( ( bExp | bSig ) == 0 ) goto invalid;
2fe8fb19SBen Gras        return packFloatx80( zSign, 0x7FFF, LIT64( 0x8000000000000000 ) );
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    if ( bExp == 0x7FFF ) {
2fe8fb19SBen Gras        if ( (bits64) ( bSig<<1 ) ) return propagateFloatx80NaN( a, b );
2fe8fb19SBen Gras        if ( ( aExp | aSig ) == 0 ) {
2fe8fb19SBen Gras invalid:
2fe8fb19SBen Gras            float_raise( float_flag_invalid );
2fe8fb19SBen Gras            z.low = floatx80_default_nan_low;
2fe8fb19SBen Gras            z.high = floatx80_default_nan_high;
2fe8fb19SBen Gras            return z;
2fe8fb19SBen Gras        }
2fe8fb19SBen Gras        return packFloatx80( zSign, 0x7FFF, LIT64( 0x8000000000000000 ) );
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    if ( aExp == 0 ) {
2fe8fb19SBen Gras        if ( aSig == 0 ) return packFloatx80( zSign, 0, 0 );
2fe8fb19SBen Gras        normalizeFloatx80Subnormal( aSig, &aExp, &aSig );
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    if ( bExp == 0 ) {
2fe8fb19SBen Gras        if ( bSig == 0 ) return packFloatx80( zSign, 0, 0 );
2fe8fb19SBen Gras        normalizeFloatx80Subnormal( bSig, &bExp, &bSig );
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    zExp = aExp + bExp - 0x3FFE;
2fe8fb19SBen Gras    mul64To128( aSig, bSig, &zSig0, &zSig1 );
2fe8fb19SBen Gras    if ( 0 < (sbits64) zSig0 ) {
2fe8fb19SBen Gras        shortShift128Left( zSig0, zSig1, 1, &zSig0, &zSig1 );
2fe8fb19SBen Gras        --zExp;
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    return
2fe8fb19SBen Gras        roundAndPackFloatx80(
2fe8fb19SBen Gras            floatx80_rounding_precision, zSign, zExp, zSig0, zSig1 );
2fe8fb19SBen Gras
2fe8fb19SBen Gras}
2fe8fb19SBen Gras
2fe8fb19SBen Gras/*
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen GrasReturns the result of dividing the extended double-precision floating-point
2fe8fb19SBen Grasvalue `a' by the corresponding value `b'.  The operation is performed
2fe8fb19SBen Grasaccording to the IEC/IEEE Standard for Binary Floating-Point Arithmetic.
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen Gras*/
2fe8fb19SBen Grasfloatx80 floatx80_div( floatx80 a, floatx80 b )
2fe8fb19SBen Gras{
2fe8fb19SBen Gras    flag aSign, bSign, zSign;
2fe8fb19SBen Gras    int32 aExp, bExp, zExp;
2fe8fb19SBen Gras    bits64 aSig, bSig, zSig0, zSig1;
2fe8fb19SBen Gras    bits64 rem0, rem1, rem2, term0, term1, term2;
2fe8fb19SBen Gras    floatx80 z;
2fe8fb19SBen Gras
2fe8fb19SBen Gras    aSig = extractFloatx80Frac( a );
2fe8fb19SBen Gras    aExp = extractFloatx80Exp( a );
2fe8fb19SBen Gras    aSign = extractFloatx80Sign( a );
2fe8fb19SBen Gras    bSig = extractFloatx80Frac( b );
2fe8fb19SBen Gras    bExp = extractFloatx80Exp( b );
2fe8fb19SBen Gras    bSign = extractFloatx80Sign( b );
2fe8fb19SBen Gras    zSign = aSign ^ bSign;
2fe8fb19SBen Gras    if ( aExp == 0x7FFF ) {
2fe8fb19SBen Gras        if ( (bits64) ( aSig<<1 ) ) return propagateFloatx80NaN( a, b );
2fe8fb19SBen Gras        if ( bExp == 0x7FFF ) {
2fe8fb19SBen Gras            if ( (bits64) ( bSig<<1 ) ) return propagateFloatx80NaN( a, b );
2fe8fb19SBen Gras            goto invalid;
2fe8fb19SBen Gras        }
2fe8fb19SBen Gras        return packFloatx80( zSign, 0x7FFF, LIT64( 0x8000000000000000 ) );
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    if ( bExp == 0x7FFF ) {
2fe8fb19SBen Gras        if ( (bits64) ( bSig<<1 ) ) return propagateFloatx80NaN( a, b );
2fe8fb19SBen Gras        return packFloatx80( zSign, 0, 0 );
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    if ( bExp == 0 ) {
2fe8fb19SBen Gras        if ( bSig == 0 ) {
2fe8fb19SBen Gras            if ( ( aExp | aSig ) == 0 ) {
2fe8fb19SBen Gras invalid:
2fe8fb19SBen Gras                float_raise( float_flag_invalid );
2fe8fb19SBen Gras                z.low = floatx80_default_nan_low;
2fe8fb19SBen Gras                z.high = floatx80_default_nan_high;
2fe8fb19SBen Gras                return z;
2fe8fb19SBen Gras            }
2fe8fb19SBen Gras            float_raise( float_flag_divbyzero );
2fe8fb19SBen Gras            return packFloatx80( zSign, 0x7FFF, LIT64( 0x8000000000000000 ) );
2fe8fb19SBen Gras        }
2fe8fb19SBen Gras        normalizeFloatx80Subnormal( bSig, &bExp, &bSig );
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    if ( aExp == 0 ) {
2fe8fb19SBen Gras        if ( aSig == 0 ) return packFloatx80( zSign, 0, 0 );
2fe8fb19SBen Gras        normalizeFloatx80Subnormal( aSig, &aExp, &aSig );
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    zExp = aExp - bExp + 0x3FFE;
2fe8fb19SBen Gras    rem1 = 0;
2fe8fb19SBen Gras    if ( bSig <= aSig ) {
2fe8fb19SBen Gras        shift128Right( aSig, 0, 1, &aSig, &rem1 );
2fe8fb19SBen Gras        ++zExp;
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    zSig0 = estimateDiv128To64( aSig, rem1, bSig );
2fe8fb19SBen Gras    mul64To128( bSig, zSig0, &term0, &term1 );
2fe8fb19SBen Gras    sub128( aSig, rem1, term0, term1, &rem0, &rem1 );
2fe8fb19SBen Gras    while ( (sbits64) rem0 < 0 ) {
2fe8fb19SBen Gras        --zSig0;
2fe8fb19SBen Gras        add128( rem0, rem1, 0, bSig, &rem0, &rem1 );
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    zSig1 = estimateDiv128To64( rem1, 0, bSig );
2fe8fb19SBen Gras    if ( (bits64) ( zSig1<<1 ) <= 8 ) {
2fe8fb19SBen Gras        mul64To128( bSig, zSig1, &term1, &term2 );
2fe8fb19SBen Gras        sub128( rem1, 0, term1, term2, &rem1, &rem2 );
2fe8fb19SBen Gras        while ( (sbits64) rem1 < 0 ) {
2fe8fb19SBen Gras            --zSig1;
2fe8fb19SBen Gras            add128( rem1, rem2, 0, bSig, &rem1, &rem2 );
2fe8fb19SBen Gras        }
2fe8fb19SBen Gras        zSig1 |= ( ( rem1 | rem2 ) != 0 );
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    return
2fe8fb19SBen Gras        roundAndPackFloatx80(
2fe8fb19SBen Gras            floatx80_rounding_precision, zSign, zExp, zSig0, zSig1 );
2fe8fb19SBen Gras
2fe8fb19SBen Gras}
2fe8fb19SBen Gras
2fe8fb19SBen Gras/*
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen GrasReturns the remainder of the extended double-precision floating-point value
2fe8fb19SBen Gras`a' with respect to the corresponding value `b'.  The operation is performed
2fe8fb19SBen Grasaccording to the IEC/IEEE Standard for Binary Floating-Point Arithmetic.
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen Gras*/
2fe8fb19SBen Grasfloatx80 floatx80_rem( floatx80 a, floatx80 b )
2fe8fb19SBen Gras{
2fe8fb19SBen Gras    flag aSign, bSign, zSign;
2fe8fb19SBen Gras    int32 aExp, bExp, expDiff;
2fe8fb19SBen Gras    bits64 aSig0, aSig1, bSig;
2fe8fb19SBen Gras    bits64 q, term0, term1, alternateASig0, alternateASig1;
2fe8fb19SBen Gras    floatx80 z;
2fe8fb19SBen Gras
2fe8fb19SBen Gras    aSig0 = extractFloatx80Frac( a );
2fe8fb19SBen Gras    aExp = extractFloatx80Exp( a );
2fe8fb19SBen Gras    aSign = extractFloatx80Sign( a );
2fe8fb19SBen Gras    bSig = extractFloatx80Frac( b );
2fe8fb19SBen Gras    bExp = extractFloatx80Exp( b );
2fe8fb19SBen Gras    bSign = extractFloatx80Sign( b );
2fe8fb19SBen Gras    if ( aExp == 0x7FFF ) {
2fe8fb19SBen Gras        if (    (bits64) ( aSig0<<1 )
2fe8fb19SBen Gras             || ( ( bExp == 0x7FFF ) && (bits64) ( bSig<<1 ) ) ) {
2fe8fb19SBen Gras            return propagateFloatx80NaN( a, b );
2fe8fb19SBen Gras        }
2fe8fb19SBen Gras        goto invalid;
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    if ( bExp == 0x7FFF ) {
2fe8fb19SBen Gras        if ( (bits64) ( bSig<<1 ) ) return propagateFloatx80NaN( a, b );
2fe8fb19SBen Gras        return a;
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    if ( bExp == 0 ) {
2fe8fb19SBen Gras        if ( bSig == 0 ) {
2fe8fb19SBen Gras invalid:
2fe8fb19SBen Gras            float_raise( float_flag_invalid );
2fe8fb19SBen Gras            z.low = floatx80_default_nan_low;
2fe8fb19SBen Gras            z.high = floatx80_default_nan_high;
2fe8fb19SBen Gras            return z;
2fe8fb19SBen Gras        }
2fe8fb19SBen Gras        normalizeFloatx80Subnormal( bSig, &bExp, &bSig );
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    if ( aExp == 0 ) {
2fe8fb19SBen Gras        if ( (bits64) ( aSig0<<1 ) == 0 ) return a;
2fe8fb19SBen Gras        normalizeFloatx80Subnormal( aSig0, &aExp, &aSig0 );
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    bSig |= LIT64( 0x8000000000000000 );
2fe8fb19SBen Gras    zSign = aSign;
2fe8fb19SBen Gras    expDiff = aExp - bExp;
2fe8fb19SBen Gras    aSig1 = 0;
2fe8fb19SBen Gras    if ( expDiff < 0 ) {
2fe8fb19SBen Gras        if ( expDiff < -1 ) return a;
2fe8fb19SBen Gras        shift128Right( aSig0, 0, 1, &aSig0, &aSig1 );
2fe8fb19SBen Gras        expDiff = 0;
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    q = ( bSig <= aSig0 );
2fe8fb19SBen Gras    if ( q ) aSig0 -= bSig;
2fe8fb19SBen Gras    expDiff -= 64;
2fe8fb19SBen Gras    while ( 0 < expDiff ) {
2fe8fb19SBen Gras        q = estimateDiv128To64( aSig0, aSig1, bSig );
2fe8fb19SBen Gras        q = ( 2 < q ) ? q - 2 : 0;
2fe8fb19SBen Gras        mul64To128( bSig, q, &term0, &term1 );
2fe8fb19SBen Gras        sub128( aSig0, aSig1, term0, term1, &aSig0, &aSig1 );
2fe8fb19SBen Gras        shortShift128Left( aSig0, aSig1, 62, &aSig0, &aSig1 );
2fe8fb19SBen Gras        expDiff -= 62;
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    expDiff += 64;
2fe8fb19SBen Gras    if ( 0 < expDiff ) {
2fe8fb19SBen Gras        q = estimateDiv128To64( aSig0, aSig1, bSig );
2fe8fb19SBen Gras        q = ( 2 < q ) ? q - 2 : 0;
2fe8fb19SBen Gras        q >>= 64 - expDiff;
2fe8fb19SBen Gras        mul64To128( bSig, q<<( 64 - expDiff ), &term0, &term1 );
2fe8fb19SBen Gras        sub128( aSig0, aSig1, term0, term1, &aSig0, &aSig1 );
2fe8fb19SBen Gras        shortShift128Left( 0, bSig, 64 - expDiff, &term0, &term1 );
2fe8fb19SBen Gras        while ( le128( term0, term1, aSig0, aSig1 ) ) {
2fe8fb19SBen Gras            ++q;
2fe8fb19SBen Gras            sub128( aSig0, aSig1, term0, term1, &aSig0, &aSig1 );
2fe8fb19SBen Gras        }
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    else {
2fe8fb19SBen Gras        term1 = 0;
2fe8fb19SBen Gras        term0 = bSig;
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    sub128( term0, term1, aSig0, aSig1, &alternateASig0, &alternateASig1 );
2fe8fb19SBen Gras    if (    lt128( alternateASig0, alternateASig1, aSig0, aSig1 )
2fe8fb19SBen Gras         || (    eq128( alternateASig0, alternateASig1, aSig0, aSig1 )
2fe8fb19SBen Gras              && ( q & 1 ) )
2fe8fb19SBen Gras       ) {
2fe8fb19SBen Gras        aSig0 = alternateASig0;
2fe8fb19SBen Gras        aSig1 = alternateASig1;
2fe8fb19SBen Gras        zSign = ! zSign;
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    return
2fe8fb19SBen Gras        normalizeRoundAndPackFloatx80(
2fe8fb19SBen Gras            80, zSign, bExp + expDiff, aSig0, aSig1 );
2fe8fb19SBen Gras
2fe8fb19SBen Gras}
2fe8fb19SBen Gras
2fe8fb19SBen Gras/*
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen GrasReturns the square root of the extended double-precision floating-point
2fe8fb19SBen Grasvalue `a'.  The operation is performed according to the IEC/IEEE Standard
2fe8fb19SBen Grasfor Binary Floating-Point Arithmetic.
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen Gras*/
2fe8fb19SBen Grasfloatx80 floatx80_sqrt( floatx80 a )
2fe8fb19SBen Gras{
2fe8fb19SBen Gras    flag aSign;
2fe8fb19SBen Gras    int32 aExp, zExp;
2fe8fb19SBen Gras    bits64 aSig0, aSig1, zSig0, zSig1, doubleZSig0;
2fe8fb19SBen Gras    bits64 rem0, rem1, rem2, rem3, term0, term1, term2, term3;
2fe8fb19SBen Gras    floatx80 z;
2fe8fb19SBen Gras
2fe8fb19SBen Gras    aSig0 = extractFloatx80Frac( a );
2fe8fb19SBen Gras    aExp = extractFloatx80Exp( a );
2fe8fb19SBen Gras    aSign = extractFloatx80Sign( a );
2fe8fb19SBen Gras    if ( aExp == 0x7FFF ) {
2fe8fb19SBen Gras        if ( (bits64) ( aSig0<<1 ) ) return propagateFloatx80NaN( a, a );
2fe8fb19SBen Gras        if ( ! aSign ) return a;
2fe8fb19SBen Gras        goto invalid;
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    if ( aSign ) {
2fe8fb19SBen Gras        if ( ( aExp | aSig0 ) == 0 ) return a;
2fe8fb19SBen Gras invalid:
2fe8fb19SBen Gras        float_raise( float_flag_invalid );
2fe8fb19SBen Gras        z.low = floatx80_default_nan_low;
2fe8fb19SBen Gras        z.high = floatx80_default_nan_high;
2fe8fb19SBen Gras        return z;
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    if ( aExp == 0 ) {
2fe8fb19SBen Gras        if ( aSig0 == 0 ) return packFloatx80( 0, 0, 0 );
2fe8fb19SBen Gras        normalizeFloatx80Subnormal( aSig0, &aExp, &aSig0 );
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    zExp = ( ( aExp - 0x3FFF )>>1 ) + 0x3FFF;
2fe8fb19SBen Gras    zSig0 = estimateSqrt32( aExp, aSig0>>32 );
2fe8fb19SBen Gras    shift128Right( aSig0, 0, 2 + ( aExp & 1 ), &aSig0, &aSig1 );
2fe8fb19SBen Gras    zSig0 = estimateDiv128To64( aSig0, aSig1, zSig0<<32 ) + ( zSig0<<30 );
2fe8fb19SBen Gras    doubleZSig0 = zSig0<<1;
2fe8fb19SBen Gras    mul64To128( zSig0, zSig0, &term0, &term1 );
2fe8fb19SBen Gras    sub128( aSig0, aSig1, term0, term1, &rem0, &rem1 );
2fe8fb19SBen Gras    while ( (sbits64) rem0 < 0 ) {
2fe8fb19SBen Gras        --zSig0;
2fe8fb19SBen Gras        doubleZSig0 -= 2;
2fe8fb19SBen Gras        add128( rem0, rem1, zSig0>>63, doubleZSig0 | 1, &rem0, &rem1 );
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    zSig1 = estimateDiv128To64( rem1, 0, doubleZSig0 );
2fe8fb19SBen Gras    if ( ( zSig1 & LIT64( 0x3FFFFFFFFFFFFFFF ) ) <= 5 ) {
2fe8fb19SBen Gras        if ( zSig1 == 0 ) zSig1 = 1;
2fe8fb19SBen Gras        mul64To128( doubleZSig0, zSig1, &term1, &term2 );
2fe8fb19SBen Gras        sub128( rem1, 0, term1, term2, &rem1, &rem2 );
2fe8fb19SBen Gras        mul64To128( zSig1, zSig1, &term2, &term3 );
2fe8fb19SBen Gras        sub192( rem1, rem2, 0, 0, term2, term3, &rem1, &rem2, &rem3 );
2fe8fb19SBen Gras        while ( (sbits64) rem1 < 0 ) {
2fe8fb19SBen Gras            --zSig1;
2fe8fb19SBen Gras            shortShift128Left( 0, zSig1, 1, &term2, &term3 );
2fe8fb19SBen Gras            term3 |= 1;
2fe8fb19SBen Gras            term2 |= doubleZSig0;
2fe8fb19SBen Gras            add192( rem1, rem2, rem3, 0, term2, term3, &rem1, &rem2, &rem3 );
2fe8fb19SBen Gras        }
2fe8fb19SBen Gras        zSig1 |= ( ( rem1 | rem2 | rem3 ) != 0 );
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    shortShift128Left( 0, zSig1, 1, &zSig0, &zSig1 );
2fe8fb19SBen Gras    zSig0 |= doubleZSig0;
2fe8fb19SBen Gras    return
2fe8fb19SBen Gras        roundAndPackFloatx80(
2fe8fb19SBen Gras            floatx80_rounding_precision, 0, zExp, zSig0, zSig1 );
2fe8fb19SBen Gras
2fe8fb19SBen Gras}
2fe8fb19SBen Gras
2fe8fb19SBen Gras/*
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen GrasReturns 1 if the extended double-precision floating-point value `a' is
2fe8fb19SBen Grasequal to the corresponding value `b', and 0 otherwise.  The comparison is
2fe8fb19SBen Grasperformed according to the IEC/IEEE Standard for Binary Floating-Point
2fe8fb19SBen GrasArithmetic.
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen Gras*/
2fe8fb19SBen Grasflag floatx80_eq( floatx80 a, floatx80 b )
2fe8fb19SBen Gras{
2fe8fb19SBen Gras
2fe8fb19SBen Gras    if (    (    ( extractFloatx80Exp( a ) == 0x7FFF )
2fe8fb19SBen Gras              && (bits64) ( extractFloatx80Frac( a )<<1 ) )
2fe8fb19SBen Gras         || (    ( extractFloatx80Exp( b ) == 0x7FFF )
2fe8fb19SBen Gras              && (bits64) ( extractFloatx80Frac( b )<<1 ) )
2fe8fb19SBen Gras       ) {
2fe8fb19SBen Gras        if (    floatx80_is_signaling_nan( a )
2fe8fb19SBen Gras             || floatx80_is_signaling_nan( b ) ) {
2fe8fb19SBen Gras            float_raise( float_flag_invalid );
2fe8fb19SBen Gras        }
2fe8fb19SBen Gras        return 0;
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    return
2fe8fb19SBen Gras           ( a.low == b.low )
2fe8fb19SBen Gras        && (    ( a.high == b.high )
2fe8fb19SBen Gras             || (    ( a.low == 0 )
2fe8fb19SBen Gras                  && ( (bits16) ( ( a.high | b.high )<<1 ) == 0 ) )
2fe8fb19SBen Gras           );
2fe8fb19SBen Gras
2fe8fb19SBen Gras}
2fe8fb19SBen Gras
2fe8fb19SBen Gras/*
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen GrasReturns 1 if the extended double-precision floating-point value `a' is
2fe8fb19SBen Grasless than or equal to the corresponding value `b', and 0 otherwise.  The
2fe8fb19SBen Grascomparison is performed according to the IEC/IEEE Standard for Binary
2fe8fb19SBen GrasFloating-Point Arithmetic.
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen Gras*/
2fe8fb19SBen Grasflag floatx80_le( floatx80 a, floatx80 b )
2fe8fb19SBen Gras{
2fe8fb19SBen Gras    flag aSign, bSign;
2fe8fb19SBen Gras
2fe8fb19SBen Gras    if (    (    ( extractFloatx80Exp( a ) == 0x7FFF )
2fe8fb19SBen Gras              && (bits64) ( extractFloatx80Frac( a )<<1 ) )
2fe8fb19SBen Gras         || (    ( extractFloatx80Exp( b ) == 0x7FFF )
2fe8fb19SBen Gras              && (bits64) ( extractFloatx80Frac( b )<<1 ) )
2fe8fb19SBen Gras       ) {
2fe8fb19SBen Gras        float_raise( float_flag_invalid );
2fe8fb19SBen Gras        return 0;
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    aSign = extractFloatx80Sign( a );
2fe8fb19SBen Gras    bSign = extractFloatx80Sign( b );
2fe8fb19SBen Gras    if ( aSign != bSign ) {
2fe8fb19SBen Gras        return
2fe8fb19SBen Gras               aSign
2fe8fb19SBen Gras            || (    ( ( (bits16) ( ( a.high | b.high )<<1 ) ) | a.low | b.low )
2fe8fb19SBen Gras                 == 0 );
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    return
2fe8fb19SBen Gras          aSign ? le128( b.high, b.low, a.high, a.low )
2fe8fb19SBen Gras        : le128( a.high, a.low, b.high, b.low );
2fe8fb19SBen Gras
2fe8fb19SBen Gras}
2fe8fb19SBen Gras
2fe8fb19SBen Gras/*
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen GrasReturns 1 if the extended double-precision floating-point value `a' is
2fe8fb19SBen Grasless than the corresponding value `b', and 0 otherwise.  The comparison
2fe8fb19SBen Grasis performed according to the IEC/IEEE Standard for Binary Floating-Point
2fe8fb19SBen GrasArithmetic.
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen Gras*/
2fe8fb19SBen Grasflag floatx80_lt( floatx80 a, floatx80 b )
2fe8fb19SBen Gras{
2fe8fb19SBen Gras    flag aSign, bSign;
2fe8fb19SBen Gras
2fe8fb19SBen Gras    if (    (    ( extractFloatx80Exp( a ) == 0x7FFF )
2fe8fb19SBen Gras              && (bits64) ( extractFloatx80Frac( a )<<1 ) )
2fe8fb19SBen Gras         || (    ( extractFloatx80Exp( b ) == 0x7FFF )
2fe8fb19SBen Gras              && (bits64) ( extractFloatx80Frac( b )<<1 ) )
2fe8fb19SBen Gras       ) {
2fe8fb19SBen Gras        float_raise( float_flag_invalid );
2fe8fb19SBen Gras        return 0;
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    aSign = extractFloatx80Sign( a );
2fe8fb19SBen Gras    bSign = extractFloatx80Sign( b );
2fe8fb19SBen Gras    if ( aSign != bSign ) {
2fe8fb19SBen Gras        return
2fe8fb19SBen Gras               aSign
2fe8fb19SBen Gras            && (    ( ( (bits16) ( ( a.high | b.high )<<1 ) ) | a.low | b.low )
2fe8fb19SBen Gras                 != 0 );
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    return
2fe8fb19SBen Gras          aSign ? lt128( b.high, b.low, a.high, a.low )
2fe8fb19SBen Gras        : lt128( a.high, a.low, b.high, b.low );
2fe8fb19SBen Gras
2fe8fb19SBen Gras}
2fe8fb19SBen Gras
2fe8fb19SBen Gras/*
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen GrasReturns 1 if the extended double-precision floating-point value `a' is equal
2fe8fb19SBen Grasto the corresponding value `b', and 0 otherwise.  The invalid exception is
2fe8fb19SBen Grasraised if either operand is a NaN.  Otherwise, the comparison is performed
2fe8fb19SBen Grasaccording to the IEC/IEEE Standard for Binary Floating-Point Arithmetic.
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen Gras*/
2fe8fb19SBen Grasflag floatx80_eq_signaling( floatx80 a, floatx80 b )
2fe8fb19SBen Gras{
2fe8fb19SBen Gras
2fe8fb19SBen Gras    if (    (    ( extractFloatx80Exp( a ) == 0x7FFF )
2fe8fb19SBen Gras              && (bits64) ( extractFloatx80Frac( a )<<1 ) )
2fe8fb19SBen Gras         || (    ( extractFloatx80Exp( b ) == 0x7FFF )
2fe8fb19SBen Gras              && (bits64) ( extractFloatx80Frac( b )<<1 ) )
2fe8fb19SBen Gras       ) {
2fe8fb19SBen Gras        float_raise( float_flag_invalid );
2fe8fb19SBen Gras        return 0;
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    return
2fe8fb19SBen Gras           ( a.low == b.low )
2fe8fb19SBen Gras        && (    ( a.high == b.high )
2fe8fb19SBen Gras             || (    ( a.low == 0 )
2fe8fb19SBen Gras                  && ( (bits16) ( ( a.high | b.high )<<1 ) == 0 ) )
2fe8fb19SBen Gras           );
2fe8fb19SBen Gras
2fe8fb19SBen Gras}
2fe8fb19SBen Gras
2fe8fb19SBen Gras/*
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen GrasReturns 1 if the extended double-precision floating-point value `a' is less
2fe8fb19SBen Grasthan or equal to the corresponding value `b', and 0 otherwise.  Quiet NaNs
2fe8fb19SBen Grasdo not cause an exception.  Otherwise, the comparison is performed according
2fe8fb19SBen Grasto the IEC/IEEE Standard for Binary Floating-Point Arithmetic.
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen Gras*/
2fe8fb19SBen Grasflag floatx80_le_quiet( floatx80 a, floatx80 b )
2fe8fb19SBen Gras{
2fe8fb19SBen Gras    flag aSign, bSign;
2fe8fb19SBen Gras
2fe8fb19SBen Gras    if (    (    ( extractFloatx80Exp( a ) == 0x7FFF )
2fe8fb19SBen Gras              && (bits64) ( extractFloatx80Frac( a )<<1 ) )
2fe8fb19SBen Gras         || (    ( extractFloatx80Exp( b ) == 0x7FFF )
2fe8fb19SBen Gras              && (bits64) ( extractFloatx80Frac( b )<<1 ) )
2fe8fb19SBen Gras       ) {
2fe8fb19SBen Gras        if (    floatx80_is_signaling_nan( a )
2fe8fb19SBen Gras             || floatx80_is_signaling_nan( b ) ) {
2fe8fb19SBen Gras            float_raise( float_flag_invalid );
2fe8fb19SBen Gras        }
2fe8fb19SBen Gras        return 0;
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    aSign = extractFloatx80Sign( a );
2fe8fb19SBen Gras    bSign = extractFloatx80Sign( b );
2fe8fb19SBen Gras    if ( aSign != bSign ) {
2fe8fb19SBen Gras        return
2fe8fb19SBen Gras               aSign
2fe8fb19SBen Gras            || (    ( ( (bits16) ( ( a.high | b.high )<<1 ) ) | a.low | b.low )
2fe8fb19SBen Gras                 == 0 );
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    return
2fe8fb19SBen Gras          aSign ? le128( b.high, b.low, a.high, a.low )
2fe8fb19SBen Gras        : le128( a.high, a.low, b.high, b.low );
2fe8fb19SBen Gras
2fe8fb19SBen Gras}
2fe8fb19SBen Gras
2fe8fb19SBen Gras/*
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen GrasReturns 1 if the extended double-precision floating-point value `a' is less
2fe8fb19SBen Grasthan the corresponding value `b', and 0 otherwise.  Quiet NaNs do not cause
2fe8fb19SBen Grasan exception.  Otherwise, the comparison is performed according to the
2fe8fb19SBen GrasIEC/IEEE Standard for Binary Floating-Point Arithmetic.
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen Gras*/
2fe8fb19SBen Grasflag floatx80_lt_quiet( floatx80 a, floatx80 b )
2fe8fb19SBen Gras{
2fe8fb19SBen Gras    flag aSign, bSign;
2fe8fb19SBen Gras
2fe8fb19SBen Gras    if (    (    ( extractFloatx80Exp( a ) == 0x7FFF )
2fe8fb19SBen Gras              && (bits64) ( extractFloatx80Frac( a )<<1 ) )
2fe8fb19SBen Gras         || (    ( extractFloatx80Exp( b ) == 0x7FFF )
2fe8fb19SBen Gras              && (bits64) ( extractFloatx80Frac( b )<<1 ) )
2fe8fb19SBen Gras       ) {
2fe8fb19SBen Gras        if (    floatx80_is_signaling_nan( a )
2fe8fb19SBen Gras             || floatx80_is_signaling_nan( b ) ) {
2fe8fb19SBen Gras            float_raise( float_flag_invalid );
2fe8fb19SBen Gras        }
2fe8fb19SBen Gras        return 0;
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    aSign = extractFloatx80Sign( a );
2fe8fb19SBen Gras    bSign = extractFloatx80Sign( b );
2fe8fb19SBen Gras    if ( aSign != bSign ) {
2fe8fb19SBen Gras        return
2fe8fb19SBen Gras               aSign
2fe8fb19SBen Gras            && (    ( ( (bits16) ( ( a.high | b.high )<<1 ) ) | a.low | b.low )
2fe8fb19SBen Gras                 != 0 );
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    return
2fe8fb19SBen Gras          aSign ? lt128( b.high, b.low, a.high, a.low )
2fe8fb19SBen Gras        : lt128( a.high, a.low, b.high, b.low );
2fe8fb19SBen Gras
2fe8fb19SBen Gras}
2fe8fb19SBen Gras
2fe8fb19SBen Gras#endif
2fe8fb19SBen Gras
2fe8fb19SBen Gras#ifdef FLOAT128
2fe8fb19SBen Gras
2fe8fb19SBen Gras/*
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen GrasReturns the result of converting the quadruple-precision floating-point
2fe8fb19SBen Grasvalue `a' to the 32-bit two's complement integer format.  The conversion
2fe8fb19SBen Grasis performed according to the IEC/IEEE Standard for Binary Floating-Point
2fe8fb19SBen GrasArithmetic---which means in particular that the conversion is rounded
2fe8fb19SBen Grasaccording to the current rounding mode.  If `a' is a NaN, the largest
2fe8fb19SBen Graspositive integer is returned.  Otherwise, if the conversion overflows, the
2fe8fb19SBen Graslargest integer with the same sign as `a' is returned.
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen Gras*/
2fe8fb19SBen Grasint32 float128_to_int32( float128 a )
2fe8fb19SBen Gras{
2fe8fb19SBen Gras    flag aSign;
2fe8fb19SBen Gras    int32 aExp, shiftCount;
2fe8fb19SBen Gras    bits64 aSig0, aSig1;
2fe8fb19SBen Gras
2fe8fb19SBen Gras    aSig1 = extractFloat128Frac1( a );
2fe8fb19SBen Gras    aSig0 = extractFloat128Frac0( a );
2fe8fb19SBen Gras    aExp = extractFloat128Exp( a );
2fe8fb19SBen Gras    aSign = extractFloat128Sign( a );
2fe8fb19SBen Gras    if ( ( aExp == 0x7FFF ) && ( aSig0 | aSig1 ) ) aSign = 0;
2fe8fb19SBen Gras    if ( aExp ) aSig0 |= LIT64( 0x0001000000000000 );
2fe8fb19SBen Gras    aSig0 |= ( aSig1 != 0 );
2fe8fb19SBen Gras    shiftCount = 0x4028 - aExp;
2fe8fb19SBen Gras    if ( 0 < shiftCount ) shift64RightJamming( aSig0, shiftCount, &aSig0 );
2fe8fb19SBen Gras    return roundAndPackInt32( aSign, aSig0 );
2fe8fb19SBen Gras
2fe8fb19SBen Gras}
2fe8fb19SBen Gras
2fe8fb19SBen Gras/*
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen GrasReturns the result of converting the quadruple-precision floating-point
2fe8fb19SBen Grasvalue `a' to the 32-bit two's complement integer format.  The conversion
2fe8fb19SBen Grasis performed according to the IEC/IEEE Standard for Binary Floating-Point
2fe8fb19SBen GrasArithmetic, except that the conversion is always rounded toward zero.  If
2fe8fb19SBen Gras`a' is a NaN, the largest positive integer is returned.  Otherwise, if the
2fe8fb19SBen Grasconversion overflows, the largest integer with the same sign as `a' is
2fe8fb19SBen Grasreturned.
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen Gras*/
2fe8fb19SBen Grasint32 float128_to_int32_round_to_zero( float128 a )
2fe8fb19SBen Gras{
2fe8fb19SBen Gras    flag aSign;
2fe8fb19SBen Gras    int32 aExp, shiftCount;
2fe8fb19SBen Gras    bits64 aSig0, aSig1, savedASig;
2fe8fb19SBen Gras    int32 z;
2fe8fb19SBen Gras
2fe8fb19SBen Gras    aSig1 = extractFloat128Frac1( a );
2fe8fb19SBen Gras    aSig0 = extractFloat128Frac0( a );
2fe8fb19SBen Gras    aExp = extractFloat128Exp( a );
2fe8fb19SBen Gras    aSign = extractFloat128Sign( a );
2fe8fb19SBen Gras    aSig0 |= ( aSig1 != 0 );
2fe8fb19SBen Gras    if ( 0x401E < aExp ) {
2fe8fb19SBen Gras        if ( ( aExp == 0x7FFF ) && aSig0 ) aSign = 0;
2fe8fb19SBen Gras        goto invalid;
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    else if ( aExp < 0x3FFF ) {
*84d9c625SLionel Sambuc        if ( aExp || aSig0 ) set_float_exception_inexact_flag();
2fe8fb19SBen Gras        return 0;
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    aSig0 |= LIT64( 0x0001000000000000 );
2fe8fb19SBen Gras    shiftCount = 0x402F - aExp;
2fe8fb19SBen Gras    savedASig = aSig0;
2fe8fb19SBen Gras    aSig0 >>= shiftCount;
f14fb602SLionel Sambuc    z = (int32)aSig0;
2fe8fb19SBen Gras    if ( aSign ) z = - z;
2fe8fb19SBen Gras    if ( ( z < 0 ) ^ aSign ) {
2fe8fb19SBen Gras invalid:
2fe8fb19SBen Gras        float_raise( float_flag_invalid );
2fe8fb19SBen Gras        return aSign ? (sbits32) 0x80000000 : 0x7FFFFFFF;
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    if ( ( aSig0<<shiftCount ) != savedASig ) {
*84d9c625SLionel Sambuc        set_float_exception_inexact_flag();
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    return z;
2fe8fb19SBen Gras
2fe8fb19SBen Gras}
2fe8fb19SBen Gras
2fe8fb19SBen Gras/*
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen GrasReturns the result of converting the quadruple-precision floating-point
2fe8fb19SBen Grasvalue `a' to the 64-bit two's complement integer format.  The conversion
2fe8fb19SBen Grasis performed according to the IEC/IEEE Standard for Binary Floating-Point
2fe8fb19SBen GrasArithmetic---which means in particular that the conversion is rounded
2fe8fb19SBen Grasaccording to the current rounding mode.  If `a' is a NaN, the largest
2fe8fb19SBen Graspositive integer is returned.  Otherwise, if the conversion overflows, the
2fe8fb19SBen Graslargest integer with the same sign as `a' is returned.
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen Gras*/
2fe8fb19SBen Grasint64 float128_to_int64( float128 a )
2fe8fb19SBen Gras{
2fe8fb19SBen Gras    flag aSign;
2fe8fb19SBen Gras    int32 aExp, shiftCount;
2fe8fb19SBen Gras    bits64 aSig0, aSig1;
2fe8fb19SBen Gras
2fe8fb19SBen Gras    aSig1 = extractFloat128Frac1( a );
2fe8fb19SBen Gras    aSig0 = extractFloat128Frac0( a );
2fe8fb19SBen Gras    aExp = extractFloat128Exp( a );
2fe8fb19SBen Gras    aSign = extractFloat128Sign( a );
2fe8fb19SBen Gras    if ( aExp ) aSig0 |= LIT64( 0x0001000000000000 );
2fe8fb19SBen Gras    shiftCount = 0x402F - aExp;
2fe8fb19SBen Gras    if ( shiftCount <= 0 ) {
2fe8fb19SBen Gras        if ( 0x403E < aExp ) {
2fe8fb19SBen Gras            float_raise( float_flag_invalid );
2fe8fb19SBen Gras            if (    ! aSign
2fe8fb19SBen Gras                 || (    ( aExp == 0x7FFF )
2fe8fb19SBen Gras                      && ( aSig1 || ( aSig0 != LIT64( 0x0001000000000000 ) ) )
2fe8fb19SBen Gras                    )
2fe8fb19SBen Gras               ) {
2fe8fb19SBen Gras                return LIT64( 0x7FFFFFFFFFFFFFFF );
2fe8fb19SBen Gras            }
2fe8fb19SBen Gras            return (sbits64) LIT64( 0x8000000000000000 );
2fe8fb19SBen Gras        }
2fe8fb19SBen Gras        shortShift128Left( aSig0, aSig1, - shiftCount, &aSig0, &aSig1 );
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    else {
2fe8fb19SBen Gras        shift64ExtraRightJamming( aSig0, aSig1, shiftCount, &aSig0, &aSig1 );
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    return roundAndPackInt64( aSign, aSig0, aSig1 );
2fe8fb19SBen Gras
2fe8fb19SBen Gras}
2fe8fb19SBen Gras
2fe8fb19SBen Gras/*
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen GrasReturns the result of converting the quadruple-precision floating-point
2fe8fb19SBen Grasvalue `a' to the 64-bit two's complement integer format.  The conversion
2fe8fb19SBen Grasis performed according to the IEC/IEEE Standard for Binary Floating-Point
2fe8fb19SBen GrasArithmetic, except that the conversion is always rounded toward zero.
2fe8fb19SBen GrasIf `a' is a NaN, the largest positive integer is returned.  Otherwise, if
2fe8fb19SBen Grasthe conversion overflows, the largest integer with the same sign as `a' is
2fe8fb19SBen Grasreturned.
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen Gras*/
2fe8fb19SBen Grasint64 float128_to_int64_round_to_zero( float128 a )
2fe8fb19SBen Gras{
2fe8fb19SBen Gras    flag aSign;
2fe8fb19SBen Gras    int32 aExp, shiftCount;
2fe8fb19SBen Gras    bits64 aSig0, aSig1;
2fe8fb19SBen Gras    int64 z;
2fe8fb19SBen Gras
2fe8fb19SBen Gras    aSig1 = extractFloat128Frac1( a );
2fe8fb19SBen Gras    aSig0 = extractFloat128Frac0( a );
2fe8fb19SBen Gras    aExp = extractFloat128Exp( a );
2fe8fb19SBen Gras    aSign = extractFloat128Sign( a );
2fe8fb19SBen Gras    if ( aExp ) aSig0 |= LIT64( 0x0001000000000000 );
2fe8fb19SBen Gras    shiftCount = aExp - 0x402F;
2fe8fb19SBen Gras    if ( 0 < shiftCount ) {
2fe8fb19SBen Gras        if ( 0x403E <= aExp ) {
2fe8fb19SBen Gras            aSig0 &= LIT64( 0x0000FFFFFFFFFFFF );
2fe8fb19SBen Gras            if (    ( a.high == LIT64( 0xC03E000000000000 ) )
2fe8fb19SBen Gras                 && ( aSig1 < LIT64( 0x0002000000000000 ) ) ) {
*84d9c625SLionel Sambuc                if ( aSig1 ) set_float_exception_inexact_flag();
2fe8fb19SBen Gras            }
2fe8fb19SBen Gras            else {
2fe8fb19SBen Gras                float_raise( float_flag_invalid );
2fe8fb19SBen Gras                if ( ! aSign || ( ( aExp == 0x7FFF ) && ( aSig0 | aSig1 ) ) ) {
2fe8fb19SBen Gras                    return LIT64( 0x7FFFFFFFFFFFFFFF );
2fe8fb19SBen Gras                }
2fe8fb19SBen Gras            }
2fe8fb19SBen Gras            return (sbits64) LIT64( 0x8000000000000000 );
2fe8fb19SBen Gras        }
2fe8fb19SBen Gras        z = ( aSig0<<shiftCount ) | ( aSig1>>( ( - shiftCount ) & 63 ) );
2fe8fb19SBen Gras        if ( (bits64) ( aSig1<<shiftCount ) ) {
*84d9c625SLionel Sambuc            set_float_exception_inexact_flag();
2fe8fb19SBen Gras        }
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    else {
2fe8fb19SBen Gras        if ( aExp < 0x3FFF ) {
2fe8fb19SBen Gras            if ( aExp | aSig0 | aSig1 ) {
*84d9c625SLionel Sambuc                set_float_exception_inexact_flag();
2fe8fb19SBen Gras            }
2fe8fb19SBen Gras            return 0;
2fe8fb19SBen Gras        }
2fe8fb19SBen Gras        z = aSig0>>( - shiftCount );
2fe8fb19SBen Gras        if (    aSig1
2fe8fb19SBen Gras             || ( shiftCount && (bits64) ( aSig0<<( shiftCount & 63 ) ) ) ) {
*84d9c625SLionel Sambuc            set_float_exception_inexact_flag();
2fe8fb19SBen Gras        }
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    if ( aSign ) z = - z;
2fe8fb19SBen Gras    return z;
2fe8fb19SBen Gras
2fe8fb19SBen Gras}
2fe8fb19SBen Gras
f14fb602SLionel Sambuc#if (defined(SOFTFLOATSPARC64_FOR_GCC) || defined(SOFTFLOAT_FOR_GCC)) \
f14fb602SLionel Sambuc    && defined(SOFTFLOAT_NEED_FIXUNS)
2fe8fb19SBen Gras/*
2fe8fb19SBen Gras * just like above - but do not care for overflow of signed results
2fe8fb19SBen Gras */
2fe8fb19SBen Grasuint64 float128_to_uint64_round_to_zero( float128 a )
2fe8fb19SBen Gras{
2fe8fb19SBen Gras    flag aSign;
2fe8fb19SBen Gras    int32 aExp, shiftCount;
2fe8fb19SBen Gras    bits64 aSig0, aSig1;
2fe8fb19SBen Gras    uint64 z;
2fe8fb19SBen Gras
2fe8fb19SBen Gras    aSig1 = extractFloat128Frac1( a );
2fe8fb19SBen Gras    aSig0 = extractFloat128Frac0( a );
2fe8fb19SBen Gras    aExp = extractFloat128Exp( a );
2fe8fb19SBen Gras    aSign = extractFloat128Sign( a );
2fe8fb19SBen Gras    if ( aExp ) aSig0 |= LIT64( 0x0001000000000000 );
2fe8fb19SBen Gras    shiftCount = aExp - 0x402F;
2fe8fb19SBen Gras    if ( 0 < shiftCount ) {
2fe8fb19SBen Gras        if ( 0x403F <= aExp ) {
2fe8fb19SBen Gras            aSig0 &= LIT64( 0x0000FFFFFFFFFFFF );
2fe8fb19SBen Gras            if (    ( a.high == LIT64( 0xC03E000000000000 ) )
2fe8fb19SBen Gras                 && ( aSig1 < LIT64( 0x0002000000000000 ) ) ) {
*84d9c625SLionel Sambuc                if ( aSig1 ) set_float_exception_inexact_flag();
2fe8fb19SBen Gras            }
2fe8fb19SBen Gras            else {
2fe8fb19SBen Gras                float_raise( float_flag_invalid );
2fe8fb19SBen Gras            }
2fe8fb19SBen Gras            return LIT64( 0xFFFFFFFFFFFFFFFF );
2fe8fb19SBen Gras        }
2fe8fb19SBen Gras        z = ( aSig0<<shiftCount ) | ( aSig1>>( ( - shiftCount ) & 63 ) );
2fe8fb19SBen Gras        if ( (bits64) ( aSig1<<shiftCount ) ) {
*84d9c625SLionel Sambuc            set_float_exception_inexact_flag();
2fe8fb19SBen Gras        }
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    else {
2fe8fb19SBen Gras        if ( aExp < 0x3FFF ) {
2fe8fb19SBen Gras            if ( aExp | aSig0 | aSig1 ) {
*84d9c625SLionel Sambuc                set_float_exception_inexact_flag();
2fe8fb19SBen Gras            }
2fe8fb19SBen Gras            return 0;
2fe8fb19SBen Gras        }
2fe8fb19SBen Gras        z = aSig0>>( - shiftCount );
2fe8fb19SBen Gras        if (aSig1 || ( shiftCount && (bits64) ( aSig0<<( shiftCount & 63 ) ) ) ) {
*84d9c625SLionel Sambuc            set_float_exception_inexact_flag();
2fe8fb19SBen Gras        }
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    if ( aSign ) z = - z;
2fe8fb19SBen Gras    return z;
2fe8fb19SBen Gras
2fe8fb19SBen Gras}
f14fb602SLionel Sambuc#endif /* (SOFTFLOATSPARC64_FOR_GCC || SOFTFLOAT_FOR_GCC) && SOFTFLOAT_NEED_FIXUNS */
2fe8fb19SBen Gras
2fe8fb19SBen Gras/*
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen GrasReturns the result of converting the quadruple-precision floating-point
2fe8fb19SBen Grasvalue `a' to the single-precision floating-point format.  The conversion
2fe8fb19SBen Grasis performed according to the IEC/IEEE Standard for Binary Floating-Point
2fe8fb19SBen GrasArithmetic.
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen Gras*/
2fe8fb19SBen Grasfloat32 float128_to_float32( float128 a )
2fe8fb19SBen Gras{
2fe8fb19SBen Gras    flag aSign;
2fe8fb19SBen Gras    int32 aExp;
2fe8fb19SBen Gras    bits64 aSig0, aSig1;
2fe8fb19SBen Gras    bits32 zSig;
2fe8fb19SBen Gras
2fe8fb19SBen Gras    aSig1 = extractFloat128Frac1( a );
2fe8fb19SBen Gras    aSig0 = extractFloat128Frac0( a );
2fe8fb19SBen Gras    aExp = extractFloat128Exp( a );
2fe8fb19SBen Gras    aSign = extractFloat128Sign( a );
2fe8fb19SBen Gras    if ( aExp == 0x7FFF ) {
2fe8fb19SBen Gras        if ( aSig0 | aSig1 ) {
2fe8fb19SBen Gras            return commonNaNToFloat32( float128ToCommonNaN( a ) );
2fe8fb19SBen Gras        }
2fe8fb19SBen Gras        return packFloat32( aSign, 0xFF, 0 );
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    aSig0 |= ( aSig1 != 0 );
2fe8fb19SBen Gras    shift64RightJamming( aSig0, 18, &aSig0 );
f14fb602SLionel Sambuc    zSig = (bits32)aSig0;
2fe8fb19SBen Gras    if ( aExp || zSig ) {
2fe8fb19SBen Gras        zSig |= 0x40000000;
2fe8fb19SBen Gras        aExp -= 0x3F81;
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    return roundAndPackFloat32( aSign, aExp, zSig );
2fe8fb19SBen Gras
2fe8fb19SBen Gras}
2fe8fb19SBen Gras
2fe8fb19SBen Gras/*
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen GrasReturns the result of converting the quadruple-precision floating-point
2fe8fb19SBen Grasvalue `a' to the double-precision floating-point format.  The conversion
2fe8fb19SBen Grasis performed according to the IEC/IEEE Standard for Binary Floating-Point
2fe8fb19SBen GrasArithmetic.
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen Gras*/
2fe8fb19SBen Grasfloat64 float128_to_float64( float128 a )
2fe8fb19SBen Gras{
2fe8fb19SBen Gras    flag aSign;
2fe8fb19SBen Gras    int32 aExp;
2fe8fb19SBen Gras    bits64 aSig0, aSig1;
2fe8fb19SBen Gras
2fe8fb19SBen Gras    aSig1 = extractFloat128Frac1( a );
2fe8fb19SBen Gras    aSig0 = extractFloat128Frac0( a );
2fe8fb19SBen Gras    aExp = extractFloat128Exp( a );
2fe8fb19SBen Gras    aSign = extractFloat128Sign( a );
2fe8fb19SBen Gras    if ( aExp == 0x7FFF ) {
2fe8fb19SBen Gras        if ( aSig0 | aSig1 ) {
2fe8fb19SBen Gras            return commonNaNToFloat64( float128ToCommonNaN( a ) );
2fe8fb19SBen Gras        }
2fe8fb19SBen Gras        return packFloat64( aSign, 0x7FF, 0 );
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    shortShift128Left( aSig0, aSig1, 14, &aSig0, &aSig1 );
2fe8fb19SBen Gras    aSig0 |= ( aSig1 != 0 );
2fe8fb19SBen Gras    if ( aExp || aSig0 ) {
2fe8fb19SBen Gras        aSig0 |= LIT64( 0x4000000000000000 );
2fe8fb19SBen Gras        aExp -= 0x3C01;
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    return roundAndPackFloat64( aSign, aExp, aSig0 );
2fe8fb19SBen Gras
2fe8fb19SBen Gras}
2fe8fb19SBen Gras
2fe8fb19SBen Gras#ifdef FLOATX80
2fe8fb19SBen Gras
2fe8fb19SBen Gras/*
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen GrasReturns the result of converting the quadruple-precision floating-point
2fe8fb19SBen Grasvalue `a' to the extended double-precision floating-point format.  The
2fe8fb19SBen Grasconversion is performed according to the IEC/IEEE Standard for Binary
2fe8fb19SBen GrasFloating-Point Arithmetic.
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen Gras*/
2fe8fb19SBen Grasfloatx80 float128_to_floatx80( float128 a )
2fe8fb19SBen Gras{
2fe8fb19SBen Gras    flag aSign;
2fe8fb19SBen Gras    int32 aExp;
2fe8fb19SBen Gras    bits64 aSig0, aSig1;
2fe8fb19SBen Gras
2fe8fb19SBen Gras    aSig1 = extractFloat128Frac1( a );
2fe8fb19SBen Gras    aSig0 = extractFloat128Frac0( a );
2fe8fb19SBen Gras    aExp = extractFloat128Exp( a );
2fe8fb19SBen Gras    aSign = extractFloat128Sign( a );
2fe8fb19SBen Gras    if ( aExp == 0x7FFF ) {
2fe8fb19SBen Gras        if ( aSig0 | aSig1 ) {
2fe8fb19SBen Gras            return commonNaNToFloatx80( float128ToCommonNaN( a ) );
2fe8fb19SBen Gras        }
2fe8fb19SBen Gras        return packFloatx80( aSign, 0x7FFF, LIT64( 0x8000000000000000 ) );
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    if ( aExp == 0 ) {
2fe8fb19SBen Gras        if ( ( aSig0 | aSig1 ) == 0 ) return packFloatx80( aSign, 0, 0 );
2fe8fb19SBen Gras        normalizeFloat128Subnormal( aSig0, aSig1, &aExp, &aSig0, &aSig1 );
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    else {
2fe8fb19SBen Gras        aSig0 |= LIT64( 0x0001000000000000 );
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    shortShift128Left( aSig0, aSig1, 15, &aSig0, &aSig1 );
2fe8fb19SBen Gras    return roundAndPackFloatx80( 80, aSign, aExp, aSig0, aSig1 );
2fe8fb19SBen Gras
2fe8fb19SBen Gras}
2fe8fb19SBen Gras
2fe8fb19SBen Gras#endif
2fe8fb19SBen Gras
2fe8fb19SBen Gras/*
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen GrasRounds the quadruple-precision floating-point value `a' to an integer, and
2fe8fb19SBen Grasreturns the result as a quadruple-precision floating-point value.  The
2fe8fb19SBen Grasoperation is performed according to the IEC/IEEE Standard for Binary
2fe8fb19SBen GrasFloating-Point Arithmetic.
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen Gras*/
2fe8fb19SBen Grasfloat128 float128_round_to_int( float128 a )
2fe8fb19SBen Gras{
2fe8fb19SBen Gras    flag aSign;
2fe8fb19SBen Gras    int32 aExp;
2fe8fb19SBen Gras    bits64 lastBitMask, roundBitsMask;
2fe8fb19SBen Gras    int8 roundingMode;
2fe8fb19SBen Gras    float128 z;
2fe8fb19SBen Gras
2fe8fb19SBen Gras    aExp = extractFloat128Exp( a );
2fe8fb19SBen Gras    if ( 0x402F <= aExp ) {
2fe8fb19SBen Gras        if ( 0x406F <= aExp ) {
2fe8fb19SBen Gras            if (    ( aExp == 0x7FFF )
2fe8fb19SBen Gras                 && ( extractFloat128Frac0( a ) | extractFloat128Frac1( a ) )
2fe8fb19SBen Gras               ) {
2fe8fb19SBen Gras                return propagateFloat128NaN( a, a );
2fe8fb19SBen Gras            }
2fe8fb19SBen Gras            return a;
2fe8fb19SBen Gras        }
2fe8fb19SBen Gras        lastBitMask = 1;
2fe8fb19SBen Gras        lastBitMask = ( lastBitMask<<( 0x406E - aExp ) )<<1;
2fe8fb19SBen Gras        roundBitsMask = lastBitMask - 1;
2fe8fb19SBen Gras        z = a;
2fe8fb19SBen Gras        roundingMode = float_rounding_mode;
2fe8fb19SBen Gras        if ( roundingMode == float_round_nearest_even ) {
2fe8fb19SBen Gras            if ( lastBitMask ) {
2fe8fb19SBen Gras                add128( z.high, z.low, 0, lastBitMask>>1, &z.high, &z.low );
2fe8fb19SBen Gras                if ( ( z.low & roundBitsMask ) == 0 ) z.low &= ~ lastBitMask;
2fe8fb19SBen Gras            }
2fe8fb19SBen Gras            else {
2fe8fb19SBen Gras                if ( (sbits64) z.low < 0 ) {
2fe8fb19SBen Gras                    ++z.high;
2fe8fb19SBen Gras                    if ( (bits64) ( z.low<<1 ) == 0 ) z.high &= ~1;
2fe8fb19SBen Gras                }
2fe8fb19SBen Gras            }
2fe8fb19SBen Gras        }
2fe8fb19SBen Gras        else if ( roundingMode != float_round_to_zero ) {
2fe8fb19SBen Gras            if (   extractFloat128Sign( z )
2fe8fb19SBen Gras                 ^ ( roundingMode == float_round_up ) ) {
2fe8fb19SBen Gras                add128( z.high, z.low, 0, roundBitsMask, &z.high, &z.low );
2fe8fb19SBen Gras            }
2fe8fb19SBen Gras        }
2fe8fb19SBen Gras        z.low &= ~ roundBitsMask;
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    else {
2fe8fb19SBen Gras        if ( aExp < 0x3FFF ) {
2fe8fb19SBen Gras            if ( ( ( (bits64) ( a.high<<1 ) ) | a.low ) == 0 ) return a;
*84d9c625SLionel Sambuc            set_float_exception_inexact_flag();
2fe8fb19SBen Gras            aSign = extractFloat128Sign( a );
2fe8fb19SBen Gras            switch ( float_rounding_mode ) {
2fe8fb19SBen Gras             case float_round_nearest_even:
2fe8fb19SBen Gras                if (    ( aExp == 0x3FFE )
2fe8fb19SBen Gras                     && (   extractFloat128Frac0( a )
2fe8fb19SBen Gras                          | extractFloat128Frac1( a ) )
2fe8fb19SBen Gras                   ) {
2fe8fb19SBen Gras                    return packFloat128( aSign, 0x3FFF, 0, 0 );
2fe8fb19SBen Gras                }
2fe8fb19SBen Gras                break;
2fe8fb19SBen Gras	     case float_round_to_zero:
2fe8fb19SBen Gras		break;
2fe8fb19SBen Gras             case float_round_down:
2fe8fb19SBen Gras                return
2fe8fb19SBen Gras                      aSign ? packFloat128( 1, 0x3FFF, 0, 0 )
2fe8fb19SBen Gras                    : packFloat128( 0, 0, 0, 0 );
2fe8fb19SBen Gras             case float_round_up:
2fe8fb19SBen Gras                return
2fe8fb19SBen Gras                      aSign ? packFloat128( 1, 0, 0, 0 )
2fe8fb19SBen Gras                    : packFloat128( 0, 0x3FFF, 0, 0 );
2fe8fb19SBen Gras            }
2fe8fb19SBen Gras            return packFloat128( aSign, 0, 0, 0 );
2fe8fb19SBen Gras        }
2fe8fb19SBen Gras        lastBitMask = 1;
2fe8fb19SBen Gras        lastBitMask <<= 0x402F - aExp;
2fe8fb19SBen Gras        roundBitsMask = lastBitMask - 1;
2fe8fb19SBen Gras        z.low = 0;
2fe8fb19SBen Gras        z.high = a.high;
2fe8fb19SBen Gras        roundingMode = float_rounding_mode;
2fe8fb19SBen Gras        if ( roundingMode == float_round_nearest_even ) {
2fe8fb19SBen Gras            z.high += lastBitMask>>1;
2fe8fb19SBen Gras            if ( ( ( z.high & roundBitsMask ) | a.low ) == 0 ) {
2fe8fb19SBen Gras                z.high &= ~ lastBitMask;
2fe8fb19SBen Gras            }
2fe8fb19SBen Gras        }
2fe8fb19SBen Gras        else if ( roundingMode != float_round_to_zero ) {
2fe8fb19SBen Gras            if (   extractFloat128Sign( z )
2fe8fb19SBen Gras                 ^ ( roundingMode == float_round_up ) ) {
2fe8fb19SBen Gras                z.high |= ( a.low != 0 );
2fe8fb19SBen Gras                z.high += roundBitsMask;
2fe8fb19SBen Gras            }
2fe8fb19SBen Gras        }
2fe8fb19SBen Gras        z.high &= ~ roundBitsMask;
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    if ( ( z.low != a.low ) || ( z.high != a.high ) ) {
*84d9c625SLionel Sambuc        set_float_exception_inexact_flag();
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    return z;
2fe8fb19SBen Gras
2fe8fb19SBen Gras}
2fe8fb19SBen Gras
2fe8fb19SBen Gras/*
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen GrasReturns the result of adding the absolute values of the quadruple-precision
2fe8fb19SBen Grasfloating-point values `a' and `b'.  If `zSign' is 1, the sum is negated
2fe8fb19SBen Grasbefore being returned.  `zSign' is ignored if the result is a NaN.
2fe8fb19SBen GrasThe addition is performed according to the IEC/IEEE Standard for Binary
2fe8fb19SBen GrasFloating-Point Arithmetic.
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen Gras*/
2fe8fb19SBen Grasstatic float128 addFloat128Sigs( float128 a, float128 b, flag zSign )
2fe8fb19SBen Gras{
2fe8fb19SBen Gras    int32 aExp, bExp, zExp;
2fe8fb19SBen Gras    bits64 aSig0, aSig1, bSig0, bSig1, zSig0, zSig1, zSig2;
2fe8fb19SBen Gras    int32 expDiff;
2fe8fb19SBen Gras
2fe8fb19SBen Gras    aSig1 = extractFloat128Frac1( a );
2fe8fb19SBen Gras    aSig0 = extractFloat128Frac0( a );
2fe8fb19SBen Gras    aExp = extractFloat128Exp( a );
2fe8fb19SBen Gras    bSig1 = extractFloat128Frac1( b );
2fe8fb19SBen Gras    bSig0 = extractFloat128Frac0( b );
2fe8fb19SBen Gras    bExp = extractFloat128Exp( b );
2fe8fb19SBen Gras    expDiff = aExp - bExp;
2fe8fb19SBen Gras    if ( 0 < expDiff ) {
2fe8fb19SBen Gras        if ( aExp == 0x7FFF ) {
2fe8fb19SBen Gras            if ( aSig0 | aSig1 ) return propagateFloat128NaN( a, b );
2fe8fb19SBen Gras            return a;
2fe8fb19SBen Gras        }
2fe8fb19SBen Gras        if ( bExp == 0 ) {
2fe8fb19SBen Gras            --expDiff;
2fe8fb19SBen Gras        }
2fe8fb19SBen Gras        else {
2fe8fb19SBen Gras            bSig0 |= LIT64( 0x0001000000000000 );
2fe8fb19SBen Gras        }
2fe8fb19SBen Gras        shift128ExtraRightJamming(
2fe8fb19SBen Gras            bSig0, bSig1, 0, expDiff, &bSig0, &bSig1, &zSig2 );
2fe8fb19SBen Gras        zExp = aExp;
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    else if ( expDiff < 0 ) {
2fe8fb19SBen Gras        if ( bExp == 0x7FFF ) {
2fe8fb19SBen Gras            if ( bSig0 | bSig1 ) return propagateFloat128NaN( a, b );
2fe8fb19SBen Gras            return packFloat128( zSign, 0x7FFF, 0, 0 );
2fe8fb19SBen Gras        }
2fe8fb19SBen Gras        if ( aExp == 0 ) {
2fe8fb19SBen Gras            ++expDiff;
2fe8fb19SBen Gras        }
2fe8fb19SBen Gras        else {
2fe8fb19SBen Gras            aSig0 |= LIT64( 0x0001000000000000 );
2fe8fb19SBen Gras        }
2fe8fb19SBen Gras        shift128ExtraRightJamming(
2fe8fb19SBen Gras            aSig0, aSig1, 0, - expDiff, &aSig0, &aSig1, &zSig2 );
2fe8fb19SBen Gras        zExp = bExp;
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    else {
2fe8fb19SBen Gras        if ( aExp == 0x7FFF ) {
2fe8fb19SBen Gras            if ( aSig0 | aSig1 | bSig0 | bSig1 ) {
2fe8fb19SBen Gras                return propagateFloat128NaN( a, b );
2fe8fb19SBen Gras            }
2fe8fb19SBen Gras            return a;
2fe8fb19SBen Gras        }
2fe8fb19SBen Gras        add128( aSig0, aSig1, bSig0, bSig1, &zSig0, &zSig1 );
2fe8fb19SBen Gras        if ( aExp == 0 ) return packFloat128( zSign, 0, zSig0, zSig1 );
2fe8fb19SBen Gras        zSig2 = 0;
2fe8fb19SBen Gras        zSig0 |= LIT64( 0x0002000000000000 );
2fe8fb19SBen Gras        zExp = aExp;
2fe8fb19SBen Gras        goto shiftRight1;
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    aSig0 |= LIT64( 0x0001000000000000 );
2fe8fb19SBen Gras    add128( aSig0, aSig1, bSig0, bSig1, &zSig0, &zSig1 );
2fe8fb19SBen Gras    --zExp;
2fe8fb19SBen Gras    if ( zSig0 < LIT64( 0x0002000000000000 ) ) goto roundAndPack;
2fe8fb19SBen Gras    ++zExp;
2fe8fb19SBen Gras shiftRight1:
2fe8fb19SBen Gras    shift128ExtraRightJamming(
2fe8fb19SBen Gras        zSig0, zSig1, zSig2, 1, &zSig0, &zSig1, &zSig2 );
2fe8fb19SBen Gras roundAndPack:
2fe8fb19SBen Gras    return roundAndPackFloat128( zSign, zExp, zSig0, zSig1, zSig2 );
2fe8fb19SBen Gras
2fe8fb19SBen Gras}
2fe8fb19SBen Gras
2fe8fb19SBen Gras/*
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen GrasReturns the result of subtracting the absolute values of the quadruple-
2fe8fb19SBen Grasprecision floating-point values `a' and `b'.  If `zSign' is 1, the
2fe8fb19SBen Grasdifference is negated before being returned.  `zSign' is ignored if the
2fe8fb19SBen Grasresult is a NaN.  The subtraction is performed according to the IEC/IEEE
2fe8fb19SBen GrasStandard for Binary Floating-Point Arithmetic.
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen Gras*/
2fe8fb19SBen Grasstatic float128 subFloat128Sigs( float128 a, float128 b, flag zSign )
2fe8fb19SBen Gras{
2fe8fb19SBen Gras    int32 aExp, bExp, zExp;
2fe8fb19SBen Gras    bits64 aSig0, aSig1, bSig0, bSig1, zSig0, zSig1;
2fe8fb19SBen Gras    int32 expDiff;
2fe8fb19SBen Gras    float128 z;
2fe8fb19SBen Gras
2fe8fb19SBen Gras    aSig1 = extractFloat128Frac1( a );
2fe8fb19SBen Gras    aSig0 = extractFloat128Frac0( a );
2fe8fb19SBen Gras    aExp = extractFloat128Exp( a );
2fe8fb19SBen Gras    bSig1 = extractFloat128Frac1( b );
2fe8fb19SBen Gras    bSig0 = extractFloat128Frac0( b );
2fe8fb19SBen Gras    bExp = extractFloat128Exp( b );
2fe8fb19SBen Gras    expDiff = aExp - bExp;
2fe8fb19SBen Gras    shortShift128Left( aSig0, aSig1, 14, &aSig0, &aSig1 );
2fe8fb19SBen Gras    shortShift128Left( bSig0, bSig1, 14, &bSig0, &bSig1 );
2fe8fb19SBen Gras    if ( 0 < expDiff ) goto aExpBigger;
2fe8fb19SBen Gras    if ( expDiff < 0 ) goto bExpBigger;
2fe8fb19SBen Gras    if ( aExp == 0x7FFF ) {
2fe8fb19SBen Gras        if ( aSig0 | aSig1 | bSig0 | bSig1 ) {
2fe8fb19SBen Gras            return propagateFloat128NaN( a, b );
2fe8fb19SBen Gras        }
2fe8fb19SBen Gras        float_raise( float_flag_invalid );
2fe8fb19SBen Gras        z.low = float128_default_nan_low;
2fe8fb19SBen Gras        z.high = float128_default_nan_high;
2fe8fb19SBen Gras        return z;
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    if ( aExp == 0 ) {
2fe8fb19SBen Gras        aExp = 1;
2fe8fb19SBen Gras        bExp = 1;
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    if ( bSig0 < aSig0 ) goto aBigger;
2fe8fb19SBen Gras    if ( aSig0 < bSig0 ) goto bBigger;
2fe8fb19SBen Gras    if ( bSig1 < aSig1 ) goto aBigger;
2fe8fb19SBen Gras    if ( aSig1 < bSig1 ) goto bBigger;
2fe8fb19SBen Gras    return packFloat128( float_rounding_mode == float_round_down, 0, 0, 0 );
2fe8fb19SBen Gras bExpBigger:
2fe8fb19SBen Gras    if ( bExp == 0x7FFF ) {
2fe8fb19SBen Gras        if ( bSig0 | bSig1 ) return propagateFloat128NaN( a, b );
2fe8fb19SBen Gras        return packFloat128( zSign ^ 1, 0x7FFF, 0, 0 );
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    if ( aExp == 0 ) {
2fe8fb19SBen Gras        ++expDiff;
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    else {
2fe8fb19SBen Gras        aSig0 |= LIT64( 0x4000000000000000 );
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    shift128RightJamming( aSig0, aSig1, - expDiff, &aSig0, &aSig1 );
2fe8fb19SBen Gras    bSig0 |= LIT64( 0x4000000000000000 );
2fe8fb19SBen Gras bBigger:
2fe8fb19SBen Gras    sub128( bSig0, bSig1, aSig0, aSig1, &zSig0, &zSig1 );
2fe8fb19SBen Gras    zExp = bExp;
2fe8fb19SBen Gras    zSign ^= 1;
2fe8fb19SBen Gras    goto normalizeRoundAndPack;
2fe8fb19SBen Gras aExpBigger:
2fe8fb19SBen Gras    if ( aExp == 0x7FFF ) {
2fe8fb19SBen Gras        if ( aSig0 | aSig1 ) return propagateFloat128NaN( a, b );
2fe8fb19SBen Gras        return a;
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    if ( bExp == 0 ) {
2fe8fb19SBen Gras        --expDiff;
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    else {
2fe8fb19SBen Gras        bSig0 |= LIT64( 0x4000000000000000 );
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    shift128RightJamming( bSig0, bSig1, expDiff, &bSig0, &bSig1 );
2fe8fb19SBen Gras    aSig0 |= LIT64( 0x4000000000000000 );
2fe8fb19SBen Gras aBigger:
2fe8fb19SBen Gras    sub128( aSig0, aSig1, bSig0, bSig1, &zSig0, &zSig1 );
2fe8fb19SBen Gras    zExp = aExp;
2fe8fb19SBen Gras normalizeRoundAndPack:
2fe8fb19SBen Gras    --zExp;
2fe8fb19SBen Gras    return normalizeRoundAndPackFloat128( zSign, zExp - 14, zSig0, zSig1 );
2fe8fb19SBen Gras
2fe8fb19SBen Gras}
2fe8fb19SBen Gras
2fe8fb19SBen Gras/*
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen GrasReturns the result of adding the quadruple-precision floating-point values
2fe8fb19SBen Gras`a' and `b'.  The operation is performed according to the IEC/IEEE Standard
2fe8fb19SBen Grasfor Binary Floating-Point Arithmetic.
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen Gras*/
2fe8fb19SBen Grasfloat128 float128_add( float128 a, float128 b )
2fe8fb19SBen Gras{
2fe8fb19SBen Gras    flag aSign, bSign;
2fe8fb19SBen Gras
2fe8fb19SBen Gras    aSign = extractFloat128Sign( a );
2fe8fb19SBen Gras    bSign = extractFloat128Sign( b );
2fe8fb19SBen Gras    if ( aSign == bSign ) {
2fe8fb19SBen Gras        return addFloat128Sigs( a, b, aSign );
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    else {
2fe8fb19SBen Gras        return subFloat128Sigs( a, b, aSign );
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras
2fe8fb19SBen Gras}
2fe8fb19SBen Gras
2fe8fb19SBen Gras/*
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen GrasReturns the result of subtracting the quadruple-precision floating-point
2fe8fb19SBen Grasvalues `a' and `b'.  The operation is performed according to the IEC/IEEE
2fe8fb19SBen GrasStandard for Binary Floating-Point Arithmetic.
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen Gras*/
2fe8fb19SBen Grasfloat128 float128_sub( float128 a, float128 b )
2fe8fb19SBen Gras{
2fe8fb19SBen Gras    flag aSign, bSign;
2fe8fb19SBen Gras
2fe8fb19SBen Gras    aSign = extractFloat128Sign( a );
2fe8fb19SBen Gras    bSign = extractFloat128Sign( b );
2fe8fb19SBen Gras    if ( aSign == bSign ) {
2fe8fb19SBen Gras        return subFloat128Sigs( a, b, aSign );
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    else {
2fe8fb19SBen Gras        return addFloat128Sigs( a, b, aSign );
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras
2fe8fb19SBen Gras}
2fe8fb19SBen Gras
2fe8fb19SBen Gras/*
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen GrasReturns the result of multiplying the quadruple-precision floating-point
2fe8fb19SBen Grasvalues `a' and `b'.  The operation is performed according to the IEC/IEEE
2fe8fb19SBen GrasStandard for Binary Floating-Point Arithmetic.
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen Gras*/
2fe8fb19SBen Grasfloat128 float128_mul( float128 a, float128 b )
2fe8fb19SBen Gras{
2fe8fb19SBen Gras    flag aSign, bSign, zSign;
2fe8fb19SBen Gras    int32 aExp, bExp, zExp;
2fe8fb19SBen Gras    bits64 aSig0, aSig1, bSig0, bSig1, zSig0, zSig1, zSig2, zSig3;
2fe8fb19SBen Gras    float128 z;
2fe8fb19SBen Gras
2fe8fb19SBen Gras    aSig1 = extractFloat128Frac1( a );
2fe8fb19SBen Gras    aSig0 = extractFloat128Frac0( a );
2fe8fb19SBen Gras    aExp = extractFloat128Exp( a );
2fe8fb19SBen Gras    aSign = extractFloat128Sign( a );
2fe8fb19SBen Gras    bSig1 = extractFloat128Frac1( b );
2fe8fb19SBen Gras    bSig0 = extractFloat128Frac0( b );
2fe8fb19SBen Gras    bExp = extractFloat128Exp( b );
2fe8fb19SBen Gras    bSign = extractFloat128Sign( b );
2fe8fb19SBen Gras    zSign = aSign ^ bSign;
2fe8fb19SBen Gras    if ( aExp == 0x7FFF ) {
2fe8fb19SBen Gras        if (    ( aSig0 | aSig1 )
2fe8fb19SBen Gras             || ( ( bExp == 0x7FFF ) && ( bSig0 | bSig1 ) ) ) {
2fe8fb19SBen Gras            return propagateFloat128NaN( a, b );
2fe8fb19SBen Gras        }
2fe8fb19SBen Gras        if ( ( bExp | bSig0 | bSig1 ) == 0 ) goto invalid;
2fe8fb19SBen Gras        return packFloat128( zSign, 0x7FFF, 0, 0 );
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    if ( bExp == 0x7FFF ) {
2fe8fb19SBen Gras        if ( bSig0 | bSig1 ) return propagateFloat128NaN( a, b );
2fe8fb19SBen Gras        if ( ( aExp | aSig0 | aSig1 ) == 0 ) {
2fe8fb19SBen Gras invalid:
2fe8fb19SBen Gras            float_raise( float_flag_invalid );
2fe8fb19SBen Gras            z.low = float128_default_nan_low;
2fe8fb19SBen Gras            z.high = float128_default_nan_high;
2fe8fb19SBen Gras            return z;
2fe8fb19SBen Gras        }
2fe8fb19SBen Gras        return packFloat128( zSign, 0x7FFF, 0, 0 );
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    if ( aExp == 0 ) {
2fe8fb19SBen Gras        if ( ( aSig0 | aSig1 ) == 0 ) return packFloat128( zSign, 0, 0, 0 );
2fe8fb19SBen Gras        normalizeFloat128Subnormal( aSig0, aSig1, &aExp, &aSig0, &aSig1 );
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    if ( bExp == 0 ) {
2fe8fb19SBen Gras        if ( ( bSig0 | bSig1 ) == 0 ) return packFloat128( zSign, 0, 0, 0 );
2fe8fb19SBen Gras        normalizeFloat128Subnormal( bSig0, bSig1, &bExp, &bSig0, &bSig1 );
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    zExp = aExp + bExp - 0x4000;
2fe8fb19SBen Gras    aSig0 |= LIT64( 0x0001000000000000 );
2fe8fb19SBen Gras    shortShift128Left( bSig0, bSig1, 16, &bSig0, &bSig1 );
2fe8fb19SBen Gras    mul128To256( aSig0, aSig1, bSig0, bSig1, &zSig0, &zSig1, &zSig2, &zSig3 );
2fe8fb19SBen Gras    add128( zSig0, zSig1, aSig0, aSig1, &zSig0, &zSig1 );
2fe8fb19SBen Gras    zSig2 |= ( zSig3 != 0 );
2fe8fb19SBen Gras    if ( LIT64( 0x0002000000000000 ) <= zSig0 ) {
2fe8fb19SBen Gras        shift128ExtraRightJamming(
2fe8fb19SBen Gras            zSig0, zSig1, zSig2, 1, &zSig0, &zSig1, &zSig2 );
2fe8fb19SBen Gras        ++zExp;
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    return roundAndPackFloat128( zSign, zExp, zSig0, zSig1, zSig2 );
2fe8fb19SBen Gras
2fe8fb19SBen Gras}
2fe8fb19SBen Gras
2fe8fb19SBen Gras/*
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen GrasReturns the result of dividing the quadruple-precision floating-point value
2fe8fb19SBen Gras`a' by the corresponding value `b'.  The operation is performed according to
2fe8fb19SBen Grasthe IEC/IEEE Standard for Binary Floating-Point Arithmetic.
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen Gras*/
2fe8fb19SBen Grasfloat128 float128_div( float128 a, float128 b )
2fe8fb19SBen Gras{
2fe8fb19SBen Gras    flag aSign, bSign, zSign;
2fe8fb19SBen Gras    int32 aExp, bExp, zExp;
2fe8fb19SBen Gras    bits64 aSig0, aSig1, bSig0, bSig1, zSig0, zSig1, zSig2;
2fe8fb19SBen Gras    bits64 rem0, rem1, rem2, rem3, term0, term1, term2, term3;
2fe8fb19SBen Gras    float128 z;
2fe8fb19SBen Gras
2fe8fb19SBen Gras    aSig1 = extractFloat128Frac1( a );
2fe8fb19SBen Gras    aSig0 = extractFloat128Frac0( a );
2fe8fb19SBen Gras    aExp = extractFloat128Exp( a );
2fe8fb19SBen Gras    aSign = extractFloat128Sign( a );
2fe8fb19SBen Gras    bSig1 = extractFloat128Frac1( b );
2fe8fb19SBen Gras    bSig0 = extractFloat128Frac0( b );
2fe8fb19SBen Gras    bExp = extractFloat128Exp( b );
2fe8fb19SBen Gras    bSign = extractFloat128Sign( b );
2fe8fb19SBen Gras    zSign = aSign ^ bSign;
2fe8fb19SBen Gras    if ( aExp == 0x7FFF ) {
2fe8fb19SBen Gras        if ( aSig0 | aSig1 ) return propagateFloat128NaN( a, b );
2fe8fb19SBen Gras        if ( bExp == 0x7FFF ) {
2fe8fb19SBen Gras            if ( bSig0 | bSig1 ) return propagateFloat128NaN( a, b );
2fe8fb19SBen Gras            goto invalid;
2fe8fb19SBen Gras        }
2fe8fb19SBen Gras        return packFloat128( zSign, 0x7FFF, 0, 0 );
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    if ( bExp == 0x7FFF ) {
2fe8fb19SBen Gras        if ( bSig0 | bSig1 ) return propagateFloat128NaN( a, b );
2fe8fb19SBen Gras        return packFloat128( zSign, 0, 0, 0 );
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    if ( bExp == 0 ) {
2fe8fb19SBen Gras        if ( ( bSig0 | bSig1 ) == 0 ) {
2fe8fb19SBen Gras            if ( ( aExp | aSig0 | aSig1 ) == 0 ) {
2fe8fb19SBen Gras invalid:
2fe8fb19SBen Gras                float_raise( float_flag_invalid );
2fe8fb19SBen Gras                z.low = float128_default_nan_low;
2fe8fb19SBen Gras                z.high = float128_default_nan_high;
2fe8fb19SBen Gras                return z;
2fe8fb19SBen Gras            }
2fe8fb19SBen Gras            float_raise( float_flag_divbyzero );
2fe8fb19SBen Gras            return packFloat128( zSign, 0x7FFF, 0, 0 );
2fe8fb19SBen Gras        }
2fe8fb19SBen Gras        normalizeFloat128Subnormal( bSig0, bSig1, &bExp, &bSig0, &bSig1 );
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    if ( aExp == 0 ) {
2fe8fb19SBen Gras        if ( ( aSig0 | aSig1 ) == 0 ) return packFloat128( zSign, 0, 0, 0 );
2fe8fb19SBen Gras        normalizeFloat128Subnormal( aSig0, aSig1, &aExp, &aSig0, &aSig1 );
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    zExp = aExp - bExp + 0x3FFD;
2fe8fb19SBen Gras    shortShift128Left(
2fe8fb19SBen Gras        aSig0 | LIT64( 0x0001000000000000 ), aSig1, 15, &aSig0, &aSig1 );
2fe8fb19SBen Gras    shortShift128Left(
2fe8fb19SBen Gras        bSig0 | LIT64( 0x0001000000000000 ), bSig1, 15, &bSig0, &bSig1 );
2fe8fb19SBen Gras    if ( le128( bSig0, bSig1, aSig0, aSig1 ) ) {
2fe8fb19SBen Gras        shift128Right( aSig0, aSig1, 1, &aSig0, &aSig1 );
2fe8fb19SBen Gras        ++zExp;
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    zSig0 = estimateDiv128To64( aSig0, aSig1, bSig0 );
2fe8fb19SBen Gras    mul128By64To192( bSig0, bSig1, zSig0, &term0, &term1, &term2 );
2fe8fb19SBen Gras    sub192( aSig0, aSig1, 0, term0, term1, term2, &rem0, &rem1, &rem2 );
2fe8fb19SBen Gras    while ( (sbits64) rem0 < 0 ) {
2fe8fb19SBen Gras        --zSig0;
2fe8fb19SBen Gras        add192( rem0, rem1, rem2, 0, bSig0, bSig1, &rem0, &rem1, &rem2 );
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    zSig1 = estimateDiv128To64( rem1, rem2, bSig0 );
2fe8fb19SBen Gras    if ( ( zSig1 & 0x3FFF ) <= 4 ) {
2fe8fb19SBen Gras        mul128By64To192( bSig0, bSig1, zSig1, &term1, &term2, &term3 );
2fe8fb19SBen Gras        sub192( rem1, rem2, 0, term1, term2, term3, &rem1, &rem2, &rem3 );
2fe8fb19SBen Gras        while ( (sbits64) rem1 < 0 ) {
2fe8fb19SBen Gras            --zSig1;
2fe8fb19SBen Gras            add192( rem1, rem2, rem3, 0, bSig0, bSig1, &rem1, &rem2, &rem3 );
2fe8fb19SBen Gras        }
2fe8fb19SBen Gras        zSig1 |= ( ( rem1 | rem2 | rem3 ) != 0 );
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    shift128ExtraRightJamming( zSig0, zSig1, 0, 15, &zSig0, &zSig1, &zSig2 );
2fe8fb19SBen Gras    return roundAndPackFloat128( zSign, zExp, zSig0, zSig1, zSig2 );
2fe8fb19SBen Gras
2fe8fb19SBen Gras}
2fe8fb19SBen Gras
2fe8fb19SBen Gras/*
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen GrasReturns the remainder of the quadruple-precision floating-point value `a'
2fe8fb19SBen Graswith respect to the corresponding value `b'.  The operation is performed
2fe8fb19SBen Grasaccording to the IEC/IEEE Standard for Binary Floating-Point Arithmetic.
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen Gras*/
2fe8fb19SBen Grasfloat128 float128_rem( float128 a, float128 b )
2fe8fb19SBen Gras{
f14fb602SLionel Sambuc    flag aSign, zSign;
2fe8fb19SBen Gras    int32 aExp, bExp, expDiff;
2fe8fb19SBen Gras    bits64 aSig0, aSig1, bSig0, bSig1, q, term0, term1, term2;
2fe8fb19SBen Gras    bits64 allZero, alternateASig0, alternateASig1, sigMean1;
2fe8fb19SBen Gras    sbits64 sigMean0;
2fe8fb19SBen Gras    float128 z;
2fe8fb19SBen Gras
2fe8fb19SBen Gras    aSig1 = extractFloat128Frac1( a );
2fe8fb19SBen Gras    aSig0 = extractFloat128Frac0( a );
2fe8fb19SBen Gras    aExp = extractFloat128Exp( a );
2fe8fb19SBen Gras    aSign = extractFloat128Sign( a );
2fe8fb19SBen Gras    bSig1 = extractFloat128Frac1( b );
2fe8fb19SBen Gras    bSig0 = extractFloat128Frac0( b );
2fe8fb19SBen Gras    bExp = extractFloat128Exp( b );
2fe8fb19SBen Gras    if ( aExp == 0x7FFF ) {
2fe8fb19SBen Gras        if (    ( aSig0 | aSig1 )
2fe8fb19SBen Gras             || ( ( bExp == 0x7FFF ) && ( bSig0 | bSig1 ) ) ) {
2fe8fb19SBen Gras            return propagateFloat128NaN( a, b );
2fe8fb19SBen Gras        }
2fe8fb19SBen Gras        goto invalid;
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    if ( bExp == 0x7FFF ) {
2fe8fb19SBen Gras        if ( bSig0 | bSig1 ) return propagateFloat128NaN( a, b );
2fe8fb19SBen Gras        return a;
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    if ( bExp == 0 ) {
2fe8fb19SBen Gras        if ( ( bSig0 | bSig1 ) == 0 ) {
2fe8fb19SBen Gras invalid:
2fe8fb19SBen Gras            float_raise( float_flag_invalid );
2fe8fb19SBen Gras            z.low = float128_default_nan_low;
2fe8fb19SBen Gras            z.high = float128_default_nan_high;
2fe8fb19SBen Gras            return z;
2fe8fb19SBen Gras        }
2fe8fb19SBen Gras        normalizeFloat128Subnormal( bSig0, bSig1, &bExp, &bSig0, &bSig1 );
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    if ( aExp == 0 ) {
2fe8fb19SBen Gras        if ( ( aSig0 | aSig1 ) == 0 ) return a;
2fe8fb19SBen Gras        normalizeFloat128Subnormal( aSig0, aSig1, &aExp, &aSig0, &aSig1 );
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    expDiff = aExp - bExp;
2fe8fb19SBen Gras    if ( expDiff < -1 ) return a;
2fe8fb19SBen Gras    shortShift128Left(
2fe8fb19SBen Gras        aSig0 | LIT64( 0x0001000000000000 ),
2fe8fb19SBen Gras        aSig1,
2fe8fb19SBen Gras        15 - ( expDiff < 0 ),
2fe8fb19SBen Gras        &aSig0,
2fe8fb19SBen Gras        &aSig1
2fe8fb19SBen Gras    );
2fe8fb19SBen Gras    shortShift128Left(
2fe8fb19SBen Gras        bSig0 | LIT64( 0x0001000000000000 ), bSig1, 15, &bSig0, &bSig1 );
2fe8fb19SBen Gras    q = le128( bSig0, bSig1, aSig0, aSig1 );
2fe8fb19SBen Gras    if ( q ) sub128( aSig0, aSig1, bSig0, bSig1, &aSig0, &aSig1 );
2fe8fb19SBen Gras    expDiff -= 64;
2fe8fb19SBen Gras    while ( 0 < expDiff ) {
2fe8fb19SBen Gras        q = estimateDiv128To64( aSig0, aSig1, bSig0 );
2fe8fb19SBen Gras        q = ( 4 < q ) ? q - 4 : 0;
2fe8fb19SBen Gras        mul128By64To192( bSig0, bSig1, q, &term0, &term1, &term2 );
2fe8fb19SBen Gras        shortShift192Left( term0, term1, term2, 61, &term1, &term2, &allZero );
2fe8fb19SBen Gras        shortShift128Left( aSig0, aSig1, 61, &aSig0, &allZero );
2fe8fb19SBen Gras        sub128( aSig0, 0, term1, term2, &aSig0, &aSig1 );
2fe8fb19SBen Gras        expDiff -= 61;
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    if ( -64 < expDiff ) {
2fe8fb19SBen Gras        q = estimateDiv128To64( aSig0, aSig1, bSig0 );
2fe8fb19SBen Gras        q = ( 4 < q ) ? q - 4 : 0;
2fe8fb19SBen Gras        q >>= - expDiff;
2fe8fb19SBen Gras        shift128Right( bSig0, bSig1, 12, &bSig0, &bSig1 );
2fe8fb19SBen Gras        expDiff += 52;
2fe8fb19SBen Gras        if ( expDiff < 0 ) {
2fe8fb19SBen Gras            shift128Right( aSig0, aSig1, - expDiff, &aSig0, &aSig1 );
2fe8fb19SBen Gras        }
2fe8fb19SBen Gras        else {
2fe8fb19SBen Gras            shortShift128Left( aSig0, aSig1, expDiff, &aSig0, &aSig1 );
2fe8fb19SBen Gras        }
2fe8fb19SBen Gras        mul128By64To192( bSig0, bSig1, q, &term0, &term1, &term2 );
2fe8fb19SBen Gras        sub128( aSig0, aSig1, term1, term2, &aSig0, &aSig1 );
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    else {
2fe8fb19SBen Gras        shift128Right( aSig0, aSig1, 12, &aSig0, &aSig1 );
2fe8fb19SBen Gras        shift128Right( bSig0, bSig1, 12, &bSig0, &bSig1 );
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    do {
2fe8fb19SBen Gras        alternateASig0 = aSig0;
2fe8fb19SBen Gras        alternateASig1 = aSig1;
2fe8fb19SBen Gras        ++q;
2fe8fb19SBen Gras        sub128( aSig0, aSig1, bSig0, bSig1, &aSig0, &aSig1 );
2fe8fb19SBen Gras    } while ( 0 <= (sbits64) aSig0 );
2fe8fb19SBen Gras    add128(
2fe8fb19SBen Gras        aSig0, aSig1, alternateASig0, alternateASig1, (bits64 *)&sigMean0, &sigMean1 );
2fe8fb19SBen Gras    if (    ( sigMean0 < 0 )
2fe8fb19SBen Gras         || ( ( ( sigMean0 | sigMean1 ) == 0 ) && ( q & 1 ) ) ) {
2fe8fb19SBen Gras        aSig0 = alternateASig0;
2fe8fb19SBen Gras        aSig1 = alternateASig1;
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    zSign = ( (sbits64) aSig0 < 0 );
2fe8fb19SBen Gras    if ( zSign ) sub128( 0, 0, aSig0, aSig1, &aSig0, &aSig1 );
2fe8fb19SBen Gras    return
2fe8fb19SBen Gras        normalizeRoundAndPackFloat128( aSign ^ zSign, bExp - 4, aSig0, aSig1 );
2fe8fb19SBen Gras
2fe8fb19SBen Gras}
2fe8fb19SBen Gras
2fe8fb19SBen Gras/*
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen GrasReturns the square root of the quadruple-precision floating-point value `a'.
2fe8fb19SBen GrasThe operation is performed according to the IEC/IEEE Standard for Binary
2fe8fb19SBen GrasFloating-Point Arithmetic.
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen Gras*/
2fe8fb19SBen Grasfloat128 float128_sqrt( float128 a )
2fe8fb19SBen Gras{
2fe8fb19SBen Gras    flag aSign;
2fe8fb19SBen Gras    int32 aExp, zExp;
2fe8fb19SBen Gras    bits64 aSig0, aSig1, zSig0, zSig1, zSig2, doubleZSig0;
2fe8fb19SBen Gras    bits64 rem0, rem1, rem2, rem3, term0, term1, term2, term3;
2fe8fb19SBen Gras    float128 z;
2fe8fb19SBen Gras
2fe8fb19SBen Gras    aSig1 = extractFloat128Frac1( a );
2fe8fb19SBen Gras    aSig0 = extractFloat128Frac0( a );
2fe8fb19SBen Gras    aExp = extractFloat128Exp( a );
2fe8fb19SBen Gras    aSign = extractFloat128Sign( a );
2fe8fb19SBen Gras    if ( aExp == 0x7FFF ) {
2fe8fb19SBen Gras        if ( aSig0 | aSig1 ) return propagateFloat128NaN( a, a );
2fe8fb19SBen Gras        if ( ! aSign ) return a;
2fe8fb19SBen Gras        goto invalid;
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    if ( aSign ) {
2fe8fb19SBen Gras        if ( ( aExp | aSig0 | aSig1 ) == 0 ) return a;
2fe8fb19SBen Gras invalid:
2fe8fb19SBen Gras        float_raise( float_flag_invalid );
2fe8fb19SBen Gras        z.low = float128_default_nan_low;
2fe8fb19SBen Gras        z.high = float128_default_nan_high;
2fe8fb19SBen Gras        return z;
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    if ( aExp == 0 ) {
2fe8fb19SBen Gras        if ( ( aSig0 | aSig1 ) == 0 ) return packFloat128( 0, 0, 0, 0 );
2fe8fb19SBen Gras        normalizeFloat128Subnormal( aSig0, aSig1, &aExp, &aSig0, &aSig1 );
2fe8fb19SBen Gras    }
*84d9c625SLionel Sambuc    zExp = (int32) ( (aExp - 0x3FFF) >> 1) + 0x3FFE;
2fe8fb19SBen Gras    aSig0 |= LIT64( 0x0001000000000000 );
f14fb602SLionel Sambuc    zSig0 = estimateSqrt32((int16)aExp, (bits32)(aSig0>>17));
2fe8fb19SBen Gras    shortShift128Left( aSig0, aSig1, 13 - ( aExp & 1 ), &aSig0, &aSig1 );
2fe8fb19SBen Gras    zSig0 = estimateDiv128To64( aSig0, aSig1, zSig0<<32 ) + ( zSig0<<30 );
2fe8fb19SBen Gras    doubleZSig0 = zSig0<<1;
2fe8fb19SBen Gras    mul64To128( zSig0, zSig0, &term0, &term1 );
2fe8fb19SBen Gras    sub128( aSig0, aSig1, term0, term1, &rem0, &rem1 );
2fe8fb19SBen Gras    while ( (sbits64) rem0 < 0 ) {
2fe8fb19SBen Gras        --zSig0;
2fe8fb19SBen Gras        doubleZSig0 -= 2;
2fe8fb19SBen Gras        add128( rem0, rem1, zSig0>>63, doubleZSig0 | 1, &rem0, &rem1 );
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    zSig1 = estimateDiv128To64( rem1, 0, doubleZSig0 );
2fe8fb19SBen Gras    if ( ( zSig1 & 0x1FFF ) <= 5 ) {
2fe8fb19SBen Gras        if ( zSig1 == 0 ) zSig1 = 1;
2fe8fb19SBen Gras        mul64To128( doubleZSig0, zSig1, &term1, &term2 );
2fe8fb19SBen Gras        sub128( rem1, 0, term1, term2, &rem1, &rem2 );
2fe8fb19SBen Gras        mul64To128( zSig1, zSig1, &term2, &term3 );
2fe8fb19SBen Gras        sub192( rem1, rem2, 0, 0, term2, term3, &rem1, &rem2, &rem3 );
2fe8fb19SBen Gras        while ( (sbits64) rem1 < 0 ) {
2fe8fb19SBen Gras            --zSig1;
2fe8fb19SBen Gras            shortShift128Left( 0, zSig1, 1, &term2, &term3 );
2fe8fb19SBen Gras            term3 |= 1;
2fe8fb19SBen Gras            term2 |= doubleZSig0;
2fe8fb19SBen Gras            add192( rem1, rem2, rem3, 0, term2, term3, &rem1, &rem2, &rem3 );
2fe8fb19SBen Gras        }
2fe8fb19SBen Gras        zSig1 |= ( ( rem1 | rem2 | rem3 ) != 0 );
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    shift128ExtraRightJamming( zSig0, zSig1, 0, 14, &zSig0, &zSig1, &zSig2 );
2fe8fb19SBen Gras    return roundAndPackFloat128( 0, zExp, zSig0, zSig1, zSig2 );
2fe8fb19SBen Gras
2fe8fb19SBen Gras}
2fe8fb19SBen Gras
2fe8fb19SBen Gras/*
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen GrasReturns 1 if the quadruple-precision floating-point value `a' is equal to
2fe8fb19SBen Grasthe corresponding value `b', and 0 otherwise.  The comparison is performed
2fe8fb19SBen Grasaccording to the IEC/IEEE Standard for Binary Floating-Point Arithmetic.
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen Gras*/
2fe8fb19SBen Grasflag float128_eq( float128 a, float128 b )
2fe8fb19SBen Gras{
2fe8fb19SBen Gras
2fe8fb19SBen Gras    if (    (    ( extractFloat128Exp( a ) == 0x7FFF )
2fe8fb19SBen Gras              && ( extractFloat128Frac0( a ) | extractFloat128Frac1( a ) ) )
2fe8fb19SBen Gras         || (    ( extractFloat128Exp( b ) == 0x7FFF )
2fe8fb19SBen Gras              && ( extractFloat128Frac0( b ) | extractFloat128Frac1( b ) ) )
2fe8fb19SBen Gras       ) {
2fe8fb19SBen Gras        if (    float128_is_signaling_nan( a )
2fe8fb19SBen Gras             || float128_is_signaling_nan( b ) ) {
2fe8fb19SBen Gras            float_raise( float_flag_invalid );
2fe8fb19SBen Gras        }
2fe8fb19SBen Gras        return 0;
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    return
2fe8fb19SBen Gras           ( a.low == b.low )
2fe8fb19SBen Gras        && (    ( a.high == b.high )
2fe8fb19SBen Gras             || (    ( a.low == 0 )
2fe8fb19SBen Gras                  && ( (bits64) ( ( a.high | b.high )<<1 ) == 0 ) )
2fe8fb19SBen Gras           );
2fe8fb19SBen Gras
2fe8fb19SBen Gras}
2fe8fb19SBen Gras
2fe8fb19SBen Gras/*
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen GrasReturns 1 if the quadruple-precision floating-point value `a' is less than
2fe8fb19SBen Grasor equal to the corresponding value `b', and 0 otherwise.  The comparison
2fe8fb19SBen Grasis performed according to the IEC/IEEE Standard for Binary Floating-Point
2fe8fb19SBen GrasArithmetic.
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen Gras*/
2fe8fb19SBen Grasflag float128_le( float128 a, float128 b )
2fe8fb19SBen Gras{
2fe8fb19SBen Gras    flag aSign, bSign;
2fe8fb19SBen Gras
2fe8fb19SBen Gras    if (    (    ( extractFloat128Exp( a ) == 0x7FFF )
2fe8fb19SBen Gras              && ( extractFloat128Frac0( a ) | extractFloat128Frac1( a ) ) )
2fe8fb19SBen Gras         || (    ( extractFloat128Exp( b ) == 0x7FFF )
2fe8fb19SBen Gras              && ( extractFloat128Frac0( b ) | extractFloat128Frac1( b ) ) )
2fe8fb19SBen Gras       ) {
2fe8fb19SBen Gras        float_raise( float_flag_invalid );
2fe8fb19SBen Gras        return 0;
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    aSign = extractFloat128Sign( a );
2fe8fb19SBen Gras    bSign = extractFloat128Sign( b );
2fe8fb19SBen Gras    if ( aSign != bSign ) {
2fe8fb19SBen Gras        return
2fe8fb19SBen Gras               aSign
2fe8fb19SBen Gras            || (    ( ( (bits64) ( ( a.high | b.high )<<1 ) ) | a.low | b.low )
2fe8fb19SBen Gras                 == 0 );
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    return
2fe8fb19SBen Gras          aSign ? le128( b.high, b.low, a.high, a.low )
2fe8fb19SBen Gras        : le128( a.high, a.low, b.high, b.low );
2fe8fb19SBen Gras
2fe8fb19SBen Gras}
2fe8fb19SBen Gras
2fe8fb19SBen Gras/*
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen GrasReturns 1 if the quadruple-precision floating-point value `a' is less than
2fe8fb19SBen Grasthe corresponding value `b', and 0 otherwise.  The comparison is performed
2fe8fb19SBen Grasaccording to the IEC/IEEE Standard for Binary Floating-Point Arithmetic.
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen Gras*/
2fe8fb19SBen Grasflag float128_lt( float128 a, float128 b )
2fe8fb19SBen Gras{
2fe8fb19SBen Gras    flag aSign, bSign;
2fe8fb19SBen Gras
2fe8fb19SBen Gras    if (    (    ( extractFloat128Exp( a ) == 0x7FFF )
2fe8fb19SBen Gras              && ( extractFloat128Frac0( a ) | extractFloat128Frac1( a ) ) )
2fe8fb19SBen Gras         || (    ( extractFloat128Exp( b ) == 0x7FFF )
2fe8fb19SBen Gras              && ( extractFloat128Frac0( b ) | extractFloat128Frac1( b ) ) )
2fe8fb19SBen Gras       ) {
2fe8fb19SBen Gras        float_raise( float_flag_invalid );
2fe8fb19SBen Gras        return 0;
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    aSign = extractFloat128Sign( a );
2fe8fb19SBen Gras    bSign = extractFloat128Sign( b );
2fe8fb19SBen Gras    if ( aSign != bSign ) {
2fe8fb19SBen Gras        return
2fe8fb19SBen Gras               aSign
2fe8fb19SBen Gras            && (    ( ( (bits64) ( ( a.high | b.high )<<1 ) ) | a.low | b.low )
2fe8fb19SBen Gras                 != 0 );
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    return
2fe8fb19SBen Gras          aSign ? lt128( b.high, b.low, a.high, a.low )
2fe8fb19SBen Gras        : lt128( a.high, a.low, b.high, b.low );
2fe8fb19SBen Gras
2fe8fb19SBen Gras}
2fe8fb19SBen Gras
2fe8fb19SBen Gras/*
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen GrasReturns 1 if the quadruple-precision floating-point value `a' is equal to
2fe8fb19SBen Grasthe corresponding value `b', and 0 otherwise.  The invalid exception is
2fe8fb19SBen Grasraised if either operand is a NaN.  Otherwise, the comparison is performed
2fe8fb19SBen Grasaccording to the IEC/IEEE Standard for Binary Floating-Point Arithmetic.
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen Gras*/
2fe8fb19SBen Grasflag float128_eq_signaling( float128 a, float128 b )
2fe8fb19SBen Gras{
2fe8fb19SBen Gras
2fe8fb19SBen Gras    if (    (    ( extractFloat128Exp( a ) == 0x7FFF )
2fe8fb19SBen Gras              && ( extractFloat128Frac0( a ) | extractFloat128Frac1( a ) ) )
2fe8fb19SBen Gras         || (    ( extractFloat128Exp( b ) == 0x7FFF )
2fe8fb19SBen Gras              && ( extractFloat128Frac0( b ) | extractFloat128Frac1( b ) ) )
2fe8fb19SBen Gras       ) {
2fe8fb19SBen Gras        float_raise( float_flag_invalid );
2fe8fb19SBen Gras        return 0;
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    return
2fe8fb19SBen Gras           ( a.low == b.low )
2fe8fb19SBen Gras        && (    ( a.high == b.high )
2fe8fb19SBen Gras             || (    ( a.low == 0 )
2fe8fb19SBen Gras                  && ( (bits64) ( ( a.high | b.high )<<1 ) == 0 ) )
2fe8fb19SBen Gras           );
2fe8fb19SBen Gras
2fe8fb19SBen Gras}
2fe8fb19SBen Gras
2fe8fb19SBen Gras/*
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen GrasReturns 1 if the quadruple-precision floating-point value `a' is less than
2fe8fb19SBen Grasor equal to the corresponding value `b', and 0 otherwise.  Quiet NaNs do not
2fe8fb19SBen Grascause an exception.  Otherwise, the comparison is performed according to the
2fe8fb19SBen GrasIEC/IEEE Standard for Binary Floating-Point Arithmetic.
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen Gras*/
2fe8fb19SBen Grasflag float128_le_quiet( float128 a, float128 b )
2fe8fb19SBen Gras{
2fe8fb19SBen Gras    flag aSign, bSign;
2fe8fb19SBen Gras
2fe8fb19SBen Gras    if (    (    ( extractFloat128Exp( a ) == 0x7FFF )
2fe8fb19SBen Gras              && ( extractFloat128Frac0( a ) | extractFloat128Frac1( a ) ) )
2fe8fb19SBen Gras         || (    ( extractFloat128Exp( b ) == 0x7FFF )
2fe8fb19SBen Gras              && ( extractFloat128Frac0( b ) | extractFloat128Frac1( b ) ) )
2fe8fb19SBen Gras       ) {
2fe8fb19SBen Gras        if (    float128_is_signaling_nan( a )
2fe8fb19SBen Gras             || float128_is_signaling_nan( b ) ) {
2fe8fb19SBen Gras            float_raise( float_flag_invalid );
2fe8fb19SBen Gras        }
2fe8fb19SBen Gras        return 0;
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    aSign = extractFloat128Sign( a );
2fe8fb19SBen Gras    bSign = extractFloat128Sign( b );
2fe8fb19SBen Gras    if ( aSign != bSign ) {
2fe8fb19SBen Gras        return
2fe8fb19SBen Gras               aSign
2fe8fb19SBen Gras            || (    ( ( (bits64) ( ( a.high | b.high )<<1 ) ) | a.low | b.low )
2fe8fb19SBen Gras                 == 0 );
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    return
2fe8fb19SBen Gras          aSign ? le128( b.high, b.low, a.high, a.low )
2fe8fb19SBen Gras        : le128( a.high, a.low, b.high, b.low );
2fe8fb19SBen Gras
2fe8fb19SBen Gras}
2fe8fb19SBen Gras
2fe8fb19SBen Gras/*
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen GrasReturns 1 if the quadruple-precision floating-point value `a' is less than
2fe8fb19SBen Grasthe corresponding value `b', and 0 otherwise.  Quiet NaNs do not cause an
2fe8fb19SBen Grasexception.  Otherwise, the comparison is performed according to the IEC/IEEE
2fe8fb19SBen GrasStandard for Binary Floating-Point Arithmetic.
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen Gras*/
2fe8fb19SBen Grasflag float128_lt_quiet( float128 a, float128 b )
2fe8fb19SBen Gras{
2fe8fb19SBen Gras    flag aSign, bSign;
2fe8fb19SBen Gras
2fe8fb19SBen Gras    if (    (    ( extractFloat128Exp( a ) == 0x7FFF )
2fe8fb19SBen Gras              && ( extractFloat128Frac0( a ) | extractFloat128Frac1( a ) ) )
2fe8fb19SBen Gras         || (    ( extractFloat128Exp( b ) == 0x7FFF )
2fe8fb19SBen Gras              && ( extractFloat128Frac0( b ) | extractFloat128Frac1( b ) ) )
2fe8fb19SBen Gras       ) {
2fe8fb19SBen Gras        if (    float128_is_signaling_nan( a )
2fe8fb19SBen Gras             || float128_is_signaling_nan( b ) ) {
2fe8fb19SBen Gras            float_raise( float_flag_invalid );
2fe8fb19SBen Gras        }
2fe8fb19SBen Gras        return 0;
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    aSign = extractFloat128Sign( a );
2fe8fb19SBen Gras    bSign = extractFloat128Sign( b );
2fe8fb19SBen Gras    if ( aSign != bSign ) {
2fe8fb19SBen Gras        return
2fe8fb19SBen Gras               aSign
2fe8fb19SBen Gras            && (    ( ( (bits64) ( ( a.high | b.high )<<1 ) ) | a.low | b.low )
2fe8fb19SBen Gras                 != 0 );
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    return
2fe8fb19SBen Gras          aSign ? lt128( b.high, b.low, a.high, a.low )
2fe8fb19SBen Gras        : lt128( a.high, a.low, b.high, b.low );
2fe8fb19SBen Gras
2fe8fb19SBen Gras}
2fe8fb19SBen Gras
2fe8fb19SBen Gras#endif
2fe8fb19SBen Gras
2fe8fb19SBen Gras
2fe8fb19SBen Gras#if defined(SOFTFLOAT_FOR_GCC) && defined(SOFTFLOAT_NEED_FIXUNS)
2fe8fb19SBen Gras
2fe8fb19SBen Gras/*
2fe8fb19SBen Gras * These two routines are not part of the original softfloat distribution.
2fe8fb19SBen Gras *
2fe8fb19SBen Gras * They are based on the corresponding conversions to integer but return
2fe8fb19SBen Gras * unsigned numbers instead since these functions are required by GCC.
2fe8fb19SBen Gras *
2fe8fb19SBen Gras * Added by Mark Brinicombe <mark@NetBSD.org>	27/09/97
2fe8fb19SBen Gras *
2fe8fb19SBen Gras * float64 version overhauled for SoftFloat 2a [bjh21 2000-07-15]
2fe8fb19SBen Gras */
2fe8fb19SBen Gras
2fe8fb19SBen Gras/*
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen GrasReturns the result of converting the double-precision floating-point value
2fe8fb19SBen Gras`a' to the 32-bit unsigned integer format.  The conversion is
2fe8fb19SBen Grasperformed according to the IEC/IEEE Standard for Binary Floating-point
2fe8fb19SBen GrasArithmetic, except that the conversion is always rounded toward zero.  If
2fe8fb19SBen Gras`a' is a NaN, the largest positive integer is returned.  If the conversion
2fe8fb19SBen Grasoverflows, the largest integer positive is returned.
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen Gras*/
2fe8fb19SBen Grasuint32 float64_to_uint32_round_to_zero( float64 a )
2fe8fb19SBen Gras{
2fe8fb19SBen Gras    flag aSign;
2fe8fb19SBen Gras    int16 aExp, shiftCount;
2fe8fb19SBen Gras    bits64 aSig, savedASig;
2fe8fb19SBen Gras    uint32 z;
2fe8fb19SBen Gras
2fe8fb19SBen Gras    aSig = extractFloat64Frac( a );
2fe8fb19SBen Gras    aExp = extractFloat64Exp( a );
2fe8fb19SBen Gras    aSign = extractFloat64Sign( a );
2fe8fb19SBen Gras
2fe8fb19SBen Gras    if (aSign) {
2fe8fb19SBen Gras        float_raise( float_flag_invalid );
2fe8fb19SBen Gras    	return(0);
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras
2fe8fb19SBen Gras    if ( 0x41E < aExp ) {
2fe8fb19SBen Gras        float_raise( float_flag_invalid );
2fe8fb19SBen Gras        return 0xffffffff;
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    else if ( aExp < 0x3FF ) {
*84d9c625SLionel Sambuc        if ( aExp || aSig ) set_float_exception_inexact_flag();
2fe8fb19SBen Gras        return 0;
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    aSig |= LIT64( 0x0010000000000000 );
2fe8fb19SBen Gras    shiftCount = 0x433 - aExp;
2fe8fb19SBen Gras    savedASig = aSig;
2fe8fb19SBen Gras    aSig >>= shiftCount;
f14fb602SLionel Sambuc    z = (uint32)aSig;
2fe8fb19SBen Gras    if ( ( aSig<<shiftCount ) != savedASig ) {
*84d9c625SLionel Sambuc        set_float_exception_inexact_flag();
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    return z;
2fe8fb19SBen Gras
2fe8fb19SBen Gras}
2fe8fb19SBen Gras
2fe8fb19SBen Gras/*
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen GrasReturns the result of converting the single-precision floating-point value
2fe8fb19SBen Gras`a' to the 32-bit unsigned integer format.  The conversion is
2fe8fb19SBen Grasperformed according to the IEC/IEEE Standard for Binary Floating-point
2fe8fb19SBen GrasArithmetic, except that the conversion is always rounded toward zero.  If
2fe8fb19SBen Gras`a' is a NaN, the largest positive integer is returned.  If the conversion
2fe8fb19SBen Grasoverflows, the largest positive integer is returned.
2fe8fb19SBen Gras-------------------------------------------------------------------------------
2fe8fb19SBen Gras*/
2fe8fb19SBen Grasuint32 float32_to_uint32_round_to_zero( float32 a )
2fe8fb19SBen Gras{
2fe8fb19SBen Gras    flag aSign;
2fe8fb19SBen Gras    int16 aExp, shiftCount;
2fe8fb19SBen Gras    bits32 aSig;
2fe8fb19SBen Gras    uint32 z;
2fe8fb19SBen Gras
2fe8fb19SBen Gras    aSig = extractFloat32Frac( a );
2fe8fb19SBen Gras    aExp = extractFloat32Exp( a );
2fe8fb19SBen Gras    aSign = extractFloat32Sign( a );
2fe8fb19SBen Gras    shiftCount = aExp - 0x9E;
2fe8fb19SBen Gras
2fe8fb19SBen Gras    if (aSign) {
2fe8fb19SBen Gras        float_raise( float_flag_invalid );
2fe8fb19SBen Gras    	return(0);
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    if ( 0 < shiftCount ) {
2fe8fb19SBen Gras        float_raise( float_flag_invalid );
2fe8fb19SBen Gras        return 0xFFFFFFFF;
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    else if ( aExp <= 0x7E ) {
*84d9c625SLionel Sambuc        if ( aExp | aSig ) set_float_exception_inexact_flag();
2fe8fb19SBen Gras        return 0;
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    aSig = ( aSig | 0x800000 )<<8;
2fe8fb19SBen Gras    z = aSig>>( - shiftCount );
2fe8fb19SBen Gras    if ( aSig<<( shiftCount & 31 ) ) {
*84d9c625SLionel Sambuc        set_float_exception_inexact_flag();
2fe8fb19SBen Gras    }
2fe8fb19SBen Gras    return z;
2fe8fb19SBen Gras
2fe8fb19SBen Gras}
2fe8fb19SBen Gras
2fe8fb19SBen Gras#endif