mpfr/src/sub1.c

4a238c70SJohn Marino/* mpfr_sub1 -- internal function to perform a "real" subtraction
4a238c70SJohn Marino
*ab6d115fSJohn MarinoCopyright 2001, 2002, 2003, 2004, 2005, 2006, 2007, 2008, 2009, 2010, 2011, 2012, 2013 Free Software Foundation, Inc.
*ab6d115fSJohn MarinoContributed by the AriC and Caramel projects, INRIA.
4a238c70SJohn Marino
4a238c70SJohn MarinoThis file is part of the GNU MPFR Library.
4a238c70SJohn Marino
4a238c70SJohn MarinoThe GNU MPFR Library is free software; you can redistribute it and/or modify
4a238c70SJohn Marinoit under the terms of the GNU Lesser General Public License as published by
4a238c70SJohn Marinothe Free Software Foundation; either version 3 of the License, or (at your
4a238c70SJohn Marinooption) any later version.
4a238c70SJohn Marino
4a238c70SJohn MarinoThe GNU MPFR Library is distributed in the hope that it will be useful, but
4a238c70SJohn MarinoWITHOUT ANY WARRANTY; without even the implied warranty of MERCHANTABILITY
4a238c70SJohn Marinoor FITNESS FOR A PARTICULAR PURPOSE.  See the GNU Lesser General Public
4a238c70SJohn MarinoLicense for more details.
4a238c70SJohn Marino
4a238c70SJohn MarinoYou should have received a copy of the GNU Lesser General Public License
4a238c70SJohn Marinoalong with the GNU MPFR Library; see the file COPYING.LESSER.  If not, see
4a238c70SJohn Marinohttp://www.gnu.org/licenses/ or write to the Free Software Foundation, Inc.,
4a238c70SJohn Marino51 Franklin St, Fifth Floor, Boston, MA 02110-1301, USA. */
4a238c70SJohn Marino
4a238c70SJohn Marino#include "mpfr-impl.h"
4a238c70SJohn Marino
4a238c70SJohn Marino/* compute sign(b) * (|b| - |c|), with |b| > |c|, diff_exp = EXP(b) - EXP(c)
4a238c70SJohn Marino   Returns 0 iff result is exact,
4a238c70SJohn Marino   a negative value when the result is less than the exact value,
4a238c70SJohn Marino   a positive value otherwise.
4a238c70SJohn Marino*/
4a238c70SJohn Marino
4a238c70SJohn Marinoint
4a238c70SJohn Marinompfr_sub1 (mpfr_ptr a, mpfr_srcptr b, mpfr_srcptr c, mpfr_rnd_t rnd_mode)
4a238c70SJohn Marino{
4a238c70SJohn Marino  int sign;
4a238c70SJohn Marino  mpfr_uexp_t diff_exp;
4a238c70SJohn Marino  mpfr_prec_t cancel, cancel1;
4a238c70SJohn Marino  mp_size_t cancel2, an, bn, cn, cn0;
4a238c70SJohn Marino  mp_limb_t *ap, *bp, *cp;
4a238c70SJohn Marino  mp_limb_t carry, bb, cc;
4a238c70SJohn Marino  int inexact, shift_b, shift_c, add_exp = 0;
4a238c70SJohn Marino  int cmp_low = 0; /* used for rounding to nearest: 0 if low(b) = low(c),
4a238c70SJohn Marino                      negative if low(b) < low(c), positive if low(b)>low(c) */
4a238c70SJohn Marino  int sh, k;
4a238c70SJohn Marino  MPFR_TMP_DECL(marker);
4a238c70SJohn Marino
4a238c70SJohn Marino  MPFR_TMP_MARK(marker);
4a238c70SJohn Marino  ap = MPFR_MANT(a);
4a238c70SJohn Marino  an = MPFR_LIMB_SIZE(a);
4a238c70SJohn Marino
4a238c70SJohn Marino  sign = mpfr_cmp2 (b, c, &cancel);
4a238c70SJohn Marino  if (MPFR_UNLIKELY(sign == 0))
4a238c70SJohn Marino    {
4a238c70SJohn Marino      if (rnd_mode == MPFR_RNDD)
4a238c70SJohn Marino        MPFR_SET_NEG (a);
4a238c70SJohn Marino      else
4a238c70SJohn Marino        MPFR_SET_POS (a);
4a238c70SJohn Marino      MPFR_SET_ZERO (a);
4a238c70SJohn Marino      MPFR_RET (0);
4a238c70SJohn Marino    }
4a238c70SJohn Marino
4a238c70SJohn Marino  /*
4a238c70SJohn Marino   * If subtraction: sign(a) = sign * sign(b)
4a238c70SJohn Marino   * If addition: sign(a) = sign of the larger argument in absolute value.
4a238c70SJohn Marino   *
4a238c70SJohn Marino   * Both cases can be simplidied in:
4a238c70SJohn Marino   * if (sign>0)
4a238c70SJohn Marino   *    if addition: sign(a) = sign * sign(b) = sign(b)
4a238c70SJohn Marino   *    if subtraction, b is greater, so sign(a) = sign(b)
4a238c70SJohn Marino   * else
4a238c70SJohn Marino   *    if subtraction, sign(a) = - sign(b)
4a238c70SJohn Marino   *    if addition, sign(a) = sign(c) (since c is greater)
4a238c70SJohn Marino   *      But if it is an addition, sign(b) and sign(c) are opposed!
4a238c70SJohn Marino   *      So sign(a) = - sign(b)
4a238c70SJohn Marino   */
4a238c70SJohn Marino
4a238c70SJohn Marino  if (sign < 0) /* swap b and c so that |b| > |c| */
4a238c70SJohn Marino    {
4a238c70SJohn Marino      mpfr_srcptr t;
4a238c70SJohn Marino      MPFR_SET_OPPOSITE_SIGN (a,b);
4a238c70SJohn Marino      t = b; b = c; c = t;
4a238c70SJohn Marino    }
4a238c70SJohn Marino  else
4a238c70SJohn Marino    MPFR_SET_SAME_SIGN (a,b);
4a238c70SJohn Marino
4a238c70SJohn Marino  /* Check if c is too small.
4a238c70SJohn Marino     A more precise test is to replace 2 by
4a238c70SJohn Marino      (rnd == MPFR_RNDN) + mpfr_power2_raw (b)
4a238c70SJohn Marino      but it is more expensive and not very useful */
4a238c70SJohn Marino  if (MPFR_UNLIKELY (MPFR_GET_EXP (c) <= MPFR_GET_EXP (b)
4a238c70SJohn Marino                     - (mpfr_exp_t) MAX (MPFR_PREC (a), MPFR_PREC (b)) - 2))
4a238c70SJohn Marino    {
4a238c70SJohn Marino      /* Remember, we can't have an exact result! */
4a238c70SJohn Marino      /*   A.AAAAAAAAAAAAAAAAA
4a238c70SJohn Marino         = B.BBBBBBBBBBBBBBB
4a238c70SJohn Marino          -                     C.CCCCCCCCCCCCC */
4a238c70SJohn Marino      /* A = S*ABS(B) +/- ulp(a) */
4a238c70SJohn Marino      MPFR_SET_EXP (a, MPFR_GET_EXP (b));
4a238c70SJohn Marino      MPFR_RNDRAW_EVEN (inexact, a, MPFR_MANT (b), MPFR_PREC (b),
4a238c70SJohn Marino                        rnd_mode, MPFR_SIGN (a),
4a238c70SJohn Marino                        if (MPFR_UNLIKELY ( ++MPFR_EXP (a) > __gmpfr_emax))
4a238c70SJohn Marino                        inexact = mpfr_overflow (a, rnd_mode, MPFR_SIGN (a)));
4a238c70SJohn Marino      /* inexact = mpfr_set4 (a, b, rnd_mode, MPFR_SIGN (a));  */
4a238c70SJohn Marino      if (inexact == 0)
4a238c70SJohn Marino        {
4a238c70SJohn Marino          /* a = b (Exact)
4a238c70SJohn Marino             But we know it isn't (Since we have to remove `c')
4a238c70SJohn Marino             So if we round to Zero, we have to remove one ulp.
4a238c70SJohn Marino             Otherwise the result is correctly rounded. */
4a238c70SJohn Marino          if (MPFR_IS_LIKE_RNDZ (rnd_mode, MPFR_IS_NEG (a)))
4a238c70SJohn Marino            {
4a238c70SJohn Marino              mpfr_nexttozero (a);
4a238c70SJohn Marino              MPFR_RET (- MPFR_INT_SIGN (a));
4a238c70SJohn Marino            }
4a238c70SJohn Marino          MPFR_RET (MPFR_INT_SIGN (a));
4a238c70SJohn Marino        }
4a238c70SJohn Marino      else
4a238c70SJohn Marino        {
4a238c70SJohn Marino          /*   A.AAAAAAAAAAAAAA
4a238c70SJohn Marino             = B.BBBBBBBBBBBBBBB
4a238c70SJohn Marino              -                   C.CCCCCCCCCCCCC */
4a238c70SJohn Marino          /* It isn't exact so Prec(b) > Prec(a) and the last
4a238c70SJohn Marino             Prec(b)-Prec(a) bits of `b' are not zeros.
4a238c70SJohn Marino             Which means that removing c from b can't generate a carry
4a238c70SJohn Marino             execpt in case of even rounding.
4a238c70SJohn Marino             In all other case the result and the inexact flag should be
4a238c70SJohn Marino             correct (We can't have an exact result).
4a238c70SJohn Marino             In case of EVEN rounding:
4a238c70SJohn Marino               1.BBBBBBBBBBBBBx10
4a238c70SJohn Marino             -                     1.CCCCCCCCCCCC
4a238c70SJohn Marino             = 1.BBBBBBBBBBBBBx01  Rounded to Prec(b)
4a238c70SJohn Marino             = 1.BBBBBBBBBBBBBx    Nearest / Rounded to Prec(a)
4a238c70SJohn Marino             Set gives:
4a238c70SJohn Marino               1.BBBBBBBBBBBBB0   if inexact == EVEN_INEX  (x == 0)
4a238c70SJohn Marino               1.BBBBBBBBBBBBB1+1 if inexact == -EVEN_INEX (x == 1)
4a238c70SJohn Marino             which means we get a wrong rounded result if x==1,
4a238c70SJohn Marino             i.e. inexact= MPFR_EVEN_INEX */
4a238c70SJohn Marino          if (MPFR_UNLIKELY (inexact == MPFR_EVEN_INEX*MPFR_INT_SIGN (a)))
4a238c70SJohn Marino            {
4a238c70SJohn Marino              mpfr_nexttozero (a);
4a238c70SJohn Marino              inexact = -MPFR_INT_SIGN (a);
4a238c70SJohn Marino            }
4a238c70SJohn Marino          MPFR_RET (inexact);
4a238c70SJohn Marino        }
4a238c70SJohn Marino    }
4a238c70SJohn Marino
4a238c70SJohn Marino  diff_exp = (mpfr_uexp_t) MPFR_GET_EXP (b) - MPFR_GET_EXP (c);
4a238c70SJohn Marino
4a238c70SJohn Marino  /* reserve a space to store b aligned with the result, i.e. shifted by
4a238c70SJohn Marino     (-cancel) % GMP_NUMB_BITS to the right */
4a238c70SJohn Marino  bn      = MPFR_LIMB_SIZE (b);
4a238c70SJohn Marino  MPFR_UNSIGNED_MINUS_MODULO (shift_b, cancel);
4a238c70SJohn Marino  cancel1 = (cancel + shift_b) / GMP_NUMB_BITS;
4a238c70SJohn Marino
4a238c70SJohn Marino  /* the high cancel1 limbs from b should not be taken into account */
4a238c70SJohn Marino  if (MPFR_UNLIKELY (shift_b == 0))
4a238c70SJohn Marino    {
4a238c70SJohn Marino      bp = MPFR_MANT(b); /* no need of an extra space */
4a238c70SJohn Marino      /* Ensure ap != bp */
4a238c70SJohn Marino      if (MPFR_UNLIKELY (ap == bp))
4a238c70SJohn Marino        {
4a238c70SJohn Marino          bp = MPFR_TMP_LIMBS_ALLOC (bn);
4a238c70SJohn Marino          MPN_COPY (bp, ap, bn);
4a238c70SJohn Marino        }
4a238c70SJohn Marino    }
4a238c70SJohn Marino  else
4a238c70SJohn Marino    {
4a238c70SJohn Marino      bp = MPFR_TMP_LIMBS_ALLOC (bn + 1);
4a238c70SJohn Marino      bp[0] = mpn_rshift (bp + 1, MPFR_MANT(b), bn++, shift_b);
4a238c70SJohn Marino    }
4a238c70SJohn Marino
4a238c70SJohn Marino  /* reserve a space to store c aligned with the result, i.e. shifted by
4a238c70SJohn Marino      (diff_exp-cancel) % GMP_NUMB_BITS to the right */
4a238c70SJohn Marino  cn      = MPFR_LIMB_SIZE(c);
4a238c70SJohn Marino  if ((UINT_MAX % GMP_NUMB_BITS) == (GMP_NUMB_BITS-1)
4a238c70SJohn Marino      && ((-(unsigned) 1)%GMP_NUMB_BITS > 0))
4a238c70SJohn Marino    shift_c = ((mpfr_uexp_t) diff_exp - cancel) % GMP_NUMB_BITS;
4a238c70SJohn Marino  else
4a238c70SJohn Marino    {
4a238c70SJohn Marino      shift_c = diff_exp - (cancel % GMP_NUMB_BITS);
4a238c70SJohn Marino      shift_c = (shift_c + GMP_NUMB_BITS) % GMP_NUMB_BITS;
4a238c70SJohn Marino    }
4a238c70SJohn Marino  MPFR_ASSERTD( shift_c >= 0 && shift_c < GMP_NUMB_BITS);
4a238c70SJohn Marino
4a238c70SJohn Marino  if (MPFR_UNLIKELY(shift_c == 0))
4a238c70SJohn Marino    {
4a238c70SJohn Marino       cp = MPFR_MANT(c);
4a238c70SJohn Marino      /* Ensure ap != cp */
4a238c70SJohn Marino      if (ap == cp)
4a238c70SJohn Marino        {
4a238c70SJohn Marino          cp = MPFR_TMP_LIMBS_ALLOC (cn);
4a238c70SJohn Marino          MPN_COPY(cp, ap, cn);
4a238c70SJohn Marino        }
4a238c70SJohn Marino    }
4a238c70SJohn Marino else
4a238c70SJohn Marino    {
4a238c70SJohn Marino      cp = MPFR_TMP_LIMBS_ALLOC (cn + 1);
4a238c70SJohn Marino      cp[0] = mpn_rshift (cp + 1, MPFR_MANT(c), cn++, shift_c);
4a238c70SJohn Marino    }
4a238c70SJohn Marino
4a238c70SJohn Marino#ifdef DEBUG
4a238c70SJohn Marino  printf ("rnd=%s shift_b=%d shift_c=%d diffexp=%lu\n",
4a238c70SJohn Marino          mpfr_print_rnd_mode (rnd_mode), shift_b, shift_c,
4a238c70SJohn Marino          (unsigned long) diff_exp);
4a238c70SJohn Marino#endif
4a238c70SJohn Marino
4a238c70SJohn Marino  MPFR_ASSERTD (ap != cp);
4a238c70SJohn Marino  MPFR_ASSERTD (bp != cp);
4a238c70SJohn Marino
4a238c70SJohn Marino  /* here we have shift_c = (diff_exp - cancel) % GMP_NUMB_BITS,
4a238c70SJohn Marino        0 <= shift_c < GMP_NUMB_BITS
4a238c70SJohn Marino     thus we want cancel2 = ceil((cancel - diff_exp) / GMP_NUMB_BITS) */
4a238c70SJohn Marino
4a238c70SJohn Marino  /* Possible optimization with a C99 compiler (i.e. well-defined
4a238c70SJohn Marino     integer division): if MPFR_PREC_MAX is reduced to
4a238c70SJohn Marino     ((mpfr_prec_t)((mpfr_uprec_t)(~(mpfr_uprec_t)0)>>1) - GMP_NUMB_BITS + 1)
4a238c70SJohn Marino     and diff_exp is of type mpfr_exp_t (no need for mpfr_uexp_t, since
4a238c70SJohn Marino     the sum or difference of 2 exponents must be representable, as used
4a238c70SJohn Marino     by the multiplication code), then the computation of cancel2 could
4a238c70SJohn Marino     be simplified to
4a238c70SJohn Marino       cancel2 = (cancel - (diff_exp - shift_c)) / GMP_NUMB_BITS;
4a238c70SJohn Marino     because cancel, diff_exp and shift_c are all non-negative and
4a238c70SJohn Marino     these variables are signed. */
4a238c70SJohn Marino
4a238c70SJohn Marino  MPFR_ASSERTD (cancel >= 0);
4a238c70SJohn Marino  if (cancel >= diff_exp)
4a238c70SJohn Marino    /* Note that cancel is signed and will be converted to mpfr_uexp_t
4a238c70SJohn Marino       (type of diff_exp) in the expression below, so that this will
4a238c70SJohn Marino       work even if cancel is very large and diff_exp = 0. */
4a238c70SJohn Marino    cancel2 = (cancel - diff_exp + (GMP_NUMB_BITS - 1)) / GMP_NUMB_BITS;
4a238c70SJohn Marino  else
4a238c70SJohn Marino    cancel2 = - (mp_size_t) ((diff_exp - cancel) / GMP_NUMB_BITS);
4a238c70SJohn Marino  /* the high cancel2 limbs from b should not be taken into account */
4a238c70SJohn Marino#ifdef DEBUG
4a238c70SJohn Marino  printf ("cancel=%lu cancel1=%lu cancel2=%ld\n",
4a238c70SJohn Marino          (unsigned long) cancel, (unsigned long) cancel1, (long) cancel2);
4a238c70SJohn Marino#endif
4a238c70SJohn Marino
4a238c70SJohn Marino  /*               ap[an-1]        ap[0]
4a238c70SJohn Marino             <----------------+-----------|---->
4a238c70SJohn Marino             <----------PREC(a)----------><-sh->
4a238c70SJohn Marino cancel1
4a238c70SJohn Marino limbs        bp[bn-cancel1-1]
4a238c70SJohn Marino <--...-----><----------------+-----------+----------->
4a238c70SJohn Marino  cancel2
4a238c70SJohn Marino  limbs       cp[cn-cancel2-1]                                    cancel2 >= 0
4a238c70SJohn Marino    <--...--><----------------+----------------+---------------->
4a238c70SJohn Marino                (-cancel2)                                        cancel2 < 0
4a238c70SJohn Marino                   limbs      <----------------+---------------->
4a238c70SJohn Marino  */
4a238c70SJohn Marino
4a238c70SJohn Marino  /* first part: put in ap[0..an-1] the value of high(b) - high(c),
4a238c70SJohn Marino     where high(b) consists of the high an+cancel1 limbs of b,
4a238c70SJohn Marino     and high(c) consists of the high an+cancel2 limbs of c.
4a238c70SJohn Marino   */
4a238c70SJohn Marino
4a238c70SJohn Marino  /* copy high(b) into a */
4a238c70SJohn Marino  if (MPFR_LIKELY(an + (mp_size_t) cancel1 <= bn))
4a238c70SJohn Marino    /* a: <----------------+-----------|---->
4a238c70SJohn Marino       b: <-----------------------------------------> */
4a238c70SJohn Marino      MPN_COPY (ap, bp + bn - (an + cancel1), an);
4a238c70SJohn Marino  else
4a238c70SJohn Marino    /* a: <----------------+-----------|---->
4a238c70SJohn Marino       b: <-------------------------> */
4a238c70SJohn Marino    if ((mp_size_t) cancel1 < bn) /* otherwise b does not overlap with a */
4a238c70SJohn Marino      {
4a238c70SJohn Marino        MPN_ZERO (ap, an + cancel1 - bn);
4a238c70SJohn Marino        MPN_COPY (ap + (an + cancel1 - bn), bp, bn - cancel1);
4a238c70SJohn Marino      }
4a238c70SJohn Marino    else
4a238c70SJohn Marino      MPN_ZERO (ap, an);
4a238c70SJohn Marino
4a238c70SJohn Marino#ifdef DEBUG
4a238c70SJohn Marino  printf("after copying high(b), a="); mpfr_print_binary(a); putchar('\n');
4a238c70SJohn Marino#endif
4a238c70SJohn Marino
4a238c70SJohn Marino  /* subtract high(c) */
4a238c70SJohn Marino  if (MPFR_LIKELY(an + cancel2 > 0)) /* otherwise c does not overlap with a */
4a238c70SJohn Marino    {
4a238c70SJohn Marino      mp_limb_t *ap2;
4a238c70SJohn Marino
4a238c70SJohn Marino      if (cancel2 >= 0)
4a238c70SJohn Marino        {
4a238c70SJohn Marino          if (an + cancel2 <= cn)
4a238c70SJohn Marino            /* a: <----------------------------->
4a238c70SJohn Marino               c: <-----------------------------------------> */
4a238c70SJohn Marino            mpn_sub_n (ap, ap, cp + cn - (an + cancel2), an);
4a238c70SJohn Marino          else
4a238c70SJohn Marino            /* a: <---------------------------->
4a238c70SJohn Marino               c: <-------------------------> */
4a238c70SJohn Marino            {
4a238c70SJohn Marino              ap2 = ap + an + (cancel2 - cn);
4a238c70SJohn Marino              if (cn > cancel2)
4a238c70SJohn Marino                mpn_sub_n (ap2, ap2, cp, cn - cancel2);
4a238c70SJohn Marino            }
4a238c70SJohn Marino        }
4a238c70SJohn Marino      else /* cancel2 < 0 */
4a238c70SJohn Marino        {
4a238c70SJohn Marino          mp_limb_t borrow;
4a238c70SJohn Marino
4a238c70SJohn Marino          if (an + cancel2 <= cn)
4a238c70SJohn Marino            /* a: <----------------------------->
4a238c70SJohn Marino               c: <-----------------------------> */
4a238c70SJohn Marino            borrow = mpn_sub_n (ap, ap, cp + cn - (an + cancel2),
4a238c70SJohn Marino                                an + cancel2);
4a238c70SJohn Marino          else
4a238c70SJohn Marino            /* a: <---------------------------->
4a238c70SJohn Marino               c: <----------------> */
4a238c70SJohn Marino            {
4a238c70SJohn Marino              ap2 = ap + an + cancel2 - cn;
4a238c70SJohn Marino              borrow = mpn_sub_n (ap2, ap2, cp, cn);
4a238c70SJohn Marino            }
4a238c70SJohn Marino          ap2 = ap + an + cancel2;
4a238c70SJohn Marino          mpn_sub_1 (ap2, ap2, -cancel2, borrow);
4a238c70SJohn Marino        }
4a238c70SJohn Marino    }
4a238c70SJohn Marino
4a238c70SJohn Marino#ifdef DEBUG
4a238c70SJohn Marino  printf("after subtracting high(c), a=");
4a238c70SJohn Marino  mpfr_print_binary(a);
4a238c70SJohn Marino  putchar('\n');
4a238c70SJohn Marino#endif
4a238c70SJohn Marino
4a238c70SJohn Marino  /* now perform rounding */
4a238c70SJohn Marino  sh = (mpfr_prec_t) an * GMP_NUMB_BITS - MPFR_PREC(a);
4a238c70SJohn Marino  /* last unused bits from a */
4a238c70SJohn Marino  carry = ap[0] & MPFR_LIMB_MASK (sh);
4a238c70SJohn Marino  ap[0] -= carry;
4a238c70SJohn Marino
4a238c70SJohn Marino  if (MPFR_LIKELY(rnd_mode == MPFR_RNDN))
4a238c70SJohn Marino    {
4a238c70SJohn Marino      if (MPFR_LIKELY(sh))
4a238c70SJohn Marino        {
4a238c70SJohn Marino          /* can decide except when carry = 2^(sh-1) [middle]
4a238c70SJohn Marino             or carry = 0 [truncate, but cannot decide inexact flag] */
4a238c70SJohn Marino          if (carry > (MPFR_LIMB_ONE << (sh - 1)))
4a238c70SJohn Marino            goto add_one_ulp;
4a238c70SJohn Marino          else if ((0 < carry) && (carry < (MPFR_LIMB_ONE << (sh - 1))))
4a238c70SJohn Marino            {
4a238c70SJohn Marino              inexact = -1; /* result if smaller than exact value */
4a238c70SJohn Marino              goto truncate;
4a238c70SJohn Marino            }
4a238c70SJohn Marino          /* now carry = 2^(sh-1), in which case cmp_low=2,
4a238c70SJohn Marino             or carry = 0, in which case cmp_low=0 */
4a238c70SJohn Marino          cmp_low = (carry == 0) ? 0 : 2;
4a238c70SJohn Marino        }
4a238c70SJohn Marino    }
4a238c70SJohn Marino  else /* directed rounding: set rnd_mode to RNDZ iff toward zero */
4a238c70SJohn Marino    {
4a238c70SJohn Marino      if (MPFR_IS_RNDUTEST_OR_RNDDNOTTEST(rnd_mode, MPFR_IS_NEG(a)))
4a238c70SJohn Marino        rnd_mode = MPFR_RNDZ;
4a238c70SJohn Marino
4a238c70SJohn Marino      if (carry)
4a238c70SJohn Marino        {
4a238c70SJohn Marino          if (rnd_mode == MPFR_RNDZ)
4a238c70SJohn Marino            {
4a238c70SJohn Marino              inexact = -1;
4a238c70SJohn Marino              goto truncate;
4a238c70SJohn Marino            }
4a238c70SJohn Marino          else /* round away */
4a238c70SJohn Marino            goto add_one_ulp;
4a238c70SJohn Marino        }
4a238c70SJohn Marino    }
4a238c70SJohn Marino
4a238c70SJohn Marino  /* we have to consider the low (bn - (an+cancel1)) limbs from b,
4a238c70SJohn Marino     and the (cn - (an+cancel2)) limbs from c. */
4a238c70SJohn Marino  bn -= an + cancel1;
4a238c70SJohn Marino  cn0 = cn;
4a238c70SJohn Marino  cn -= an + cancel2;
4a238c70SJohn Marino
4a238c70SJohn Marino#ifdef DEBUG
4a238c70SJohn Marino  printf ("last sh=%d bits from a are %lu, bn=%ld, cn=%ld\n",
4a238c70SJohn Marino          sh, (unsigned long) carry, (long) bn, (long) cn);
4a238c70SJohn Marino#endif
4a238c70SJohn Marino
4a238c70SJohn Marino  /* for rounding to nearest, we couldn't conclude up to here in the following
4a238c70SJohn Marino     cases:
4a238c70SJohn Marino     1. sh = 0, then cmp_low=0: we can either truncate, subtract one ulp
4a238c70SJohn Marino        or add one ulp: -1 ulp < low(b)-low(c) < 1 ulp
4a238c70SJohn Marino     2. sh > 0 but the low sh bits from high(b)-high(c) equal 2^(sh-1):
4a238c70SJohn Marino        -0.5 ulp <= -1/2^sh < low(b)-low(c)-0.5 < 1/2^sh <= 0.5 ulp
4a238c70SJohn Marino        we can't decide the rounding, in that case cmp_low=2:
4a238c70SJohn Marino        either we truncate and flag=-1, or we add one ulp and flag=1
4a238c70SJohn Marino     3. the low sh>0 bits from high(b)-high(c) equal 0: we know we have to
4a238c70SJohn Marino        truncate but we can't decide the ternary value, here cmp_low=0:
4a238c70SJohn Marino        -0.5 ulp <= -1/2^sh < low(b)-low(c) < 1/2^sh <= 0.5 ulp
4a238c70SJohn Marino        we always truncate and inexact can be any of -1,0,1
4a238c70SJohn Marino  */
4a238c70SJohn Marino
4a238c70SJohn Marino  /* note: here cn might exceed cn0, in which case we consider a zero limb */
4a238c70SJohn Marino  for (k = 0; (bn > 0) || (cn > 0); k = 1)
4a238c70SJohn Marino    {
4a238c70SJohn Marino      /* if cmp_low < 0, we know low(b) - low(c) < 0
4a238c70SJohn Marino         if cmp_low > 0, we know low(b) - low(c) > 0
4a238c70SJohn Marino            (more precisely if cmp_low = 2, low(b) - low(c) = 0.5 ulp so far)
4a238c70SJohn Marino         if cmp_low = 0, so far low(b) - low(c) = 0 */
4a238c70SJohn Marino
4a238c70SJohn Marino      /* get next limbs */
4a238c70SJohn Marino      bb = (bn > 0) ? bp[--bn] : 0;
4a238c70SJohn Marino      if ((cn > 0) && (cn-- <= cn0))
4a238c70SJohn Marino        cc = cp[cn];
4a238c70SJohn Marino      else
4a238c70SJohn Marino        cc = 0;
4a238c70SJohn Marino
4a238c70SJohn Marino      /* cmp_low compares low(b) and low(c) */
4a238c70SJohn Marino      if (cmp_low == 0) /* case 1 or 3 */
4a238c70SJohn Marino        cmp_low = (bb < cc) ? -2+k : (bb > cc) ? 1 : 0;
4a238c70SJohn Marino
4a238c70SJohn Marino      /* Case 1 for k=0 splits into 7 subcases:
4a238c70SJohn Marino         1a: bb > cc + half
4a238c70SJohn Marino         1b: bb = cc + half
4a238c70SJohn Marino         1c: 0 < bb - cc < half
4a238c70SJohn Marino         1d: bb = cc
4a238c70SJohn Marino         1e: -half < bb - cc < 0
4a238c70SJohn Marino         1f: bb - cc = -half
4a238c70SJohn Marino         1g: bb - cc < -half
4a238c70SJohn Marino
4a238c70SJohn Marino         Case 2 splits into 3 subcases:
4a238c70SJohn Marino         2a: bb > cc
4a238c70SJohn Marino         2b: bb = cc
4a238c70SJohn Marino         2c: bb < cc
4a238c70SJohn Marino
4a238c70SJohn Marino         Case 3 splits into 3 subcases:
4a238c70SJohn Marino         3a: bb > cc
4a238c70SJohn Marino         3b: bb = cc
4a238c70SJohn Marino         3c: bb < cc
4a238c70SJohn Marino      */
4a238c70SJohn Marino
4a238c70SJohn Marino      /* the case rounding to nearest with sh=0 is special since one couldn't
4a238c70SJohn Marino         subtract above 1/2 ulp in the trailing limb of the result */
4a238c70SJohn Marino      if (rnd_mode == MPFR_RNDN && sh == 0 && k == 0) /* case 1 for k=0 */
4a238c70SJohn Marino        {
4a238c70SJohn Marino          mp_limb_t half = MPFR_LIMB_HIGHBIT;
4a238c70SJohn Marino
4a238c70SJohn Marino          /* add one ulp if bb > cc + half
4a238c70SJohn Marino             truncate if cc - half < bb < cc + half
4a238c70SJohn Marino             sub one ulp if bb < cc - half
4a238c70SJohn Marino          */
4a238c70SJohn Marino
4a238c70SJohn Marino          if (cmp_low < 0) /* bb < cc: -1 ulp < low(b) - low(c) < 0,
4a238c70SJohn Marino                              cases 1e, 1f and 1g */
4a238c70SJohn Marino            {
4a238c70SJohn Marino              if (cc >= half)
4a238c70SJohn Marino                cc -= half;
4a238c70SJohn Marino              else /* since bb < cc < half, bb+half < 2*half */
4a238c70SJohn Marino                bb += half;
4a238c70SJohn Marino              /* now we have bb < cc + half:
4a238c70SJohn Marino                 we have to subtract one ulp if bb < cc,
4a238c70SJohn Marino                 and truncate if bb > cc */
4a238c70SJohn Marino            }
4a238c70SJohn Marino          else if (cmp_low >= 0) /* bb >= cc, cases 1a to 1d */
4a238c70SJohn Marino            {
4a238c70SJohn Marino              if (cc < half)
4a238c70SJohn Marino                cc += half;
4a238c70SJohn Marino              else /* since bb >= cc >= half, bb - half >= 0 */
4a238c70SJohn Marino                bb -= half;
4a238c70SJohn Marino              /* now we have bb > cc - half: we have to add one ulp if bb > cc,
4a238c70SJohn Marino                 and truncate if bb < cc */
4a238c70SJohn Marino              if (cmp_low > 0)
4a238c70SJohn Marino                cmp_low = 2;
4a238c70SJohn Marino            }
4a238c70SJohn Marino        }
4a238c70SJohn Marino
4a238c70SJohn Marino#ifdef DEBUG
4a238c70SJohn Marino      printf ("k=%u bb=%lu cc=%lu cmp_low=%d\n", k,
4a238c70SJohn Marino              (unsigned long) bb, (unsigned long) cc, cmp_low);
4a238c70SJohn Marino#endif
4a238c70SJohn Marino      if (cmp_low < 0) /* low(b) - low(c) < 0: either truncate or subtract
4a238c70SJohn Marino                          one ulp */
4a238c70SJohn Marino        {
4a238c70SJohn Marino          if (rnd_mode == MPFR_RNDZ)
4a238c70SJohn Marino            goto sub_one_ulp; /* set inexact=-1 */
4a238c70SJohn Marino          else if (rnd_mode != MPFR_RNDN) /* round away */
4a238c70SJohn Marino            {
4a238c70SJohn Marino              inexact = 1;
4a238c70SJohn Marino              goto truncate;
4a238c70SJohn Marino            }
4a238c70SJohn Marino          else /* round to nearest */
4a238c70SJohn Marino            {
4a238c70SJohn Marino              /* If cmp_low < 0 and bb > cc, then -0.5 ulp < low(b)-low(c) < 0,
4a238c70SJohn Marino                 whatever the value of sh.
4a238c70SJohn Marino                 If sh>0, then cmp_low < 0 implies that the initial neglected
4a238c70SJohn Marino                 sh bits were 0 (otherwise cmp_low=2 initially), thus the
4a238c70SJohn Marino                 weight of the new bits is less than 0.5 ulp too.
4a238c70SJohn Marino                 If k > 0 (and sh=0) this means that either the first neglected
4a238c70SJohn Marino                 limbs bb and cc were equal (thus cmp_low was 0 for k=0),
4a238c70SJohn Marino                 or we had bb - cc = -0.5 ulp or 0.5 ulp.
4a238c70SJohn Marino                 The last case is not possible here since we would have
4a238c70SJohn Marino                 cmp_low > 0 which is sticky.
4a238c70SJohn Marino                 In the first case (where we have cmp_low = -1), we truncate,
4a238c70SJohn Marino                 whereas in the 2nd case we have cmp_low = -2 and we subtract
4a238c70SJohn Marino                 one ulp.
4a238c70SJohn Marino              */
4a238c70SJohn Marino              if (bb > cc || sh > 0 || cmp_low == -1)
4a238c70SJohn Marino                {  /* -0.5 ulp < low(b)-low(c) < 0,
4a238c70SJohn Marino                      bb > cc corresponds to cases 1e and 1f1
4a238c70SJohn Marino                      sh > 0 corresponds to cases 3c and 3b3
4a238c70SJohn Marino                      cmp_low = -1 corresponds to case 1d3 (also 3b3) */
4a238c70SJohn Marino                  inexact = 1;
4a238c70SJohn Marino                  goto truncate;
4a238c70SJohn Marino                }
4a238c70SJohn Marino              else if (bb < cc) /* here sh = 0 and low(b)-low(c) < -0.5 ulp,
4a238c70SJohn Marino                                   this corresponds to cases 1g and 1f3 */
4a238c70SJohn Marino                goto sub_one_ulp;
4a238c70SJohn Marino              /* the only case where we can't conclude is sh=0 and bb=cc,
4a238c70SJohn Marino                 i.e., we have low(b) - low(c) = -0.5 ulp (up to now), thus
4a238c70SJohn Marino                 we don't know if we must truncate or subtract one ulp.
4a238c70SJohn Marino                 Note: for sh=0 we can't have low(b) - low(c) = -0.5 ulp up to
4a238c70SJohn Marino                 now, since low(b) - low(c) > 1/2^sh */
4a238c70SJohn Marino            }
4a238c70SJohn Marino        }
4a238c70SJohn Marino      else if (cmp_low > 0) /* 0 < low(b) - low(c): either truncate or
4a238c70SJohn Marino                               add one ulp */
4a238c70SJohn Marino        {
4a238c70SJohn Marino          if (rnd_mode == MPFR_RNDZ)
4a238c70SJohn Marino            {
4a238c70SJohn Marino              inexact = -1;
4a238c70SJohn Marino              goto truncate;
4a238c70SJohn Marino            }
4a238c70SJohn Marino          else if (rnd_mode != MPFR_RNDN) /* round away */
4a238c70SJohn Marino            goto add_one_ulp;
4a238c70SJohn Marino          else /* round to nearest */
4a238c70SJohn Marino            {
4a238c70SJohn Marino              if (bb > cc)
4a238c70SJohn Marino                {
4a238c70SJohn Marino                  /* if sh=0, then bb>cc means that low(b)-low(c) > 0.5 ulp,
4a238c70SJohn Marino                     and similarly when cmp_low=2 */
4a238c70SJohn Marino                  if (cmp_low == 2) /* cases 1a, 1b1, 2a and 2b1 */
4a238c70SJohn Marino                    goto add_one_ulp;
4a238c70SJohn Marino                  /* sh > 0 and cmp_low > 0: this implies that the sh initial
4a238c70SJohn Marino                     neglected bits were 0, and the remaining low(b)-low(c)>0,
4a238c70SJohn Marino                     but its weight is less than 0.5 ulp */
4a238c70SJohn Marino                  else /* 0 < low(b) - low(c) < 0.5 ulp, this corresponds to
4a238c70SJohn Marino                          cases 3a, 1d1 and 3b1 */
4a238c70SJohn Marino                    {
4a238c70SJohn Marino                      inexact = -1;
4a238c70SJohn Marino                      goto truncate;
4a238c70SJohn Marino                    }
4a238c70SJohn Marino                }
4a238c70SJohn Marino              else if (bb < cc) /* 0 < low(b) - low(c) < 0.5 ulp, cases 1c,
4a238c70SJohn Marino                                   1b3, 2b3 and 2c */
4a238c70SJohn Marino                {
4a238c70SJohn Marino                  inexact = -1;
4a238c70SJohn Marino                  goto truncate;
4a238c70SJohn Marino                }
4a238c70SJohn Marino              /* the only case where we can't conclude is bb=cc, i.e.,
4a238c70SJohn Marino                 low(b) - low(c) = 0.5 ulp (up to now), thus we don't know
4a238c70SJohn Marino                 if we must truncate or add one ulp. */
4a238c70SJohn Marino            }
4a238c70SJohn Marino        }
4a238c70SJohn Marino      /* after k=0, we cannot conclude in the following cases, we split them
4a238c70SJohn Marino         according to the values of bb and cc for k=1:
4a238c70SJohn Marino         1b. sh=0 and cmp_low = 1 and bb-cc = half [around 0.5 ulp]
4a238c70SJohn Marino             1b1. bb > cc: add one ulp, inex = 1
4a238c70SJohn Marino             1b2: bb = cc: cannot conclude
4a238c70SJohn Marino             1b3: bb < cc: truncate, inex = -1
4a238c70SJohn Marino         1d. sh=0 and cmp_low = 0 and bb-cc = 0 [around 0]
4a238c70SJohn Marino             1d1: bb > cc: truncate, inex = -1
4a238c70SJohn Marino             1d2: bb = cc: cannot conclude
4a238c70SJohn Marino             1d3: bb < cc: truncate, inex = +1
4a238c70SJohn Marino         1f. sh=0 and cmp_low = -1 and bb-cc = -half [around -0.5 ulp]
4a238c70SJohn Marino             1f1: bb > cc: truncate, inex = +1
4a238c70SJohn Marino             1f2: bb = cc: cannot conclude
4a238c70SJohn Marino             1f3: bb < cc: sub one ulp, inex = -1
4a238c70SJohn Marino         2b. sh > 0 and cmp_low = 2 and bb=cc [around 0.5 ulp]
4a238c70SJohn Marino             2b1. bb > cc: add one ulp, inex = 1
4a238c70SJohn Marino             2b2: bb = cc: cannot conclude
4a238c70SJohn Marino             2b3: bb < cc: truncate, inex = -1
4a238c70SJohn Marino         3b. sh > 0 and cmp_low = 0 [around 0]
4a238c70SJohn Marino             3b1. bb > cc: truncate, inex = -1
4a238c70SJohn Marino             3b2: bb = cc: cannot conclude
4a238c70SJohn Marino             3b3: bb < cc: truncate, inex = +1
4a238c70SJohn Marino      */
4a238c70SJohn Marino    }
4a238c70SJohn Marino
4a238c70SJohn Marino  if ((rnd_mode == MPFR_RNDN) && cmp_low != 0)
4a238c70SJohn Marino    {
4a238c70SJohn Marino      /* even rounding rule */
4a238c70SJohn Marino      if ((ap[0] >> sh) & 1)
4a238c70SJohn Marino        {
4a238c70SJohn Marino          if (cmp_low < 0)
4a238c70SJohn Marino            goto sub_one_ulp;
4a238c70SJohn Marino          else
4a238c70SJohn Marino            goto add_one_ulp;
4a238c70SJohn Marino        }
4a238c70SJohn Marino      else
4a238c70SJohn Marino        inexact = (cmp_low > 0) ? -1 : 1;
4a238c70SJohn Marino    }
4a238c70SJohn Marino  else
4a238c70SJohn Marino    inexact = 0;
4a238c70SJohn Marino  goto truncate;
4a238c70SJohn Marino
4a238c70SJohn Marino sub_one_ulp: /* sub one unit in last place to a */
4a238c70SJohn Marino  mpn_sub_1 (ap, ap, an, MPFR_LIMB_ONE << sh);
4a238c70SJohn Marino  inexact = -1;
4a238c70SJohn Marino  goto end_of_sub;
4a238c70SJohn Marino
4a238c70SJohn Marino add_one_ulp: /* add one unit in last place to a */
4a238c70SJohn Marino  if (MPFR_UNLIKELY(mpn_add_1 (ap, ap, an, MPFR_LIMB_ONE << sh)))
4a238c70SJohn Marino    /* result is a power of 2: 11111111111111 + 1 = 1000000000000000 */
4a238c70SJohn Marino    {
4a238c70SJohn Marino      ap[an-1] = MPFR_LIMB_HIGHBIT;
4a238c70SJohn Marino      add_exp = 1;
4a238c70SJohn Marino    }
4a238c70SJohn Marino  inexact = 1; /* result larger than exact value */
4a238c70SJohn Marino
4a238c70SJohn Marino truncate:
4a238c70SJohn Marino  if (MPFR_UNLIKELY((ap[an-1] >> (GMP_NUMB_BITS - 1)) == 0))
4a238c70SJohn Marino    /* case 1 - epsilon */
4a238c70SJohn Marino    {
4a238c70SJohn Marino      ap[an-1] = MPFR_LIMB_HIGHBIT;
4a238c70SJohn Marino      add_exp = 1;
4a238c70SJohn Marino    }
4a238c70SJohn Marino
4a238c70SJohn Marino end_of_sub:
4a238c70SJohn Marino  /* we have to set MPFR_EXP(a) to MPFR_EXP(b) - cancel + add_exp, taking
4a238c70SJohn Marino     care of underflows/overflows in that computation, and of the allowed
4a238c70SJohn Marino     exponent range */
4a238c70SJohn Marino  if (MPFR_LIKELY(cancel))
4a238c70SJohn Marino    {
4a238c70SJohn Marino      mpfr_exp_t exp_a;
4a238c70SJohn Marino
4a238c70SJohn Marino      cancel -= add_exp; /* OK: add_exp is an int equal to 0 or 1 */
4a238c70SJohn Marino      exp_a = MPFR_GET_EXP (b) - cancel;
4a238c70SJohn Marino      if (MPFR_UNLIKELY(exp_a < __gmpfr_emin))
4a238c70SJohn Marino        {
4a238c70SJohn Marino          MPFR_TMP_FREE(marker);
4a238c70SJohn Marino          if (rnd_mode == MPFR_RNDN &&
4a238c70SJohn Marino              (exp_a < __gmpfr_emin - 1 ||
4a238c70SJohn Marino               (inexact >= 0 && mpfr_powerof2_raw (a))))
4a238c70SJohn Marino            rnd_mode = MPFR_RNDZ;
4a238c70SJohn Marino          return mpfr_underflow (a, rnd_mode, MPFR_SIGN(a));
4a238c70SJohn Marino        }
4a238c70SJohn Marino      MPFR_SET_EXP (a, exp_a);
4a238c70SJohn Marino    }
4a238c70SJohn Marino  else /* cancel = 0: MPFR_EXP(a) <- MPFR_EXP(b) + add_exp */
4a238c70SJohn Marino    {
4a238c70SJohn Marino      /* in case cancel = 0, add_exp can still be 1, in case b is just
4a238c70SJohn Marino         below a power of two, c is very small, prec(a) < prec(b),
4a238c70SJohn Marino         and rnd=away or nearest */
4a238c70SJohn Marino      mpfr_exp_t exp_b;
4a238c70SJohn Marino
4a238c70SJohn Marino      exp_b = MPFR_GET_EXP (b);
4a238c70SJohn Marino      if (MPFR_UNLIKELY(add_exp && exp_b == __gmpfr_emax))
4a238c70SJohn Marino        {
4a238c70SJohn Marino          MPFR_TMP_FREE(marker);
4a238c70SJohn Marino          return mpfr_overflow (a, rnd_mode, MPFR_SIGN(a));
4a238c70SJohn Marino        }
4a238c70SJohn Marino      MPFR_SET_EXP (a, exp_b + add_exp);
4a238c70SJohn Marino    }
4a238c70SJohn Marino  MPFR_TMP_FREE(marker);
4a238c70SJohn Marino#ifdef DEBUG
4a238c70SJohn Marino  printf ("result is a="); mpfr_print_binary(a); putchar('\n');
4a238c70SJohn Marino#endif
4a238c70SJohn Marino  /* check that result is msb-normalized */
4a238c70SJohn Marino  MPFR_ASSERTD(ap[an-1] > ~ap[an-1]);
4a238c70SJohn Marino  MPFR_RET (inexact * MPFR_INT_SIGN (a));
4a238c70SJohn Marino}