libquadmath/printf/divrem.c

*627f7eb2Smrg/* mpn_divrem -- Divide natural numbers, producing both remainder and
*627f7eb2Smrg   quotient.
*627f7eb2Smrg
*627f7eb2SmrgCopyright (C) 1993, 1994, 1995, 1996 Free Software Foundation, Inc.
*627f7eb2Smrg
*627f7eb2SmrgThis file is part of the GNU MP Library.
*627f7eb2Smrg
*627f7eb2SmrgThe GNU MP Library is free software; you can redistribute it and/or modify
*627f7eb2Smrgit under the terms of the GNU Lesser General Public License as published by
*627f7eb2Smrgthe Free Software Foundation; either version 2.1 of the License, or (at your
*627f7eb2Smrgoption) any later version.
*627f7eb2Smrg
*627f7eb2SmrgThe GNU MP Library is distributed in the hope that it will be useful, but
*627f7eb2SmrgWITHOUT ANY WARRANTY; without even the implied warranty of MERCHANTABILITY
*627f7eb2Smrgor FITNESS FOR A PARTICULAR PURPOSE.  See the GNU Lesser General Public
*627f7eb2SmrgLicense for more details.
*627f7eb2Smrg
*627f7eb2SmrgYou should have received a copy of the GNU Lesser General Public License
*627f7eb2Smrgalong with the GNU MP Library; see the file COPYING.LIB.  If not, write to
*627f7eb2Smrgthe Free Software Foundation, Inc., 59 Temple Place - Suite 330, Boston,
*627f7eb2SmrgMA 02111-1307, USA. */
*627f7eb2Smrg
*627f7eb2Smrg#include <config.h>
*627f7eb2Smrg#include "gmp-impl.h"
*627f7eb2Smrg
*627f7eb2Smrg/* Divide num (NP/NSIZE) by den (DP/DSIZE) and write
*627f7eb2Smrg   the NSIZE-DSIZE least significant quotient limbs at QP
*627f7eb2Smrg   and the DSIZE long remainder at NP.  If QEXTRA_LIMBS is
*627f7eb2Smrg   non-zero, generate that many fraction bits and append them after the
*627f7eb2Smrg   other quotient limbs.
*627f7eb2Smrg   Return the most significant limb of the quotient, this is always 0 or 1.
*627f7eb2Smrg
*627f7eb2Smrg   Preconditions:
*627f7eb2Smrg   0. NSIZE >= DSIZE.
*627f7eb2Smrg   1. The most significant bit of the divisor must be set.
*627f7eb2Smrg   2. QP must either not overlap with the input operands at all, or
*627f7eb2Smrg      QP + DSIZE >= NP must hold true.  (This means that it's
*627f7eb2Smrg      possible to put the quotient in the high part of NUM, right after the
*627f7eb2Smrg      remainder in NUM.
*627f7eb2Smrg   3. NSIZE >= DSIZE, even if QEXTRA_LIMBS is non-zero.  */
*627f7eb2Smrg
*627f7eb2Smrgmp_limb_t
*627f7eb2Smrg#if __STDC__
*627f7eb2Smrgmpn_divrem (mp_ptr qp, mp_size_t qextra_limbs,
*627f7eb2Smrg	    mp_ptr np, mp_size_t nsize,
*627f7eb2Smrg	    mp_srcptr dp, mp_size_t dsize)
*627f7eb2Smrg#else
*627f7eb2Smrgmpn_divrem (qp, qextra_limbs, np, nsize, dp, dsize)
*627f7eb2Smrg     mp_ptr qp;
*627f7eb2Smrg     mp_size_t qextra_limbs;
*627f7eb2Smrg     mp_ptr np;
*627f7eb2Smrg     mp_size_t nsize;
*627f7eb2Smrg     mp_srcptr dp;
*627f7eb2Smrg     mp_size_t dsize;
*627f7eb2Smrg#endif
*627f7eb2Smrg{
*627f7eb2Smrg  mp_limb_t most_significant_q_limb = 0;
*627f7eb2Smrg
*627f7eb2Smrg  switch (dsize)
*627f7eb2Smrg    {
*627f7eb2Smrg    case 0:
*627f7eb2Smrg      /* We are asked to divide by zero, so go ahead and do it!  (To make
*627f7eb2Smrg	 the compiler not remove this statement, return the value.)  */
*627f7eb2Smrg      return 1 / dsize;
*627f7eb2Smrg
*627f7eb2Smrg    case 1:
*627f7eb2Smrg      {
*627f7eb2Smrg	mp_size_t i;
*627f7eb2Smrg	mp_limb_t n1;
*627f7eb2Smrg	mp_limb_t d;
*627f7eb2Smrg
*627f7eb2Smrg	d = dp[0];
*627f7eb2Smrg	n1 = np[nsize - 1];
*627f7eb2Smrg
*627f7eb2Smrg	if (n1 >= d)
*627f7eb2Smrg	  {
*627f7eb2Smrg	    n1 -= d;
*627f7eb2Smrg	    most_significant_q_limb = 1;
*627f7eb2Smrg	  }
*627f7eb2Smrg
*627f7eb2Smrg	qp += qextra_limbs;
*627f7eb2Smrg	for (i = nsize - 2; i >= 0; i--)
*627f7eb2Smrg	  udiv_qrnnd (qp[i], n1, n1, np[i], d);
*627f7eb2Smrg	qp -= qextra_limbs;
*627f7eb2Smrg
*627f7eb2Smrg	for (i = qextra_limbs - 1; i >= 0; i--)
*627f7eb2Smrg	  udiv_qrnnd (qp[i], n1, n1, 0, d);
*627f7eb2Smrg
*627f7eb2Smrg	np[0] = n1;
*627f7eb2Smrg      }
*627f7eb2Smrg      break;
*627f7eb2Smrg
*627f7eb2Smrg    case 2:
*627f7eb2Smrg      {
*627f7eb2Smrg	mp_size_t i;
*627f7eb2Smrg	mp_limb_t n1, n0, n2;
*627f7eb2Smrg	mp_limb_t d1, d0;
*627f7eb2Smrg
*627f7eb2Smrg	np += nsize - 2;
*627f7eb2Smrg	d1 = dp[1];
*627f7eb2Smrg	d0 = dp[0];
*627f7eb2Smrg	n1 = np[1];
*627f7eb2Smrg	n0 = np[0];
*627f7eb2Smrg
*627f7eb2Smrg	if (n1 >= d1 && (n1 > d1 || n0 >= d0))
*627f7eb2Smrg	  {
*627f7eb2Smrg	    sub_ddmmss (n1, n0, n1, n0, d1, d0);
*627f7eb2Smrg	    most_significant_q_limb = 1;
*627f7eb2Smrg	  }
*627f7eb2Smrg
*627f7eb2Smrg	for (i = qextra_limbs + nsize - 2 - 1; i >= 0; i--)
*627f7eb2Smrg	  {
*627f7eb2Smrg	    mp_limb_t q;
*627f7eb2Smrg	    mp_limb_t r;
*627f7eb2Smrg
*627f7eb2Smrg	    if (i >= qextra_limbs)
*627f7eb2Smrg	      np--;
*627f7eb2Smrg	    else
*627f7eb2Smrg	      np[0] = 0;
*627f7eb2Smrg
*627f7eb2Smrg	    if (n1 == d1)
*627f7eb2Smrg	      {
*627f7eb2Smrg		/* Q should be either 111..111 or 111..110.  Need special
*627f7eb2Smrg		   treatment of this rare case as normal division would
*627f7eb2Smrg		   give overflow.  */
*627f7eb2Smrg		q = ~(mp_limb_t) 0;
*627f7eb2Smrg
*627f7eb2Smrg		r = n0 + d1;
*627f7eb2Smrg		if (r < d1)	/* Carry in the addition? */
*627f7eb2Smrg		  {
*627f7eb2Smrg		    add_ssaaaa (n1, n0, r - d0, np[0], 0, d0);
*627f7eb2Smrg		    qp[i] = q;
*627f7eb2Smrg		    continue;
*627f7eb2Smrg		  }
*627f7eb2Smrg		n1 = d0 - (d0 != 0);
*627f7eb2Smrg		n0 = -d0;
*627f7eb2Smrg	      }
*627f7eb2Smrg	    else
*627f7eb2Smrg	      {
*627f7eb2Smrg		udiv_qrnnd (q, r, n1, n0, d1);
*627f7eb2Smrg		umul_ppmm (n1, n0, d0, q);
*627f7eb2Smrg	      }
*627f7eb2Smrg
*627f7eb2Smrg	    n2 = np[0];
*627f7eb2Smrg	  q_test:
*627f7eb2Smrg	    if (n1 > r || (n1 == r && n0 > n2))
*627f7eb2Smrg	      {
*627f7eb2Smrg		/* The estimated Q was too large.  */
*627f7eb2Smrg		q--;
*627f7eb2Smrg
*627f7eb2Smrg		sub_ddmmss (n1, n0, n1, n0, 0, d0);
*627f7eb2Smrg		r += d1;
*627f7eb2Smrg		if (r >= d1)	/* If not carry, test Q again.  */
*627f7eb2Smrg		  goto q_test;
*627f7eb2Smrg	      }
*627f7eb2Smrg
*627f7eb2Smrg	    qp[i] = q;
*627f7eb2Smrg	    sub_ddmmss (n1, n0, r, n2, n1, n0);
*627f7eb2Smrg	  }
*627f7eb2Smrg	np[1] = n1;
*627f7eb2Smrg	np[0] = n0;
*627f7eb2Smrg      }
*627f7eb2Smrg      break;
*627f7eb2Smrg
*627f7eb2Smrg    default:
*627f7eb2Smrg      {
*627f7eb2Smrg	mp_size_t i;
*627f7eb2Smrg	mp_limb_t dX, d1, n0;
*627f7eb2Smrg
*627f7eb2Smrg	np += nsize - dsize;
*627f7eb2Smrg	dX = dp[dsize - 1];
*627f7eb2Smrg	d1 = dp[dsize - 2];
*627f7eb2Smrg	n0 = np[dsize - 1];
*627f7eb2Smrg
*627f7eb2Smrg	if (n0 >= dX)
*627f7eb2Smrg	  {
*627f7eb2Smrg	    if (n0 > dX || mpn_cmp (np, dp, dsize - 1) >= 0)
*627f7eb2Smrg	      {
*627f7eb2Smrg		mpn_sub_n (np, np, dp, dsize);
*627f7eb2Smrg		n0 = np[dsize - 1];
*627f7eb2Smrg		most_significant_q_limb = 1;
*627f7eb2Smrg	      }
*627f7eb2Smrg	  }
*627f7eb2Smrg
*627f7eb2Smrg	for (i = qextra_limbs + nsize - dsize - 1; i >= 0; i--)
*627f7eb2Smrg	  {
*627f7eb2Smrg	    mp_limb_t q;
*627f7eb2Smrg	    mp_limb_t n1, n2;
*627f7eb2Smrg	    mp_limb_t cy_limb;
*627f7eb2Smrg
*627f7eb2Smrg	    if (i >= qextra_limbs)
*627f7eb2Smrg	      {
*627f7eb2Smrg		np--;
*627f7eb2Smrg		n2 = np[dsize];
*627f7eb2Smrg	      }
*627f7eb2Smrg	    else
*627f7eb2Smrg	      {
*627f7eb2Smrg		n2 = np[dsize - 1];
*627f7eb2Smrg		MPN_COPY_DECR (np + 1, np, dsize);
*627f7eb2Smrg		np[0] = 0;
*627f7eb2Smrg	      }
*627f7eb2Smrg
*627f7eb2Smrg	    if (n0 == dX)
*627f7eb2Smrg	      /* This might over-estimate q, but it's probably not worth
*627f7eb2Smrg		 the extra code here to find out.  */
*627f7eb2Smrg	      q = ~(mp_limb_t) 0;
*627f7eb2Smrg	    else
*627f7eb2Smrg	      {
*627f7eb2Smrg		mp_limb_t r;
*627f7eb2Smrg
*627f7eb2Smrg		udiv_qrnnd (q, r, n0, np[dsize - 1], dX);
*627f7eb2Smrg		umul_ppmm (n1, n0, d1, q);
*627f7eb2Smrg
*627f7eb2Smrg		while (n1 > r || (n1 == r && n0 > np[dsize - 2]))
*627f7eb2Smrg		  {
*627f7eb2Smrg		    q--;
*627f7eb2Smrg		    r += dX;
*627f7eb2Smrg		    if (r < dX)	/* I.e. "carry in previous addition?"  */
*627f7eb2Smrg		      break;
*627f7eb2Smrg		    n1 -= n0 < d1;
*627f7eb2Smrg		    n0 -= d1;
*627f7eb2Smrg		  }
*627f7eb2Smrg	      }
*627f7eb2Smrg
*627f7eb2Smrg	    /* Possible optimization: We already have (q * n0) and (1 * n1)
*627f7eb2Smrg	       after the calculation of q.  Taking advantage of that, we
*627f7eb2Smrg	       could make this loop make two iterations less.  */
*627f7eb2Smrg
*627f7eb2Smrg	    cy_limb = mpn_submul_1 (np, dp, dsize, q);
*627f7eb2Smrg
*627f7eb2Smrg	    if (n2 != cy_limb)
*627f7eb2Smrg	      {
*627f7eb2Smrg		mpn_add_n (np, np, dp, dsize);
*627f7eb2Smrg		q--;
*627f7eb2Smrg	      }
*627f7eb2Smrg
*627f7eb2Smrg	    qp[i] = q;
*627f7eb2Smrg	    n0 = np[dsize - 1];
*627f7eb2Smrg	  }
*627f7eb2Smrg      }
*627f7eb2Smrg    }
*627f7eb2Smrg
*627f7eb2Smrg  return most_significant_q_limb;
*627f7eb2Smrg}