mpn/generic/gcd_1.c

86d7f5d3SJohn Marino/* mpn_gcd_1 -- mpn and limb greatest common divisor.
86d7f5d3SJohn Marino
86d7f5d3SJohn MarinoCopyright 1994, 1996, 2000, 2001 Free Software Foundation, Inc.
86d7f5d3SJohn Marino
86d7f5d3SJohn MarinoThis file is part of the GNU MP Library.
86d7f5d3SJohn Marino
86d7f5d3SJohn MarinoThe GNU MP Library is free software; you can redistribute it and/or modify
86d7f5d3SJohn Marinoit under the terms of the GNU Lesser General Public License as published by
86d7f5d3SJohn Marinothe Free Software Foundation; either version 3 of the License, or (at your
86d7f5d3SJohn Marinooption) any later version.
86d7f5d3SJohn Marino
86d7f5d3SJohn MarinoThe GNU MP Library is distributed in the hope that it will be useful, but
86d7f5d3SJohn MarinoWITHOUT ANY WARRANTY; without even the implied warranty of MERCHANTABILITY
86d7f5d3SJohn Marinoor FITNESS FOR A PARTICULAR PURPOSE.  See the GNU Lesser General Public
86d7f5d3SJohn MarinoLicense for more details.
86d7f5d3SJohn Marino
86d7f5d3SJohn MarinoYou should have received a copy of the GNU Lesser General Public License
86d7f5d3SJohn Marinoalong with the GNU MP Library.  If not, see http://www.gnu.org/licenses/.  */
86d7f5d3SJohn Marino
86d7f5d3SJohn Marino#include "gmp.h"
86d7f5d3SJohn Marino#include "gmp-impl.h"
86d7f5d3SJohn Marino#include "longlong.h"
86d7f5d3SJohn Marino
86d7f5d3SJohn Marino#ifndef GCD_1_METHOD
86d7f5d3SJohn Marino#define GCD_1_METHOD 2
86d7f5d3SJohn Marino#endif
86d7f5d3SJohn Marino
86d7f5d3SJohn Marino#define USE_ZEROTAB 0
86d7f5d3SJohn Marino
86d7f5d3SJohn Marino#if USE_ZEROTAB
86d7f5d3SJohn Marinostatic const unsigned char zerotab[16] = {
86d7f5d3SJohn Marino  4, 0, 1, 0, 2, 0, 1, 0, 3, 0, 1, 0, 2, 0, 1, 0
86d7f5d3SJohn Marino};
86d7f5d3SJohn Marino#endif
86d7f5d3SJohn Marino
86d7f5d3SJohn Marino/* Does not work for U == 0 or V == 0.  It would be tough to make it work for
86d7f5d3SJohn Marino   V == 0 since gcd(x,0) = x, and U does not generally fit in an mp_limb_t.
86d7f5d3SJohn Marino
86d7f5d3SJohn Marino   The threshold for doing u%v when size==1 will vary by CPU according to
86d7f5d3SJohn Marino   the speed of a division and the code generated for the main loop.  Any
86d7f5d3SJohn Marino   tuning for this is left to a CPU specific implementation.  */
86d7f5d3SJohn Marino
86d7f5d3SJohn Marinomp_limb_t
86d7f5d3SJohn Marinompn_gcd_1 (mp_srcptr up, mp_size_t size, mp_limb_t vlimb)
86d7f5d3SJohn Marino{
86d7f5d3SJohn Marino  mp_limb_t      ulimb;
86d7f5d3SJohn Marino  unsigned long  zero_bits, u_low_zero_bits;
86d7f5d3SJohn Marino
86d7f5d3SJohn Marino  ASSERT (size >= 1);
86d7f5d3SJohn Marino  ASSERT (vlimb != 0);
86d7f5d3SJohn Marino  ASSERT_MPN_NONZERO_P (up, size);
86d7f5d3SJohn Marino
86d7f5d3SJohn Marino  ulimb = up[0];
86d7f5d3SJohn Marino
86d7f5d3SJohn Marino  /* Need vlimb odd for modexact, want it odd to get common zeros. */
86d7f5d3SJohn Marino  count_trailing_zeros (zero_bits, vlimb);
86d7f5d3SJohn Marino  vlimb >>= zero_bits;
86d7f5d3SJohn Marino
86d7f5d3SJohn Marino  if (size > 1)
86d7f5d3SJohn Marino    {
86d7f5d3SJohn Marino      /* Must get common zeros before the mod reduction.  If ulimb==0 then
86d7f5d3SJohn Marino	 vlimb already gives the common zeros.  */
86d7f5d3SJohn Marino      if (ulimb != 0)
86d7f5d3SJohn Marino	{
86d7f5d3SJohn Marino	  count_trailing_zeros (u_low_zero_bits, ulimb);
86d7f5d3SJohn Marino	  zero_bits = MIN (zero_bits, u_low_zero_bits);
86d7f5d3SJohn Marino	}
86d7f5d3SJohn Marino
86d7f5d3SJohn Marino      ulimb = MPN_MOD_OR_MODEXACT_1_ODD (up, size, vlimb);
86d7f5d3SJohn Marino      if (ulimb == 0)
86d7f5d3SJohn Marino	goto done;
86d7f5d3SJohn Marino
86d7f5d3SJohn Marino      goto strip_u_maybe;
86d7f5d3SJohn Marino    }
86d7f5d3SJohn Marino
86d7f5d3SJohn Marino  /* size==1, so up[0]!=0 */
86d7f5d3SJohn Marino  count_trailing_zeros (u_low_zero_bits, ulimb);
86d7f5d3SJohn Marino  ulimb >>= u_low_zero_bits;
86d7f5d3SJohn Marino  zero_bits = MIN (zero_bits, u_low_zero_bits);
86d7f5d3SJohn Marino
86d7f5d3SJohn Marino  /* make u bigger */
86d7f5d3SJohn Marino  if (vlimb > ulimb)
86d7f5d3SJohn Marino    MP_LIMB_T_SWAP (ulimb, vlimb);
86d7f5d3SJohn Marino
86d7f5d3SJohn Marino  /* if u is much bigger than v, reduce using a division rather than
86d7f5d3SJohn Marino     chipping away at it bit-by-bit */
86d7f5d3SJohn Marino  if ((ulimb >> 16) > vlimb)
86d7f5d3SJohn Marino    {
86d7f5d3SJohn Marino      ulimb %= vlimb;
86d7f5d3SJohn Marino      if (ulimb == 0)
86d7f5d3SJohn Marino	goto done;
86d7f5d3SJohn Marino      goto strip_u_maybe;
86d7f5d3SJohn Marino    }
86d7f5d3SJohn Marino
86d7f5d3SJohn Marino  ASSERT (ulimb & 1);
86d7f5d3SJohn Marino  ASSERT (vlimb & 1);
86d7f5d3SJohn Marino
86d7f5d3SJohn Marino#if GCD_1_METHOD == 1
86d7f5d3SJohn Marino  while (ulimb != vlimb)
86d7f5d3SJohn Marino    {
86d7f5d3SJohn Marino      ASSERT (ulimb & 1);
86d7f5d3SJohn Marino      ASSERT (vlimb & 1);
86d7f5d3SJohn Marino
86d7f5d3SJohn Marino      if (ulimb > vlimb)
86d7f5d3SJohn Marino	{
86d7f5d3SJohn Marino	  ulimb -= vlimb;
86d7f5d3SJohn Marino	  do
86d7f5d3SJohn Marino	    {
86d7f5d3SJohn Marino	      ulimb >>= 1;
86d7f5d3SJohn Marino	      ASSERT (ulimb != 0);
86d7f5d3SJohn Marino	    strip_u_maybe:
86d7f5d3SJohn Marino	      ;
86d7f5d3SJohn Marino	    }
86d7f5d3SJohn Marino	  while ((ulimb & 1) == 0);
86d7f5d3SJohn Marino	}
86d7f5d3SJohn Marino      else /*  vlimb > ulimb.  */
86d7f5d3SJohn Marino	{
86d7f5d3SJohn Marino	  vlimb -= ulimb;
86d7f5d3SJohn Marino	  do
86d7f5d3SJohn Marino	    {
86d7f5d3SJohn Marino	      vlimb >>= 1;
86d7f5d3SJohn Marino	      ASSERT (vlimb != 0);
86d7f5d3SJohn Marino	    }
86d7f5d3SJohn Marino	  while ((vlimb & 1) == 0);
86d7f5d3SJohn Marino	}
86d7f5d3SJohn Marino    }
86d7f5d3SJohn Marino#else
86d7f5d3SJohn Marino# if GCD_1_METHOD  == 2
86d7f5d3SJohn Marino
86d7f5d3SJohn Marino  ulimb >>= 1;
86d7f5d3SJohn Marino  vlimb >>= 1;
86d7f5d3SJohn Marino
86d7f5d3SJohn Marino  while (ulimb != vlimb)
86d7f5d3SJohn Marino    {
86d7f5d3SJohn Marino      int c;
86d7f5d3SJohn Marino      mp_limb_t t = ulimb - vlimb;
86d7f5d3SJohn Marino      mp_limb_t vgtu = LIMB_HIGHBIT_TO_MASK (t);
86d7f5d3SJohn Marino
86d7f5d3SJohn Marino      /* v <-- min (u, v) */
86d7f5d3SJohn Marino      vlimb += (vgtu & t);
86d7f5d3SJohn Marino
86d7f5d3SJohn Marino      /* u <-- |u - v| */
86d7f5d3SJohn Marino      ulimb = (t ^ vgtu) - vgtu;
86d7f5d3SJohn Marino
86d7f5d3SJohn Marino#if USE_ZEROTAB
86d7f5d3SJohn Marino      /* Number of trailing zeros is the same no matter if we look at
86d7f5d3SJohn Marino       * t or ulimb, but using t gives more parallelism. */
86d7f5d3SJohn Marino      c = zerotab[t & 15];
86d7f5d3SJohn Marino
86d7f5d3SJohn Marino      while (UNLIKELY (c == 4))
86d7f5d3SJohn Marino	{
86d7f5d3SJohn Marino	  ulimb >>= 4;
86d7f5d3SJohn Marino	  if (0)
86d7f5d3SJohn Marino	  strip_u_maybe:
86d7f5d3SJohn Marino	    vlimb >>= 1;
86d7f5d3SJohn Marino
86d7f5d3SJohn Marino	  c = zerotab[ulimb & 15];
86d7f5d3SJohn Marino	}
86d7f5d3SJohn Marino#else
86d7f5d3SJohn Marino      if (0)
86d7f5d3SJohn Marino	{
86d7f5d3SJohn Marino	strip_u_maybe:
86d7f5d3SJohn Marino	  vlimb >>= 1;
86d7f5d3SJohn Marino	  t = ulimb;
86d7f5d3SJohn Marino	}
86d7f5d3SJohn Marino      count_trailing_zeros (c, t);
86d7f5d3SJohn Marino#endif
86d7f5d3SJohn Marino      ulimb >>= (c + 1);
86d7f5d3SJohn Marino    }
86d7f5d3SJohn Marino
86d7f5d3SJohn Marino  vlimb = (vlimb << 1) | 1;
86d7f5d3SJohn Marino# else
86d7f5d3SJohn Marino#  error Unknown GCD_1_METHOD
86d7f5d3SJohn Marino# endif
86d7f5d3SJohn Marino#endif
86d7f5d3SJohn Marino
86d7f5d3SJohn Marino done:
86d7f5d3SJohn Marino  return vlimb << zero_bits;
86d7f5d3SJohn Marino}