mpn/generic/gcdext_lehmer.c

*86d7f5d3SJohn Marino/* mpn_gcdext -- Extended Greatest Common Divisor.
*86d7f5d3SJohn Marino
*86d7f5d3SJohn MarinoCopyright 1996, 1998, 2000, 2001, 2002, 2003, 2004, 2005, 2008, 2009 Free Software
*86d7f5d3SJohn MarinoFoundation, Inc.
*86d7f5d3SJohn Marino
*86d7f5d3SJohn MarinoThis file is part of the GNU MP Library.
*86d7f5d3SJohn Marino
*86d7f5d3SJohn MarinoThe GNU MP Library is free software; you can redistribute it and/or modify
*86d7f5d3SJohn Marinoit under the terms of the GNU Lesser General Public License as published by
*86d7f5d3SJohn Marinothe Free Software Foundation; either version 3 of the License, or (at your
*86d7f5d3SJohn Marinooption) any later version.
*86d7f5d3SJohn Marino
*86d7f5d3SJohn MarinoThe GNU MP Library is distributed in the hope that it will be useful, but
*86d7f5d3SJohn MarinoWITHOUT ANY WARRANTY; without even the implied warranty of MERCHANTABILITY
*86d7f5d3SJohn Marinoor FITNESS FOR A PARTICULAR PURPOSE.  See the GNU Lesser General Public
*86d7f5d3SJohn MarinoLicense for more details.
*86d7f5d3SJohn Marino
*86d7f5d3SJohn MarinoYou should have received a copy of the GNU Lesser General Public License
*86d7f5d3SJohn Marinoalong with the GNU MP Library.  If not, see http://www.gnu.org/licenses/.  */
*86d7f5d3SJohn Marino
*86d7f5d3SJohn Marino#include "gmp.h"
*86d7f5d3SJohn Marino#include "gmp-impl.h"
*86d7f5d3SJohn Marino#include "longlong.h"
*86d7f5d3SJohn Marino
*86d7f5d3SJohn Marino/* Temporary storage: 3*(n+1) for u. n+1 for the matrix-vector
*86d7f5d3SJohn Marino   multiplications (if hgcd2 succeeds). If hgcd fails, n+1 limbs are
*86d7f5d3SJohn Marino   needed for the division, with most n for the quotient, and n+1 for
*86d7f5d3SJohn Marino   the product q u0. In all, 4n + 3. */
*86d7f5d3SJohn Marino
*86d7f5d3SJohn Marinomp_size_t
*86d7f5d3SJohn Marinompn_gcdext_lehmer_n (mp_ptr gp, mp_ptr up, mp_size_t *usize,
*86d7f5d3SJohn Marino		     mp_ptr ap, mp_ptr bp, mp_size_t n,
*86d7f5d3SJohn Marino		     mp_ptr tp)
*86d7f5d3SJohn Marino{
*86d7f5d3SJohn Marino  mp_size_t ualloc = n + 1;
*86d7f5d3SJohn Marino
*86d7f5d3SJohn Marino  /* Keeps track of the second row of the reduction matrix
*86d7f5d3SJohn Marino   *
*86d7f5d3SJohn Marino   *   M = (v0, v1 ; u0, u1)
*86d7f5d3SJohn Marino   *
*86d7f5d3SJohn Marino   * which correspond to the first column of the inverse
*86d7f5d3SJohn Marino   *
*86d7f5d3SJohn Marino   *   M^{-1} = (u1, -v1; -u0, v0)
*86d7f5d3SJohn Marino   */
*86d7f5d3SJohn Marino
*86d7f5d3SJohn Marino  mp_size_t un;
*86d7f5d3SJohn Marino  mp_ptr u0;
*86d7f5d3SJohn Marino  mp_ptr u1;
*86d7f5d3SJohn Marino  mp_ptr u2;
*86d7f5d3SJohn Marino
*86d7f5d3SJohn Marino  MPN_ZERO (tp, 3*ualloc);
*86d7f5d3SJohn Marino  u0 = tp; tp += ualloc;
*86d7f5d3SJohn Marino  u1 = tp; tp += ualloc;
*86d7f5d3SJohn Marino  u2 = tp; tp += ualloc;
*86d7f5d3SJohn Marino
*86d7f5d3SJohn Marino  u1[0] = 1; un = 1;
*86d7f5d3SJohn Marino
*86d7f5d3SJohn Marino  /* FIXME: Handle n == 2 differently, after the loop? */
*86d7f5d3SJohn Marino  while (n >= 2)
*86d7f5d3SJohn Marino    {
*86d7f5d3SJohn Marino      struct hgcd_matrix1 M;
*86d7f5d3SJohn Marino      mp_limb_t ah, al, bh, bl;
*86d7f5d3SJohn Marino      mp_limb_t mask;
*86d7f5d3SJohn Marino
*86d7f5d3SJohn Marino      mask = ap[n-1] | bp[n-1];
*86d7f5d3SJohn Marino      ASSERT (mask > 0);
*86d7f5d3SJohn Marino
*86d7f5d3SJohn Marino      if (mask & GMP_NUMB_HIGHBIT)
*86d7f5d3SJohn Marino	{
*86d7f5d3SJohn Marino	  ah = ap[n-1]; al = ap[n-2];
*86d7f5d3SJohn Marino	  bh = bp[n-1]; bl = bp[n-2];
*86d7f5d3SJohn Marino	}
*86d7f5d3SJohn Marino      else if (n == 2)
*86d7f5d3SJohn Marino	{
*86d7f5d3SJohn Marino	  /* We use the full inputs without truncation, so we can
*86d7f5d3SJohn Marino	     safely shift left. */
*86d7f5d3SJohn Marino	  int shift;
*86d7f5d3SJohn Marino
*86d7f5d3SJohn Marino	  count_leading_zeros (shift, mask);
*86d7f5d3SJohn Marino	  ah = MPN_EXTRACT_NUMB (shift, ap[1], ap[0]);
*86d7f5d3SJohn Marino	  al = ap[0] << shift;
*86d7f5d3SJohn Marino	  bh = MPN_EXTRACT_NUMB (shift, bp[1], bp[0]);
*86d7f5d3SJohn Marino	  bl = bp[0] << shift;
*86d7f5d3SJohn Marino	}
*86d7f5d3SJohn Marino      else
*86d7f5d3SJohn Marino	{
*86d7f5d3SJohn Marino	  int shift;
*86d7f5d3SJohn Marino
*86d7f5d3SJohn Marino	  count_leading_zeros (shift, mask);
*86d7f5d3SJohn Marino	  ah = MPN_EXTRACT_NUMB (shift, ap[n-1], ap[n-2]);
*86d7f5d3SJohn Marino	  al = MPN_EXTRACT_NUMB (shift, ap[n-2], ap[n-3]);
*86d7f5d3SJohn Marino	  bh = MPN_EXTRACT_NUMB (shift, bp[n-1], bp[n-2]);
*86d7f5d3SJohn Marino	  bl = MPN_EXTRACT_NUMB (shift, bp[n-2], bp[n-3]);
*86d7f5d3SJohn Marino	}
*86d7f5d3SJohn Marino
*86d7f5d3SJohn Marino      /* Try an mpn_nhgcd2 step */
*86d7f5d3SJohn Marino      if (mpn_hgcd2 (ah, al, bh, bl, &M))
*86d7f5d3SJohn Marino	{
*86d7f5d3SJohn Marino	  n = mpn_hgcd_mul_matrix1_inverse_vector (&M, tp, ap, bp, n);
*86d7f5d3SJohn Marino	  MP_PTR_SWAP (ap, tp);
*86d7f5d3SJohn Marino	  un = mpn_hgcd_mul_matrix1_vector(&M, u2, u0, u1, un);
*86d7f5d3SJohn Marino	  MP_PTR_SWAP (u0, u2);
*86d7f5d3SJohn Marino	}
*86d7f5d3SJohn Marino      else
*86d7f5d3SJohn Marino	{
*86d7f5d3SJohn Marino	  /* mpn_hgcd2 has failed. Then either one of a or b is very
*86d7f5d3SJohn Marino	     small, or the difference is very small. Perform one
*86d7f5d3SJohn Marino	     subtraction followed by one division. */
*86d7f5d3SJohn Marino	  mp_size_t gn;
*86d7f5d3SJohn Marino	  mp_size_t updated_un = un;
*86d7f5d3SJohn Marino
*86d7f5d3SJohn Marino	  /* Temporary storage n for the quotient and ualloc for the
*86d7f5d3SJohn Marino	     new cofactor. */
*86d7f5d3SJohn Marino	  n = mpn_gcdext_subdiv_step (gp, &gn, up, usize, ap, bp, n,
*86d7f5d3SJohn Marino				      u0, u1, &updated_un, tp, u2);
*86d7f5d3SJohn Marino	  if (n == 0)
*86d7f5d3SJohn Marino	    return gn;
*86d7f5d3SJohn Marino
*86d7f5d3SJohn Marino	  un = updated_un;
*86d7f5d3SJohn Marino	}
*86d7f5d3SJohn Marino    }
*86d7f5d3SJohn Marino  ASSERT_ALWAYS (ap[0] > 0);
*86d7f5d3SJohn Marino  ASSERT_ALWAYS (bp[0] > 0);
*86d7f5d3SJohn Marino
*86d7f5d3SJohn Marino  if (ap[0] == bp[0])
*86d7f5d3SJohn Marino    {
*86d7f5d3SJohn Marino      int c;
*86d7f5d3SJohn Marino
*86d7f5d3SJohn Marino      /* Which cofactor to return now? Candidates are +u1 and -u0,
*86d7f5d3SJohn Marino	 depending on which of a and b was most recently reduced,
*86d7f5d3SJohn Marino	 which we don't keep track of. So compare and get the smallest
*86d7f5d3SJohn Marino	 one. */
*86d7f5d3SJohn Marino
*86d7f5d3SJohn Marino      gp[0] = ap[0];
*86d7f5d3SJohn Marino
*86d7f5d3SJohn Marino      MPN_CMP (c, u0, u1, un);
*86d7f5d3SJohn Marino      ASSERT (c != 0 || (un == 1 && u0[0] == 1 && u1[0] == 1));
*86d7f5d3SJohn Marino      if (c < 0)
*86d7f5d3SJohn Marino	{
*86d7f5d3SJohn Marino	  MPN_NORMALIZE (u0, un);
*86d7f5d3SJohn Marino	  MPN_COPY (up, u0, un);
*86d7f5d3SJohn Marino	  *usize = -un;
*86d7f5d3SJohn Marino	}
*86d7f5d3SJohn Marino      else
*86d7f5d3SJohn Marino	{
*86d7f5d3SJohn Marino	  MPN_NORMALIZE_NOT_ZERO (u1, un);
*86d7f5d3SJohn Marino	  MPN_COPY (up, u1, un);
*86d7f5d3SJohn Marino	  *usize = un;
*86d7f5d3SJohn Marino	}
*86d7f5d3SJohn Marino      return 1;
*86d7f5d3SJohn Marino    }
*86d7f5d3SJohn Marino  else
*86d7f5d3SJohn Marino    {
*86d7f5d3SJohn Marino      mp_limb_t uh, vh;
*86d7f5d3SJohn Marino      mp_limb_signed_t u;
*86d7f5d3SJohn Marino      mp_limb_signed_t v;
*86d7f5d3SJohn Marino      int negate;
*86d7f5d3SJohn Marino
*86d7f5d3SJohn Marino      gp[0] = mpn_gcdext_1 (&u, &v, ap[0], bp[0]);
*86d7f5d3SJohn Marino
*86d7f5d3SJohn Marino      /* Set up = u u1 - v u0. Keep track of size, un grows by one or
*86d7f5d3SJohn Marino	 two limbs. */
*86d7f5d3SJohn Marino
*86d7f5d3SJohn Marino      if (u == 0)
*86d7f5d3SJohn Marino	{
*86d7f5d3SJohn Marino	  ASSERT (v == 1);
*86d7f5d3SJohn Marino	  MPN_NORMALIZE (u0, un);
*86d7f5d3SJohn Marino	  MPN_COPY (up, u0, un);
*86d7f5d3SJohn Marino	  *usize = -un;
*86d7f5d3SJohn Marino	  return 1;
*86d7f5d3SJohn Marino	}
*86d7f5d3SJohn Marino      else if (v == 0)
*86d7f5d3SJohn Marino	{
*86d7f5d3SJohn Marino	  ASSERT (u == 1);
*86d7f5d3SJohn Marino	  MPN_NORMALIZE (u1, un);
*86d7f5d3SJohn Marino	  MPN_COPY (up, u1, un);
*86d7f5d3SJohn Marino	  *usize = un;
*86d7f5d3SJohn Marino	  return 1;
*86d7f5d3SJohn Marino	}
*86d7f5d3SJohn Marino      else if (u > 0)
*86d7f5d3SJohn Marino	{
*86d7f5d3SJohn Marino	  negate = 0;
*86d7f5d3SJohn Marino	  ASSERT (v < 0);
*86d7f5d3SJohn Marino	  v = -v;
*86d7f5d3SJohn Marino	}
*86d7f5d3SJohn Marino      else
*86d7f5d3SJohn Marino	{
*86d7f5d3SJohn Marino	  negate = 1;
*86d7f5d3SJohn Marino	  ASSERT (v > 0);
*86d7f5d3SJohn Marino	  u = -u;
*86d7f5d3SJohn Marino	}
*86d7f5d3SJohn Marino
*86d7f5d3SJohn Marino      uh = mpn_mul_1 (up, u1, un, u);
*86d7f5d3SJohn Marino      vh = mpn_addmul_1 (up, u0, un, v);
*86d7f5d3SJohn Marino
*86d7f5d3SJohn Marino      if ( (uh | vh) > 0)
*86d7f5d3SJohn Marino	{
*86d7f5d3SJohn Marino	  uh += vh;
*86d7f5d3SJohn Marino	  up[un++] = uh;
*86d7f5d3SJohn Marino	  if (uh < vh)
*86d7f5d3SJohn Marino	    up[un++] = 1;
*86d7f5d3SJohn Marino	}
*86d7f5d3SJohn Marino
*86d7f5d3SJohn Marino      MPN_NORMALIZE_NOT_ZERO (up, un);
*86d7f5d3SJohn Marino
*86d7f5d3SJohn Marino      *usize = negate ? -un : un;
*86d7f5d3SJohn Marino      return 1;
*86d7f5d3SJohn Marino    }
*86d7f5d3SJohn Marino}