mpn/generic/gcdext_lehmer.c

86d7f5d3SJohn Marino/* mpn_gcdext -- Extended Greatest Common Divisor.
86d7f5d3SJohn Marino
86d7f5d3SJohn MarinoCopyright 1996, 1998, 2000, 2001, 2002, 2003, 2004, 2005, 2008, 2009 Free Software
86d7f5d3SJohn MarinoFoundation, Inc.
86d7f5d3SJohn Marino
86d7f5d3SJohn MarinoThis file is part of the GNU MP Library.
86d7f5d3SJohn Marino
86d7f5d3SJohn MarinoThe GNU MP Library is free software; you can redistribute it and/or modify
86d7f5d3SJohn Marinoit under the terms of the GNU Lesser General Public License as published by
86d7f5d3SJohn Marinothe Free Software Foundation; either version 3 of the License, or (at your
86d7f5d3SJohn Marinooption) any later version.
86d7f5d3SJohn Marino
86d7f5d3SJohn MarinoThe GNU MP Library is distributed in the hope that it will be useful, but
86d7f5d3SJohn MarinoWITHOUT ANY WARRANTY; without even the implied warranty of MERCHANTABILITY
86d7f5d3SJohn Marinoor FITNESS FOR A PARTICULAR PURPOSE.  See the GNU Lesser General Public
86d7f5d3SJohn MarinoLicense for more details.
86d7f5d3SJohn Marino
86d7f5d3SJohn MarinoYou should have received a copy of the GNU Lesser General Public License
86d7f5d3SJohn Marinoalong with the GNU MP Library.  If not, see http://www.gnu.org/licenses/.  */
86d7f5d3SJohn Marino
86d7f5d3SJohn Marino#include "gmp.h"
86d7f5d3SJohn Marino#include "gmp-impl.h"
86d7f5d3SJohn Marino#include "longlong.h"
86d7f5d3SJohn Marino
86d7f5d3SJohn Marino/* Temporary storage: 3*(n+1) for u. n+1 for the matrix-vector
86d7f5d3SJohn Marino   multiplications (if hgcd2 succeeds). If hgcd fails, n+1 limbs are
86d7f5d3SJohn Marino   needed for the division, with most n for the quotient, and n+1 for
86d7f5d3SJohn Marino   the product q u0. In all, 4n + 3. */
86d7f5d3SJohn Marino
86d7f5d3SJohn Marinomp_size_t
86d7f5d3SJohn Marinompn_gcdext_lehmer_n (mp_ptr gp, mp_ptr up, mp_size_t *usize,
86d7f5d3SJohn Marino		     mp_ptr ap, mp_ptr bp, mp_size_t n,
86d7f5d3SJohn Marino		     mp_ptr tp)
86d7f5d3SJohn Marino{
86d7f5d3SJohn Marino  mp_size_t ualloc = n + 1;
86d7f5d3SJohn Marino
86d7f5d3SJohn Marino  /* Keeps track of the second row of the reduction matrix
86d7f5d3SJohn Marino   *
86d7f5d3SJohn Marino   *   M = (v0, v1 ; u0, u1)
86d7f5d3SJohn Marino   *
86d7f5d3SJohn Marino   * which correspond to the first column of the inverse
86d7f5d3SJohn Marino   *
86d7f5d3SJohn Marino   *   M^{-1} = (u1, -v1; -u0, v0)
86d7f5d3SJohn Marino   */
86d7f5d3SJohn Marino
86d7f5d3SJohn Marino  mp_size_t un;
86d7f5d3SJohn Marino  mp_ptr u0;
86d7f5d3SJohn Marino  mp_ptr u1;
86d7f5d3SJohn Marino  mp_ptr u2;
86d7f5d3SJohn Marino
86d7f5d3SJohn Marino  MPN_ZERO (tp, 3*ualloc);
86d7f5d3SJohn Marino  u0 = tp; tp += ualloc;
86d7f5d3SJohn Marino  u1 = tp; tp += ualloc;
86d7f5d3SJohn Marino  u2 = tp; tp += ualloc;
86d7f5d3SJohn Marino
86d7f5d3SJohn Marino  u1[0] = 1; un = 1;
86d7f5d3SJohn Marino
86d7f5d3SJohn Marino  /* FIXME: Handle n == 2 differently, after the loop? */
86d7f5d3SJohn Marino  while (n >= 2)
86d7f5d3SJohn Marino    {
86d7f5d3SJohn Marino      struct hgcd_matrix1 M;
86d7f5d3SJohn Marino      mp_limb_t ah, al, bh, bl;
86d7f5d3SJohn Marino      mp_limb_t mask;
86d7f5d3SJohn Marino
86d7f5d3SJohn Marino      mask = ap[n-1] | bp[n-1];
86d7f5d3SJohn Marino      ASSERT (mask > 0);
86d7f5d3SJohn Marino
86d7f5d3SJohn Marino      if (mask & GMP_NUMB_HIGHBIT)
86d7f5d3SJohn Marino	{
86d7f5d3SJohn Marino	  ah = ap[n-1]; al = ap[n-2];
86d7f5d3SJohn Marino	  bh = bp[n-1]; bl = bp[n-2];
86d7f5d3SJohn Marino	}
86d7f5d3SJohn Marino      else if (n == 2)
86d7f5d3SJohn Marino	{
86d7f5d3SJohn Marino	  /* We use the full inputs without truncation, so we can
86d7f5d3SJohn Marino	     safely shift left. */
86d7f5d3SJohn Marino	  int shift;
86d7f5d3SJohn Marino
86d7f5d3SJohn Marino	  count_leading_zeros (shift, mask);
86d7f5d3SJohn Marino	  ah = MPN_EXTRACT_NUMB (shift, ap[1], ap[0]);
86d7f5d3SJohn Marino	  al = ap[0] << shift;
86d7f5d3SJohn Marino	  bh = MPN_EXTRACT_NUMB (shift, bp[1], bp[0]);
86d7f5d3SJohn Marino	  bl = bp[0] << shift;
86d7f5d3SJohn Marino	}
86d7f5d3SJohn Marino      else
86d7f5d3SJohn Marino	{
86d7f5d3SJohn Marino	  int shift;
86d7f5d3SJohn Marino
86d7f5d3SJohn Marino	  count_leading_zeros (shift, mask);
86d7f5d3SJohn Marino	  ah = MPN_EXTRACT_NUMB (shift, ap[n-1], ap[n-2]);
86d7f5d3SJohn Marino	  al = MPN_EXTRACT_NUMB (shift, ap[n-2], ap[n-3]);
86d7f5d3SJohn Marino	  bh = MPN_EXTRACT_NUMB (shift, bp[n-1], bp[n-2]);
86d7f5d3SJohn Marino	  bl = MPN_EXTRACT_NUMB (shift, bp[n-2], bp[n-3]);
86d7f5d3SJohn Marino	}
86d7f5d3SJohn Marino
86d7f5d3SJohn Marino      /* Try an mpn_nhgcd2 step */
86d7f5d3SJohn Marino      if (mpn_hgcd2 (ah, al, bh, bl, &M))
86d7f5d3SJohn Marino	{
86d7f5d3SJohn Marino	  n = mpn_hgcd_mul_matrix1_inverse_vector (&M, tp, ap, bp, n);
86d7f5d3SJohn Marino	  MP_PTR_SWAP (ap, tp);
86d7f5d3SJohn Marino	  un = mpn_hgcd_mul_matrix1_vector(&M, u2, u0, u1, un);
86d7f5d3SJohn Marino	  MP_PTR_SWAP (u0, u2);
86d7f5d3SJohn Marino	}
86d7f5d3SJohn Marino      else
86d7f5d3SJohn Marino	{
86d7f5d3SJohn Marino	  /* mpn_hgcd2 has failed. Then either one of a or b is very
86d7f5d3SJohn Marino	     small, or the difference is very small. Perform one
86d7f5d3SJohn Marino	     subtraction followed by one division. */
86d7f5d3SJohn Marino	  mp_size_t gn;
86d7f5d3SJohn Marino	  mp_size_t updated_un = un;
86d7f5d3SJohn Marino
86d7f5d3SJohn Marino	  /* Temporary storage n for the quotient and ualloc for the
86d7f5d3SJohn Marino	     new cofactor. */
86d7f5d3SJohn Marino	  n = mpn_gcdext_subdiv_step (gp, &gn, up, usize, ap, bp, n,
86d7f5d3SJohn Marino				      u0, u1, &updated_un, tp, u2);
86d7f5d3SJohn Marino	  if (n == 0)
86d7f5d3SJohn Marino	    return gn;
86d7f5d3SJohn Marino
86d7f5d3SJohn Marino	  un = updated_un;
86d7f5d3SJohn Marino	}
86d7f5d3SJohn Marino    }
86d7f5d3SJohn Marino  ASSERT_ALWAYS (ap[0] > 0);
86d7f5d3SJohn Marino  ASSERT_ALWAYS (bp[0] > 0);
86d7f5d3SJohn Marino
86d7f5d3SJohn Marino  if (ap[0] == bp[0])
86d7f5d3SJohn Marino    {
86d7f5d3SJohn Marino      int c;
86d7f5d3SJohn Marino
86d7f5d3SJohn Marino      /* Which cofactor to return now? Candidates are +u1 and -u0,
86d7f5d3SJohn Marino	 depending on which of a and b was most recently reduced,
86d7f5d3SJohn Marino	 which we don't keep track of. So compare and get the smallest
86d7f5d3SJohn Marino	 one. */
86d7f5d3SJohn Marino
86d7f5d3SJohn Marino      gp[0] = ap[0];
86d7f5d3SJohn Marino
86d7f5d3SJohn Marino      MPN_CMP (c, u0, u1, un);
86d7f5d3SJohn Marino      ASSERT (c != 0 || (un == 1 && u0[0] == 1 && u1[0] == 1));
86d7f5d3SJohn Marino      if (c < 0)
86d7f5d3SJohn Marino	{
86d7f5d3SJohn Marino	  MPN_NORMALIZE (u0, un);
86d7f5d3SJohn Marino	  MPN_COPY (up, u0, un);
86d7f5d3SJohn Marino	  *usize = -un;
86d7f5d3SJohn Marino	}
86d7f5d3SJohn Marino      else
86d7f5d3SJohn Marino	{
86d7f5d3SJohn Marino	  MPN_NORMALIZE_NOT_ZERO (u1, un);
86d7f5d3SJohn Marino	  MPN_COPY (up, u1, un);
86d7f5d3SJohn Marino	  *usize = un;
86d7f5d3SJohn Marino	}
86d7f5d3SJohn Marino      return 1;
86d7f5d3SJohn Marino    }
86d7f5d3SJohn Marino  else
86d7f5d3SJohn Marino    {
86d7f5d3SJohn Marino      mp_limb_t uh, vh;
86d7f5d3SJohn Marino      mp_limb_signed_t u;
86d7f5d3SJohn Marino      mp_limb_signed_t v;
86d7f5d3SJohn Marino      int negate;
86d7f5d3SJohn Marino
86d7f5d3SJohn Marino      gp[0] = mpn_gcdext_1 (&u, &v, ap[0], bp[0]);
86d7f5d3SJohn Marino
86d7f5d3SJohn Marino      /* Set up = u u1 - v u0. Keep track of size, un grows by one or
86d7f5d3SJohn Marino	 two limbs. */
86d7f5d3SJohn Marino
86d7f5d3SJohn Marino      if (u == 0)
86d7f5d3SJohn Marino	{
86d7f5d3SJohn Marino	  ASSERT (v == 1);
86d7f5d3SJohn Marino	  MPN_NORMALIZE (u0, un);
86d7f5d3SJohn Marino	  MPN_COPY (up, u0, un);
86d7f5d3SJohn Marino	  *usize = -un;
86d7f5d3SJohn Marino	  return 1;
86d7f5d3SJohn Marino	}
86d7f5d3SJohn Marino      else if (v == 0)
86d7f5d3SJohn Marino	{
86d7f5d3SJohn Marino	  ASSERT (u == 1);
86d7f5d3SJohn Marino	  MPN_NORMALIZE (u1, un);
86d7f5d3SJohn Marino	  MPN_COPY (up, u1, un);
86d7f5d3SJohn Marino	  *usize = un;
86d7f5d3SJohn Marino	  return 1;
86d7f5d3SJohn Marino	}
86d7f5d3SJohn Marino      else if (u > 0)
86d7f5d3SJohn Marino	{
86d7f5d3SJohn Marino	  negate = 0;
86d7f5d3SJohn Marino	  ASSERT (v < 0);
86d7f5d3SJohn Marino	  v = -v;
86d7f5d3SJohn Marino	}
86d7f5d3SJohn Marino      else
86d7f5d3SJohn Marino	{
86d7f5d3SJohn Marino	  negate = 1;
86d7f5d3SJohn Marino	  ASSERT (v > 0);
86d7f5d3SJohn Marino	  u = -u;
86d7f5d3SJohn Marino	}
86d7f5d3SJohn Marino
86d7f5d3SJohn Marino      uh = mpn_mul_1 (up, u1, un, u);
86d7f5d3SJohn Marino      vh = mpn_addmul_1 (up, u0, un, v);
86d7f5d3SJohn Marino
86d7f5d3SJohn Marino      if ( (uh | vh) > 0)
86d7f5d3SJohn Marino	{
86d7f5d3SJohn Marino	  uh += vh;
86d7f5d3SJohn Marino	  up[un++] = uh;
86d7f5d3SJohn Marino	  if (uh < vh)
86d7f5d3SJohn Marino	    up[un++] = 1;
86d7f5d3SJohn Marino	}
86d7f5d3SJohn Marino
86d7f5d3SJohn Marino      MPN_NORMALIZE_NOT_ZERO (up, un);
86d7f5d3SJohn Marino
86d7f5d3SJohn Marino      *usize = negate ? -un : un;
86d7f5d3SJohn Marino      return 1;
86d7f5d3SJohn Marino    }
86d7f5d3SJohn Marino}