gmp/mpz/lucnum_ui.c

*86d7f5d3SJohn Marino/* mpz_lucnum_ui -- calculate Lucas number.
*86d7f5d3SJohn Marino
*86d7f5d3SJohn MarinoCopyright 2001, 2003, 2005 Free Software Foundation, Inc.
*86d7f5d3SJohn Marino
*86d7f5d3SJohn MarinoThis file is part of the GNU MP Library.
*86d7f5d3SJohn Marino
*86d7f5d3SJohn MarinoThe GNU MP Library is free software; you can redistribute it and/or modify
*86d7f5d3SJohn Marinoit under the terms of the GNU Lesser General Public License as published by
*86d7f5d3SJohn Marinothe Free Software Foundation; either version 3 of the License, or (at your
*86d7f5d3SJohn Marinooption) any later version.
*86d7f5d3SJohn Marino
*86d7f5d3SJohn MarinoThe GNU MP Library is distributed in the hope that it will be useful, but
*86d7f5d3SJohn MarinoWITHOUT ANY WARRANTY; without even the implied warranty of MERCHANTABILITY
*86d7f5d3SJohn Marinoor FITNESS FOR A PARTICULAR PURPOSE.  See the GNU Lesser General Public
*86d7f5d3SJohn MarinoLicense for more details.
*86d7f5d3SJohn Marino
*86d7f5d3SJohn MarinoYou should have received a copy of the GNU Lesser General Public License
*86d7f5d3SJohn Marinoalong with the GNU MP Library.  If not, see http://www.gnu.org/licenses/.  */
*86d7f5d3SJohn Marino
*86d7f5d3SJohn Marino#include <stdio.h>
*86d7f5d3SJohn Marino#include "gmp.h"
*86d7f5d3SJohn Marino#include "gmp-impl.h"
*86d7f5d3SJohn Marino
*86d7f5d3SJohn Marino
*86d7f5d3SJohn Marino/* change this to "#define TRACE(x) x" for diagnostics */
*86d7f5d3SJohn Marino#define TRACE(x)
*86d7f5d3SJohn Marino
*86d7f5d3SJohn Marino
*86d7f5d3SJohn Marino/* Notes:
*86d7f5d3SJohn Marino
*86d7f5d3SJohn Marino   For the +4 in L[2k+1] when k is even, all L[4m+3] == 4, 5 or 7 mod 8, so
*86d7f5d3SJohn Marino   there can't be an overflow applying +4 to just the low limb (since that
*86d7f5d3SJohn Marino   would leave 0, 1, 2 or 3 mod 8).
*86d7f5d3SJohn Marino
*86d7f5d3SJohn Marino   For the -4 in L[2k+1] when k is even, it seems (no proof) that
*86d7f5d3SJohn Marino   L[3*2^(b-2)-3] == -4 mod 2^b, so for instance with a 32-bit limb
*86d7f5d3SJohn Marino   L[0xBFFFFFFD] == 0xFFFFFFFC mod 2^32, and this implies a borrow from the
*86d7f5d3SJohn Marino   low limb.  Obviously L[0xBFFFFFFD] is a huge number, but it's at least
*86d7f5d3SJohn Marino   conceivable to calculate it, so it probably should be handled.
*86d7f5d3SJohn Marino
*86d7f5d3SJohn Marino   For the -2 in L[2k] with k even, it seems (no proof) L[2^(b-1)] == -1 mod
*86d7f5d3SJohn Marino   2^b, so for instance in 32-bits L[0x80000000] has a low limb of
*86d7f5d3SJohn Marino   0xFFFFFFFF so there would have been a borrow.  Again L[0x80000000] is
*86d7f5d3SJohn Marino   obviously huge, but probably should be made to work.  */
*86d7f5d3SJohn Marino
*86d7f5d3SJohn Marinovoid
*86d7f5d3SJohn Marinompz_lucnum_ui (mpz_ptr ln, unsigned long n)
*86d7f5d3SJohn Marino{
*86d7f5d3SJohn Marino  mp_size_t  lalloc, xalloc, lsize, xsize;
*86d7f5d3SJohn Marino  mp_ptr     lp, xp;
*86d7f5d3SJohn Marino  mp_limb_t  c;
*86d7f5d3SJohn Marino  int        zeros;
*86d7f5d3SJohn Marino  TMP_DECL;
*86d7f5d3SJohn Marino
*86d7f5d3SJohn Marino  TRACE (printf ("mpn_lucnum_ui n=%lu\n", n));
*86d7f5d3SJohn Marino
*86d7f5d3SJohn Marino  if (n <= FIB_TABLE_LUCNUM_LIMIT)
*86d7f5d3SJohn Marino    {
*86d7f5d3SJohn Marino      /* L[n] = F[n] + 2F[n-1] */
*86d7f5d3SJohn Marino      PTR(ln)[0] = FIB_TABLE(n) + 2 * FIB_TABLE ((int) n - 1);
*86d7f5d3SJohn Marino      SIZ(ln) = 1;
*86d7f5d3SJohn Marino      return;
*86d7f5d3SJohn Marino    }
*86d7f5d3SJohn Marino
*86d7f5d3SJohn Marino  /* +1 since L[n]=F[n]+2F[n-1] might be 1 limb bigger than F[n], further +1
*86d7f5d3SJohn Marino     since square or mul used below might need an extra limb over the true
*86d7f5d3SJohn Marino     size */
*86d7f5d3SJohn Marino  lalloc = MPN_FIB2_SIZE (n) + 2;
*86d7f5d3SJohn Marino  MPZ_REALLOC (ln, lalloc);
*86d7f5d3SJohn Marino  lp = PTR (ln);
*86d7f5d3SJohn Marino
*86d7f5d3SJohn Marino  TMP_MARK;
*86d7f5d3SJohn Marino  xalloc = lalloc;
*86d7f5d3SJohn Marino  xp = TMP_ALLOC_LIMBS (xalloc);
*86d7f5d3SJohn Marino
*86d7f5d3SJohn Marino  /* Strip trailing zeros from n, until either an odd number is reached
*86d7f5d3SJohn Marino     where the L[2k+1] formula can be used, or until n fits within the
*86d7f5d3SJohn Marino     FIB_TABLE data.  The table is preferred of course.  */
*86d7f5d3SJohn Marino  zeros = 0;
*86d7f5d3SJohn Marino  for (;;)
*86d7f5d3SJohn Marino    {
*86d7f5d3SJohn Marino      if (n & 1)
*86d7f5d3SJohn Marino        {
*86d7f5d3SJohn Marino          /* L[2k+1] = 5*F[k-1]*(2*F[k]+F[k-1]) - 4*(-1)^k */
*86d7f5d3SJohn Marino
*86d7f5d3SJohn Marino          mp_size_t  yalloc, ysize;
*86d7f5d3SJohn Marino          mp_ptr     yp;
*86d7f5d3SJohn Marino
*86d7f5d3SJohn Marino          TRACE (printf ("  initial odd n=%lu\n", n));
*86d7f5d3SJohn Marino
*86d7f5d3SJohn Marino          yalloc = MPN_FIB2_SIZE (n/2);
*86d7f5d3SJohn Marino          yp = TMP_ALLOC_LIMBS (yalloc);
*86d7f5d3SJohn Marino          ASSERT (xalloc >= yalloc);
*86d7f5d3SJohn Marino
*86d7f5d3SJohn Marino          xsize = mpn_fib2_ui (xp, yp, n/2);
*86d7f5d3SJohn Marino
*86d7f5d3SJohn Marino          /* possible high zero on F[k-1] */
*86d7f5d3SJohn Marino          ysize = xsize;
*86d7f5d3SJohn Marino          ysize -= (yp[ysize-1] == 0);
*86d7f5d3SJohn Marino          ASSERT (yp[ysize-1] != 0);
*86d7f5d3SJohn Marino
*86d7f5d3SJohn Marino          /* xp = 2*F[k] + F[k-1] */
*86d7f5d3SJohn Marino#if HAVE_NATIVE_mpn_addlsh1_n
*86d7f5d3SJohn Marino          c = mpn_addlsh1_n (xp, yp, xp, xsize);
*86d7f5d3SJohn Marino#else
*86d7f5d3SJohn Marino          c = mpn_lshift (xp, xp, xsize, 1);
*86d7f5d3SJohn Marino          c += mpn_add_n (xp, xp, yp, xsize);
*86d7f5d3SJohn Marino#endif
*86d7f5d3SJohn Marino          ASSERT (xalloc >= xsize+1);
*86d7f5d3SJohn Marino          xp[xsize] = c;
*86d7f5d3SJohn Marino          xsize += (c != 0);
*86d7f5d3SJohn Marino          ASSERT (xp[xsize-1] != 0);
*86d7f5d3SJohn Marino
*86d7f5d3SJohn Marino          ASSERT (lalloc >= xsize + ysize);
*86d7f5d3SJohn Marino          c = mpn_mul (lp, xp, xsize, yp, ysize);
*86d7f5d3SJohn Marino          lsize = xsize + ysize;
*86d7f5d3SJohn Marino          lsize -= (c == 0);
*86d7f5d3SJohn Marino
*86d7f5d3SJohn Marino          /* lp = 5*lp */
*86d7f5d3SJohn Marino#if HAVE_NATIVE_mpn_addlshift
*86d7f5d3SJohn Marino          c = mpn_addlshift (lp, lp, lsize, 2);
*86d7f5d3SJohn Marino#else
*86d7f5d3SJohn Marino          c = mpn_lshift (xp, lp, lsize, 2);
*86d7f5d3SJohn Marino          c += mpn_add_n (lp, lp, xp, lsize);
*86d7f5d3SJohn Marino#endif
*86d7f5d3SJohn Marino          ASSERT (lalloc >= lsize+1);
*86d7f5d3SJohn Marino          lp[lsize] = c;
*86d7f5d3SJohn Marino          lsize += (c != 0);
*86d7f5d3SJohn Marino
*86d7f5d3SJohn Marino          /* lp = lp - 4*(-1)^k */
*86d7f5d3SJohn Marino          if (n & 2)
*86d7f5d3SJohn Marino            {
*86d7f5d3SJohn Marino              /* no overflow, see comments above */
*86d7f5d3SJohn Marino              ASSERT (lp[0] <= MP_LIMB_T_MAX-4);
*86d7f5d3SJohn Marino              lp[0] += 4;
*86d7f5d3SJohn Marino            }
*86d7f5d3SJohn Marino          else
*86d7f5d3SJohn Marino            {
*86d7f5d3SJohn Marino              /* won't go negative */
*86d7f5d3SJohn Marino              MPN_DECR_U (lp, lsize, CNST_LIMB(4));
*86d7f5d3SJohn Marino            }
*86d7f5d3SJohn Marino
*86d7f5d3SJohn Marino          TRACE (mpn_trace ("  l",lp, lsize));
*86d7f5d3SJohn Marino          break;
*86d7f5d3SJohn Marino        }
*86d7f5d3SJohn Marino
*86d7f5d3SJohn Marino      MP_PTR_SWAP (xp, lp); /* balance the swaps wanted in the L[2k] below */
*86d7f5d3SJohn Marino      zeros++;
*86d7f5d3SJohn Marino      n /= 2;
*86d7f5d3SJohn Marino
*86d7f5d3SJohn Marino      if (n <= FIB_TABLE_LUCNUM_LIMIT)
*86d7f5d3SJohn Marino        {
*86d7f5d3SJohn Marino          /* L[n] = F[n] + 2F[n-1] */
*86d7f5d3SJohn Marino          lp[0] = FIB_TABLE (n) + 2 * FIB_TABLE ((int) n - 1);
*86d7f5d3SJohn Marino          lsize = 1;
*86d7f5d3SJohn Marino
*86d7f5d3SJohn Marino          TRACE (printf ("  initial small n=%lu\n", n);
*86d7f5d3SJohn Marino                 mpn_trace ("  l",lp, lsize));
*86d7f5d3SJohn Marino          break;
*86d7f5d3SJohn Marino        }
*86d7f5d3SJohn Marino    }
*86d7f5d3SJohn Marino
*86d7f5d3SJohn Marino  for ( ; zeros != 0; zeros--)
*86d7f5d3SJohn Marino    {
*86d7f5d3SJohn Marino      /* L[2k] = L[k]^2 + 2*(-1)^k */
*86d7f5d3SJohn Marino
*86d7f5d3SJohn Marino      TRACE (printf ("  zeros=%d\n", zeros));
*86d7f5d3SJohn Marino
*86d7f5d3SJohn Marino      ASSERT (xalloc >= 2*lsize);
*86d7f5d3SJohn Marino      mpn_sqr (xp, lp, lsize);
*86d7f5d3SJohn Marino      lsize *= 2;
*86d7f5d3SJohn Marino      lsize -= (xp[lsize-1] == 0);
*86d7f5d3SJohn Marino
*86d7f5d3SJohn Marino      /* First time around the loop k==n determines (-1)^k, after that k is
*86d7f5d3SJohn Marino         always even and we set n=0 to indicate that.  */
*86d7f5d3SJohn Marino      if (n & 1)
*86d7f5d3SJohn Marino        {
*86d7f5d3SJohn Marino          /* L[n]^2 == 0 or 1 mod 4, like all squares, so +2 gives no carry */
*86d7f5d3SJohn Marino          ASSERT (xp[0] <= MP_LIMB_T_MAX-2);
*86d7f5d3SJohn Marino          xp[0] += 2;
*86d7f5d3SJohn Marino          n = 0;
*86d7f5d3SJohn Marino        }
*86d7f5d3SJohn Marino      else
*86d7f5d3SJohn Marino        {
*86d7f5d3SJohn Marino          /* won't go negative */
*86d7f5d3SJohn Marino          MPN_DECR_U (xp, lsize, CNST_LIMB(2));
*86d7f5d3SJohn Marino        }
*86d7f5d3SJohn Marino
*86d7f5d3SJohn Marino      MP_PTR_SWAP (xp, lp);
*86d7f5d3SJohn Marino      ASSERT (lp[lsize-1] != 0);
*86d7f5d3SJohn Marino    }
*86d7f5d3SJohn Marino
*86d7f5d3SJohn Marino  /* should end up in the right spot after all the xp/lp swaps */
*86d7f5d3SJohn Marino  ASSERT (lp == PTR(ln));
*86d7f5d3SJohn Marino  SIZ(ln) = lsize;
*86d7f5d3SJohn Marino
*86d7f5d3SJohn Marino  TMP_FREE;
*86d7f5d3SJohn Marino}