mpn/generic/invertappr.c

86d7f5d3SJohn Marino/* mpn_invertappr and helper functions.  Compute I such that
86d7f5d3SJohn Marino   floor((B^{2n}-1)/U - 1 <= I + B^n <= floor((B^{2n}-1)/U.
86d7f5d3SJohn Marino
86d7f5d3SJohn Marino   Contributed to the GNU project by Marco Bodrato.
86d7f5d3SJohn Marino
86d7f5d3SJohn Marino   The algorithm used here was inspired by ApproximateReciprocal from "Modern
86d7f5d3SJohn Marino   Computer Arithmetic", by Richard P. Brent and Paul Zimmermann.  Special
86d7f5d3SJohn Marino   thanks to Paul Zimmermann for his very valuable suggestions on all the
86d7f5d3SJohn Marino   theoretical aspects during the work on this code.
86d7f5d3SJohn Marino
86d7f5d3SJohn Marino   THE FUNCTIONS IN THIS FILE ARE INTERNAL WITH MUTABLE INTERFACES.  IT IS ONLY
86d7f5d3SJohn Marino   SAFE TO REACH THEM THROUGH DOCUMENTED INTERFACES.  IN FACT, IT IS ALMOST
86d7f5d3SJohn Marino   GUARANTEED THAT THEY WILL CHANGE OR DISAPPEAR IN A FUTURE GMP RELEASE.
86d7f5d3SJohn Marino
86d7f5d3SJohn MarinoCopyright (C) 2007, 2009, 2010 Free Software Foundation, Inc.
86d7f5d3SJohn Marino
86d7f5d3SJohn MarinoThis file is part of the GNU MP Library.
86d7f5d3SJohn Marino
86d7f5d3SJohn MarinoThe GNU MP Library is free software; you can redistribute it and/or modify
86d7f5d3SJohn Marinoit under the terms of the GNU Lesser General Public License as published by
86d7f5d3SJohn Marinothe Free Software Foundation; either version 3 of the License, or (at your
86d7f5d3SJohn Marinooption) any later version.
86d7f5d3SJohn Marino
86d7f5d3SJohn MarinoThe GNU MP Library is distributed in the hope that it will be useful, but
86d7f5d3SJohn MarinoWITHOUT ANY WARRANTY; without even the implied warranty of MERCHANTABILITY
86d7f5d3SJohn Marinoor FITNESS FOR A PARTICULAR PURPOSE.  See the GNU Lesser General Public
86d7f5d3SJohn MarinoLicense for more details.
86d7f5d3SJohn Marino
86d7f5d3SJohn MarinoYou should have received a copy of the GNU Lesser General Public License
86d7f5d3SJohn Marinoalong with the GNU MP Library.  If not, see http://www.gnu.org/licenses/.  */
86d7f5d3SJohn Marino
86d7f5d3SJohn Marino/* FIXME: Remove NULL and TMP_*, as soon as all the callers properly
86d7f5d3SJohn Marino   allocate and pass the scratch to the function. */
86d7f5d3SJohn Marino#include <stdlib.h>		/* for NULL */
86d7f5d3SJohn Marino
86d7f5d3SJohn Marino#include "gmp.h"
86d7f5d3SJohn Marino#include "gmp-impl.h"
86d7f5d3SJohn Marino#include "longlong.h"
86d7f5d3SJohn Marino
86d7f5d3SJohn Marino/* FIXME: The iterative version splits the operand in two slighty unbalanced
86d7f5d3SJohn Marino   parts, the use of log_2 (or counting the bits) underestimate the maximum
86d7f5d3SJohn Marino   number of iterations.  */
86d7f5d3SJohn Marino
86d7f5d3SJohn Marino/* This is intended for constant THRESHOLDs only, where the compiler
86d7f5d3SJohn Marino   can completely fold the result.  */
86d7f5d3SJohn Marino#define LOG2C(n) \
86d7f5d3SJohn Marino (((n) >=    0x1) + ((n) >=    0x2) + ((n) >=    0x4) + ((n) >=    0x8) + \
86d7f5d3SJohn Marino  ((n) >=   0x10) + ((n) >=   0x20) + ((n) >=   0x40) + ((n) >=   0x80) + \
86d7f5d3SJohn Marino  ((n) >=  0x100) + ((n) >=  0x200) + ((n) >=  0x400) + ((n) >=  0x800) + \
86d7f5d3SJohn Marino  ((n) >= 0x1000) + ((n) >= 0x2000) + ((n) >= 0x4000) + ((n) >= 0x8000))
86d7f5d3SJohn Marino
86d7f5d3SJohn Marino#if TUNE_PROGRAM_BUILD
86d7f5d3SJohn Marino#define NPOWS \
86d7f5d3SJohn Marino ((sizeof(mp_size_t) > 6 ? 48 : 8*sizeof(mp_size_t)))
86d7f5d3SJohn Marino#define MAYBE_dcpi1_divappr   1
86d7f5d3SJohn Marino#else
86d7f5d3SJohn Marino#define NPOWS \
86d7f5d3SJohn Marino ((sizeof(mp_size_t) > 6 ? 48 : 8*sizeof(mp_size_t)) - LOG2C (INV_NEWTON_THRESHOLD))
86d7f5d3SJohn Marino#define MAYBE_dcpi1_divappr \
86d7f5d3SJohn Marino  (INV_NEWTON_THRESHOLD < DC_DIVAPPR_Q_THRESHOLD)
86d7f5d3SJohn Marino#if (INV_NEWTON_THRESHOLD > INV_MULMOD_BNM1_THRESHOLD) && \
86d7f5d3SJohn Marino    (INV_APPR_THRESHOLD > INV_MULMOD_BNM1_THRESHOLD)
86d7f5d3SJohn Marino#undef  INV_MULMOD_BNM1_THRESHOLD
86d7f5d3SJohn Marino#define INV_MULMOD_BNM1_THRESHOLD 0 /* always when Newton */
86d7f5d3SJohn Marino#endif
86d7f5d3SJohn Marino#endif
86d7f5d3SJohn Marino
86d7f5d3SJohn Marino/* All the three functions mpn{,_bc,_ni}_invertappr (ip, dp, n, scratch), take
86d7f5d3SJohn Marino   the strictly normalised value {dp,n} (i.e., most significant bit must be set)
86d7f5d3SJohn Marino   as an input, and compute {ip,n}: the approximate reciprocal of {dp,n}.
86d7f5d3SJohn Marino
86d7f5d3SJohn Marino   Let e = mpn*_invertappr (ip, dp, n, scratch) be the returned value; the
86d7f5d3SJohn Marino   following conditions are satisfied by the output:
86d7f5d3SJohn Marino     0 <= e <= 1;
86d7f5d3SJohn Marino     {dp,n}*(B^n+{ip,n}) < B^{2n} <= {dp,n}*(B^n+{ip,n}+1+e) .
86d7f5d3SJohn Marino   I.e. e=0 means that the result {ip,n} equals the one given by mpn_invert.
86d7f5d3SJohn Marino	e=1 means that the result _may_ be one less than expected.
86d7f5d3SJohn Marino
86d7f5d3SJohn Marino   The _bc version returns e=1 most of the time.
86d7f5d3SJohn Marino   The _ni version should return e=0 most of the time; only about 1% of
86d7f5d3SJohn Marino   possible random input should give e=1.
86d7f5d3SJohn Marino
86d7f5d3SJohn Marino   When the strict result is needed, i.e., e=0 in the relation above:
86d7f5d3SJohn Marino     {dp,n}*(B^n+{ip,n}) < B^{2n} <= {dp,n}*(B^n+{ip,n}+1) ;
86d7f5d3SJohn Marino   the function mpn_invert (ip, dp, n, scratch) should be used instead.  */
86d7f5d3SJohn Marino
86d7f5d3SJohn Marino/* Maximum scratch needed by this branch (at tp): 3*n + 2 */
86d7f5d3SJohn Marinostatic mp_limb_t
86d7f5d3SJohn Marinompn_bc_invertappr (mp_ptr ip, mp_srcptr dp, mp_size_t n, mp_ptr tp)
86d7f5d3SJohn Marino{
86d7f5d3SJohn Marino  mp_ptr xp;
86d7f5d3SJohn Marino
86d7f5d3SJohn Marino  ASSERT (n > 0);
86d7f5d3SJohn Marino  ASSERT (dp[n-1] & GMP_NUMB_HIGHBIT);
86d7f5d3SJohn Marino  ASSERT (! MPN_OVERLAP_P (ip, n, dp, n));
86d7f5d3SJohn Marino  ASSERT (! MPN_OVERLAP_P (ip, n, tp, mpn_invertappr_itch(n)));
86d7f5d3SJohn Marino  ASSERT (! MPN_OVERLAP_P (dp, n, tp, mpn_invertappr_itch(n)));
86d7f5d3SJohn Marino
86d7f5d3SJohn Marino  /* Compute a base value of r limbs. */
86d7f5d3SJohn Marino  if (n == 1)
86d7f5d3SJohn Marino    invert_limb (*ip, *dp);
86d7f5d3SJohn Marino  else {
86d7f5d3SJohn Marino    mp_size_t i;
86d7f5d3SJohn Marino    xp = tp + n + 2;				/* 2 * n limbs */
86d7f5d3SJohn Marino
86d7f5d3SJohn Marino    for (i = n - 1; i >= 0; i--)
86d7f5d3SJohn Marino      xp[i] = GMP_NUMB_MAX;
86d7f5d3SJohn Marino    mpn_com (xp + n, dp, n);
86d7f5d3SJohn Marino
86d7f5d3SJohn Marino    /* Now xp contains B^2n - {dp,n}*B^n - 1 */
86d7f5d3SJohn Marino
86d7f5d3SJohn Marino    /* FIXME: if mpn_*pi1_divappr_q handles n==2, use it! */
86d7f5d3SJohn Marino    if (n == 2) {
86d7f5d3SJohn Marino      mpn_divrem_2 (ip, 0, xp, 4, dp);
86d7f5d3SJohn Marino    } else {
86d7f5d3SJohn Marino      gmp_pi1_t inv;
86d7f5d3SJohn Marino      invert_pi1 (inv, dp[n-1], dp[n-2]);
86d7f5d3SJohn Marino      if (! MAYBE_dcpi1_divappr
86d7f5d3SJohn Marino	  || BELOW_THRESHOLD (n, DC_DIVAPPR_Q_THRESHOLD))
86d7f5d3SJohn Marino	mpn_sbpi1_divappr_q (ip, xp, 2 * n, dp, n, inv.inv32);
86d7f5d3SJohn Marino      else
86d7f5d3SJohn Marino	mpn_dcpi1_divappr_q (ip, xp, 2 * n, dp, n, &inv);
86d7f5d3SJohn Marino      MPN_DECR_U(ip, n, 1);
86d7f5d3SJohn Marino      return 1;
86d7f5d3SJohn Marino    }
86d7f5d3SJohn Marino  }
86d7f5d3SJohn Marino  return 0;
86d7f5d3SJohn Marino}
86d7f5d3SJohn Marino
86d7f5d3SJohn Marino/* mpn_ni_invertappr: computes the approximate reciprocal using Newton's
86d7f5d3SJohn Marino   iterations (at least one).
86d7f5d3SJohn Marino
86d7f5d3SJohn Marino   Inspired by Algorithm "ApproximateReciprocal", published in "Modern Computer
86d7f5d3SJohn Marino   Arithmetic" by Richard P. Brent and Paul Zimmermann, algorithm 3.5, page 121
86d7f5d3SJohn Marino   in version 0.4 of the book.
86d7f5d3SJohn Marino
86d7f5d3SJohn Marino   Some adaptations were introduced, to allow product mod B^m-1 and return the
86d7f5d3SJohn Marino   value e.
86d7f5d3SJohn Marino
86d7f5d3SJohn Marino   USE_MUL_N = 1 (default) introduces a correction in such a way that "the
86d7f5d3SJohn Marino   value of B^{n+h}-T computed at step 8 cannot exceed B^n-1" (the book reads
86d7f5d3SJohn Marino   "2B^n-1").  This correction should not require to modify the proof.
86d7f5d3SJohn Marino
86d7f5d3SJohn Marino   We use a wrapped product modulo B^m-1.  NOTE: is there any normalisation
86d7f5d3SJohn Marino   problem for the [0] class?  It shouldn't: we compute 2*|A*X_h - B^{n+h}| <
86d7f5d3SJohn Marino   B^m-1.  We may get [0] if and only if we get AX_h = B^{n+h}.  This can
86d7f5d3SJohn Marino   happen only if A=B^{n}/2, but this implies X_h = B^{h}*2-1 i.e., AX_h =
86d7f5d3SJohn Marino   B^{n+h} - A, then we get into the "negative" branch, where X_h is not
86d7f5d3SJohn Marino   incremented (because A < B^n).
86d7f5d3SJohn Marino
86d7f5d3SJohn Marino   FIXME: the scratch for mulmod_bnm1 does not currently fit in the scratch, it
86d7f5d3SJohn Marino   is allocated apart.  */
86d7f5d3SJohn Marino
86d7f5d3SJohn Marino#define USE_MUL_N 1
86d7f5d3SJohn Marino
86d7f5d3SJohn Marinomp_limb_t
86d7f5d3SJohn Marinompn_ni_invertappr (mp_ptr ip, mp_srcptr dp, mp_size_t n, mp_ptr scratch)
86d7f5d3SJohn Marino{
86d7f5d3SJohn Marino  mp_limb_t cy;
86d7f5d3SJohn Marino  mp_ptr xp;
86d7f5d3SJohn Marino  mp_size_t rn, mn;
86d7f5d3SJohn Marino  mp_size_t sizes[NPOWS], *sizp;
86d7f5d3SJohn Marino  mp_ptr tp;
86d7f5d3SJohn Marino  TMP_DECL;
86d7f5d3SJohn Marino#define rp scratch
86d7f5d3SJohn Marino
86d7f5d3SJohn Marino  ASSERT (n > 2);
86d7f5d3SJohn Marino  ASSERT (dp[n-1] & GMP_NUMB_HIGHBIT);
86d7f5d3SJohn Marino  ASSERT (! MPN_OVERLAP_P (ip, n, dp, n));
86d7f5d3SJohn Marino  ASSERT (! MPN_OVERLAP_P (ip, n, scratch, mpn_invertappr_itch(n)));
86d7f5d3SJohn Marino  ASSERT (! MPN_OVERLAP_P (dp, n, scratch, mpn_invertappr_itch(n)));
86d7f5d3SJohn Marino
86d7f5d3SJohn Marino  /* Compute the computation precisions from highest to lowest, leaving the
86d7f5d3SJohn Marino     base case size in 'rn'.  */
86d7f5d3SJohn Marino  sizp = sizes;
86d7f5d3SJohn Marino  rn = n;
86d7f5d3SJohn Marino  do {
86d7f5d3SJohn Marino    *sizp = rn;
86d7f5d3SJohn Marino    rn = ((rn) >> 1) + 1;
86d7f5d3SJohn Marino    sizp ++;
86d7f5d3SJohn Marino  } while (ABOVE_THRESHOLD (rn, INV_NEWTON_THRESHOLD));
86d7f5d3SJohn Marino
86d7f5d3SJohn Marino  /* We search the inverse of 0.{dp,n}, we compute it as 1.{ip,n} */
86d7f5d3SJohn Marino  dp += n;
86d7f5d3SJohn Marino  ip += n;
86d7f5d3SJohn Marino
86d7f5d3SJohn Marino  /* Compute a base value of rn limbs. */
86d7f5d3SJohn Marino  mpn_bc_invertappr (ip - rn, dp - rn, rn, scratch);
86d7f5d3SJohn Marino
86d7f5d3SJohn Marino  TMP_MARK;
86d7f5d3SJohn Marino
86d7f5d3SJohn Marino  if (ABOVE_THRESHOLD (n, INV_MULMOD_BNM1_THRESHOLD))
86d7f5d3SJohn Marino    {
86d7f5d3SJohn Marino      mn = mpn_mulmod_bnm1_next_size (n + 1);
86d7f5d3SJohn Marino      tp = TMP_ALLOC_LIMBS (mpn_mulmod_bnm1_itch (mn, n, (n >> 1) + 1));
86d7f5d3SJohn Marino    }
86d7f5d3SJohn Marino  /* Use Newton's iterations to get the desired precision.*/
86d7f5d3SJohn Marino
86d7f5d3SJohn Marino  /* define rp scratch; 2rn + 1 limbs <= 2(n>>1 + 1) + 1 <= n + 3  limbs */
86d7f5d3SJohn Marino  /* Maximum scratch needed by this branch <= 3*n + 2 */
86d7f5d3SJohn Marino  xp = scratch + n + 3;				/*  n + rn limbs */
86d7f5d3SJohn Marino  while (1) {
86d7f5d3SJohn Marino    mp_limb_t method;
86d7f5d3SJohn Marino
86d7f5d3SJohn Marino    n = *--sizp;
86d7f5d3SJohn Marino    /*
86d7f5d3SJohn Marino      v    n  v
86d7f5d3SJohn Marino      +----+--+
86d7f5d3SJohn Marino      ^ rn ^
86d7f5d3SJohn Marino    */
86d7f5d3SJohn Marino
86d7f5d3SJohn Marino    /* Compute i_jd . */
86d7f5d3SJohn Marino    if (BELOW_THRESHOLD (n, INV_MULMOD_BNM1_THRESHOLD)
86d7f5d3SJohn Marino	|| ((mn = mpn_mulmod_bnm1_next_size (n + 1)) > (n + rn))) {
86d7f5d3SJohn Marino      /* FIXME: We do only need {xp,n+1}*/
86d7f5d3SJohn Marino      mpn_mul (xp, dp - n, n, ip - rn, rn);
86d7f5d3SJohn Marino      mpn_add_n (xp + rn, xp + rn, dp - n, n - rn + 1);
86d7f5d3SJohn Marino      method = 1; /* Remember we used (truncated) product */
86d7f5d3SJohn Marino      /* We computed cy.{xp,rn+n} <- 1.{ip,rn} * 0.{dp,n} */
86d7f5d3SJohn Marino    } else { /* Use B^n-1 wraparound */
86d7f5d3SJohn Marino      mpn_mulmod_bnm1 (xp, mn, dp - n, n, ip - rn, rn, tp);
86d7f5d3SJohn Marino      /* We computed {xp,mn} <- {ip,rn} * {dp,n} mod (B^mn-1) */
86d7f5d3SJohn Marino      /* We know that 2*|ip*dp + dp*B^rn - B^{rn+n}| < B^mn-1 */
86d7f5d3SJohn Marino      /* Add dp*B^rn mod (B^mn-1) */
86d7f5d3SJohn Marino      ASSERT (n >= mn - rn);
86d7f5d3SJohn Marino      xp[mn] = 1 + mpn_add_n (xp + rn, xp + rn, dp - n, mn - rn);
86d7f5d3SJohn Marino      cy = mpn_add_n (xp, xp, dp - (n - (mn - rn)), n - (mn - rn));
86d7f5d3SJohn Marino      MPN_INCR_U (xp + n - (mn - rn), mn + 1 - n + (mn - rn), cy);
86d7f5d3SJohn Marino      ASSERT (n + rn >=  mn);
86d7f5d3SJohn Marino      /* Subtract B^{rn+n} */
86d7f5d3SJohn Marino      MPN_DECR_U (xp + rn + n - mn, 2*mn + 1 - rn - n, 1);
86d7f5d3SJohn Marino      if (xp[mn])
86d7f5d3SJohn Marino	MPN_INCR_U (xp, mn, xp[mn] - 1);
86d7f5d3SJohn Marino      else
86d7f5d3SJohn Marino	MPN_DECR_U (xp, mn, 1);
86d7f5d3SJohn Marino      method = 0; /* Remember we are working Mod B^m-1 */
86d7f5d3SJohn Marino    }
86d7f5d3SJohn Marino
86d7f5d3SJohn Marino    if (xp[n] < 2) { /* "positive" residue class */
86d7f5d3SJohn Marino      cy = 1;
86d7f5d3SJohn Marino      while (xp[n] || mpn_cmp (xp, dp - n, n)>0) {
86d7f5d3SJohn Marino	xp[n] -= mpn_sub_n (xp, xp, dp - n, n);
86d7f5d3SJohn Marino	cy ++;
86d7f5d3SJohn Marino      }
86d7f5d3SJohn Marino      MPN_DECR_U(ip - rn, rn, cy);
86d7f5d3SJohn Marino      ASSERT (cy <= 4); /* at most 3 cycles for the while above */
86d7f5d3SJohn Marino      ASSERT_NOCARRY (mpn_sub_n (xp, dp - n, xp, n));
86d7f5d3SJohn Marino      ASSERT (xp[n] == 0);
86d7f5d3SJohn Marino    } else { /* "negative" residue class */
86d7f5d3SJohn Marino      mpn_com (xp, xp, n + 1);
86d7f5d3SJohn Marino      MPN_INCR_U(xp, n + 1, method);
86d7f5d3SJohn Marino      ASSERT (xp[n] <= 1);
86d7f5d3SJohn Marino#if USE_MUL_N
86d7f5d3SJohn Marino      if (xp[n]) {
86d7f5d3SJohn Marino	MPN_INCR_U(ip - rn, rn, 1);
86d7f5d3SJohn Marino	ASSERT_CARRY (mpn_sub_n (xp, xp, dp - n, n));
86d7f5d3SJohn Marino      }
86d7f5d3SJohn Marino#endif
86d7f5d3SJohn Marino    }
86d7f5d3SJohn Marino
86d7f5d3SJohn Marino    /* Compute x_ju_j. FIXME:We need {rp+rn,rn}, mulhi? */
86d7f5d3SJohn Marino#if USE_MUL_N
86d7f5d3SJohn Marino    mpn_mul_n (rp, xp + n - rn, ip - rn, rn);
86d7f5d3SJohn Marino#else
86d7f5d3SJohn Marino    rp[2*rn] = 0;
86d7f5d3SJohn Marino    mpn_mul (rp, xp + n - rn, rn + xp[n], ip - rn, rn);
86d7f5d3SJohn Marino#endif
86d7f5d3SJohn Marino    /* We need _only_ the carry from the next addition  */
86d7f5d3SJohn Marino    /* Anyway 2rn-n <= 2... we don't need to optimise.  */
86d7f5d3SJohn Marino    cy = mpn_add_n (rp + rn, rp + rn, xp + n - rn, 2*rn - n);
86d7f5d3SJohn Marino    cy = mpn_add_nc (ip - n, rp + 3*rn - n, xp + rn, n - rn, cy);
86d7f5d3SJohn Marino    MPN_INCR_U (ip - rn, rn, cy + (1-USE_MUL_N)*(rp[2*rn] + xp[n]));
86d7f5d3SJohn Marino    if (sizp == sizes) { /* Get out of the cycle */
86d7f5d3SJohn Marino      /* Check for possible carry propagation from below. */
86d7f5d3SJohn Marino      cy = rp[3*rn - n - 1] > GMP_NUMB_MAX - 7; /* Be conservative. */
86d7f5d3SJohn Marino/*    cy = mpn_add_1 (rp + rn, rp + rn, 2*rn - n, 4); */
86d7f5d3SJohn Marino      break;
86d7f5d3SJohn Marino    }
86d7f5d3SJohn Marino    rn = n;
86d7f5d3SJohn Marino  }
86d7f5d3SJohn Marino  TMP_FREE;
86d7f5d3SJohn Marino
86d7f5d3SJohn Marino  return cy;
86d7f5d3SJohn Marino#undef rp
86d7f5d3SJohn Marino}
86d7f5d3SJohn Marino
86d7f5d3SJohn Marinomp_limb_t
86d7f5d3SJohn Marinompn_invertappr (mp_ptr ip, mp_srcptr dp, mp_size_t n, mp_ptr scratch)
86d7f5d3SJohn Marino{
86d7f5d3SJohn Marino  mp_limb_t res;
86d7f5d3SJohn Marino  TMP_DECL;
86d7f5d3SJohn Marino
86d7f5d3SJohn Marino  TMP_MARK;
86d7f5d3SJohn Marino
86d7f5d3SJohn Marino  if (scratch == NULL)
86d7f5d3SJohn Marino    scratch = TMP_ALLOC_LIMBS (mpn_invertappr_itch (n));
86d7f5d3SJohn Marino
86d7f5d3SJohn Marino  ASSERT (n > 0);
86d7f5d3SJohn Marino  ASSERT (dp[n-1] & GMP_NUMB_HIGHBIT);
86d7f5d3SJohn Marino  ASSERT (! MPN_OVERLAP_P (ip, n, dp, n));
86d7f5d3SJohn Marino  ASSERT (! MPN_OVERLAP_P (ip, n, scratch, mpn_invertappr_itch(n)));
86d7f5d3SJohn Marino  ASSERT (! MPN_OVERLAP_P (dp, n, scratch, mpn_invertappr_itch(n)));
86d7f5d3SJohn Marino
86d7f5d3SJohn Marino  if (BELOW_THRESHOLD (n, INV_NEWTON_THRESHOLD))
86d7f5d3SJohn Marino    res = mpn_bc_invertappr (ip, dp, n, scratch);
86d7f5d3SJohn Marino  else
86d7f5d3SJohn Marino    res = mpn_ni_invertappr (ip, dp, n, scratch);
86d7f5d3SJohn Marino
86d7f5d3SJohn Marino  TMP_FREE;
86d7f5d3SJohn Marino  return res;
86d7f5d3SJohn Marino}