mpfr/src/atan.c

4a238c70SJohn Marino/* mpfr_atan -- arc-tangent of a floating-point number
4a238c70SJohn Marino
*ab6d115fSJohn MarinoCopyright 2001, 2002, 2003, 2004, 2005, 2006, 2007, 2008, 2009, 2010, 2011, 2012, 2013 Free Software Foundation, Inc.
*ab6d115fSJohn MarinoContributed by the AriC and Caramel projects, INRIA.
4a238c70SJohn Marino
4a238c70SJohn MarinoThis file is part of the GNU MPFR Library.
4a238c70SJohn Marino
4a238c70SJohn MarinoThe GNU MPFR Library is free software; you can redistribute it and/or modify
4a238c70SJohn Marinoit under the terms of the GNU Lesser General Public License as published by
4a238c70SJohn Marinothe Free Software Foundation; either version 3 of the License, or (at your
4a238c70SJohn Marinooption) any later version.
4a238c70SJohn Marino
4a238c70SJohn MarinoThe GNU MPFR Library is distributed in the hope that it will be useful, but
4a238c70SJohn MarinoWITHOUT ANY WARRANTY; without even the implied warranty of MERCHANTABILITY
4a238c70SJohn Marinoor FITNESS FOR A PARTICULAR PURPOSE.  See the GNU Lesser General Public
4a238c70SJohn MarinoLicense for more details.
4a238c70SJohn Marino
4a238c70SJohn MarinoYou should have received a copy of the GNU Lesser General Public License
4a238c70SJohn Marinoalong with the GNU MPFR Library; see the file COPYING.LESSER.  If not, see
4a238c70SJohn Marinohttp://www.gnu.org/licenses/ or write to the Free Software Foundation, Inc.,
4a238c70SJohn Marino51 Franklin St, Fifth Floor, Boston, MA 02110-1301, USA. */
4a238c70SJohn Marino
4a238c70SJohn Marino#define MPFR_NEED_LONGLONG_H
4a238c70SJohn Marino#include "mpfr-impl.h"
4a238c70SJohn Marino
4a238c70SJohn Marino/* If x = p/2^r, put in y an approximation of atan(x)/x using 2^m terms
4a238c70SJohn Marino   for the series expansion, with an error of at most 1 ulp.
4a238c70SJohn Marino   Assumes |x| < 1.
4a238c70SJohn Marino
4a238c70SJohn Marino   If X=x^2, we want 1 - X/3 + X^2/5 - ... + (-1)^k*X^k/(2k+1) + ...
4a238c70SJohn Marino
4a238c70SJohn Marino   Assume p is non-zero.
4a238c70SJohn Marino
4a238c70SJohn Marino   When we sum terms up to x^k/(2k+1), the denominator Q[0] is
4a238c70SJohn Marino   3*5*7*...*(2k+1) ~ (2k/e)^k.
4a238c70SJohn Marino*/
4a238c70SJohn Marinostatic void
4a238c70SJohn Marinompfr_atan_aux (mpfr_ptr y, mpz_ptr p, long r, int m, mpz_t *tab)
4a238c70SJohn Marino{
4a238c70SJohn Marino  mpz_t *S, *Q, *ptoj;
4a238c70SJohn Marino  unsigned long n, i, k, j, l;
4a238c70SJohn Marino  mpfr_exp_t diff, expo;
4a238c70SJohn Marino  int im, done;
4a238c70SJohn Marino  mpfr_prec_t mult, *accu, *log2_nb_terms;
4a238c70SJohn Marino  mpfr_prec_t precy = MPFR_PREC(y);
4a238c70SJohn Marino
4a238c70SJohn Marino  MPFR_ASSERTD(mpz_cmp_ui (p, 0) != 0);
4a238c70SJohn Marino
4a238c70SJohn Marino  accu = (mpfr_prec_t*) (*__gmp_allocate_func) ((2 * m + 2) * sizeof (mpfr_prec_t));
4a238c70SJohn Marino  log2_nb_terms = accu + m + 1;
4a238c70SJohn Marino
4a238c70SJohn Marino  /* Set Tables */
4a238c70SJohn Marino  S    = tab;           /* S */
4a238c70SJohn Marino  ptoj = S + 1*(m+1);   /* p^2^j Precomputed table */
4a238c70SJohn Marino  Q    = S + 2*(m+1);   /* Product of Odd integer  table  */
4a238c70SJohn Marino
4a238c70SJohn Marino  /* From p to p^2, and r to 2r */
4a238c70SJohn Marino  mpz_mul (p, p, p);
4a238c70SJohn Marino  MPFR_ASSERTD (2 * r > r);
4a238c70SJohn Marino  r = 2 * r;
4a238c70SJohn Marino
4a238c70SJohn Marino  /* Normalize p */
4a238c70SJohn Marino  n = mpz_scan1 (p, 0);
4a238c70SJohn Marino  mpz_tdiv_q_2exp (p, p, n); /* exact */
4a238c70SJohn Marino  MPFR_ASSERTD (r > n);
4a238c70SJohn Marino  r -= n;
4a238c70SJohn Marino  /* since |p/2^r| < 1, and p is a non-zero integer, necessarily r > 0 */
4a238c70SJohn Marino
4a238c70SJohn Marino  MPFR_ASSERTD (mpz_sgn (p) > 0);
4a238c70SJohn Marino  MPFR_ASSERTD (m > 0);
4a238c70SJohn Marino
4a238c70SJohn Marino  /* check if p=1 (special case) */
4a238c70SJohn Marino  l = 0;
4a238c70SJohn Marino  /*
4a238c70SJohn Marino    We compute by binary splitting, with X = x^2 = p/2^r:
4a238c70SJohn Marino    P(a,b) = p if a+1=b, P(a,c)*P(c,b) otherwise
4a238c70SJohn Marino    Q(a,b) = (2a+1)*2^r if a+1=b [except Q(0,1)=1], Q(a,c)*Q(c,b) otherwise
4a238c70SJohn Marino    S(a,b) = p*(2a+1) if a+1=b, Q(c,b)*S(a,c)+Q(a,c)*P(a,c)*S(c,b) otherwise
4a238c70SJohn Marino    Then atan(x)/x ~ S(0,i)/Q(0,i) for i so that (p/2^r)^i/i is small enough.
4a238c70SJohn Marino    The factor 2^(r*(b-a)) in Q(a,b) is implicit, thus we have to take it
4a238c70SJohn Marino    into account when we compute with Q.
4a238c70SJohn Marino  */
4a238c70SJohn Marino  accu[0] = 0; /* accu[k] = Mult[0] + ... + Mult[k], where Mult[j] is the
4a238c70SJohn Marino                  number of bits of the corresponding term S[j]/Q[j] */
4a238c70SJohn Marino  if (mpz_cmp_ui (p, 1) != 0)
4a238c70SJohn Marino    {
4a238c70SJohn Marino      /* p <> 1: precompute ptoj table */
4a238c70SJohn Marino      mpz_set (ptoj[0], p);
4a238c70SJohn Marino      for (im = 1 ; im <= m ; im ++)
4a238c70SJohn Marino        mpz_mul (ptoj[im], ptoj[im - 1], ptoj[im - 1]);
4a238c70SJohn Marino      /* main loop */
4a238c70SJohn Marino      n = 1UL << m;
4a238c70SJohn Marino      /* the ith term being X^i/(2i+1) with X=p/2^r, we can stop when
4a238c70SJohn Marino         p^i/2^(r*i) < 2^(-precy), i.e. r*i > precy + log2(p^i) */
4a238c70SJohn Marino      for (i = k = done = 0; (i < n) && (done == 0); i += 2, k ++)
4a238c70SJohn Marino        {
4a238c70SJohn Marino          /* initialize both S[k],Q[k] and S[k+1],Q[k+1] */
4a238c70SJohn Marino          mpz_set_ui (Q[k+1], 2 * i + 3); /* Q(i+1,i+2) */
4a238c70SJohn Marino          mpz_mul_ui (S[k+1], p, 2 * i + 1); /* S(i+1,i+2) */
4a238c70SJohn Marino          mpz_mul_2exp (S[k], Q[k+1], r);
4a238c70SJohn Marino          mpz_sub (S[k], S[k], S[k+1]); /* S(i,i+2) */
4a238c70SJohn Marino          mpz_mul_ui (Q[k], Q[k+1], 2 * i + 1); /* Q(i,i+2) */
4a238c70SJohn Marino          log2_nb_terms[k] = 1; /* S[k]/Q[k] corresponds to 2 terms */
4a238c70SJohn Marino          for (j = (i + 2) >> 1, l = 1; (j & 1) == 0; l ++, j >>= 1, k --)
4a238c70SJohn Marino            {
4a238c70SJohn Marino              /* invariant: S[k-1]/Q[k-1] and S[k]/Q[k] correspond
4a238c70SJohn Marino                 to 2^l terms each. We combine them into S[k-1]/Q[k-1] */
4a238c70SJohn Marino              MPFR_ASSERTD (k > 0);
4a238c70SJohn Marino              mpz_mul (S[k], S[k], Q[k-1]);
4a238c70SJohn Marino              mpz_mul (S[k], S[k], ptoj[l]);
4a238c70SJohn Marino              mpz_mul (S[k-1], S[k-1], Q[k]);
4a238c70SJohn Marino              mpz_mul_2exp (S[k-1], S[k-1], r << l);
4a238c70SJohn Marino              mpz_add (S[k-1], S[k-1], S[k]);
4a238c70SJohn Marino              mpz_mul (Q[k-1], Q[k-1], Q[k]);
4a238c70SJohn Marino              log2_nb_terms[k-1] = l + 1;
4a238c70SJohn Marino              /* now S[k-1]/Q[k-1] corresponds to 2^(l+1) terms */
4a238c70SJohn Marino              MPFR_MPZ_SIZEINBASE2(mult, ptoj[l+1]);
4a238c70SJohn Marino              /* FIXME: precompute bits(ptoj[l+1]) outside the loop? */
4a238c70SJohn Marino              mult = (r << (l + 1)) - mult - 1;
4a238c70SJohn Marino              accu[k-1] = (k == 1) ? mult : accu[k-2] + mult;
4a238c70SJohn Marino              if (accu[k-1] > precy)
4a238c70SJohn Marino                done = 1;
4a238c70SJohn Marino            }
4a238c70SJohn Marino        }
4a238c70SJohn Marino    }
4a238c70SJohn Marino  else /* special case p=1: the ith term being X^i/(2i+1) with X=1/2^r,
4a238c70SJohn Marino          we can stop when r*i > precy i.e. i > precy/r */
4a238c70SJohn Marino    {
4a238c70SJohn Marino      n = 1UL << m;
4a238c70SJohn Marino      for (i = k = 0; (i < n) && (i <= precy / r); i += 2, k ++)
4a238c70SJohn Marino        {
4a238c70SJohn Marino          mpz_set_ui (Q[k + 1], 2 * i + 3);
4a238c70SJohn Marino          mpz_mul_2exp (S[k], Q[k+1], r);
4a238c70SJohn Marino          mpz_sub_ui (S[k], S[k], 1 + 2 * i);
4a238c70SJohn Marino          mpz_mul_ui (Q[k], Q[k + 1], 1 + 2 * i);
4a238c70SJohn Marino          log2_nb_terms[k] = 1; /* S[k]/Q[k] corresponds to 2 terms */
4a238c70SJohn Marino          for (j = (i + 2) >> 1, l = 1; (j & 1) == 0; l++, j >>= 1, k --)
4a238c70SJohn Marino            {
4a238c70SJohn Marino              MPFR_ASSERTD (k > 0);
4a238c70SJohn Marino              mpz_mul (S[k], S[k], Q[k-1]);
4a238c70SJohn Marino              mpz_mul (S[k-1], S[k-1], Q[k]);
4a238c70SJohn Marino              mpz_mul_2exp (S[k-1], S[k-1], r << l);
4a238c70SJohn Marino              mpz_add (S[k-1], S[k-1], S[k]);
4a238c70SJohn Marino              mpz_mul (Q[k-1], Q[k-1], Q[k]);
4a238c70SJohn Marino              log2_nb_terms[k-1] = l + 1;
4a238c70SJohn Marino            }
4a238c70SJohn Marino        }
4a238c70SJohn Marino    }
4a238c70SJohn Marino
4a238c70SJohn Marino  /* we need to combine S[0]/Q[0]...S[k-1]/Q[k-1] */
4a238c70SJohn Marino  l = 0; /* number of terms accumulated in S[k]/Q[k] */
4a238c70SJohn Marino  while (k > 1)
4a238c70SJohn Marino    {
4a238c70SJohn Marino      k --;
4a238c70SJohn Marino      /* combine S[k-1]/Q[k-1] and S[k]/Q[k] */
4a238c70SJohn Marino      j = log2_nb_terms[k-1];
4a238c70SJohn Marino      mpz_mul (S[k], S[k], Q[k-1]);
4a238c70SJohn Marino      if (mpz_cmp_ui (p, 1) != 0)
4a238c70SJohn Marino        mpz_mul (S[k], S[k], ptoj[j]);
4a238c70SJohn Marino      mpz_mul (S[k-1], S[k-1], Q[k]);
4a238c70SJohn Marino      l += 1 << log2_nb_terms[k];
4a238c70SJohn Marino      mpz_mul_2exp (S[k-1], S[k-1], r * l);
4a238c70SJohn Marino      mpz_add (S[k-1], S[k-1], S[k]);
4a238c70SJohn Marino      mpz_mul (Q[k-1], Q[k-1], Q[k]);
4a238c70SJohn Marino    }
4a238c70SJohn Marino  (*__gmp_free_func) (accu, (2 * m + 2) * sizeof (mpfr_prec_t));
4a238c70SJohn Marino
4a238c70SJohn Marino  MPFR_MPZ_SIZEINBASE2 (diff, S[0]);
4a238c70SJohn Marino  diff -= 2 * precy;
4a238c70SJohn Marino  expo = diff;
4a238c70SJohn Marino  if (diff >= 0)
4a238c70SJohn Marino    mpz_tdiv_q_2exp (S[0], S[0], diff);
4a238c70SJohn Marino  else
4a238c70SJohn Marino    mpz_mul_2exp (S[0], S[0], -diff);
4a238c70SJohn Marino
4a238c70SJohn Marino  MPFR_MPZ_SIZEINBASE2 (diff, Q[0]);
4a238c70SJohn Marino  diff -= precy;
4a238c70SJohn Marino  expo -= diff;
4a238c70SJohn Marino  if (diff >= 0)
4a238c70SJohn Marino    mpz_tdiv_q_2exp (Q[0], Q[0], diff);
4a238c70SJohn Marino  else
4a238c70SJohn Marino    mpz_mul_2exp (Q[0], Q[0], -diff);
4a238c70SJohn Marino
4a238c70SJohn Marino  mpz_tdiv_q (S[0], S[0], Q[0]);
4a238c70SJohn Marino  mpfr_set_z (y, S[0], MPFR_RNDD);
4a238c70SJohn Marino  MPFR_SET_EXP (y, MPFR_EXP(y) + expo - r * (i - 1));
4a238c70SJohn Marino}
4a238c70SJohn Marino
4a238c70SJohn Marinoint
4a238c70SJohn Marinompfr_atan (mpfr_ptr atan, mpfr_srcptr x, mpfr_rnd_t rnd_mode)
4a238c70SJohn Marino{
4a238c70SJohn Marino  mpfr_t xp, arctgt, sk, tmp, tmp2;
4a238c70SJohn Marino  mpz_t  ukz;
4a238c70SJohn Marino  mpz_t *tabz;
4a238c70SJohn Marino  mpfr_exp_t exptol;
4a238c70SJohn Marino  mpfr_prec_t prec, realprec, est_lost, lost;
4a238c70SJohn Marino  unsigned long twopoweri, log2p, red;
4a238c70SJohn Marino  int comparaison, inexact;
4a238c70SJohn Marino  int i, n0, oldn0;
4a238c70SJohn Marino  MPFR_GROUP_DECL (group);
4a238c70SJohn Marino  MPFR_SAVE_EXPO_DECL (expo);
4a238c70SJohn Marino  MPFR_ZIV_DECL (loop);
4a238c70SJohn Marino
4a238c70SJohn Marino  MPFR_LOG_FUNC
4a238c70SJohn Marino    (("x[%Pu]=%.*Rg rnd=%d", mpfr_get_prec (x), mpfr_log_prec, x, rnd_mode),
4a238c70SJohn Marino     ("atan[%Pu]=%.*Rg inexact=%d",
4a238c70SJohn Marino      mpfr_get_prec (atan), mpfr_log_prec, atan, inexact));
4a238c70SJohn Marino
4a238c70SJohn Marino  /* Singular cases */
4a238c70SJohn Marino  if (MPFR_UNLIKELY (MPFR_IS_SINGULAR (x)))
4a238c70SJohn Marino    {
4a238c70SJohn Marino      if (MPFR_IS_NAN (x))
4a238c70SJohn Marino        {
4a238c70SJohn Marino          MPFR_SET_NAN (atan);
4a238c70SJohn Marino          MPFR_RET_NAN;
4a238c70SJohn Marino        }
4a238c70SJohn Marino      else if (MPFR_IS_INF (x))
4a238c70SJohn Marino        {
4a238c70SJohn Marino          MPFR_SAVE_EXPO_MARK (expo);
4a238c70SJohn Marino          if (MPFR_IS_POS (x))  /* arctan(+inf) = Pi/2 */
4a238c70SJohn Marino            inexact = mpfr_const_pi (atan, rnd_mode);
4a238c70SJohn Marino          else /* arctan(-inf) = -Pi/2 */
4a238c70SJohn Marino            {
4a238c70SJohn Marino              inexact = -mpfr_const_pi (atan,
4a238c70SJohn Marino                                        MPFR_INVERT_RND (rnd_mode));
4a238c70SJohn Marino              MPFR_CHANGE_SIGN (atan);
4a238c70SJohn Marino            }
4a238c70SJohn Marino          mpfr_div_2ui (atan, atan, 1, rnd_mode);  /* exact (no exceptions) */
4a238c70SJohn Marino          MPFR_SAVE_EXPO_FREE (expo);
4a238c70SJohn Marino          return mpfr_check_range (atan, inexact, rnd_mode);
4a238c70SJohn Marino        }
4a238c70SJohn Marino      else /* x is necessarily 0 */
4a238c70SJohn Marino        {
4a238c70SJohn Marino          MPFR_ASSERTD (MPFR_IS_ZERO (x));
4a238c70SJohn Marino          MPFR_SET_ZERO (atan);
4a238c70SJohn Marino          MPFR_SET_SAME_SIGN (atan, x);
4a238c70SJohn Marino          MPFR_RET (0);
4a238c70SJohn Marino        }
4a238c70SJohn Marino    }
4a238c70SJohn Marino
4a238c70SJohn Marino  /* atan(x) = x - x^3/3 + x^5/5...
4a238c70SJohn Marino     so the error is < 2^(3*EXP(x)-1)
4a238c70SJohn Marino     so `EXP(x)-(3*EXP(x)-1)` = -2*EXP(x)+1 */
4a238c70SJohn Marino  MPFR_FAST_COMPUTE_IF_SMALL_INPUT (atan, x, -2 * MPFR_GET_EXP (x), 1, 0,
4a238c70SJohn Marino                                    rnd_mode, {});
4a238c70SJohn Marino
4a238c70SJohn Marino  /* Set x_p=|x| */
4a238c70SJohn Marino  MPFR_TMP_INIT_ABS (xp, x);
4a238c70SJohn Marino
4a238c70SJohn Marino  MPFR_SAVE_EXPO_MARK (expo);
4a238c70SJohn Marino
4a238c70SJohn Marino  /* Other simple case arctan(-+1)=-+pi/4 */
4a238c70SJohn Marino  comparaison = mpfr_cmp_ui (xp, 1);
4a238c70SJohn Marino  if (MPFR_UNLIKELY (comparaison == 0))
4a238c70SJohn Marino    {
4a238c70SJohn Marino      int neg = MPFR_IS_NEG (x);
4a238c70SJohn Marino      inexact = mpfr_const_pi (atan, MPFR_IS_POS (x) ? rnd_mode
4a238c70SJohn Marino                               : MPFR_INVERT_RND (rnd_mode));
4a238c70SJohn Marino      if (neg)
4a238c70SJohn Marino        {
4a238c70SJohn Marino          inexact = -inexact;
4a238c70SJohn Marino          MPFR_CHANGE_SIGN (atan);
4a238c70SJohn Marino        }
4a238c70SJohn Marino      mpfr_div_2ui (atan, atan, 2, rnd_mode);  /* exact (no exceptions) */
4a238c70SJohn Marino      MPFR_SAVE_EXPO_FREE (expo);
4a238c70SJohn Marino      return mpfr_check_range (atan, inexact, rnd_mode);
4a238c70SJohn Marino    }
4a238c70SJohn Marino
4a238c70SJohn Marino  realprec = MPFR_PREC (atan) + MPFR_INT_CEIL_LOG2 (MPFR_PREC (atan)) + 4;
4a238c70SJohn Marino  prec = realprec + GMP_NUMB_BITS;
4a238c70SJohn Marino
4a238c70SJohn Marino  /* Initialisation */
4a238c70SJohn Marino  mpz_init (ukz);
4a238c70SJohn Marino  MPFR_GROUP_INIT_4 (group, prec, sk, tmp, tmp2, arctgt);
4a238c70SJohn Marino  oldn0 = 0;
4a238c70SJohn Marino  tabz = (mpz_t *) 0;
4a238c70SJohn Marino
4a238c70SJohn Marino  MPFR_ZIV_INIT (loop, prec);
4a238c70SJohn Marino  for (;;)
4a238c70SJohn Marino    {
4a238c70SJohn Marino      /* First, if |x| < 1, we need to have more prec to be able to round (sup)
4a238c70SJohn Marino         n0 = ceil(log(prec_requested + 2 + 1+ln(2.4)/ln(2))/log(2)) */
4a238c70SJohn Marino      mpfr_prec_t sup;
4a238c70SJohn Marino      sup = MPFR_GET_EXP (xp) < 0 ? 2 - MPFR_GET_EXP (xp) : 1; /* sup >= 1 */
4a238c70SJohn Marino
4a238c70SJohn Marino      n0 = MPFR_INT_CEIL_LOG2 ((realprec + sup) + 3);
4a238c70SJohn Marino      /* since realprec >= 4, n0 >= ceil(log2(8)) >= 3, thus 3*n0 > 2 */
4a238c70SJohn Marino      prec = (realprec + sup) + 1 + MPFR_INT_CEIL_LOG2 (3*n0-2);
4a238c70SJohn Marino
4a238c70SJohn Marino      /* the number of lost bits due to argument reduction is
4a238c70SJohn Marino         9 - 2 * EXP(sk), which we estimate by 9 + 2*ceil(log2(p))
4a238c70SJohn Marino         since we manage that sk < 1/p */
4a238c70SJohn Marino      if (MPFR_PREC (atan) > 100)
4a238c70SJohn Marino        {
4a238c70SJohn Marino          log2p = MPFR_INT_CEIL_LOG2(prec) / 2 - 3;
4a238c70SJohn Marino          est_lost = 9 + 2 * log2p;
4a238c70SJohn Marino          prec += est_lost;
4a238c70SJohn Marino        }
4a238c70SJohn Marino      else
4a238c70SJohn Marino        log2p = est_lost = 0; /* don't reduce the argument */
4a238c70SJohn Marino
4a238c70SJohn Marino      /* Initialisation */
4a238c70SJohn Marino      MPFR_GROUP_REPREC_4 (group, prec, sk, tmp, tmp2, arctgt);
4a238c70SJohn Marino      if (MPFR_LIKELY (oldn0 == 0))
4a238c70SJohn Marino        {
4a238c70SJohn Marino          oldn0 = 3 * (n0 + 1);
4a238c70SJohn Marino          tabz = (mpz_t *) (*__gmp_allocate_func) (oldn0 * sizeof (mpz_t));
4a238c70SJohn Marino          for (i = 0; i < oldn0; i++)
4a238c70SJohn Marino            mpz_init (tabz[i]);
4a238c70SJohn Marino        }
4a238c70SJohn Marino      else if (MPFR_UNLIKELY (oldn0 < 3 * (n0 + 1)))
4a238c70SJohn Marino        {
4a238c70SJohn Marino          tabz = (mpz_t *) (*__gmp_reallocate_func)
4a238c70SJohn Marino            (tabz, oldn0 * sizeof (mpz_t), 3 * (n0 + 1)*sizeof (mpz_t));
4a238c70SJohn Marino          for (i = oldn0; i < 3 * (n0 + 1); i++)
4a238c70SJohn Marino            mpz_init (tabz[i]);
4a238c70SJohn Marino          oldn0 = 3 * (n0 + 1);
4a238c70SJohn Marino        }
4a238c70SJohn Marino
4a238c70SJohn Marino      /* The mpfr_ui_div below mustn't underflow. This is guaranteed by
4a238c70SJohn Marino         MPFR_SAVE_EXPO_MARK, but let's check that for maintainability. */
4a238c70SJohn Marino      MPFR_ASSERTD (__gmpfr_emax <= 1 - __gmpfr_emin);
4a238c70SJohn Marino
4a238c70SJohn Marino      if (comparaison > 0) /* use atan(xp) = Pi/2 - atan(1/xp) */
4a238c70SJohn Marino        mpfr_ui_div (sk, 1, xp, MPFR_RNDN);
4a238c70SJohn Marino      else
4a238c70SJohn Marino        mpfr_set (sk, xp, MPFR_RNDN);
4a238c70SJohn Marino
4a238c70SJohn Marino      /* now 0 < sk <= 1 */
4a238c70SJohn Marino
4a238c70SJohn Marino      /* Argument reduction: atan(x) = 2 atan((sqrt(1+x^2)-1)/x).
4a238c70SJohn Marino         We want |sk| < k/sqrt(p) where p is the target precision. */
4a238c70SJohn Marino      lost = 0;
4a238c70SJohn Marino      for (red = 0; MPFR_GET_EXP(sk) > - (mpfr_exp_t) log2p; red ++)
4a238c70SJohn Marino        {
4a238c70SJohn Marino          lost = 9 - 2 * MPFR_EXP(sk);
4a238c70SJohn Marino          mpfr_mul (tmp, sk, sk, MPFR_RNDN);
4a238c70SJohn Marino          mpfr_add_ui (tmp, tmp, 1, MPFR_RNDN);
4a238c70SJohn Marino          mpfr_sqrt (tmp, tmp, MPFR_RNDN);
4a238c70SJohn Marino          mpfr_sub_ui (tmp, tmp, 1, MPFR_RNDN);
4a238c70SJohn Marino          if (red == 0 && comparaison > 0)
4a238c70SJohn Marino            /* use xp = 1/sk */
4a238c70SJohn Marino            mpfr_mul (sk, tmp, xp, MPFR_RNDN);
4a238c70SJohn Marino          else
4a238c70SJohn Marino            mpfr_div (sk, tmp, sk, MPFR_RNDN);
4a238c70SJohn Marino        }
4a238c70SJohn Marino
4a238c70SJohn Marino      /* we started from x0 = 1/|x| if |x| > 1, and |x| otherwise, thus
4a238c70SJohn Marino         we had x0 = min(|x|, 1/|x|) <= 1, and applied 'red' times the
4a238c70SJohn Marino         argument reduction x -> (sqrt(1+x^2)-1)/x, which keeps 0 < x < 1,
4a238c70SJohn Marino         thus 0 < sk <= 1, and sk=1 can occur only if red=0 */
4a238c70SJohn Marino
4a238c70SJohn Marino      /* If sk=1, then if |x| < 1, we have 1 - 2^(-prec-1) <= |x| < 1,
4a238c70SJohn Marino         or if |x| > 1, we have 1 - 2^(-prec-1) <= 1/|x| < 1, thus in all
4a238c70SJohn Marino         cases ||x| - 1| <= 2^(-prec), from which it follows
4a238c70SJohn Marino         |atan|x| - Pi/4| <= 2^(-prec), given the Taylor expansion
4a238c70SJohn Marino         atan(1+x) = Pi/4 + x/2 - x^2/4 + ...
4a238c70SJohn Marino         Since Pi/4 = 0.785..., the error is at most one ulp.
4a238c70SJohn Marino      */
4a238c70SJohn Marino      if (MPFR_UNLIKELY(mpfr_cmp_ui (sk, 1) == 0))
4a238c70SJohn Marino        {
4a238c70SJohn Marino          mpfr_const_pi (arctgt, MPFR_RNDN); /* 1/2 ulp extra error */
4a238c70SJohn Marino          mpfr_div_2ui (arctgt, arctgt, 2, MPFR_RNDN); /* exact */
4a238c70SJohn Marino          realprec = prec - 2;
4a238c70SJohn Marino          goto can_round;
4a238c70SJohn Marino        }
4a238c70SJohn Marino
4a238c70SJohn Marino      /* Assignation  */
4a238c70SJohn Marino      MPFR_SET_ZERO (arctgt);
4a238c70SJohn Marino      twopoweri = 1 << 0;
4a238c70SJohn Marino      MPFR_ASSERTD (n0 >= 4);
4a238c70SJohn Marino      for (i = 0 ; i < n0; i++)
4a238c70SJohn Marino        {
4a238c70SJohn Marino          if (MPFR_UNLIKELY (MPFR_IS_ZERO (sk)))
4a238c70SJohn Marino            break;
4a238c70SJohn Marino          /* Calculation of trunc(tmp) --> mpz */
4a238c70SJohn Marino          mpfr_mul_2ui (tmp, sk, twopoweri, MPFR_RNDN);
4a238c70SJohn Marino          mpfr_trunc (tmp, tmp);
4a238c70SJohn Marino          if (!MPFR_IS_ZERO (tmp))
4a238c70SJohn Marino            {
4a238c70SJohn Marino              /* tmp = ukz*2^exptol */
4a238c70SJohn Marino              exptol = mpfr_get_z_2exp (ukz, tmp);
4a238c70SJohn Marino              /* since the s_k are decreasing (see algorithms.tex),
4a238c70SJohn Marino                 and s_0 = min(|x|, 1/|x|) < 1, we have sk < 1,
4a238c70SJohn Marino                 thus exptol < 0 */
4a238c70SJohn Marino              MPFR_ASSERTD (exptol < 0);
4a238c70SJohn Marino              mpz_tdiv_q_2exp (ukz, ukz, (unsigned long int) (-exptol));
4a238c70SJohn Marino              /* since tmp is a non-zero integer, and tmp = ukzold*2^exptol,
4a238c70SJohn Marino                 we now have ukz = tmp, thus ukz is non-zero */
4a238c70SJohn Marino              /* Calculation of arctan(Ak) */
4a238c70SJohn Marino              mpfr_set_z (tmp, ukz, MPFR_RNDN);
4a238c70SJohn Marino              mpfr_div_2ui (tmp, tmp, twopoweri, MPFR_RNDN);
4a238c70SJohn Marino              mpfr_atan_aux (tmp2, ukz, twopoweri, n0 - i, tabz);
4a238c70SJohn Marino              mpfr_mul (tmp2, tmp2, tmp, MPFR_RNDN);
4a238c70SJohn Marino              /* Addition */
4a238c70SJohn Marino              mpfr_add (arctgt, arctgt, tmp2, MPFR_RNDN);
4a238c70SJohn Marino              /* Next iteration */
4a238c70SJohn Marino              mpfr_sub (tmp2, sk, tmp, MPFR_RNDN);
4a238c70SJohn Marino              mpfr_mul (sk, sk, tmp, MPFR_RNDN);
4a238c70SJohn Marino              mpfr_add_ui (sk, sk, 1, MPFR_RNDN);
4a238c70SJohn Marino              mpfr_div (sk, tmp2, sk, MPFR_RNDN);
4a238c70SJohn Marino            }
4a238c70SJohn Marino          twopoweri <<= 1;
4a238c70SJohn Marino        }
4a238c70SJohn Marino      /* Add last step (Arctan(sk) ~= sk */
4a238c70SJohn Marino      mpfr_add (arctgt, arctgt, sk, MPFR_RNDN);
4a238c70SJohn Marino
4a238c70SJohn Marino      /* argument reduction */
4a238c70SJohn Marino      mpfr_mul_2exp (arctgt, arctgt, red, MPFR_RNDN);
4a238c70SJohn Marino
4a238c70SJohn Marino      if (comparaison > 0)
4a238c70SJohn Marino        { /* atan(x) = Pi/2-atan(1/x) for x > 0 */
4a238c70SJohn Marino          mpfr_const_pi (tmp, MPFR_RNDN);
4a238c70SJohn Marino          mpfr_div_2ui (tmp, tmp, 1, MPFR_RNDN);
4a238c70SJohn Marino          mpfr_sub (arctgt, tmp, arctgt, MPFR_RNDN);
4a238c70SJohn Marino        }
4a238c70SJohn Marino      MPFR_SET_POS (arctgt);
4a238c70SJohn Marino
4a238c70SJohn Marino    can_round:
4a238c70SJohn Marino      if (MPFR_LIKELY (MPFR_CAN_ROUND (arctgt, realprec + est_lost - lost,
4a238c70SJohn Marino                                       MPFR_PREC (atan), rnd_mode)))
4a238c70SJohn Marino        break;
4a238c70SJohn Marino      MPFR_ZIV_NEXT (loop, realprec);
4a238c70SJohn Marino    }
4a238c70SJohn Marino  MPFR_ZIV_FREE (loop);
4a238c70SJohn Marino
4a238c70SJohn Marino  inexact = mpfr_set4 (atan, arctgt, rnd_mode, MPFR_SIGN (x));
4a238c70SJohn Marino
4a238c70SJohn Marino  for (i = 0 ; i < oldn0 ; i++)
4a238c70SJohn Marino    mpz_clear (tabz[i]);
4a238c70SJohn Marino  mpz_clear (ukz);
4a238c70SJohn Marino  (*__gmp_free_func) (tabz, oldn0 * sizeof (mpz_t));
4a238c70SJohn Marino  MPFR_GROUP_CLEAR (group);
4a238c70SJohn Marino
4a238c70SJohn Marino  MPFR_SAVE_EXPO_FREE (expo);
4a238c70SJohn Marino  return mpfr_check_range (atan, inexact, rnd_mode);
4a238c70SJohn Marino}