mpc/src/norm.c

*d30dc8cbSJohn Marino/* mpc_norm -- Square of the norm of a complex number.
*d30dc8cbSJohn Marino
*d30dc8cbSJohn MarinoCopyright (C) 2002, 2005, 2008, 2009, 2010, 2011 INRIA
*d30dc8cbSJohn Marino
*d30dc8cbSJohn MarinoThis file is part of GNU MPC.
*d30dc8cbSJohn Marino
*d30dc8cbSJohn MarinoGNU MPC is free software; you can redistribute it and/or modify it under
*d30dc8cbSJohn Marinothe terms of the GNU Lesser General Public License as published by the
*d30dc8cbSJohn MarinoFree Software Foundation; either version 3 of the License, or (at your
*d30dc8cbSJohn Marinooption) any later version.
*d30dc8cbSJohn Marino
*d30dc8cbSJohn MarinoGNU MPC is distributed in the hope that it will be useful, but WITHOUT ANY
*d30dc8cbSJohn MarinoWARRANTY; without even the implied warranty of MERCHANTABILITY or FITNESS
*d30dc8cbSJohn MarinoFOR A PARTICULAR PURPOSE. See the GNU Lesser General Public License for
*d30dc8cbSJohn Marinomore details.
*d30dc8cbSJohn Marino
*d30dc8cbSJohn MarinoYou should have received a copy of the GNU Lesser General Public License
*d30dc8cbSJohn Marinoalong with this program. If not, see http://www.gnu.org/licenses/ .
*d30dc8cbSJohn Marino*/
*d30dc8cbSJohn Marino
*d30dc8cbSJohn Marino#include <stdio.h>    /* for MPC_ASSERT */
*d30dc8cbSJohn Marino#include "mpc-impl.h"
*d30dc8cbSJohn Marino
*d30dc8cbSJohn Marino/* a <- norm(b) = b * conj(b)
*d30dc8cbSJohn Marino   (the rounding mode is mpfr_rnd_t here since we return an mpfr number) */
*d30dc8cbSJohn Marinoint
*d30dc8cbSJohn Marinompc_norm (mpfr_ptr a, mpc_srcptr b, mpfr_rnd_t rnd)
*d30dc8cbSJohn Marino{
*d30dc8cbSJohn Marino   int inexact;
*d30dc8cbSJohn Marino   int saved_underflow, saved_overflow;
*d30dc8cbSJohn Marino
*d30dc8cbSJohn Marino   /* handling of special values; consistent with abs in that
*d30dc8cbSJohn Marino      norm = abs^2; so norm (+-inf, xxx) = norm (xxx, +-inf) = +inf */
*d30dc8cbSJohn Marino   if (!mpc_fin_p (b))
*d30dc8cbSJohn Marino         return mpc_abs (a, b, rnd);
*d30dc8cbSJohn Marino   else if (mpfr_zero_p (mpc_realref (b))) {
*d30dc8cbSJohn Marino      if (mpfr_zero_p (mpc_imagref (b)))
*d30dc8cbSJohn Marino         return mpfr_set_ui (a, 0, rnd); /* +0 */
*d30dc8cbSJohn Marino      else
*d30dc8cbSJohn Marino         return mpfr_sqr (a, mpc_imagref (b), rnd);
*d30dc8cbSJohn Marino   }
*d30dc8cbSJohn Marino   else if (mpfr_zero_p (mpc_imagref (b)))
*d30dc8cbSJohn Marino     return mpfr_sqr (a, mpc_realref (b), rnd); /* Re(b) <> 0 */
*d30dc8cbSJohn Marino
*d30dc8cbSJohn Marino   else /* everything finite and non-zero */ {
*d30dc8cbSJohn Marino      mpfr_t u, v, res;
*d30dc8cbSJohn Marino      mpfr_prec_t prec, prec_u, prec_v;
*d30dc8cbSJohn Marino      int loops;
*d30dc8cbSJohn Marino      const int max_loops = 2;
*d30dc8cbSJohn Marino         /* switch to exact squarings when loops==max_loops */
*d30dc8cbSJohn Marino
*d30dc8cbSJohn Marino      prec = mpfr_get_prec (a);
*d30dc8cbSJohn Marino
*d30dc8cbSJohn Marino      mpfr_init (u);
*d30dc8cbSJohn Marino      mpfr_init (v);
*d30dc8cbSJohn Marino      mpfr_init (res);
*d30dc8cbSJohn Marino
*d30dc8cbSJohn Marino      /* save the underflow or overflow flags from MPFR */
*d30dc8cbSJohn Marino      saved_underflow = mpfr_underflow_p ();
*d30dc8cbSJohn Marino      saved_overflow = mpfr_overflow_p ();
*d30dc8cbSJohn Marino
*d30dc8cbSJohn Marino      loops = 0;
*d30dc8cbSJohn Marino      mpfr_clear_underflow ();
*d30dc8cbSJohn Marino      mpfr_clear_overflow ();
*d30dc8cbSJohn Marino      do {
*d30dc8cbSJohn Marino         loops++;
*d30dc8cbSJohn Marino         prec += mpc_ceil_log2 (prec) + 3;
*d30dc8cbSJohn Marino         if (loops >= max_loops) {
*d30dc8cbSJohn Marino            prec_u = 2 * MPC_PREC_RE (b);
*d30dc8cbSJohn Marino            prec_v = 2 * MPC_PREC_IM (b);
*d30dc8cbSJohn Marino         }
*d30dc8cbSJohn Marino         else {
*d30dc8cbSJohn Marino            prec_u = MPC_MIN (prec, 2 * MPC_PREC_RE (b));
*d30dc8cbSJohn Marino            prec_v = MPC_MIN (prec, 2 * MPC_PREC_IM (b));
*d30dc8cbSJohn Marino         }
*d30dc8cbSJohn Marino
*d30dc8cbSJohn Marino         mpfr_set_prec (u, prec_u);
*d30dc8cbSJohn Marino         mpfr_set_prec (v, prec_v);
*d30dc8cbSJohn Marino
*d30dc8cbSJohn Marino         inexact  = mpfr_sqr (u, mpc_realref(b), GMP_RNDD); /* err <= 1 ulp in prec */
*d30dc8cbSJohn Marino         inexact |= mpfr_sqr (v, mpc_imagref(b), GMP_RNDD); /* err <= 1 ulp in prec */
*d30dc8cbSJohn Marino
*d30dc8cbSJohn Marino         /* If loops = max_loops, inexact should be 0 here, except in case
*d30dc8cbSJohn Marino               of underflow or overflow.
*d30dc8cbSJohn Marino            If loops < max_loops and inexact is zero, we can exit the
*d30dc8cbSJohn Marino            while-loop since it only remains to add u and v into a. */
*d30dc8cbSJohn Marino         if (inexact) {
*d30dc8cbSJohn Marino             mpfr_set_prec (res, prec);
*d30dc8cbSJohn Marino             mpfr_add (res, u, v, GMP_RNDD); /* err <= 3 ulp in prec */
*d30dc8cbSJohn Marino         }
*d30dc8cbSJohn Marino
*d30dc8cbSJohn Marino      } while (loops < max_loops && inexact != 0
*d30dc8cbSJohn Marino               && !mpfr_can_round (res, prec - 2, GMP_RNDD, GMP_RNDU,
*d30dc8cbSJohn Marino                                   mpfr_get_prec (a) + (rnd == GMP_RNDN)));
*d30dc8cbSJohn Marino
*d30dc8cbSJohn Marino      if (!inexact)
*d30dc8cbSJohn Marino         /* squarings were exact, neither underflow nor overflow */
*d30dc8cbSJohn Marino         inexact = mpfr_add (a, u, v, rnd);
*d30dc8cbSJohn Marino      /* if there was an overflow in Re(b)^2 or Im(b)^2 or their sum,
*d30dc8cbSJohn Marino         since the norm is larger, there is an overflow for the norm */
*d30dc8cbSJohn Marino      else if (mpfr_overflow_p ()) {
*d30dc8cbSJohn Marino         /* replace by "correctly rounded overflow" */
*d30dc8cbSJohn Marino         mpfr_set_ui (a, 1ul, GMP_RNDN);
*d30dc8cbSJohn Marino         inexact = mpfr_mul_2ui (a, a, mpfr_get_emax (), rnd);
*d30dc8cbSJohn Marino      }
*d30dc8cbSJohn Marino      else if (mpfr_underflow_p ()) {
*d30dc8cbSJohn Marino         /* necessarily one of the squarings did underflow (otherwise their
*d30dc8cbSJohn Marino            sum could not underflow), thus one of u, v is zero. */
*d30dc8cbSJohn Marino         mpfr_exp_t emin = mpfr_get_emin ();
*d30dc8cbSJohn Marino
*d30dc8cbSJohn Marino         /* Now either both u and v are zero, or u is zero and v exact,
*d30dc8cbSJohn Marino            or v is zero and u exact.
*d30dc8cbSJohn Marino            In the latter case, Im(b)^2 < 2^(emin-1).
*d30dc8cbSJohn Marino            If ulp(u) >= 2^(emin+1) and norm(b) is not exactly
*d30dc8cbSJohn Marino            representable at the target precision, then rounding u+Im(b)^2
*d30dc8cbSJohn Marino            is equivalent to rounding u+2^(emin-1).
*d30dc8cbSJohn Marino            For instance, if exp(u)>0 and the target precision is smaller
*d30dc8cbSJohn Marino            than about |emin|, the norm is not representable. To make the
*d30dc8cbSJohn Marino            scaling in the "else" case work without underflow, we test
*d30dc8cbSJohn Marino            whether exp(u) is larger than a small negative number instead.
*d30dc8cbSJohn Marino            The second case is handled analogously.                        */
*d30dc8cbSJohn Marino         if (!mpfr_zero_p (u)
*d30dc8cbSJohn Marino             && mpfr_get_exp (u) - 2 * (mpfr_exp_t) prec_u > emin
*d30dc8cbSJohn Marino             && mpfr_get_exp (u) > -10) {
*d30dc8cbSJohn Marino               mpfr_set_prec (v, MPFR_PREC_MIN);
*d30dc8cbSJohn Marino               mpfr_set_ui_2exp (v, 1, emin - 1, GMP_RNDZ);
*d30dc8cbSJohn Marino               inexact = mpfr_add (a, u, v, rnd);
*d30dc8cbSJohn Marino         }
*d30dc8cbSJohn Marino         else if (!mpfr_zero_p (v)
*d30dc8cbSJohn Marino             && mpfr_get_exp (v) - 2 * (mpfr_exp_t) prec_v > emin
*d30dc8cbSJohn Marino             && mpfr_get_exp (v) > -10) {
*d30dc8cbSJohn Marino               mpfr_set_prec (u, MPFR_PREC_MIN);
*d30dc8cbSJohn Marino               mpfr_set_ui_2exp (u, 1, emin - 1, GMP_RNDZ);
*d30dc8cbSJohn Marino               inexact = mpfr_add (a, u, v, rnd);
*d30dc8cbSJohn Marino         }
*d30dc8cbSJohn Marino         else {
*d30dc8cbSJohn Marino            unsigned long int scale, exp_re, exp_im;
*d30dc8cbSJohn Marino            int inex_underflow;
*d30dc8cbSJohn Marino
*d30dc8cbSJohn Marino            /* scale the input to an average exponent close to 0 */
*d30dc8cbSJohn Marino            exp_re = (unsigned long int) (-mpfr_get_exp (mpc_realref (b)));
*d30dc8cbSJohn Marino            exp_im = (unsigned long int) (-mpfr_get_exp (mpc_imagref (b)));
*d30dc8cbSJohn Marino            scale = exp_re / 2 + exp_im / 2 + (exp_re % 2 + exp_im % 2) / 2;
*d30dc8cbSJohn Marino               /* (exp_re + exp_im) / 2, computed in a way avoiding
*d30dc8cbSJohn Marino                  integer overflow                                  */
*d30dc8cbSJohn Marino            if (mpfr_zero_p (u)) {
*d30dc8cbSJohn Marino               /* recompute the scaled value exactly */
*d30dc8cbSJohn Marino               mpfr_mul_2ui (u, mpc_realref (b), scale, GMP_RNDN);
*d30dc8cbSJohn Marino               mpfr_sqr (u, u, GMP_RNDN);
*d30dc8cbSJohn Marino            }
*d30dc8cbSJohn Marino            else /* just scale */
*d30dc8cbSJohn Marino               mpfr_mul_2ui (u, u, 2*scale, GMP_RNDN);
*d30dc8cbSJohn Marino            if (mpfr_zero_p (v)) {
*d30dc8cbSJohn Marino               mpfr_mul_2ui (v, mpc_imagref (b), scale, GMP_RNDN);
*d30dc8cbSJohn Marino               mpfr_sqr (v, v, GMP_RNDN);
*d30dc8cbSJohn Marino            }
*d30dc8cbSJohn Marino            else
*d30dc8cbSJohn Marino               mpfr_mul_2ui (v, v, 2*scale, GMP_RNDN);
*d30dc8cbSJohn Marino
*d30dc8cbSJohn Marino            inexact = mpfr_add (a, u, v, rnd);
*d30dc8cbSJohn Marino            mpfr_clear_underflow ();
*d30dc8cbSJohn Marino            inex_underflow = mpfr_div_2ui (a, a, 2*scale, rnd);
*d30dc8cbSJohn Marino            if (mpfr_underflow_p ())
*d30dc8cbSJohn Marino               inexact = inex_underflow;
*d30dc8cbSJohn Marino         }
*d30dc8cbSJohn Marino      }
*d30dc8cbSJohn Marino      else /* no problems, ternary value due to mpfr_can_round trick */
*d30dc8cbSJohn Marino         inexact = mpfr_set (a, res, rnd);
*d30dc8cbSJohn Marino
*d30dc8cbSJohn Marino      /* restore underflow and overflow flags from MPFR */
*d30dc8cbSJohn Marino      if (saved_underflow)
*d30dc8cbSJohn Marino        mpfr_set_underflow ();
*d30dc8cbSJohn Marino      if (saved_overflow)
*d30dc8cbSJohn Marino        mpfr_set_overflow ();
*d30dc8cbSJohn Marino
*d30dc8cbSJohn Marino      mpfr_clear (u);
*d30dc8cbSJohn Marino      mpfr_clear (v);
*d30dc8cbSJohn Marino      mpfr_clear (res);
*d30dc8cbSJohn Marino   }
*d30dc8cbSJohn Marino
*d30dc8cbSJohn Marino   return inexact;
*d30dc8cbSJohn Marino}