libquadmath/math/tanq_kernel.c

*627f7eb2Smrg/*
*627f7eb2Smrg * ====================================================
*627f7eb2Smrg * Copyright (C) 1993 by Sun Microsystems, Inc. All rights reserved.
*627f7eb2Smrg *
*627f7eb2Smrg * Developed at SunPro, a Sun Microsystems, Inc. business.
*627f7eb2Smrg * Permission to use, copy, modify, and distribute this
*627f7eb2Smrg * software is freely granted, provided that this notice
*627f7eb2Smrg * is preserved.
*627f7eb2Smrg * ====================================================
*627f7eb2Smrg */
*627f7eb2Smrg
*627f7eb2Smrg/*
*627f7eb2Smrg  Long double expansions are
*627f7eb2Smrg  Copyright (C) 2001 Stephen L. Moshier <moshier@na-net.ornl.gov>
*627f7eb2Smrg  and are incorporated herein by permission of the author.  The author
*627f7eb2Smrg  reserves the right to distribute this material elsewhere under different
*627f7eb2Smrg  copying permissions.  These modifications are distributed here under
*627f7eb2Smrg  the following terms:
*627f7eb2Smrg
*627f7eb2Smrg    This library is free software; you can redistribute it and/or
*627f7eb2Smrg    modify it under the terms of the GNU Lesser General Public
*627f7eb2Smrg    License as published by the Free Software Foundation; either
*627f7eb2Smrg    version 2.1 of the License, or (at your option) any later version.
*627f7eb2Smrg
*627f7eb2Smrg    This library is distributed in the hope that it will be useful,
*627f7eb2Smrg    but WITHOUT ANY WARRANTY; without even the implied warranty of
*627f7eb2Smrg    MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
*627f7eb2Smrg    Lesser General Public License for more details.
*627f7eb2Smrg
*627f7eb2Smrg    You should have received a copy of the GNU Lesser General Public
*627f7eb2Smrg    License along with this library; if not, see
*627f7eb2Smrg    <http://www.gnu.org/licenses/>.  */
*627f7eb2Smrg
*627f7eb2Smrg/* __quadmath_kernel_tanq( x, y, k )
*627f7eb2Smrg * kernel tan function on [-pi/4, pi/4], pi/4 ~ 0.7854
*627f7eb2Smrg * Input x is assumed to be bounded by ~pi/4 in magnitude.
*627f7eb2Smrg * Input y is the tail of x.
*627f7eb2Smrg * Input k indicates whether tan (if k=1) or
*627f7eb2Smrg * -1/tan (if k= -1) is returned.
*627f7eb2Smrg *
*627f7eb2Smrg * Algorithm
*627f7eb2Smrg *	1. Since tan(-x) = -tan(x), we need only to consider positive x.
*627f7eb2Smrg *	2. if x < 2^-57, return x with inexact if x!=0.
*627f7eb2Smrg *	3. tan(x) is approximated by a rational form x + x^3 / 3 + x^5 R(x^2)
*627f7eb2Smrg *          on [0,0.67433].
*627f7eb2Smrg *
*627f7eb2Smrg *	   Note: tan(x+y) = tan(x) + tan'(x)*y
*627f7eb2Smrg *		          ~ tan(x) + (1+x*x)*y
*627f7eb2Smrg *	   Therefore, for better accuracy in computing tan(x+y), let
*627f7eb2Smrg *		r = x^3 * R(x^2)
*627f7eb2Smrg *	   then
*627f7eb2Smrg *		tan(x+y) = x + (x^3 / 3 + (x^2 *(r+y)+y))
*627f7eb2Smrg *
*627f7eb2Smrg *      4. For x in [0.67433,pi/4],  let y = pi/4 - x, then
*627f7eb2Smrg *		tan(x) = tan(pi/4-y) = (1-tan(y))/(1+tan(y))
*627f7eb2Smrg *		       = 1 - 2*(tan(y) - (tan(y)^2)/(1+tan(y)))
*627f7eb2Smrg */
*627f7eb2Smrg
*627f7eb2Smrg#include "quadmath-imp.h"
*627f7eb2Smrg
*627f7eb2Smrgstatic const __float128
*627f7eb2Smrg  one = 1,
*627f7eb2Smrg  pio4hi = 7.8539816339744830961566084581987569936977E-1Q,
*627f7eb2Smrg  pio4lo = 2.1679525325309452561992610065108379921906E-35Q,
*627f7eb2Smrg
*627f7eb2Smrg  /* tan x = x + x^3 / 3 + x^5 T(x^2)/U(x^2)
*627f7eb2Smrg     0 <= x <= 0.6743316650390625
*627f7eb2Smrg     Peak relative error 8.0e-36  */
*627f7eb2Smrg TH =  3.333333333333333333333333333333333333333E-1Q,
*627f7eb2Smrg T0 = -1.813014711743583437742363284336855889393E7Q,
*627f7eb2Smrg T1 =  1.320767960008972224312740075083259247618E6Q,
*627f7eb2Smrg T2 = -2.626775478255838182468651821863299023956E4Q,
*627f7eb2Smrg T3 =  1.764573356488504935415411383687150199315E2Q,
*627f7eb2Smrg T4 = -3.333267763822178690794678978979803526092E-1Q,
*627f7eb2Smrg
*627f7eb2Smrg U0 = -1.359761033807687578306772463253710042010E8Q,
*627f7eb2Smrg U1 =  6.494370630656893175666729313065113194784E7Q,
*627f7eb2Smrg U2 = -4.180787672237927475505536849168729386782E6Q,
*627f7eb2Smrg U3 =  8.031643765106170040139966622980914621521E4Q,
*627f7eb2Smrg U4 = -5.323131271912475695157127875560667378597E2Q;
*627f7eb2Smrg  /* 1.000000000000000000000000000000000000000E0 */
*627f7eb2Smrg
*627f7eb2Smrg
*627f7eb2Smrg__float128
*627f7eb2Smrg__quadmath_kernel_tanq (__float128 x, __float128 y, int iy)
*627f7eb2Smrg{
*627f7eb2Smrg  __float128 z, r, v, w, s;
*627f7eb2Smrg  int32_t ix, sign;
*627f7eb2Smrg  ieee854_float128 u, u1;
*627f7eb2Smrg
*627f7eb2Smrg  u.value = x;
*627f7eb2Smrg  ix = u.words32.w0 & 0x7fffffff;
*627f7eb2Smrg  if (ix < 0x3fc60000)		/* x < 2**-57 */
*627f7eb2Smrg    {
*627f7eb2Smrg      if ((int) x == 0)
*627f7eb2Smrg	{			/* generate inexact */
*627f7eb2Smrg	  if ((ix | u.words32.w1 | u.words32.w2 | u.words32.w3
*627f7eb2Smrg	       | (iy + 1)) == 0)
*627f7eb2Smrg	    return one / fabsq (x);
*627f7eb2Smrg	  else if (iy == 1)
*627f7eb2Smrg	    {
*627f7eb2Smrg	      math_check_force_underflow (x);
*627f7eb2Smrg	      return x;
*627f7eb2Smrg	    }
*627f7eb2Smrg	  else
*627f7eb2Smrg	    return -one / x;
*627f7eb2Smrg	}
*627f7eb2Smrg    }
*627f7eb2Smrg  if (ix >= 0x3ffe5942) /* |x| >= 0.6743316650390625 */
*627f7eb2Smrg    {
*627f7eb2Smrg      if ((u.words32.w0 & 0x80000000) != 0)
*627f7eb2Smrg	{
*627f7eb2Smrg	  x = -x;
*627f7eb2Smrg	  y = -y;
*627f7eb2Smrg	  sign = -1;
*627f7eb2Smrg	}
*627f7eb2Smrg      else
*627f7eb2Smrg	sign = 1;
*627f7eb2Smrg      z = pio4hi - x;
*627f7eb2Smrg      w = pio4lo - y;
*627f7eb2Smrg      x = z + w;
*627f7eb2Smrg      y = 0.0;
*627f7eb2Smrg    }
*627f7eb2Smrg  z = x * x;
*627f7eb2Smrg  r = T0 + z * (T1 + z * (T2 + z * (T3 + z * T4)));
*627f7eb2Smrg  v = U0 + z * (U1 + z * (U2 + z * (U3 + z * (U4 + z))));
*627f7eb2Smrg  r = r / v;
*627f7eb2Smrg
*627f7eb2Smrg  s = z * x;
*627f7eb2Smrg  r = y + z * (s * r + y);
*627f7eb2Smrg  r += TH * s;
*627f7eb2Smrg  w = x + r;
*627f7eb2Smrg  if (ix >= 0x3ffe5942)
*627f7eb2Smrg    {
*627f7eb2Smrg      v = (__float128) iy;
*627f7eb2Smrg      w = (v - 2.0 * (x - (w * w / (w + v) - r)));
*627f7eb2Smrg      /* SIGN is set for arguments that reach this code, but not
*627f7eb2Smrg	 otherwise, resulting in warnings that it may be used
*627f7eb2Smrg	 uninitialized although in the cases where it is used it has
*627f7eb2Smrg	 always been set.  */
*627f7eb2Smrg
*627f7eb2Smrg
*627f7eb2Smrg      if (sign < 0)
*627f7eb2Smrg	w = -w;
*627f7eb2Smrg
*627f7eb2Smrg      return w;
*627f7eb2Smrg    }
*627f7eb2Smrg  if (iy == 1)
*627f7eb2Smrg    return w;
*627f7eb2Smrg  else
*627f7eb2Smrg    {				/* if allow error up to 2 ulp,
*627f7eb2Smrg				   simply return -1.0/(x+r) here */
*627f7eb2Smrg      /*  compute -1.0/(x+r) accurately */
*627f7eb2Smrg      u1.value = w;
*627f7eb2Smrg      u1.words32.w2 = 0;
*627f7eb2Smrg      u1.words32.w3 = 0;
*627f7eb2Smrg      v = r - (u1.value - x);		/* u1+v = r+x */
*627f7eb2Smrg      z = -1.0 / w;
*627f7eb2Smrg      u.value = z;
*627f7eb2Smrg      u.words32.w2 = 0;
*627f7eb2Smrg      u.words32.w3 = 0;
*627f7eb2Smrg      s = 1.0 + u.value * u1.value;
*627f7eb2Smrg      return u.value + z * (s + u.value * v);
*627f7eb2Smrg    }
*627f7eb2Smrg}