libm/common/atan2.c

*24578Szliu/*
*24578Szliu * Copyright (c) 1985 Regents of the University of California.
*24578Szliu *
*24578Szliu * Use and reproduction of this software are granted  in  accordance  with
*24578Szliu * the terms and conditions specified in  the  Berkeley  Software  License
*24578Szliu * Agreement (in particular, this entails acknowledgement of the programs'
*24578Szliu * source, and inclusion of this notice) with the additional understanding
*24578Szliu * that  all  recipients  should regard themselves as participants  in  an
*24578Szliu * ongoing  research  project and hence should  feel  obligated  to report
*24578Szliu * their  experiences (good or bad) with these elementary function  codes,
*24578Szliu * using "sendbug 4bsd-bugs@BERKELEY", to the authors.
*24578Szliu */
*24578Szliu
*24578Szliu#ifndef lint
*24578Szliustatic char sccsid[] = "@(#)atan2.c	1.1 (ELEFUNT) 09/06/85";
*24578Szliu#endif not lint
*24578Szliu
*24578Szliu/* ATAN2(Y,X)
*24578Szliu * RETURN ARG (X+iY)
*24578Szliu * DOUBLE PRECISION (VAX D format 56 bits, IEEE DOUBLE 53 BITS)
*24578Szliu * CODED IN C BY K.C. NG, 1/8/85;
*24578Szliu * REVISED BY K.C. NG on 2/7/85, 2/13/85, 3/7/85, 3/30/85, 6/29/85.
*24578Szliu *
*24578Szliu * Required system supported functions :
*24578Szliu *	copysign(x,y)
*24578Szliu *	scalb(x,y)
*24578Szliu *	logb(x)
*24578Szliu *
*24578Szliu * Method :
*24578Szliu *	1. Reduce y to positive by atan2(y,x)=-atan2(-y,x).
*24578Szliu *	2. Reduce x to positive by (if x and y are unexceptional):
*24578Szliu *		ARG (x+iy) = arctan(y/x)   	   ... if x > 0,
*24578Szliu *		ARG (x+iy) = pi - arctan[y/(-x)]   ... if x < 0,
*24578Szliu *	3. According to the integer k=4t+0.25 truncated , t=y/x, the argument
*24578Szliu *	   is further reduced to one of the following intervals and the
*24578Szliu *	   arctangent of y/x is evaluated by the corresponding formula:
*24578Szliu *
*24578Szliu *         [0,7/16]	   atan(y/x) = t - t^3*(a1+t^2*(a2+...(a10+t^2*a11)...)
*24578Szliu *	   [7/16,11/16]    atan(y/x) = atan(1/2) + atan( (y-x/2)/(x+y/2) )
*24578Szliu *	   [11/16.19/16]   atan(y/x) = atan( 1 ) + atan( (y-x)/(x+y) )
*24578Szliu *	   [19/16,39/16]   atan(y/x) = atan(3/2) + atan( (y-1.5x)/(x+1.5y) )
*24578Szliu *	   [39/16,INF]     atan(y/x) = atan(INF) + atan( -x/y )
*24578Szliu *
*24578Szliu * Special cases:
*24578Szliu * Notations: atan2(y,x) == ARG (x+iy) == ARG(x,y).
*24578Szliu *
*24578Szliu *	ARG( NAN , (anything) ) is NaN;
*24578Szliu *	ARG( (anything), NaN ) is NaN;
*24578Szliu *	ARG(+(anything but NaN), +-0) is +-0  ;
*24578Szliu *	ARG(-(anything but NaN), +-0) is +-PI ;
*24578Szliu *	ARG( 0, +-(anything but 0 and NaN) ) is +-PI/2;
*24578Szliu *	ARG( +INF,+-(anything but INF and NaN) ) is +-0 ;
*24578Szliu *	ARG( -INF,+-(anything but INF and NaN) ) is +-PI;
*24578Szliu *	ARG( +INF,+-INF ) is +-PI/4 ;
*24578Szliu *	ARG( -INF,+-INF ) is +-3PI/4;
*24578Szliu *	ARG( (anything but,0,NaN, and INF),+-INF ) is +-PI/2;
*24578Szliu *
*24578Szliu * Accuracy:
*24578Szliu *	atan2(y,x) returns (PI/pi) * the exact ARG (x+iy) nearly rounded,
*24578Szliu *	where
*24578Szliu *
*24578Szliu *	in decimal:
*24578Szliu *		pi = 3.141592653589793 23846264338327 .....
*24578Szliu *    53 bits   PI = 3.141592653589793 115997963 ..... ,
*24578Szliu *    56 bits   PI = 3.141592653589793 227020265 ..... ,
*24578Szliu *
*24578Szliu *	in hexadecimal:
*24578Szliu *		pi = 3.243F6A8885A308D313198A2E....
*24578Szliu *    53 bits   PI = 3.243F6A8885A30  =  2 * 1.921FB54442D18	error=.276ulps
*24578Szliu *    56 bits   PI = 3.243F6A8885A308 =  4 * .C90FDAA22168C2    error=.206ulps
*24578Szliu *
*24578Szliu *	In a test run with 356,000 random argument on [-1,1] * [-1,1] on a
*24578Szliu *	VAX, the maximum observed error was 1.41 ulps (units of the last place)
*24578Szliu *	compared with (PI/pi)*(the exact ARG(x+iy)).
*24578Szliu *
*24578Szliu * Note:
*24578Szliu *	We use machine PI (the true pi rounded) in place of the actual
*24578Szliu *	value of pi for all the trig and inverse trig functions. In general,
*24578Szliu *	if trig is one of sin, cos, tan, then computed trig(y) returns the
*24578Szliu *	exact trig(y*pi/PI) nearly rounded; correspondingly, computed arctrig
*24578Szliu *	returns the exact arctrig(y)*PI/pi nearly rounded. These guarantee the
*24578Szliu *	trig functions have period PI, and trig(arctrig(x)) returns x for
*24578Szliu *	all critical values x.
*24578Szliu *
*24578Szliu * Constants:
*24578Szliu * The hexadecimal values are the intended ones for the following constants.
*24578Szliu * The decimal values may be used, provided that the compiler will convert
*24578Szliu * from decimal to binary accurately enough to produce the hexadecimal values
*24578Szliu * shown.
*24578Szliu */
*24578Szliu
*24578Szliustatic double
*24578Szliu#ifdef VAX 	/* VAX D format */
*24578Szliuathfhi =  4.6364760900080611433E-1    , /*Hex  2^ -1   *  .ED63382B0DDA7B */
*24578Szliuathflo =  1.9338828231967579916E-19   , /*Hex  2^-62   *  .E450059CFE92C0 */
*24578SzliuPIo4   =  7.8539816339744830676E-1    , /*Hex  2^  0   *  .C90FDAA22168C2 */
*24578Szliuat1fhi =  9.8279372324732906796E-1    , /*Hex  2^  0   *  .FB985E940FB4D9 */
*24578Szliuat1flo = -3.5540295636764633916E-18   , /*Hex  2^-57   * -.831EDC34D6EAEA */
*24578SzliuPIo2   =  1.5707963267948966135E0     , /*Hex  2^  1   *  .C90FDAA22168C2 */
*24578SzliuPI     =  3.1415926535897932270E0     , /*Hex  2^  2   *  .C90FDAA22168C2 */
*24578Szliua1     =  3.3333333333333473730E-1    , /*Hex  2^ -1   *  .AAAAAAAAAAAB75 */
*24578Szliua2     = -2.0000000000017730678E-1    , /*Hex  2^ -2   * -.CCCCCCCCCD946E */
*24578Szliua3     =  1.4285714286694640301E-1    , /*Hex  2^ -2   *  .92492492744262 */
*24578Szliua4     = -1.1111111135032672795E-1    , /*Hex  2^ -3   * -.E38E38EBC66292 */
*24578Szliua5     =  9.0909091380563043783E-2    , /*Hex  2^ -3   *  .BA2E8BB31BD70C */
*24578Szliua6     = -7.6922954286089459397E-2    , /*Hex  2^ -3   * -.9D89C827C37F18 */
*24578Szliua7     =  6.6663180891693915586E-2    , /*Hex  2^ -3   *  .8886B4AE379E58 */
*24578Szliua8     = -5.8772703698290408927E-2    , /*Hex  2^ -4   * -.F0BBA58481A942 */
*24578Szliua9     =  5.2170707402812969804E-2    , /*Hex  2^ -4   *  .D5B0F3A1AB13AB */
*24578Szliua10    = -4.4895863157820361210E-2    , /*Hex  2^ -4   * -.B7E4B97FD1048F */
*24578Szliua11    =  3.3006147437343875094E-2    , /*Hex  2^ -4   *  .8731743CF72D87 */
*24578Szliua12    = -1.4614844866464185439E-2    ; /*Hex  2^ -6   * -.EF731A2F3476D9 */
*24578Szliu#else 	/* IEEE double */
*24578Szliuathfhi =  4.6364760900080609352E-1    , /*Hex  2^ -2   *  1.DAC670561BB4F */
*24578Szliuathflo =  4.6249969567426939759E-18   , /*Hex  2^-58   *  1.5543B8F253271 */
*24578SzliuPIo4   =  7.8539816339744827900E-1    , /*Hex  2^ -1   *  1.921FB54442D18 */
*24578Szliuat1fhi =  9.8279372324732905408E-1    , /*Hex  2^ -1   *  1.F730BD281F69B */
*24578Szliuat1flo = -2.4407677060164810007E-17   , /*Hex  2^-56   * -1.C23DFEFEAE6B5 */
*24578SzliuPIo2   =  1.5707963267948965580E0     , /*Hex  2^  0   *  1.921FB54442D18 */
*24578SzliuPI     =  3.1415926535897931160E0     , /*Hex  2^  1   *  1.921FB54442D18 */
*24578Szliua1     =  3.3333333333333942106E-1    , /*Hex  2^ -2   *  1.55555555555C3 */
*24578Szliua2     = -1.9999999999979536924E-1    , /*Hex  2^ -3   * -1.9999999997CCD */
*24578Szliua3     =  1.4285714278004377209E-1    , /*Hex  2^ -3   *  1.24924921EC1D7 */
*24578Szliua4     = -1.1111110579344973814E-1    , /*Hex  2^ -4   * -1.C71C7059AF280 */
*24578Szliua5     =  9.0908906105474668324E-2    , /*Hex  2^ -4   *  1.745CE5AA35DB2 */
*24578Szliua6     = -7.6919217767468239799E-2    , /*Hex  2^ -4   * -1.3B0FA54BEC400 */
*24578Szliua7     =  6.6614695906082474486E-2    , /*Hex  2^ -4   *  1.10DA924597FFF */
*24578Szliua8     = -5.8358371008508623523E-2    , /*Hex  2^ -5   * -1.DE125FDDBD793 */
*24578Szliua9     =  4.9850617156082015213E-2    , /*Hex  2^ -5   *  1.9860524BDD807 */
*24578Szliua10    = -3.6700606902093604877E-2    , /*Hex  2^ -5   * -1.2CA6C04C6937A */
*24578Szliua11    =  1.6438029044759730479E-2    ; /*Hex  2^ -6   *  1.0D52174A1BB54 */
*24578Szliu#endif
*24578Szliu
*24578Szliudouble atan2(y,x)
*24578Szliudouble  y,x;
*24578Szliu{
*24578Szliu	static double zero=0, one=1, small=1.0E-9, big=1.0E18;
*24578Szliu	double copysign(),logb(),scalb(),t,z,signy,signx,hi,lo;
*24578Szliu	int finite(), k,m;
*24578Szliu
*24578Szliu    /* if x or y is NAN */
*24578Szliu	if(x!=x) return(x); if(y!=y) return(y);
*24578Szliu
*24578Szliu    /* copy down the sign of y and x */
*24578Szliu	signy = copysign(one,y) ;
*24578Szliu	signx = copysign(one,x) ;
*24578Szliu
*24578Szliu    /* if x is 1.0, goto begin */
*24578Szliu	if(x==1) { y=copysign(y,one); t=y; if(finite(t)) goto begin;}
*24578Szliu
*24578Szliu    /* when y = 0 */
*24578Szliu	if(y==zero) return((signx==one)?y:copysign(PI,signy));
*24578Szliu
*24578Szliu    /* when x = 0 */
*24578Szliu	if(x==zero) return(copysign(PIo2,signy));
*24578Szliu
*24578Szliu    /* when x is INF */
*24578Szliu	if(!finite(x))
*24578Szliu	    if(!finite(y))
*24578Szliu		return(copysign((signx==one)?PIo4:3*PIo4,signy));
*24578Szliu	    else
*24578Szliu		return(copysign((signx==one)?zero:PI,signy));
*24578Szliu
*24578Szliu    /* when y is INF */
*24578Szliu	if(!finite(y)) return(copysign(PIo2,signy));
*24578Szliu
*24578Szliu
*24578Szliu    /* compute y/x */
*24578Szliu	x=copysign(x,one);
*24578Szliu	y=copysign(y,one);
*24578Szliu	if((m=(k=logb(y))-logb(x)) > 60) t=big+big;
*24578Szliu	    else if(m < -80 ) t=y/x;
*24578Szliu	    else { t = y/x ; y = scalb(y,-k); x=scalb(x,-k); }
*24578Szliu
*24578Szliu    /* begin argument reduction */
*24578Szliubegin:
*24578Szliu	if (t < 2.4375) {
*24578Szliu
*24578Szliu	/* truncate 4(t+1/16) to integer for branching */
*24578Szliu	    k = 4 * (t+0.0625);
*24578Szliu	    switch (k) {
*24578Szliu
*24578Szliu	    /* t is in [0,7/16] */
*24578Szliu	    case 0:
*24578Szliu	    case 1:
*24578Szliu		if (t < small)
*24578Szliu		    { big + small ;  /* raise inexact flag */
*24578Szliu		      return (copysign((signx>zero)?t:PI-t,signy)); }
*24578Szliu
*24578Szliu		hi = zero;  lo = zero;  break;
*24578Szliu
*24578Szliu	    /* t is in [7/16,11/16] */
*24578Szliu	    case 2:
*24578Szliu		hi = athfhi; lo = athflo;
*24578Szliu		z = x+x;
*24578Szliu		t = ( (y+y) - x ) / ( z +  y ); break;
*24578Szliu
*24578Szliu	    /* t is in [11/16,19/16] */
*24578Szliu	    case 3:
*24578Szliu	    case 4:
*24578Szliu		hi = PIo4; lo = zero;
*24578Szliu		t = ( y - x ) / ( x + y ); break;
*24578Szliu
*24578Szliu	    /* t is in [19/16,39/16] */
*24578Szliu	    default:
*24578Szliu		hi = at1fhi; lo = at1flo;
*24578Szliu		z = y-x; y=y+y+y; t = x+x;
*24578Szliu		t = ( (z+z)-x ) / ( t + y ); break;
*24578Szliu	    }
*24578Szliu	}
*24578Szliu	/* end of if (t < 2.4375) */
*24578Szliu
*24578Szliu	else
*24578Szliu	{
*24578Szliu	    hi = PIo2; lo = zero;
*24578Szliu
*24578Szliu	    /* t is in [2.4375, big] */
*24578Szliu	    if (t <= big)  t = - x / y;
*24578Szliu
*24578Szliu	    /* t is in [big, INF] */
*24578Szliu	    else
*24578Szliu	      { big+small;	/* raise inexact flag */
*24578Szliu		t = zero; }
*24578Szliu	}
*24578Szliu    /* end of argument reduction */
*24578Szliu
*24578Szliu    /* compute atan(t) for t in [-.4375, .4375] */
*24578Szliu	z = t*t;
*24578Szliu#ifdef VAX
*24578Szliu	z = t*(z*(a1+z*(a2+z*(a3+z*(a4+z*(a5+z*(a6+z*(a7+z*(a8+
*24578Szliu			z*(a9+z*(a10+z*(a11+z*a12))))))))))));
*24578Szliu#else	/* IEEE double */
*24578Szliu	z = t*(z*(a1+z*(a2+z*(a3+z*(a4+z*(a5+z*(a6+z*(a7+z*(a8+
*24578Szliu			z*(a9+z*(a10+z*a11)))))))))));
*24578Szliu#endif
*24578Szliu	z = lo - z; z += t; z += hi;
*24578Szliu
*24578Szliu	return(copysign((signx>zero)?z:PI-z,signy));
*24578Szliu}