libm/common/trig.c

24582Szliu/*
24582Szliu * Copyright (c) 1985 Regents of the University of California.
24582Szliu *
24582Szliu * Use and reproduction of this software are granted  in  accordance  with
24582Szliu * the terms and conditions specified in  the  Berkeley  Software  License
24582Szliu * Agreement (in particular, this entails acknowledgement of the programs'
24582Szliu * source, and inclusion of this notice) with the additional understanding
24582Szliu * that  all  recipients  should regard themselves as participants  in  an
24582Szliu * ongoing  research  project and hence should  feel  obligated  to report
24582Szliu * their  experiences (good or bad) with these elementary function  codes,
24582Szliu * using "sendbug 4bsd-bugs@BERKELEY", to the authors.
24582Szliu */
24582Szliu
24582Szliu#ifndef lint
*24720Selefuntstatic char sccsid[] =
*24720Selefunt"@(#)trig.c	1.2 (Berkeley) 8/22/85; 1.2 (ucb.elefunt) 09/12/85";
24582Szliu#endif not lint
24582Szliu
24582Szliu/* SIN(X), COS(X), TAN(X)
24582Szliu * RETURN THE SINE, COSINE, AND TANGENT OF X RESPECTIVELY
24582Szliu * DOUBLE PRECISION (VAX D format 56 bits, IEEE DOUBLE 53 BITS)
24582Szliu * CODED IN C BY K.C. NG, 1/8/85;
24582Szliu * REVISED BY W. Kahan and K.C. NG, 8/17/85.
24582Szliu *
24582Szliu * Required system supported functions:
24582Szliu *      copysign(x,y)
24582Szliu *      finite(x)
24582Szliu *      drem(x,p)
24582Szliu *
24582Szliu * Static kernel functions:
24582Szliu *      sin__S(z)       ....sin__S(x*x) return (sin(x)-x)/x
24582Szliu *      cos__C(z)       ....cos__C(x*x) return cos(x)-1-x*x/2
24582Szliu *
24582Szliu * Method.
24582Szliu *      Let S and C denote the polynomial approximations to sin and cos
24582Szliu *      respectively on [-PI/4, +PI/4].
24582Szliu *
24582Szliu *      SIN and COS:
24582Szliu *      1. Reduce the argument into [-PI , +PI] by the remainder function.
24582Szliu *      2. For x in (-PI,+PI), there are three cases:
24582Szliu *			case 1:	|x| < PI/4
24582Szliu *			case 2:	PI/4 <= |x| < 3PI/4
24582Szliu *			case 3:	3PI/4 <= |x|.
24582Szliu *	   SIN and COS of x are computed by:
24582Szliu *
24582Szliu *                   sin(x)      cos(x)       remark
24582Szliu *     ----------------------------------------------------------
24582Szliu *        case 1     S(x)         C(x)
24582Szliu *        case 2 sign(x)*C(y)     S(y)      y=PI/2-|x|
24582Szliu *        case 3     S(y)        -C(y)      y=sign(x)*(PI-|x|)
24582Szliu *     ----------------------------------------------------------
24582Szliu *
24582Szliu *      TAN:
24582Szliu *      1. Reduce the argument into [-PI/2 , +PI/2] by the remainder function.
24582Szliu *      2. For x in (-PI/2,+PI/2), there are two cases:
24582Szliu *			case 1:	|x| < PI/4
24582Szliu *			case 2:	PI/4 <= |x| < PI/2
24582Szliu *         TAN of x is computed by:
24582Szliu *
24582Szliu *                   tan (x)            remark
24582Szliu *     ----------------------------------------------------------
24582Szliu *        case 1     S(x)/C(x)
24582Szliu *        case 2     C(y)/S(y)     y=sign(x)*(PI/2-|x|)
24582Szliu *     ----------------------------------------------------------
24582Szliu *
24582Szliu *   Notes:
24582Szliu *      1. S(y) and C(y) were computed by:
24582Szliu *              S(y) = y+y*sin__S(y*y)
24582Szliu *              C(y) = 1-(y*y/2-cos__C(x*x))          ... if y*y/2 <  thresh,
24582Szliu *                   = 0.5-((y*y/2-0.5)-cos__C(x*x))  ... if y*y/2 >= thresh.
24582Szliu *         where
24582Szliu *              thresh = 0.5*(acos(3/4)**2)
24582Szliu *
24582Szliu *      2. For better accuracy, we use the following formula for S/C for tan
24582Szliu *         (k=0): let ss=sin__S(y*y), and cc=cos__C(y*y), then
24582Szliu *
24582Szliu *                            y+y*ss             (y*y/2-cc)+ss
24582Szliu *             S(y)/C(y)   = -------- = y + y * ---------------.
24582Szliu *                               C                     C
24582Szliu *
24582Szliu *
24582Szliu * Special cases:
24582Szliu *      Let trig be any of sin, cos, or tan.
24582Szliu *      trig(+-INF)  is NaN, with signals;
24582Szliu *      trig(NaN)    is that NaN;
24582Szliu *      trig(n*PI/2) is exact for any integer n, provided n*PI is
24582Szliu *      representable; otherwise, trig(x) is inexact.
24582Szliu *
24582Szliu * Accuracy:
24582Szliu *      trig(x) returns the exact trig(x*pi/PI) nearly rounded, where
24582Szliu *
24582Szliu *      Decimal:
24582Szliu *              pi = 3.141592653589793 23846264338327 .....
24582Szliu *    53 bits   PI = 3.141592653589793 115997963 ..... ,
24582Szliu *    56 bits   PI = 3.141592653589793 227020265 ..... ,
24582Szliu *
24582Szliu *      Hexadecimal:
24582Szliu *              pi = 3.243F6A8885A308D313198A2E....
24582Szliu *    53 bits   PI = 3.243F6A8885A30  =  2 * 1.921FB54442D18    error=.276ulps
24582Szliu *    56 bits   PI = 3.243F6A8885A308 =  4 * .C90FDAA22168C2    error=.206ulps
24582Szliu *
24582Szliu *      In a test run with 1,024,000 random arguments on a VAX, the maximum
24582Szliu *      observed errors (compared with the exact trig(x*pi/PI)) were
24582Szliu *                      tan(x) : 2.09 ulps (around 4.716340404662354)
24582Szliu *                      sin(x) : .861 ulps
24582Szliu *                      cos(x) : .857 ulps
24582Szliu *
24582Szliu * Constants:
24582Szliu * The hexadecimal values are the intended ones for the following constants.
24582Szliu * The decimal values may be used, provided that the compiler will convert
24582Szliu * from decimal to binary accurately enough to produce the hexadecimal values
24582Szliu * shown.
24582Szliu */
24582Szliu
24582Szliu#ifdef VAX
24582Szliu/*thresh =  2.6117239648121182150E-1    , Hex  2^ -1   *  .85B8636B026EA0 */
24582Szliu/*PIo4   =  7.8539816339744830676E-1    , Hex  2^  0   *  .C90FDAA22168C2 */
24582Szliu/*PIo2   =  1.5707963267948966135E0     , Hex  2^  1   *  .C90FDAA22168C2 */
24582Szliu/*PI3o4  =  2.3561944901923449203E0     , Hex  2^  2   *  .96CBE3F9990E92 */
24582Szliu/*PI     =  3.1415926535897932270E0     , Hex  2^  2   *  .C90FDAA22168C2 */
24582Szliu/*PI2    =  6.2831853071795864540E0     ; Hex  2^  3   *  .C90FDAA22168C2 */
24582Szliustatic long    threshx[] = { 0xb8633f85, 0x6ea06b02};
24582Szliu#define   thresh    (*(double*)threshx)
24582Szliustatic long      PIo4x[] = { 0x0fda4049, 0x68c2a221};
24582Szliu#define     PIo4    (*(double*)PIo4x)
24582Szliustatic long      PIo2x[] = { 0x0fda40c9, 0x68c2a221};
24582Szliu#define     PIo2    (*(double*)PIo2x)
24582Szliustatic long      PI3o4x[] = { 0xcbe34116, 0x0e92f999};
24582Szliu#define     PI3o4    (*(double*)PI3o4x)
24582Szliustatic long        PIx[] = { 0x0fda4149, 0x68c2a221};
24582Szliu#define       PI    (*(double*)PIx)
24582Szliustatic long       PI2x[] = { 0x0fda41c9, 0x68c2a221};
24582Szliu#define      PI2    (*(double*)PI2x)
24582Szliu#else   /* IEEE double  */
24582Szliustatic double
24582Szliuthresh =  2.6117239648121182150E-1    , /*Hex  2^ -2   *  1.0B70C6D604DD4 */
24582SzliuPIo4   =  7.8539816339744827900E-1    , /*Hex  2^ -1   *  1.921FB54442D18 */
24582SzliuPIo2   =  1.5707963267948965580E0     , /*Hex  2^  0   *  1.921FB54442D18 */
24582SzliuPI3o4  =  2.3561944901923448370E0     , /*Hex  2^  1   *  1.2D97C7F3321D2 */
24582SzliuPI     =  3.1415926535897931160E0     , /*Hex  2^  1   *  1.921FB54442D18 */
24582SzliuPI2    =  6.2831853071795862320E0     ; /*Hex  2^  2   *  1.921FB54442D18 */
24582Szliu#endif
24582Szliustatic double zero=0, one=1, negone= -1, half=1.0/2.0,
24582Szliu	      small=1E-10, /* 1+small**2==1; better values for small:
24582Szliu					small = 1.5E-9 for VAX D
24582Szliu					      = 1.2E-8 for IEEE Double
24582Szliu					      = 2.8E-10 for IEEE Extended */
24582Szliu	      big=1E20;    /* big = 1/(small**2) */
24582Szliu
24582Szliudouble tan(x)
24582Szliudouble x;
24582Szliu{
24582Szliu        double copysign(),drem(),cos__C(),sin__S(),a,z,ss,cc,c;
24582Szliu        int finite(),k;
24582Szliu
24582Szliu        /* tan(NaN) and tan(INF) must be NaN */
24582Szliu            if(!finite(x))  return(x-x);
24582Szliu        x=drem(x,PI);        /* reduce x into [-PI/2, PI/2] */
24582Szliu        a=copysign(x,one);   /* ... = abs(x) */
24582Szliu	if ( a >= PIo4 ) {k=1; x = copysign( PIo2 - a , x ); }
24582Szliu	   else { k=0; if(a < small ) { big + a; return(x); }}
24582Szliu
24582Szliu        z  = x*x;
24582Szliu        cc = cos__C(z);
24582Szliu        ss = sin__S(z);
24582Szliu	z  = z*half ;		/* Next get c = cos(x) accurately */
24582Szliu	c  = (z >= thresh )? half-((z-half)-cc) : one-(z-cc);
24582Szliu	if (k==0) return ( x + (x*(z-(cc-ss)))/c );  /* sin/cos */
24582Szliu	return( c/(x+x*ss) );	/*                  ... cos/sin */
24582Szliu
24582Szliu
24582Szliu}
24582Szliudouble sin(x)
24582Szliudouble x;
24582Szliu{
24582Szliu        double copysign(),drem(),sin__S(),cos__C(),a,c,z;
24582Szliu        int finite();
24582Szliu
24582Szliu        /* sin(NaN) and sin(INF) must be NaN */
24582Szliu            if(!finite(x))  return(x-x);
24582Szliu	x=drem(x,PI2);         /*    reduce x into [-PI, PI] */
24582Szliu        a=copysign(x,one);
24582Szliu	if( a >= PIo4 ) {
24582Szliu	     if( a >= PI3o4 )   /* 	.. in [3PI/4,  PI ]  */
24582Szliu		x=copysign((a=PI-a),x);
24582Szliu
24582Szliu	     else {	       /* 	.. in [PI/4, 3PI/4]  */
24582Szliu		a=PIo2-a;      /* return sign(x)*C(PI/2-|x|) */
24582Szliu		z=a*a;
24582Szliu		c=cos__C(z);
24582Szliu		z=z*half;
24582Szliu		a=(z>=thresh)?half-((z-half)-c):one-(z-c);
24582Szliu		return(copysign(a,x));
24582Szliu		}
24582Szliu             }
24582Szliu
24582Szliu        /* return S(x) */
24582Szliu            if( a < small) { big + a; return(x);}
24582Szliu            return(x+x*sin__S(x*x));
24582Szliu}
24582Szliu
24582Szliudouble cos(x)
24582Szliudouble x;
24582Szliu{
24582Szliu        double copysign(),drem(),sin__S(),cos__C(),a,c,z,s=1.0;
24582Szliu        int finite();
24582Szliu
24582Szliu        /* cos(NaN) and cos(INF) must be NaN */
24582Szliu            if(!finite(x))  return(x-x);
24582Szliu	x=drem(x,PI2);         /*    reduce x into [-PI, PI] */
24582Szliu        a=copysign(x,one);
24582Szliu	if ( a >= PIo4 ) {
24582Szliu	     if ( a >= PI3o4 )  /* 	.. in [3PI/4,  PI ]  */
24582Szliu		{ a=PI-a; s= negone; }
24582Szliu
24582Szliu	     else 	       /* 	.. in [PI/4, 3PI/4]  */
24582Szliu                               /*        return  S(PI/2-|x|) */
24582Szliu		{ a=PIo2-a; return(a+a*sin__S(a*a));}
24582Szliu	     }
24582Szliu
24582Szliu
24582Szliu        /* return s*C(a) */
24582Szliu            if( a < small) { big + a; return(s);}
24582Szliu	    z=a*a;
24582Szliu	    c=cos__C(z);
24582Szliu	    z=z*half;
24582Szliu	    a=(z>=thresh)?half-((z-half)-c):one-(z-c);
24582Szliu	    return(copysign(a,s));
24582Szliu}
24582Szliu
24582Szliu
24582Szliu/* sin__S(x*x)
24582Szliu * DOUBLE PRECISION (VAX D format 56 bits, IEEE DOUBLE 53 BITS)
24582Szliu * STATIC KERNEL FUNCTION OF SIN(X), COS(X), AND TAN(X)
24582Szliu * CODED IN C BY K.C. NG, 1/21/85;
24582Szliu * REVISED BY K.C. NG on 8/13/85.
24582Szliu *
24582Szliu *	    sin(x*k) - x
24582Szliu * RETURN  --------------- on [-PI/4,PI/4] , where k=pi/PI, PI is the rounded
24582Szliu *	            x
24582Szliu * value of pi in machine precision:
24582Szliu *
24582Szliu *	Decimal:
24582Szliu *		pi = 3.141592653589793 23846264338327 .....
24582Szliu *    53 bits   PI = 3.141592653589793 115997963 ..... ,
24582Szliu *    56 bits   PI = 3.141592653589793 227020265 ..... ,
24582Szliu *
24582Szliu *	Hexadecimal:
24582Szliu *		pi = 3.243F6A8885A308D313198A2E....
24582Szliu *    53 bits   PI = 3.243F6A8885A30  =  2 * 1.921FB54442D18
24582Szliu *    56 bits   PI = 3.243F6A8885A308 =  4 * .C90FDAA22168C2
24582Szliu *
24582Szliu * Method:
24582Szliu *	1. Let z=x*x. Create a polynomial approximation to
24582Szliu *	    (sin(k*x)-x)/x  =  z*(S0 + S1*z^1 + ... + S5*z^5).
24582Szliu *	Then
24582Szliu *      sin__S(x*x) = z*(S0 + S1*z^1 + ... + S5*z^5)
24582Szliu *
24582Szliu *	The coefficient S's are obtained by a special Remez algorithm.
24582Szliu *
24582Szliu * Accuracy:
24582Szliu *	In the absence of rounding error, the approximation has absolute error
24582Szliu *	less than 2**(-61.11) for VAX D FORMAT, 2**(-57.45) for IEEE DOUBLE.
24582Szliu *
24582Szliu * Constants:
24582Szliu * The hexadecimal values are the intended ones for the following constants.
24582Szliu * The decimal values may be used, provided that the compiler will convert
24582Szliu * from decimal to binary accurately enough to produce the hexadecimal values
24582Szliu * shown.
24582Szliu *
24582Szliu */
24582Szliu
24582Szliu#ifdef VAX
24582Szliu/*S0     = -1.6666666666666646660E-1    , Hex  2^ -2   * -.AAAAAAAAAAAA71 */
24582Szliu/*S1     =  8.3333333333297230413E-3    , Hex  2^ -6   *  .8888888888477F */
24582Szliu/*S2     = -1.9841269838362403710E-4    , Hex  2^-12   * -.D00D00CF8A1057 */
24582Szliu/*S3     =  2.7557318019967078930E-6    , Hex  2^-18   *  .B8EF1CA326BEDC */
24582Szliu/*S4     = -2.5051841873876551398E-8    , Hex  2^-25   * -.D73195374CE1D3 */
24582Szliu/*S5     =  1.6028995389845827653E-10   , Hex  2^-32   *  .B03D9C6D26CCCC */
24582Szliu/*S6     = -6.2723499671769283121E-13   ; Hex  2^-40   * -.B08D0B7561EA82 */
24582Szliustatic long        S0x[] = { 0xaaaabf2a, 0xaa71aaaa};
24582Szliu#define       S0    (*(double*)S0x)
24582Szliustatic long        S1x[] = { 0x88883d08, 0x477f8888};
24582Szliu#define       S1    (*(double*)S1x)
24582Szliustatic long        S2x[] = { 0x0d00ba50, 0x1057cf8a};
24582Szliu#define       S2    (*(double*)S2x)
24582Szliustatic long        S3x[] = { 0xef1c3738, 0xbedca326};
24582Szliu#define       S3    (*(double*)S3x)
24582Szliustatic long        S4x[] = { 0x3195b3d7, 0xe1d3374c};
24582Szliu#define       S4    (*(double*)S4x)
24582Szliustatic long        S5x[] = { 0x3d9c3030, 0xcccc6d26};
24582Szliu#define       S5    (*(double*)S5x)
24582Szliustatic long        S6x[] = { 0x8d0bac30, 0xea827561};
24582Szliu#define       S6    (*(double*)S6x)
24582Szliu#else	/* IEEE double  */
24582Szliustatic double
24582SzliuS0     = -1.6666666666666463126E-1    , /*Hex  2^ -3   * -1.555555555550C */
24582SzliuS1     =  8.3333333332992771264E-3    , /*Hex  2^ -7   *  1.111111110C461 */
24582SzliuS2     = -1.9841269816180999116E-4    , /*Hex  2^-13   * -1.A01A019746345 */
24582SzliuS3     =  2.7557309793219876880E-6    , /*Hex  2^-19   *  1.71DE3209CDCD9 */
24582SzliuS4     = -2.5050225177523807003E-8    , /*Hex  2^-26   * -1.AE5C0E319A4EF */
24582SzliuS5     =  1.5868926979889205164E-10   ; /*Hex  2^-33   *  1.5CF61DF672B13 */
24582Szliu#endif
24582Szliu
24582Szliustatic double sin__S(z)
24582Szliudouble z;
24582Szliu{
24582Szliu#ifdef VAX
24582Szliu	return(z*(S0+z*(S1+z*(S2+z*(S3+z*(S4+z*(S5+z*S6)))))));
24582Szliu#else 	/* IEEE double */
24582Szliu	return(z*(S0+z*(S1+z*(S2+z*(S3+z*(S4+z*S5))))));
24582Szliu#endif
24582Szliu}
24582Szliu
24582Szliu
24582Szliu/* cos__C(x*x)
24582Szliu * DOUBLE PRECISION (VAX D FORMAT 56 BITS, IEEE DOUBLE 53 BITS)
24582Szliu * STATIC KERNEL FUNCTION OF SIN(X), COS(X), AND TAN(X)
24582Szliu * CODED IN C BY K.C. NG, 1/21/85;
24582Szliu * REVISED BY K.C. NG on 8/13/85.
24582Szliu *
24582Szliu *	   		    x*x
24582Szliu * RETURN   cos(k*x) - 1 + ----- on [-PI/4,PI/4],  where k = pi/PI,
24582Szliu *	  		     2
24582Szliu * PI is the rounded value of pi in machine precision :
24582Szliu *
24582Szliu *	Decimal:
24582Szliu *		pi = 3.141592653589793 23846264338327 .....
24582Szliu *    53 bits   PI = 3.141592653589793 115997963 ..... ,
24582Szliu *    56 bits   PI = 3.141592653589793 227020265 ..... ,
24582Szliu *
24582Szliu *	Hexadecimal:
24582Szliu *		pi = 3.243F6A8885A308D313198A2E....
24582Szliu *    53 bits   PI = 3.243F6A8885A30  =  2 * 1.921FB54442D18
24582Szliu *    56 bits   PI = 3.243F6A8885A308 =  4 * .C90FDAA22168C2
24582Szliu *
24582Szliu *
24582Szliu * Method:
24582Szliu *	1. Let z=x*x. Create a polynomial approximation to
24582Szliu *	    cos(k*x)-1+z/2  =  z*z*(C0 + C1*z^1 + ... + C5*z^5)
24582Szliu *	then
24582Szliu *      cos__C(z) =  z*z*(C0 + C1*z^1 + ... + C5*z^5)
24582Szliu *
24582Szliu *	The coefficient C's are obtained by a special Remez algorithm.
24582Szliu *
24582Szliu * Accuracy:
24582Szliu *	In the absence of rounding error, the approximation has absolute error
24582Szliu *	less than 2**(-64) for VAX D FORMAT, 2**(-58.3) for IEEE DOUBLE.
24582Szliu *
24582Szliu *
24582Szliu * Constants:
24582Szliu * The hexadecimal values are the intended ones for the following constants.
24582Szliu * The decimal values may be used, provided that the compiler will convert
24582Szliu * from decimal to binary accurately enough to produce the hexadecimal values
24582Szliu * shown.
24582Szliu *
24582Szliu */
24582Szliu
24582Szliu#ifdef VAX
24582Szliu/*C0     =  4.1666666666666504759E-2    , Hex  2^ -4   *  .AAAAAAAAAAA9F0 */
24582Szliu/*C1     = -1.3888888888865302059E-3    , Hex  2^ -9   * -.B60B60B60A0CCA */
24582Szliu/*C2     =  2.4801587285601038265E-5    , Hex  2^-15   *  .D00D00CDCD098F */
24582Szliu/*C3     = -2.7557313470902390219E-7    , Hex  2^-21   * -.93F27BB593E805 */
24582Szliu/*C4     =  2.0875623401082232009E-9    , Hex  2^-28   *  .8F74C8FA1E3FF0 */
24582Szliu/*C5     = -1.1355178117642986178E-11   ; Hex  2^-36   * -.C7C32D0A5C5A63 */
24582Szliustatic long        C0x[] = { 0xaaaa3e2a, 0xa9f0aaaa};
24582Szliu#define       C0    (*(double*)C0x)
24582Szliustatic long        C1x[] = { 0x0b60bbb6, 0x0ccab60a};
24582Szliu#define       C1    (*(double*)C1x)
24582Szliustatic long        C2x[] = { 0x0d0038d0, 0x098fcdcd};
24582Szliu#define       C2    (*(double*)C2x)
24582Szliustatic long        C3x[] = { 0xf27bb593, 0xe805b593};
24582Szliu#define       C3    (*(double*)C3x)
24582Szliustatic long        C4x[] = { 0x74c8320f, 0x3ff0fa1e};
24582Szliu#define       C4    (*(double*)C4x)
24582Szliustatic long        C5x[] = { 0xc32dae47, 0x5a630a5c};
24582Szliu#define       C5    (*(double*)C5x)
24582Szliu#else	/* IEEE double  */
24582Szliustatic double
24582SzliuC0     =  4.1666666666666504759E-2    , /*Hex  2^ -5   *  1.555555555553E */
24582SzliuC1     = -1.3888888888865301516E-3    , /*Hex  2^-10   * -1.6C16C16C14199 */
24582SzliuC2     =  2.4801587269650015769E-5    , /*Hex  2^-16   *  1.A01A01971CAEB */
24582SzliuC3     = -2.7557304623183959811E-7    , /*Hex  2^-22   * -1.27E4F1314AD1A */
24582SzliuC4     =  2.0873958177697780076E-9    , /*Hex  2^-29   *  1.1EE3B60DDDC8C */
24582SzliuC5     = -1.1250289076471311557E-11   ; /*Hex  2^-37   * -1.8BD5986B2A52E */
24582Szliu#endif
24582Szliu
24582Szliustatic double cos__C(z)
24582Szliudouble z;
24582Szliu{
24582Szliu	return(z*z*(C0+z*(C1+z*(C2+z*(C3+z*(C4+z*C5))))));
24582Szliu}