src/ld80/s_cbrtl.c

*05a0b428SJohn Marino/*-
*05a0b428SJohn Marino * ====================================================
*05a0b428SJohn Marino * Copyright (C) 1993 by Sun Microsystems, Inc. All rights reserved.
*05a0b428SJohn Marino * Copyright (c) 2009-2011, Bruce D. Evans, Steven G. Kargl, David Schultz.
*05a0b428SJohn Marino *
*05a0b428SJohn Marino * Developed at SunPro, a Sun Microsystems, Inc. business.
*05a0b428SJohn Marino * Permission to use, copy, modify, and distribute this
*05a0b428SJohn Marino * software is freely granted, provided that this notice
*05a0b428SJohn Marino * is preserved.
*05a0b428SJohn Marino * ====================================================
*05a0b428SJohn Marino *
*05a0b428SJohn Marino * The argument reduction and testing for exceptional cases was
*05a0b428SJohn Marino * written by Steven G. Kargl with input from Bruce D. Evans
*05a0b428SJohn Marino * and David A. Schultz.
*05a0b428SJohn Marino */
*05a0b428SJohn Marino
*05a0b428SJohn Marino#include <float.h>
*05a0b428SJohn Marino#include <ieeefp.h>
*05a0b428SJohn Marino#include <math.h>
*05a0b428SJohn Marino
*05a0b428SJohn Marino#include "math_private.h"
*05a0b428SJohn Marino
*05a0b428SJohn Marino#define	BIAS	(LDBL_MAX_EXP - 1)
*05a0b428SJohn Marino
*05a0b428SJohn Marinostatic const unsigned
*05a0b428SJohn Marino    B1 = 709958130;	/* B1 = (127-127.0/3-0.03306235651)*2**23 */
*05a0b428SJohn Marino
*05a0b428SJohn Marinolong double
*05a0b428SJohn Marinocbrtl(long double x)
*05a0b428SJohn Marino{
*05a0b428SJohn Marino	long double v, r, s, t, w;
*05a0b428SJohn Marino	double dr, dt, dx;
*05a0b428SJohn Marino	float ft, fx;
*05a0b428SJohn Marino	uint32_t hx, lx;
*05a0b428SJohn Marino	uint16_t expsign, es;
*05a0b428SJohn Marino	int k;
*05a0b428SJohn Marino	volatile double vd1, vd2;
*05a0b428SJohn Marino
*05a0b428SJohn Marino	GET_LDOUBLE_EXP(expsign,x);
*05a0b428SJohn Marino	k = expsign & 0x7fff;
*05a0b428SJohn Marino
*05a0b428SJohn Marino	/*
*05a0b428SJohn Marino	 * If x = +-Inf, then cbrt(x) = +-Inf.
*05a0b428SJohn Marino	 * If x = NaN, then cbrt(x) = NaN.
*05a0b428SJohn Marino	 */
*05a0b428SJohn Marino	if (k == BIAS + LDBL_MAX_EXP)
*05a0b428SJohn Marino		return (x + x);
*05a0b428SJohn Marino
*05a0b428SJohn Marino	if (k == 0) {
*05a0b428SJohn Marino		/* If x = +-0, then cbrt(x) = +-0. */
*05a0b428SJohn Marino		GET_LDOUBLE_WORDS(es,hx,lx,x);
*05a0b428SJohn Marino		if ((hx|lx) == 0) {
*05a0b428SJohn Marino			return (x);
*05a0b428SJohn Marino		}
*05a0b428SJohn Marino		/* Adjust subnormal numbers. */
*05a0b428SJohn Marino		x *= 0x1.0p514;
*05a0b428SJohn Marino		GET_LDOUBLE_EXP(k,x);
*05a0b428SJohn Marino		k &= 0x7fff;
*05a0b428SJohn Marino		k -= BIAS + 514;
*05a0b428SJohn Marino	} else
*05a0b428SJohn Marino		k -= BIAS;
*05a0b428SJohn Marino	SET_LDOUBLE_EXP(x,BIAS);
*05a0b428SJohn Marino	v = 1;
*05a0b428SJohn Marino
*05a0b428SJohn Marino	switch (k % 3) {
*05a0b428SJohn Marino	case 1:
*05a0b428SJohn Marino	case -2:
*05a0b428SJohn Marino		x = 2*x;
*05a0b428SJohn Marino		k--;
*05a0b428SJohn Marino		break;
*05a0b428SJohn Marino	case 2:
*05a0b428SJohn Marino	case -1:
*05a0b428SJohn Marino		x = 4*x;
*05a0b428SJohn Marino		k -= 2;
*05a0b428SJohn Marino		break;
*05a0b428SJohn Marino	}
*05a0b428SJohn Marino	SET_LDOUBLE_EXP(v, (expsign & 0x8000) | (BIAS + k / 3));
*05a0b428SJohn Marino
*05a0b428SJohn Marino	/*
*05a0b428SJohn Marino	 * The following is the guts of s_cbrtf, with the handling of
*05a0b428SJohn Marino	 * special values removed and extra care for accuracy not taken,
*05a0b428SJohn Marino	 * but with most of the extra accuracy not discarded.
*05a0b428SJohn Marino	 */
*05a0b428SJohn Marino
*05a0b428SJohn Marino	/* ~5-bit estimate: */
*05a0b428SJohn Marino	fx = x;
*05a0b428SJohn Marino	GET_FLOAT_WORD(hx, fx);
*05a0b428SJohn Marino	SET_FLOAT_WORD(ft, ((hx & 0x7fffffff) / 3 + B1));
*05a0b428SJohn Marino
*05a0b428SJohn Marino	/* ~16-bit estimate: */
*05a0b428SJohn Marino	dx = x;
*05a0b428SJohn Marino	dt = ft;
*05a0b428SJohn Marino	dr = dt * dt * dt;
*05a0b428SJohn Marino	dt = dt * (dx + dx + dr) / (dx + dr + dr);
*05a0b428SJohn Marino
*05a0b428SJohn Marino	/* ~47-bit estimate: */
*05a0b428SJohn Marino	dr = dt * dt * dt;
*05a0b428SJohn Marino	dt = dt * (dx + dx + dr) / (dx + dr + dr);
*05a0b428SJohn Marino
*05a0b428SJohn Marino	/*
*05a0b428SJohn Marino	 * dt is cbrtl(x) to ~47 bits (after x has been reduced to 1 <= x < 8).
*05a0b428SJohn Marino	 * Round it away from zero to 32 bits (32 so that t*t is exact, and
*05a0b428SJohn Marino	 * away from zero for technical reasons).
*05a0b428SJohn Marino	 */
*05a0b428SJohn Marino	vd2 = 0x1.0p32;
*05a0b428SJohn Marino	vd1 = 0x1.0p-31;
*05a0b428SJohn Marino	#define vd ((long double)vd2 + vd1)
*05a0b428SJohn Marino
*05a0b428SJohn Marino	t = dt + vd - 0x1.0p32;
*05a0b428SJohn Marino
*05a0b428SJohn Marino	/*
*05a0b428SJohn Marino	 * Final step Newton iteration to 64 or 113 bits with
*05a0b428SJohn Marino	 * error < 0.667 ulps
*05a0b428SJohn Marino	 */
*05a0b428SJohn Marino	s=t*t;				/* t*t is exact */
*05a0b428SJohn Marino	r=x/s;				/* error <= 0.5 ulps; |r| < |t| */
*05a0b428SJohn Marino	w=t+t;				/* t+t is exact */
*05a0b428SJohn Marino	r=(r-t)/(w+r);			/* r-t is exact; w+r ~= 3*t */
*05a0b428SJohn Marino	t=t+t*r;			/* error <= 0.5 + 0.5/3 + epsilon */
*05a0b428SJohn Marino
*05a0b428SJohn Marino	t *= v;
*05a0b428SJohn Marino	return (t);
*05a0b428SJohn Marino}