openbsd_libm/src/s_csqrtf.c

*05a0b428SJohn Marino/*	$OpenBSD: s_csqrtf.c,v 1.2 2010/07/18 18:42:26 guenther Exp $	*/
*05a0b428SJohn Marino/*
*05a0b428SJohn Marino * Copyright (c) 2008 Stephen L. Moshier <steve@moshier.net>
*05a0b428SJohn Marino *
*05a0b428SJohn Marino * Permission to use, copy, modify, and distribute this software for any
*05a0b428SJohn Marino * purpose with or without fee is hereby granted, provided that the above
*05a0b428SJohn Marino * copyright notice and this permission notice appear in all copies.
*05a0b428SJohn Marino *
*05a0b428SJohn Marino * THE SOFTWARE IS PROVIDED "AS IS" AND THE AUTHOR DISCLAIMS ALL WARRANTIES
*05a0b428SJohn Marino * WITH REGARD TO THIS SOFTWARE INCLUDING ALL IMPLIED WARRANTIES OF
*05a0b428SJohn Marino * MERCHANTABILITY AND FITNESS. IN NO EVENT SHALL THE AUTHOR BE LIABLE FOR
*05a0b428SJohn Marino * ANY SPECIAL, DIRECT, INDIRECT, OR CONSEQUENTIAL DAMAGES OR ANY DAMAGES
*05a0b428SJohn Marino * WHATSOEVER RESULTING FROM LOSS OF USE, DATA OR PROFITS, WHETHER IN AN
*05a0b428SJohn Marino * ACTION OF CONTRACT, NEGLIGENCE OR OTHER TORTIOUS ACTION, ARISING OUT OF
*05a0b428SJohn Marino * OR IN CONNECTION WITH THE USE OR PERFORMANCE OF THIS SOFTWARE.
*05a0b428SJohn Marino */
*05a0b428SJohn Marino
*05a0b428SJohn Marino/*							csqrtf()
*05a0b428SJohn Marino *
*05a0b428SJohn Marino *	Complex square root
*05a0b428SJohn Marino *
*05a0b428SJohn Marino *
*05a0b428SJohn Marino *
*05a0b428SJohn Marino * SYNOPSIS:
*05a0b428SJohn Marino *
*05a0b428SJohn Marino * float complex csqrtf();
*05a0b428SJohn Marino * float complex z, w;
*05a0b428SJohn Marino *
*05a0b428SJohn Marino * w = csqrtf( z );
*05a0b428SJohn Marino *
*05a0b428SJohn Marino *
*05a0b428SJohn Marino *
*05a0b428SJohn Marino * DESCRIPTION:
*05a0b428SJohn Marino *
*05a0b428SJohn Marino *
*05a0b428SJohn Marino * If z = x + iy,  r = |z|, then
*05a0b428SJohn Marino *
*05a0b428SJohn Marino *                       1/2
*05a0b428SJohn Marino * Re w  =  [ (r + x)/2 ]   ,
*05a0b428SJohn Marino *
*05a0b428SJohn Marino *                       1/2
*05a0b428SJohn Marino * Im w  =  [ (r - x)/2 ]   .
*05a0b428SJohn Marino *
*05a0b428SJohn Marino * Cancellation error in r-x or r+x is avoided by using the
*05a0b428SJohn Marino * identity  2 Re w Im w  =  y.
*05a0b428SJohn Marino *
*05a0b428SJohn Marino * Note that -w is also a square root of z.  The root chosen
*05a0b428SJohn Marino * is always in the right half plane and Im w has the same sign as y.
*05a0b428SJohn Marino *
*05a0b428SJohn Marino *
*05a0b428SJohn Marino *
*05a0b428SJohn Marino * ACCURACY:
*05a0b428SJohn Marino *
*05a0b428SJohn Marino *
*05a0b428SJohn Marino *                      Relative error:
*05a0b428SJohn Marino * arithmetic   domain     # trials      peak         rms
*05a0b428SJohn Marino *    IEEE      -10,+10    1,000,000    1.8e-7       3.5e-8
*05a0b428SJohn Marino *
*05a0b428SJohn Marino */
*05a0b428SJohn Marino
*05a0b428SJohn Marino#include <complex.h>
*05a0b428SJohn Marino#include <math.h>
*05a0b428SJohn Marino
*05a0b428SJohn Marinofloat complex
*05a0b428SJohn Marinocsqrtf(float complex z)
*05a0b428SJohn Marino{
*05a0b428SJohn Marino	float complex w;
*05a0b428SJohn Marino	float x, y, r, t, scale;
*05a0b428SJohn Marino
*05a0b428SJohn Marino	x = crealf(z);
*05a0b428SJohn Marino	y = cimagf(z);
*05a0b428SJohn Marino
*05a0b428SJohn Marino	if(y == 0.0f) {
*05a0b428SJohn Marino		if (x < 0.0f) {
*05a0b428SJohn Marino			w = 0.0f + sqrtf(-x) * I;
*05a0b428SJohn Marino			return (w);
*05a0b428SJohn Marino		}
*05a0b428SJohn Marino		else if (x == 0.0f) {
*05a0b428SJohn Marino			return (0.0f + y * I);
*05a0b428SJohn Marino		}
*05a0b428SJohn Marino		else {
*05a0b428SJohn Marino			w = sqrtf(x) + y * I;
*05a0b428SJohn Marino			return (w);
*05a0b428SJohn Marino		}
*05a0b428SJohn Marino	}
*05a0b428SJohn Marino
*05a0b428SJohn Marino	if (x == 0.0f) {
*05a0b428SJohn Marino		r = fabsf(y);
*05a0b428SJohn Marino		r = sqrtf(0.5f*r);
*05a0b428SJohn Marino		if(y > 0)
*05a0b428SJohn Marino			w = r + r * I;
*05a0b428SJohn Marino		else
*05a0b428SJohn Marino			w = r - r * I;
*05a0b428SJohn Marino		return (w);
*05a0b428SJohn Marino	}
*05a0b428SJohn Marino
*05a0b428SJohn Marino	/* Rescale to avoid internal overflow or underflow.  */
*05a0b428SJohn Marino	if ((fabsf(x) > 4.0f) || (fabsf(y) > 4.0f)) {
*05a0b428SJohn Marino		x *= 0.25f;
*05a0b428SJohn Marino		y *= 0.25f;
*05a0b428SJohn Marino		scale = 2.0f;
*05a0b428SJohn Marino	}
*05a0b428SJohn Marino	else {
*05a0b428SJohn Marino		x *= 6.7108864e7f; /* 2^26 */
*05a0b428SJohn Marino		y *= 6.7108864e7f;
*05a0b428SJohn Marino		scale = 1.220703125e-4f; /* 2^-13 */
*05a0b428SJohn Marino#if 0
*05a0b428SJohn Marino		x *= 4.0f;
*05a0b428SJohn Marino		y *= 4.0f;
*05a0b428SJohn Marino		scale = 0.5f;
*05a0b428SJohn Marino#endif
*05a0b428SJohn Marino	}
*05a0b428SJohn Marino	w = x + y * I;
*05a0b428SJohn Marino	r = cabsf(w);
*05a0b428SJohn Marino	if (x > 0) {
*05a0b428SJohn Marino		t = sqrtf( 0.5f * r + 0.5f * x );
*05a0b428SJohn Marino		r = scale * fabsf((0.5f * y) / t);
*05a0b428SJohn Marino		t *= scale;
*05a0b428SJohn Marino	}
*05a0b428SJohn Marino	else {
*05a0b428SJohn Marino		r = sqrtf(0.5f * r - 0.5f * x);
*05a0b428SJohn Marino		t = scale * fabsf((0.5f * y) / r);
*05a0b428SJohn Marino		r *= scale;
*05a0b428SJohn Marino	}
*05a0b428SJohn Marino
*05a0b428SJohn Marino	if (y < 0)
*05a0b428SJohn Marino		w = t - r * I;
*05a0b428SJohn Marino	else
*05a0b428SJohn Marino		w = t + r * I;
*05a0b428SJohn Marino	return (w);
*05a0b428SJohn Marino}