1df930be7Sderaadt /* e_j0f.c -- float version of e_j0.c.
2df930be7Sderaadt * Conversion to float by Ian Lance Taylor, Cygnus Support, ian@cygnus.com.
3df930be7Sderaadt */
4df930be7Sderaadt
5df930be7Sderaadt /*
6df930be7Sderaadt * ====================================================
7df930be7Sderaadt * Copyright (C) 1993 by Sun Microsystems, Inc. All rights reserved.
8df930be7Sderaadt *
9df930be7Sderaadt * Developed at SunPro, a Sun Microsystems, Inc. business.
10df930be7Sderaadt * Permission to use, copy, modify, and distribute this
11df930be7Sderaadt * software is freely granted, provided that this notice
12df930be7Sderaadt * is preserved.
13df930be7Sderaadt * ====================================================
14df930be7Sderaadt */
15df930be7Sderaadt
16df930be7Sderaadt #include "math.h"
17df930be7Sderaadt #include "math_private.h"
18df930be7Sderaadt
19df930be7Sderaadt static float pzerof(float), qzerof(float);
20df930be7Sderaadt
21df930be7Sderaadt static const float
22df930be7Sderaadt huge = 1e30,
23df930be7Sderaadt one = 1.0,
24df930be7Sderaadt invsqrtpi= 5.6418961287e-01, /* 0x3f106ebb */
25df930be7Sderaadt tpi = 6.3661974669e-01, /* 0x3f22f983 */
26df930be7Sderaadt /* R0/S0 on [0, 2.00] */
27df930be7Sderaadt R02 = 1.5625000000e-02, /* 0x3c800000 */
28df930be7Sderaadt R03 = -1.8997929874e-04, /* 0xb947352e */
29df930be7Sderaadt R04 = 1.8295404516e-06, /* 0x35f58e88 */
30df930be7Sderaadt R05 = -4.6183270541e-09, /* 0xb19eaf3c */
31df930be7Sderaadt S01 = 1.5619102865e-02, /* 0x3c7fe744 */
32df930be7Sderaadt S02 = 1.1692678527e-04, /* 0x38f53697 */
33df930be7Sderaadt S03 = 5.1354652442e-07, /* 0x3509daa6 */
34df930be7Sderaadt S04 = 1.1661400734e-09; /* 0x30a045e8 */
35df930be7Sderaadt
36df930be7Sderaadt static const float zero = 0.0;
37df930be7Sderaadt
38e7beb4a7Smillert float
j0f(float x)397b36286aSmartynas j0f(float x)
40df930be7Sderaadt {
41df930be7Sderaadt float z, s,c,ss,cc,r,u,v;
42df930be7Sderaadt int32_t hx,ix;
43df930be7Sderaadt
44df930be7Sderaadt GET_FLOAT_WORD(hx,x);
45df930be7Sderaadt ix = hx&0x7fffffff;
46df930be7Sderaadt if(ix>=0x7f800000) return one/(x*x);
47df930be7Sderaadt x = fabsf(x);
48df930be7Sderaadt if(ix >= 0x40000000) { /* |x| >= 2.0 */
49df930be7Sderaadt s = sinf(x);
50df930be7Sderaadt c = cosf(x);
51df930be7Sderaadt ss = s-c;
52df930be7Sderaadt cc = s+c;
53df930be7Sderaadt if(ix<0x7f000000) { /* make sure x+x not overflow */
54df930be7Sderaadt z = -cosf(x+x);
55df930be7Sderaadt if ((s*c)<zero) cc = z/ss;
56df930be7Sderaadt else ss = z/cc;
57df930be7Sderaadt }
58df930be7Sderaadt /*
59df930be7Sderaadt * j0(x) = 1/sqrt(pi) * (P(0,x)*cc - Q(0,x)*ss) / sqrt(x)
60df930be7Sderaadt * y0(x) = 1/sqrt(pi) * (P(0,x)*ss + Q(0,x)*cc) / sqrt(x)
61df930be7Sderaadt */
62ed994b09Sotto if(ix>0x80000000U) z = (invsqrtpi*cc)/sqrtf(x);
63df930be7Sderaadt else {
64df930be7Sderaadt u = pzerof(x); v = qzerof(x);
65df930be7Sderaadt z = invsqrtpi*(u*cc-v*ss)/sqrtf(x);
66df930be7Sderaadt }
67df930be7Sderaadt return z;
68df930be7Sderaadt }
69df930be7Sderaadt if(ix<0x39000000) { /* |x| < 2**-13 */
70df930be7Sderaadt if(huge+x>one) { /* raise inexact if x != 0 */
71df930be7Sderaadt if(ix<0x32000000) return one; /* |x|<2**-27 */
72df930be7Sderaadt else return one - (float)0.25*x*x;
73df930be7Sderaadt }
74df930be7Sderaadt }
75df930be7Sderaadt z = x*x;
76df930be7Sderaadt r = z*(R02+z*(R03+z*(R04+z*R05)));
77df930be7Sderaadt s = one+z*(S01+z*(S02+z*(S03+z*S04)));
78df930be7Sderaadt if(ix < 0x3F800000) { /* |x| < 1.00 */
79df930be7Sderaadt return one + z*((float)-0.25+(r/s));
80df930be7Sderaadt } else {
81df930be7Sderaadt u = (float)0.5*x;
82df930be7Sderaadt return((one+u)*(one-u)+z*(r/s));
83df930be7Sderaadt }
84df930be7Sderaadt }
85*2f2c0062Sguenther DEF_NONSTD(j0f);
86df930be7Sderaadt
87df930be7Sderaadt static const float
88df930be7Sderaadt u00 = -7.3804296553e-02, /* 0xbd9726b5 */
89df930be7Sderaadt u01 = 1.7666645348e-01, /* 0x3e34e80d */
90df930be7Sderaadt u02 = -1.3818567619e-02, /* 0xbc626746 */
91df930be7Sderaadt u03 = 3.4745343146e-04, /* 0x39b62a69 */
92df930be7Sderaadt u04 = -3.8140706238e-06, /* 0xb67ff53c */
93df930be7Sderaadt u05 = 1.9559013964e-08, /* 0x32a802ba */
94df930be7Sderaadt u06 = -3.9820518410e-11, /* 0xae2f21eb */
95df930be7Sderaadt v01 = 1.2730483897e-02, /* 0x3c509385 */
96df930be7Sderaadt v02 = 7.6006865129e-05, /* 0x389f65e0 */
97df930be7Sderaadt v03 = 2.5915085189e-07, /* 0x348b216c */
98df930be7Sderaadt v04 = 4.4111031494e-10; /* 0x2ff280c2 */
99df930be7Sderaadt
100e7beb4a7Smillert float
y0f(float x)1017b36286aSmartynas y0f(float x)
102df930be7Sderaadt {
103df930be7Sderaadt float z, s,c,ss,cc,u,v;
104df930be7Sderaadt int32_t hx,ix;
105df930be7Sderaadt
106df930be7Sderaadt GET_FLOAT_WORD(hx,x);
107df930be7Sderaadt ix = 0x7fffffff&hx;
108df930be7Sderaadt /* Y0(NaN) is NaN, y0(-inf) is Nan, y0(inf) is 0 */
109df930be7Sderaadt if(ix>=0x7f800000) return one/(x+x*x);
110df930be7Sderaadt if(ix==0) return -one/zero;
111df930be7Sderaadt if(hx<0) return zero/zero;
112df930be7Sderaadt if(ix >= 0x40000000) { /* |x| >= 2.0 */
113df930be7Sderaadt /* y0(x) = sqrt(2/(pi*x))*(p0(x)*sin(x0)+q0(x)*cos(x0))
114df930be7Sderaadt * where x0 = x-pi/4
115df930be7Sderaadt * Better formula:
116df930be7Sderaadt * cos(x0) = cos(x)cos(pi/4)+sin(x)sin(pi/4)
117df930be7Sderaadt * = 1/sqrt(2) * (sin(x) + cos(x))
118df930be7Sderaadt * sin(x0) = sin(x)cos(3pi/4)-cos(x)sin(3pi/4)
119df930be7Sderaadt * = 1/sqrt(2) * (sin(x) - cos(x))
120df930be7Sderaadt * To avoid cancellation, use
121df930be7Sderaadt * sin(x) +- cos(x) = -cos(2x)/(sin(x) -+ cos(x))
122df930be7Sderaadt * to compute the worse one.
123df930be7Sderaadt */
124df930be7Sderaadt s = sinf(x);
125df930be7Sderaadt c = cosf(x);
126df930be7Sderaadt ss = s-c;
127df930be7Sderaadt cc = s+c;
128df930be7Sderaadt /*
129df930be7Sderaadt * j0(x) = 1/sqrt(pi) * (P(0,x)*cc - Q(0,x)*ss) / sqrt(x)
130df930be7Sderaadt * y0(x) = 1/sqrt(pi) * (P(0,x)*ss + Q(0,x)*cc) / sqrt(x)
131df930be7Sderaadt */
132df930be7Sderaadt if(ix<0x7f000000) { /* make sure x+x not overflow */
133df930be7Sderaadt z = -cosf(x+x);
134df930be7Sderaadt if ((s*c)<zero) cc = z/ss;
135df930be7Sderaadt else ss = z/cc;
136df930be7Sderaadt }
137ed994b09Sotto if(ix>0x80000000U) z = (invsqrtpi*ss)/sqrtf(x);
138df930be7Sderaadt else {
139df930be7Sderaadt u = pzerof(x); v = qzerof(x);
140df930be7Sderaadt z = invsqrtpi*(u*ss+v*cc)/sqrtf(x);
141df930be7Sderaadt }
142df930be7Sderaadt return z;
143df930be7Sderaadt }
144df930be7Sderaadt if(ix<=0x32000000) { /* x < 2**-27 */
1457b36286aSmartynas return(u00 + tpi*logf(x));
146df930be7Sderaadt }
147df930be7Sderaadt z = x*x;
148df930be7Sderaadt u = u00+z*(u01+z*(u02+z*(u03+z*(u04+z*(u05+z*u06)))));
149df930be7Sderaadt v = one+z*(v01+z*(v02+z*(v03+z*v04)));
1507b36286aSmartynas return(u/v + tpi*(j0f(x)*logf(x)));
151df930be7Sderaadt }
152*2f2c0062Sguenther DEF_NONSTD(y0f);
153df930be7Sderaadt
154df930be7Sderaadt /* The asymptotic expansions of pzero is
155df930be7Sderaadt * 1 - 9/128 s^2 + 11025/98304 s^4 - ..., where s = 1/x.
156df930be7Sderaadt * For x >= 2, We approximate pzero by
157df930be7Sderaadt * pzero(x) = 1 + (R/S)
158df930be7Sderaadt * where R = pR0 + pR1*s^2 + pR2*s^4 + ... + pR5*s^10
159df930be7Sderaadt * S = 1 + pS0*s^2 + ... + pS4*s^10
160df930be7Sderaadt * and
161df930be7Sderaadt * | pzero(x)-1-R/S | <= 2 ** ( -60.26)
162df930be7Sderaadt */
163df930be7Sderaadt static const float pR8[6] = { /* for x in [inf, 8]=1/[0,0.125] */
164df930be7Sderaadt 0.0000000000e+00, /* 0x00000000 */
165df930be7Sderaadt -7.0312500000e-02, /* 0xbd900000 */
166df930be7Sderaadt -8.0816707611e+00, /* 0xc1014e86 */
167df930be7Sderaadt -2.5706311035e+02, /* 0xc3808814 */
168df930be7Sderaadt -2.4852163086e+03, /* 0xc51b5376 */
169df930be7Sderaadt -5.2530439453e+03, /* 0xc5a4285a */
170df930be7Sderaadt };
171df930be7Sderaadt static const float pS8[5] = {
172df930be7Sderaadt 1.1653436279e+02, /* 0x42e91198 */
173df930be7Sderaadt 3.8337448730e+03, /* 0x456f9beb */
174df930be7Sderaadt 4.0597855469e+04, /* 0x471e95db */
175df930be7Sderaadt 1.1675296875e+05, /* 0x47e4087c */
176df930be7Sderaadt 4.7627726562e+04, /* 0x473a0bba */
177df930be7Sderaadt };
178df930be7Sderaadt static const float pR5[6] = { /* for x in [8,4.5454]=1/[0.125,0.22001] */
179df930be7Sderaadt -1.1412546255e-11, /* 0xad48c58a */
180df930be7Sderaadt -7.0312492549e-02, /* 0xbd8fffff */
181df930be7Sderaadt -4.1596107483e+00, /* 0xc0851b88 */
182df930be7Sderaadt -6.7674766541e+01, /* 0xc287597b */
183df930be7Sderaadt -3.3123129272e+02, /* 0xc3a59d9b */
184df930be7Sderaadt -3.4643338013e+02, /* 0xc3ad3779 */
185df930be7Sderaadt };
186df930be7Sderaadt static const float pS5[5] = {
187df930be7Sderaadt 6.0753936768e+01, /* 0x42730408 */
188df930be7Sderaadt 1.0512523193e+03, /* 0x44836813 */
189df930be7Sderaadt 5.9789707031e+03, /* 0x45bad7c4 */
190df930be7Sderaadt 9.6254453125e+03, /* 0x461665c8 */
191df930be7Sderaadt 2.4060581055e+03, /* 0x451660ee */
192df930be7Sderaadt };
193df930be7Sderaadt
194df930be7Sderaadt static const float pR3[6] = {/* for x in [4.547,2.8571]=1/[0.2199,0.35001] */
195df930be7Sderaadt -2.5470459075e-09, /* 0xb12f081b */
196df930be7Sderaadt -7.0311963558e-02, /* 0xbd8fffb8 */
197df930be7Sderaadt -2.4090321064e+00, /* 0xc01a2d95 */
198df930be7Sderaadt -2.1965976715e+01, /* 0xc1afba52 */
199df930be7Sderaadt -5.8079170227e+01, /* 0xc2685112 */
200df930be7Sderaadt -3.1447946548e+01, /* 0xc1fb9565 */
201df930be7Sderaadt };
202df930be7Sderaadt static const float pS3[5] = {
203df930be7Sderaadt 3.5856033325e+01, /* 0x420f6c94 */
204df930be7Sderaadt 3.6151397705e+02, /* 0x43b4c1ca */
205df930be7Sderaadt 1.1936077881e+03, /* 0x44953373 */
206df930be7Sderaadt 1.1279968262e+03, /* 0x448cffe6 */
207df930be7Sderaadt 1.7358093262e+02, /* 0x432d94b8 */
208df930be7Sderaadt };
209df930be7Sderaadt
210df930be7Sderaadt static const float pR2[6] = {/* for x in [2.8570,2]=1/[0.3499,0.5] */
211df930be7Sderaadt -8.8753431271e-08, /* 0xb3be98b7 */
212df930be7Sderaadt -7.0303097367e-02, /* 0xbd8ffb12 */
213df930be7Sderaadt -1.4507384300e+00, /* 0xbfb9b1cc */
214df930be7Sderaadt -7.6356959343e+00, /* 0xc0f4579f */
215df930be7Sderaadt -1.1193166733e+01, /* 0xc1331736 */
216df930be7Sderaadt -3.2336456776e+00, /* 0xc04ef40d */
217df930be7Sderaadt };
218df930be7Sderaadt static const float pS2[5] = {
219df930be7Sderaadt 2.2220300674e+01, /* 0x41b1c32d */
220df930be7Sderaadt 1.3620678711e+02, /* 0x430834f0 */
221df930be7Sderaadt 2.7047027588e+02, /* 0x43873c32 */
222df930be7Sderaadt 1.5387539673e+02, /* 0x4319e01a */
223df930be7Sderaadt 1.4657617569e+01, /* 0x416a859a */
224df930be7Sderaadt };
225df930be7Sderaadt
226e7beb4a7Smillert static float
pzerof(float x)227e7beb4a7Smillert pzerof(float x)
228df930be7Sderaadt {
229df930be7Sderaadt const float *p,*q;
230df930be7Sderaadt float z,r,s;
231df930be7Sderaadt int32_t ix;
232df930be7Sderaadt GET_FLOAT_WORD(ix,x);
233df930be7Sderaadt ix &= 0x7fffffff;
234df930be7Sderaadt if(ix>=0x41000000) {p = pR8; q= pS8;}
235df930be7Sderaadt else if(ix>=0x40f71c58){p = pR5; q= pS5;}
236df930be7Sderaadt else if(ix>=0x4036db68){p = pR3; q= pS3;}
237df930be7Sderaadt else if(ix>=0x40000000){p = pR2; q= pS2;}
238df930be7Sderaadt z = one/(x*x);
239df930be7Sderaadt r = p[0]+z*(p[1]+z*(p[2]+z*(p[3]+z*(p[4]+z*p[5]))));
240df930be7Sderaadt s = one+z*(q[0]+z*(q[1]+z*(q[2]+z*(q[3]+z*q[4]))));
241df930be7Sderaadt return one+ r/s;
242df930be7Sderaadt }
243df930be7Sderaadt
244df930be7Sderaadt
245df930be7Sderaadt /* For x >= 8, the asymptotic expansions of qzero is
246df930be7Sderaadt * -1/8 s + 75/1024 s^3 - ..., where s = 1/x.
247df930be7Sderaadt * We approximate pzero by
248df930be7Sderaadt * qzero(x) = s*(-1.25 + (R/S))
249df930be7Sderaadt * where R = qR0 + qR1*s^2 + qR2*s^4 + ... + qR5*s^10
250df930be7Sderaadt * S = 1 + qS0*s^2 + ... + qS5*s^12
251df930be7Sderaadt * and
252df930be7Sderaadt * | qzero(x)/s +1.25-R/S | <= 2 ** ( -61.22)
253df930be7Sderaadt */
254df930be7Sderaadt static const float qR8[6] = { /* for x in [inf, 8]=1/[0,0.125] */
255df930be7Sderaadt 0.0000000000e+00, /* 0x00000000 */
256df930be7Sderaadt 7.3242187500e-02, /* 0x3d960000 */
257df930be7Sderaadt 1.1768206596e+01, /* 0x413c4a93 */
258df930be7Sderaadt 5.5767340088e+02, /* 0x440b6b19 */
259df930be7Sderaadt 8.8591972656e+03, /* 0x460a6cca */
260df930be7Sderaadt 3.7014625000e+04, /* 0x471096a0 */
261df930be7Sderaadt };
262df930be7Sderaadt static const float qS8[6] = {
263df930be7Sderaadt 1.6377603149e+02, /* 0x4323c6aa */
264df930be7Sderaadt 8.0983447266e+03, /* 0x45fd12c2 */
265df930be7Sderaadt 1.4253829688e+05, /* 0x480b3293 */
266df930be7Sderaadt 8.0330925000e+05, /* 0x49441ed4 */
267df930be7Sderaadt 8.4050156250e+05, /* 0x494d3359 */
268df930be7Sderaadt -3.4389928125e+05, /* 0xc8a7eb69 */
269df930be7Sderaadt };
270df930be7Sderaadt
271df930be7Sderaadt static const float qR5[6] = { /* for x in [8,4.5454]=1/[0.125,0.22001] */
272df930be7Sderaadt 1.8408595828e-11, /* 0x2da1ec79 */
273df930be7Sderaadt 7.3242180049e-02, /* 0x3d95ffff */
274df930be7Sderaadt 5.8356351852e+00, /* 0x40babd86 */
275df930be7Sderaadt 1.3511157227e+02, /* 0x43071c90 */
276df930be7Sderaadt 1.0272437744e+03, /* 0x448067cd */
277df930be7Sderaadt 1.9899779053e+03, /* 0x44f8bf4b */
278df930be7Sderaadt };
279df930be7Sderaadt static const float qS5[6] = {
280df930be7Sderaadt 8.2776611328e+01, /* 0x42a58da0 */
281df930be7Sderaadt 2.0778142090e+03, /* 0x4501dd07 */
282df930be7Sderaadt 1.8847289062e+04, /* 0x46933e94 */
283df930be7Sderaadt 5.6751113281e+04, /* 0x475daf1d */
284df930be7Sderaadt 3.5976753906e+04, /* 0x470c88c1 */
285df930be7Sderaadt -5.3543427734e+03, /* 0xc5a752be */
286df930be7Sderaadt };
287df930be7Sderaadt
288df930be7Sderaadt static const float qR3[6] = {/* for x in [4.547,2.8571]=1/[0.2199,0.35001] */
289df930be7Sderaadt 4.3774099900e-09, /* 0x3196681b */
290df930be7Sderaadt 7.3241114616e-02, /* 0x3d95ff70 */
291df930be7Sderaadt 3.3442313671e+00, /* 0x405607e3 */
292df930be7Sderaadt 4.2621845245e+01, /* 0x422a7cc5 */
293df930be7Sderaadt 1.7080809021e+02, /* 0x432acedf */
294df930be7Sderaadt 1.6673394775e+02, /* 0x4326bbe4 */
295df930be7Sderaadt };
296df930be7Sderaadt static const float qS3[6] = {
297df930be7Sderaadt 4.8758872986e+01, /* 0x42430916 */
298df930be7Sderaadt 7.0968920898e+02, /* 0x44316c1c */
299df930be7Sderaadt 3.7041481934e+03, /* 0x4567825f */
300df930be7Sderaadt 6.4604252930e+03, /* 0x45c9e367 */
301df930be7Sderaadt 2.5163337402e+03, /* 0x451d4557 */
302df930be7Sderaadt -1.4924745178e+02, /* 0xc3153f59 */
303df930be7Sderaadt };
304df930be7Sderaadt
305df930be7Sderaadt static const float qR2[6] = {/* for x in [2.8570,2]=1/[0.3499,0.5] */
306df930be7Sderaadt 1.5044444979e-07, /* 0x342189db */
307df930be7Sderaadt 7.3223426938e-02, /* 0x3d95f62a */
308df930be7Sderaadt 1.9981917143e+00, /* 0x3fffc4bf */
309df930be7Sderaadt 1.4495602608e+01, /* 0x4167edfd */
310df930be7Sderaadt 3.1666231155e+01, /* 0x41fd5471 */
311df930be7Sderaadt 1.6252708435e+01, /* 0x4182058c */
312df930be7Sderaadt };
313df930be7Sderaadt static const float qS2[6] = {
314df930be7Sderaadt 3.0365585327e+01, /* 0x41f2ecb8 */
315df930be7Sderaadt 2.6934811401e+02, /* 0x4386ac8f */
316df930be7Sderaadt 8.4478375244e+02, /* 0x44533229 */
317df930be7Sderaadt 8.8293585205e+02, /* 0x445cbbe5 */
318df930be7Sderaadt 2.1266638184e+02, /* 0x4354aa98 */
319df930be7Sderaadt -5.3109550476e+00, /* 0xc0a9f358 */
320df930be7Sderaadt };
321df930be7Sderaadt
322e7beb4a7Smillert static float
qzerof(float x)323e7beb4a7Smillert qzerof(float x)
324df930be7Sderaadt {
325df930be7Sderaadt const float *p,*q;
326df930be7Sderaadt float s,r,z;
327df930be7Sderaadt int32_t ix;
328df930be7Sderaadt GET_FLOAT_WORD(ix,x);
329df930be7Sderaadt ix &= 0x7fffffff;
330df930be7Sderaadt if(ix>=0x41000000) {p = qR8; q= qS8;}
331df930be7Sderaadt else if(ix>=0x40f71c58){p = qR5; q= qS5;}
332df930be7Sderaadt else if(ix>=0x4036db68){p = qR3; q= qS3;}
333df930be7Sderaadt else if(ix>=0x40000000){p = qR2; q= qS2;}
334df930be7Sderaadt z = one/(x*x);
335df930be7Sderaadt r = p[0]+z*(p[1]+z*(p[2]+z*(p[3]+z*(p[4]+z*p[5]))));
336df930be7Sderaadt s = one+z*(q[0]+z*(q[1]+z*(q[2]+z*(q[3]+z*(q[4]+z*q[5])))));
337df930be7Sderaadt return (-(float).125 + r/s)/x;
338df930be7Sderaadt }
339