aarch64/experimental/tanf_3u3.c

*f3087befSAndrew Turner/*
*f3087befSAndrew Turner * Single-precision scalar tan(x) function.
*f3087befSAndrew Turner *
*f3087befSAndrew Turner * Copyright (c) 2021-2024, Arm Limited.
*f3087befSAndrew Turner * SPDX-License-Identifier: MIT OR Apache-2.0 WITH LLVM-exception
*f3087befSAndrew Turner */
*f3087befSAndrew Turner#include "math_config.h"
*f3087befSAndrew Turner#include "test_sig.h"
*f3087befSAndrew Turner#include "test_defs.h"
*f3087befSAndrew Turner#include "poly_scalar_f32.h"
*f3087befSAndrew Turner
*f3087befSAndrew Turner/* Useful constants.  */
*f3087befSAndrew Turner#define NegPio2_1 (-0x1.921fb6p+0f)
*f3087befSAndrew Turner#define NegPio2_2 (0x1.777a5cp-25f)
*f3087befSAndrew Turner#define NegPio2_3 (0x1.ee59dap-50f)
*f3087befSAndrew Turner/* Reduced from 0x1p20 to 0x1p17 to ensure 3.5ulps.  */
*f3087befSAndrew Turner#define RangeVal (0x1p17f)
*f3087befSAndrew Turner#define InvPio2 ((0x1.45f306p-1f))
*f3087befSAndrew Turner#define Shift (0x1.8p+23f)
*f3087befSAndrew Turner#define AbsMask (0x7fffffff)
*f3087befSAndrew Turner#define Pio4 (0x1.921fb6p-1)
*f3087befSAndrew Turner/* 2PI * 2^-64.  */
*f3087befSAndrew Turner#define Pio2p63 (0x1.921FB54442D18p-62)
*f3087befSAndrew Turner
*f3087befSAndrew Turnerstatic inline float
*f3087befSAndrew Turnereval_P (float z)
*f3087befSAndrew Turner{
*f3087befSAndrew Turner  return pw_horner_5_f32 (z, z * z, __tanf_poly_data.poly_tan);
*f3087befSAndrew Turner}
*f3087befSAndrew Turner
*f3087befSAndrew Turnerstatic inline float
*f3087befSAndrew Turnereval_Q (float z)
*f3087befSAndrew Turner{
*f3087befSAndrew Turner  return pairwise_poly_3_f32 (z, z * z, __tanf_poly_data.poly_cotan);
*f3087befSAndrew Turner}
*f3087befSAndrew Turner
*f3087befSAndrew Turner/* Reduction of the input argument x using Cody-Waite approach, such that x = r
*f3087befSAndrew Turner   + n * pi/2 with r lives in [-pi/4, pi/4] and n is a signed integer.  */
*f3087befSAndrew Turnerstatic inline float
*f3087befSAndrew Turnerreduce (float x, int32_t *in)
*f3087befSAndrew Turner{
*f3087befSAndrew Turner  /* n = rint(x/(pi/2)).  */
*f3087befSAndrew Turner  float r = x;
*f3087befSAndrew Turner  float q = fmaf (InvPio2, r, Shift);
*f3087befSAndrew Turner  float n = q - Shift;
*f3087befSAndrew Turner  /* There is no rounding here, n is representable by a signed integer.  */
*f3087befSAndrew Turner  *in = (int32_t) n;
*f3087befSAndrew Turner  /* r = x - n * (pi/2)  (range reduction into -pi/4 .. pi/4).  */
*f3087befSAndrew Turner  r = fmaf (NegPio2_1, n, r);
*f3087befSAndrew Turner  r = fmaf (NegPio2_2, n, r);
*f3087befSAndrew Turner  r = fmaf (NegPio2_3, n, r);
*f3087befSAndrew Turner  return r;
*f3087befSAndrew Turner}
*f3087befSAndrew Turner
*f3087befSAndrew Turner/* Reduce the range of XI to a multiple of PI/2 using fast integer arithmetic.
*f3087befSAndrew Turner   XI is a reinterpreted float and must be >= 2.0f (the sign bit is ignored).
*f3087befSAndrew Turner   Return the modulo between -PI/4 and PI/4 and store the quadrant in NP.
*f3087befSAndrew Turner   Reduction uses a table of 4/PI with 192 bits of precision.  A 32x96->128 bit
*f3087befSAndrew Turner   multiply computes the exact 2.62-bit fixed-point modulo.  Since the result
*f3087befSAndrew Turner   can have at most 29 leading zeros after the binary point, the double
*f3087befSAndrew Turner   precision result is accurate to 33 bits.  */
*f3087befSAndrew Turnerstatic inline double
*f3087befSAndrew Turnerreduce_large (uint32_t xi, int *np)
*f3087befSAndrew Turner{
*f3087befSAndrew Turner  const uint32_t *arr = &__inv_pio4[(xi >> 26) & 15];
*f3087befSAndrew Turner  int shift = (xi >> 23) & 7;
*f3087befSAndrew Turner  uint64_t n, res0, res1, res2;
*f3087befSAndrew Turner
*f3087befSAndrew Turner  xi = (xi & 0xffffff) | 0x800000;
*f3087befSAndrew Turner  xi <<= shift;
*f3087befSAndrew Turner
*f3087befSAndrew Turner  res0 = xi * arr[0];
*f3087befSAndrew Turner  res1 = (uint64_t) xi * arr[4];
*f3087befSAndrew Turner  res2 = (uint64_t) xi * arr[8];
*f3087befSAndrew Turner  res0 = (res2 >> 32) | (res0 << 32);
*f3087befSAndrew Turner  res0 += res1;
*f3087befSAndrew Turner
*f3087befSAndrew Turner  n = (res0 + (1ULL << 61)) >> 62;
*f3087befSAndrew Turner  res0 -= n << 62;
*f3087befSAndrew Turner  double x = (int64_t) res0;
*f3087befSAndrew Turner  *np = n;
*f3087befSAndrew Turner  return x * Pio2p63;
*f3087befSAndrew Turner}
*f3087befSAndrew Turner
*f3087befSAndrew Turner/* Top 12 bits of the float representation with the sign bit cleared.  */
*f3087befSAndrew Turnerstatic inline uint32_t
*f3087befSAndrew Turnertop12 (float x)
*f3087befSAndrew Turner{
*f3087befSAndrew Turner  return (asuint (x) >> 20);
*f3087befSAndrew Turner}
*f3087befSAndrew Turner
*f3087befSAndrew Turner/* Fast single-precision tan implementation.
*f3087befSAndrew Turner   Maximum ULP error: 3.293ulps.
*f3087befSAndrew Turner   tanf(0x1.c849eap+16) got -0x1.fe8d98p-1 want -0x1.fe8d9ep-1.  */
*f3087befSAndrew Turnerfloat
*f3087befSAndrew Turnertanf (float x)
*f3087befSAndrew Turner{
*f3087befSAndrew Turner  /* Get top words.  */
*f3087befSAndrew Turner  uint32_t ix = asuint (x);
*f3087befSAndrew Turner  uint32_t ia = ix & AbsMask;
*f3087befSAndrew Turner  uint32_t ia12 = ia >> 20;
*f3087befSAndrew Turner
*f3087befSAndrew Turner  /* Dispatch between no reduction (small numbers), fast reduction and
*f3087befSAndrew Turner     slow large numbers reduction. The reduction step determines r float
*f3087befSAndrew Turner     (|r| < pi/4) and n signed integer such that x = r + n * pi/2.  */
*f3087befSAndrew Turner  int32_t n;
*f3087befSAndrew Turner  float r;
*f3087befSAndrew Turner  if (ia12 < top12 (Pio4))
*f3087befSAndrew Turner    {
*f3087befSAndrew Turner      /* Optimize small values.  */
*f3087befSAndrew Turner      if (unlikely (ia12 < top12 (0x1p-12f)))
*f3087befSAndrew Turner	{
*f3087befSAndrew Turner	  if (unlikely (ia12 < top12 (0x1p-126f)))
*f3087befSAndrew Turner	    /* Force underflow for tiny x.  */
*f3087befSAndrew Turner	    force_eval_float (x * x);
*f3087befSAndrew Turner	  return x;
*f3087befSAndrew Turner	}
*f3087befSAndrew Turner
*f3087befSAndrew Turner      /* tan (x) ~= x + x^3 * P(x^2).  */
*f3087befSAndrew Turner      float x2 = x * x;
*f3087befSAndrew Turner      float y = eval_P (x2);
*f3087befSAndrew Turner      return fmaf (x2, x * y, x);
*f3087befSAndrew Turner    }
*f3087befSAndrew Turner  /* Similar to other trigonometric routines, fast inaccurate reduction is
*f3087befSAndrew Turner     performed for values of x from pi/4 up to RangeVal. In order to keep
*f3087befSAndrew Turner     errors below 3.5ulps, we set the value of RangeVal to 2^17. This might
*f3087befSAndrew Turner     differ for other trigonometric routines. Above this value more advanced
*f3087befSAndrew Turner     but slower reduction techniques need to be implemented to reach a similar
*f3087befSAndrew Turner     accuracy.  */
*f3087befSAndrew Turner  else if (ia12 < top12 (RangeVal))
*f3087befSAndrew Turner    {
*f3087befSAndrew Turner      /* Fast inaccurate reduction.  */
*f3087befSAndrew Turner      r = reduce (x, &n);
*f3087befSAndrew Turner    }
*f3087befSAndrew Turner  else if (ia12 < 0x7f8)
*f3087befSAndrew Turner    {
*f3087befSAndrew Turner      /* Slow accurate reduction.  */
*f3087befSAndrew Turner      uint32_t sign = ix & ~AbsMask;
*f3087befSAndrew Turner      double dar = reduce_large (ia, &n);
*f3087befSAndrew Turner      float ar = (float) dar;
*f3087befSAndrew Turner      r = asfloat (asuint (ar) ^ sign);
*f3087befSAndrew Turner    }
*f3087befSAndrew Turner  else
*f3087befSAndrew Turner    {
*f3087befSAndrew Turner      /* tan(Inf or NaN) is NaN.  */
*f3087befSAndrew Turner      return __math_invalidf (x);
*f3087befSAndrew Turner    }
*f3087befSAndrew Turner
*f3087befSAndrew Turner  /* If x lives in an interval where |tan(x)|
*f3087befSAndrew Turner     - is finite then use an approximation of tangent in the form
*f3087befSAndrew Turner       tan(r) ~ r + r^3 * P(r^2) = r + r * r^2 * P(r^2).
*f3087befSAndrew Turner     - grows to infinity then use an approximation of cotangent in the form
*f3087befSAndrew Turner       cotan(z) ~ 1/z + z * Q(z^2), where the reciprocal can be computed early.
*f3087befSAndrew Turner       Using symmetries of tangent and the identity tan(r) = cotan(pi/2 - r),
*f3087befSAndrew Turner       we only need to change the sign of r to obtain tan(x) from cotan(r).
*f3087befSAndrew Turner     This 2-interval approach requires 2 different sets of coefficients P and
*f3087befSAndrew Turner     Q, where Q is a lower order polynomial than P.  */
*f3087befSAndrew Turner
*f3087befSAndrew Turner  /* Determine if x lives in an interval where |tan(x)| grows to infinity.  */
*f3087befSAndrew Turner  uint32_t alt = (uint32_t) n & 1;
*f3087befSAndrew Turner
*f3087befSAndrew Turner  /* Perform additional reduction if required.  */
*f3087befSAndrew Turner  float z = alt ? -r : r;
*f3087befSAndrew Turner
*f3087befSAndrew Turner  /* Prepare backward transformation.  */
*f3087befSAndrew Turner  float z2 = r * r;
*f3087befSAndrew Turner  float offset = alt ? 1.0f / z : z;
*f3087befSAndrew Turner  float scale = alt ? z : z * z2;
*f3087befSAndrew Turner
*f3087befSAndrew Turner  /* Evaluate polynomial approximation of tan or cotan.  */
*f3087befSAndrew Turner  float p = alt ? eval_Q (z2) : eval_P (z2);
*f3087befSAndrew Turner
*f3087befSAndrew Turner  /* A unified way of assembling the result on both interval types.  */
*f3087befSAndrew Turner  return fmaf (scale, p, offset);
*f3087befSAndrew Turner}
*f3087befSAndrew Turner
*f3087befSAndrew TurnerTEST_SIG (S, F, 1, tan, -3.1, 3.1)
*f3087befSAndrew TurnerTEST_ULP (tanf, 2.80)
*f3087befSAndrew TurnerTEST_INTERVAL (tanf, 0, 0xffff0000, 10000)
*f3087befSAndrew TurnerTEST_SYM_INTERVAL (tanf, 0x1p-127, 0x1p-14, 50000)
*f3087befSAndrew TurnerTEST_SYM_INTERVAL (tanf, 0x1p-14, 0.7, 50000)
*f3087befSAndrew TurnerTEST_SYM_INTERVAL (tanf, 0.7, 1.5, 50000)
*f3087befSAndrew TurnerTEST_SYM_INTERVAL (tanf, 1.5, 0x1p17, 50000)
*f3087befSAndrew TurnerTEST_SYM_INTERVAL (tanf, 0x1p17, 0x1p54, 50000)
*f3087befSAndrew TurnerTEST_SYM_INTERVAL (tanf, 0x1p54, inf, 50000)