math/generic/sinf16.cpp

cd04653cSwldfngrs//===-- Half-precision sin(x) function ------------------------------------===//
cd04653cSwldfngrs//
cd04653cSwldfngrs// Part of the LLVM Project, under the Apache License v2.0 with LLVM Exceptions.
cd04653cSwldfngrs// See https://llvm.org/LICENSE.txt for license information.
cd04653cSwldfngrs// SPDX-License-Identifier: Apache-2.0 WITH LLVM-exception
cd04653cSwldfngrs//
cd04653cSwldfngrs//===----------------------------------------------------------------------===//
cd04653cSwldfngrs
cd04653cSwldfngrs#include "src/math/sinf16.h"
cd04653cSwldfngrs#include "hdr/errno_macros.h"
cd04653cSwldfngrs#include "hdr/fenv_macros.h"
cd04653cSwldfngrs#include "sincosf16_utils.h"
cd04653cSwldfngrs#include "src/__support/FPUtil/FEnvImpl.h"
cd04653cSwldfngrs#include "src/__support/FPUtil/FPBits.h"
cd04653cSwldfngrs#include "src/__support/FPUtil/cast.h"
cd04653cSwldfngrs#include "src/__support/FPUtil/except_value_utils.h"
cd04653cSwldfngrs#include "src/__support/FPUtil/multiply_add.h"
cd04653cSwldfngrs#include "src/__support/macros/optimization.h"
cd04653cSwldfngrs
cd04653cSwldfngrsnamespace LIBC_NAMESPACE_DECL {
cd04653cSwldfngrs
cd04653cSwldfngrsconstexpr size_t N_EXCEPTS = 4;
cd04653cSwldfngrs
cd04653cSwldfngrsconstexpr fputil::ExceptValues<float16, N_EXCEPTS> SINF16_EXCEPTS{{
cd04653cSwldfngrs    // (input, RZ output, RU offset, RD offset, RN offset)
cd04653cSwldfngrs    {0x2b45, 0x2b43, 1, 0, 1},
cd04653cSwldfngrs    {0x585c, 0x3ba3, 1, 0, 1},
cd04653cSwldfngrs    {0x5cb0, 0xbbff, 0, 1, 0},
cd04653cSwldfngrs    {0x51f5, 0xb80f, 0, 1, 0},
cd04653cSwldfngrs}};
cd04653cSwldfngrs
cd04653cSwldfngrsLLVM_LIBC_FUNCTION(float16, sinf16, (float16 x)) {
cd04653cSwldfngrs  using FPBits = fputil::FPBits<float16>;
cd04653cSwldfngrs  FPBits xbits(x);
cd04653cSwldfngrs
cd04653cSwldfngrs  uint16_t x_u = xbits.uintval();
cd04653cSwldfngrs  uint16_t x_abs = x_u & 0x7fff;
cd04653cSwldfngrs  float xf = x;
cd04653cSwldfngrs
cd04653cSwldfngrs  // Range reduction:
cd04653cSwldfngrs  // For |x| > pi/32, we perform range reduction as follows:
cd04653cSwldfngrs  // Find k and y such that:
cd04653cSwldfngrs  //   x = (k + y) * pi/32
cd04653cSwldfngrs  //   k is an integer, |y| < 0.5
cd04653cSwldfngrs  //
cd04653cSwldfngrs  // This is done by performing:
cd04653cSwldfngrs  //   k = round(x * 32/pi)
cd04653cSwldfngrs  //   y = x * 32/pi - k
cd04653cSwldfngrs  //
cd04653cSwldfngrs  // Once k and y are computed, we then deduce the answer by the sine of sum
cd04653cSwldfngrs  // formula:
cd04653cSwldfngrs  //   sin(x) = sin((k + y) * pi/32)
cd04653cSwldfngrs  //   	      = sin(k * pi/32) * cos(y * pi/32) +
cd04653cSwldfngrs  //   	        sin(y * pi/32) * cos(k * pi/32)
cd04653cSwldfngrs
cd04653cSwldfngrs  // Handle exceptional values
cd04653cSwldfngrs  bool x_sign = x_u >> 15;
cd04653cSwldfngrs  if (auto r = SINF16_EXCEPTS.lookup_odd(x_abs, x_sign);
cd04653cSwldfngrs      LIBC_UNLIKELY(r.has_value()))
cd04653cSwldfngrs    return r.value();
cd04653cSwldfngrs
cd04653cSwldfngrs  int rounding = fputil::quick_get_round();
cd04653cSwldfngrs
cd04653cSwldfngrs  // Exhaustive tests show that for |x| <= 0x1.f4p-11, 1ULP rounding errors
cd04653cSwldfngrs  // occur. To fix this, the following apply:
cd04653cSwldfngrs  if (LIBC_UNLIKELY(x_abs <= 0x13d0)) {
cd04653cSwldfngrs    // sin(+/-0) = +/-0
cd04653cSwldfngrs    if (LIBC_UNLIKELY(x_abs == 0U))
cd04653cSwldfngrs      return x;
cd04653cSwldfngrs
cd04653cSwldfngrs    // When x > 0, and rounding upward, sin(x) == x.
cd04653cSwldfngrs    // When x < 0, and rounding downward, sin(x) == x.
cd04653cSwldfngrs    if ((rounding == FE_UPWARD && xbits.is_pos()) ||
cd04653cSwldfngrs        (rounding == FE_DOWNWARD && xbits.is_neg()))
cd04653cSwldfngrs      return x;
cd04653cSwldfngrs
cd04653cSwldfngrs    // When x < 0, and rounding upward, sin(x) == (x - 1ULP)
cd04653cSwldfngrs    if (rounding == FE_UPWARD && xbits.is_neg()) {
cd04653cSwldfngrs      x_u--;
cd04653cSwldfngrs      return FPBits(x_u).get_val();
cd04653cSwldfngrs    }
cd04653cSwldfngrs  }
cd04653cSwldfngrs
cd04653cSwldfngrs  if (xbits.is_inf_or_nan()) {
cd04653cSwldfngrs    if (xbits.is_inf()) {
cd04653cSwldfngrs      fputil::set_errno_if_required(EDOM);
cd04653cSwldfngrs      fputil::raise_except_if_required(FE_INVALID);
cd04653cSwldfngrs    }
cd04653cSwldfngrs
cd04653cSwldfngrs    return x + FPBits::quiet_nan().get_val();
cd04653cSwldfngrs  }
cd04653cSwldfngrs
cd04653cSwldfngrs  float sin_k, cos_k, sin_y, cosm1_y;
cd04653cSwldfngrs  sincosf16_eval(xf, sin_k, cos_k, sin_y, cosm1_y);
cd04653cSwldfngrs
cd04653cSwldfngrs  if (LIBC_UNLIKELY(sin_y == 0 && sin_k == 0))
cd04653cSwldfngrs    return FPBits::zero(xbits.sign()).get_val();
cd04653cSwldfngrs
*6a865b6dSwldfngrs  // Since, cosm1_y = cos_y - 1, therefore:
cd04653cSwldfngrs  //   sin(x) = cos_k * sin_y + sin_k + (cosm1_y * sin_k)
cd04653cSwldfngrs  return fputil::cast<float16>(fputil::multiply_add(
cd04653cSwldfngrs      sin_y, cos_k, fputil::multiply_add(cosm1_y, sin_k, sin_k)));
cd04653cSwldfngrs}
cd04653cSwldfngrs
cd04653cSwldfngrs} // namespace LIBC_NAMESPACE_DECL