config/tilepro/softdivide.c

48fb7bfaSmrg/* Division and remainder routines for Tile.
*b1e83836Smrg   Copyright (C) 2011-2022 Free Software Foundation, Inc.
48fb7bfaSmrg   Contributed by Walter Lee (walt@tilera.com)
48fb7bfaSmrg
48fb7bfaSmrg   This file is free software; you can redistribute it and/or modify it
48fb7bfaSmrg   under the terms of the GNU General Public License as published by the
48fb7bfaSmrg   Free Software Foundation; either version 3, or (at your option) any
48fb7bfaSmrg   later version.
48fb7bfaSmrg
48fb7bfaSmrg   This file is distributed in the hope that it will be useful, but
48fb7bfaSmrg   WITHOUT ANY WARRANTY; without even the implied warranty of
48fb7bfaSmrg   MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
48fb7bfaSmrg   General Public License for more details.
48fb7bfaSmrg
48fb7bfaSmrg   Under Section 7 of GPL version 3, you are granted additional
48fb7bfaSmrg   permissions described in the GCC Runtime Library Exception, version
48fb7bfaSmrg   3.1, as published by the Free Software Foundation.
48fb7bfaSmrg
48fb7bfaSmrg   You should have received a copy of the GNU General Public License and
48fb7bfaSmrg   a copy of the GCC Runtime Library Exception along with this program;
48fb7bfaSmrg   see the files COPYING3 and COPYING.RUNTIME respectively.  If not, see
48fb7bfaSmrg   <http://www.gnu.org/licenses/>.  */
48fb7bfaSmrg
48fb7bfaSmrgtypedef int int32_t;
48fb7bfaSmrgtypedef unsigned uint32_t;
48fb7bfaSmrgtypedef long long int64_t;
48fb7bfaSmrgtypedef unsigned long long uint64_t;
48fb7bfaSmrg
48fb7bfaSmrg/* Raise signal 8 (SIGFPE) with code 1 (FPE_INTDIV).  */
48fb7bfaSmrgstatic inline void
48fb7bfaSmrgraise_intdiv (void)
48fb7bfaSmrg{
48fb7bfaSmrg  asm ("{ raise; moveli zero, 8 + (1 << 6) }");
48fb7bfaSmrg}
48fb7bfaSmrg
48fb7bfaSmrg
48fb7bfaSmrg#ifndef __tilegx__
48fb7bfaSmrg/*__udivsi3 - 32 bit integer unsigned divide  */
48fb7bfaSmrgstatic inline uint32_t __attribute__ ((always_inline))
48fb7bfaSmrg__udivsi3_inline (uint32_t dividend, uint32_t divisor)
48fb7bfaSmrg{
48fb7bfaSmrg  /* Divide out any power of two factor from dividend and divisor.
48fb7bfaSmrg     Note that when dividing by zero the divisor will remain zero,
48fb7bfaSmrg     which is all we need to detect that case below.  */
48fb7bfaSmrg  const int power_of_two_factor = __insn_ctz (divisor);
48fb7bfaSmrg  divisor >>= power_of_two_factor;
48fb7bfaSmrg  dividend >>= power_of_two_factor;
48fb7bfaSmrg
48fb7bfaSmrg  /* Checks for division by power of two or division by zero.  */
48fb7bfaSmrg  if (divisor <= 1)
48fb7bfaSmrg    {
48fb7bfaSmrg      if (divisor == 0)
48fb7bfaSmrg	{
48fb7bfaSmrg	  raise_intdiv ();
48fb7bfaSmrg	  return 0;
48fb7bfaSmrg	}
48fb7bfaSmrg      return dividend;
48fb7bfaSmrg    }
48fb7bfaSmrg
48fb7bfaSmrg  /* Compute (a / b) by repeatedly finding the largest N
48fb7bfaSmrg     such that (b << N) <= a. For each such N, set bit N in the
48fb7bfaSmrg     quotient, subtract (b << N) from a, and keep going. Think of this as
48fb7bfaSmrg     the reverse of the "shift-and-add" that a multiply does. The values
48fb7bfaSmrg     of N are precisely those shift counts.
48fb7bfaSmrg
48fb7bfaSmrg     Finding N is easy. First, use clz(b) - clz(a) to find the N
48fb7bfaSmrg     that lines up the high bit of (b << N) with the high bit of a.
48fb7bfaSmrg     Any larger value of N would definitely make (b << N) > a,
48fb7bfaSmrg     which is too big.
48fb7bfaSmrg
48fb7bfaSmrg     Then, if (b << N) > a (because it has larger low bits), decrement
48fb7bfaSmrg     N by one.  This adjustment will definitely make (b << N) less
48fb7bfaSmrg     than a, because a's high bit is now one higher than b's.  */
48fb7bfaSmrg
48fb7bfaSmrg  /* Precomputing the max_ values allows us to avoid a subtract
48fb7bfaSmrg     in the inner loop and just right shift by clz(remainder).  */
48fb7bfaSmrg  const int divisor_clz = __insn_clz (divisor);
48fb7bfaSmrg  const uint32_t max_divisor = divisor << divisor_clz;
48fb7bfaSmrg  const uint32_t max_qbit = 1 << divisor_clz;
48fb7bfaSmrg
48fb7bfaSmrg  uint32_t quotient = 0;
48fb7bfaSmrg  uint32_t remainder = dividend;
48fb7bfaSmrg
48fb7bfaSmrg  while (remainder >= divisor)
48fb7bfaSmrg    {
48fb7bfaSmrg      int shift = __insn_clz (remainder);
48fb7bfaSmrg      uint32_t scaled_divisor = max_divisor >> shift;
48fb7bfaSmrg      uint32_t quotient_bit = max_qbit >> shift;
48fb7bfaSmrg
48fb7bfaSmrg      int too_big = (scaled_divisor > remainder);
48fb7bfaSmrg      scaled_divisor >>= too_big;
48fb7bfaSmrg      quotient_bit >>= too_big;
48fb7bfaSmrg      remainder -= scaled_divisor;
48fb7bfaSmrg      quotient |= quotient_bit;
48fb7bfaSmrg    }
48fb7bfaSmrg  return quotient;
48fb7bfaSmrg}
48fb7bfaSmrg#endif /* !__tilegx__ */
48fb7bfaSmrg
48fb7bfaSmrg
48fb7bfaSmrg/* __udivdi3 - 64 bit integer unsigned divide  */
48fb7bfaSmrgstatic inline uint64_t __attribute__ ((always_inline))
48fb7bfaSmrg__udivdi3_inline (uint64_t dividend, uint64_t divisor)
48fb7bfaSmrg{
48fb7bfaSmrg  /* Divide out any power of two factor from dividend and divisor.
48fb7bfaSmrg     Note that when dividing by zero the divisor will remain zero,
48fb7bfaSmrg     which is all we need to detect that case below.  */
48fb7bfaSmrg  const int power_of_two_factor = __builtin_ctzll (divisor);
48fb7bfaSmrg  divisor >>= power_of_two_factor;
48fb7bfaSmrg  dividend >>= power_of_two_factor;
48fb7bfaSmrg
48fb7bfaSmrg  /* Checks for division by power of two or division by zero.  */
48fb7bfaSmrg  if (divisor <= 1)
48fb7bfaSmrg    {
48fb7bfaSmrg      if (divisor == 0)
48fb7bfaSmrg	{
48fb7bfaSmrg	  raise_intdiv ();
48fb7bfaSmrg	  return 0;
48fb7bfaSmrg	}
48fb7bfaSmrg      return dividend;
48fb7bfaSmrg    }
48fb7bfaSmrg
48fb7bfaSmrg#ifndef __tilegx__
48fb7bfaSmrg  if (((uint32_t) (dividend >> 32) | ((uint32_t) (divisor >> 32))) == 0)
48fb7bfaSmrg    {
48fb7bfaSmrg      /* Operands both fit in 32 bits, so use faster 32 bit algorithm.  */
48fb7bfaSmrg      return __udivsi3_inline ((uint32_t) dividend, (uint32_t) divisor);
48fb7bfaSmrg    }
48fb7bfaSmrg#endif /* !__tilegx__ */
48fb7bfaSmrg
48fb7bfaSmrg  /* See algorithm description in __udivsi3  */
48fb7bfaSmrg
48fb7bfaSmrg  const int divisor_clz = __builtin_clzll (divisor);
48fb7bfaSmrg  const uint64_t max_divisor = divisor << divisor_clz;
48fb7bfaSmrg  const uint64_t max_qbit = 1ULL << divisor_clz;
48fb7bfaSmrg
48fb7bfaSmrg  uint64_t quotient = 0;
48fb7bfaSmrg  uint64_t remainder = dividend;
48fb7bfaSmrg
48fb7bfaSmrg  while (remainder >= divisor)
48fb7bfaSmrg    {
48fb7bfaSmrg      int shift = __builtin_clzll (remainder);
48fb7bfaSmrg      uint64_t scaled_divisor = max_divisor >> shift;
48fb7bfaSmrg      uint64_t quotient_bit = max_qbit >> shift;
48fb7bfaSmrg
48fb7bfaSmrg      int too_big = (scaled_divisor > remainder);
48fb7bfaSmrg      scaled_divisor >>= too_big;
48fb7bfaSmrg      quotient_bit >>= too_big;
48fb7bfaSmrg      remainder -= scaled_divisor;
48fb7bfaSmrg      quotient |= quotient_bit;
48fb7bfaSmrg    }
48fb7bfaSmrg  return quotient;
48fb7bfaSmrg}
48fb7bfaSmrg
48fb7bfaSmrg
48fb7bfaSmrg#ifndef __tilegx__
48fb7bfaSmrg/* __umodsi3 - 32 bit integer unsigned modulo  */
48fb7bfaSmrgstatic inline uint32_t __attribute__ ((always_inline))
48fb7bfaSmrg__umodsi3_inline (uint32_t dividend, uint32_t divisor)
48fb7bfaSmrg{
48fb7bfaSmrg  /* Shortcircuit mod by a power of two (and catch mod by zero).  */
48fb7bfaSmrg  const uint32_t mask = divisor - 1;
48fb7bfaSmrg  if ((divisor & mask) == 0)
48fb7bfaSmrg    {
48fb7bfaSmrg      if (divisor == 0)
48fb7bfaSmrg	{
48fb7bfaSmrg	  raise_intdiv ();
48fb7bfaSmrg	  return 0;
48fb7bfaSmrg	}
48fb7bfaSmrg      return dividend & mask;
48fb7bfaSmrg    }
48fb7bfaSmrg
48fb7bfaSmrg  /* We compute the remainder (a % b) by repeatedly subtracting off
48fb7bfaSmrg     multiples of b from a until a < b. The key is that subtracting
48fb7bfaSmrg     off a multiple of b does not affect the result mod b.
48fb7bfaSmrg
48fb7bfaSmrg     To make the algorithm run efficiently, we need to subtract
48fb7bfaSmrg     off a large multiple of b at each step. We subtract the largest
48fb7bfaSmrg     (b << N) that is <= a.
48fb7bfaSmrg
48fb7bfaSmrg     Finding N is easy. First, use clz(b) - clz(a) to find the N
48fb7bfaSmrg     that lines up the high bit of (b << N) with the high bit of a.
48fb7bfaSmrg     Any larger value of N would definitely make (b << N) > a,
48fb7bfaSmrg     which is too big.
48fb7bfaSmrg
48fb7bfaSmrg     Then, if (b << N) > a (because it has larger low bits), decrement
48fb7bfaSmrg     N by one.  This adjustment will definitely make (b << N) less
48fb7bfaSmrg     than a, because a's high bit is now one higher than b's.  */
48fb7bfaSmrg  const uint32_t max_divisor = divisor << __insn_clz (divisor);
48fb7bfaSmrg
48fb7bfaSmrg  uint32_t remainder = dividend;
48fb7bfaSmrg  while (remainder >= divisor)
48fb7bfaSmrg    {
48fb7bfaSmrg      const int shift = __insn_clz (remainder);
48fb7bfaSmrg      uint32_t scaled_divisor = max_divisor >> shift;
48fb7bfaSmrg      scaled_divisor >>= (scaled_divisor > remainder);
48fb7bfaSmrg      remainder -= scaled_divisor;
48fb7bfaSmrg    }
48fb7bfaSmrg
48fb7bfaSmrg  return remainder;
48fb7bfaSmrg}
48fb7bfaSmrg#endif /* !__tilegx__ */
48fb7bfaSmrg
48fb7bfaSmrg
48fb7bfaSmrg/* __umoddi3 - 64 bit integer unsigned modulo  */
48fb7bfaSmrgstatic inline uint64_t __attribute__ ((always_inline))
48fb7bfaSmrg__umoddi3_inline (uint64_t dividend, uint64_t divisor)
48fb7bfaSmrg{
48fb7bfaSmrg#ifndef __tilegx__
48fb7bfaSmrg  if (((uint32_t) (dividend >> 32) | ((uint32_t) (divisor >> 32))) == 0)
48fb7bfaSmrg    {
48fb7bfaSmrg      /* Operands both fit in 32 bits, so use faster 32 bit algorithm.  */
48fb7bfaSmrg      return __umodsi3_inline ((uint32_t) dividend, (uint32_t) divisor);
48fb7bfaSmrg    }
48fb7bfaSmrg#endif /* !__tilegx__ */
48fb7bfaSmrg
48fb7bfaSmrg  /* Shortcircuit mod by a power of two (and catch mod by zero).  */
48fb7bfaSmrg  const uint64_t mask = divisor - 1;
48fb7bfaSmrg  if ((divisor & mask) == 0)
48fb7bfaSmrg    {
48fb7bfaSmrg      if (divisor == 0)
48fb7bfaSmrg	{
48fb7bfaSmrg	  raise_intdiv ();
48fb7bfaSmrg	  return 0;
48fb7bfaSmrg	}
48fb7bfaSmrg      return dividend & mask;
48fb7bfaSmrg    }
48fb7bfaSmrg
48fb7bfaSmrg  /* See algorithm description in __umodsi3  */
48fb7bfaSmrg  const uint64_t max_divisor = divisor << __builtin_clzll (divisor);
48fb7bfaSmrg
48fb7bfaSmrg  uint64_t remainder = dividend;
48fb7bfaSmrg  while (remainder >= divisor)
48fb7bfaSmrg    {
48fb7bfaSmrg      const int shift = __builtin_clzll (remainder);
48fb7bfaSmrg      uint64_t scaled_divisor = max_divisor >> shift;
48fb7bfaSmrg      scaled_divisor >>= (scaled_divisor > remainder);
48fb7bfaSmrg      remainder -= scaled_divisor;
48fb7bfaSmrg    }
48fb7bfaSmrg
48fb7bfaSmrg  return remainder;
48fb7bfaSmrg}
48fb7bfaSmrg
48fb7bfaSmrg
48fb7bfaSmrguint32_t __udivsi3 (uint32_t dividend, uint32_t divisor);
48fb7bfaSmrg#ifdef L_tile_udivsi3
48fb7bfaSmrguint32_t
48fb7bfaSmrg__udivsi3 (uint32_t dividend, uint32_t divisor)
48fb7bfaSmrg{
48fb7bfaSmrg#ifndef __tilegx__
48fb7bfaSmrg  return __udivsi3_inline (dividend, divisor);
48fb7bfaSmrg#else /* !__tilegx__ */
48fb7bfaSmrg  uint64_t n = __udivdi3_inline (((uint64_t) dividend), ((uint64_t) divisor));
48fb7bfaSmrg  return (uint32_t) n;
48fb7bfaSmrg#endif /* !__tilegx__ */
48fb7bfaSmrg}
48fb7bfaSmrg#endif
48fb7bfaSmrg
48fb7bfaSmrg#define ABS(x) ((x) >= 0 ? (x) : -(x))
48fb7bfaSmrg
48fb7bfaSmrgint32_t __divsi3 (int32_t dividend, int32_t divisor);
48fb7bfaSmrg#ifdef L_tile_divsi3
48fb7bfaSmrg/* __divsi3 - 32 bit integer signed divide  */
48fb7bfaSmrgint32_t
48fb7bfaSmrg__divsi3 (int32_t dividend, int32_t divisor)
48fb7bfaSmrg{
48fb7bfaSmrg#ifndef __tilegx__
48fb7bfaSmrg  uint32_t n = __udivsi3_inline (ABS (dividend), ABS (divisor));
48fb7bfaSmrg#else /* !__tilegx__ */
48fb7bfaSmrg  uint64_t n =
48fb7bfaSmrg    __udivdi3_inline (ABS ((int64_t) dividend), ABS ((int64_t) divisor));
48fb7bfaSmrg#endif /* !__tilegx__ */
48fb7bfaSmrg  if ((dividend ^ divisor) < 0)
48fb7bfaSmrg    n = -n;
48fb7bfaSmrg  return (int32_t) n;
48fb7bfaSmrg}
48fb7bfaSmrg#endif
48fb7bfaSmrg
48fb7bfaSmrg
48fb7bfaSmrguint64_t __udivdi3 (uint64_t dividend, uint64_t divisor);
48fb7bfaSmrg#ifdef L_tile_udivdi3
48fb7bfaSmrguint64_t
48fb7bfaSmrg__udivdi3 (uint64_t dividend, uint64_t divisor)
48fb7bfaSmrg{
48fb7bfaSmrg  return __udivdi3_inline (dividend, divisor);
48fb7bfaSmrg}
48fb7bfaSmrg#endif
48fb7bfaSmrg
48fb7bfaSmrg/*__divdi3 - 64 bit integer signed divide  */
48fb7bfaSmrgint64_t __divdi3 (int64_t dividend, int64_t divisor);
48fb7bfaSmrg#ifdef L_tile_divdi3
48fb7bfaSmrgint64_t
48fb7bfaSmrg__divdi3 (int64_t dividend, int64_t divisor)
48fb7bfaSmrg{
48fb7bfaSmrg  uint64_t n = __udivdi3_inline (ABS (dividend), ABS (divisor));
48fb7bfaSmrg  if ((dividend ^ divisor) < 0)
48fb7bfaSmrg    n = -n;
48fb7bfaSmrg  return (int64_t) n;
48fb7bfaSmrg}
48fb7bfaSmrg#endif
48fb7bfaSmrg
48fb7bfaSmrg
48fb7bfaSmrguint32_t __umodsi3 (uint32_t dividend, uint32_t divisor);
48fb7bfaSmrg#ifdef L_tile_umodsi3
48fb7bfaSmrguint32_t
48fb7bfaSmrg__umodsi3 (uint32_t dividend, uint32_t divisor)
48fb7bfaSmrg{
48fb7bfaSmrg#ifndef __tilegx__
48fb7bfaSmrg  return __umodsi3_inline (dividend, divisor);
48fb7bfaSmrg#else /* !__tilegx__ */
48fb7bfaSmrg  return __umoddi3_inline ((uint64_t) dividend, (uint64_t) divisor);
48fb7bfaSmrg#endif /* !__tilegx__ */
48fb7bfaSmrg}
48fb7bfaSmrg#endif
48fb7bfaSmrg
48fb7bfaSmrg
48fb7bfaSmrg/* __modsi3 - 32 bit integer signed modulo  */
48fb7bfaSmrgint32_t __modsi3 (int32_t dividend, int32_t divisor);
48fb7bfaSmrg#ifdef L_tile_modsi3
48fb7bfaSmrgint32_t
48fb7bfaSmrg__modsi3 (int32_t dividend, int32_t divisor)
48fb7bfaSmrg{
48fb7bfaSmrg#ifndef __tilegx__
48fb7bfaSmrg  uint32_t remainder = __umodsi3_inline (ABS (dividend), ABS (divisor));
48fb7bfaSmrg#else /* !__tilegx__ */
48fb7bfaSmrg  uint64_t remainder =
48fb7bfaSmrg    __umoddi3_inline (ABS ((int64_t) dividend), ABS ((int64_t) divisor));
48fb7bfaSmrg#endif /* !__tilegx__ */
48fb7bfaSmrg  return (int32_t) ((dividend >= 0) ? remainder : -remainder);
48fb7bfaSmrg}
48fb7bfaSmrg#endif
48fb7bfaSmrg
48fb7bfaSmrg
48fb7bfaSmrguint64_t __umoddi3 (uint64_t dividend, uint64_t divisor);
48fb7bfaSmrg#ifdef L_tile_umoddi3
48fb7bfaSmrguint64_t
48fb7bfaSmrg__umoddi3 (uint64_t dividend, uint64_t divisor)
48fb7bfaSmrg{
48fb7bfaSmrg  return __umoddi3_inline (dividend, divisor);
48fb7bfaSmrg}
48fb7bfaSmrg#endif
48fb7bfaSmrg
48fb7bfaSmrg
48fb7bfaSmrg/* __moddi3 - 64 bit integer signed modulo  */
48fb7bfaSmrgint64_t __moddi3 (int64_t dividend, int64_t divisor);
48fb7bfaSmrg#ifdef L_tile_moddi3
48fb7bfaSmrgint64_t
48fb7bfaSmrg__moddi3 (int64_t dividend, int64_t divisor)
48fb7bfaSmrg{
48fb7bfaSmrg  uint64_t remainder = __umoddi3_inline (ABS (dividend), ABS (divisor));
48fb7bfaSmrg  return (int64_t) ((dividend >= 0) ? remainder : -remainder);
48fb7bfaSmrg}
48fb7bfaSmrg#endif