config/tilepro/softdivide.c

36ac495dSmrg/* Division and remainder routines for Tile.
*8feb0f0bSmrg   Copyright (C) 2011-2020 Free Software Foundation, Inc.
36ac495dSmrg   Contributed by Walter Lee (walt@tilera.com)
36ac495dSmrg
36ac495dSmrg   This file is free software; you can redistribute it and/or modify it
36ac495dSmrg   under the terms of the GNU General Public License as published by the
36ac495dSmrg   Free Software Foundation; either version 3, or (at your option) any
36ac495dSmrg   later version.
36ac495dSmrg
36ac495dSmrg   This file is distributed in the hope that it will be useful, but
36ac495dSmrg   WITHOUT ANY WARRANTY; without even the implied warranty of
36ac495dSmrg   MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
36ac495dSmrg   General Public License for more details.
36ac495dSmrg
36ac495dSmrg   Under Section 7 of GPL version 3, you are granted additional
36ac495dSmrg   permissions described in the GCC Runtime Library Exception, version
36ac495dSmrg   3.1, as published by the Free Software Foundation.
36ac495dSmrg
36ac495dSmrg   You should have received a copy of the GNU General Public License and
36ac495dSmrg   a copy of the GCC Runtime Library Exception along with this program;
36ac495dSmrg   see the files COPYING3 and COPYING.RUNTIME respectively.  If not, see
36ac495dSmrg   <http://www.gnu.org/licenses/>.  */
36ac495dSmrg
36ac495dSmrgtypedef int int32_t;
36ac495dSmrgtypedef unsigned uint32_t;
36ac495dSmrgtypedef long long int64_t;
36ac495dSmrgtypedef unsigned long long uint64_t;
36ac495dSmrg
36ac495dSmrg/* Raise signal 8 (SIGFPE) with code 1 (FPE_INTDIV).  */
36ac495dSmrgstatic inline void
36ac495dSmrgraise_intdiv (void)
36ac495dSmrg{
36ac495dSmrg  asm ("{ raise; moveli zero, 8 + (1 << 6) }");
36ac495dSmrg}
36ac495dSmrg
36ac495dSmrg
36ac495dSmrg#ifndef __tilegx__
36ac495dSmrg/*__udivsi3 - 32 bit integer unsigned divide  */
36ac495dSmrgstatic inline uint32_t __attribute__ ((always_inline))
36ac495dSmrg__udivsi3_inline (uint32_t dividend, uint32_t divisor)
36ac495dSmrg{
36ac495dSmrg  /* Divide out any power of two factor from dividend and divisor.
36ac495dSmrg     Note that when dividing by zero the divisor will remain zero,
36ac495dSmrg     which is all we need to detect that case below.  */
36ac495dSmrg  const int power_of_two_factor = __insn_ctz (divisor);
36ac495dSmrg  divisor >>= power_of_two_factor;
36ac495dSmrg  dividend >>= power_of_two_factor;
36ac495dSmrg
36ac495dSmrg  /* Checks for division by power of two or division by zero.  */
36ac495dSmrg  if (divisor <= 1)
36ac495dSmrg    {
36ac495dSmrg      if (divisor == 0)
36ac495dSmrg	{
36ac495dSmrg	  raise_intdiv ();
36ac495dSmrg	  return 0;
36ac495dSmrg	}
36ac495dSmrg      return dividend;
36ac495dSmrg    }
36ac495dSmrg
36ac495dSmrg  /* Compute (a / b) by repeatedly finding the largest N
36ac495dSmrg     such that (b << N) <= a. For each such N, set bit N in the
36ac495dSmrg     quotient, subtract (b << N) from a, and keep going. Think of this as
36ac495dSmrg     the reverse of the "shift-and-add" that a multiply does. The values
36ac495dSmrg     of N are precisely those shift counts.
36ac495dSmrg
36ac495dSmrg     Finding N is easy. First, use clz(b) - clz(a) to find the N
36ac495dSmrg     that lines up the high bit of (b << N) with the high bit of a.
36ac495dSmrg     Any larger value of N would definitely make (b << N) > a,
36ac495dSmrg     which is too big.
36ac495dSmrg
36ac495dSmrg     Then, if (b << N) > a (because it has larger low bits), decrement
36ac495dSmrg     N by one.  This adjustment will definitely make (b << N) less
36ac495dSmrg     than a, because a's high bit is now one higher than b's.  */
36ac495dSmrg
36ac495dSmrg  /* Precomputing the max_ values allows us to avoid a subtract
36ac495dSmrg     in the inner loop and just right shift by clz(remainder).  */
36ac495dSmrg  const int divisor_clz = __insn_clz (divisor);
36ac495dSmrg  const uint32_t max_divisor = divisor << divisor_clz;
36ac495dSmrg  const uint32_t max_qbit = 1 << divisor_clz;
36ac495dSmrg
36ac495dSmrg  uint32_t quotient = 0;
36ac495dSmrg  uint32_t remainder = dividend;
36ac495dSmrg
36ac495dSmrg  while (remainder >= divisor)
36ac495dSmrg    {
36ac495dSmrg      int shift = __insn_clz (remainder);
36ac495dSmrg      uint32_t scaled_divisor = max_divisor >> shift;
36ac495dSmrg      uint32_t quotient_bit = max_qbit >> shift;
36ac495dSmrg
36ac495dSmrg      int too_big = (scaled_divisor > remainder);
36ac495dSmrg      scaled_divisor >>= too_big;
36ac495dSmrg      quotient_bit >>= too_big;
36ac495dSmrg      remainder -= scaled_divisor;
36ac495dSmrg      quotient |= quotient_bit;
36ac495dSmrg    }
36ac495dSmrg  return quotient;
36ac495dSmrg}
36ac495dSmrg#endif /* !__tilegx__ */
36ac495dSmrg
36ac495dSmrg
36ac495dSmrg/* __udivdi3 - 64 bit integer unsigned divide  */
36ac495dSmrgstatic inline uint64_t __attribute__ ((always_inline))
36ac495dSmrg__udivdi3_inline (uint64_t dividend, uint64_t divisor)
36ac495dSmrg{
36ac495dSmrg  /* Divide out any power of two factor from dividend and divisor.
36ac495dSmrg     Note that when dividing by zero the divisor will remain zero,
36ac495dSmrg     which is all we need to detect that case below.  */
36ac495dSmrg  const int power_of_two_factor = __builtin_ctzll (divisor);
36ac495dSmrg  divisor >>= power_of_two_factor;
36ac495dSmrg  dividend >>= power_of_two_factor;
36ac495dSmrg
36ac495dSmrg  /* Checks for division by power of two or division by zero.  */
36ac495dSmrg  if (divisor <= 1)
36ac495dSmrg    {
36ac495dSmrg      if (divisor == 0)
36ac495dSmrg	{
36ac495dSmrg	  raise_intdiv ();
36ac495dSmrg	  return 0;
36ac495dSmrg	}
36ac495dSmrg      return dividend;
36ac495dSmrg    }
36ac495dSmrg
36ac495dSmrg#ifndef __tilegx__
36ac495dSmrg  if (((uint32_t) (dividend >> 32) | ((uint32_t) (divisor >> 32))) == 0)
36ac495dSmrg    {
36ac495dSmrg      /* Operands both fit in 32 bits, so use faster 32 bit algorithm.  */
36ac495dSmrg      return __udivsi3_inline ((uint32_t) dividend, (uint32_t) divisor);
36ac495dSmrg    }
36ac495dSmrg#endif /* !__tilegx__ */
36ac495dSmrg
36ac495dSmrg  /* See algorithm description in __udivsi3  */
36ac495dSmrg
36ac495dSmrg  const int divisor_clz = __builtin_clzll (divisor);
36ac495dSmrg  const uint64_t max_divisor = divisor << divisor_clz;
36ac495dSmrg  const uint64_t max_qbit = 1ULL << divisor_clz;
36ac495dSmrg
36ac495dSmrg  uint64_t quotient = 0;
36ac495dSmrg  uint64_t remainder = dividend;
36ac495dSmrg
36ac495dSmrg  while (remainder >= divisor)
36ac495dSmrg    {
36ac495dSmrg      int shift = __builtin_clzll (remainder);
36ac495dSmrg      uint64_t scaled_divisor = max_divisor >> shift;
36ac495dSmrg      uint64_t quotient_bit = max_qbit >> shift;
36ac495dSmrg
36ac495dSmrg      int too_big = (scaled_divisor > remainder);
36ac495dSmrg      scaled_divisor >>= too_big;
36ac495dSmrg      quotient_bit >>= too_big;
36ac495dSmrg      remainder -= scaled_divisor;
36ac495dSmrg      quotient |= quotient_bit;
36ac495dSmrg    }
36ac495dSmrg  return quotient;
36ac495dSmrg}
36ac495dSmrg
36ac495dSmrg
36ac495dSmrg#ifndef __tilegx__
36ac495dSmrg/* __umodsi3 - 32 bit integer unsigned modulo  */
36ac495dSmrgstatic inline uint32_t __attribute__ ((always_inline))
36ac495dSmrg__umodsi3_inline (uint32_t dividend, uint32_t divisor)
36ac495dSmrg{
36ac495dSmrg  /* Shortcircuit mod by a power of two (and catch mod by zero).  */
36ac495dSmrg  const uint32_t mask = divisor - 1;
36ac495dSmrg  if ((divisor & mask) == 0)
36ac495dSmrg    {
36ac495dSmrg      if (divisor == 0)
36ac495dSmrg	{
36ac495dSmrg	  raise_intdiv ();
36ac495dSmrg	  return 0;
36ac495dSmrg	}
36ac495dSmrg      return dividend & mask;
36ac495dSmrg    }
36ac495dSmrg
36ac495dSmrg  /* We compute the remainder (a % b) by repeatedly subtracting off
36ac495dSmrg     multiples of b from a until a < b. The key is that subtracting
36ac495dSmrg     off a multiple of b does not affect the result mod b.
36ac495dSmrg
36ac495dSmrg     To make the algorithm run efficiently, we need to subtract
36ac495dSmrg     off a large multiple of b at each step. We subtract the largest
36ac495dSmrg     (b << N) that is <= a.
36ac495dSmrg
36ac495dSmrg     Finding N is easy. First, use clz(b) - clz(a) to find the N
36ac495dSmrg     that lines up the high bit of (b << N) with the high bit of a.
36ac495dSmrg     Any larger value of N would definitely make (b << N) > a,
36ac495dSmrg     which is too big.
36ac495dSmrg
36ac495dSmrg     Then, if (b << N) > a (because it has larger low bits), decrement
36ac495dSmrg     N by one.  This adjustment will definitely make (b << N) less
36ac495dSmrg     than a, because a's high bit is now one higher than b's.  */
36ac495dSmrg  const uint32_t max_divisor = divisor << __insn_clz (divisor);
36ac495dSmrg
36ac495dSmrg  uint32_t remainder = dividend;
36ac495dSmrg  while (remainder >= divisor)
36ac495dSmrg    {
36ac495dSmrg      const int shift = __insn_clz (remainder);
36ac495dSmrg      uint32_t scaled_divisor = max_divisor >> shift;
36ac495dSmrg      scaled_divisor >>= (scaled_divisor > remainder);
36ac495dSmrg      remainder -= scaled_divisor;
36ac495dSmrg    }
36ac495dSmrg
36ac495dSmrg  return remainder;
36ac495dSmrg}
36ac495dSmrg#endif /* !__tilegx__ */
36ac495dSmrg
36ac495dSmrg
36ac495dSmrg/* __umoddi3 - 64 bit integer unsigned modulo  */
36ac495dSmrgstatic inline uint64_t __attribute__ ((always_inline))
36ac495dSmrg__umoddi3_inline (uint64_t dividend, uint64_t divisor)
36ac495dSmrg{
36ac495dSmrg#ifndef __tilegx__
36ac495dSmrg  if (((uint32_t) (dividend >> 32) | ((uint32_t) (divisor >> 32))) == 0)
36ac495dSmrg    {
36ac495dSmrg      /* Operands both fit in 32 bits, so use faster 32 bit algorithm.  */
36ac495dSmrg      return __umodsi3_inline ((uint32_t) dividend, (uint32_t) divisor);
36ac495dSmrg    }
36ac495dSmrg#endif /* !__tilegx__ */
36ac495dSmrg
36ac495dSmrg  /* Shortcircuit mod by a power of two (and catch mod by zero).  */
36ac495dSmrg  const uint64_t mask = divisor - 1;
36ac495dSmrg  if ((divisor & mask) == 0)
36ac495dSmrg    {
36ac495dSmrg      if (divisor == 0)
36ac495dSmrg	{
36ac495dSmrg	  raise_intdiv ();
36ac495dSmrg	  return 0;
36ac495dSmrg	}
36ac495dSmrg      return dividend & mask;
36ac495dSmrg    }
36ac495dSmrg
36ac495dSmrg  /* See algorithm description in __umodsi3  */
36ac495dSmrg  const uint64_t max_divisor = divisor << __builtin_clzll (divisor);
36ac495dSmrg
36ac495dSmrg  uint64_t remainder = dividend;
36ac495dSmrg  while (remainder >= divisor)
36ac495dSmrg    {
36ac495dSmrg      const int shift = __builtin_clzll (remainder);
36ac495dSmrg      uint64_t scaled_divisor = max_divisor >> shift;
36ac495dSmrg      scaled_divisor >>= (scaled_divisor > remainder);
36ac495dSmrg      remainder -= scaled_divisor;
36ac495dSmrg    }
36ac495dSmrg
36ac495dSmrg  return remainder;
36ac495dSmrg}
36ac495dSmrg
36ac495dSmrg
36ac495dSmrguint32_t __udivsi3 (uint32_t dividend, uint32_t divisor);
36ac495dSmrg#ifdef L_tile_udivsi3
36ac495dSmrguint32_t
36ac495dSmrg__udivsi3 (uint32_t dividend, uint32_t divisor)
36ac495dSmrg{
36ac495dSmrg#ifndef __tilegx__
36ac495dSmrg  return __udivsi3_inline (dividend, divisor);
36ac495dSmrg#else /* !__tilegx__ */
36ac495dSmrg  uint64_t n = __udivdi3_inline (((uint64_t) dividend), ((uint64_t) divisor));
36ac495dSmrg  return (uint32_t) n;
36ac495dSmrg#endif /* !__tilegx__ */
36ac495dSmrg}
36ac495dSmrg#endif
36ac495dSmrg
36ac495dSmrg#define ABS(x) ((x) >= 0 ? (x) : -(x))
36ac495dSmrg
36ac495dSmrgint32_t __divsi3 (int32_t dividend, int32_t divisor);
36ac495dSmrg#ifdef L_tile_divsi3
36ac495dSmrg/* __divsi3 - 32 bit integer signed divide  */
36ac495dSmrgint32_t
36ac495dSmrg__divsi3 (int32_t dividend, int32_t divisor)
36ac495dSmrg{
36ac495dSmrg#ifndef __tilegx__
36ac495dSmrg  uint32_t n = __udivsi3_inline (ABS (dividend), ABS (divisor));
36ac495dSmrg#else /* !__tilegx__ */
36ac495dSmrg  uint64_t n =
36ac495dSmrg    __udivdi3_inline (ABS ((int64_t) dividend), ABS ((int64_t) divisor));
36ac495dSmrg#endif /* !__tilegx__ */
36ac495dSmrg  if ((dividend ^ divisor) < 0)
36ac495dSmrg    n = -n;
36ac495dSmrg  return (int32_t) n;
36ac495dSmrg}
36ac495dSmrg#endif
36ac495dSmrg
36ac495dSmrg
36ac495dSmrguint64_t __udivdi3 (uint64_t dividend, uint64_t divisor);
36ac495dSmrg#ifdef L_tile_udivdi3
36ac495dSmrguint64_t
36ac495dSmrg__udivdi3 (uint64_t dividend, uint64_t divisor)
36ac495dSmrg{
36ac495dSmrg  return __udivdi3_inline (dividend, divisor);
36ac495dSmrg}
36ac495dSmrg#endif
36ac495dSmrg
36ac495dSmrg/*__divdi3 - 64 bit integer signed divide  */
36ac495dSmrgint64_t __divdi3 (int64_t dividend, int64_t divisor);
36ac495dSmrg#ifdef L_tile_divdi3
36ac495dSmrgint64_t
36ac495dSmrg__divdi3 (int64_t dividend, int64_t divisor)
36ac495dSmrg{
36ac495dSmrg  uint64_t n = __udivdi3_inline (ABS (dividend), ABS (divisor));
36ac495dSmrg  if ((dividend ^ divisor) < 0)
36ac495dSmrg    n = -n;
36ac495dSmrg  return (int64_t) n;
36ac495dSmrg}
36ac495dSmrg#endif
36ac495dSmrg
36ac495dSmrg
36ac495dSmrguint32_t __umodsi3 (uint32_t dividend, uint32_t divisor);
36ac495dSmrg#ifdef L_tile_umodsi3
36ac495dSmrguint32_t
36ac495dSmrg__umodsi3 (uint32_t dividend, uint32_t divisor)
36ac495dSmrg{
36ac495dSmrg#ifndef __tilegx__
36ac495dSmrg  return __umodsi3_inline (dividend, divisor);
36ac495dSmrg#else /* !__tilegx__ */
36ac495dSmrg  return __umoddi3_inline ((uint64_t) dividend, (uint64_t) divisor);
36ac495dSmrg#endif /* !__tilegx__ */
36ac495dSmrg}
36ac495dSmrg#endif
36ac495dSmrg
36ac495dSmrg
36ac495dSmrg/* __modsi3 - 32 bit integer signed modulo  */
36ac495dSmrgint32_t __modsi3 (int32_t dividend, int32_t divisor);
36ac495dSmrg#ifdef L_tile_modsi3
36ac495dSmrgint32_t
36ac495dSmrg__modsi3 (int32_t dividend, int32_t divisor)
36ac495dSmrg{
36ac495dSmrg#ifndef __tilegx__
36ac495dSmrg  uint32_t remainder = __umodsi3_inline (ABS (dividend), ABS (divisor));
36ac495dSmrg#else /* !__tilegx__ */
36ac495dSmrg  uint64_t remainder =
36ac495dSmrg    __umoddi3_inline (ABS ((int64_t) dividend), ABS ((int64_t) divisor));
36ac495dSmrg#endif /* !__tilegx__ */
36ac495dSmrg  return (int32_t) ((dividend >= 0) ? remainder : -remainder);
36ac495dSmrg}
36ac495dSmrg#endif
36ac495dSmrg
36ac495dSmrg
36ac495dSmrguint64_t __umoddi3 (uint64_t dividend, uint64_t divisor);
36ac495dSmrg#ifdef L_tile_umoddi3
36ac495dSmrguint64_t
36ac495dSmrg__umoddi3 (uint64_t dividend, uint64_t divisor)
36ac495dSmrg{
36ac495dSmrg  return __umoddi3_inline (dividend, divisor);
36ac495dSmrg}
36ac495dSmrg#endif
36ac495dSmrg
36ac495dSmrg
36ac495dSmrg/* __moddi3 - 64 bit integer signed modulo  */
36ac495dSmrgint64_t __moddi3 (int64_t dividend, int64_t divisor);
36ac495dSmrg#ifdef L_tile_moddi3
36ac495dSmrgint64_t
36ac495dSmrg__moddi3 (int64_t dividend, int64_t divisor)
36ac495dSmrg{
36ac495dSmrg  uint64_t remainder = __umoddi3_inline (ABS (dividend), ABS (divisor));
36ac495dSmrg  return (int64_t) ((dividend >= 0) ? remainder : -remainder);
36ac495dSmrg}
36ac495dSmrg#endif