builtins/hexagon/dfmul.S

*0b57cec5SDimitry Andric//===----------------------Hexagon builtin routine ------------------------===//
*0b57cec5SDimitry Andric//
*0b57cec5SDimitry Andric// Part of the LLVM Project, under the Apache License v2.0 with LLVM Exceptions.
*0b57cec5SDimitry Andric// See https://llvm.org/LICENSE.txt for license information.
*0b57cec5SDimitry Andric// SPDX-License-Identifier: Apache-2.0 WITH LLVM-exception
*0b57cec5SDimitry Andric//
*0b57cec5SDimitry Andric//===----------------------------------------------------------------------===//
*0b57cec5SDimitry Andric
*0b57cec5SDimitry Andric// Double Precision Multiply
*0b57cec5SDimitry Andric#define A r1:0
*0b57cec5SDimitry Andric#define AH r1
*0b57cec5SDimitry Andric#define AL r0
*0b57cec5SDimitry Andric#define B r3:2
*0b57cec5SDimitry Andric#define BH r3
*0b57cec5SDimitry Andric#define BL r2
*0b57cec5SDimitry Andric
*0b57cec5SDimitry Andric#define BTMP r5:4
*0b57cec5SDimitry Andric#define BTMPH r5
*0b57cec5SDimitry Andric#define BTMPL r4
*0b57cec5SDimitry Andric
*0b57cec5SDimitry Andric#define PP_ODD r7:6
*0b57cec5SDimitry Andric#define PP_ODD_H r7
*0b57cec5SDimitry Andric#define PP_ODD_L r6
*0b57cec5SDimitry Andric
*0b57cec5SDimitry Andric#define ONE r9:8
*0b57cec5SDimitry Andric#define S_ONE r8
*0b57cec5SDimitry Andric#define S_ZERO r9
*0b57cec5SDimitry Andric
*0b57cec5SDimitry Andric#define PP_HH r11:10
*0b57cec5SDimitry Andric#define PP_HH_H r11
*0b57cec5SDimitry Andric#define PP_HH_L r10
*0b57cec5SDimitry Andric
*0b57cec5SDimitry Andric#define ATMP r13:12
*0b57cec5SDimitry Andric#define ATMPH r13
*0b57cec5SDimitry Andric#define ATMPL r12
*0b57cec5SDimitry Andric
*0b57cec5SDimitry Andric#define PP_LL r15:14
*0b57cec5SDimitry Andric#define PP_LL_H r15
*0b57cec5SDimitry Andric#define PP_LL_L r14
*0b57cec5SDimitry Andric
*0b57cec5SDimitry Andric#define TMP r28
*0b57cec5SDimitry Andric
*0b57cec5SDimitry Andric#define MANTBITS 52
*0b57cec5SDimitry Andric#define HI_MANTBITS 20
*0b57cec5SDimitry Andric#define EXPBITS 11
*0b57cec5SDimitry Andric#define BIAS 1024
*0b57cec5SDimitry Andric#define MANTISSA_TO_INT_BIAS 52
*0b57cec5SDimitry Andric
*0b57cec5SDimitry Andric// Some constant to adjust normalization amount in error code
*0b57cec5SDimitry Andric// Amount to right shift the partial product to get to a denorm
*0b57cec5SDimitry Andric#define FUDGE 5
*0b57cec5SDimitry Andric
*0b57cec5SDimitry Andric#define Q6_ALIAS(TAG) .global __qdsp_##TAG ; .set __qdsp_##TAG, __hexagon_##TAG
*0b57cec5SDimitry Andric#define FAST_ALIAS(TAG) .global __hexagon_fast_##TAG ; .set __hexagon_fast_##TAG, __hexagon_##TAG
*0b57cec5SDimitry Andric#define FAST2_ALIAS(TAG) .global __hexagon_fast2_##TAG ; .set __hexagon_fast2_##TAG, __hexagon_##TAG
*0b57cec5SDimitry Andric#define END(TAG) .size TAG,.-TAG
*0b57cec5SDimitry Andric
*0b57cec5SDimitry Andric#define SR_ROUND_OFF 22
*0b57cec5SDimitry Andric	.text
*0b57cec5SDimitry Andric	.global __hexagon_muldf3
*0b57cec5SDimitry Andric	.type __hexagon_muldf3,@function
*0b57cec5SDimitry Andric	Q6_ALIAS(muldf3)
*0b57cec5SDimitry Andric  FAST_ALIAS(muldf3)
*0b57cec5SDimitry Andric  FAST2_ALIAS(muldf3)
*0b57cec5SDimitry Andric	.p2align 5
*0b57cec5SDimitry Andric__hexagon_muldf3:
*0b57cec5SDimitry Andric	{
*0b57cec5SDimitry Andric		p0 = dfclass(A,#2)
*0b57cec5SDimitry Andric		p0 = dfclass(B,#2)
*0b57cec5SDimitry Andric		ATMP = combine(##0x40000000,#0)
*0b57cec5SDimitry Andric	}
*0b57cec5SDimitry Andric	{
*0b57cec5SDimitry Andric		ATMP = insert(A,#MANTBITS,#EXPBITS-1)
*0b57cec5SDimitry Andric		BTMP = asl(B,#EXPBITS-1)
*0b57cec5SDimitry Andric		TMP = #-BIAS
*0b57cec5SDimitry Andric		ONE = #1
*0b57cec5SDimitry Andric	}
*0b57cec5SDimitry Andric	{
*0b57cec5SDimitry Andric		PP_ODD = mpyu(BTMPL,ATMPH)
*0b57cec5SDimitry Andric		BTMP = insert(ONE,#2,#62)
*0b57cec5SDimitry Andric	}
*0b57cec5SDimitry Andric	// since we know that the MSB of the H registers is zero, we should never carry
*0b57cec5SDimitry Andric	// H <= 2^31-1.  L <= 2^32-1.  Therefore, HL <= 2^63-2^32-2^31+1
*0b57cec5SDimitry Andric	// Adding 2 HLs, we get 2^64-3*2^32+2 maximum.
*0b57cec5SDimitry Andric	// Therefore, we can add 3 2^32-1 values safely without carry.  We only need one.
*0b57cec5SDimitry Andric	{
*0b57cec5SDimitry Andric		PP_LL = mpyu(ATMPL,BTMPL)
*0b57cec5SDimitry Andric		PP_ODD += mpyu(ATMPL,BTMPH)
*0b57cec5SDimitry Andric	}
*0b57cec5SDimitry Andric	{
*0b57cec5SDimitry Andric		PP_ODD += lsr(PP_LL,#32)
*0b57cec5SDimitry Andric		PP_HH = mpyu(ATMPH,BTMPH)
*0b57cec5SDimitry Andric		BTMP = combine(##BIAS+BIAS-4,#0)
*0b57cec5SDimitry Andric	}
*0b57cec5SDimitry Andric	{
*0b57cec5SDimitry Andric		PP_HH += lsr(PP_ODD,#32)
*0b57cec5SDimitry Andric		if (!p0) jump .Lmul_abnormal
*0b57cec5SDimitry Andric		p1 = cmp.eq(PP_LL_L,#0)		// 64 lsb's 0?
*0b57cec5SDimitry Andric		p1 = cmp.eq(PP_ODD_L,#0)	// 64 lsb's 0?
*0b57cec5SDimitry Andric	}
*0b57cec5SDimitry Andric
*0b57cec5SDimitry Andric	// PP_HH can have a maximum of 0x3FFF_FFFF_FFFF_FFFF or thereabouts
*0b57cec5SDimitry Andric	// PP_HH can have a minimum of 0x1000_0000_0000_0000 or so
*0b57cec5SDimitry Andric
*0b57cec5SDimitry Andric#undef PP_ODD
*0b57cec5SDimitry Andric#undef PP_ODD_H
*0b57cec5SDimitry Andric#undef PP_ODD_L
*0b57cec5SDimitry Andric#define EXP10 r7:6
*0b57cec5SDimitry Andric#define EXP1 r7
*0b57cec5SDimitry Andric#define EXP0 r6
*0b57cec5SDimitry Andric	{
*0b57cec5SDimitry Andric		if (!p1) PP_HH_L = or(PP_HH_L,S_ONE)
*0b57cec5SDimitry Andric		EXP0 = extractu(AH,#EXPBITS,#HI_MANTBITS)
*0b57cec5SDimitry Andric		EXP1 = extractu(BH,#EXPBITS,#HI_MANTBITS)
*0b57cec5SDimitry Andric	}
*0b57cec5SDimitry Andric	{
*0b57cec5SDimitry Andric		PP_LL = neg(PP_HH)
*0b57cec5SDimitry Andric		EXP0 += add(TMP,EXP1)
*0b57cec5SDimitry Andric		TMP = xor(AH,BH)
*0b57cec5SDimitry Andric	}
*0b57cec5SDimitry Andric	{
*0b57cec5SDimitry Andric		if (!p2.new) PP_HH = PP_LL
*0b57cec5SDimitry Andric		p2 = cmp.gt(TMP,#-1)
*0b57cec5SDimitry Andric		p0 = !cmp.gt(EXP0,BTMPH)
*0b57cec5SDimitry Andric		p0 = cmp.gt(EXP0,BTMPL)
*0b57cec5SDimitry Andric		if (!p0.new) jump:nt .Lmul_ovf_unf
*0b57cec5SDimitry Andric	}
*0b57cec5SDimitry Andric	{
*0b57cec5SDimitry Andric		A = convert_d2df(PP_HH)
*0b57cec5SDimitry Andric		EXP0 = add(EXP0,#-BIAS-58)
*0b57cec5SDimitry Andric	}
*0b57cec5SDimitry Andric	{
*0b57cec5SDimitry Andric		AH += asl(EXP0,#HI_MANTBITS)
*0b57cec5SDimitry Andric		jumpr r31
*0b57cec5SDimitry Andric	}
*0b57cec5SDimitry Andric
*0b57cec5SDimitry Andric	.falign
*0b57cec5SDimitry Andric.Lpossible_unf:
*0b57cec5SDimitry Andric	// We end up with a positive exponent
*0b57cec5SDimitry Andric	// But we may have rounded up to an exponent of 1.
*0b57cec5SDimitry Andric	// If the exponent is 1, if we rounded up to it
*0b57cec5SDimitry Andric	// we need to also raise underflow
*0b57cec5SDimitry Andric	// Fortunately, this is pretty easy to detect, we must have +/- 0x0010_0000_0000_0000
*0b57cec5SDimitry Andric	// And the PP should also have more than one bit set
*0b57cec5SDimitry Andric	//
*0b57cec5SDimitry Andric	// Note: ATMP should have abs(PP_HH)
*0b57cec5SDimitry Andric	// Note: BTMPL should have 0x7FEFFFFF
*0b57cec5SDimitry Andric	{
*0b57cec5SDimitry Andric		p0 = cmp.eq(AL,#0)
*0b57cec5SDimitry Andric		p0 = bitsclr(AH,BTMPL)
*0b57cec5SDimitry Andric		if (!p0.new) jumpr:t r31
*0b57cec5SDimitry Andric		BTMPH = #0x7fff
*0b57cec5SDimitry Andric	}
*0b57cec5SDimitry Andric	{
*0b57cec5SDimitry Andric		p0 = bitsset(ATMPH,BTMPH)
*0b57cec5SDimitry Andric		BTMPL = USR
*0b57cec5SDimitry Andric		BTMPH = #0x030
*0b57cec5SDimitry Andric	}
*0b57cec5SDimitry Andric	{
*0b57cec5SDimitry Andric		if (p0) BTMPL = or(BTMPL,BTMPH)
*0b57cec5SDimitry Andric	}
*0b57cec5SDimitry Andric	{
*0b57cec5SDimitry Andric		USR = BTMPL
*0b57cec5SDimitry Andric	}
*0b57cec5SDimitry Andric	{
*0b57cec5SDimitry Andric		p0 = dfcmp.eq(A,A)
*0b57cec5SDimitry Andric		jumpr r31
*0b57cec5SDimitry Andric	}
*0b57cec5SDimitry Andric	.falign
*0b57cec5SDimitry Andric.Lmul_ovf_unf:
*0b57cec5SDimitry Andric	{
*0b57cec5SDimitry Andric		A = convert_d2df(PP_HH)
*0b57cec5SDimitry Andric		ATMP = abs(PP_HH)			// take absolute value
*0b57cec5SDimitry Andric		EXP1 = add(EXP0,#-BIAS-58)
*0b57cec5SDimitry Andric	}
*0b57cec5SDimitry Andric	{
*0b57cec5SDimitry Andric		AH += asl(EXP1,#HI_MANTBITS)
*0b57cec5SDimitry Andric		EXP1 = extractu(AH,#EXPBITS,#HI_MANTBITS)
*0b57cec5SDimitry Andric		BTMPL = ##0x7FEFFFFF
*0b57cec5SDimitry Andric	}
*0b57cec5SDimitry Andric	{
*0b57cec5SDimitry Andric		EXP1 += add(EXP0,##-BIAS-58)
*0b57cec5SDimitry Andric		//BTMPH = add(clb(ATMP),#-2)
*0b57cec5SDimitry Andric		BTMPH = #0
*0b57cec5SDimitry Andric	}
*0b57cec5SDimitry Andric	{
*0b57cec5SDimitry Andric		p0 = cmp.gt(EXP1,##BIAS+BIAS-2)	// overflow
*0b57cec5SDimitry Andric		if (p0.new) jump:nt .Lmul_ovf
*0b57cec5SDimitry Andric	}
*0b57cec5SDimitry Andric	{
*0b57cec5SDimitry Andric		p0 = cmp.gt(EXP1,#0)
*0b57cec5SDimitry Andric		if (p0.new) jump:nt .Lpossible_unf
*0b57cec5SDimitry Andric		BTMPH = sub(EXP0,BTMPH)
*0b57cec5SDimitry Andric		TMP = #63				// max amount to shift
*0b57cec5SDimitry Andric	}
*0b57cec5SDimitry Andric	// Underflow
*0b57cec5SDimitry Andric	//
*0b57cec5SDimitry Andric	// PP_HH has the partial product with sticky LSB.
*0b57cec5SDimitry Andric	// PP_HH can have a maximum of 0x3FFF_FFFF_FFFF_FFFF or thereabouts
*0b57cec5SDimitry Andric	// PP_HH can have a minimum of 0x1000_0000_0000_0000 or so
*0b57cec5SDimitry Andric	// The exponent of PP_HH is in  EXP1, which is non-positive (0 or negative)
*0b57cec5SDimitry Andric	// That's the exponent that happens after the normalization
*0b57cec5SDimitry Andric	//
*0b57cec5SDimitry Andric	// EXP0 has the exponent that, when added to the normalized value, is out of range.
*0b57cec5SDimitry Andric	//
*0b57cec5SDimitry Andric	// Strategy:
*0b57cec5SDimitry Andric	//
*0b57cec5SDimitry Andric	// * Shift down bits, with sticky bit, such that the bits are aligned according
*0b57cec5SDimitry Andric	//   to the LZ count and appropriate exponent, but not all the way to mantissa
*0b57cec5SDimitry Andric	//   field, keep around the last few bits.
*0b57cec5SDimitry Andric	// * Put a 1 near the MSB
*0b57cec5SDimitry Andric	// * Check the LSBs for inexact; if inexact also set underflow
*0b57cec5SDimitry Andric	// * Convert [u]d2df -- will correctly round according to rounding mode
*0b57cec5SDimitry Andric	// * Replace exponent field with zero
*0b57cec5SDimitry Andric
*0b57cec5SDimitry Andric	{
*0b57cec5SDimitry Andric		BTMPL = #0	 			// offset for extract
*0b57cec5SDimitry Andric		BTMPH = sub(#FUDGE,BTMPH)		// amount to right shift
*0b57cec5SDimitry Andric	}
*0b57cec5SDimitry Andric	{
*0b57cec5SDimitry Andric		p3 = cmp.gt(PP_HH_H,#-1)		// is it positive?
*0b57cec5SDimitry Andric		BTMPH = min(BTMPH,TMP)			// Don't shift more than 63
*0b57cec5SDimitry Andric		PP_HH = ATMP
*0b57cec5SDimitry Andric	}
*0b57cec5SDimitry Andric	{
*0b57cec5SDimitry Andric		TMP = USR
*0b57cec5SDimitry Andric		PP_LL = extractu(PP_HH,BTMP)
*0b57cec5SDimitry Andric	}
*0b57cec5SDimitry Andric	{
*0b57cec5SDimitry Andric		PP_HH = asr(PP_HH,BTMPH)
*0b57cec5SDimitry Andric		BTMPL = #0x0030					// underflow flag
*0b57cec5SDimitry Andric		AH = insert(S_ZERO,#EXPBITS,#HI_MANTBITS)
*0b57cec5SDimitry Andric	}
*0b57cec5SDimitry Andric	{
*0b57cec5SDimitry Andric		p0 = cmp.gtu(ONE,PP_LL)				// Did we extract all zeros?
*0b57cec5SDimitry Andric		if (!p0.new) PP_HH_L = or(PP_HH_L,S_ONE)	// add sticky bit
*0b57cec5SDimitry Andric		PP_HH_H = setbit(PP_HH_H,#HI_MANTBITS+3)	// Add back in a bit so we can use convert instruction
*0b57cec5SDimitry Andric	}
*0b57cec5SDimitry Andric	{
*0b57cec5SDimitry Andric		PP_LL = neg(PP_HH)
*0b57cec5SDimitry Andric		p1 = bitsclr(PP_HH_L,#0x7)		// Are the LSB's clear?
*0b57cec5SDimitry Andric		if (!p1.new) TMP = or(BTMPL,TMP)	// If not, Inexact+Underflow
*0b57cec5SDimitry Andric	}
*0b57cec5SDimitry Andric	{
*0b57cec5SDimitry Andric		if (!p3) PP_HH = PP_LL
*0b57cec5SDimitry Andric		USR = TMP
*0b57cec5SDimitry Andric	}
*0b57cec5SDimitry Andric	{
*0b57cec5SDimitry Andric		A = convert_d2df(PP_HH)			// Do rounding
*0b57cec5SDimitry Andric		p0 = dfcmp.eq(A,A)			// realize exception
*0b57cec5SDimitry Andric	}
*0b57cec5SDimitry Andric	{
*0b57cec5SDimitry Andric		AH = insert(S_ZERO,#EXPBITS-1,#HI_MANTBITS+1)		// Insert correct exponent
*0b57cec5SDimitry Andric		jumpr r31
*0b57cec5SDimitry Andric	}
*0b57cec5SDimitry Andric	.falign
*0b57cec5SDimitry Andric.Lmul_ovf:
*0b57cec5SDimitry Andric	// We get either max finite value or infinity.  Either way, overflow+inexact
*0b57cec5SDimitry Andric	{
*0b57cec5SDimitry Andric		TMP = USR
*0b57cec5SDimitry Andric		ATMP = combine(##0x7fefffff,#-1)	// positive max finite
*0b57cec5SDimitry Andric		A = PP_HH
*0b57cec5SDimitry Andric	}
*0b57cec5SDimitry Andric	{
*0b57cec5SDimitry Andric		PP_LL_L = extractu(TMP,#2,#SR_ROUND_OFF)	// rounding bits
*0b57cec5SDimitry Andric		TMP = or(TMP,#0x28)			// inexact + overflow
*0b57cec5SDimitry Andric		BTMP = combine(##0x7ff00000,#0)		// positive infinity
*0b57cec5SDimitry Andric	}
*0b57cec5SDimitry Andric	{
*0b57cec5SDimitry Andric		USR = TMP
*0b57cec5SDimitry Andric		PP_LL_L ^= lsr(AH,#31)			// Does sign match rounding?
*0b57cec5SDimitry Andric		TMP = PP_LL_L				// unmodified rounding mode
*0b57cec5SDimitry Andric	}
*0b57cec5SDimitry Andric	{
*0b57cec5SDimitry Andric		p0 = !cmp.eq(TMP,#1)			// If not round-to-zero and
*0b57cec5SDimitry Andric		p0 = !cmp.eq(PP_LL_L,#2)		// Not rounding the other way,
*0b57cec5SDimitry Andric		if (p0.new) ATMP = BTMP			// we should get infinity
*0b57cec5SDimitry Andric		p0 = dfcmp.eq(A,A)			// Realize FP exception if enabled
*0b57cec5SDimitry Andric	}
*0b57cec5SDimitry Andric	{
*0b57cec5SDimitry Andric		A = insert(ATMP,#63,#0)			// insert inf/maxfinite, leave sign
*0b57cec5SDimitry Andric		jumpr r31
*0b57cec5SDimitry Andric	}
*0b57cec5SDimitry Andric
*0b57cec5SDimitry Andric.Lmul_abnormal:
*0b57cec5SDimitry Andric	{
*0b57cec5SDimitry Andric		ATMP = extractu(A,#63,#0)		// strip off sign
*0b57cec5SDimitry Andric		BTMP = extractu(B,#63,#0)		// strip off sign
*0b57cec5SDimitry Andric	}
*0b57cec5SDimitry Andric	{
*0b57cec5SDimitry Andric		p3 = cmp.gtu(ATMP,BTMP)
*0b57cec5SDimitry Andric		if (!p3.new) A = B			// sort values
*0b57cec5SDimitry Andric		if (!p3.new) B = A			// sort values
*0b57cec5SDimitry Andric	}
*0b57cec5SDimitry Andric	{
*0b57cec5SDimitry Andric		// Any NaN --> NaN, possibly raise invalid if sNaN
*0b57cec5SDimitry Andric		p0 = dfclass(A,#0x0f)		// A not NaN?
*0b57cec5SDimitry Andric		if (!p0.new) jump:nt .Linvalid_nan
*0b57cec5SDimitry Andric		if (!p3) ATMP = BTMP
*0b57cec5SDimitry Andric		if (!p3) BTMP = ATMP
*0b57cec5SDimitry Andric	}
*0b57cec5SDimitry Andric	{
*0b57cec5SDimitry Andric		// Infinity * nonzero number is infinity
*0b57cec5SDimitry Andric		p1 = dfclass(A,#0x08)		// A is infinity
*0b57cec5SDimitry Andric		p1 = dfclass(B,#0x0e)		// B is nonzero
*0b57cec5SDimitry Andric	}
*0b57cec5SDimitry Andric	{
*0b57cec5SDimitry Andric		// Infinity * zero --> NaN, raise invalid
*0b57cec5SDimitry Andric		// Other zeros return zero
*0b57cec5SDimitry Andric		p0 = dfclass(A,#0x08)		// A is infinity
*0b57cec5SDimitry Andric		p0 = dfclass(B,#0x01)		// B is zero
*0b57cec5SDimitry Andric	}
*0b57cec5SDimitry Andric	{
*0b57cec5SDimitry Andric		if (p1) jump .Ltrue_inf
*0b57cec5SDimitry Andric		p2 = dfclass(B,#0x01)
*0b57cec5SDimitry Andric	}
*0b57cec5SDimitry Andric	{
*0b57cec5SDimitry Andric		if (p0) jump .Linvalid_zeroinf
*0b57cec5SDimitry Andric		if (p2) jump .Ltrue_zero		// so return zero
*0b57cec5SDimitry Andric		TMP = ##0x7c000000
*0b57cec5SDimitry Andric	}
*0b57cec5SDimitry Andric	// We are left with a normal or subnormal times a subnormal. A > B
*0b57cec5SDimitry Andric	// If A and B are both very small (exp(a) < BIAS-MANTBITS),
*0b57cec5SDimitry Andric	// we go to a single sticky bit, which we can round easily.
*0b57cec5SDimitry Andric	// If A and B might multiply to something bigger, decrease A exponent and increase
*0b57cec5SDimitry Andric	// B exponent and try again
*0b57cec5SDimitry Andric	{
*0b57cec5SDimitry Andric		p0 = bitsclr(AH,TMP)
*0b57cec5SDimitry Andric		if (p0.new) jump:nt .Lmul_tiny
*0b57cec5SDimitry Andric	}
*0b57cec5SDimitry Andric	{
*0b57cec5SDimitry Andric		TMP = cl0(BTMP)
*0b57cec5SDimitry Andric	}
*0b57cec5SDimitry Andric	{
*0b57cec5SDimitry Andric		TMP = add(TMP,#-EXPBITS)
*0b57cec5SDimitry Andric	}
*0b57cec5SDimitry Andric	{
*0b57cec5SDimitry Andric		BTMP = asl(BTMP,TMP)
*0b57cec5SDimitry Andric	}
*0b57cec5SDimitry Andric	{
*0b57cec5SDimitry Andric		B = insert(BTMP,#63,#0)
*0b57cec5SDimitry Andric		AH -= asl(TMP,#HI_MANTBITS)
*0b57cec5SDimitry Andric	}
*0b57cec5SDimitry Andric	jump __hexagon_muldf3
*0b57cec5SDimitry Andric.Lmul_tiny:
*0b57cec5SDimitry Andric	{
*0b57cec5SDimitry Andric		TMP = USR
*0b57cec5SDimitry Andric		A = xor(A,B)				// get sign bit
*0b57cec5SDimitry Andric	}
*0b57cec5SDimitry Andric	{
*0b57cec5SDimitry Andric		TMP = or(TMP,#0x30)			// Inexact + Underflow
*0b57cec5SDimitry Andric		A = insert(ONE,#63,#0)			// put in rounded up value
*0b57cec5SDimitry Andric		BTMPH = extractu(TMP,#2,#SR_ROUND_OFF)	// get rounding mode
*0b57cec5SDimitry Andric	}
*0b57cec5SDimitry Andric	{
*0b57cec5SDimitry Andric		USR = TMP
*0b57cec5SDimitry Andric		p0 = cmp.gt(BTMPH,#1)			// Round towards pos/neg inf?
*0b57cec5SDimitry Andric		if (!p0.new) AL = #0			// If not, zero
*0b57cec5SDimitry Andric		BTMPH ^= lsr(AH,#31)			// rounding my way --> set LSB
*0b57cec5SDimitry Andric	}
*0b57cec5SDimitry Andric	{
*0b57cec5SDimitry Andric		p0 = cmp.eq(BTMPH,#3)			// if rounding towards right inf
*0b57cec5SDimitry Andric		if (!p0.new) AL = #0			// don't go to zero
*0b57cec5SDimitry Andric		jumpr r31
*0b57cec5SDimitry Andric	}
*0b57cec5SDimitry Andric.Linvalid_zeroinf:
*0b57cec5SDimitry Andric	{
*0b57cec5SDimitry Andric		TMP = USR
*0b57cec5SDimitry Andric	}
*0b57cec5SDimitry Andric	{
*0b57cec5SDimitry Andric		A = #-1
*0b57cec5SDimitry Andric		TMP = or(TMP,#2)
*0b57cec5SDimitry Andric	}
*0b57cec5SDimitry Andric	{
*0b57cec5SDimitry Andric		USR = TMP
*0b57cec5SDimitry Andric	}
*0b57cec5SDimitry Andric	{
*0b57cec5SDimitry Andric		p0 = dfcmp.uo(A,A)			// force exception if enabled
*0b57cec5SDimitry Andric		jumpr r31
*0b57cec5SDimitry Andric	}
*0b57cec5SDimitry Andric.Linvalid_nan:
*0b57cec5SDimitry Andric	{
*0b57cec5SDimitry Andric		p0 = dfclass(B,#0x0f)			// if B is not NaN
*0b57cec5SDimitry Andric		TMP = convert_df2sf(A)			// will generate invalid if sNaN
*0b57cec5SDimitry Andric		if (p0.new) B = A 			// make it whatever A is
*0b57cec5SDimitry Andric	}
*0b57cec5SDimitry Andric	{
*0b57cec5SDimitry Andric		BL = convert_df2sf(B)			// will generate invalid if sNaN
*0b57cec5SDimitry Andric		A = #-1
*0b57cec5SDimitry Andric		jumpr r31
*0b57cec5SDimitry Andric	}
*0b57cec5SDimitry Andric	.falign
*0b57cec5SDimitry Andric.Ltrue_zero:
*0b57cec5SDimitry Andric	{
*0b57cec5SDimitry Andric		A = B
*0b57cec5SDimitry Andric		B = A
*0b57cec5SDimitry Andric	}
*0b57cec5SDimitry Andric.Ltrue_inf:
*0b57cec5SDimitry Andric	{
*0b57cec5SDimitry Andric		BH = extract(BH,#1,#31)
*0b57cec5SDimitry Andric	}
*0b57cec5SDimitry Andric	{
*0b57cec5SDimitry Andric		AH ^= asl(BH,#31)
*0b57cec5SDimitry Andric		jumpr r31
*0b57cec5SDimitry Andric	}
*0b57cec5SDimitry AndricEND(__hexagon_muldf3)
*0b57cec5SDimitry Andric
*0b57cec5SDimitry Andric#undef ATMP
*0b57cec5SDimitry Andric#undef ATMPL
*0b57cec5SDimitry Andric#undef ATMPH
*0b57cec5SDimitry Andric#undef BTMP
*0b57cec5SDimitry Andric#undef BTMPL
*0b57cec5SDimitry Andric#undef BTMPH