util/i386/muldiv.s

*436Sdmick/*
*436Sdmick * CDDL HEADER START
*436Sdmick *
*436Sdmick * The contents of this file are subject to the terms of the
*436Sdmick * Common Development and Distribution License, Version 1.0 only
*436Sdmick * (the "License").  You may not use this file except in compliance
*436Sdmick * with the License.
*436Sdmick *
*436Sdmick * You can obtain a copy of the license at usr/src/OPENSOLARIS.LICENSE
*436Sdmick * or http://www.opensolaris.org/os/licensing.
*436Sdmick * See the License for the specific language governing permissions
*436Sdmick * and limitations under the License.
*436Sdmick *
*436Sdmick * When distributing Covered Code, include this CDDL HEADER in each
*436Sdmick * file and include the License file at usr/src/OPENSOLARIS.LICENSE.
*436Sdmick * If applicable, add the following below this CDDL HEADER, with the
*436Sdmick * fields enclosed by brackets "[]" replaced with your own identifying
*436Sdmick * information: Portions Copyright [yyyy] [name of copyright owner]
*436Sdmick *
*436Sdmick * CDDL HEADER END
*436Sdmick */
*436Sdmick/*
*436Sdmick * Copyright 2005 Sun Microsystems, Inc.  All rights reserved.
*436Sdmick * Use is subject to license terms.
*436Sdmick */
*436Sdmick
*436Sdmick#if !defined(lint)
*436Sdmick	.ident	"%Z%%M%	%I%	%E% SMI"
*436Sdmick
*436Sdmick	.file	"muldiv.s"
*436Sdmick#endif
*436Sdmick
*436Sdmick#if defined(__i386) && !defined(__amd64)
*436Sdmick
*436Sdmick/*
*436Sdmick * Helper routines for 32-bit compilers to perform 64-bit math.
*436Sdmick * These are used both by the Sun and GCC compilers.
*436Sdmick */
*436Sdmick
*436Sdmick#include <sys/asm_linkage.h>
*436Sdmick#include <sys/asm_misc.h>
*436Sdmick
*436Sdmick
*436Sdmick#if defined(__lint)
*436Sdmick#include <sys/types.h>
*436Sdmick
*436Sdmick/* ARGSUSED */
*436Sdmickint64_t
*436Sdmick__mul64(int64_t a, int64_t b)
*436Sdmick{
*436Sdmick	return (0);
*436Sdmick}
*436Sdmick
*436Sdmick#else   /* __lint */
*436Sdmick
*436Sdmick/
*436Sdmick/   function __mul64(A,B:Longint):Longint;
*436Sdmick/	{Overflow is not checked}
*436Sdmick/
*436Sdmick/ We essentially do multiply by longhand, using base 2**32 digits.
*436Sdmick/               a       b	parameter A
*436Sdmick/	     x 	c       d	parameter B
*436Sdmick/		---------
*436Sdmick/               ad      bd
*436Sdmick/       ac	bc
*436Sdmick/       -----------------
*436Sdmick/       ac	ad+bc	bd
*436Sdmick/
*436Sdmick/       We can ignore ac and top 32 bits of ad+bc: if <> 0, overflow happened.
*436Sdmick/
*436Sdmick	ENTRY(__mul64)
*436Sdmick	push	%ebp
*436Sdmick	mov    	%esp,%ebp
*436Sdmick	pushl	%esi
*436Sdmick	mov	12(%ebp),%eax	/ A.hi (a)
*436Sdmick	mull	16(%ebp)	/ Multiply A.hi by B.lo (produces ad)
*436Sdmick	xchg	%ecx,%eax	/ ecx = bottom half of ad.
*436Sdmick	movl    8(%ebp),%eax	/ A.Lo (b)
*436Sdmick	movl	%eax,%esi	/ Save A.lo for later
*436Sdmick	mull	16(%ebp)	/ Multiply A.Lo by B.LO (dx:ax = bd.)
*436Sdmick	addl	%edx,%ecx	/ cx is ad
*436Sdmick	xchg	%eax,%esi       / esi is bd, eax = A.lo (d)
*436Sdmick	mull	20(%ebp)	/ Multiply A.lo * B.hi (producing bc)
*436Sdmick	addl	%ecx,%eax	/ Produce ad+bc
*436Sdmick	movl	%esi,%edx
*436Sdmick	xchg	%eax,%edx
*436Sdmick	popl	%esi
*436Sdmick	movl	%ebp,%esp
*436Sdmick	popl	%ebp
*436Sdmick	ret     $16
*436Sdmick	SET_SIZE(__mul64)
*436Sdmick
*436Sdmick#endif	/* __lint */
*436Sdmick
*436Sdmick/*
*436Sdmick * C support for 64-bit modulo and division.
*436Sdmick * Hand-customized compiler output - see comments for details.
*436Sdmick */
*436Sdmick#if defined(__lint)
*436Sdmick
*436Sdmick/* ARGSUSED */
*436Sdmickuint64_t
*436Sdmick__udiv64(uint64_t a, uint64_t b)
*436Sdmick{ return (0); }
*436Sdmick
*436Sdmick/* ARGSUSED */
*436Sdmickuint64_t
*436Sdmick__urem64(int64_t a, int64_t b)
*436Sdmick{ return (0); }
*436Sdmick
*436Sdmick/* ARGSUSED */
*436Sdmickint64_t
*436Sdmick__div64(int64_t a, int64_t b)
*436Sdmick{ return (0); }
*436Sdmick
*436Sdmick/* ARGSUSED */
*436Sdmickint64_t
*436Sdmick__rem64(int64_t a, int64_t b)
*436Sdmick{ return (0); }
*436Sdmick
*436Sdmick#else	/* __lint */
*436Sdmick
*436Sdmick/ /*
*436Sdmick/  * Unsigned division with remainder.
*436Sdmick/  * Divide two uint64_ts, and calculate remainder.
*436Sdmick/  */
*436Sdmick/ uint64_t
*436Sdmick/ UDivRem(uint64_t x, uint64_t y, uint64_t * pmod)
*436Sdmick/ {
*436Sdmick/ 	/* simple cases: y is a single uint32_t */
*436Sdmick/ 	if (HI(y) == 0) {
*436Sdmick/ 		uint32_t	div_hi, div_rem;
*436Sdmick/ 		uint32_t 	q0, q1;
*436Sdmick/
*436Sdmick/ 		/* calculate q1 */
*436Sdmick/ 		if (HI(x) < LO(y)) {
*436Sdmick/ 			/* result is a single uint32_t, use one division */
*436Sdmick/ 			q1 = 0;
*436Sdmick/ 			div_hi = HI(x);
*436Sdmick/ 		} else {
*436Sdmick/ 			/* result is a double uint32_t, use two divisions */
*436Sdmick/ 			A_DIV32(HI(x), 0, LO(y), q1, div_hi);
*436Sdmick/ 		}
*436Sdmick/
*436Sdmick/ 		/* calculate q0 and remainder */
*436Sdmick/ 		A_DIV32(LO(x), div_hi, LO(y), q0, div_rem);
*436Sdmick/
*436Sdmick/ 		/* return remainder */
*436Sdmick/ 		*pmod = div_rem;
*436Sdmick/
*436Sdmick/ 		/* return result */
*436Sdmick/ 		return (HILO(q1, q0));
*436Sdmick/
*436Sdmick/ 	} else if (HI(x) < HI(y)) {
*436Sdmick/ 		/* HI(x) < HI(y) => x < y => result is 0 */
*436Sdmick/
*436Sdmick/ 		/* return remainder */
*436Sdmick/ 		*pmod = x;
*436Sdmick/
*436Sdmick/ 		/* return result */
*436Sdmick/ 		return (0);
*436Sdmick/
*436Sdmick/ 	} else {
*436Sdmick/ 		/*
*436Sdmick/ 		 * uint64_t by uint64_t division, resulting in a one-uint32_t
*436Sdmick/ 		 * result
*436Sdmick/ 		 */
*436Sdmick/ 		uint32_t		y0, y1;
*436Sdmick/ 		uint32_t		x1, x0;
*436Sdmick/ 		uint32_t		q0;
*436Sdmick/ 		uint32_t		normshift;
*436Sdmick/
*436Sdmick/ 		/* normalize by shifting x and y so MSB(y) == 1 */
*436Sdmick/ 		HIBIT(HI(y), normshift);	/* index of highest 1 bit */
*436Sdmick/ 		normshift = 31 - normshift;
*436Sdmick/
*436Sdmick/ 		if (normshift == 0) {
*436Sdmick/ 			/* no shifting needed, and x < 2*y so q <= 1 */
*436Sdmick/ 			y1 = HI(y);
*436Sdmick/ 			y0 = LO(y);
*436Sdmick/ 			x1 = HI(x);
*436Sdmick/ 			x0 = LO(x);
*436Sdmick/
*436Sdmick/ 			/* if x >= y then q = 1 (note x1 >= y1) */
*436Sdmick/ 			if (x1 > y1 || x0 >= y0) {
*436Sdmick/ 				q0 = 1;
*436Sdmick/ 				/* subtract y from x to get remainder */
*436Sdmick/ 				A_SUB2(y0, y1, x0, x1);
*436Sdmick/ 			} else {
*436Sdmick/ 				q0 = 0;
*436Sdmick/ 			}
*436Sdmick/
*436Sdmick/ 			/* return remainder */
*436Sdmick/ 			*pmod = HILO(x1, x0);
*436Sdmick/
*436Sdmick/ 			/* return result */
*436Sdmick/ 			return (q0);
*436Sdmick/
*436Sdmick/ 		} else {
*436Sdmick/ 			/*
*436Sdmick/ 			 * the last case: result is one uint32_t, but we need to
*436Sdmick/ 			 * normalize
*436Sdmick/ 			 */
*436Sdmick/ 			uint64_t	dt;
*436Sdmick/ 			uint32_t		t0, t1, x2;
*436Sdmick/
*436Sdmick/ 			/* normalize y */
*436Sdmick/ 			dt = (y << normshift);
*436Sdmick/ 			y1 = HI(dt);
*436Sdmick/ 			y0 = LO(dt);
*436Sdmick/
*436Sdmick/ 			/* normalize x (we need 3 uint32_ts!!!) */
*436Sdmick/ 			x2 = (HI(x) >> (32 - normshift));
*436Sdmick/ 			dt = (x << normshift);
*436Sdmick/ 			x1 = HI(dt);
*436Sdmick/ 			x0 = LO(dt);
*436Sdmick/
*436Sdmick/ 			/* estimate q0, and reduce x to a two uint32_t value */
*436Sdmick/ 			A_DIV32(x1, x2, y1, q0, x1);
*436Sdmick/
*436Sdmick/ 			/* adjust q0 down if too high */
*436Sdmick/ 			/*
*436Sdmick/ 			 * because of the limited range of x2 we can only be
*436Sdmick/ 			 * one off
*436Sdmick/ 			 */
*436Sdmick/ 			A_MUL32(y0, q0, t0, t1);
*436Sdmick/ 			if (t1 > x1 || (t1 == x1 && t0 > x0)) {
*436Sdmick/ 				q0--;
*436Sdmick/ 				A_SUB2(y0, y1, t0, t1);
*436Sdmick/ 			}
*436Sdmick/ 			/* return remainder */
*436Sdmick/ 			/* subtract product from x to get remainder */
*436Sdmick/ 			A_SUB2(t0, t1, x0, x1);
*436Sdmick/ 			*pmod = (HILO(x1, x0) >> normshift);
*436Sdmick/
*436Sdmick/ 			/* return result */
*436Sdmick/ 			return (q0);
*436Sdmick/ 		}
*436Sdmick/ 	}
*436Sdmick/ }
*436Sdmick	ENTRY(UDivRem)
*436Sdmick	pushl	%ebp
*436Sdmick	pushl	%edi
*436Sdmick	pushl	%esi
*436Sdmick	subl	$48, %esp
*436Sdmick	movl	68(%esp), %edi	/ y,
*436Sdmick	testl	%edi, %edi	/ tmp63
*436Sdmick	movl	%eax, 40(%esp)	/ x, x
*436Sdmick	movl	%edx, 44(%esp)	/ x, x
*436Sdmick	movl	%edi, %esi	/, tmp62
*436Sdmick	movl	%edi, %ecx	/ tmp62, tmp63
*436Sdmick	jne	.LL2
*436Sdmick	movl	%edx, %eax	/, tmp68
*436Sdmick	cmpl	64(%esp), %eax	/ y, tmp68
*436Sdmick	jae	.LL21
*436Sdmick.LL4:
*436Sdmick	movl	72(%esp), %ebp	/ pmod,
*436Sdmick	xorl	%esi, %esi	/ <result>
*436Sdmick	movl	40(%esp), %eax	/ x, q0
*436Sdmick	movl	%ecx, %edi	/ <result>, <result>
*436Sdmick	divl	64(%esp)	/ y
*436Sdmick	movl	%edx, (%ebp)	/ div_rem,
*436Sdmick	xorl	%edx, %edx	/ q0
*436Sdmick	addl	%eax, %esi	/ q0, <result>
*436Sdmick	movl	$0, 4(%ebp)
*436Sdmick	adcl	%edx, %edi	/ q0, <result>
*436Sdmick	addl	$48, %esp
*436Sdmick	movl	%esi, %eax	/ <result>, <result>
*436Sdmick	popl	%esi
*436Sdmick	movl	%edi, %edx	/ <result>, <result>
*436Sdmick	popl	%edi
*436Sdmick	popl	%ebp
*436Sdmick	ret
*436Sdmick	.align	16
*436Sdmick.LL2:
*436Sdmick	movl	44(%esp), %eax	/ x,
*436Sdmick	xorl	%edx, %edx
*436Sdmick	cmpl	%esi, %eax	/ tmp62, tmp5
*436Sdmick	movl	%eax, 32(%esp)	/ tmp5,
*436Sdmick	movl	%edx, 36(%esp)
*436Sdmick	jae	.LL6
*436Sdmick	movl	72(%esp), %esi	/ pmod,
*436Sdmick	movl	40(%esp), %ebp	/ x,
*436Sdmick	movl	44(%esp), %ecx	/ x,
*436Sdmick	movl	%ebp, (%esi)
*436Sdmick	movl	%ecx, 4(%esi)
*436Sdmick	xorl	%edi, %edi	/ <result>
*436Sdmick	xorl	%esi, %esi	/ <result>
*436Sdmick.LL22:
*436Sdmick	addl	$48, %esp
*436Sdmick	movl	%esi, %eax	/ <result>, <result>
*436Sdmick	popl	%esi
*436Sdmick	movl	%edi, %edx	/ <result>, <result>
*436Sdmick	popl	%edi
*436Sdmick	popl	%ebp
*436Sdmick	ret
*436Sdmick	.align	16
*436Sdmick.LL21:
*436Sdmick	movl	%edi, %edx	/ tmp63, div_hi
*436Sdmick	divl	64(%esp)	/ y
*436Sdmick	movl	%eax, %ecx	/, q1
*436Sdmick	jmp	.LL4
*436Sdmick	.align	16
*436Sdmick.LL6:
*436Sdmick	movl	$31, %edi	/, tmp87
*436Sdmick	bsrl	%esi,%edx	/ tmp62, normshift
*436Sdmick	subl	%edx, %edi	/ normshift, tmp87
*436Sdmick	movl	%edi, 28(%esp)	/ tmp87,
*436Sdmick	jne	.LL8
*436Sdmick	movl	32(%esp), %edx	/, x1
*436Sdmick	cmpl	%ecx, %edx	/ y1, x1
*436Sdmick	movl	64(%esp), %edi	/ y, y0
*436Sdmick	movl	40(%esp), %esi	/ x, x0
*436Sdmick	ja	.LL10
*436Sdmick	xorl	%ebp, %ebp	/ q0
*436Sdmick	cmpl	%edi, %esi	/ y0, x0
*436Sdmick	jb	.LL11
*436Sdmick.LL10:
*436Sdmick	movl	$1, %ebp	/, q0
*436Sdmick	subl	%edi,%esi	/ y0, x0
*436Sdmick	sbbl	%ecx,%edx	/ tmp63, x1
*436Sdmick.LL11:
*436Sdmick	movl	%edx, %ecx	/ x1, x1
*436Sdmick	xorl	%edx, %edx	/ x1
*436Sdmick	xorl	%edi, %edi	/ x0
*436Sdmick	addl	%esi, %edx	/ x0, x1
*436Sdmick	adcl	%edi, %ecx	/ x0, x1
*436Sdmick	movl	72(%esp), %esi	/ pmod,
*436Sdmick	movl	%edx, (%esi)	/ x1,
*436Sdmick	movl	%ecx, 4(%esi)	/ x1,
*436Sdmick	xorl	%edi, %edi	/ <result>
*436Sdmick	movl	%ebp, %esi	/ q0, <result>
*436Sdmick	jmp	.LL22
*436Sdmick	.align	16
*436Sdmick.LL8:
*436Sdmick	movb	28(%esp), %cl
*436Sdmick	movl	64(%esp), %esi	/ y, dt
*436Sdmick	movl	68(%esp), %edi	/ y, dt
*436Sdmick	shldl	%esi, %edi	/, dt, dt
*436Sdmick	sall	%cl, %esi	/, dt
*436Sdmick	andl	$32, %ecx
*436Sdmick	jne	.LL23
*436Sdmick.LL17:
*436Sdmick	movl	$32, %ecx	/, tmp102
*436Sdmick	subl	28(%esp), %ecx	/, tmp102
*436Sdmick	movl	%esi, %ebp	/ dt, y0
*436Sdmick	movl	32(%esp), %esi
*436Sdmick	shrl	%cl, %esi	/ tmp102,
*436Sdmick	movl	%edi, 24(%esp)	/ tmp99,
*436Sdmick	movb	28(%esp), %cl
*436Sdmick	movl	%esi, 12(%esp)	/, x2
*436Sdmick	movl	44(%esp), %edi	/ x, dt
*436Sdmick	movl	40(%esp), %esi	/ x, dt
*436Sdmick	shldl	%esi, %edi	/, dt, dt
*436Sdmick	sall	%cl, %esi	/, dt
*436Sdmick	andl	$32, %ecx
*436Sdmick	je	.LL18
*436Sdmick	movl	%esi, %edi	/ dt, dt
*436Sdmick	xorl	%esi, %esi	/ dt
*436Sdmick.LL18:
*436Sdmick	movl	%edi, %ecx	/ dt,
*436Sdmick	movl	%edi, %eax	/ tmp2,
*436Sdmick	movl	%ecx, (%esp)
*436Sdmick	movl	12(%esp), %edx	/ x2,
*436Sdmick	divl	24(%esp)
*436Sdmick	movl	%edx, %ecx	/, x1
*436Sdmick	xorl	%edi, %edi
*436Sdmick	movl	%eax, 20(%esp)
*436Sdmick	movl	%ebp, %eax	/ y0, t0
*436Sdmick	mull	20(%esp)
*436Sdmick	cmpl	%ecx, %edx	/ x1, t1
*436Sdmick	movl	%edi, 4(%esp)
*436Sdmick	ja	.LL14
*436Sdmick	je	.LL24
*436Sdmick.LL15:
*436Sdmick	movl	%ecx, %edi	/ x1,
*436Sdmick	subl	%eax,%esi	/ t0, x0
*436Sdmick	sbbl	%edx,%edi	/ t1,
*436Sdmick	movl	%edi, %eax	/, x1
*436Sdmick	movl	%eax, %edx	/ x1, x1
*436Sdmick	xorl	%eax, %eax	/ x1
*436Sdmick	xorl	%ebp, %ebp	/ x0
*436Sdmick	addl	%esi, %eax	/ x0, x1
*436Sdmick	adcl	%ebp, %edx	/ x0, x1
*436Sdmick	movb	28(%esp), %cl
*436Sdmick	shrdl	%edx, %eax	/, x1, x1
*436Sdmick	shrl	%cl, %edx	/, x1
*436Sdmick	andl	$32, %ecx
*436Sdmick	je	.LL16
*436Sdmick	movl	%edx, %eax	/ x1, x1
*436Sdmick	xorl	%edx, %edx	/ x1
*436Sdmick.LL16:
*436Sdmick	movl	72(%esp), %ecx	/ pmod,
*436Sdmick	movl	20(%esp), %esi	/, <result>
*436Sdmick	xorl	%edi, %edi	/ <result>
*436Sdmick	movl	%eax, (%ecx)	/ x1,
*436Sdmick	movl	%edx, 4(%ecx)	/ x1,
*436Sdmick	jmp	.LL22
*436Sdmick	.align	16
*436Sdmick.LL24:
*436Sdmick	cmpl	%esi, %eax	/ x0, t0
*436Sdmick	jbe	.LL15
*436Sdmick.LL14:
*436Sdmick	decl	20(%esp)
*436Sdmick	subl	%ebp,%eax	/ y0, t0
*436Sdmick	sbbl	24(%esp),%edx	/, t1
*436Sdmick	jmp	.LL15
*436Sdmick.LL23:
*436Sdmick	movl	%esi, %edi	/ dt, dt
*436Sdmick	xorl	%esi, %esi	/ dt
*436Sdmick	jmp	.LL17
*436Sdmick	SET_SIZE(UDivRem)
*436Sdmick
*436Sdmick/*
*436Sdmick * Unsigned division without remainder.
*436Sdmick */
*436Sdmick/ uint64_t
*436Sdmick/ UDiv(uint64_t x, uint64_t y)
*436Sdmick/ {
*436Sdmick/ 	if (HI(y) == 0) {
*436Sdmick/ 		/* simple cases: y is a single uint32_t */
*436Sdmick/ 		uint32_t	div_hi, div_rem;
*436Sdmick/ 		uint32_t	q0, q1;
*436Sdmick/
*436Sdmick/ 		/* calculate q1 */
*436Sdmick/ 		if (HI(x) < LO(y)) {
*436Sdmick/ 			/* result is a single uint32_t, use one division */
*436Sdmick/ 			q1 = 0;
*436Sdmick/ 			div_hi = HI(x);
*436Sdmick/ 		} else {
*436Sdmick/ 			/* result is a double uint32_t, use two divisions */
*436Sdmick/ 			A_DIV32(HI(x), 0, LO(y), q1, div_hi);
*436Sdmick/ 		}
*436Sdmick/
*436Sdmick/ 		/* calculate q0 and remainder */
*436Sdmick/ 		A_DIV32(LO(x), div_hi, LO(y), q0, div_rem);
*436Sdmick/
*436Sdmick/ 		/* return result */
*436Sdmick/ 		return (HILO(q1, q0));
*436Sdmick/
*436Sdmick/ 	} else if (HI(x) < HI(y)) {
*436Sdmick/ 		/* HI(x) < HI(y) => x < y => result is 0 */
*436Sdmick/
*436Sdmick/ 		/* return result */
*436Sdmick/ 		return (0);
*436Sdmick/
*436Sdmick/ 	} else {
*436Sdmick/ 		/*
*436Sdmick/ 		 * uint64_t by uint64_t division, resulting in a one-uint32_t
*436Sdmick/ 		 * result
*436Sdmick/ 		 */
*436Sdmick/ 		uint32_t		y0, y1;
*436Sdmick/ 		uint32_t		x1, x0;
*436Sdmick/ 		uint32_t		q0;
*436Sdmick/ 		unsigned		normshift;
*436Sdmick/
*436Sdmick/ 		/* normalize by shifting x and y so MSB(y) == 1 */
*436Sdmick/ 		HIBIT(HI(y), normshift);	/* index of highest 1 bit */
*436Sdmick/ 		normshift = 31 - normshift;
*436Sdmick/
*436Sdmick/ 		if (normshift == 0) {
*436Sdmick/ 			/* no shifting needed, and x < 2*y so q <= 1 */
*436Sdmick/ 			y1 = HI(y);
*436Sdmick/ 			y0 = LO(y);
*436Sdmick/ 			x1 = HI(x);
*436Sdmick/ 			x0 = LO(x);
*436Sdmick/
*436Sdmick/ 			/* if x >= y then q = 1 (note x1 >= y1) */
*436Sdmick/ 			if (x1 > y1 || x0 >= y0) {
*436Sdmick/ 				q0 = 1;
*436Sdmick/ 				/* subtract y from x to get remainder */
*436Sdmick/ 				/* A_SUB2(y0, y1, x0, x1); */
*436Sdmick/ 			} else {
*436Sdmick/ 				q0 = 0;
*436Sdmick/ 			}
*436Sdmick/
*436Sdmick/ 			/* return result */
*436Sdmick/ 			return (q0);
*436Sdmick/
*436Sdmick/ 		} else {
*436Sdmick/ 			/*
*436Sdmick/ 			 * the last case: result is one uint32_t, but we need to
*436Sdmick/ 			 * normalize
*436Sdmick/ 			 */
*436Sdmick/ 			uint64_t	dt;
*436Sdmick/ 			uint32_t		t0, t1, x2;
*436Sdmick/
*436Sdmick/ 			/* normalize y */
*436Sdmick/ 			dt = (y << normshift);
*436Sdmick/ 			y1 = HI(dt);
*436Sdmick/ 			y0 = LO(dt);
*436Sdmick/
*436Sdmick/ 			/* normalize x (we need 3 uint32_ts!!!) */
*436Sdmick/ 			x2 = (HI(x) >> (32 - normshift));
*436Sdmick/ 			dt = (x << normshift);
*436Sdmick/ 			x1 = HI(dt);
*436Sdmick/ 			x0 = LO(dt);
*436Sdmick/
*436Sdmick/ 			/* estimate q0, and reduce x to a two uint32_t value */
*436Sdmick/ 			A_DIV32(x1, x2, y1, q0, x1);
*436Sdmick/
*436Sdmick/ 			/* adjust q0 down if too high */
*436Sdmick/ 			/*
*436Sdmick/ 			 * because of the limited range of x2 we can only be
*436Sdmick/ 			 * one off
*436Sdmick/ 			 */
*436Sdmick/ 			A_MUL32(y0, q0, t0, t1);
*436Sdmick/ 			if (t1 > x1 || (t1 == x1 && t0 > x0)) {
*436Sdmick/ 				q0--;
*436Sdmick/ 			}
*436Sdmick/ 			/* return result */
*436Sdmick/ 			return (q0);
*436Sdmick/ 		}
*436Sdmick/ 	}
*436Sdmick/ }
*436Sdmick	ENTRY(UDiv)
*436Sdmick	pushl	%ebp
*436Sdmick	pushl	%edi
*436Sdmick	pushl	%esi
*436Sdmick	subl	$40, %esp
*436Sdmick	movl	%edx, 36(%esp)	/ x, x
*436Sdmick	movl	60(%esp), %edx	/ y,
*436Sdmick	testl	%edx, %edx	/ tmp62
*436Sdmick	movl	%eax, 32(%esp)	/ x, x
*436Sdmick	movl	%edx, %ecx	/ tmp61, tmp62
*436Sdmick	movl	%edx, %eax	/, tmp61
*436Sdmick	jne	.LL26
*436Sdmick	movl	36(%esp), %esi	/ x,
*436Sdmick	cmpl	56(%esp), %esi	/ y, tmp67
*436Sdmick	movl	%esi, %eax	/, tmp67
*436Sdmick	movl	%esi, %edx	/ tmp67, div_hi
*436Sdmick	jb	.LL28
*436Sdmick	movl	%ecx, %edx	/ tmp62, div_hi
*436Sdmick	divl	56(%esp)	/ y
*436Sdmick	movl	%eax, %ecx	/, q1
*436Sdmick.LL28:
*436Sdmick	xorl	%esi, %esi	/ <result>
*436Sdmick	movl	%ecx, %edi	/ <result>, <result>
*436Sdmick	movl	32(%esp), %eax	/ x, q0
*436Sdmick	xorl	%ecx, %ecx	/ q0
*436Sdmick	divl	56(%esp)	/ y
*436Sdmick	addl	%eax, %esi	/ q0, <result>
*436Sdmick	adcl	%ecx, %edi	/ q0, <result>
*436Sdmick.LL25:
*436Sdmick	addl	$40, %esp
*436Sdmick	movl	%esi, %eax	/ <result>, <result>
*436Sdmick	popl	%esi
*436Sdmick	movl	%edi, %edx	/ <result>, <result>
*436Sdmick	popl	%edi
*436Sdmick	popl	%ebp
*436Sdmick	ret
*436Sdmick	.align	16
*436Sdmick.LL26:
*436Sdmick	movl	36(%esp), %esi	/ x,
*436Sdmick	xorl	%edi, %edi
*436Sdmick	movl	%esi, 24(%esp)	/ tmp1,
*436Sdmick	movl	%edi, 28(%esp)
*436Sdmick	xorl	%esi, %esi	/ <result>
*436Sdmick	xorl	%edi, %edi	/ <result>
*436Sdmick	cmpl	%eax, 24(%esp)	/ tmp61,
*436Sdmick	jb	.LL25
*436Sdmick	bsrl	%eax,%ebp	/ tmp61, normshift
*436Sdmick	movl	$31, %eax	/, tmp85
*436Sdmick	subl	%ebp, %eax	/ normshift, normshift
*436Sdmick	jne	.LL32
*436Sdmick	movl	24(%esp), %eax	/, x1
*436Sdmick	cmpl	%ecx, %eax	/ tmp62, x1
*436Sdmick	movl	56(%esp), %esi	/ y, y0
*436Sdmick	movl	32(%esp), %edx	/ x, x0
*436Sdmick	ja	.LL34
*436Sdmick	xorl	%eax, %eax	/ q0
*436Sdmick	cmpl	%esi, %edx	/ y0, x0
*436Sdmick	jb	.LL35
*436Sdmick.LL34:
*436Sdmick	movl	$1, %eax	/, q0
*436Sdmick.LL35:
*436Sdmick	movl	%eax, %esi	/ q0, <result>
*436Sdmick	xorl	%edi, %edi	/ <result>
*436Sdmick.LL45:
*436Sdmick	addl	$40, %esp
*436Sdmick	movl	%esi, %eax	/ <result>, <result>
*436Sdmick	popl	%esi
*436Sdmick	movl	%edi, %edx	/ <result>, <result>
*436Sdmick	popl	%edi
*436Sdmick	popl	%ebp
*436Sdmick	ret
*436Sdmick	.align	16
*436Sdmick.LL32:
*436Sdmick	movb	%al, %cl
*436Sdmick	movl	56(%esp), %esi	/ y,
*436Sdmick	movl	60(%esp), %edi	/ y,
*436Sdmick	shldl	%esi, %edi
*436Sdmick	sall	%cl, %esi
*436Sdmick	andl	$32, %ecx
*436Sdmick	jne	.LL43
*436Sdmick.LL40:
*436Sdmick	movl	$32, %ecx	/, tmp96
*436Sdmick	subl	%eax, %ecx	/ normshift, tmp96
*436Sdmick	movl	%edi, %edx
*436Sdmick	movl	%edi, 20(%esp)	/, dt
*436Sdmick	movl	24(%esp), %ebp	/, x2
*436Sdmick	xorl	%edi, %edi
*436Sdmick	shrl	%cl, %ebp	/ tmp96, x2
*436Sdmick	movl	%esi, 16(%esp)	/, dt
*436Sdmick	movb	%al, %cl
*436Sdmick	movl	32(%esp), %esi	/ x, dt
*436Sdmick	movl	%edi, 12(%esp)
*436Sdmick	movl	36(%esp), %edi	/ x, dt
*436Sdmick	shldl	%esi, %edi	/, dt, dt
*436Sdmick	sall	%cl, %esi	/, dt
*436Sdmick	andl	$32, %ecx
*436Sdmick	movl	%edx, 8(%esp)
*436Sdmick	je	.LL41
*436Sdmick	movl	%esi, %edi	/ dt, dt
*436Sdmick	xorl	%esi, %esi	/ dt
*436Sdmick.LL41:
*436Sdmick	xorl	%ecx, %ecx
*436Sdmick	movl	%edi, %eax	/ tmp1,
*436Sdmick	movl	%ebp, %edx	/ x2,
*436Sdmick	divl	8(%esp)
*436Sdmick	movl	%edx, %ebp	/, x1
*436Sdmick	movl	%ecx, 4(%esp)
*436Sdmick	movl	%eax, %ecx	/, q0
*436Sdmick	movl	16(%esp), %eax	/ dt,
*436Sdmick	mull	%ecx	/ q0
*436Sdmick	cmpl	%ebp, %edx	/ x1, t1
*436Sdmick	movl	%edi, (%esp)
*436Sdmick	movl	%esi, %edi	/ dt, x0
*436Sdmick	ja	.LL38
*436Sdmick	je	.LL44
*436Sdmick.LL39:
*436Sdmick	movl	%ecx, %esi	/ q0, <result>
*436Sdmick.LL46:
*436Sdmick	xorl	%edi, %edi	/ <result>
*436Sdmick	jmp	.LL45
*436Sdmick.LL44:
*436Sdmick	cmpl	%edi, %eax	/ x0, t0
*436Sdmick	jbe	.LL39
*436Sdmick.LL38:
*436Sdmick	decl	%ecx		/ q0
*436Sdmick	movl	%ecx, %esi	/ q0, <result>
*436Sdmick	jmp	.LL46
*436Sdmick.LL43:
*436Sdmick	movl	%esi, %edi
*436Sdmick	xorl	%esi, %esi
*436Sdmick	jmp	.LL40
*436Sdmick	SET_SIZE(UDiv)
*436Sdmick
*436Sdmick/*
*436Sdmick * __udiv64
*436Sdmick *
*436Sdmick * Perform division of two unsigned 64-bit quantities, returning the
*436Sdmick * quotient in %edx:%eax.  __udiv64 pops the arguments on return,
*436Sdmick */
*436Sdmick	ENTRY(__udiv64)
*436Sdmick	movl	4(%esp), %eax	/ x, x
*436Sdmick	movl	8(%esp), %edx	/ x, x
*436Sdmick	pushl	16(%esp)	/ y
*436Sdmick	pushl	16(%esp)
*436Sdmick	call	UDiv
*436Sdmick	addl	$8, %esp
*436Sdmick	ret     $16
*436Sdmick	SET_SIZE(__udiv64)
*436Sdmick
*436Sdmick/*
*436Sdmick * __urem64
*436Sdmick *
*436Sdmick * Perform division of two unsigned 64-bit quantities, returning the
*436Sdmick * remainder in %edx:%eax.  __urem64 pops the arguments on return
*436Sdmick */
*436Sdmick	ENTRY(__urem64)
*436Sdmick	subl	$12, %esp
*436Sdmick	movl	%esp, %ecx	/, tmp65
*436Sdmick	movl	16(%esp), %eax	/ x, x
*436Sdmick	movl	20(%esp), %edx	/ x, x
*436Sdmick	pushl	%ecx		/ tmp65
*436Sdmick	pushl	32(%esp)	/ y
*436Sdmick	pushl	32(%esp)
*436Sdmick	call	UDivRem
*436Sdmick	movl	12(%esp), %eax	/ rem, rem
*436Sdmick	movl	16(%esp), %edx	/ rem, rem
*436Sdmick	addl	$24, %esp
*436Sdmick	ret	$16
*436Sdmick	SET_SIZE(__urem64)
*436Sdmick
*436Sdmick/*
*436Sdmick * __div64
*436Sdmick *
*436Sdmick * Perform division of two signed 64-bit quantities, returning the
*436Sdmick * quotient in %edx:%eax.  __div64 pops the arguments on return.
*436Sdmick */
*436Sdmick/ int64_t
*436Sdmick/ __div64(int64_t x, int64_t y)
*436Sdmick/ {
*436Sdmick/ 	int		negative;
*436Sdmick/ 	uint64_t	xt, yt, r;
*436Sdmick/
*436Sdmick/ 	if (x < 0) {
*436Sdmick/ 		xt = -(uint64_t) x;
*436Sdmick/ 		negative = 1;
*436Sdmick/ 	} else {
*436Sdmick/ 		xt = x;
*436Sdmick/ 		negative = 0;
*436Sdmick/ 	}
*436Sdmick/ 	if (y < 0) {
*436Sdmick/ 		yt = -(uint64_t) y;
*436Sdmick/ 		negative ^= 1;
*436Sdmick/ 	} else {
*436Sdmick/ 		yt = y;
*436Sdmick/ 	}
*436Sdmick/ 	r = UDiv(xt, yt);
*436Sdmick/ 	return (negative ? (int64_t) - r : r);
*436Sdmick/ }
*436Sdmick	ENTRY(__div64)
*436Sdmick	pushl	%ebp
*436Sdmick	pushl	%edi
*436Sdmick	pushl	%esi
*436Sdmick	subl	$8, %esp
*436Sdmick	movl	28(%esp), %edx	/ x, x
*436Sdmick	testl	%edx, %edx	/ x
*436Sdmick	movl	24(%esp), %eax	/ x, x
*436Sdmick	movl	32(%esp), %esi	/ y, y
*436Sdmick	movl	36(%esp), %edi	/ y, y
*436Sdmick	js	.LL84
*436Sdmick	xorl	%ebp, %ebp	/ negative
*436Sdmick	testl	%edi, %edi	/ y
*436Sdmick	movl	%eax, (%esp)	/ x, xt
*436Sdmick	movl	%edx, 4(%esp)	/ x, xt
*436Sdmick	movl	%esi, %eax	/ y, yt
*436Sdmick	movl	%edi, %edx	/ y, yt
*436Sdmick	js	.LL85
*436Sdmick.LL82:
*436Sdmick	pushl	%edx		/ yt
*436Sdmick	pushl	%eax		/ yt
*436Sdmick	movl	8(%esp), %eax	/ xt, xt
*436Sdmick	movl	12(%esp), %edx	/ xt, xt
*436Sdmick	call	UDiv
*436Sdmick	popl	%ecx
*436Sdmick	testl	%ebp, %ebp	/ negative
*436Sdmick	popl	%esi
*436Sdmick	je	.LL83
*436Sdmick	negl	%eax		/ r
*436Sdmick	adcl	$0, %edx	/, r
*436Sdmick	negl	%edx		/ r
*436Sdmick.LL83:
*436Sdmick	addl	$8, %esp
*436Sdmick	popl	%esi
*436Sdmick	popl	%edi
*436Sdmick	popl	%ebp
*436Sdmick	ret	$16
*436Sdmick	.align	16
*436Sdmick.LL84:
*436Sdmick	negl	%eax		/ x
*436Sdmick	adcl	$0, %edx	/, x
*436Sdmick	negl	%edx		/ x
*436Sdmick	testl	%edi, %edi	/ y
*436Sdmick	movl	%eax, (%esp)	/ x, xt
*436Sdmick	movl	%edx, 4(%esp)	/ x, xt
*436Sdmick	movl	$1, %ebp	/, negative
*436Sdmick	movl	%esi, %eax	/ y, yt
*436Sdmick	movl	%edi, %edx	/ y, yt
*436Sdmick	jns	.LL82
*436Sdmick	.align	16
*436Sdmick.LL85:
*436Sdmick	negl	%eax		/ yt
*436Sdmick	adcl	$0, %edx	/, yt
*436Sdmick	negl	%edx		/ yt
*436Sdmick	xorl	$1, %ebp	/, negative
*436Sdmick	jmp	.LL82
*436Sdmick	SET_SIZE(__div64)
*436Sdmick
*436Sdmick/*
*436Sdmick * __rem64
*436Sdmick *
*436Sdmick * Perform division of two signed 64-bit quantities, returning the
*436Sdmick * remainder in %edx:%eax.  __rem64 pops the arguments on return.
*436Sdmick */
*436Sdmick/ int64_t
*436Sdmick/ __rem64(int64_t x, int64_t y)
*436Sdmick/ {
*436Sdmick/ 	uint64_t	xt, yt, rem;
*436Sdmick/
*436Sdmick/ 	if (x < 0) {
*436Sdmick/ 		xt = -(uint64_t) x;
*436Sdmick/ 	} else {
*436Sdmick/ 		xt = x;
*436Sdmick/ 	}
*436Sdmick/ 	if (y < 0) {
*436Sdmick/ 		yt = -(uint64_t) y;
*436Sdmick/ 	} else {
*436Sdmick/ 		yt = y;
*436Sdmick/ 	}
*436Sdmick/ 	(void) UDivRem(xt, yt, &rem);
*436Sdmick/ 	return (x < 0 ? (int64_t) - rem : rem);
*436Sdmick/ }
*436Sdmick	ENTRY(__rem64)
*436Sdmick	pushl	%edi
*436Sdmick	pushl	%esi
*436Sdmick	subl	$20, %esp
*436Sdmick	movl	36(%esp), %ecx	/ x,
*436Sdmick	movl	32(%esp), %esi	/ x,
*436Sdmick	movl	36(%esp), %edi	/ x,
*436Sdmick	testl	%ecx, %ecx
*436Sdmick	movl	40(%esp), %eax	/ y, y
*436Sdmick	movl	44(%esp), %edx	/ y, y
*436Sdmick	movl	%esi, (%esp)	/, xt
*436Sdmick	movl	%edi, 4(%esp)	/, xt
*436Sdmick	js	.LL92
*436Sdmick	testl	%edx, %edx	/ y
*436Sdmick	movl	%eax, %esi	/ y, yt
*436Sdmick	movl	%edx, %edi	/ y, yt
*436Sdmick	js	.LL93
*436Sdmick.LL90:
*436Sdmick	leal	8(%esp), %eax	/, tmp66
*436Sdmick	pushl	%eax		/ tmp66
*436Sdmick	pushl	%edi		/ yt
*436Sdmick	pushl	%esi		/ yt
*436Sdmick	movl	12(%esp), %eax	/ xt, xt
*436Sdmick	movl	16(%esp), %edx	/ xt, xt
*436Sdmick	call	UDivRem
*436Sdmick	addl	$12, %esp
*436Sdmick	movl	36(%esp), %edi	/ x,
*436Sdmick	testl	%edi, %edi
*436Sdmick	movl	8(%esp), %eax	/ rem, rem
*436Sdmick	movl	12(%esp), %edx	/ rem, rem
*436Sdmick	js	.LL94
*436Sdmick	addl	$20, %esp
*436Sdmick	popl	%esi
*436Sdmick	popl	%edi
*436Sdmick	ret	$16
*436Sdmick	.align	16
*436Sdmick.LL92:
*436Sdmick	negl	%esi
*436Sdmick	adcl	$0, %edi
*436Sdmick	negl	%edi
*436Sdmick	testl	%edx, %edx	/ y
*436Sdmick	movl	%esi, (%esp)	/, xt
*436Sdmick	movl	%edi, 4(%esp)	/, xt
*436Sdmick	movl	%eax, %esi	/ y, yt
*436Sdmick	movl	%edx, %edi	/ y, yt
*436Sdmick	jns	.LL90
*436Sdmick	.align	16
*436Sdmick.LL93:
*436Sdmick	negl	%esi		/ yt
*436Sdmick	adcl	$0, %edi	/, yt
*436Sdmick	negl	%edi		/ yt
*436Sdmick	jmp	.LL90
*436Sdmick	.align	16
*436Sdmick.LL94:
*436Sdmick	negl	%eax		/ rem
*436Sdmick	adcl	$0, %edx	/, rem
*436Sdmick	addl	$20, %esp
*436Sdmick	popl	%esi
*436Sdmick	negl	%edx		/ rem
*436Sdmick	popl	%edi
*436Sdmick	ret	$16
*436Sdmick	SET_SIZE(__rem64)
*436Sdmick
*436Sdmick#endif	/* __lint */
*436Sdmick
*436Sdmick#if defined(__lint)
*436Sdmick
*436Sdmick/*
*436Sdmick * C support for 64-bit modulo and division.
*436Sdmick * GNU routines callable from C (though generated by the compiler).
*436Sdmick * Hand-customized compiler output - see comments for details.
*436Sdmick */
*436Sdmick/*ARGSUSED*/
*436Sdmickunsigned long long
*436Sdmick__udivdi3(unsigned long long a, unsigned long long b)
*436Sdmick{ return (0); }
*436Sdmick
*436Sdmick/*ARGSUSED*/
*436Sdmickunsigned long long
*436Sdmick__umoddi3(unsigned long long a, unsigned long long b)
*436Sdmick{ return (0); }
*436Sdmick
*436Sdmick/*ARGSUSED*/
*436Sdmicklong long
*436Sdmick__divdi3(long long a, long long b)
*436Sdmick{ return (0); }
*436Sdmick
*436Sdmick/*ARGSUSED*/
*436Sdmicklong long
*436Sdmick__moddi3(long long a, long long b)
*436Sdmick{ return (0); }
*436Sdmick
*436Sdmick/* ARGSUSED */
*436Sdmickint64_t __divrem64(int64_t a, int64_t b)
*436Sdmick{ return (0); }
*436Sdmick
*436Sdmick/* ARGSUSED */
*436Sdmickuint64_t __udivrem64(uint64_t a, uint64_t b)
*436Sdmick{ return (0); }
*436Sdmick
*436Sdmick#else	/* __lint */
*436Sdmick
*436Sdmick/*
*436Sdmick * int32_t/int64_t division/manipulation
*436Sdmick *
*436Sdmick * Hand-customized compiler output: the non-GCC entry points depart from
*436Sdmick * the SYS V ABI by requiring their arguments to be popped, and in the
*436Sdmick * [u]divrem64 cases returning the remainder in %ecx:%esi. Note the
*436Sdmick * compiler-generated use of %edx:%eax for the first argument of
*436Sdmick * internal entry points.
*436Sdmick *
*436Sdmick * Inlines for speed:
*436Sdmick * - counting the number of leading zeros in a word
*436Sdmick * - multiplying two 32-bit numbers giving a 64-bit result
*436Sdmick * - dividing a 64-bit number by a 32-bit number, giving both quotient
*436Sdmick *	and remainder
*436Sdmick * - subtracting two 64-bit results
*436Sdmick */
*436Sdmick/ #define	LO(X)		((uint32_t)(X) & 0xffffffff)
*436Sdmick/ #define	HI(X)		((uint32_t)((X) >> 32) & 0xffffffff)
*436Sdmick/ #define	HILO(H, L)	(((uint64_t)(H) << 32) + (L))
*436Sdmick/
*436Sdmick/ /* give index of highest bit */
*436Sdmick/ #define	HIBIT(a, r) \
*436Sdmick/     asm("bsrl %1,%0": "=r"((uint32_t)(r)) : "g" (a))
*436Sdmick/
*436Sdmick/ /* multiply two uint32_ts resulting in a uint64_t */
*436Sdmick/ #define	A_MUL32(a, b, lo, hi) \
*436Sdmick/     asm("mull %2" \
*436Sdmick/ 	: "=a"((uint32_t)(lo)), "=d"((uint32_t)(hi)) : "g" (b), "0"(a))
*436Sdmick/
*436Sdmick/ /* divide a uint64_t by a uint32_t */
*436Sdmick/ #define	A_DIV32(lo, hi, b, q, r) \
*436Sdmick/     asm("divl %2" \
*436Sdmick/ 	: "=a"((uint32_t)(q)), "=d"((uint32_t)(r)) \
*436Sdmick/ 	: "g" (b), "0"((uint32_t)(lo)), "1"((uint32_t)hi))
*436Sdmick/
*436Sdmick/ /* subtract two uint64_ts (with borrow) */
*436Sdmick/ #define	A_SUB2(bl, bh, al, ah) \
*436Sdmick/     asm("subl %4,%0\n\tsbbl %5,%1" \
*436Sdmick/ 	: "=&r"((uint32_t)(al)), "=r"((uint32_t)(ah)) \
*436Sdmick/ 	: "0"((uint32_t)(al)), "1"((uint32_t)(ah)), "g"((uint32_t)(bl)), \
*436Sdmick/ 	"g"((uint32_t)(bh)))
*436Sdmick
*436Sdmick/*
*436Sdmick * __udivdi3
*436Sdmick *
*436Sdmick * Perform division of two unsigned 64-bit quantities, returning the
*436Sdmick * quotient in %edx:%eax.
*436Sdmick */
*436Sdmick	ENTRY(__udivdi3)
*436Sdmick	movl	4(%esp), %eax	/ x, x
*436Sdmick	movl	8(%esp), %edx	/ x, x
*436Sdmick	pushl	16(%esp)	/ y
*436Sdmick	pushl	16(%esp)
*436Sdmick	call	UDiv
*436Sdmick	addl	$8, %esp
*436Sdmick	ret
*436Sdmick	SET_SIZE(__udivdi3)
*436Sdmick
*436Sdmick/*
*436Sdmick * __umoddi3
*436Sdmick *
*436Sdmick * Perform division of two unsigned 64-bit quantities, returning the
*436Sdmick * remainder in %edx:%eax.
*436Sdmick */
*436Sdmick	ENTRY(__umoddi3)
*436Sdmick	subl	$12, %esp
*436Sdmick	movl	%esp, %ecx	/, tmp65
*436Sdmick	movl	16(%esp), %eax	/ x, x
*436Sdmick	movl	20(%esp), %edx	/ x, x
*436Sdmick	pushl	%ecx		/ tmp65
*436Sdmick	pushl	32(%esp)	/ y
*436Sdmick	pushl	32(%esp)
*436Sdmick	call	UDivRem
*436Sdmick	movl	12(%esp), %eax	/ rem, rem
*436Sdmick	movl	16(%esp), %edx	/ rem, rem
*436Sdmick	addl	$24, %esp
*436Sdmick	ret
*436Sdmick	SET_SIZE(__umoddi3)
*436Sdmick
*436Sdmick/*
*436Sdmick * __divdi3
*436Sdmick *
*436Sdmick * Perform division of two signed 64-bit quantities, returning the
*436Sdmick * quotient in %edx:%eax.
*436Sdmick */
*436Sdmick/ int64_t
*436Sdmick/ __divdi3(int64_t x, int64_t y)
*436Sdmick/ {
*436Sdmick/ 	int		negative;
*436Sdmick/ 	uint64_t	xt, yt, r;
*436Sdmick/
*436Sdmick/ 	if (x < 0) {
*436Sdmick/ 		xt = -(uint64_t) x;
*436Sdmick/ 		negative = 1;
*436Sdmick/ 	} else {
*436Sdmick/ 		xt = x;
*436Sdmick/ 		negative = 0;
*436Sdmick/ 	}
*436Sdmick/ 	if (y < 0) {
*436Sdmick/ 		yt = -(uint64_t) y;
*436Sdmick/ 		negative ^= 1;
*436Sdmick/ 	} else {
*436Sdmick/ 		yt = y;
*436Sdmick/ 	}
*436Sdmick/ 	r = UDiv(xt, yt);
*436Sdmick/ 	return (negative ? (int64_t) - r : r);
*436Sdmick/ }
*436Sdmick	ENTRY(__divdi3)
*436Sdmick	pushl	%ebp
*436Sdmick	pushl	%edi
*436Sdmick	pushl	%esi
*436Sdmick	subl	$8, %esp
*436Sdmick	movl	28(%esp), %edx	/ x, x
*436Sdmick	testl	%edx, %edx	/ x
*436Sdmick	movl	24(%esp), %eax	/ x, x
*436Sdmick	movl	32(%esp), %esi	/ y, y
*436Sdmick	movl	36(%esp), %edi	/ y, y
*436Sdmick	js	.LL55
*436Sdmick	xorl	%ebp, %ebp	/ negative
*436Sdmick	testl	%edi, %edi	/ y
*436Sdmick	movl	%eax, (%esp)	/ x, xt
*436Sdmick	movl	%edx, 4(%esp)	/ x, xt
*436Sdmick	movl	%esi, %eax	/ y, yt
*436Sdmick	movl	%edi, %edx	/ y, yt
*436Sdmick	js	.LL56
*436Sdmick.LL53:
*436Sdmick	pushl	%edx		/ yt
*436Sdmick	pushl	%eax		/ yt
*436Sdmick	movl	8(%esp), %eax	/ xt, xt
*436Sdmick	movl	12(%esp), %edx	/ xt, xt
*436Sdmick	call	UDiv
*436Sdmick	popl	%ecx
*436Sdmick	testl	%ebp, %ebp	/ negative
*436Sdmick	popl	%esi
*436Sdmick	je	.LL54
*436Sdmick	negl	%eax		/ r
*436Sdmick	adcl	$0, %edx	/, r
*436Sdmick	negl	%edx		/ r
*436Sdmick.LL54:
*436Sdmick	addl	$8, %esp
*436Sdmick	popl	%esi
*436Sdmick	popl	%edi
*436Sdmick	popl	%ebp
*436Sdmick	ret
*436Sdmick	.align	16
*436Sdmick.LL55:
*436Sdmick	negl	%eax		/ x
*436Sdmick	adcl	$0, %edx	/, x
*436Sdmick	negl	%edx		/ x
*436Sdmick	testl	%edi, %edi	/ y
*436Sdmick	movl	%eax, (%esp)	/ x, xt
*436Sdmick	movl	%edx, 4(%esp)	/ x, xt
*436Sdmick	movl	$1, %ebp	/, negative
*436Sdmick	movl	%esi, %eax	/ y, yt
*436Sdmick	movl	%edi, %edx	/ y, yt
*436Sdmick	jns	.LL53
*436Sdmick	.align	16
*436Sdmick.LL56:
*436Sdmick	negl	%eax		/ yt
*436Sdmick	adcl	$0, %edx	/, yt
*436Sdmick	negl	%edx		/ yt
*436Sdmick	xorl	$1, %ebp	/, negative
*436Sdmick	jmp	.LL53
*436Sdmick	SET_SIZE(__divdi3)
*436Sdmick
*436Sdmick/*
*436Sdmick * __moddi3
*436Sdmick *
*436Sdmick * Perform division of two signed 64-bit quantities, returning the
*436Sdmick * quotient in %edx:%eax.
*436Sdmick */
*436Sdmick/ int64_t
*436Sdmick/ __moddi3(int64_t x, int64_t y)
*436Sdmick/ {
*436Sdmick/ 	uint64_t	xt, yt, rem;
*436Sdmick/
*436Sdmick/ 	if (x < 0) {
*436Sdmick/ 		xt = -(uint64_t) x;
*436Sdmick/ 	} else {
*436Sdmick/ 		xt = x;
*436Sdmick/ 	}
*436Sdmick/ 	if (y < 0) {
*436Sdmick/ 		yt = -(uint64_t) y;
*436Sdmick/ 	} else {
*436Sdmick/ 		yt = y;
*436Sdmick/ 	}
*436Sdmick/ 	(void) UDivRem(xt, yt, &rem);
*436Sdmick/ 	return (x < 0 ? (int64_t) - rem : rem);
*436Sdmick/ }
*436Sdmick	ENTRY(__moddi3)
*436Sdmick	pushl	%edi
*436Sdmick	pushl	%esi
*436Sdmick	subl	$20, %esp
*436Sdmick	movl	36(%esp), %ecx	/ x,
*436Sdmick	movl	32(%esp), %esi	/ x,
*436Sdmick	movl	36(%esp), %edi	/ x,
*436Sdmick	testl	%ecx, %ecx
*436Sdmick	movl	40(%esp), %eax	/ y, y
*436Sdmick	movl	44(%esp), %edx	/ y, y
*436Sdmick	movl	%esi, (%esp)	/, xt
*436Sdmick	movl	%edi, 4(%esp)	/, xt
*436Sdmick	js	.LL63
*436Sdmick	testl	%edx, %edx	/ y
*436Sdmick	movl	%eax, %esi	/ y, yt
*436Sdmick	movl	%edx, %edi	/ y, yt
*436Sdmick	js	.LL64
*436Sdmick.LL61:
*436Sdmick	leal	8(%esp), %eax	/, tmp66
*436Sdmick	pushl	%eax		/ tmp66
*436Sdmick	pushl	%edi		/ yt
*436Sdmick	pushl	%esi		/ yt
*436Sdmick	movl	12(%esp), %eax	/ xt, xt
*436Sdmick	movl	16(%esp), %edx	/ xt, xt
*436Sdmick	call	UDivRem
*436Sdmick	addl	$12, %esp
*436Sdmick	movl	36(%esp), %edi	/ x,
*436Sdmick	testl	%edi, %edi
*436Sdmick	movl	8(%esp), %eax	/ rem, rem
*436Sdmick	movl	12(%esp), %edx	/ rem, rem
*436Sdmick	js	.LL65
*436Sdmick	addl	$20, %esp
*436Sdmick	popl	%esi
*436Sdmick	popl	%edi
*436Sdmick	ret
*436Sdmick	.align	16
*436Sdmick.LL63:
*436Sdmick	negl	%esi
*436Sdmick	adcl	$0, %edi
*436Sdmick	negl	%edi
*436Sdmick	testl	%edx, %edx	/ y
*436Sdmick	movl	%esi, (%esp)	/, xt
*436Sdmick	movl	%edi, 4(%esp)	/, xt
*436Sdmick	movl	%eax, %esi	/ y, yt
*436Sdmick	movl	%edx, %edi	/ y, yt
*436Sdmick	jns	.LL61
*436Sdmick	.align	16
*436Sdmick.LL64:
*436Sdmick	negl	%esi		/ yt
*436Sdmick	adcl	$0, %edi	/, yt
*436Sdmick	negl	%edi		/ yt
*436Sdmick	jmp	.LL61
*436Sdmick	.align	16
*436Sdmick.LL65:
*436Sdmick	negl	%eax		/ rem
*436Sdmick	adcl	$0, %edx	/, rem
*436Sdmick	addl	$20, %esp
*436Sdmick	popl	%esi
*436Sdmick	negl	%edx		/ rem
*436Sdmick	popl	%edi
*436Sdmick	ret
*436Sdmick	SET_SIZE(__moddi3)
*436Sdmick
*436Sdmick/*
*436Sdmick * __udivrem64
*436Sdmick *
*436Sdmick * Perform division of two unsigned 64-bit quantities, returning the
*436Sdmick * quotient in %edx:%eax, and the remainder in %ecx:%esi.  __udivrem64
*436Sdmick * pops the arguments on return.
*436Sdmick */
*436Sdmick	ENTRY(__udivrem64)
*436Sdmick	subl	$12, %esp
*436Sdmick	movl	%esp, %ecx	/, tmp64
*436Sdmick	movl	16(%esp), %eax	/ x, x
*436Sdmick	movl	20(%esp), %edx	/ x, x
*436Sdmick	pushl	%ecx		/ tmp64
*436Sdmick	pushl	32(%esp)	/ y
*436Sdmick	pushl	32(%esp)
*436Sdmick	call	UDivRem
*436Sdmick	movl	16(%esp), %ecx	/ rem, tmp63
*436Sdmick	movl	12(%esp), %esi	/ rem
*436Sdmick	addl	$24, %esp
*436Sdmick	ret	$16
*436Sdmick	SET_SIZE(__udivrem64)
*436Sdmick
*436Sdmick/*
*436Sdmick * Signed division with remainder.
*436Sdmick */
*436Sdmick/ int64_t
*436Sdmick/ SDivRem(int64_t x, int64_t y, int64_t * pmod)
*436Sdmick/ {
*436Sdmick/ 	int		negative;
*436Sdmick/ 	uint64_t	xt, yt, r, rem;
*436Sdmick/
*436Sdmick/ 	if (x < 0) {
*436Sdmick/ 		xt = -(uint64_t) x;
*436Sdmick/ 		negative = 1;
*436Sdmick/ 	} else {
*436Sdmick/ 		xt = x;
*436Sdmick/ 		negative = 0;
*436Sdmick/ 	}
*436Sdmick/ 	if (y < 0) {
*436Sdmick/ 		yt = -(uint64_t) y;
*436Sdmick/ 		negative ^= 1;
*436Sdmick/ 	} else {
*436Sdmick/ 		yt = y;
*436Sdmick/ 	}
*436Sdmick/ 	r = UDivRem(xt, yt, &rem);
*436Sdmick/ 	*pmod = (x < 0 ? (int64_t) - rem : rem);
*436Sdmick/ 	return (negative ? (int64_t) - r : r);
*436Sdmick/ }
*436Sdmick	ENTRY(SDivRem)
*436Sdmick	pushl	%ebp
*436Sdmick	pushl	%edi
*436Sdmick	pushl	%esi
*436Sdmick	subl	$24, %esp
*436Sdmick	testl	%edx, %edx	/ x
*436Sdmick	movl	%edx, %edi	/ x, x
*436Sdmick	js	.LL73
*436Sdmick	movl	44(%esp), %esi	/ y,
*436Sdmick	xorl	%ebp, %ebp	/ negative
*436Sdmick	testl	%esi, %esi
*436Sdmick	movl	%edx, 12(%esp)	/ x, xt
*436Sdmick	movl	%eax, 8(%esp)	/ x, xt
*436Sdmick	movl	40(%esp), %edx	/ y, yt
*436Sdmick	movl	44(%esp), %ecx	/ y, yt
*436Sdmick	js	.LL74
*436Sdmick.LL70:
*436Sdmick	leal	16(%esp), %eax	/, tmp70
*436Sdmick	pushl	%eax		/ tmp70
*436Sdmick	pushl	%ecx		/ yt
*436Sdmick	pushl	%edx		/ yt
*436Sdmick	movl	20(%esp), %eax	/ xt, xt
*436Sdmick	movl	24(%esp), %edx	/ xt, xt
*436Sdmick	call	UDivRem
*436Sdmick	movl	%edx, 16(%esp)	/, r
*436Sdmick	movl	%eax, 12(%esp)	/, r
*436Sdmick	addl	$12, %esp
*436Sdmick	testl	%edi, %edi	/ x
*436Sdmick	movl	16(%esp), %edx	/ rem, rem
*436Sdmick	movl	20(%esp), %ecx	/ rem, rem
*436Sdmick	js	.LL75
*436Sdmick.LL71:
*436Sdmick	movl	48(%esp), %edi	/ pmod, pmod
*436Sdmick	testl	%ebp, %ebp	/ negative
*436Sdmick	movl	%edx, (%edi)	/ rem,* pmod
*436Sdmick	movl	%ecx, 4(%edi)	/ rem,
*436Sdmick	movl	(%esp), %eax	/ r, r
*436Sdmick	movl	4(%esp), %edx	/ r, r
*436Sdmick	je	.LL72
*436Sdmick	negl	%eax		/ r
*436Sdmick	adcl	$0, %edx	/, r
*436Sdmick	negl	%edx		/ r
*436Sdmick.LL72:
*436Sdmick	addl	$24, %esp
*436Sdmick	popl	%esi
*436Sdmick	popl	%edi
*436Sdmick	popl	%ebp
*436Sdmick	ret
*436Sdmick	.align	16
*436Sdmick.LL73:
*436Sdmick	negl	%eax
*436Sdmick	adcl	$0, %edx
*436Sdmick	movl	44(%esp), %esi	/ y,
*436Sdmick	negl	%edx
*436Sdmick	testl	%esi, %esi
*436Sdmick	movl	%edx, 12(%esp)	/, xt
*436Sdmick	movl	%eax, 8(%esp)	/, xt
*436Sdmick	movl	$1, %ebp	/, negative
*436Sdmick	movl	40(%esp), %edx	/ y, yt
*436Sdmick	movl	44(%esp), %ecx	/ y, yt
*436Sdmick	jns	.LL70
*436Sdmick	.align	16
*436Sdmick.LL74:
*436Sdmick	negl	%edx		/ yt
*436Sdmick	adcl	$0, %ecx	/, yt
*436Sdmick	negl	%ecx		/ yt
*436Sdmick	xorl	$1, %ebp	/, negative
*436Sdmick	jmp	.LL70
*436Sdmick	.align	16
*436Sdmick.LL75:
*436Sdmick	negl	%edx		/ rem
*436Sdmick	adcl	$0, %ecx	/, rem
*436Sdmick	negl	%ecx		/ rem
*436Sdmick	jmp	.LL71
*436Sdmick	SET_SIZE(SDivRem)
*436Sdmick
*436Sdmick/*
*436Sdmick * __divrem64
*436Sdmick *
*436Sdmick * Perform division of two signed 64-bit quantities, returning the
*436Sdmick * quotient in %edx:%eax, and the remainder in %ecx:%esi.  __divrem64
*436Sdmick * pops the arguments on return.
*436Sdmick */
*436Sdmick	ENTRY(__divrem64)
*436Sdmick	subl	$20, %esp
*436Sdmick	movl	%esp, %ecx	/, tmp64
*436Sdmick	movl	24(%esp), %eax	/ x, x
*436Sdmick	movl	28(%esp), %edx	/ x, x
*436Sdmick	pushl	%ecx		/ tmp64
*436Sdmick	pushl	40(%esp)	/ y
*436Sdmick	pushl	40(%esp)
*436Sdmick	call	SDivRem
*436Sdmick	movl	16(%esp), %ecx
*436Sdmick	movl	12(%esp),%esi	/ rem
*436Sdmick	addl	$32, %esp
*436Sdmick	ret	$16
*436Sdmick	SET_SIZE(__divrem64)
*436Sdmick
*436Sdmick
*436Sdmick#endif /* __lint */
*436Sdmick
*436Sdmick#endif /* defined(__i386) && !defined(__amd64) */