xref: /dflybsd-src/crypto/libressl/crypto/bn/bn_isqrt.c (revision 961e30ea7dc61d1112b778ea4981eac68129fb86)
1*de0e0e4dSAntonio Huete Jimenez /*	$OpenBSD: bn_isqrt.c,v 1.2 2022/07/13 11:20:00 tb Exp $ */
2*de0e0e4dSAntonio Huete Jimenez /*
3*de0e0e4dSAntonio Huete Jimenez  * Copyright (c) 2022 Theo Buehler <tb@openbsd.org>
4*de0e0e4dSAntonio Huete Jimenez  *
5*de0e0e4dSAntonio Huete Jimenez  * Permission to use, copy, modify, and distribute this software for any
6*de0e0e4dSAntonio Huete Jimenez  * purpose with or without fee is hereby granted, provided that the above
7*de0e0e4dSAntonio Huete Jimenez  * copyright notice and this permission notice appear in all copies.
8*de0e0e4dSAntonio Huete Jimenez  *
9*de0e0e4dSAntonio Huete Jimenez  * THE SOFTWARE IS PROVIDED "AS IS" AND THE AUTHOR DISCLAIMS ALL WARRANTIES
10*de0e0e4dSAntonio Huete Jimenez  * WITH REGARD TO THIS SOFTWARE INCLUDING ALL IMPLIED WARRANTIES OF
11*de0e0e4dSAntonio Huete Jimenez  * MERCHANTABILITY AND FITNESS. IN NO EVENT SHALL THE AUTHOR BE LIABLE FOR
12*de0e0e4dSAntonio Huete Jimenez  * ANY SPECIAL, DIRECT, INDIRECT, OR CONSEQUENTIAL DAMAGES OR ANY DAMAGES
13*de0e0e4dSAntonio Huete Jimenez  * WHATSOEVER RESULTING FROM LOSS OF USE, DATA OR PROFITS, WHETHER IN AN
14*de0e0e4dSAntonio Huete Jimenez  * ACTION OF CONTRACT, NEGLIGENCE OR OTHER TORTIOUS ACTION, ARISING OUT OF
15*de0e0e4dSAntonio Huete Jimenez  * OR IN CONNECTION WITH THE USE OR PERFORMANCE OF THIS SOFTWARE.
16*de0e0e4dSAntonio Huete Jimenez  */
17*de0e0e4dSAntonio Huete Jimenez 
18*de0e0e4dSAntonio Huete Jimenez #include <stddef.h>
19*de0e0e4dSAntonio Huete Jimenez #include <stdint.h>
20*de0e0e4dSAntonio Huete Jimenez 
21*de0e0e4dSAntonio Huete Jimenez #include <openssl/bn.h>
22*de0e0e4dSAntonio Huete Jimenez #include <openssl/err.h>
23*de0e0e4dSAntonio Huete Jimenez 
24*de0e0e4dSAntonio Huete Jimenez #include "bn_lcl.h"
25*de0e0e4dSAntonio Huete Jimenez 
26*de0e0e4dSAntonio Huete Jimenez #define CTASSERT(x)	extern char  _ctassert[(x) ? 1 : -1 ]   \
27*de0e0e4dSAntonio Huete Jimenez 			    __attribute__((__unused__))
28*de0e0e4dSAntonio Huete Jimenez 
29*de0e0e4dSAntonio Huete Jimenez /*
30*de0e0e4dSAntonio Huete Jimenez  * Calculate integer square root of |n| using a variant of Newton's method.
31*de0e0e4dSAntonio Huete Jimenez  *
32*de0e0e4dSAntonio Huete Jimenez  * Returns the integer square root of |n| in the caller-provided |out_sqrt|;
33*de0e0e4dSAntonio Huete Jimenez  * |*out_perfect| is set to 1 if and only if |n| is a perfect square.
34*de0e0e4dSAntonio Huete Jimenez  * One of |out_sqrt| and |out_perfect| can be NULL; |in_ctx| can be NULL.
35*de0e0e4dSAntonio Huete Jimenez  *
36*de0e0e4dSAntonio Huete Jimenez  * Returns 0 on error, 1 on success.
37*de0e0e4dSAntonio Huete Jimenez  *
38*de0e0e4dSAntonio Huete Jimenez  * Adapted from pure Python describing cpython's math.isqrt(), without bothering
39*de0e0e4dSAntonio Huete Jimenez  * with any of the optimizations in the C code. A correctness proof is here:
40*de0e0e4dSAntonio Huete Jimenez  * https://github.com/mdickinson/snippets/blob/master/proofs/isqrt/src/isqrt.lean
41*de0e0e4dSAntonio Huete Jimenez  * The comments in the Python code also give a rather detailed proof.
42*de0e0e4dSAntonio Huete Jimenez  */
43*de0e0e4dSAntonio Huete Jimenez 
44*de0e0e4dSAntonio Huete Jimenez int
bn_isqrt(BIGNUM * out_sqrt,int * out_perfect,const BIGNUM * n,BN_CTX * in_ctx)45*de0e0e4dSAntonio Huete Jimenez bn_isqrt(BIGNUM *out_sqrt, int *out_perfect, const BIGNUM *n, BN_CTX *in_ctx)
46*de0e0e4dSAntonio Huete Jimenez {
47*de0e0e4dSAntonio Huete Jimenez 	BN_CTX *ctx = NULL;
48*de0e0e4dSAntonio Huete Jimenez 	BIGNUM *a, *b;
49*de0e0e4dSAntonio Huete Jimenez 	int c, d, e, s;
50*de0e0e4dSAntonio Huete Jimenez 	int cmp, perfect;
51*de0e0e4dSAntonio Huete Jimenez 	int ret = 0;
52*de0e0e4dSAntonio Huete Jimenez 
53*de0e0e4dSAntonio Huete Jimenez 	if (out_perfect == NULL && out_sqrt == NULL) {
54*de0e0e4dSAntonio Huete Jimenez 		BNerror(ERR_R_PASSED_NULL_PARAMETER);
55*de0e0e4dSAntonio Huete Jimenez 		goto err;
56*de0e0e4dSAntonio Huete Jimenez 	}
57*de0e0e4dSAntonio Huete Jimenez 
58*de0e0e4dSAntonio Huete Jimenez 	if (BN_is_negative(n)) {
59*de0e0e4dSAntonio Huete Jimenez 		BNerror(BN_R_INVALID_RANGE);
60*de0e0e4dSAntonio Huete Jimenez 		goto err;
61*de0e0e4dSAntonio Huete Jimenez 	}
62*de0e0e4dSAntonio Huete Jimenez 
63*de0e0e4dSAntonio Huete Jimenez 	if ((ctx = in_ctx) == NULL)
64*de0e0e4dSAntonio Huete Jimenez 		ctx = BN_CTX_new();
65*de0e0e4dSAntonio Huete Jimenez 	if (ctx == NULL)
66*de0e0e4dSAntonio Huete Jimenez 		goto err;
67*de0e0e4dSAntonio Huete Jimenez 
68*de0e0e4dSAntonio Huete Jimenez 	BN_CTX_start(ctx);
69*de0e0e4dSAntonio Huete Jimenez 
70*de0e0e4dSAntonio Huete Jimenez 	if ((a = BN_CTX_get(ctx)) == NULL)
71*de0e0e4dSAntonio Huete Jimenez 		goto err;
72*de0e0e4dSAntonio Huete Jimenez 	if ((b = BN_CTX_get(ctx)) == NULL)
73*de0e0e4dSAntonio Huete Jimenez 		goto err;
74*de0e0e4dSAntonio Huete Jimenez 
75*de0e0e4dSAntonio Huete Jimenez 	if (BN_is_zero(n)) {
76*de0e0e4dSAntonio Huete Jimenez 		perfect = 1;
77*de0e0e4dSAntonio Huete Jimenez 		if (!BN_zero(a))
78*de0e0e4dSAntonio Huete Jimenez 			goto err;
79*de0e0e4dSAntonio Huete Jimenez 		goto done;
80*de0e0e4dSAntonio Huete Jimenez 	}
81*de0e0e4dSAntonio Huete Jimenez 
82*de0e0e4dSAntonio Huete Jimenez 	if (!BN_one(a))
83*de0e0e4dSAntonio Huete Jimenez 		goto err;
84*de0e0e4dSAntonio Huete Jimenez 
85*de0e0e4dSAntonio Huete Jimenez 	c = (BN_num_bits(n) - 1) / 2;
86*de0e0e4dSAntonio Huete Jimenez 	d = 0;
87*de0e0e4dSAntonio Huete Jimenez 
88*de0e0e4dSAntonio Huete Jimenez 	/* Calculate s = floor(log(c)). */
89*de0e0e4dSAntonio Huete Jimenez 	if (!BN_set_word(b, c))
90*de0e0e4dSAntonio Huete Jimenez 		goto err;
91*de0e0e4dSAntonio Huete Jimenez 	s = BN_num_bits(b) - 1;
92*de0e0e4dSAntonio Huete Jimenez 
93*de0e0e4dSAntonio Huete Jimenez 	/*
94*de0e0e4dSAntonio Huete Jimenez 	 * By definition, the loop below is run <= floor(log(log(n))) times.
95*de0e0e4dSAntonio Huete Jimenez 	 * Comments in the cpython code establish the loop invariant that
96*de0e0e4dSAntonio Huete Jimenez 	 *
97*de0e0e4dSAntonio Huete Jimenez 	 *	(a - 1)^2 < n / 4^(c - d) < (a + 1)^2
98*de0e0e4dSAntonio Huete Jimenez 	 *
99*de0e0e4dSAntonio Huete Jimenez 	 * holds true in every iteration. Once this is proved via induction,
100*de0e0e4dSAntonio Huete Jimenez 	 * correctness of the algorithm is easy.
101*de0e0e4dSAntonio Huete Jimenez 	 *
102*de0e0e4dSAntonio Huete Jimenez 	 * Roughly speaking, A = (a << (d - e)) is used for one Newton step
103*de0e0e4dSAntonio Huete Jimenez 	 * "a = (A >> 1) + (m >> 1) / A" approximating m = (n >> 2 * (c - d)).
104*de0e0e4dSAntonio Huete Jimenez 	 */
105*de0e0e4dSAntonio Huete Jimenez 
106*de0e0e4dSAntonio Huete Jimenez 	for (; s >= 0; s--) {
107*de0e0e4dSAntonio Huete Jimenez 		e = d;
108*de0e0e4dSAntonio Huete Jimenez 		d = c >> s;
109*de0e0e4dSAntonio Huete Jimenez 
110*de0e0e4dSAntonio Huete Jimenez 		if (!BN_rshift(b, n, 2 * c - d - e + 1))
111*de0e0e4dSAntonio Huete Jimenez 			goto err;
112*de0e0e4dSAntonio Huete Jimenez 
113*de0e0e4dSAntonio Huete Jimenez 		if (!BN_div_ct(b, NULL, b, a, ctx))
114*de0e0e4dSAntonio Huete Jimenez 			goto err;
115*de0e0e4dSAntonio Huete Jimenez 
116*de0e0e4dSAntonio Huete Jimenez 		if (!BN_lshift(a, a, d - e - 1))
117*de0e0e4dSAntonio Huete Jimenez 			goto err;
118*de0e0e4dSAntonio Huete Jimenez 
119*de0e0e4dSAntonio Huete Jimenez 		if (!BN_add(a, a, b))
120*de0e0e4dSAntonio Huete Jimenez 			goto err;
121*de0e0e4dSAntonio Huete Jimenez 	}
122*de0e0e4dSAntonio Huete Jimenez 
123*de0e0e4dSAntonio Huete Jimenez 	/*
124*de0e0e4dSAntonio Huete Jimenez 	 * The loop invariant implies that either a or a - 1 is isqrt(n).
125*de0e0e4dSAntonio Huete Jimenez 	 * Figure out which one it is. The invariant also implies that for
126*de0e0e4dSAntonio Huete Jimenez 	 * a perfect square n, a must be the square root.
127*de0e0e4dSAntonio Huete Jimenez 	 */
128*de0e0e4dSAntonio Huete Jimenez 
129*de0e0e4dSAntonio Huete Jimenez 	if (!BN_sqr(b, a, ctx))
130*de0e0e4dSAntonio Huete Jimenez 		goto err;
131*de0e0e4dSAntonio Huete Jimenez 
132*de0e0e4dSAntonio Huete Jimenez 	/* If a^2 > n, we must have isqrt(n) == a - 1. */
133*de0e0e4dSAntonio Huete Jimenez 	if ((cmp = BN_cmp(b, n)) > 0) {
134*de0e0e4dSAntonio Huete Jimenez 		if (!BN_sub_word(a, 1))
135*de0e0e4dSAntonio Huete Jimenez 			goto err;
136*de0e0e4dSAntonio Huete Jimenez 	}
137*de0e0e4dSAntonio Huete Jimenez 
138*de0e0e4dSAntonio Huete Jimenez 	perfect = cmp == 0;
139*de0e0e4dSAntonio Huete Jimenez 
140*de0e0e4dSAntonio Huete Jimenez  done:
141*de0e0e4dSAntonio Huete Jimenez 	if (out_perfect != NULL)
142*de0e0e4dSAntonio Huete Jimenez 		*out_perfect = perfect;
143*de0e0e4dSAntonio Huete Jimenez 
144*de0e0e4dSAntonio Huete Jimenez 	if (out_sqrt != NULL) {
145*de0e0e4dSAntonio Huete Jimenez 		if (!BN_copy(out_sqrt, a))
146*de0e0e4dSAntonio Huete Jimenez 			goto err;
147*de0e0e4dSAntonio Huete Jimenez 	}
148*de0e0e4dSAntonio Huete Jimenez 
149*de0e0e4dSAntonio Huete Jimenez 	ret = 1;
150*de0e0e4dSAntonio Huete Jimenez 
151*de0e0e4dSAntonio Huete Jimenez  err:
152*de0e0e4dSAntonio Huete Jimenez 	BN_CTX_end(ctx);
153*de0e0e4dSAntonio Huete Jimenez 
154*de0e0e4dSAntonio Huete Jimenez 	if (ctx != in_ctx)
155*de0e0e4dSAntonio Huete Jimenez 		BN_CTX_free(ctx);
156*de0e0e4dSAntonio Huete Jimenez 
157*de0e0e4dSAntonio Huete Jimenez 	return ret;
158*de0e0e4dSAntonio Huete Jimenez }
159*de0e0e4dSAntonio Huete Jimenez 
160*de0e0e4dSAntonio Huete Jimenez /*
161*de0e0e4dSAntonio Huete Jimenez  * is_square_mod_N[r % N] indicates whether r % N has a square root modulo N.
162*de0e0e4dSAntonio Huete Jimenez  * The tables are generated in regress/lib/libcrypto/bn/bn_isqrt.c.
163*de0e0e4dSAntonio Huete Jimenez  */
164*de0e0e4dSAntonio Huete Jimenez 
165*de0e0e4dSAntonio Huete Jimenez const uint8_t is_square_mod_11[] = {
166*de0e0e4dSAntonio Huete Jimenez 	1, 1, 0, 1, 1, 1, 0, 0, 0, 1, 0,
167*de0e0e4dSAntonio Huete Jimenez };
168*de0e0e4dSAntonio Huete Jimenez CTASSERT(sizeof(is_square_mod_11) == 11);
169*de0e0e4dSAntonio Huete Jimenez 
170*de0e0e4dSAntonio Huete Jimenez const uint8_t is_square_mod_63[] = {
171*de0e0e4dSAntonio Huete Jimenez 	1, 1, 0, 0, 1, 0, 0, 1, 0, 1, 0, 0, 0, 0, 0, 0,
172*de0e0e4dSAntonio Huete Jimenez 	1, 0, 1, 0, 0, 0, 1, 0, 0, 1, 0, 0, 1, 0, 0, 0,
173*de0e0e4dSAntonio Huete Jimenez 	0, 0, 0, 0, 1, 1, 0, 0, 0, 0, 0, 1, 0, 0, 1, 0,
174*de0e0e4dSAntonio Huete Jimenez 	0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0,
175*de0e0e4dSAntonio Huete Jimenez };
176*de0e0e4dSAntonio Huete Jimenez CTASSERT(sizeof(is_square_mod_63) == 63);
177*de0e0e4dSAntonio Huete Jimenez 
178*de0e0e4dSAntonio Huete Jimenez const uint8_t is_square_mod_64[] = {
179*de0e0e4dSAntonio Huete Jimenez 	1, 1, 0, 0, 1, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0,
180*de0e0e4dSAntonio Huete Jimenez 	1, 1, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0,
181*de0e0e4dSAntonio Huete Jimenez 	0, 1, 0, 0, 1, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0,
182*de0e0e4dSAntonio Huete Jimenez 	0, 1, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0,
183*de0e0e4dSAntonio Huete Jimenez };
184*de0e0e4dSAntonio Huete Jimenez CTASSERT(sizeof(is_square_mod_64) == 64);
185*de0e0e4dSAntonio Huete Jimenez 
186*de0e0e4dSAntonio Huete Jimenez const uint8_t is_square_mod_65[] = {
187*de0e0e4dSAntonio Huete Jimenez 	1, 1, 0, 0, 1, 0, 0, 0, 0, 1, 1, 0, 0, 0, 1, 0,
188*de0e0e4dSAntonio Huete Jimenez 	1, 0, 0, 0, 0, 0, 0, 0, 0, 1, 1, 0, 0, 1, 1, 0,
189*de0e0e4dSAntonio Huete Jimenez 	0, 0, 0, 1, 1, 0, 0, 1, 1, 0, 0, 0, 0, 0, 0, 0,
190*de0e0e4dSAntonio Huete Jimenez 	0, 1, 0, 1, 0, 0, 0, 1, 1, 0, 0, 0, 0, 1, 0, 0,
191*de0e0e4dSAntonio Huete Jimenez 	1,
192*de0e0e4dSAntonio Huete Jimenez };
193*de0e0e4dSAntonio Huete Jimenez CTASSERT(sizeof(is_square_mod_65) == 65);
194*de0e0e4dSAntonio Huete Jimenez 
195*de0e0e4dSAntonio Huete Jimenez /*
196*de0e0e4dSAntonio Huete Jimenez  * Determine whether n is a perfect square or not.
197*de0e0e4dSAntonio Huete Jimenez  *
198*de0e0e4dSAntonio Huete Jimenez  * Returns 1 on success and 0 on error. In case of success, |*out_perfect| is
199*de0e0e4dSAntonio Huete Jimenez  * set to 1 if and only if |n| is a perfect square.
200*de0e0e4dSAntonio Huete Jimenez  */
201*de0e0e4dSAntonio Huete Jimenez 
202*de0e0e4dSAntonio Huete Jimenez int
bn_is_perfect_square(int * out_perfect,const BIGNUM * n,BN_CTX * ctx)203*de0e0e4dSAntonio Huete Jimenez bn_is_perfect_square(int *out_perfect, const BIGNUM *n, BN_CTX *ctx)
204*de0e0e4dSAntonio Huete Jimenez {
205*de0e0e4dSAntonio Huete Jimenez 	BN_ULONG r;
206*de0e0e4dSAntonio Huete Jimenez 
207*de0e0e4dSAntonio Huete Jimenez 	*out_perfect = 0;
208*de0e0e4dSAntonio Huete Jimenez 
209*de0e0e4dSAntonio Huete Jimenez 	if (BN_is_negative(n))
210*de0e0e4dSAntonio Huete Jimenez 		return 1;
211*de0e0e4dSAntonio Huete Jimenez 
212*de0e0e4dSAntonio Huete Jimenez 	/*
213*de0e0e4dSAntonio Huete Jimenez 	 * Before performing an expensive bn_isqrt() operation, weed out many
214*de0e0e4dSAntonio Huete Jimenez 	 * obvious non-squares. See H. Cohen, "A course in computational
215*de0e0e4dSAntonio Huete Jimenez 	 * algebraic number theory", Algorithm 1.7.3.
216*de0e0e4dSAntonio Huete Jimenez 	 *
217*de0e0e4dSAntonio Huete Jimenez 	 * The idea is that a square remains a square when reduced modulo any
218*de0e0e4dSAntonio Huete Jimenez 	 * number. The moduli are chosen in such a way that a non-square has
219*de0e0e4dSAntonio Huete Jimenez 	 * probability < 1% of passing the four table lookups.
220*de0e0e4dSAntonio Huete Jimenez 	 */
221*de0e0e4dSAntonio Huete Jimenez 
222*de0e0e4dSAntonio Huete Jimenez 	/* n % 64 */
223*de0e0e4dSAntonio Huete Jimenez 	r = BN_lsw(n) & 0x3f;
224*de0e0e4dSAntonio Huete Jimenez 
225*de0e0e4dSAntonio Huete Jimenez 	if (!is_square_mod_64[r % 64])
226*de0e0e4dSAntonio Huete Jimenez 		return 1;
227*de0e0e4dSAntonio Huete Jimenez 
228*de0e0e4dSAntonio Huete Jimenez 	if ((r = BN_mod_word(n, 11 * 63 * 65)) == (BN_ULONG)-1)
229*de0e0e4dSAntonio Huete Jimenez 		return 0;
230*de0e0e4dSAntonio Huete Jimenez 
231*de0e0e4dSAntonio Huete Jimenez 	if (!is_square_mod_63[r % 63] ||
232*de0e0e4dSAntonio Huete Jimenez 	    !is_square_mod_65[r % 65] ||
233*de0e0e4dSAntonio Huete Jimenez 	    !is_square_mod_11[r % 11])
234*de0e0e4dSAntonio Huete Jimenez 		return 1;
235*de0e0e4dSAntonio Huete Jimenez 
236*de0e0e4dSAntonio Huete Jimenez 	return bn_isqrt(NULL, out_perfect, n, ctx);
237*de0e0e4dSAntonio Huete Jimenez }
238