1*de0e0e4dSAntonio Huete Jimenez /* $OpenBSD: bn_isqrt.c,v 1.2 2022/07/13 11:20:00 tb Exp $ */
2*de0e0e4dSAntonio Huete Jimenez /*
3*de0e0e4dSAntonio Huete Jimenez * Copyright (c) 2022 Theo Buehler <tb@openbsd.org>
4*de0e0e4dSAntonio Huete Jimenez *
5*de0e0e4dSAntonio Huete Jimenez * Permission to use, copy, modify, and distribute this software for any
6*de0e0e4dSAntonio Huete Jimenez * purpose with or without fee is hereby granted, provided that the above
7*de0e0e4dSAntonio Huete Jimenez * copyright notice and this permission notice appear in all copies.
8*de0e0e4dSAntonio Huete Jimenez *
9*de0e0e4dSAntonio Huete Jimenez * THE SOFTWARE IS PROVIDED "AS IS" AND THE AUTHOR DISCLAIMS ALL WARRANTIES
10*de0e0e4dSAntonio Huete Jimenez * WITH REGARD TO THIS SOFTWARE INCLUDING ALL IMPLIED WARRANTIES OF
11*de0e0e4dSAntonio Huete Jimenez * MERCHANTABILITY AND FITNESS. IN NO EVENT SHALL THE AUTHOR BE LIABLE FOR
12*de0e0e4dSAntonio Huete Jimenez * ANY SPECIAL, DIRECT, INDIRECT, OR CONSEQUENTIAL DAMAGES OR ANY DAMAGES
13*de0e0e4dSAntonio Huete Jimenez * WHATSOEVER RESULTING FROM LOSS OF USE, DATA OR PROFITS, WHETHER IN AN
14*de0e0e4dSAntonio Huete Jimenez * ACTION OF CONTRACT, NEGLIGENCE OR OTHER TORTIOUS ACTION, ARISING OUT OF
15*de0e0e4dSAntonio Huete Jimenez * OR IN CONNECTION WITH THE USE OR PERFORMANCE OF THIS SOFTWARE.
16*de0e0e4dSAntonio Huete Jimenez */
17*de0e0e4dSAntonio Huete Jimenez
18*de0e0e4dSAntonio Huete Jimenez #include <stddef.h>
19*de0e0e4dSAntonio Huete Jimenez #include <stdint.h>
20*de0e0e4dSAntonio Huete Jimenez
21*de0e0e4dSAntonio Huete Jimenez #include <openssl/bn.h>
22*de0e0e4dSAntonio Huete Jimenez #include <openssl/err.h>
23*de0e0e4dSAntonio Huete Jimenez
24*de0e0e4dSAntonio Huete Jimenez #include "bn_lcl.h"
25*de0e0e4dSAntonio Huete Jimenez
26*de0e0e4dSAntonio Huete Jimenez #define CTASSERT(x) extern char _ctassert[(x) ? 1 : -1 ] \
27*de0e0e4dSAntonio Huete Jimenez __attribute__((__unused__))
28*de0e0e4dSAntonio Huete Jimenez
29*de0e0e4dSAntonio Huete Jimenez /*
30*de0e0e4dSAntonio Huete Jimenez * Calculate integer square root of |n| using a variant of Newton's method.
31*de0e0e4dSAntonio Huete Jimenez *
32*de0e0e4dSAntonio Huete Jimenez * Returns the integer square root of |n| in the caller-provided |out_sqrt|;
33*de0e0e4dSAntonio Huete Jimenez * |*out_perfect| is set to 1 if and only if |n| is a perfect square.
34*de0e0e4dSAntonio Huete Jimenez * One of |out_sqrt| and |out_perfect| can be NULL; |in_ctx| can be NULL.
35*de0e0e4dSAntonio Huete Jimenez *
36*de0e0e4dSAntonio Huete Jimenez * Returns 0 on error, 1 on success.
37*de0e0e4dSAntonio Huete Jimenez *
38*de0e0e4dSAntonio Huete Jimenez * Adapted from pure Python describing cpython's math.isqrt(), without bothering
39*de0e0e4dSAntonio Huete Jimenez * with any of the optimizations in the C code. A correctness proof is here:
40*de0e0e4dSAntonio Huete Jimenez * https://github.com/mdickinson/snippets/blob/master/proofs/isqrt/src/isqrt.lean
41*de0e0e4dSAntonio Huete Jimenez * The comments in the Python code also give a rather detailed proof.
42*de0e0e4dSAntonio Huete Jimenez */
43*de0e0e4dSAntonio Huete Jimenez
44*de0e0e4dSAntonio Huete Jimenez int
bn_isqrt(BIGNUM * out_sqrt,int * out_perfect,const BIGNUM * n,BN_CTX * in_ctx)45*de0e0e4dSAntonio Huete Jimenez bn_isqrt(BIGNUM *out_sqrt, int *out_perfect, const BIGNUM *n, BN_CTX *in_ctx)
46*de0e0e4dSAntonio Huete Jimenez {
47*de0e0e4dSAntonio Huete Jimenez BN_CTX *ctx = NULL;
48*de0e0e4dSAntonio Huete Jimenez BIGNUM *a, *b;
49*de0e0e4dSAntonio Huete Jimenez int c, d, e, s;
50*de0e0e4dSAntonio Huete Jimenez int cmp, perfect;
51*de0e0e4dSAntonio Huete Jimenez int ret = 0;
52*de0e0e4dSAntonio Huete Jimenez
53*de0e0e4dSAntonio Huete Jimenez if (out_perfect == NULL && out_sqrt == NULL) {
54*de0e0e4dSAntonio Huete Jimenez BNerror(ERR_R_PASSED_NULL_PARAMETER);
55*de0e0e4dSAntonio Huete Jimenez goto err;
56*de0e0e4dSAntonio Huete Jimenez }
57*de0e0e4dSAntonio Huete Jimenez
58*de0e0e4dSAntonio Huete Jimenez if (BN_is_negative(n)) {
59*de0e0e4dSAntonio Huete Jimenez BNerror(BN_R_INVALID_RANGE);
60*de0e0e4dSAntonio Huete Jimenez goto err;
61*de0e0e4dSAntonio Huete Jimenez }
62*de0e0e4dSAntonio Huete Jimenez
63*de0e0e4dSAntonio Huete Jimenez if ((ctx = in_ctx) == NULL)
64*de0e0e4dSAntonio Huete Jimenez ctx = BN_CTX_new();
65*de0e0e4dSAntonio Huete Jimenez if (ctx == NULL)
66*de0e0e4dSAntonio Huete Jimenez goto err;
67*de0e0e4dSAntonio Huete Jimenez
68*de0e0e4dSAntonio Huete Jimenez BN_CTX_start(ctx);
69*de0e0e4dSAntonio Huete Jimenez
70*de0e0e4dSAntonio Huete Jimenez if ((a = BN_CTX_get(ctx)) == NULL)
71*de0e0e4dSAntonio Huete Jimenez goto err;
72*de0e0e4dSAntonio Huete Jimenez if ((b = BN_CTX_get(ctx)) == NULL)
73*de0e0e4dSAntonio Huete Jimenez goto err;
74*de0e0e4dSAntonio Huete Jimenez
75*de0e0e4dSAntonio Huete Jimenez if (BN_is_zero(n)) {
76*de0e0e4dSAntonio Huete Jimenez perfect = 1;
77*de0e0e4dSAntonio Huete Jimenez if (!BN_zero(a))
78*de0e0e4dSAntonio Huete Jimenez goto err;
79*de0e0e4dSAntonio Huete Jimenez goto done;
80*de0e0e4dSAntonio Huete Jimenez }
81*de0e0e4dSAntonio Huete Jimenez
82*de0e0e4dSAntonio Huete Jimenez if (!BN_one(a))
83*de0e0e4dSAntonio Huete Jimenez goto err;
84*de0e0e4dSAntonio Huete Jimenez
85*de0e0e4dSAntonio Huete Jimenez c = (BN_num_bits(n) - 1) / 2;
86*de0e0e4dSAntonio Huete Jimenez d = 0;
87*de0e0e4dSAntonio Huete Jimenez
88*de0e0e4dSAntonio Huete Jimenez /* Calculate s = floor(log(c)). */
89*de0e0e4dSAntonio Huete Jimenez if (!BN_set_word(b, c))
90*de0e0e4dSAntonio Huete Jimenez goto err;
91*de0e0e4dSAntonio Huete Jimenez s = BN_num_bits(b) - 1;
92*de0e0e4dSAntonio Huete Jimenez
93*de0e0e4dSAntonio Huete Jimenez /*
94*de0e0e4dSAntonio Huete Jimenez * By definition, the loop below is run <= floor(log(log(n))) times.
95*de0e0e4dSAntonio Huete Jimenez * Comments in the cpython code establish the loop invariant that
96*de0e0e4dSAntonio Huete Jimenez *
97*de0e0e4dSAntonio Huete Jimenez * (a - 1)^2 < n / 4^(c - d) < (a + 1)^2
98*de0e0e4dSAntonio Huete Jimenez *
99*de0e0e4dSAntonio Huete Jimenez * holds true in every iteration. Once this is proved via induction,
100*de0e0e4dSAntonio Huete Jimenez * correctness of the algorithm is easy.
101*de0e0e4dSAntonio Huete Jimenez *
102*de0e0e4dSAntonio Huete Jimenez * Roughly speaking, A = (a << (d - e)) is used for one Newton step
103*de0e0e4dSAntonio Huete Jimenez * "a = (A >> 1) + (m >> 1) / A" approximating m = (n >> 2 * (c - d)).
104*de0e0e4dSAntonio Huete Jimenez */
105*de0e0e4dSAntonio Huete Jimenez
106*de0e0e4dSAntonio Huete Jimenez for (; s >= 0; s--) {
107*de0e0e4dSAntonio Huete Jimenez e = d;
108*de0e0e4dSAntonio Huete Jimenez d = c >> s;
109*de0e0e4dSAntonio Huete Jimenez
110*de0e0e4dSAntonio Huete Jimenez if (!BN_rshift(b, n, 2 * c - d - e + 1))
111*de0e0e4dSAntonio Huete Jimenez goto err;
112*de0e0e4dSAntonio Huete Jimenez
113*de0e0e4dSAntonio Huete Jimenez if (!BN_div_ct(b, NULL, b, a, ctx))
114*de0e0e4dSAntonio Huete Jimenez goto err;
115*de0e0e4dSAntonio Huete Jimenez
116*de0e0e4dSAntonio Huete Jimenez if (!BN_lshift(a, a, d - e - 1))
117*de0e0e4dSAntonio Huete Jimenez goto err;
118*de0e0e4dSAntonio Huete Jimenez
119*de0e0e4dSAntonio Huete Jimenez if (!BN_add(a, a, b))
120*de0e0e4dSAntonio Huete Jimenez goto err;
121*de0e0e4dSAntonio Huete Jimenez }
122*de0e0e4dSAntonio Huete Jimenez
123*de0e0e4dSAntonio Huete Jimenez /*
124*de0e0e4dSAntonio Huete Jimenez * The loop invariant implies that either a or a - 1 is isqrt(n).
125*de0e0e4dSAntonio Huete Jimenez * Figure out which one it is. The invariant also implies that for
126*de0e0e4dSAntonio Huete Jimenez * a perfect square n, a must be the square root.
127*de0e0e4dSAntonio Huete Jimenez */
128*de0e0e4dSAntonio Huete Jimenez
129*de0e0e4dSAntonio Huete Jimenez if (!BN_sqr(b, a, ctx))
130*de0e0e4dSAntonio Huete Jimenez goto err;
131*de0e0e4dSAntonio Huete Jimenez
132*de0e0e4dSAntonio Huete Jimenez /* If a^2 > n, we must have isqrt(n) == a - 1. */
133*de0e0e4dSAntonio Huete Jimenez if ((cmp = BN_cmp(b, n)) > 0) {
134*de0e0e4dSAntonio Huete Jimenez if (!BN_sub_word(a, 1))
135*de0e0e4dSAntonio Huete Jimenez goto err;
136*de0e0e4dSAntonio Huete Jimenez }
137*de0e0e4dSAntonio Huete Jimenez
138*de0e0e4dSAntonio Huete Jimenez perfect = cmp == 0;
139*de0e0e4dSAntonio Huete Jimenez
140*de0e0e4dSAntonio Huete Jimenez done:
141*de0e0e4dSAntonio Huete Jimenez if (out_perfect != NULL)
142*de0e0e4dSAntonio Huete Jimenez *out_perfect = perfect;
143*de0e0e4dSAntonio Huete Jimenez
144*de0e0e4dSAntonio Huete Jimenez if (out_sqrt != NULL) {
145*de0e0e4dSAntonio Huete Jimenez if (!BN_copy(out_sqrt, a))
146*de0e0e4dSAntonio Huete Jimenez goto err;
147*de0e0e4dSAntonio Huete Jimenez }
148*de0e0e4dSAntonio Huete Jimenez
149*de0e0e4dSAntonio Huete Jimenez ret = 1;
150*de0e0e4dSAntonio Huete Jimenez
151*de0e0e4dSAntonio Huete Jimenez err:
152*de0e0e4dSAntonio Huete Jimenez BN_CTX_end(ctx);
153*de0e0e4dSAntonio Huete Jimenez
154*de0e0e4dSAntonio Huete Jimenez if (ctx != in_ctx)
155*de0e0e4dSAntonio Huete Jimenez BN_CTX_free(ctx);
156*de0e0e4dSAntonio Huete Jimenez
157*de0e0e4dSAntonio Huete Jimenez return ret;
158*de0e0e4dSAntonio Huete Jimenez }
159*de0e0e4dSAntonio Huete Jimenez
160*de0e0e4dSAntonio Huete Jimenez /*
161*de0e0e4dSAntonio Huete Jimenez * is_square_mod_N[r % N] indicates whether r % N has a square root modulo N.
162*de0e0e4dSAntonio Huete Jimenez * The tables are generated in regress/lib/libcrypto/bn/bn_isqrt.c.
163*de0e0e4dSAntonio Huete Jimenez */
164*de0e0e4dSAntonio Huete Jimenez
165*de0e0e4dSAntonio Huete Jimenez const uint8_t is_square_mod_11[] = {
166*de0e0e4dSAntonio Huete Jimenez 1, 1, 0, 1, 1, 1, 0, 0, 0, 1, 0,
167*de0e0e4dSAntonio Huete Jimenez };
168*de0e0e4dSAntonio Huete Jimenez CTASSERT(sizeof(is_square_mod_11) == 11);
169*de0e0e4dSAntonio Huete Jimenez
170*de0e0e4dSAntonio Huete Jimenez const uint8_t is_square_mod_63[] = {
171*de0e0e4dSAntonio Huete Jimenez 1, 1, 0, 0, 1, 0, 0, 1, 0, 1, 0, 0, 0, 0, 0, 0,
172*de0e0e4dSAntonio Huete Jimenez 1, 0, 1, 0, 0, 0, 1, 0, 0, 1, 0, 0, 1, 0, 0, 0,
173*de0e0e4dSAntonio Huete Jimenez 0, 0, 0, 0, 1, 1, 0, 0, 0, 0, 0, 1, 0, 0, 1, 0,
174*de0e0e4dSAntonio Huete Jimenez 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0,
175*de0e0e4dSAntonio Huete Jimenez };
176*de0e0e4dSAntonio Huete Jimenez CTASSERT(sizeof(is_square_mod_63) == 63);
177*de0e0e4dSAntonio Huete Jimenez
178*de0e0e4dSAntonio Huete Jimenez const uint8_t is_square_mod_64[] = {
179*de0e0e4dSAntonio Huete Jimenez 1, 1, 0, 0, 1, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0,
180*de0e0e4dSAntonio Huete Jimenez 1, 1, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0,
181*de0e0e4dSAntonio Huete Jimenez 0, 1, 0, 0, 1, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0,
182*de0e0e4dSAntonio Huete Jimenez 0, 1, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0,
183*de0e0e4dSAntonio Huete Jimenez };
184*de0e0e4dSAntonio Huete Jimenez CTASSERT(sizeof(is_square_mod_64) == 64);
185*de0e0e4dSAntonio Huete Jimenez
186*de0e0e4dSAntonio Huete Jimenez const uint8_t is_square_mod_65[] = {
187*de0e0e4dSAntonio Huete Jimenez 1, 1, 0, 0, 1, 0, 0, 0, 0, 1, 1, 0, 0, 0, 1, 0,
188*de0e0e4dSAntonio Huete Jimenez 1, 0, 0, 0, 0, 0, 0, 0, 0, 1, 1, 0, 0, 1, 1, 0,
189*de0e0e4dSAntonio Huete Jimenez 0, 0, 0, 1, 1, 0, 0, 1, 1, 0, 0, 0, 0, 0, 0, 0,
190*de0e0e4dSAntonio Huete Jimenez 0, 1, 0, 1, 0, 0, 0, 1, 1, 0, 0, 0, 0, 1, 0, 0,
191*de0e0e4dSAntonio Huete Jimenez 1,
192*de0e0e4dSAntonio Huete Jimenez };
193*de0e0e4dSAntonio Huete Jimenez CTASSERT(sizeof(is_square_mod_65) == 65);
194*de0e0e4dSAntonio Huete Jimenez
195*de0e0e4dSAntonio Huete Jimenez /*
196*de0e0e4dSAntonio Huete Jimenez * Determine whether n is a perfect square or not.
197*de0e0e4dSAntonio Huete Jimenez *
198*de0e0e4dSAntonio Huete Jimenez * Returns 1 on success and 0 on error. In case of success, |*out_perfect| is
199*de0e0e4dSAntonio Huete Jimenez * set to 1 if and only if |n| is a perfect square.
200*de0e0e4dSAntonio Huete Jimenez */
201*de0e0e4dSAntonio Huete Jimenez
202*de0e0e4dSAntonio Huete Jimenez int
bn_is_perfect_square(int * out_perfect,const BIGNUM * n,BN_CTX * ctx)203*de0e0e4dSAntonio Huete Jimenez bn_is_perfect_square(int *out_perfect, const BIGNUM *n, BN_CTX *ctx)
204*de0e0e4dSAntonio Huete Jimenez {
205*de0e0e4dSAntonio Huete Jimenez BN_ULONG r;
206*de0e0e4dSAntonio Huete Jimenez
207*de0e0e4dSAntonio Huete Jimenez *out_perfect = 0;
208*de0e0e4dSAntonio Huete Jimenez
209*de0e0e4dSAntonio Huete Jimenez if (BN_is_negative(n))
210*de0e0e4dSAntonio Huete Jimenez return 1;
211*de0e0e4dSAntonio Huete Jimenez
212*de0e0e4dSAntonio Huete Jimenez /*
213*de0e0e4dSAntonio Huete Jimenez * Before performing an expensive bn_isqrt() operation, weed out many
214*de0e0e4dSAntonio Huete Jimenez * obvious non-squares. See H. Cohen, "A course in computational
215*de0e0e4dSAntonio Huete Jimenez * algebraic number theory", Algorithm 1.7.3.
216*de0e0e4dSAntonio Huete Jimenez *
217*de0e0e4dSAntonio Huete Jimenez * The idea is that a square remains a square when reduced modulo any
218*de0e0e4dSAntonio Huete Jimenez * number. The moduli are chosen in such a way that a non-square has
219*de0e0e4dSAntonio Huete Jimenez * probability < 1% of passing the four table lookups.
220*de0e0e4dSAntonio Huete Jimenez */
221*de0e0e4dSAntonio Huete Jimenez
222*de0e0e4dSAntonio Huete Jimenez /* n % 64 */
223*de0e0e4dSAntonio Huete Jimenez r = BN_lsw(n) & 0x3f;
224*de0e0e4dSAntonio Huete Jimenez
225*de0e0e4dSAntonio Huete Jimenez if (!is_square_mod_64[r % 64])
226*de0e0e4dSAntonio Huete Jimenez return 1;
227*de0e0e4dSAntonio Huete Jimenez
228*de0e0e4dSAntonio Huete Jimenez if ((r = BN_mod_word(n, 11 * 63 * 65)) == (BN_ULONG)-1)
229*de0e0e4dSAntonio Huete Jimenez return 0;
230*de0e0e4dSAntonio Huete Jimenez
231*de0e0e4dSAntonio Huete Jimenez if (!is_square_mod_63[r % 63] ||
232*de0e0e4dSAntonio Huete Jimenez !is_square_mod_65[r % 65] ||
233*de0e0e4dSAntonio Huete Jimenez !is_square_mod_11[r % 11])
234*de0e0e4dSAntonio Huete Jimenez return 1;
235*de0e0e4dSAntonio Huete Jimenez
236*de0e0e4dSAntonio Huete Jimenez return bn_isqrt(NULL, out_perfect, n, ctx);
237*de0e0e4dSAntonio Huete Jimenez }
238