libraries/liblutil/base64.c

*549b59edSchristos/*	$NetBSD: base64.c,v 1.3 2021/08/14 16:14:58 christos Exp $	*/
4e6df137Slukem
2de962bdSlukem/* base64.c -- routines to encode/decode base64 data */
d11b170bStron/* $OpenLDAP$ */
2de962bdSlukem/* This work is part of OpenLDAP Software <http://www.openldap.org/>.
2de962bdSlukem *
*549b59edSchristos * Copyright 1998-2021 The OpenLDAP Foundation.
2de962bdSlukem * Portions Copyright 1998-2003 Kurt D. Zeilenga.
2de962bdSlukem * Portions Copyright 1995 IBM Corporation.
2de962bdSlukem * All rights reserved.
2de962bdSlukem *
2de962bdSlukem * Redistribution and use in source and binary forms, with or without
2de962bdSlukem * modification, are permitted only as authorized by the OpenLDAP
2de962bdSlukem * Public License.
2de962bdSlukem *
2de962bdSlukem * A copy of this license is available in the file LICENSE in the
2de962bdSlukem * top-level directory of the distribution or, alternatively, at
2de962bdSlukem * <http://www.OpenLDAP.org/license.html>.
2de962bdSlukem */
2de962bdSlukem/* Portions Copyright (c) 1996, 1998 by Internet Software Consortium.
2de962bdSlukem *
2de962bdSlukem * Permission to use, copy, modify, and distribute this software for any
2de962bdSlukem * purpose with or without fee is hereby granted, provided that the above
2de962bdSlukem * copyright notice and this permission notice appear in all copies.
2de962bdSlukem *
2de962bdSlukem * THE SOFTWARE IS PROVIDED "AS IS" AND INTERNET SOFTWARE CONSORTIUM DISCLAIMS
2de962bdSlukem * ALL WARRANTIES WITH REGARD TO THIS SOFTWARE INCLUDING ALL IMPLIED WARRANTIES
2de962bdSlukem * OF MERCHANTABILITY AND FITNESS. IN NO EVENT SHALL INTERNET SOFTWARE
2de962bdSlukem * CONSORTIUM BE LIABLE FOR ANY SPECIAL, DIRECT, INDIRECT, OR CONSEQUENTIAL
2de962bdSlukem * DAMAGES OR ANY DAMAGES WHATSOEVER RESULTING FROM LOSS OF USE, DATA OR
2de962bdSlukem * PROFITS, WHETHER IN AN ACTION OF CONTRACT, NEGLIGENCE OR OTHER TORTIOUS
2de962bdSlukem * ACTION, ARISING OUT OF OR IN CONNECTION WITH THE USE OR PERFORMANCE OF THIS
2de962bdSlukem * SOFTWARE.
2de962bdSlukem */
2de962bdSlukem/* This work is based upon Base64 routines (developed by IBM) found
2de962bdSlukem * Berkeley Internet Name Daemon (BIND) as distributed by ISC.  They
2de962bdSlukem * were adapted for inclusion in OpenLDAP Software by Kurt D. Zeilenga.
2de962bdSlukem */
2de962bdSlukem
376af7d7Schristos#include <sys/cdefs.h>
*549b59edSchristos__RCSID("$NetBSD: base64.c,v 1.3 2021/08/14 16:14:58 christos Exp $");
376af7d7Schristos
2de962bdSlukem#include "portable.h"
2de962bdSlukem
2de962bdSlukem#include <ac/assert.h>
2de962bdSlukem#include <ac/stdlib.h>
2de962bdSlukem#include <ac/ctype.h>
2de962bdSlukem#include <ac/string.h>
2de962bdSlukem
2de962bdSlukem/* include socket.h to get sys/types.h and/or winsock2.h */
2de962bdSlukem#include <ac/socket.h>
2de962bdSlukem
2de962bdSlukem#include "lutil.h"
2de962bdSlukem
2de962bdSlukemstatic const char Base64[] =
2de962bdSlukem	"ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz0123456789+/";
2de962bdSlukemstatic const char Pad64 = '=';
2de962bdSlukem
2de962bdSlukem/* (From RFC1521 and draft-ietf-dnssec-secext-03.txt)
2de962bdSlukem   The following encoding technique is taken from RFC 1521 by Borenstein
2de962bdSlukem   and Freed.  It is reproduced here in a slightly edited form for
2de962bdSlukem   convenience.
2de962bdSlukem
2de962bdSlukem   A 65-character subset of US-ASCII is used, enabling 6 bits to be
2de962bdSlukem   represented per printable character. (The extra 65th character, "=",
2de962bdSlukem   is used to signify a special processing function.)
2de962bdSlukem
2de962bdSlukem   The encoding process represents 24-bit groups of input bits as output
2de962bdSlukem   strings of 4 encoded characters. Proceeding from left to right, a
2de962bdSlukem   24-bit input group is formed by concatenating 3 8-bit input groups.
2de962bdSlukem   These 24 bits are then treated as 4 concatenated 6-bit groups, each
2de962bdSlukem   of which is translated into a single digit in the base64 alphabet.
2de962bdSlukem
2de962bdSlukem   Each 6-bit group is used as an index into an array of 64 printable
2de962bdSlukem   characters. The character referenced by the index is placed in the
2de962bdSlukem   output string.
2de962bdSlukem
2de962bdSlukem                         Table 1: The Base64 Alphabet
2de962bdSlukem
2de962bdSlukem      Value Encoding  Value Encoding  Value Encoding  Value Encoding
2de962bdSlukem          0 A            17 R            34 i            51 z
2de962bdSlukem          1 B            18 S            35 j            52 0
2de962bdSlukem          2 C            19 T            36 k            53 1
2de962bdSlukem          3 D            20 U            37 l            54 2
2de962bdSlukem          4 E            21 V            38 m            55 3
2de962bdSlukem          5 F            22 W            39 n            56 4
2de962bdSlukem          6 G            23 X            40 o            57 5
2de962bdSlukem          7 H            24 Y            41 p            58 6
2de962bdSlukem          8 I            25 Z            42 q            59 7
2de962bdSlukem          9 J            26 a            43 r            60 8
2de962bdSlukem         10 K            27 b            44 s            61 9
2de962bdSlukem         11 L            28 c            45 t            62 +
2de962bdSlukem         12 M            29 d            46 u            63 /
2de962bdSlukem         13 N            30 e            47 v
2de962bdSlukem         14 O            31 f            48 w         (pad) =
2de962bdSlukem         15 P            32 g            49 x
2de962bdSlukem         16 Q            33 h            50 y
2de962bdSlukem
2de962bdSlukem   Special processing is performed if fewer than 24 bits are available
2de962bdSlukem   at the end of the data being encoded.  A full encoding quantum is
2de962bdSlukem   always completed at the end of a quantity.  When fewer than 24 input
2de962bdSlukem   bits are available in an input group, zero bits are added (on the
2de962bdSlukem   right) to form an integral number of 6-bit groups.  Padding at the
2de962bdSlukem   end of the data is performed using the '=' character.
2de962bdSlukem
2de962bdSlukem   Since all base64 input is an integral number of octets, only the
2de962bdSlukem         -------------------------------------------------
2de962bdSlukem   following cases can arise:
2de962bdSlukem
2de962bdSlukem       (1) the final quantum of encoding input is an integral
2de962bdSlukem           multiple of 24 bits; here, the final unit of encoded
2de962bdSlukem	   output will be an integral multiple of 4 characters
2de962bdSlukem	   with no "=" padding,
2de962bdSlukem       (2) the final quantum of encoding input is exactly 8 bits;
2de962bdSlukem           here, the final unit of encoded output will be two
2de962bdSlukem	   characters followed by two "=" padding characters, or
2de962bdSlukem       (3) the final quantum of encoding input is exactly 16 bits;
2de962bdSlukem           here, the final unit of encoded output will be three
2de962bdSlukem	   characters followed by one "=" padding character.
2de962bdSlukem   */
2de962bdSlukem
2de962bdSlukemint
2de962bdSlukemlutil_b64_ntop(
2de962bdSlukem	u_char const *src,
2de962bdSlukem	size_t srclength,
2de962bdSlukem	char *target,
2de962bdSlukem	size_t targsize)
2de962bdSlukem{
2de962bdSlukem	size_t datalength = 0;
2de962bdSlukem	u_char input[3];
2de962bdSlukem	u_char output[4];
2de962bdSlukem	size_t i;
2de962bdSlukem
2de962bdSlukem	while (2 < srclength) {
2de962bdSlukem		input[0] = *src++;
2de962bdSlukem		input[1] = *src++;
2de962bdSlukem		input[2] = *src++;
2de962bdSlukem		srclength -= 3;
2de962bdSlukem
2de962bdSlukem		output[0] = input[0] >> 2;
2de962bdSlukem		output[1] = ((input[0] & 0x03) << 4) + (input[1] >> 4);
2de962bdSlukem		output[2] = ((input[1] & 0x0f) << 2) + (input[2] >> 6);
2de962bdSlukem		output[3] = input[2] & 0x3f;
2de962bdSlukem		assert(output[0] < 64);
2de962bdSlukem		assert(output[1] < 64);
2de962bdSlukem		assert(output[2] < 64);
2de962bdSlukem		assert(output[3] < 64);
2de962bdSlukem
2de962bdSlukem		if (datalength + 4 > targsize)
2de962bdSlukem			return (-1);
2de962bdSlukem		target[datalength++] = Base64[output[0]];
2de962bdSlukem		target[datalength++] = Base64[output[1]];
2de962bdSlukem		target[datalength++] = Base64[output[2]];
2de962bdSlukem		target[datalength++] = Base64[output[3]];
2de962bdSlukem	}
2de962bdSlukem
2de962bdSlukem	/* Now we worry about padding. */
2de962bdSlukem	if (0 != srclength) {
2de962bdSlukem		/* Get what's left. */
2de962bdSlukem		input[0] = input[1] = input[2] = '\0';
2de962bdSlukem		for (i = 0; i < srclength; i++)
2de962bdSlukem			input[i] = *src++;
2de962bdSlukem
2de962bdSlukem		output[0] = input[0] >> 2;
2de962bdSlukem		output[1] = ((input[0] & 0x03) << 4) + (input[1] >> 4);
2de962bdSlukem		output[2] = ((input[1] & 0x0f) << 2) + (input[2] >> 6);
2de962bdSlukem		assert(output[0] < 64);
2de962bdSlukem		assert(output[1] < 64);
2de962bdSlukem		assert(output[2] < 64);
2de962bdSlukem
2de962bdSlukem		if (datalength + 4 > targsize)
2de962bdSlukem			return (-1);
2de962bdSlukem		target[datalength++] = Base64[output[0]];
2de962bdSlukem		target[datalength++] = Base64[output[1]];
2de962bdSlukem		if (srclength == 1)
2de962bdSlukem			target[datalength++] = Pad64;
2de962bdSlukem		else
2de962bdSlukem			target[datalength++] = Base64[output[2]];
2de962bdSlukem		target[datalength++] = Pad64;
2de962bdSlukem	}
2de962bdSlukem	if (datalength >= targsize)
2de962bdSlukem		return (-1);
2de962bdSlukem	target[datalength] = '\0';	/* Returned value doesn't count \0. */
2de962bdSlukem	return (datalength);
2de962bdSlukem}
2de962bdSlukem
2de962bdSlukem/* skips all whitespace anywhere.
2de962bdSlukem   converts characters, four at a time, starting at (or after)
2de962bdSlukem   src from base - 64 numbers into three 8 bit bytes in the target area.
2de962bdSlukem   it returns the number of data bytes stored at the target, or -1 on error.
2de962bdSlukem */
2de962bdSlukem
2de962bdSlukemint
2de962bdSlukemlutil_b64_pton(
2de962bdSlukem	char const *src,
2de962bdSlukem	u_char *target,
2de962bdSlukem	size_t targsize)
2de962bdSlukem{
2de962bdSlukem	int tarindex, state, ch;
2de962bdSlukem	char *pos;
2de962bdSlukem
2de962bdSlukem	state = 0;
2de962bdSlukem	tarindex = 0;
2de962bdSlukem
2de962bdSlukem	while ((ch = *src++) != '\0') {
2de962bdSlukem		if (isascii(ch) && isspace(ch))	/* Skip whitespace anywhere. */
2de962bdSlukem			continue;
2de962bdSlukem
2de962bdSlukem		if (ch == Pad64)
2de962bdSlukem			break;
2de962bdSlukem
2de962bdSlukem		pos = strchr(Base64, ch);
2de962bdSlukem		if (pos == 0) 		/* A non-base64 character. */
2de962bdSlukem			return (-1);
2de962bdSlukem
2de962bdSlukem		switch (state) {
2de962bdSlukem		case 0:
2de962bdSlukem			if (target) {
2de962bdSlukem				if ((size_t)tarindex >= targsize)
2de962bdSlukem					return (-1);
2de962bdSlukem				target[tarindex] = (pos - Base64) << 2;
2de962bdSlukem			}
2de962bdSlukem			state = 1;
2de962bdSlukem			break;
2de962bdSlukem		case 1:
2de962bdSlukem			if (target) {
2de962bdSlukem				if ((size_t)tarindex + 1 >= targsize)
2de962bdSlukem					return (-1);
2de962bdSlukem				target[tarindex]   |=  (pos - Base64) >> 4;
2de962bdSlukem				target[tarindex+1]  = ((pos - Base64) & 0x0f)
2de962bdSlukem							<< 4 ;
2de962bdSlukem			}
2de962bdSlukem			tarindex++;
2de962bdSlukem			state = 2;
2de962bdSlukem			break;
2de962bdSlukem		case 2:
2de962bdSlukem			if (target) {
2de962bdSlukem				if ((size_t)tarindex + 1 >= targsize)
2de962bdSlukem					return (-1);
2de962bdSlukem				target[tarindex]   |=  (pos - Base64) >> 2;
2de962bdSlukem				target[tarindex+1]  = ((pos - Base64) & 0x03)
2de962bdSlukem							<< 6;
2de962bdSlukem			}
2de962bdSlukem			tarindex++;
2de962bdSlukem			state = 3;
2de962bdSlukem			break;
2de962bdSlukem		case 3:
2de962bdSlukem			if (target) {
2de962bdSlukem				if ((size_t)tarindex >= targsize)
2de962bdSlukem					return (-1);
2de962bdSlukem				target[tarindex] |= (pos - Base64);
2de962bdSlukem			}
2de962bdSlukem			tarindex++;
2de962bdSlukem			state = 0;
2de962bdSlukem			break;
2de962bdSlukem		default:
2de962bdSlukem			abort();
2de962bdSlukem		}
2de962bdSlukem	}
2de962bdSlukem
2de962bdSlukem	/*
2de962bdSlukem	 * We are done decoding Base-64 chars.  Let's see if we ended
2de962bdSlukem	 * on a byte boundary, and/or with erroneous trailing characters.
2de962bdSlukem	 */
2de962bdSlukem
2de962bdSlukem	if (ch == Pad64) {		/* We got a pad char. */
2de962bdSlukem		ch = *src++;		/* Skip it, get next. */
2de962bdSlukem		switch (state) {
2de962bdSlukem		case 0:		/* Invalid = in first position */
2de962bdSlukem		case 1:		/* Invalid = in second position */
2de962bdSlukem			return (-1);
2de962bdSlukem
2de962bdSlukem		case 2:		/* Valid, means one byte of info */
2de962bdSlukem			/* Skip any number of spaces. */
2de962bdSlukem			for ((void)NULL; ch != '\0'; ch = *src++)
2de962bdSlukem				if (! (isascii(ch) && isspace(ch)))
2de962bdSlukem					break;
2de962bdSlukem			/* Make sure there is another trailing = sign. */
2de962bdSlukem			if (ch != Pad64)
2de962bdSlukem				return (-1);
2de962bdSlukem			ch = *src++;		/* Skip the = */
2de962bdSlukem			/* Fall through to "single trailing =" case. */
2de962bdSlukem			/* FALLTHROUGH */
2de962bdSlukem
2de962bdSlukem		case 3:		/* Valid, means two bytes of info */
2de962bdSlukem			/*
2de962bdSlukem			 * We know this char is an =.  Is there anything but
2de962bdSlukem			 * whitespace after it?
2de962bdSlukem			 */
2de962bdSlukem			for ((void)NULL; ch != '\0'; ch = *src++)
2de962bdSlukem				if (! (isascii(ch) && isspace(ch)))
2de962bdSlukem					return (-1);
2de962bdSlukem
2de962bdSlukem			/*
2de962bdSlukem			 * Now make sure for cases 2 and 3 that the "extra"
2de962bdSlukem			 * bits that slopped past the last full byte were
2de962bdSlukem			 * zeros.  If we don't check them, they become a
2de962bdSlukem			 * subliminal channel.
2de962bdSlukem			 */
2de962bdSlukem			if (target && target[tarindex] != 0)
2de962bdSlukem				return (-1);
2de962bdSlukem		}
2de962bdSlukem	} else {
2de962bdSlukem		/*
2de962bdSlukem		 * We ended by seeing the end of the string.  Make sure we
2de962bdSlukem		 * have no partial bytes lying around.
2de962bdSlukem		 */
2de962bdSlukem		if (state != 0)
2de962bdSlukem			return (-1);
2de962bdSlukem	}
2de962bdSlukem
2de962bdSlukem	return (tarindex);
2de962bdSlukem}