xref: /plan9-contrib/sys/src/libsec/port/chacha.c (revision 59f1ab2eed2731678066f939e3f8a9647023435d)
1*59f1ab2eSDavid du Colombier /*
2*59f1ab2eSDavid du Colombier Adapted from chacha-merged.c version 20080118
3*59f1ab2eSDavid du Colombier D. J. Bernstein
4*59f1ab2eSDavid du Colombier Public domain.
5*59f1ab2eSDavid du Colombier 
6*59f1ab2eSDavid du Colombier modified for use in Plan 9 and Inferno (no algorithmic changes),
7*59f1ab2eSDavid du Colombier and including the changes to block number and nonce defined in RFC7539
8*59f1ab2eSDavid du Colombier */
9*59f1ab2eSDavid du Colombier 
10*59f1ab2eSDavid du Colombier #include <u.h>
11*59f1ab2eSDavid du Colombier #include <libc.h>
12*59f1ab2eSDavid du Colombier #include <libsec.h>
13*59f1ab2eSDavid du Colombier 
14*59f1ab2eSDavid du Colombier enum{
15*59f1ab2eSDavid du Colombier 	Blockwords=	ChachaBsize/sizeof(u32int)
16*59f1ab2eSDavid du Colombier };
17*59f1ab2eSDavid du Colombier 
18*59f1ab2eSDavid du Colombier /* little-endian data order */
19*59f1ab2eSDavid du Colombier #define GET4(p)	((((((p)[3]<<8) | (p)[2])<<8) | (p)[1])<<8 | (p)[0])
20*59f1ab2eSDavid du Colombier #define PUT4(p, v)	(((p)[0]=v), (v>>=8), ((p)[1]=v), (v>>=8), ((p)[2]=v), (v>>=8), ((p)[3]=v))
21*59f1ab2eSDavid du Colombier 
22*59f1ab2eSDavid du Colombier #define ROTATE(v,c) ((u32int)((v) << (c)) | ((v) >> (32 - (c))))
23*59f1ab2eSDavid du Colombier 
24*59f1ab2eSDavid du Colombier #define QUARTERROUND(ia,ib,ic,id) { \
25*59f1ab2eSDavid du Colombier 	u32int a, b, c, d, t;\
26*59f1ab2eSDavid du Colombier 	a = x[ia]; b = x[ib]; c = x[ic]; d = x[id]; \
27*59f1ab2eSDavid du Colombier 	a += b; t = d^a; d = ROTATE(t,16); \
28*59f1ab2eSDavid du Colombier 	c += d; t = b^c; b = ROTATE(t,12); \
29*59f1ab2eSDavid du Colombier 	a += b; t = d^a; d = ROTATE(t, 8); \
30*59f1ab2eSDavid du Colombier 	c += d; t = b^c; b = ROTATE(t, 7); \
31*59f1ab2eSDavid du Colombier 	x[ia] = a; x[ib] = b; x[ic] = c; x[id] = d; \
32*59f1ab2eSDavid du Colombier }
33*59f1ab2eSDavid du Colombier 
34*59f1ab2eSDavid du Colombier #define ENCRYPT(s, x, y, d) {\
35*59f1ab2eSDavid du Colombier 	u32int v; \
36*59f1ab2eSDavid du Colombier 	uchar *sp, *dp; \
37*59f1ab2eSDavid du Colombier 	sp = (s); \
38*59f1ab2eSDavid du Colombier 	v = GET4(sp); \
39*59f1ab2eSDavid du Colombier 	v ^= (x)+(y); \
40*59f1ab2eSDavid du Colombier 	dp = (d); \
41*59f1ab2eSDavid du Colombier 	PUT4(dp, v); \
42*59f1ab2eSDavid du Colombier }
43*59f1ab2eSDavid du Colombier 
44*59f1ab2eSDavid du Colombier static uchar sigma[16] = "expand 32-byte k";
45*59f1ab2eSDavid du Colombier static uchar tau[16] = "expand 16-byte k";
46*59f1ab2eSDavid du Colombier 
47*59f1ab2eSDavid du Colombier static void
load(u32int * d,uchar * s,int nw)48*59f1ab2eSDavid du Colombier load(u32int *d, uchar *s, int nw)
49*59f1ab2eSDavid du Colombier {
50*59f1ab2eSDavid du Colombier 	int i;
51*59f1ab2eSDavid du Colombier 
52*59f1ab2eSDavid du Colombier 	for(i = 0; i < nw; i++, s+=4)
53*59f1ab2eSDavid du Colombier 		d[i] = GET4(s);
54*59f1ab2eSDavid du Colombier }
55*59f1ab2eSDavid du Colombier 
56*59f1ab2eSDavid du Colombier void
setupChachastate(Chachastate * s,uchar * key,usize keylen,uchar * iv,int rounds)57*59f1ab2eSDavid du Colombier setupChachastate(Chachastate *s, uchar *key, usize keylen, uchar *iv, int rounds)
58*59f1ab2eSDavid du Colombier {
59*59f1ab2eSDavid du Colombier 	if(keylen != 256/8 && keylen != 128/8)
60*59f1ab2eSDavid du Colombier 		sysfatal("invalid chacha key length");
61*59f1ab2eSDavid du Colombier 	if(rounds == 0)
62*59f1ab2eSDavid du Colombier 		rounds = 20;
63*59f1ab2eSDavid du Colombier 	s->rounds = rounds;
64*59f1ab2eSDavid du Colombier 	if(keylen == 256/8) { /* recommended */
65*59f1ab2eSDavid du Colombier 		load(&s->input[0], sigma, 4);
66*59f1ab2eSDavid du Colombier 		load(&s->input[4], key, 8);
67*59f1ab2eSDavid du Colombier 	}else{
68*59f1ab2eSDavid du Colombier 		load(&s->input[0], tau, 4);
69*59f1ab2eSDavid du Colombier 		load(&s->input[4], key, 4);
70*59f1ab2eSDavid du Colombier 		load(&s->input[8], key, 4);
71*59f1ab2eSDavid du Colombier 	}
72*59f1ab2eSDavid du Colombier 	s->input[12] = 0;
73*59f1ab2eSDavid du Colombier 	if(iv == nil){
74*59f1ab2eSDavid du Colombier 		s->input[13] = 0;
75*59f1ab2eSDavid du Colombier 		s->input[14] = 0;
76*59f1ab2eSDavid du Colombier 		s->input[15] = 0;
77*59f1ab2eSDavid du Colombier 	}else
78*59f1ab2eSDavid du Colombier 		load(&s->input[13], iv, 3);
79*59f1ab2eSDavid du Colombier }
80*59f1ab2eSDavid du Colombier 
81*59f1ab2eSDavid du Colombier void
chacha_setblock(Chachastate * s,u32int blockno)82*59f1ab2eSDavid du Colombier chacha_setblock(Chachastate *s, u32int blockno)
83*59f1ab2eSDavid du Colombier {
84*59f1ab2eSDavid du Colombier 	s->input[12] = blockno;
85*59f1ab2eSDavid du Colombier }
86*59f1ab2eSDavid du Colombier 
87*59f1ab2eSDavid du Colombier static void
encryptblock(Chachastate * s,uchar * src,uchar * dst)88*59f1ab2eSDavid du Colombier encryptblock(Chachastate *s, uchar *src, uchar *dst)
89*59f1ab2eSDavid du Colombier {
90*59f1ab2eSDavid du Colombier 	u32int x[Blockwords];
91*59f1ab2eSDavid du Colombier 	int i, rounds;
92*59f1ab2eSDavid du Colombier 
93*59f1ab2eSDavid du Colombier 	rounds = s->rounds;
94*59f1ab2eSDavid du Colombier 	x[0] = s->input[0];
95*59f1ab2eSDavid du Colombier 	x[1] = s->input[1];
96*59f1ab2eSDavid du Colombier 	x[2] = s->input[2];
97*59f1ab2eSDavid du Colombier 	x[3] = s->input[3];
98*59f1ab2eSDavid du Colombier 	x[4] = s->input[4];
99*59f1ab2eSDavid du Colombier 	x[5] = s->input[5];
100*59f1ab2eSDavid du Colombier 	x[6] = s->input[6];
101*59f1ab2eSDavid du Colombier 	x[7] = s->input[7];
102*59f1ab2eSDavid du Colombier 	x[8] = s->input[8];
103*59f1ab2eSDavid du Colombier 	x[9] = s->input[9];
104*59f1ab2eSDavid du Colombier 	x[10] = s->input[10];
105*59f1ab2eSDavid du Colombier 	x[11] = s->input[11];
106*59f1ab2eSDavid du Colombier 	x[12] = s->input[12];
107*59f1ab2eSDavid du Colombier 	x[13] = s->input[13];
108*59f1ab2eSDavid du Colombier 	x[14] = s->input[14];
109*59f1ab2eSDavid du Colombier 	x[15] = s->input[15];
110*59f1ab2eSDavid du Colombier 
111*59f1ab2eSDavid du Colombier 	for(i = rounds; i > 0; i -= 2) {
112*59f1ab2eSDavid du Colombier 		QUARTERROUND(0, 4, 8,12)
113*59f1ab2eSDavid du Colombier 		QUARTERROUND(1, 5, 9,13)
114*59f1ab2eSDavid du Colombier 		QUARTERROUND(2, 6,10,14)
115*59f1ab2eSDavid du Colombier 		QUARTERROUND(3, 7,11,15)
116*59f1ab2eSDavid du Colombier 
117*59f1ab2eSDavid du Colombier 		QUARTERROUND(0, 5,10,15)
118*59f1ab2eSDavid du Colombier 		QUARTERROUND(1, 6,11,12)
119*59f1ab2eSDavid du Colombier 		QUARTERROUND(2, 7, 8,13)
120*59f1ab2eSDavid du Colombier 		QUARTERROUND(3, 4, 9,14)
121*59f1ab2eSDavid du Colombier 	}
122*59f1ab2eSDavid du Colombier 
123*59f1ab2eSDavid du Colombier #ifdef FULL_UNROLL
124*59f1ab2eSDavid du Colombier 	ENCRYPT(src+0*4, x[0], s->input[0], dst+0*4);
125*59f1ab2eSDavid du Colombier 	ENCRYPT(src+1*4, x[1], s->input[1], dst+1*4);
126*59f1ab2eSDavid du Colombier 	ENCRYPT(src+2*4, x[2], s->input[2], dst+2*4);
127*59f1ab2eSDavid du Colombier 	ENCRYPT(src+3*4, x[3], s->input[3], dst+3*4);
128*59f1ab2eSDavid du Colombier 	ENCRYPT(src+4*4, x[4], s->input[4], dst+4*4);
129*59f1ab2eSDavid du Colombier 	ENCRYPT(src+5*4, x[5], s->input[5], dst+5*4);
130*59f1ab2eSDavid du Colombier 	ENCRYPT(src+6*4, x[6], s->input[6], dst+6*4);
131*59f1ab2eSDavid du Colombier 	ENCRYPT(src+7*4, x[7], s->input[7], dst+7*4);
132*59f1ab2eSDavid du Colombier 	ENCRYPT(src+8*4, x[8], s->input[8], dst+8*4);
133*59f1ab2eSDavid du Colombier 	ENCRYPT(src+9*4, x[9], s->input[9], dst+9*4);
134*59f1ab2eSDavid du Colombier 	ENCRYPT(src+10*4, x[10], s->input[10], dst+10*4);
135*59f1ab2eSDavid du Colombier 	ENCRYPT(src+11*4, x[11], s->input[11], dst+11*4);
136*59f1ab2eSDavid du Colombier 	ENCRYPT(src+12*4, x[12], s->input[12], dst+12*4);
137*59f1ab2eSDavid du Colombier 	ENCRYPT(src+13*4, x[13], s->input[13], dst+13*4);
138*59f1ab2eSDavid du Colombier 	ENCRYPT(src+14*4, x[14], s->input[14], dst+14*4);
139*59f1ab2eSDavid du Colombier 	ENCRYPT(src+15*4, x[15], s->input[15], dst+15*4);
140*59f1ab2eSDavid du Colombier #else
141*59f1ab2eSDavid du Colombier 	for(i=0; i<nelem(x); i+=4){
142*59f1ab2eSDavid du Colombier 		ENCRYPT(src, x[i], s->input[i], dst);
143*59f1ab2eSDavid du Colombier 		ENCRYPT(src+4, x[i+1], s->input[i+1], dst+4);
144*59f1ab2eSDavid du Colombier 		ENCRYPT(src+8, x[i+2], s->input[i+2], dst+8);
145*59f1ab2eSDavid du Colombier 		ENCRYPT(src+12, x[i+3], s->input[i+3], dst+12);
146*59f1ab2eSDavid du Colombier 		src += 16;
147*59f1ab2eSDavid du Colombier 		dst += 16;
148*59f1ab2eSDavid du Colombier 	}
149*59f1ab2eSDavid du Colombier #endif
150*59f1ab2eSDavid du Colombier 
151*59f1ab2eSDavid du Colombier 	s->input[12]++;
152*59f1ab2eSDavid du Colombier }
153*59f1ab2eSDavid du Colombier 
154*59f1ab2eSDavid du Colombier void
chacha_encrypt2(uchar * src,uchar * dst,usize bytes,Chachastate * s)155*59f1ab2eSDavid du Colombier chacha_encrypt2(uchar *src, uchar *dst, usize bytes, Chachastate *s)
156*59f1ab2eSDavid du Colombier {
157*59f1ab2eSDavid du Colombier 	uchar tmp[ChachaBsize];
158*59f1ab2eSDavid du Colombier 
159*59f1ab2eSDavid du Colombier 	for(; bytes >= ChachaBsize; bytes -= ChachaBsize){
160*59f1ab2eSDavid du Colombier 		encryptblock(s, src, dst);
161*59f1ab2eSDavid du Colombier 		src += ChachaBsize;
162*59f1ab2eSDavid du Colombier 		dst += ChachaBsize;
163*59f1ab2eSDavid du Colombier 	}
164*59f1ab2eSDavid du Colombier 	if(bytes > 0){
165*59f1ab2eSDavid du Colombier 		memmove(tmp, src, bytes);
166*59f1ab2eSDavid du Colombier 		encryptblock(s, tmp, tmp);
167*59f1ab2eSDavid du Colombier 		memmove(dst, tmp, bytes);
168*59f1ab2eSDavid du Colombier 	}
169*59f1ab2eSDavid du Colombier }
170*59f1ab2eSDavid du Colombier 
171*59f1ab2eSDavid du Colombier void
chacha_encrypt(uchar * buf,usize bytes,Chachastate * s)172*59f1ab2eSDavid du Colombier chacha_encrypt(uchar *buf, usize bytes, Chachastate *s)
173*59f1ab2eSDavid du Colombier {
174*59f1ab2eSDavid du Colombier 	chacha_encrypt2(buf, buf, bytes, s);
175*59f1ab2eSDavid du Colombier }
176