xref: /plan9/sys/src/libhttpd/urlunesc.c (revision 9a747e4fd48b9f4522c70c07e8f882a15030f964)
1*9a747e4fSDavid du Colombier #include <u.h>
2*9a747e4fSDavid du Colombier #include <libc.h>
3*9a747e4fSDavid du Colombier #include <bin.h>
4*9a747e4fSDavid du Colombier #include <httpd.h>
5*9a747e4fSDavid du Colombier 
6*9a747e4fSDavid du Colombier /* go from url with escaped utf to utf */
7*9a747e4fSDavid du Colombier char *
hurlunesc(HConnect * cc,char * s)8*9a747e4fSDavid du Colombier hurlunesc(HConnect *cc, char *s)
9*9a747e4fSDavid du Colombier {
10*9a747e4fSDavid du Colombier 	char *t, *v, *u;
11*9a747e4fSDavid du Colombier 	Rune r;
12*9a747e4fSDavid du Colombier 	int c, n;
13*9a747e4fSDavid du Colombier 
14*9a747e4fSDavid du Colombier 	/* unescape */
15*9a747e4fSDavid du Colombier 	u = halloc(cc, strlen(s)+1);
16*9a747e4fSDavid du Colombier 	for(t = u; c = *s; s++){
17*9a747e4fSDavid du Colombier 		if(c == '%'){
18*9a747e4fSDavid du Colombier 			n = s[1];
19*9a747e4fSDavid du Colombier 			if(n >= '0' && n <= '9')
20*9a747e4fSDavid du Colombier 				n = n - '0';
21*9a747e4fSDavid du Colombier 			else if(n >= 'A' && n <= 'F')
22*9a747e4fSDavid du Colombier 				n = n - 'A' + 10;
23*9a747e4fSDavid du Colombier 			else if(n >= 'a' && n <= 'f')
24*9a747e4fSDavid du Colombier 				n = n - 'a' + 10;
25*9a747e4fSDavid du Colombier 			else
26*9a747e4fSDavid du Colombier 				break;
27*9a747e4fSDavid du Colombier 			r = n;
28*9a747e4fSDavid du Colombier 			n = s[2];
29*9a747e4fSDavid du Colombier 			if(n >= '0' && n <= '9')
30*9a747e4fSDavid du Colombier 				n = n - '0';
31*9a747e4fSDavid du Colombier 			else if(n >= 'A' && n <= 'F')
32*9a747e4fSDavid du Colombier 				n = n - 'A' + 10;
33*9a747e4fSDavid du Colombier 			else if(n >= 'a' && n <= 'f')
34*9a747e4fSDavid du Colombier 				n = n - 'a' + 10;
35*9a747e4fSDavid du Colombier 			else
36*9a747e4fSDavid du Colombier 				break;
37*9a747e4fSDavid du Colombier 			s += 2;
38*9a747e4fSDavid du Colombier 			c = (r<<4)+n;
39*9a747e4fSDavid du Colombier 		}
40*9a747e4fSDavid du Colombier 		*t++ = c;
41*9a747e4fSDavid du Colombier 	}
42*9a747e4fSDavid du Colombier 	*t = '\0';
43*9a747e4fSDavid du Colombier 
44*9a747e4fSDavid du Colombier 	/* convert to valid utf */
45*9a747e4fSDavid du Colombier 	v = halloc(cc, UTFmax*strlen(u) + 1);
46*9a747e4fSDavid du Colombier 	s = u;
47*9a747e4fSDavid du Colombier 	t = v;
48*9a747e4fSDavid du Colombier 	while(*s){
49*9a747e4fSDavid du Colombier 		/* in decoding error, assume latin1 */
50*9a747e4fSDavid du Colombier 		if((n=chartorune(&r, s)) == 1 && r == Runeerror)
51*9a747e4fSDavid du Colombier 			r = (uchar)*s;
52*9a747e4fSDavid du Colombier 		s += n;
53*9a747e4fSDavid du Colombier 		t += runetochar(t, &r);
54*9a747e4fSDavid du Colombier 	}
55*9a747e4fSDavid du Colombier 	*t = '\0';
56*9a747e4fSDavid du Colombier 
57*9a747e4fSDavid du Colombier 	return v;
58*9a747e4fSDavid du Colombier }
59