xref: /plan9/sys/src/libhttpd/parsereq.c (revision b39189fd423aed869c5cf5189bc504918cff969b)
180ee5cbfSDavid du Colombier #include <u.h>
280ee5cbfSDavid du Colombier #include <libc.h>
380ee5cbfSDavid du Colombier #include <bin.h>
480ee5cbfSDavid du Colombier #include <httpd.h>
580ee5cbfSDavid du Colombier 
680ee5cbfSDavid du Colombier typedef struct Strings		Strings;
780ee5cbfSDavid du Colombier 
880ee5cbfSDavid du Colombier struct Strings
980ee5cbfSDavid du Colombier {
1080ee5cbfSDavid du Colombier 	char	*s1;
1180ee5cbfSDavid du Colombier 	char	*s2;
1280ee5cbfSDavid du Colombier };
1380ee5cbfSDavid du Colombier 
1480ee5cbfSDavid du Colombier static	char*		abspath(HConnect *cc, char *origpath, char *curdir);
1580ee5cbfSDavid du Colombier static	int		getc(HConnect*);
1680ee5cbfSDavid du Colombier static	char*		getword(HConnect*);
1780ee5cbfSDavid du Colombier static	Strings		parseuri(HConnect *c, char*);
1880ee5cbfSDavid du Colombier static	Strings		stripsearch(char*);
1980ee5cbfSDavid du Colombier 
2080ee5cbfSDavid du Colombier /*
2180ee5cbfSDavid du Colombier  * parse the next request line
2280ee5cbfSDavid du Colombier  * returns:
2380ee5cbfSDavid du Colombier  *	1 ok
2480ee5cbfSDavid du Colombier  *	0 eof
2580ee5cbfSDavid du Colombier  *	-1 error
2680ee5cbfSDavid du Colombier  */
2780ee5cbfSDavid du Colombier int
hparsereq(HConnect * c,int timeout)2880ee5cbfSDavid du Colombier hparsereq(HConnect *c, int timeout)
2980ee5cbfSDavid du Colombier {
3080ee5cbfSDavid du Colombier 	Strings ss;
3180ee5cbfSDavid du Colombier 	char *vs, *v, *search, *uri, *origuri, *extra;
3280ee5cbfSDavid du Colombier 
3380ee5cbfSDavid du Colombier 	if(c->bin != nil){
3480ee5cbfSDavid du Colombier 		hfail(c, HInternal);
3580ee5cbfSDavid du Colombier 		return -1;
3680ee5cbfSDavid du Colombier 	}
3780ee5cbfSDavid du Colombier 
3880ee5cbfSDavid du Colombier 	/*
3980ee5cbfSDavid du Colombier 	 * serve requests until a magic request.
4080ee5cbfSDavid du Colombier 	 * later requests have to come quickly.
4180ee5cbfSDavid du Colombier 	 * only works for http/1.1 or later.
4280ee5cbfSDavid du Colombier 	 */
43e059317eSDavid du Colombier 	if(timeout)
4480ee5cbfSDavid du Colombier 		alarm(timeout);
45e059317eSDavid du Colombier 	if(hgethead(c, 0) < 0)
46e059317eSDavid du Colombier 		return -1;
47e059317eSDavid du Colombier 	if(timeout)
4880ee5cbfSDavid du Colombier 		alarm(0);
4980ee5cbfSDavid du Colombier 	c->reqtime = time(nil);
5080ee5cbfSDavid du Colombier 	c->req.meth = getword(c);
5180ee5cbfSDavid du Colombier 	if(c->req.meth == nil){
5280ee5cbfSDavid du Colombier 		hfail(c, HSyntax);
5380ee5cbfSDavid du Colombier 		return -1;
5480ee5cbfSDavid du Colombier 	}
5580ee5cbfSDavid du Colombier 	uri = getword(c);
5680ee5cbfSDavid du Colombier 	if(uri == nil || strlen(uri) == 0){
5780ee5cbfSDavid du Colombier 		hfail(c, HSyntax);
5880ee5cbfSDavid du Colombier 		return -1;
5980ee5cbfSDavid du Colombier 	}
6080ee5cbfSDavid du Colombier 	v = getword(c);
6180ee5cbfSDavid du Colombier 	if(v == nil){
6280ee5cbfSDavid du Colombier 		if(strcmp(c->req.meth, "GET") != 0){
6380ee5cbfSDavid du Colombier 			hfail(c, HUnimp, c->req.meth);
6480ee5cbfSDavid du Colombier 			return -1;
6580ee5cbfSDavid du Colombier 		}
6680ee5cbfSDavid du Colombier 		c->req.vermaj = 0;
6780ee5cbfSDavid du Colombier 		c->req.vermin = 9;
6880ee5cbfSDavid du Colombier 	}else{
6980ee5cbfSDavid du Colombier 		vs = v;
7080ee5cbfSDavid du Colombier 		if(strncmp(vs, "HTTP/", 5) != 0){
7180ee5cbfSDavid du Colombier 			hfail(c, HUnkVers, vs);
7280ee5cbfSDavid du Colombier 			return -1;
7380ee5cbfSDavid du Colombier 		}
7480ee5cbfSDavid du Colombier 		vs += 5;
7580ee5cbfSDavid du Colombier 		c->req.vermaj = strtoul(vs, &vs, 10);
7680ee5cbfSDavid du Colombier 		if(*vs != '.' || c->req.vermaj != 1){
7780ee5cbfSDavid du Colombier 			hfail(c, HUnkVers, vs);
7880ee5cbfSDavid du Colombier 			return -1;
7980ee5cbfSDavid du Colombier 		}
8080ee5cbfSDavid du Colombier 		vs++;
8180ee5cbfSDavid du Colombier 		c->req.vermin = strtoul(vs, &vs, 10);
8280ee5cbfSDavid du Colombier 		if(*vs != '\0'){
8380ee5cbfSDavid du Colombier 			hfail(c, HUnkVers, vs);
8480ee5cbfSDavid du Colombier 			return -1;
8580ee5cbfSDavid du Colombier 		}
8680ee5cbfSDavid du Colombier 
8780ee5cbfSDavid du Colombier 		extra = getword(c);
8880ee5cbfSDavid du Colombier 		if(extra != nil){
8980ee5cbfSDavid du Colombier 			hfail(c, HSyntax);
9080ee5cbfSDavid du Colombier 			return -1;
9180ee5cbfSDavid du Colombier 		}
9280ee5cbfSDavid du Colombier 	}
9380ee5cbfSDavid du Colombier 
9480ee5cbfSDavid du Colombier 	/*
9580ee5cbfSDavid du Colombier 	 * the fragment is not supposed to be sent
9680ee5cbfSDavid du Colombier 	 * strip it 'cause some clients send it
9780ee5cbfSDavid du Colombier 	 */
9880ee5cbfSDavid du Colombier 	origuri = uri;
9980ee5cbfSDavid du Colombier 	uri = strchr(origuri, '#');
10080ee5cbfSDavid du Colombier 	if(uri != nil)
10180ee5cbfSDavid du Colombier 		*uri = 0;
10280ee5cbfSDavid du Colombier 
10380ee5cbfSDavid du Colombier 	/*
10480ee5cbfSDavid du Colombier 	 * http/1.1 requires the server to accept absolute
10580ee5cbfSDavid du Colombier 	 * or relative uri's.  convert to relative with an absolute path
10680ee5cbfSDavid du Colombier 	 */
10780ee5cbfSDavid du Colombier 	if(http11(c)){
10880ee5cbfSDavid du Colombier 		ss = parseuri(c, origuri);
10980ee5cbfSDavid du Colombier 		uri = ss.s1;
11080ee5cbfSDavid du Colombier 		c->req.urihost = ss.s2;
11180ee5cbfSDavid du Colombier 		if(uri == nil){
11280ee5cbfSDavid du Colombier 			hfail(c, HBadReq, uri);
11380ee5cbfSDavid du Colombier 			return -1;
11480ee5cbfSDavid du Colombier 		}
11580ee5cbfSDavid du Colombier 		origuri = uri;
11680ee5cbfSDavid du Colombier 	}
11780ee5cbfSDavid du Colombier 
11880ee5cbfSDavid du Colombier 	/*
11980ee5cbfSDavid du Colombier 	 * munge uri for search, protection, and magic
12080ee5cbfSDavid du Colombier 	 */
12180ee5cbfSDavid du Colombier 	ss = stripsearch(origuri);
12280ee5cbfSDavid du Colombier 	origuri = ss.s1;
12380ee5cbfSDavid du Colombier 	search = ss.s2;
12480ee5cbfSDavid du Colombier 	uri = hurlunesc(c, origuri);
12580ee5cbfSDavid du Colombier 	uri = abspath(c, uri, "/");
12680ee5cbfSDavid du Colombier 	if(uri == nil || uri[0] == '\0'){
12780ee5cbfSDavid du Colombier 		hfail(c, HNotFound, "no object specified");
12880ee5cbfSDavid du Colombier 		return -1;
12980ee5cbfSDavid du Colombier 	}
13080ee5cbfSDavid du Colombier 
13180ee5cbfSDavid du Colombier 	c->req.uri = uri;
13280ee5cbfSDavid du Colombier 	c->req.search = search;
1337ef45392SDavid du Colombier 	if(search)
1347ef45392SDavid du Colombier 		c->req.searchpairs = hparsequery(c, hstrdup(c, search));
13580ee5cbfSDavid du Colombier 
13680ee5cbfSDavid du Colombier 	return 1;
13780ee5cbfSDavid du Colombier }
13880ee5cbfSDavid du Colombier 
13980ee5cbfSDavid du Colombier static Strings
parseuri(HConnect * c,char * uri)14080ee5cbfSDavid du Colombier parseuri(HConnect *c, char *uri)
14180ee5cbfSDavid du Colombier {
14280ee5cbfSDavid du Colombier 	Strings ss;
14380ee5cbfSDavid du Colombier 	char *urihost, *p;
14480ee5cbfSDavid du Colombier 
14580ee5cbfSDavid du Colombier 	urihost = nil;
146*b39189fdSDavid du Colombier 	ss.s1 = ss.s2 = nil;
147*b39189fdSDavid du Colombier 	if(uri[0] != '/')
148*b39189fdSDavid du Colombier 		if(cistrncmp(uri, "http://", 7) == 0)
14980ee5cbfSDavid du Colombier 			uri += 5;		/* skip http: */
150*b39189fdSDavid du Colombier 		else if (cistrncmp(uri, "https://", 8) == 0)
151*b39189fdSDavid du Colombier 			uri += 6;		/* skip https: */
152*b39189fdSDavid du Colombier 		else
153*b39189fdSDavid du Colombier 			return ss;
15480ee5cbfSDavid du Colombier 
15580ee5cbfSDavid du Colombier 	/*
15680ee5cbfSDavid du Colombier 	 * anything starting with // is a host name or number
157*b39189fdSDavid du Colombier 	 * hostnames consists of letters, digits, - and .
15880ee5cbfSDavid du Colombier 	 * for now, just ignore any port given
15980ee5cbfSDavid du Colombier 	 */
16080ee5cbfSDavid du Colombier 	if(uri[0] == '/' && uri[1] == '/'){
16180ee5cbfSDavid du Colombier 		urihost = uri + 2;
16280ee5cbfSDavid du Colombier 		p = strchr(urihost, '/');
16380ee5cbfSDavid du Colombier 		if(p == nil)
16480ee5cbfSDavid du Colombier 			uri = hstrdup(c, "/");
16580ee5cbfSDavid du Colombier 		else{
16680ee5cbfSDavid du Colombier 			uri = hstrdup(c, p);
16780ee5cbfSDavid du Colombier 			*p = '\0';
16880ee5cbfSDavid du Colombier 		}
16980ee5cbfSDavid du Colombier 		p = strchr(urihost, ':');
17080ee5cbfSDavid du Colombier 		if(p != nil)
17180ee5cbfSDavid du Colombier 			*p = '\0';
17280ee5cbfSDavid du Colombier 	}
17380ee5cbfSDavid du Colombier 
174*b39189fdSDavid du Colombier 	if(uri[0] != '/' || uri[1] == '/')
17580ee5cbfSDavid du Colombier 		return ss;
17680ee5cbfSDavid du Colombier 
17780ee5cbfSDavid du Colombier 	ss.s1 = uri;
17880ee5cbfSDavid du Colombier 	ss.s2 = hlower(urihost);
17980ee5cbfSDavid du Colombier 	return ss;
18080ee5cbfSDavid du Colombier }
18180ee5cbfSDavid du Colombier static Strings
stripsearch(char * uri)18280ee5cbfSDavid du Colombier stripsearch(char *uri)
18380ee5cbfSDavid du Colombier {
18480ee5cbfSDavid du Colombier 	Strings ss;
18580ee5cbfSDavid du Colombier 	char *search;
18680ee5cbfSDavid du Colombier 
18780ee5cbfSDavid du Colombier 	search = strchr(uri, '?');
18880ee5cbfSDavid du Colombier 	if(search != nil)
18980ee5cbfSDavid du Colombier 		*search++ = 0;
19080ee5cbfSDavid du Colombier 	ss.s1 = uri;
19180ee5cbfSDavid du Colombier 	ss.s2 = search;
19280ee5cbfSDavid du Colombier 	return ss;
19380ee5cbfSDavid du Colombier }
19480ee5cbfSDavid du Colombier 
19580ee5cbfSDavid du Colombier /*
19680ee5cbfSDavid du Colombier  *  to circumscribe the accessible files we have to eliminate ..'s
19780ee5cbfSDavid du Colombier  *  and resolve all names from the root.
19880ee5cbfSDavid du Colombier  */
19980ee5cbfSDavid du Colombier static char*
abspath(HConnect * cc,char * origpath,char * curdir)20080ee5cbfSDavid du Colombier abspath(HConnect *cc, char *origpath, char *curdir)
20180ee5cbfSDavid du Colombier {
20280ee5cbfSDavid du Colombier 	char *p, *sp, *path, *work, *rpath;
20380ee5cbfSDavid du Colombier 	int len, n, c;
20480ee5cbfSDavid du Colombier 
20580ee5cbfSDavid du Colombier 	if(curdir == nil)
20680ee5cbfSDavid du Colombier 		curdir = "/";
20780ee5cbfSDavid du Colombier 	if(origpath == nil)
20880ee5cbfSDavid du Colombier 		origpath = "";
20980ee5cbfSDavid du Colombier 	work = hstrdup(cc, origpath);
21080ee5cbfSDavid du Colombier 	path = work;
21180ee5cbfSDavid du Colombier 
21280ee5cbfSDavid du Colombier 	/*
21380ee5cbfSDavid du Colombier 	 * remove any really special characters
21480ee5cbfSDavid du Colombier 	 */
21580ee5cbfSDavid du Colombier 	for(sp = "`;|"; *sp; sp++){
21680ee5cbfSDavid du Colombier 		p = strchr(path, *sp);
21780ee5cbfSDavid du Colombier 		if(p)
21880ee5cbfSDavid du Colombier 			*p = 0;
21980ee5cbfSDavid du Colombier 	}
22080ee5cbfSDavid du Colombier 
22180ee5cbfSDavid du Colombier 	len = strlen(curdir) + strlen(path) + 2 + UTFmax;
22280ee5cbfSDavid du Colombier 	if(len < 10)
22380ee5cbfSDavid du Colombier 		len = 10;
22480ee5cbfSDavid du Colombier 	rpath = halloc(cc, len);
22580ee5cbfSDavid du Colombier 	if(*path == '/')
22680ee5cbfSDavid du Colombier 		rpath[0] = 0;
22780ee5cbfSDavid du Colombier 	else
22880ee5cbfSDavid du Colombier 		strcpy(rpath, curdir);
22980ee5cbfSDavid du Colombier 	n = strlen(rpath);
23080ee5cbfSDavid du Colombier 
23180ee5cbfSDavid du Colombier 	while(path){
23280ee5cbfSDavid du Colombier 		p = strchr(path, '/');
23380ee5cbfSDavid du Colombier 		if(p)
23480ee5cbfSDavid du Colombier 			*p++ = 0;
23580ee5cbfSDavid du Colombier 		if(strcmp(path, "..") == 0){
23680ee5cbfSDavid du Colombier 			while(n > 1){
23780ee5cbfSDavid du Colombier 				n--;
23880ee5cbfSDavid du Colombier 				c = rpath[n];
23980ee5cbfSDavid du Colombier 				rpath[n] = 0;
24080ee5cbfSDavid du Colombier 				if(c == '/')
24180ee5cbfSDavid du Colombier 					break;
24280ee5cbfSDavid du Colombier 			}
2439a747e4fSDavid du Colombier 		}else if(strcmp(path, ".") == 0){
24480ee5cbfSDavid du Colombier 			;
2459a747e4fSDavid du Colombier 		}else if(n == 1)
24680ee5cbfSDavid du Colombier 			n += snprint(rpath+n, len-n, "%s", path);
24780ee5cbfSDavid du Colombier 		else
24880ee5cbfSDavid du Colombier 			n += snprint(rpath+n, len-n, "/%s", path);
24980ee5cbfSDavid du Colombier 		path = p;
25080ee5cbfSDavid du Colombier 	}
25180ee5cbfSDavid du Colombier 
25280ee5cbfSDavid du Colombier 	if(strncmp(rpath, "/bin/", 5) == 0)
25380ee5cbfSDavid du Colombier 		strcpy(rpath, "/");
25480ee5cbfSDavid du Colombier 	return rpath;
25580ee5cbfSDavid du Colombier }
25680ee5cbfSDavid du Colombier 
25780ee5cbfSDavid du Colombier static char*
getword(HConnect * c)25880ee5cbfSDavid du Colombier getword(HConnect *c)
25980ee5cbfSDavid du Colombier {
26080ee5cbfSDavid du Colombier 	char *buf;
26180ee5cbfSDavid du Colombier 	int ch, n;
26280ee5cbfSDavid du Colombier 
26380ee5cbfSDavid du Colombier 	while((ch = getc(c)) == ' ' || ch == '\t' || ch == '\r')
26480ee5cbfSDavid du Colombier 		;
26580ee5cbfSDavid du Colombier 	if(ch == '\n')
26680ee5cbfSDavid du Colombier 		return nil;
26780ee5cbfSDavid du Colombier 	n = 0;
26880ee5cbfSDavid du Colombier 	buf = halloc(c, 1);
26980ee5cbfSDavid du Colombier 	for(;;){
27080ee5cbfSDavid du Colombier 		switch(ch){
27180ee5cbfSDavid du Colombier 		case ' ':
27280ee5cbfSDavid du Colombier 		case '\t':
27380ee5cbfSDavid du Colombier 		case '\r':
27480ee5cbfSDavid du Colombier 		case '\n':
27580ee5cbfSDavid du Colombier 			buf[n] = '\0';
27680ee5cbfSDavid du Colombier 			return hstrdup(c, buf);
27780ee5cbfSDavid du Colombier 		}
27880ee5cbfSDavid du Colombier 
27980ee5cbfSDavid du Colombier 		if(n < HMaxWord-1){
28080ee5cbfSDavid du Colombier 			buf = bingrow(&c->bin, buf, n, n + 1, 0);
28180ee5cbfSDavid du Colombier 			if(buf == nil)
28280ee5cbfSDavid du Colombier 				return nil;
28380ee5cbfSDavid du Colombier 			buf[n++] = ch;
28480ee5cbfSDavid du Colombier 		}
28580ee5cbfSDavid du Colombier 		ch = getc(c);
28680ee5cbfSDavid du Colombier 	}
28780ee5cbfSDavid du Colombier }
28880ee5cbfSDavid du Colombier 
28980ee5cbfSDavid du Colombier static int
getc(HConnect * c)29080ee5cbfSDavid du Colombier getc(HConnect *c)
29180ee5cbfSDavid du Colombier {
29280ee5cbfSDavid du Colombier 	if(c->hpos < c->hstop)
29380ee5cbfSDavid du Colombier 		return *c->hpos++;
29480ee5cbfSDavid du Colombier 	return '\n';
29580ee5cbfSDavid du Colombier }
296