xref: /plan9/sys/src/cmd/ip/httpd/netlib_find.c (revision 9a747e4fd48b9f4522c70c07e8f882a15030f964)
17dd7cddfSDavid du Colombier /* invoked from /netlib/pub/search.html */
27dd7cddfSDavid du Colombier 
37dd7cddfSDavid du Colombier #include <u.h>
47dd7cddfSDavid du Colombier #include <libc.h>
57dd7cddfSDavid du Colombier #include <bio.h>
67dd7cddfSDavid du Colombier #include "httpd.h"
780ee5cbfSDavid du Colombier #include "httpsrv.h"
87dd7cddfSDavid du Colombier 
97dd7cddfSDavid du Colombier void bib_fmt(char*,char*);
107dd7cddfSDavid du Colombier void index_fmt(char*,char*);
117dd7cddfSDavid du Colombier void no_fmt(char*,char*);
1280ee5cbfSDavid du Colombier int send(HConnect*);
137dd7cddfSDavid du Colombier 
147dd7cddfSDavid du Colombier Hio *hout;
157dd7cddfSDavid du Colombier 
167dd7cddfSDavid du Colombier /********** table of databases ************/
177dd7cddfSDavid du Colombier 
187dd7cddfSDavid du Colombier typedef struct DB	DB;
197dd7cddfSDavid du Colombier struct DB
207dd7cddfSDavid du Colombier {
217dd7cddfSDavid du Colombier 	int	SELECT;	/* value from search.html */
227dd7cddfSDavid du Colombier 	char	*log;	/* abbreviation for logfile */
237dd7cddfSDavid du Colombier 	int	maxhit;	/* maximum number of hits to return */
247dd7cddfSDavid du Colombier 	char	*file;	/* searchfs database */
257dd7cddfSDavid du Colombier 	void	(*fmt)(char*,char*); /* convert one record to HTML */
267dd7cddfSDavid du Colombier 	char	*postlude;	/* trailer text */
277dd7cddfSDavid du Colombier };
287dd7cddfSDavid du Colombier 
297dd7cddfSDavid du Colombier DB db[] =
307dd7cddfSDavid du Colombier {
317dd7cddfSDavid du Colombier  {0, "netlib",	250, "/srv/netlib_DEFAULT", index_fmt,
327dd7cddfSDavid du Colombier 	"<HR><A HREF=\"/netlib/master\">browse netlib</A></BODY>\r\n"},
337dd7cddfSDavid du Colombier  {1, "BibNet",	250, "/srv/netlib_bibnet", bib_fmt,
347dd7cddfSDavid du Colombier 	"<HR><A HREF=\"/netlib/bibnet\">browse BibNet</A></BODY>\r\n"},
357dd7cddfSDavid du Colombier  {2, "compgeom",	250, "/srv/netlib_compgeom", no_fmt, "</BODY>\r\n"},
367dd7cddfSDavid du Colombier  {3, "approx",	250, "/srv/netlib_approximation", no_fmt,
377dd7cddfSDavid du Colombier 	"<HR><A HREF=\"/netlib/a/catalog.html.gz\">hierarchical catalog</A></BODY>\r\n"},
387dd7cddfSDavid du Colombier  {4, "siam",	 50, "/srv/netlib_siam-Secret", no_fmt, "</BODY>\r\n"},
397dd7cddfSDavid du Colombier  {-1,"",0,"",no_fmt,""}
407dd7cddfSDavid du Colombier };
417dd7cddfSDavid du Colombier 
427dd7cddfSDavid du Colombier 
437dd7cddfSDavid du Colombier 
447dd7cddfSDavid du Colombier /********** reformat database record as HTML ************/
457dd7cddfSDavid du Colombier 
467dd7cddfSDavid du Colombier void /* tr '\015' '\012' ("uncombline") */
no_fmt(char * s,char * e)477dd7cddfSDavid du Colombier no_fmt(char*s,char*e)
487dd7cddfSDavid du Colombier {
497dd7cddfSDavid du Colombier 	/* s = start, e = (one past) end of database record */
507dd7cddfSDavid du Colombier 	char *p;
517dd7cddfSDavid du Colombier 	for(p = s; p<e; p++)
527dd7cddfSDavid du Colombier 		if(*p=='\r'){
537dd7cddfSDavid du Colombier 			hwrite(hout, s,p-s);
547dd7cddfSDavid du Colombier 			hprint(hout, "\n");
557dd7cddfSDavid du Colombier 			s = p+1;
567dd7cddfSDavid du Colombier 		}
577dd7cddfSDavid du Colombier }
587dd7cddfSDavid du Colombier 
597dd7cddfSDavid du Colombier int /* should the filename have .gz appended? */
suffix(char * filename)607dd7cddfSDavid du Colombier suffix(char*filename)
617dd7cddfSDavid du Colombier {
627dd7cddfSDavid du Colombier 	int n;
637dd7cddfSDavid du Colombier 	char *z;
647dd7cddfSDavid du Colombier 
657dd7cddfSDavid du Colombier 	if(!filename || *filename==0)
667dd7cddfSDavid du Colombier 		return(0);
677dd7cddfSDavid du Colombier 	n = strlen(filename);
687dd7cddfSDavid du Colombier 	if(strncmp(".html",filename+n-5,5)==0)
697dd7cddfSDavid du Colombier 		return(0);
707dd7cddfSDavid du Colombier 	z = malloc(n+50);
717dd7cddfSDavid du Colombier 	if(z == nil)
727dd7cddfSDavid du Colombier 		return(0);
737dd7cddfSDavid du Colombier 	strcpy(z,"/netlib/pub/");
747dd7cddfSDavid du Colombier 	strcat(z,filename);
757dd7cddfSDavid du Colombier 	strcat(z,".gz");
767dd7cddfSDavid du Colombier 	if(access(z,4)==0){
777dd7cddfSDavid du Colombier 		free(z);
787dd7cddfSDavid du Colombier 		return(1);
797dd7cddfSDavid du Colombier 	}
807dd7cddfSDavid du Colombier 	free(z);
817dd7cddfSDavid du Colombier 	return(0);
827dd7cddfSDavid du Colombier }
837dd7cddfSDavid du Colombier 
847dd7cddfSDavid du Colombier void /* add HREF to "file:" lines */
index_fmt(char * s,char * e)857dd7cddfSDavid du Colombier index_fmt(char*s,char*e)
867dd7cddfSDavid du Colombier {
877dd7cddfSDavid du Colombier 	char *p, *filename;
887dd7cddfSDavid du Colombier 	if(strncmp(s,"file",4)==0 && (s[4]==' '||s[4]=='\t')){
897dd7cddfSDavid du Colombier 		for(filename = s+4; strchr(" \t",*filename); filename++){}
907dd7cddfSDavid du Colombier 		for(s = filename; *s && strchr("\r\n",*s)==nil; s++){}
917dd7cddfSDavid du Colombier 		*s++ = '\0';
927dd7cddfSDavid du Colombier 		if(*s=='\n') s++;
937dd7cddfSDavid du Colombier 		hprint(hout, "file:   <A HREF=\"/netlib/%s",filename);
947dd7cddfSDavid du Colombier 		if(suffix(filename))
957dd7cddfSDavid du Colombier 			hprint(hout, ".gz");
967dd7cddfSDavid du Colombier 		hprint(hout, "\">%s</A>\r\n",filename);
977dd7cddfSDavid du Colombier 		for(p = s; p<e; p++)
987dd7cddfSDavid du Colombier 			if(*p=='\r'){
997dd7cddfSDavid du Colombier 				hwrite(hout, s,p-s);
1007dd7cddfSDavid du Colombier 				hprint(hout, "\n");
1017dd7cddfSDavid du Colombier 				s = p+1;
1027dd7cddfSDavid du Colombier 			}
1037dd7cddfSDavid du Colombier 	}else if(strncmp(s,"lib",3)==0 && (s[3]==' '||s[3]=='\t')){
1047dd7cddfSDavid du Colombier 		for(filename = s+3; strchr(" \t",*filename); filename++){}
1057dd7cddfSDavid du Colombier 		for(s = filename; *s && strchr("\r\n",*s)==nil; s++){}
1067dd7cddfSDavid du Colombier 		*s++ = '\0';
1077dd7cddfSDavid du Colombier 		if(*s=='\n') s++;
1087dd7cddfSDavid du Colombier 		hprint(hout, "lib:    <A HREF=\"/netlib/%s",filename);
1097dd7cddfSDavid du Colombier 		hprint(hout, "\">%s</A>\r\n",filename);
1107dd7cddfSDavid du Colombier 		for(p = s; p<e; p++)
1117dd7cddfSDavid du Colombier 			if(*p=='\r'){
1127dd7cddfSDavid du Colombier 				hwrite(hout, s,p-s);
1137dd7cddfSDavid du Colombier 				hprint(hout, "\n");
1147dd7cddfSDavid du Colombier 				s = p+1;
1157dd7cddfSDavid du Colombier 			}
1167dd7cddfSDavid du Colombier 	}else{
1177dd7cddfSDavid du Colombier 		no_fmt(s,e);
1187dd7cddfSDavid du Colombier 	}
1197dd7cddfSDavid du Colombier }
1207dd7cddfSDavid du Colombier 
1217dd7cddfSDavid du Colombier void /* add HREF to "URL" lines */
bib_fmt(char * s,char * e)1227dd7cddfSDavid du Colombier bib_fmt(char*s,char*e)
1237dd7cddfSDavid du Colombier {
1247dd7cddfSDavid du Colombier 	char *p, *filename;
1257dd7cddfSDavid du Colombier 	for(p = s; p<e; p++)
1267dd7cddfSDavid du Colombier 		if(*p=='\r'){
1277dd7cddfSDavid du Colombier 			hwrite(hout, s,p-s);
1287dd7cddfSDavid du Colombier 			hprint(hout, "\n");
1297dd7cddfSDavid du Colombier 			s = p+1;
1307dd7cddfSDavid du Colombier 			if(strncmp(s," URL =",6)==0 &&
1317dd7cddfSDavid du Colombier 					(filename = strchr(s+6,'"'))!=nil){
1327dd7cddfSDavid du Colombier 				filename++;
1337dd7cddfSDavid du Colombier 				for(s = filename; *s && strchr("\"\r\n",*s)==nil; s++){}
1347dd7cddfSDavid du Colombier 				*s++ = '\0';
1357dd7cddfSDavid du Colombier 				p = s;
1367dd7cddfSDavid du Colombier 				hprint(hout, " URL =<A HREF=\"%s\">%s</A>",
1377dd7cddfSDavid du Colombier 					filename,filename);
1387dd7cddfSDavid du Colombier 			}
1397dd7cddfSDavid du Colombier 		}
1407dd7cddfSDavid du Colombier }
1417dd7cddfSDavid du Colombier 
1427dd7cddfSDavid du Colombier 
1437dd7cddfSDavid du Colombier /********** main() calls httpheadget() calls send() ************/
1447dd7cddfSDavid du Colombier 
1457dd7cddfSDavid du Colombier void
main(int argc,char ** argv)1467dd7cddfSDavid du Colombier main(int argc, char **argv)
1477dd7cddfSDavid du Colombier {
14880ee5cbfSDavid du Colombier 	HConnect *c;
1497dd7cddfSDavid du Colombier 
1507dd7cddfSDavid du Colombier 	c = init(argc, argv);
1517dd7cddfSDavid du Colombier 	hout = &c->hout;
15280ee5cbfSDavid du Colombier 	if(hparseheaders(c, HSTIMEOUT) >= 0)
1537dd7cddfSDavid du Colombier 		send(c);
1547dd7cddfSDavid du Colombier 	exits(nil);
1557dd7cddfSDavid du Colombier }
1567dd7cddfSDavid du Colombier 
1577dd7cddfSDavid du Colombier Biobuf Blist;
1587dd7cddfSDavid du Colombier 
1597dd7cddfSDavid du Colombier Biobuf*
init800fs(char * name,char * pat)1607dd7cddfSDavid du Colombier init800fs(char*name,char*pat)
1617dd7cddfSDavid du Colombier {
1627dd7cddfSDavid du Colombier 	int fd800fs, n;
1637dd7cddfSDavid du Colombier 	char*search;
1647dd7cddfSDavid du Colombier 
1657dd7cddfSDavid du Colombier 	fd800fs = open(name, ORDWR);
1667dd7cddfSDavid du Colombier 	if(fd800fs < 0)
1677dd7cddfSDavid du Colombier 		exits("can't connect to 800fs server");
168*9a747e4fSDavid du Colombier 	if(mount(fd800fs, -1, "/mnt", MREPL, "") < 0)
1697dd7cddfSDavid du Colombier 		exits("can't mount /mnt");
1707dd7cddfSDavid du Colombier 	fd800fs = open("/mnt/search", ORDWR);
1717dd7cddfSDavid du Colombier 	n = strlen("search=")+strlen(pat)+1;
1727dd7cddfSDavid du Colombier 	search = ezalloc(n);
1737dd7cddfSDavid du Colombier 	strcpy(search,"search=");
1747dd7cddfSDavid du Colombier 	strcat(search,pat);
1757dd7cddfSDavid du Colombier 	write(fd800fs,search,n);
1767dd7cddfSDavid du Colombier 	free(search);
1777dd7cddfSDavid du Colombier 	Binit(&Blist, fd800fs,OREAD);
1787dd7cddfSDavid du Colombier 	return(&Blist);
1797dd7cddfSDavid du Colombier }
1807dd7cddfSDavid du Colombier 
1817dd7cddfSDavid du Colombier 
18280ee5cbfSDavid du Colombier static char *
hq(char * text)18380ee5cbfSDavid du Colombier hq(char *text)
18480ee5cbfSDavid du Colombier {
18580ee5cbfSDavid du Colombier 	int textlen = strlen(text), escapedlen = textlen;
18680ee5cbfSDavid du Colombier 	char *escaped, *s, *w;
18780ee5cbfSDavid du Colombier 
18880ee5cbfSDavid du Colombier 	for(s = text; *s; s++)
18980ee5cbfSDavid du Colombier 		if(*s=='<' || *s=='>' || *s=='&')
19080ee5cbfSDavid du Colombier 			escapedlen += 4;
19180ee5cbfSDavid du Colombier 	escaped = ezalloc(escapedlen+1);
19280ee5cbfSDavid du Colombier 	for(s = text, w = escaped; *s; s++){
19380ee5cbfSDavid du Colombier 		if(*s == '<'){
19480ee5cbfSDavid du Colombier 			strcpy(w, "&lt;");
19580ee5cbfSDavid du Colombier 			w += 4;
19680ee5cbfSDavid du Colombier 		}else if(*s == '>'){
19780ee5cbfSDavid du Colombier 			strcpy(w, "&gt;");
19880ee5cbfSDavid du Colombier 			w += 4;
19980ee5cbfSDavid du Colombier 		}else if(*s == '&'){
20080ee5cbfSDavid du Colombier 			strcpy(w, "&amp;");
20180ee5cbfSDavid du Colombier 			w += 5;
20280ee5cbfSDavid du Colombier 		}else{
20380ee5cbfSDavid du Colombier 			*w++ = *s;
20480ee5cbfSDavid du Colombier 		}
20580ee5cbfSDavid du Colombier 	}
20680ee5cbfSDavid du Colombier 	return escaped;
20780ee5cbfSDavid du Colombier }
20880ee5cbfSDavid du Colombier 
20980ee5cbfSDavid du Colombier int
send(HConnect * c)21080ee5cbfSDavid du Colombier send(HConnect *c)
2117dd7cddfSDavid du Colombier {
2127dd7cddfSDavid du Colombier 	Biobuf*blist;
2137dd7cddfSDavid du Colombier 	int m, n, dbi, nmatch;
2147dd7cddfSDavid du Colombier 	char *pat, *s, *e;
21580ee5cbfSDavid du Colombier 	HSPairs *q;
2167dd7cddfSDavid du Colombier 
2177dd7cddfSDavid du Colombier 	if(strcmp(c->req.meth, "GET") != 0 && strcmp(c->req.meth, "HEAD") != 0)
21880ee5cbfSDavid du Colombier 		return hunallowed(c, "GET, HEAD");
2197dd7cddfSDavid du Colombier 	if(c->head.expectother || c->head.expectcont)
22080ee5cbfSDavid du Colombier 		return hfail(c, HExpectFail, nil);
2217dd7cddfSDavid du Colombier 	if(c->req.search == nil || !*c->req.search)
22280ee5cbfSDavid du Colombier 		return hfail(c, HNoData, "netlib_find");
2237dd7cddfSDavid du Colombier 	s = c->req.search;
2247dd7cddfSDavid du Colombier 	while((s = strchr(s, '+')) != nil)
2257dd7cddfSDavid du Colombier 		*s++ = ' ';
2267dd7cddfSDavid du Colombier 	dbi = -1;
2277dd7cddfSDavid du Colombier 	pat = nil;
22880ee5cbfSDavid du Colombier 	for(q = hparsequery(c, hstrdup(c, c->req.search)); q; q = q->next){
2297dd7cddfSDavid du Colombier 		if(strcmp(q->s, "db") == 0){
2307dd7cddfSDavid du Colombier 			m = atoi(q->t);
2317dd7cddfSDavid du Colombier 			for(dbi = 0; m!=db[dbi].SELECT; dbi++)
2327dd7cddfSDavid du Colombier 				if(db[dbi].SELECT<0)
2337dd7cddfSDavid du Colombier 					exits("unrecognized db");
2347dd7cddfSDavid du Colombier 		}else if(strcmp(q->s, "pat") == 0){
2357dd7cddfSDavid du Colombier 			pat = q->t;
2367dd7cddfSDavid du Colombier 		}
2377dd7cddfSDavid du Colombier 	}
2387dd7cddfSDavid du Colombier 	if(dbi < 0)
2397dd7cddfSDavid du Colombier 		exits("missing db field in query");
2407dd7cddfSDavid du Colombier 	if(pat == nil)
2417dd7cddfSDavid du Colombier 		exits("missing pat field in query");
2427dd7cddfSDavid du Colombier 	logit(c, "netlib_find %s %s", db[dbi].log,pat);
2437dd7cddfSDavid du Colombier 
2447dd7cddfSDavid du Colombier 	blist = init800fs(db[dbi].file,pat);
2457dd7cddfSDavid du Colombier 
2467dd7cddfSDavid du Colombier 	if(c->req.vermaj){
24780ee5cbfSDavid du Colombier 		hokheaders(c);
2487dd7cddfSDavid du Colombier 		hprint(hout, "Content-type: text/html\r\n");
2497dd7cddfSDavid du Colombier 		hprint(hout, "\r\n");
2507dd7cddfSDavid du Colombier 	}
25114414594SDavid du Colombier 	if(strcmp(c->req.meth, "HEAD") == 0){
25214414594SDavid du Colombier 		writelog(c, "Reply: 200 netlib_find 0\n");
253*9a747e4fSDavid du Colombier 		hflush(hout);
2547dd7cddfSDavid du Colombier 		exits(nil);
25514414594SDavid du Colombier 	}
2567dd7cddfSDavid du Colombier 
2577dd7cddfSDavid du Colombier 	hprint(hout, "<HEAD><TITLE>%s/%s</TITLE></HEAD>\r\n<BODY>\r\n",
25880ee5cbfSDavid du Colombier 		db[dbi].log,hq(pat));
2597dd7cddfSDavid du Colombier 	nmatch = 0;
2607dd7cddfSDavid du Colombier 
2617dd7cddfSDavid du Colombier 	while(s = Brdline(blist, '\n')){ /* get next database record */
2627dd7cddfSDavid du Colombier 		n = Blinelen(blist);
2637dd7cddfSDavid du Colombier 		e = s+n;
2647dd7cddfSDavid du Colombier 		hprint(hout, "<PRE>");
2657dd7cddfSDavid du Colombier 		(*db[dbi].fmt)(s,e);
2667dd7cddfSDavid du Colombier 		hprint(hout, "</PRE>\r\n");
2677dd7cddfSDavid du Colombier 		if(nmatch++>=db[dbi].maxhit){
2687dd7cddfSDavid du Colombier 			hprint(hout, "<H4>reached limit at %d hits</H4>\n\r",nmatch);
2697dd7cddfSDavid du Colombier 			break;
2707dd7cddfSDavid du Colombier 		}
2717dd7cddfSDavid du Colombier 	}
2727dd7cddfSDavid du Colombier 	if(nmatch==0)
2737dd7cddfSDavid du Colombier 		hprint(hout, "<H4>Nothing Found.</H4>\r\n");
2747dd7cddfSDavid du Colombier 	hprint(hout, db[dbi].postlude);
27514414594SDavid du Colombier 	hflush(hout);
27614414594SDavid du Colombier 	writelog(c, "Reply: 200 netlib_find %ld %ld\n", hout->seek, hout->seek);
27780ee5cbfSDavid du Colombier 	return 1;
2787dd7cddfSDavid du Colombier }
279