xref: /minix3/minix/usr.bin/grep/file.c (revision d794ecc9efbcfa044947fd20468ba1f184b357e7)
1*d794ecc9SDavid van Moolenbroek /*	$OpenBSD: file.c,v 1.11 2010/07/02 20:48:48 nicm Exp $	*/
2*d794ecc9SDavid van Moolenbroek 
3*d794ecc9SDavid van Moolenbroek /*-
4*d794ecc9SDavid van Moolenbroek  * Copyright (c) 1999 James Howard and Dag-Erling Co�dan Sm�rgrav
5*d794ecc9SDavid van Moolenbroek  * All rights reserved.
6*d794ecc9SDavid van Moolenbroek  *
7*d794ecc9SDavid van Moolenbroek  * Redistribution and use in source and binary forms, with or without
8*d794ecc9SDavid van Moolenbroek  * modification, are permitted provided that the following conditions
9*d794ecc9SDavid van Moolenbroek  * are met:
10*d794ecc9SDavid van Moolenbroek  * 1. Redistributions of source code must retain the above copyright
11*d794ecc9SDavid van Moolenbroek  *    notice, this list of conditions and the following disclaimer.
12*d794ecc9SDavid van Moolenbroek  * 2. Redistributions in binary form must reproduce the above copyright
13*d794ecc9SDavid van Moolenbroek  *    notice, this list of conditions and the following disclaimer in the
14*d794ecc9SDavid van Moolenbroek  *    documentation and/or other materials provided with the distribution.
15*d794ecc9SDavid van Moolenbroek  *
16*d794ecc9SDavid van Moolenbroek  * THIS SOFTWARE IS PROVIDED BY THE AUTHOR AND CONTRIBUTORS ``AS IS'' AND
17*d794ecc9SDavid van Moolenbroek  * ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE
18*d794ecc9SDavid van Moolenbroek  * IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE
19*d794ecc9SDavid van Moolenbroek  * ARE DISCLAIMED.  IN NO EVENT SHALL THE AUTHOR OR CONTRIBUTORS BE LIABLE
20*d794ecc9SDavid van Moolenbroek  * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL
21*d794ecc9SDavid van Moolenbroek  * DAMAGES (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS
22*d794ecc9SDavid van Moolenbroek  * OR SERVICES; LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION)
23*d794ecc9SDavid van Moolenbroek  * HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT
24*d794ecc9SDavid van Moolenbroek  * LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY
25*d794ecc9SDavid van Moolenbroek  * OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF
26*d794ecc9SDavid van Moolenbroek  * SUCH DAMAGE.
27*d794ecc9SDavid van Moolenbroek  */
28*d794ecc9SDavid van Moolenbroek 
29*d794ecc9SDavid van Moolenbroek #include <sys/param.h>
30*d794ecc9SDavid van Moolenbroek 
31*d794ecc9SDavid van Moolenbroek #include <err.h>
32*d794ecc9SDavid van Moolenbroek #include <stdio.h>
33*d794ecc9SDavid van Moolenbroek #include <stdlib.h>
34*d794ecc9SDavid van Moolenbroek #include <zlib.h>
35*d794ecc9SDavid van Moolenbroek #ifdef __minix
36*d794ecc9SDavid van Moolenbroek #include <unistd.h> /* isatty */
37*d794ecc9SDavid van Moolenbroek #endif /* __minix */
38*d794ecc9SDavid van Moolenbroek 
39*d794ecc9SDavid van Moolenbroek #include "grep.h"
40*d794ecc9SDavid van Moolenbroek 
41*d794ecc9SDavid van Moolenbroek static char	 fname[MAXPATHLEN];
42*d794ecc9SDavid van Moolenbroek #ifndef NOZ
43*d794ecc9SDavid van Moolenbroek static char	*lnbuf;
44*d794ecc9SDavid van Moolenbroek static size_t	 lnbuflen;
45*d794ecc9SDavid van Moolenbroek #endif
46*d794ecc9SDavid van Moolenbroek 
47*d794ecc9SDavid van Moolenbroek #define FILE_STDIO	0
48*d794ecc9SDavid van Moolenbroek #define FILE_MMAP	1
49*d794ecc9SDavid van Moolenbroek #define FILE_GZIP	2
50*d794ecc9SDavid van Moolenbroek 
51*d794ecc9SDavid van Moolenbroek struct file {
52*d794ecc9SDavid van Moolenbroek 	int	 type;
53*d794ecc9SDavid van Moolenbroek 	int	 noseek;
54*d794ecc9SDavid van Moolenbroek 	FILE	*f;
55*d794ecc9SDavid van Moolenbroek 	mmf_t	*mmf;
56*d794ecc9SDavid van Moolenbroek 	gzFile	*gzf;
57*d794ecc9SDavid van Moolenbroek };
58*d794ecc9SDavid van Moolenbroek 
59*d794ecc9SDavid van Moolenbroek #ifndef NOZ
60*d794ecc9SDavid van Moolenbroek static char *
gzfgetln(gzFile * f,size_t * len)61*d794ecc9SDavid van Moolenbroek gzfgetln(gzFile *f, size_t *len)
62*d794ecc9SDavid van Moolenbroek {
63*d794ecc9SDavid van Moolenbroek 	size_t		n;
64*d794ecc9SDavid van Moolenbroek 	int		c;
65*d794ecc9SDavid van Moolenbroek 
66*d794ecc9SDavid van Moolenbroek 	for (n = 0; ; ++n) {
67*d794ecc9SDavid van Moolenbroek 		c = gzgetc(f);
68*d794ecc9SDavid van Moolenbroek 		if (c == -1) {
69*d794ecc9SDavid van Moolenbroek 			const char *gzerrstr;
70*d794ecc9SDavid van Moolenbroek 			int gzerr;
71*d794ecc9SDavid van Moolenbroek 
72*d794ecc9SDavid van Moolenbroek 			if (gzeof(f))
73*d794ecc9SDavid van Moolenbroek 				break;
74*d794ecc9SDavid van Moolenbroek 
75*d794ecc9SDavid van Moolenbroek 			gzerrstr = gzerror(f, &gzerr);
76*d794ecc9SDavid van Moolenbroek 			if (gzerr == Z_ERRNO)
77*d794ecc9SDavid van Moolenbroek 				err(2, "%s", fname);
78*d794ecc9SDavid van Moolenbroek 			else
79*d794ecc9SDavid van Moolenbroek 				errx(2, "%s: %s", fname, gzerrstr);
80*d794ecc9SDavid van Moolenbroek 		}
81*d794ecc9SDavid van Moolenbroek 		if (n >= lnbuflen) {
82*d794ecc9SDavid van Moolenbroek 			lnbuflen *= 2;
83*d794ecc9SDavid van Moolenbroek 			lnbuf = grep_realloc(lnbuf, ++lnbuflen);
84*d794ecc9SDavid van Moolenbroek 		}
85*d794ecc9SDavid van Moolenbroek 		if (c == '\n')
86*d794ecc9SDavid van Moolenbroek 			break;
87*d794ecc9SDavid van Moolenbroek 		lnbuf[n] = c;
88*d794ecc9SDavid van Moolenbroek 	}
89*d794ecc9SDavid van Moolenbroek 
90*d794ecc9SDavid van Moolenbroek 	if (gzeof(f) && n == 0)
91*d794ecc9SDavid van Moolenbroek 		return NULL;
92*d794ecc9SDavid van Moolenbroek 	*len = n;
93*d794ecc9SDavid van Moolenbroek 	return lnbuf;
94*d794ecc9SDavid van Moolenbroek }
95*d794ecc9SDavid van Moolenbroek #endif
96*d794ecc9SDavid van Moolenbroek 
97*d794ecc9SDavid van Moolenbroek file_t *
grep_fdopen(int fd,const char * mode)98*d794ecc9SDavid van Moolenbroek grep_fdopen(int fd, const char *mode)
99*d794ecc9SDavid van Moolenbroek {
100*d794ecc9SDavid van Moolenbroek 	file_t *f;
101*d794ecc9SDavid van Moolenbroek 
102*d794ecc9SDavid van Moolenbroek 	if (fd == STDIN_FILENO)
103*d794ecc9SDavid van Moolenbroek 		snprintf(fname, sizeof fname, "(standard input)");
104*d794ecc9SDavid van Moolenbroek 	else
105*d794ecc9SDavid van Moolenbroek 		snprintf(fname, sizeof fname, "(fd %d)", fd);
106*d794ecc9SDavid van Moolenbroek 
107*d794ecc9SDavid van Moolenbroek 	f = grep_malloc(sizeof *f);
108*d794ecc9SDavid van Moolenbroek 
109*d794ecc9SDavid van Moolenbroek #ifndef NOZ
110*d794ecc9SDavid van Moolenbroek 	if (Zflag) {
111*d794ecc9SDavid van Moolenbroek 		f->type = FILE_GZIP;
112*d794ecc9SDavid van Moolenbroek 		f->noseek = lseek(fd, 0L, SEEK_SET) == -1;
113*d794ecc9SDavid van Moolenbroek 		if ((f->gzf = gzdopen(fd, mode)) != NULL)
114*d794ecc9SDavid van Moolenbroek 			return f;
115*d794ecc9SDavid van Moolenbroek 	} else
116*d794ecc9SDavid van Moolenbroek #endif
117*d794ecc9SDavid van Moolenbroek 	{
118*d794ecc9SDavid van Moolenbroek 		f->type = FILE_STDIO;
119*d794ecc9SDavid van Moolenbroek 		f->noseek = isatty(fd);
120*d794ecc9SDavid van Moolenbroek 		if ((f->f = fdopen(fd, mode)) != NULL)
121*d794ecc9SDavid van Moolenbroek 			return f;
122*d794ecc9SDavid van Moolenbroek 	}
123*d794ecc9SDavid van Moolenbroek 
124*d794ecc9SDavid van Moolenbroek 	free(f);
125*d794ecc9SDavid van Moolenbroek 	return NULL;
126*d794ecc9SDavid van Moolenbroek }
127*d794ecc9SDavid van Moolenbroek 
128*d794ecc9SDavid van Moolenbroek file_t *
grep_open(const char * path,const char * mode)129*d794ecc9SDavid van Moolenbroek grep_open(const char *path, const char *mode)
130*d794ecc9SDavid van Moolenbroek {
131*d794ecc9SDavid van Moolenbroek 	file_t *f;
132*d794ecc9SDavid van Moolenbroek 
133*d794ecc9SDavid van Moolenbroek 	snprintf(fname, sizeof fname, "%s", path);
134*d794ecc9SDavid van Moolenbroek 
135*d794ecc9SDavid van Moolenbroek 	f = grep_malloc(sizeof *f);
136*d794ecc9SDavid van Moolenbroek 	f->noseek = 0;
137*d794ecc9SDavid van Moolenbroek 
138*d794ecc9SDavid van Moolenbroek #ifndef NOZ
139*d794ecc9SDavid van Moolenbroek 	if (Zflag) {
140*d794ecc9SDavid van Moolenbroek 		f->type = FILE_GZIP;
141*d794ecc9SDavid van Moolenbroek 		if ((f->gzf = gzopen(fname, mode)) != NULL)
142*d794ecc9SDavid van Moolenbroek 			return f;
143*d794ecc9SDavid van Moolenbroek 	} else
144*d794ecc9SDavid van Moolenbroek #endif
145*d794ecc9SDavid van Moolenbroek 	{
146*d794ecc9SDavid van Moolenbroek #ifndef SMALL
147*d794ecc9SDavid van Moolenbroek 		/* try mmap first; if it fails, try stdio */
148*d794ecc9SDavid van Moolenbroek 		if ((f->mmf = mmopen(fname, mode)) != NULL) {
149*d794ecc9SDavid van Moolenbroek 			f->type = FILE_MMAP;
150*d794ecc9SDavid van Moolenbroek 			return f;
151*d794ecc9SDavid van Moolenbroek 		}
152*d794ecc9SDavid van Moolenbroek #endif
153*d794ecc9SDavid van Moolenbroek 		f->type = FILE_STDIO;
154*d794ecc9SDavid van Moolenbroek 		if ((f->f = fopen(path, mode)) != NULL)
155*d794ecc9SDavid van Moolenbroek 			return f;
156*d794ecc9SDavid van Moolenbroek 	}
157*d794ecc9SDavid van Moolenbroek 
158*d794ecc9SDavid van Moolenbroek 	free(f);
159*d794ecc9SDavid van Moolenbroek 	return NULL;
160*d794ecc9SDavid van Moolenbroek }
161*d794ecc9SDavid van Moolenbroek 
162*d794ecc9SDavid van Moolenbroek int
grep_bin_file(file_t * f)163*d794ecc9SDavid van Moolenbroek grep_bin_file(file_t *f)
164*d794ecc9SDavid van Moolenbroek {
165*d794ecc9SDavid van Moolenbroek 	if (f->noseek)
166*d794ecc9SDavid van Moolenbroek 		return 0;
167*d794ecc9SDavid van Moolenbroek 
168*d794ecc9SDavid van Moolenbroek 	switch (f->type) {
169*d794ecc9SDavid van Moolenbroek 	case FILE_STDIO:
170*d794ecc9SDavid van Moolenbroek 		return bin_file(f->f);
171*d794ecc9SDavid van Moolenbroek #ifndef SMALL
172*d794ecc9SDavid van Moolenbroek 	case FILE_MMAP:
173*d794ecc9SDavid van Moolenbroek 		return mmbin_file(f->mmf);
174*d794ecc9SDavid van Moolenbroek #endif
175*d794ecc9SDavid van Moolenbroek #ifndef NOZ
176*d794ecc9SDavid van Moolenbroek 	case FILE_GZIP:
177*d794ecc9SDavid van Moolenbroek 		return gzbin_file(f->gzf);
178*d794ecc9SDavid van Moolenbroek #endif
179*d794ecc9SDavid van Moolenbroek 	default:
180*d794ecc9SDavid van Moolenbroek 		/* can't happen */
181*d794ecc9SDavid van Moolenbroek 		errx(2, "invalid file type");
182*d794ecc9SDavid van Moolenbroek 	}
183*d794ecc9SDavid van Moolenbroek }
184*d794ecc9SDavid van Moolenbroek 
185*d794ecc9SDavid van Moolenbroek char *
grep_fgetln(file_t * f,size_t * l)186*d794ecc9SDavid van Moolenbroek grep_fgetln(file_t *f, size_t *l)
187*d794ecc9SDavid van Moolenbroek {
188*d794ecc9SDavid van Moolenbroek 	switch (f->type) {
189*d794ecc9SDavid van Moolenbroek 	case FILE_STDIO:
190*d794ecc9SDavid van Moolenbroek 		return fgetln(f->f, l);
191*d794ecc9SDavid van Moolenbroek #ifndef SMALL
192*d794ecc9SDavid van Moolenbroek 	case FILE_MMAP:
193*d794ecc9SDavid van Moolenbroek 		return mmfgetln(f->mmf, l);
194*d794ecc9SDavid van Moolenbroek #endif
195*d794ecc9SDavid van Moolenbroek #ifndef NOZ
196*d794ecc9SDavid van Moolenbroek 	case FILE_GZIP:
197*d794ecc9SDavid van Moolenbroek 		return gzfgetln(f->gzf, l);
198*d794ecc9SDavid van Moolenbroek #endif
199*d794ecc9SDavid van Moolenbroek 	default:
200*d794ecc9SDavid van Moolenbroek 		/* can't happen */
201*d794ecc9SDavid van Moolenbroek 		errx(2, "invalid file type");
202*d794ecc9SDavid van Moolenbroek 	}
203*d794ecc9SDavid van Moolenbroek }
204*d794ecc9SDavid van Moolenbroek 
205*d794ecc9SDavid van Moolenbroek void
grep_close(file_t * f)206*d794ecc9SDavid van Moolenbroek grep_close(file_t *f)
207*d794ecc9SDavid van Moolenbroek {
208*d794ecc9SDavid van Moolenbroek 	switch (f->type) {
209*d794ecc9SDavid van Moolenbroek 	case FILE_STDIO:
210*d794ecc9SDavid van Moolenbroek 		fclose(f->f);
211*d794ecc9SDavid van Moolenbroek 		break;
212*d794ecc9SDavid van Moolenbroek #ifndef SMALL
213*d794ecc9SDavid van Moolenbroek 	case FILE_MMAP:
214*d794ecc9SDavid van Moolenbroek 		mmclose(f->mmf);
215*d794ecc9SDavid van Moolenbroek 		break;
216*d794ecc9SDavid van Moolenbroek #endif
217*d794ecc9SDavid van Moolenbroek #ifndef NOZ
218*d794ecc9SDavid van Moolenbroek 	case FILE_GZIP:
219*d794ecc9SDavid van Moolenbroek 		gzclose(f->gzf);
220*d794ecc9SDavid van Moolenbroek 		break;
221*d794ecc9SDavid van Moolenbroek #endif
222*d794ecc9SDavid van Moolenbroek 	default:
223*d794ecc9SDavid van Moolenbroek 		/* can't happen */
224*d794ecc9SDavid van Moolenbroek 		errx(2, "invalid file type");
225*d794ecc9SDavid van Moolenbroek 	}
226*d794ecc9SDavid van Moolenbroek 	free(f);
227*d794ecc9SDavid van Moolenbroek }
228