xref: /openbsd-src/usr.bin/mandoc/term_ascii.c (revision 9b9d2a55a62c8e82206c25f94fcc7f4e2765250e)
1 /*	$OpenBSD: term_ascii.c,v 1.33 2015/07/17 22:35:36 schwarze Exp $ */
2 /*
3  * Copyright (c) 2010, 2011 Kristaps Dzonsons <kristaps@bsd.lv>
4  * Copyright (c) 2014, 2015 Ingo Schwarze <schwarze@openbsd.org>
5  *
6  * Permission to use, copy, modify, and distribute this software for any
7  * purpose with or without fee is hereby granted, provided that the above
8  * copyright notice and this permission notice appear in all copies.
9  *
10  * THE SOFTWARE IS PROVIDED "AS IS" AND THE AUTHORS DISCLAIM ALL WARRANTIES
11  * WITH REGARD TO THIS SOFTWARE INCLUDING ALL IMPLIED WARRANTIES OF
12  * MERCHANTABILITY AND FITNESS. IN NO EVENT SHALL THE AUTHORS BE LIABLE FOR
13  * ANY SPECIAL, DIRECT, INDIRECT, OR CONSEQUENTIAL DAMAGES OR ANY DAMAGES
14  * WHATSOEVER RESULTING FROM LOSS OF USE, DATA OR PROFITS, WHETHER IN AN
15  * ACTION OF CONTRACT, NEGLIGENCE OR OTHER TORTIOUS ACTION, ARISING OUT OF
16  * OR IN CONNECTION WITH THE USE OR PERFORMANCE OF THIS SOFTWARE.
17  */
18 #include <sys/types.h>
19 
20 #include <assert.h>
21 #include <locale.h>
22 #include <stdint.h>
23 #include <stdio.h>
24 #include <stdlib.h>
25 #include <unistd.h>
26 #include <wchar.h>
27 
28 #include "mandoc.h"
29 #include "mandoc_aux.h"
30 #include "out.h"
31 #include "term.h"
32 #include "manconf.h"
33 #include "main.h"
34 
35 static	struct termp	 *ascii_init(enum termenc, const struct mchars *,
36 				const struct manoutput *);
37 static	int		  ascii_hspan(const struct termp *,
38 				const struct roffsu *);
39 static	size_t		  ascii_width(const struct termp *, int);
40 static	void		  ascii_advance(struct termp *, size_t);
41 static	void		  ascii_begin(struct termp *);
42 static	void		  ascii_end(struct termp *);
43 static	void		  ascii_endline(struct termp *);
44 static	void		  ascii_letter(struct termp *, int);
45 static	void		  ascii_setwidth(struct termp *, int, int);
46 
47 static	void		  locale_advance(struct termp *, size_t);
48 static	void		  locale_endline(struct termp *);
49 static	void		  locale_letter(struct termp *, int);
50 static	size_t		  locale_width(const struct termp *, int);
51 
52 
53 static struct termp *
54 ascii_init(enum termenc enc, const struct mchars *mchars,
55 	const struct manoutput *outopts)
56 {
57 	char		*v;
58 	struct termp	*p;
59 
60 	p = mandoc_calloc(1, sizeof(struct termp));
61 
62 	p->symtab = mchars;
63 	p->line = 1;
64 	p->tabwidth = 5;
65 	p->defrmargin = p->lastrmargin = 78;
66 	p->fontq = mandoc_reallocarray(NULL,
67 	     (p->fontsz = 8), sizeof(enum termfont));
68 	p->fontq[0] = p->fontl = TERMFONT_NONE;
69 
70 	p->begin = ascii_begin;
71 	p->end = ascii_end;
72 	p->hspan = ascii_hspan;
73 	p->type = TERMTYPE_CHAR;
74 
75 	p->enc = TERMENC_ASCII;
76 	p->advance = ascii_advance;
77 	p->endline = ascii_endline;
78 	p->letter = ascii_letter;
79 	p->setwidth = ascii_setwidth;
80 	p->width = ascii_width;
81 
82 	if (TERMENC_ASCII != enc) {
83 		v = TERMENC_LOCALE == enc ?
84 		    setlocale(LC_ALL, "") :
85 		    setlocale(LC_CTYPE, "en_US.UTF-8");
86 		if (NULL != v && MB_CUR_MAX > 1) {
87 			p->enc = enc;
88 			p->advance = locale_advance;
89 			p->endline = locale_endline;
90 			p->letter = locale_letter;
91 			p->width = locale_width;
92 		}
93 	}
94 
95 	if (outopts->mdoc) {
96 		p->mdocstyle = 1;
97 		p->defindent = 5;
98 	}
99 	if (outopts->indent)
100 		p->defindent = outopts->indent;
101 	if (outopts->width)
102 		p->defrmargin = outopts->width;
103 	if (outopts->synopsisonly)
104 		p->synopsisonly = 1;
105 
106 	return(p);
107 }
108 
109 void *
110 ascii_alloc(const struct mchars *mchars, const struct manoutput *outopts)
111 {
112 
113 	return(ascii_init(TERMENC_ASCII, mchars, outopts));
114 }
115 
116 void *
117 utf8_alloc(const struct mchars *mchars, const struct manoutput *outopts)
118 {
119 
120 	return(ascii_init(TERMENC_UTF8, mchars, outopts));
121 }
122 
123 void *
124 locale_alloc(const struct mchars *mchars, const struct manoutput *outopts)
125 {
126 
127 	return(ascii_init(TERMENC_LOCALE, mchars, outopts));
128 }
129 
130 static void
131 ascii_setwidth(struct termp *p, int iop, int width)
132 {
133 
134 	width /= 24;
135 	p->rmargin = p->defrmargin;
136 	if (iop > 0)
137 		p->defrmargin += width;
138 	else if (iop == 0)
139 		p->defrmargin = width ? (size_t)width : p->lastrmargin;
140 	else if (p->defrmargin > (size_t)width)
141 		p->defrmargin -= width;
142 	else
143 		p->defrmargin = 0;
144 	p->lastrmargin = p->rmargin;
145 	p->rmargin = p->maxrmargin = p->defrmargin;
146 }
147 
148 void
149 ascii_sepline(void *arg)
150 {
151 	struct termp	*p;
152 	size_t		 i;
153 
154 	p = (struct termp *)arg;
155 	p->line += 3;
156 	putchar('\n');
157 	for (i = 0; i < p->defrmargin; i++)
158 		putchar('-');
159 	putchar('\n');
160 	putchar('\n');
161 }
162 
163 static size_t
164 ascii_width(const struct termp *p, int c)
165 {
166 
167 	return(1);
168 }
169 
170 void
171 ascii_free(void *arg)
172 {
173 
174 	term_free((struct termp *)arg);
175 }
176 
177 static void
178 ascii_letter(struct termp *p, int c)
179 {
180 
181 	putchar(c);
182 }
183 
184 static void
185 ascii_begin(struct termp *p)
186 {
187 
188 	(*p->headf)(p, p->argf);
189 }
190 
191 static void
192 ascii_end(struct termp *p)
193 {
194 
195 	(*p->footf)(p, p->argf);
196 }
197 
198 static void
199 ascii_endline(struct termp *p)
200 {
201 
202 	p->line++;
203 	putchar('\n');
204 }
205 
206 static void
207 ascii_advance(struct termp *p, size_t len)
208 {
209 	size_t		i;
210 
211 	for (i = 0; i < len; i++)
212 		putchar(' ');
213 }
214 
215 static int
216 ascii_hspan(const struct termp *p, const struct roffsu *su)
217 {
218 	double		 r;
219 
220 	switch (su->unit) {
221 	case SCALE_BU:
222 		r = su->scale;
223 		break;
224 	case SCALE_CM:
225 		r = su->scale * 240.0 / 2.54;
226 		break;
227 	case SCALE_FS:
228 		r = su->scale * 65536.0;
229 		break;
230 	case SCALE_IN:
231 		r = su->scale * 240.0;
232 		break;
233 	case SCALE_MM:
234 		r = su->scale * 0.24;
235 		break;
236 	case SCALE_VS:
237 		/* FALLTHROUGH */
238 	case SCALE_PC:
239 		r = su->scale * 40.0;
240 		break;
241 	case SCALE_PT:
242 		r = su->scale * 10.0 / 3.0;
243 		break;
244 	case SCALE_EN:
245 		/* FALLTHROUGH */
246 	case SCALE_EM:
247 		r = su->scale * 24.0;
248 		break;
249 	default:
250 		abort();
251 		/* NOTREACHED */
252 	}
253 	return(r > 0.0 ? r + 0.01 : r - 0.01);
254 }
255 
256 const char *
257 ascii_uc2str(int uc)
258 {
259 	static const char nbrsp[2] = { ASCII_NBRSP, '\0' };
260 	static const char *tab[] = {
261 	"<NUL>","<SOH>","<STX>","<ETX>","<EOT>","<ENQ>","<ACK>","<BEL>",
262 	"<BS>",	"\t",	"<LF>",	"<VT>",	"<FF>",	"<CR>",	"<SO>",	"<SI>",
263 	"<DLE>","<DC1>","<DC2>","<DC3>","<DC4>","<NAK>","<SYN>","<ETB>",
264 	"<CAN>","<EM>",	"<SUB>","<ESC>","<FS>",	"<GS>",	"<RS>",	"<US>",
265 	" ",	"!",	"\"",	"#",	"$",	"%",	"&",	"'",
266 	"(",	")",	"*",	"+",	",",	"-",	".",	"/",
267 	"0",	"1",	"2",	"3",	"4",	"5",	"6",	"7",
268 	"8",	"9",	":",	";",	"<",	"=",	">",	"?",
269 	"@",	"A",	"B",	"C",	"D",	"E",	"F",	"G",
270 	"H",	"I",	"J",	"K",	"L",	"M",	"N",	"O",
271 	"P",	"Q",	"R",	"S",	"T",	"U",	"V",	"W",
272 	"X",	"Y",	"Z",	"[",	"\\",	"]",	"^",	"_",
273 	"`",	"a",	"b",	"c",	"d",	"e",	"f",	"g",
274 	"h",	"i",	"j",	"k",	"l",	"m",	"n",	"o",
275 	"p",	"q",	"r",	"s",	"t",	"u",	"v",	"w",
276 	"x",	"y",	"z",	"{",	"|",	"}",	"~",	"<DEL>",
277 	"<80>",	"<81>",	"<82>",	"<83>",	"<84>",	"<85>",	"<86>",	"<87>",
278 	"<88>",	"<89>",	"<8A>",	"<8B>",	"<8C>",	"<8D>",	"<8E>",	"<8F>",
279 	"<90>",	"<91>",	"<92>",	"<93>",	"<94>",	"<95>",	"<96>",	"<97>",
280 	"<99>",	"<99>",	"<9A>",	"<9B>",	"<9C>",	"<9D>",	"<9E>",	"<9F>",
281 	nbrsp,	"!",	"/\bc",	"GBP",	"o\bx",	"=\bY",	"|",	"<sec>",
282 	"\"",	"(C)",	"_\ba",	"<<",	"~",	"",	"(R)",	"-",
283 	"<deg>","+-",	"2",	"3",	"'",	",\bu",	"<par>",".",
284 	",",	"1",	"_\bo",	">>",	"1/4",	"1/2",	"3/4",	"?",
285 	"`\bA",	"'\bA",	"^\bA",	"~\bA",	"\"\bA","o\bA",	"AE",	",\bC",
286 	"`\bE",	"'\bE",	"^\bE",	"\"\bE","`\bI",	"'\bI",	"^\bI",	"\"\bI",
287 	"-\bD",	"~\bN",	"`\bO",	"'\bO",	"^\bO",	"~\bO",	"\"\bO","x",
288 	"/\bO",	"`\bU",	"'\bU",	"^\bU",	"\"\bU","'\bY",	"Th",	"ss",
289 	"`\ba",	"'\ba",	"^\ba",	"~\ba",	"\"\ba","o\ba",	"ae",	",\bc",
290 	"`\be",	"'\be",	"^\be",	"\"\be","`\bi",	"'\bi",	"^\bi",	"\"\bi",
291 	"d",	"~\bn",	"`\bo",	"'\bo",	"^\bo",	"~\bo",	"\"\bo","-:-",
292 	"/\bo",	"`\bu",	"'\bu",	"^\bu",	"\"\bu","'\by",	"th",	"\"\by",
293 	"A",	"a",	"A",	"a",	"A",	"a",	"'\bC",	"'\bc",
294 	"^\bC",	"^\bc",	"C",	"c",	"C",	"c",	"D",	"d",
295 	"/\bD",	"/\bd",	"E",	"e",	"E",	"e",	"E",	"e",
296 	"E",	"e",	"E",	"e",	"^\bG",	"^\bg",	"G",	"g",
297 	"G",	"g",	",\bG",	",\bg",	"^\bH",	"^\bh",	"/\bH",	"/\bh",
298 	"~\bI",	"~\bi",	"I",	"i",	"I",	"i",	"I",	"i",
299 	"I",	"i",	"IJ",	"ij",	"^\bJ",	"^\bj",	",\bK",	",\bk",
300 	"q",	"'\bL",	"'\bl",	",\bL",	",\bl",	"L",	"l",	"L",
301 	"l",	"/\bL",	"/\bl",	"'\bN",	"'\bn",	",\bN",	",\bn",	"N",
302 	"n",	"'n",	"Ng",	"ng",	"O",	"o",	"O",	"o",
303 	"O",	"o",	"OE",	"oe",	"'\bR",	"'\br",	",\bR",	",\br",
304 	"R",	"r",	"'\bS",	"'\bs",	"^\bS",	"^\bs",	",\bS",	",\bs",
305 	"S",	"s",	",\bT",	",\bt",	"T",	"t",	"/\bT",	"/\bt",
306 	"~\bU",	"~\bu",	"U",	"u",	"U",	"u",	"U",	"u",
307 	"U",	"u",	"U",	"u",	"^\bW",	"^\bw",	"^\bY",	"^\by",
308 	"\"\bY","'\bZ",	"'\bz",	"Z",	"z",	"Z",	"z",	"s",
309 	"b",	"B",	"B",	"b",	"6",	"6",	"O",	"C",
310 	"c",	"D",	"D",	"D",	"d",	"d",	"3",	"@",
311 	"E",	"F",	",\bf",	"G",	"G",	"hv",	"I",	"/\bI",
312 	"K",	"k",	"/\bl",	"l",	"W",	"N",	"n",	"~\bO",
313 	"O",	"o",	"OI",	"oi",	"P",	"p",	"YR",	"2",
314 	"2",	"SH",	"sh",	"t",	"T",	"t",	"T",	"U",
315 	"u",	"Y",	"V",	"Y",	"y",	"/\bZ",	"/\bz",	"ZH",
316 	"ZH",	"zh",	"zh",	"/\b2",	"5",	"5",	"ts",	"w",
317 	"|",	"||",	"|=",	"!",	"DZ",	"Dz",	"dz",	"LJ",
318 	"Lj",	"lj",	"NJ",	"Nj",	"nj",	"A",	"a",	"I",
319 	"i",	"O",	"o",	"U",	"u",	"U",	"u",	"U",
320 	"u",	"U",	"u",	"U",	"u",	"@",	"A",	"a",
321 	"A",	"a",	"AE",	"ae",	"/\bG",	"/\bg",	"G",	"g",
322 	"K",	"k",	"O",	"o",	"O",	"o",	"ZH",	"zh",
323 	"j",	"DZ",	"Dz",	"dz",	"'\bG",	"'\bg",	"HV",	"W",
324 	"`\bN",	"`\bn",	"A",	"a",	"'\bAE","'\bae","O",	"o"};
325 
326 	assert(uc >= 0);
327 	if ((size_t)uc < sizeof(tab)/sizeof(tab[0]))
328 		return(tab[uc]);
329 	return(mchars_uc2str(uc));
330 }
331 
332 static size_t
333 locale_width(const struct termp *p, int c)
334 {
335 	int		rc;
336 
337 	if (c == ASCII_NBRSP)
338 		c = ' ';
339 	rc = wcwidth(c);
340 	if (rc < 0)
341 		rc = 0;
342 	return(rc);
343 }
344 
345 static void
346 locale_advance(struct termp *p, size_t len)
347 {
348 	size_t		i;
349 
350 	for (i = 0; i < len; i++)
351 		putwchar(L' ');
352 }
353 
354 static void
355 locale_endline(struct termp *p)
356 {
357 
358 	p->line++;
359 	putwchar(L'\n');
360 }
361 
362 static void
363 locale_letter(struct termp *p, int c)
364 {
365 
366 	putwchar(c);
367 }
368