xref: /openbsd-src/usr.bin/indent/parse.c (revision 043fbe51c197dbbcd422e917b65f765d8b5f8874)
1*043fbe51Sderaadt /*	$OpenBSD: parse.c,v 1.9 2009/10/27 23:59:39 deraadt Exp $	*/
21258a77dSderaadt 
3df930be7Sderaadt /*
42a0991d2Spjanzen  * Copyright (c) 1980, 1993
52a0991d2Spjanzen  *	The Regents of the University of California.
6df930be7Sderaadt  * Copyright (c) 1976 Board of Trustees of the University of Illinois.
72a0991d2Spjanzen  * Copyright (c) 1985 Sun Microsystems, Inc.
8df930be7Sderaadt  * All rights reserved.
9df930be7Sderaadt  *
10df930be7Sderaadt  * Redistribution and use in source and binary forms, with or without
11df930be7Sderaadt  * modification, are permitted provided that the following conditions
12df930be7Sderaadt  * are met:
13df930be7Sderaadt  * 1. Redistributions of source code must retain the above copyright
14df930be7Sderaadt  *    notice, this list of conditions and the following disclaimer.
15df930be7Sderaadt  * 2. Redistributions in binary form must reproduce the above copyright
16df930be7Sderaadt  *    notice, this list of conditions and the following disclaimer in the
17df930be7Sderaadt  *    documentation and/or other materials provided with the distribution.
1848b1c289Sderaadt  * 3. Neither the name of the University nor the names of its contributors
19df930be7Sderaadt  *    may be used to endorse or promote products derived from this software
20df930be7Sderaadt  *    without specific prior written permission.
21df930be7Sderaadt  *
22df930be7Sderaadt  * THIS SOFTWARE IS PROVIDED BY THE REGENTS AND CONTRIBUTORS ``AS IS'' AND
23df930be7Sderaadt  * ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE
24df930be7Sderaadt  * IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE
25df930be7Sderaadt  * ARE DISCLAIMED.  IN NO EVENT SHALL THE REGENTS OR CONTRIBUTORS BE LIABLE
26df930be7Sderaadt  * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL
27df930be7Sderaadt  * DAMAGES (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS
28df930be7Sderaadt  * OR SERVICES; LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION)
29df930be7Sderaadt  * HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT
30df930be7Sderaadt  * LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY
31df930be7Sderaadt  * OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF
32df930be7Sderaadt  * SUCH DAMAGE.
33df930be7Sderaadt  */
34df930be7Sderaadt 
35df930be7Sderaadt #include <stdio.h>
36df930be7Sderaadt #include "indent_globs.h"
37df930be7Sderaadt #include "indent_codes.h"
38df930be7Sderaadt 
394a16fd11Sderaadt void reduce(void);
40f614d3c6Smickey 
41f614d3c6Smickey void
parse(int tk)4276f50813Sderaadt parse(int tk)			/* the code for the construct scanned */
43df930be7Sderaadt {
44df930be7Sderaadt     int         i;
45df930be7Sderaadt 
46df930be7Sderaadt #ifdef debug
47df930be7Sderaadt     printf("%2d - %s\n", tk, token);
48df930be7Sderaadt #endif
49df930be7Sderaadt 
50df930be7Sderaadt     while (ps.p_stack[ps.tos] == ifhead && tk != elselit) {
51df930be7Sderaadt 	/* true if we have an if without an else */
52df930be7Sderaadt 	ps.p_stack[ps.tos] = stmt;	/* apply the if(..) stmt ::= stmt
53df930be7Sderaadt 					 * reduction */
54df930be7Sderaadt 	reduce();		/* see if this allows any reduction */
55df930be7Sderaadt     }
56df930be7Sderaadt 
57df930be7Sderaadt 
58df930be7Sderaadt     switch (tk) {		/* go on and figure out what to do with the
59df930be7Sderaadt 				 * input */
60df930be7Sderaadt 
61df930be7Sderaadt     case decl:			/* scanned a declaration word */
62df930be7Sderaadt 	ps.search_brace = btype_2;
63df930be7Sderaadt 	/* indicate that following brace should be on same line */
64df930be7Sderaadt 	if (ps.p_stack[ps.tos] != decl) {	/* only put one declaration
65df930be7Sderaadt 						 * onto stack */
66df930be7Sderaadt 	    break_comma = true;	/* while in declaration, newline should be
67df930be7Sderaadt 				 * forced after comma */
68df930be7Sderaadt 	    ps.p_stack[++ps.tos] = decl;
69df930be7Sderaadt 	    ps.il[ps.tos] = ps.i_l_follow;
70df930be7Sderaadt 
71df930be7Sderaadt 	    if (ps.ljust_decl) {/* only do if we want left justified
72df930be7Sderaadt 				 * declarations */
73df930be7Sderaadt 		ps.ind_level = 0;
74df930be7Sderaadt 		for (i = ps.tos - 1; i > 0; --i)
75df930be7Sderaadt 		    if (ps.p_stack[i] == decl)
76df930be7Sderaadt 			++ps.ind_level;	/* indentation is number of
77df930be7Sderaadt 					 * declaration levels deep we are */
78df930be7Sderaadt 		ps.i_l_follow = ps.ind_level;
79df930be7Sderaadt 	    }
80df930be7Sderaadt 	}
81df930be7Sderaadt 	break;
82df930be7Sderaadt 
83df930be7Sderaadt     case ifstmt:		/* scanned if (...) */
84df930be7Sderaadt 	if (ps.p_stack[ps.tos] == elsehead && ps.else_if)	/* "else if ..." */
85df930be7Sderaadt 	    ps.i_l_follow = ps.il[ps.tos];
86df930be7Sderaadt     case dolit:		/* 'do' */
87df930be7Sderaadt     case forstmt:		/* for (...) */
88df930be7Sderaadt 	ps.p_stack[++ps.tos] = tk;
89df930be7Sderaadt 	ps.il[ps.tos] = ps.ind_level = ps.i_l_follow;
90df930be7Sderaadt 	++ps.i_l_follow;	/* subsequent statements should be indented 1 */
91df930be7Sderaadt 	ps.search_brace = btype_2;
92df930be7Sderaadt 	break;
93df930be7Sderaadt 
94df930be7Sderaadt     case lbrace:		/* scanned { */
95df930be7Sderaadt 	break_comma = false;	/* don't break comma in an initial list */
96df930be7Sderaadt 	if (ps.p_stack[ps.tos] == stmt || ps.p_stack[ps.tos] == decl
97df930be7Sderaadt 		|| ps.p_stack[ps.tos] == stmtl)
98df930be7Sderaadt 	    ++ps.i_l_follow;	/* it is a random, isolated stmt group or a
99df930be7Sderaadt 				 * declaration */
100df930be7Sderaadt 	else {
101df930be7Sderaadt 	    if (s_code == e_code) {
102df930be7Sderaadt 		/*
103df930be7Sderaadt 		 * only do this if there is nothing on the line
104df930be7Sderaadt 		 */
105df930be7Sderaadt 		--ps.ind_level;
106df930be7Sderaadt 		/*
107df930be7Sderaadt 		 * it is a group as part of a while, for, etc.
108df930be7Sderaadt 		 */
109df930be7Sderaadt 		if (ps.p_stack[ps.tos] == swstmt && ps.case_indent >= 1)
110df930be7Sderaadt 		    --ps.ind_level;
111df930be7Sderaadt 		/*
112df930be7Sderaadt 		 * for a switch, brace should be two levels out from the code
113df930be7Sderaadt 		 */
114df930be7Sderaadt 	    }
115df930be7Sderaadt 	}
116df930be7Sderaadt 
117df930be7Sderaadt 	ps.p_stack[++ps.tos] = lbrace;
118df930be7Sderaadt 	ps.il[ps.tos] = ps.ind_level;
119df930be7Sderaadt 	ps.p_stack[++ps.tos] = stmt;
120df930be7Sderaadt 	/* allow null stmt between braces */
121df930be7Sderaadt 	ps.il[ps.tos] = ps.i_l_follow;
122df930be7Sderaadt 	break;
123df930be7Sderaadt 
124df930be7Sderaadt     case whilestmt:		/* scanned while (...) */
125df930be7Sderaadt 	if (ps.p_stack[ps.tos] == dohead) {
126df930be7Sderaadt 	    /* it is matched with do stmt */
127df930be7Sderaadt 	    ps.ind_level = ps.i_l_follow = ps.il[ps.tos];
128df930be7Sderaadt 	    ps.p_stack[++ps.tos] = whilestmt;
129df930be7Sderaadt 	    ps.il[ps.tos] = ps.ind_level = ps.i_l_follow;
130df930be7Sderaadt 	}
131df930be7Sderaadt 	else {			/* it is a while loop */
132df930be7Sderaadt 	    ps.p_stack[++ps.tos] = whilestmt;
133df930be7Sderaadt 	    ps.il[ps.tos] = ps.i_l_follow;
134df930be7Sderaadt 	    ++ps.i_l_follow;
135df930be7Sderaadt 	    ps.search_brace = btype_2;
136df930be7Sderaadt 	}
137df930be7Sderaadt 
138df930be7Sderaadt 	break;
139df930be7Sderaadt 
140df930be7Sderaadt     case elselit:		/* scanned an else */
141df930be7Sderaadt 
142df930be7Sderaadt 	if (ps.p_stack[ps.tos] != ifhead)
143df930be7Sderaadt 	    diag(1, "Unmatched 'else'");
144df930be7Sderaadt 	else {
145df930be7Sderaadt 	    ps.ind_level = ps.il[ps.tos];	/* indentation for else should
146df930be7Sderaadt 						 * be same as for if */
147df930be7Sderaadt 	    ps.i_l_follow = ps.ind_level + 1;	/* everything following should
148df930be7Sderaadt 						 * be in 1 level */
149df930be7Sderaadt 	    ps.p_stack[ps.tos] = elsehead;
150df930be7Sderaadt 	    /* remember if with else */
151df930be7Sderaadt 	    ps.search_brace = btype_2 | ps.else_if;
152df930be7Sderaadt 	}
153df930be7Sderaadt 	break;
154df930be7Sderaadt 
155df930be7Sderaadt     case rbrace:		/* scanned a } */
156df930be7Sderaadt 	/* stack should have <lbrace> <stmt> or <lbrace> <stmtl> */
157df930be7Sderaadt 	if (ps.p_stack[ps.tos - 1] == lbrace) {
158df930be7Sderaadt 	    ps.ind_level = ps.i_l_follow = ps.il[--ps.tos];
159df930be7Sderaadt 	    ps.p_stack[ps.tos] = stmt;
160df930be7Sderaadt 	}
161df930be7Sderaadt 	else
162df930be7Sderaadt 	    diag(1, "Stmt nesting error.");
163df930be7Sderaadt 	break;
164df930be7Sderaadt 
165df930be7Sderaadt     case swstmt:		/* had switch (...) */
166df930be7Sderaadt 	ps.p_stack[++ps.tos] = swstmt;
167df930be7Sderaadt 	ps.cstk[ps.tos] = case_ind;
168df930be7Sderaadt 	/* save current case indent level */
169df930be7Sderaadt 	ps.il[ps.tos] = ps.i_l_follow;
170df930be7Sderaadt 	case_ind = ps.i_l_follow + ps.case_indent;	/* cases should be one
171df930be7Sderaadt 							 * level down from
172df930be7Sderaadt 							 * switch */
173df930be7Sderaadt 	ps.i_l_follow += ps.case_indent + 1;	/* statements should be two
174df930be7Sderaadt 						 * levels in */
175df930be7Sderaadt 	ps.search_brace = btype_2;
176df930be7Sderaadt 	break;
177df930be7Sderaadt 
178df930be7Sderaadt     case semicolon:		/* this indicates a simple stmt */
179df930be7Sderaadt 	break_comma = false;	/* turn off flag to break after commas in a
180df930be7Sderaadt 				 * declaration */
181df930be7Sderaadt 	ps.p_stack[++ps.tos] = stmt;
182df930be7Sderaadt 	ps.il[ps.tos] = ps.ind_level;
183df930be7Sderaadt 	break;
184df930be7Sderaadt 
185df930be7Sderaadt     default:			/* this is an error */
186df930be7Sderaadt 	diag(1, "Unknown code to parser");
187df930be7Sderaadt 	return;
188df930be7Sderaadt 
189df930be7Sderaadt 
190df930be7Sderaadt     }				/* end of switch */
191df930be7Sderaadt 
192df930be7Sderaadt     reduce();			/* see if any reduction can be done */
193df930be7Sderaadt 
194df930be7Sderaadt #ifdef debug
195df930be7Sderaadt     for (i = 1; i <= ps.tos; ++i)
196df930be7Sderaadt 	printf("(%d %d)", ps.p_stack[i], ps.il[i]);
197df930be7Sderaadt     printf("\n");
198df930be7Sderaadt #endif
199df930be7Sderaadt 
200df930be7Sderaadt     return;
201df930be7Sderaadt }
202df930be7Sderaadt 
203df930be7Sderaadt /*
204df930be7Sderaadt  * NAME: reduce
205df930be7Sderaadt  *
206df930be7Sderaadt  * FUNCTION: Implements the reduce part of the parsing algorithm
207df930be7Sderaadt  *
208df930be7Sderaadt  * ALGORITHM: The following reductions are done.  Reductions are repeated
209df930be7Sderaadt  *	until no more are possible.
210df930be7Sderaadt  *
211df930be7Sderaadt  * Old TOS		New TOS
212df930be7Sderaadt  * <stmt> <stmt>	<stmtl>
213df930be7Sderaadt  * <stmtl> <stmt>	<stmtl>
214df930be7Sderaadt  * do <stmt>		"dostmt"
215df930be7Sderaadt  * if <stmt>		"ifstmt"
216df930be7Sderaadt  * switch <stmt>	<stmt>
217df930be7Sderaadt  * decl <stmt>		<stmt>
218df930be7Sderaadt  * "ifelse" <stmt>	<stmt>
219df930be7Sderaadt  * for <stmt>		<stmt>
220df930be7Sderaadt  * while <stmt>		<stmt>
221df930be7Sderaadt  * "dostmt" while	<stmt>
222df930be7Sderaadt  *
223df930be7Sderaadt  * On each reduction, ps.i_l_follow (the indentation for the following line)
224df930be7Sderaadt  * is set to the indentation level associated with the old TOS.
225df930be7Sderaadt  *
226df930be7Sderaadt  * PARAMETERS: None
227df930be7Sderaadt  *
228df930be7Sderaadt  * RETURNS: Nothing
229df930be7Sderaadt  *
230df930be7Sderaadt  * GLOBALS: ps.cstk ps.i_l_follow = ps.il ps.p_stack = ps.tos =
231df930be7Sderaadt  *
232df930be7Sderaadt  * CALLS: None
233df930be7Sderaadt  *
234df930be7Sderaadt  * CALLED BY: parse
235df930be7Sderaadt  *
236df930be7Sderaadt  * HISTORY: initial coding 	November 1976	D A Willcox of CAC
237df930be7Sderaadt  *
238df930be7Sderaadt  */
239df930be7Sderaadt /*----------------------------------------------*\
240df930be7Sderaadt |   REDUCTION PHASE				    |
241df930be7Sderaadt \*----------------------------------------------*/
242f614d3c6Smickey void
reduce(void)2434a16fd11Sderaadt reduce(void)
244df930be7Sderaadt {
245df930be7Sderaadt 
246c0932ef1Smpech     int i;
247df930be7Sderaadt 
248df930be7Sderaadt     for (;;) {			/* keep looping until there is nothing left to
249df930be7Sderaadt 				 * reduce */
250df930be7Sderaadt 
251df930be7Sderaadt 	switch (ps.p_stack[ps.tos]) {
252df930be7Sderaadt 
253df930be7Sderaadt 	case stmt:
254df930be7Sderaadt 	    switch (ps.p_stack[ps.tos - 1]) {
255df930be7Sderaadt 
256df930be7Sderaadt 	    case stmt:
257df930be7Sderaadt 	    case stmtl:
258df930be7Sderaadt 		/* stmtl stmt or stmt stmt */
259df930be7Sderaadt 		ps.p_stack[--ps.tos] = stmtl;
260df930be7Sderaadt 		break;
261df930be7Sderaadt 
262df930be7Sderaadt 	    case dolit:	/* <do> <stmt> */
263df930be7Sderaadt 		ps.p_stack[--ps.tos] = dohead;
264df930be7Sderaadt 		ps.i_l_follow = ps.il[ps.tos];
265df930be7Sderaadt 		break;
266df930be7Sderaadt 
267df930be7Sderaadt 	    case ifstmt:
268df930be7Sderaadt 		/* <if> <stmt> */
269df930be7Sderaadt 		ps.p_stack[--ps.tos] = ifhead;
270df930be7Sderaadt 		for (i = ps.tos - 1;
271df930be7Sderaadt 			(
272df930be7Sderaadt 			 ps.p_stack[i] != stmt
273df930be7Sderaadt 			 &&
274df930be7Sderaadt 			 ps.p_stack[i] != stmtl
275df930be7Sderaadt 			 &&
276df930be7Sderaadt 			 ps.p_stack[i] != lbrace
277df930be7Sderaadt 			 );
278df930be7Sderaadt 			--i);
279df930be7Sderaadt 		ps.i_l_follow = ps.il[i];
280df930be7Sderaadt 		/*
281df930be7Sderaadt 		 * for the time being, we will assume that there is no else on
282df930be7Sderaadt 		 * this if, and set the indentation level accordingly. If an
283df930be7Sderaadt 		 * else is scanned, it will be fixed up later
284df930be7Sderaadt 		 */
285df930be7Sderaadt 		break;
286df930be7Sderaadt 
287df930be7Sderaadt 	    case swstmt:
288df930be7Sderaadt 		/* <switch> <stmt> */
289df930be7Sderaadt 		case_ind = ps.cstk[ps.tos - 1];
290df930be7Sderaadt 
291df930be7Sderaadt 	    case decl:		/* finish of a declaration */
292df930be7Sderaadt 	    case elsehead:
293df930be7Sderaadt 		/* <<if> <stmt> else> <stmt> */
294df930be7Sderaadt 	    case forstmt:
295df930be7Sderaadt 		/* <for> <stmt> */
296df930be7Sderaadt 	    case whilestmt:
297df930be7Sderaadt 		/* <while> <stmt> */
298df930be7Sderaadt 		ps.p_stack[--ps.tos] = stmt;
299df930be7Sderaadt 		ps.i_l_follow = ps.il[ps.tos];
300df930be7Sderaadt 		break;
301df930be7Sderaadt 
302df930be7Sderaadt 	    default:		/* <anything else> <stmt> */
303df930be7Sderaadt 		return;
304df930be7Sderaadt 
305df930be7Sderaadt 	    }			/* end of section for <stmt> on top of stack */
306df930be7Sderaadt 	    break;
307df930be7Sderaadt 
308df930be7Sderaadt 	case whilestmt:	/* while (...) on top */
309df930be7Sderaadt 	    if (ps.p_stack[ps.tos - 1] == dohead) {
310df930be7Sderaadt 		/* it is termination of a do while */
311df930be7Sderaadt 		ps.p_stack[--ps.tos] = stmt;
312df930be7Sderaadt 		break;
313df930be7Sderaadt 	    }
314df930be7Sderaadt 	    else
315df930be7Sderaadt 		return;
316df930be7Sderaadt 
317df930be7Sderaadt 	default:		/* anything else on top */
318df930be7Sderaadt 	    return;
319df930be7Sderaadt 
320df930be7Sderaadt 	}
321df930be7Sderaadt     }
322df930be7Sderaadt }
323