xref: /netbsd-src/external/gpl2/gettext/dist/gettext-tools/src/format-librep.c (revision 946379e7b37692fc43f68eb0d1c10daa0a7f3b6c)
1*946379e7Schristos /* librep format strings.
2*946379e7Schristos    Copyright (C) 2001-2004, 2006 Free Software Foundation, Inc.
3*946379e7Schristos    Written by Bruno Haible <haible@clisp.cons.org>, 2001.
4*946379e7Schristos 
5*946379e7Schristos    This program is free software; you can redistribute it and/or modify
6*946379e7Schristos    it under the terms of the GNU General Public License as published by
7*946379e7Schristos    the Free Software Foundation; either version 2, or (at your option)
8*946379e7Schristos    any later version.
9*946379e7Schristos 
10*946379e7Schristos    This program is distributed in the hope that it will be useful,
11*946379e7Schristos    but WITHOUT ANY WARRANTY; without even the implied warranty of
12*946379e7Schristos    MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
13*946379e7Schristos    GNU General Public License for more details.
14*946379e7Schristos 
15*946379e7Schristos    You should have received a copy of the GNU General Public License
16*946379e7Schristos    along with this program; if not, write to the Free Software Foundation,
17*946379e7Schristos    Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301, USA.  */
18*946379e7Schristos 
19*946379e7Schristos #ifdef HAVE_CONFIG_H
20*946379e7Schristos # include <config.h>
21*946379e7Schristos #endif
22*946379e7Schristos 
23*946379e7Schristos #include <stdbool.h>
24*946379e7Schristos #include <stdlib.h>
25*946379e7Schristos 
26*946379e7Schristos #include "format.h"
27*946379e7Schristos #include "c-ctype.h"
28*946379e7Schristos #include "xalloc.h"
29*946379e7Schristos #include "xvasprintf.h"
30*946379e7Schristos #include "format-invalid.h"
31*946379e7Schristos #include "gettext.h"
32*946379e7Schristos 
33*946379e7Schristos #define _(str) gettext (str)
34*946379e7Schristos 
35*946379e7Schristos /* librep format strings are implemented in librep-0.14/src/streams.c.
36*946379e7Schristos    A directive
37*946379e7Schristos    - starts with '%' or '%m$' where m is a positive integer,
38*946379e7Schristos    - is optionally followed by any of the characters '-', '^', '0', '+', ' ',
39*946379e7Schristos      each of which acts as a flag,
40*946379e7Schristos    - is optionally followed by a width specification: a nonempty digit
41*946379e7Schristos      sequence,
42*946379e7Schristos    - is optionally followed by '.' and a precision specification: a nonempty
43*946379e7Schristos      digit sequence,
44*946379e7Schristos    - is finished by a specifier
45*946379e7Schristos        - '%', that needs no argument,
46*946379e7Schristos        - 'c', that need a character argument,
47*946379e7Schristos        - 'd', 'x', 'X', 'o', that need an integer argument,
48*946379e7Schristos        - 's', that need an argument and prints it using princ,
49*946379e7Schristos        - 'S', that need an argument and prints it using prin1.
50*946379e7Schristos    Numbered ('%m$') and unnumbered argument specifications can be used in the
51*946379e7Schristos    same string. The effect of '%m$' is to set the current argument number to
52*946379e7Schristos    m. The current argument number is incremented after processing a directive.
53*946379e7Schristos  */
54*946379e7Schristos 
55*946379e7Schristos enum format_arg_type
56*946379e7Schristos {
57*946379e7Schristos   FAT_NONE,
58*946379e7Schristos   FAT_CHARACTER,
59*946379e7Schristos   FAT_INTEGER,
60*946379e7Schristos   FAT_OBJECT_PRETTY,
61*946379e7Schristos   FAT_OBJECT
62*946379e7Schristos };
63*946379e7Schristos 
64*946379e7Schristos struct numbered_arg
65*946379e7Schristos {
66*946379e7Schristos   unsigned int number;
67*946379e7Schristos   enum format_arg_type type;
68*946379e7Schristos };
69*946379e7Schristos 
70*946379e7Schristos struct spec
71*946379e7Schristos {
72*946379e7Schristos   unsigned int directives;
73*946379e7Schristos   unsigned int numbered_arg_count;
74*946379e7Schristos   unsigned int allocated;
75*946379e7Schristos   struct numbered_arg *numbered;
76*946379e7Schristos };
77*946379e7Schristos 
78*946379e7Schristos /* Locale independent test for a decimal digit.
79*946379e7Schristos    Argument can be  'char' or 'unsigned char'.  (Whereas the argument of
80*946379e7Schristos    <ctype.h> isdigit must be an 'unsigned char'.)  */
81*946379e7Schristos #undef isdigit
82*946379e7Schristos #define isdigit(c) ((unsigned int) ((c) - '0') < 10)
83*946379e7Schristos 
84*946379e7Schristos 
85*946379e7Schristos static int
numbered_arg_compare(const void * p1,const void * p2)86*946379e7Schristos numbered_arg_compare (const void *p1, const void *p2)
87*946379e7Schristos {
88*946379e7Schristos   unsigned int n1 = ((const struct numbered_arg *) p1)->number;
89*946379e7Schristos   unsigned int n2 = ((const struct numbered_arg *) p2)->number;
90*946379e7Schristos 
91*946379e7Schristos   return (n1 > n2 ? 1 : n1 < n2 ? -1 : 0);
92*946379e7Schristos }
93*946379e7Schristos 
94*946379e7Schristos static void *
format_parse(const char * format,bool translated,char ** invalid_reason)95*946379e7Schristos format_parse (const char *format, bool translated, char **invalid_reason)
96*946379e7Schristos {
97*946379e7Schristos   struct spec spec;
98*946379e7Schristos   struct spec *result;
99*946379e7Schristos   unsigned int number;
100*946379e7Schristos 
101*946379e7Schristos   spec.directives = 0;
102*946379e7Schristos   spec.numbered_arg_count = 0;
103*946379e7Schristos   spec.allocated = 0;
104*946379e7Schristos   spec.numbered = NULL;
105*946379e7Schristos   number = 1;
106*946379e7Schristos 
107*946379e7Schristos   for (; *format != '\0';)
108*946379e7Schristos     if (*format++ == '%')
109*946379e7Schristos       {
110*946379e7Schristos 	/* A directive.  */
111*946379e7Schristos 	enum format_arg_type type;
112*946379e7Schristos 
113*946379e7Schristos 	spec.directives++;
114*946379e7Schristos 
115*946379e7Schristos 	if (isdigit (*format))
116*946379e7Schristos 	  {
117*946379e7Schristos 	    const char *f = format;
118*946379e7Schristos 	    unsigned int m = 0;
119*946379e7Schristos 
120*946379e7Schristos 	    do
121*946379e7Schristos 	      {
122*946379e7Schristos 		m = 10 * m + (*f - '0');
123*946379e7Schristos 		f++;
124*946379e7Schristos 	      }
125*946379e7Schristos 	    while (isdigit (*f));
126*946379e7Schristos 
127*946379e7Schristos 	    if (*f == '$' && m > 0)
128*946379e7Schristos 	      {
129*946379e7Schristos 		number = m;
130*946379e7Schristos 		format = ++f;
131*946379e7Schristos 	      }
132*946379e7Schristos 	  }
133*946379e7Schristos 
134*946379e7Schristos 	/* Parse flags.  */
135*946379e7Schristos 	while (*format == '-' || *format == '^' || *format == '0'
136*946379e7Schristos 	       || *format == '+' || *format == ' ')
137*946379e7Schristos 	  format++;
138*946379e7Schristos 
139*946379e7Schristos 	/* Parse width.  */
140*946379e7Schristos 	if (isdigit (*format))
141*946379e7Schristos 	  {
142*946379e7Schristos 	    do format++; while (isdigit (*format));
143*946379e7Schristos 	  }
144*946379e7Schristos 
145*946379e7Schristos 	/* Parse precision.  */
146*946379e7Schristos 	if (*format == '.')
147*946379e7Schristos 	  {
148*946379e7Schristos 	    format++;
149*946379e7Schristos 
150*946379e7Schristos 	    if (isdigit (*format))
151*946379e7Schristos 	      {
152*946379e7Schristos 		do format++; while (isdigit (*format));
153*946379e7Schristos 	      }
154*946379e7Schristos 	  }
155*946379e7Schristos 
156*946379e7Schristos 	switch (*format)
157*946379e7Schristos 	  {
158*946379e7Schristos 	  case '%':
159*946379e7Schristos 	    type = FAT_NONE;
160*946379e7Schristos 	    break;
161*946379e7Schristos 	  case 'c':
162*946379e7Schristos 	    type = FAT_CHARACTER;
163*946379e7Schristos 	    break;
164*946379e7Schristos 	  case 'd': case 'x': case 'X': case 'o':
165*946379e7Schristos 	    type = FAT_INTEGER;
166*946379e7Schristos 	    break;
167*946379e7Schristos 	  case 's':
168*946379e7Schristos 	    type = FAT_OBJECT_PRETTY;
169*946379e7Schristos 	    break;
170*946379e7Schristos 	  case 'S':
171*946379e7Schristos 	    type = FAT_OBJECT;
172*946379e7Schristos 	    break;
173*946379e7Schristos 	  default:
174*946379e7Schristos 	    *invalid_reason =
175*946379e7Schristos 	      (*format == '\0'
176*946379e7Schristos 	       ? INVALID_UNTERMINATED_DIRECTIVE ()
177*946379e7Schristos 	       : INVALID_CONVERSION_SPECIFIER (spec.directives, *format));
178*946379e7Schristos 	    goto bad_format;
179*946379e7Schristos 	  }
180*946379e7Schristos 
181*946379e7Schristos 	if (type != FAT_NONE)
182*946379e7Schristos 	  {
183*946379e7Schristos 	    if (spec.allocated == spec.numbered_arg_count)
184*946379e7Schristos 	      {
185*946379e7Schristos 		spec.allocated = 2 * spec.allocated + 1;
186*946379e7Schristos 		spec.numbered = (struct numbered_arg *) xrealloc (spec.numbered, spec.allocated * sizeof (struct numbered_arg));
187*946379e7Schristos 	      }
188*946379e7Schristos 	    spec.numbered[spec.numbered_arg_count].number = number;
189*946379e7Schristos 	    spec.numbered[spec.numbered_arg_count].type = type;
190*946379e7Schristos 	    spec.numbered_arg_count++;
191*946379e7Schristos 
192*946379e7Schristos 	    number++;
193*946379e7Schristos 	  }
194*946379e7Schristos 
195*946379e7Schristos 	format++;
196*946379e7Schristos       }
197*946379e7Schristos 
198*946379e7Schristos   /* Sort the numbered argument array, and eliminate duplicates.  */
199*946379e7Schristos   if (spec.numbered_arg_count > 1)
200*946379e7Schristos     {
201*946379e7Schristos       unsigned int i, j;
202*946379e7Schristos       bool err;
203*946379e7Schristos 
204*946379e7Schristos       qsort (spec.numbered, spec.numbered_arg_count,
205*946379e7Schristos 	     sizeof (struct numbered_arg), numbered_arg_compare);
206*946379e7Schristos 
207*946379e7Schristos       /* Remove duplicates: Copy from i to j, keeping 0 <= j <= i.  */
208*946379e7Schristos       err = false;
209*946379e7Schristos       for (i = j = 0; i < spec.numbered_arg_count; i++)
210*946379e7Schristos 	if (j > 0 && spec.numbered[i].number == spec.numbered[j-1].number)
211*946379e7Schristos 	  {
212*946379e7Schristos 	    enum format_arg_type type1 = spec.numbered[i].type;
213*946379e7Schristos 	    enum format_arg_type type2 = spec.numbered[j-1].type;
214*946379e7Schristos 	    enum format_arg_type type_both;
215*946379e7Schristos 
216*946379e7Schristos 	    if (type1 == type2)
217*946379e7Schristos 	      type_both = type1;
218*946379e7Schristos 	    else
219*946379e7Schristos 	      {
220*946379e7Schristos 		/* Incompatible types.  */
221*946379e7Schristos 		type_both = FAT_NONE;
222*946379e7Schristos 		if (!err)
223*946379e7Schristos 		  *invalid_reason =
224*946379e7Schristos 		    INVALID_INCOMPATIBLE_ARG_TYPES (spec.numbered[i].number);
225*946379e7Schristos 		err = true;
226*946379e7Schristos 	      }
227*946379e7Schristos 
228*946379e7Schristos 	    spec.numbered[j-1].type = type_both;
229*946379e7Schristos 	  }
230*946379e7Schristos 	else
231*946379e7Schristos 	  {
232*946379e7Schristos 	    if (j < i)
233*946379e7Schristos 	      {
234*946379e7Schristos 		spec.numbered[j].number = spec.numbered[i].number;
235*946379e7Schristos 		spec.numbered[j].type = spec.numbered[i].type;
236*946379e7Schristos 	      }
237*946379e7Schristos 	    j++;
238*946379e7Schristos 	  }
239*946379e7Schristos       spec.numbered_arg_count = j;
240*946379e7Schristos       if (err)
241*946379e7Schristos 	/* *invalid_reason has already been set above.  */
242*946379e7Schristos 	goto bad_format;
243*946379e7Schristos     }
244*946379e7Schristos 
245*946379e7Schristos   result = (struct spec *) xmalloc (sizeof (struct spec));
246*946379e7Schristos   *result = spec;
247*946379e7Schristos   return result;
248*946379e7Schristos 
249*946379e7Schristos  bad_format:
250*946379e7Schristos   if (spec.numbered != NULL)
251*946379e7Schristos     free (spec.numbered);
252*946379e7Schristos   return NULL;
253*946379e7Schristos }
254*946379e7Schristos 
255*946379e7Schristos static void
format_free(void * descr)256*946379e7Schristos format_free (void *descr)
257*946379e7Schristos {
258*946379e7Schristos   struct spec *spec = (struct spec *) descr;
259*946379e7Schristos 
260*946379e7Schristos   if (spec->numbered != NULL)
261*946379e7Schristos     free (spec->numbered);
262*946379e7Schristos   free (spec);
263*946379e7Schristos }
264*946379e7Schristos 
265*946379e7Schristos static int
format_get_number_of_directives(void * descr)266*946379e7Schristos format_get_number_of_directives (void *descr)
267*946379e7Schristos {
268*946379e7Schristos   struct spec *spec = (struct spec *) descr;
269*946379e7Schristos 
270*946379e7Schristos   return spec->directives;
271*946379e7Schristos }
272*946379e7Schristos 
273*946379e7Schristos static bool
format_check(void * msgid_descr,void * msgstr_descr,bool equality,formatstring_error_logger_t error_logger,const char * pretty_msgstr)274*946379e7Schristos format_check (void *msgid_descr, void *msgstr_descr, bool equality,
275*946379e7Schristos 	      formatstring_error_logger_t error_logger,
276*946379e7Schristos 	      const char *pretty_msgstr)
277*946379e7Schristos {
278*946379e7Schristos   struct spec *spec1 = (struct spec *) msgid_descr;
279*946379e7Schristos   struct spec *spec2 = (struct spec *) msgstr_descr;
280*946379e7Schristos   bool err = false;
281*946379e7Schristos 
282*946379e7Schristos   if (spec1->numbered_arg_count + spec2->numbered_arg_count > 0)
283*946379e7Schristos     {
284*946379e7Schristos       unsigned int i, j;
285*946379e7Schristos       unsigned int n1 = spec1->numbered_arg_count;
286*946379e7Schristos       unsigned int n2 = spec2->numbered_arg_count;
287*946379e7Schristos 
288*946379e7Schristos       /* Check the argument names are the same.
289*946379e7Schristos 	 Both arrays are sorted.  We search for the first difference.  */
290*946379e7Schristos       for (i = 0, j = 0; i < n1 || j < n2; )
291*946379e7Schristos 	{
292*946379e7Schristos 	  int cmp = (i >= n1 ? 1 :
293*946379e7Schristos 		     j >= n2 ? -1 :
294*946379e7Schristos 		     spec1->numbered[i].number > spec2->numbered[j].number ? 1 :
295*946379e7Schristos 		     spec1->numbered[i].number < spec2->numbered[j].number ? -1 :
296*946379e7Schristos 		     0);
297*946379e7Schristos 
298*946379e7Schristos 	  if (cmp > 0)
299*946379e7Schristos 	    {
300*946379e7Schristos 	      if (error_logger)
301*946379e7Schristos 		error_logger (_("a format specification for argument %u, as in '%s', doesn't exist in 'msgid'"),
302*946379e7Schristos 			      spec2->numbered[j].number, pretty_msgstr);
303*946379e7Schristos 	      err = true;
304*946379e7Schristos 	      break;
305*946379e7Schristos 	    }
306*946379e7Schristos 	  else if (cmp < 0)
307*946379e7Schristos 	    {
308*946379e7Schristos 	      if (equality)
309*946379e7Schristos 		{
310*946379e7Schristos 		  if (error_logger)
311*946379e7Schristos 		    error_logger (_("a format specification for argument %u doesn't exist in '%s'"),
312*946379e7Schristos 				  spec1->numbered[i].number, pretty_msgstr);
313*946379e7Schristos 		  err = true;
314*946379e7Schristos 		  break;
315*946379e7Schristos 		}
316*946379e7Schristos 	      else
317*946379e7Schristos 		i++;
318*946379e7Schristos 	    }
319*946379e7Schristos 	  else
320*946379e7Schristos 	    j++, i++;
321*946379e7Schristos 	}
322*946379e7Schristos       /* Check the argument types are the same.  */
323*946379e7Schristos       if (!err)
324*946379e7Schristos 	for (i = 0, j = 0; j < n2; )
325*946379e7Schristos 	  {
326*946379e7Schristos 	    if (spec1->numbered[i].number == spec2->numbered[j].number)
327*946379e7Schristos 	      {
328*946379e7Schristos 		if (spec1->numbered[i].type != spec2->numbered[j].type)
329*946379e7Schristos 		  {
330*946379e7Schristos 		    if (error_logger)
331*946379e7Schristos 		      error_logger (_("format specifications in 'msgid' and '%s' for argument %u are not the same"),
332*946379e7Schristos 				    pretty_msgstr, spec2->numbered[j].number);
333*946379e7Schristos 		    err = true;
334*946379e7Schristos 		    break;
335*946379e7Schristos 		  }
336*946379e7Schristos 		j++, i++;
337*946379e7Schristos 	      }
338*946379e7Schristos 	    else
339*946379e7Schristos 	      i++;
340*946379e7Schristos 	  }
341*946379e7Schristos     }
342*946379e7Schristos 
343*946379e7Schristos   return err;
344*946379e7Schristos }
345*946379e7Schristos 
346*946379e7Schristos 
347*946379e7Schristos struct formatstring_parser formatstring_librep =
348*946379e7Schristos {
349*946379e7Schristos   format_parse,
350*946379e7Schristos   format_free,
351*946379e7Schristos   format_get_number_of_directives,
352*946379e7Schristos   NULL,
353*946379e7Schristos   format_check
354*946379e7Schristos };
355*946379e7Schristos 
356*946379e7Schristos 
357*946379e7Schristos #ifdef TEST
358*946379e7Schristos 
359*946379e7Schristos /* Test program: Print the argument list specification returned by
360*946379e7Schristos    format_parse for strings read from standard input.  */
361*946379e7Schristos 
362*946379e7Schristos #include <stdio.h>
363*946379e7Schristos #include "getline.h"
364*946379e7Schristos 
365*946379e7Schristos static void
format_print(void * descr)366*946379e7Schristos format_print (void *descr)
367*946379e7Schristos {
368*946379e7Schristos   struct spec *spec = (struct spec *) descr;
369*946379e7Schristos   unsigned int last;
370*946379e7Schristos   unsigned int i;
371*946379e7Schristos 
372*946379e7Schristos   if (spec == NULL)
373*946379e7Schristos     {
374*946379e7Schristos       printf ("INVALID");
375*946379e7Schristos       return;
376*946379e7Schristos     }
377*946379e7Schristos 
378*946379e7Schristos   printf ("(");
379*946379e7Schristos   last = 1;
380*946379e7Schristos   for (i = 0; i < spec->numbered_arg_count; i++)
381*946379e7Schristos     {
382*946379e7Schristos       unsigned int number = spec->numbered[i].number;
383*946379e7Schristos 
384*946379e7Schristos       if (i > 0)
385*946379e7Schristos 	printf (" ");
386*946379e7Schristos       if (number < last)
387*946379e7Schristos 	abort ();
388*946379e7Schristos       for (; last < number; last++)
389*946379e7Schristos 	printf ("_ ");
390*946379e7Schristos       switch (spec->numbered[i].type)
391*946379e7Schristos 	{
392*946379e7Schristos 	case FAT_CHARACTER:
393*946379e7Schristos 	  printf ("c");
394*946379e7Schristos 	  break;
395*946379e7Schristos 	case FAT_INTEGER:
396*946379e7Schristos 	  printf ("i");
397*946379e7Schristos 	  break;
398*946379e7Schristos 	case FAT_OBJECT_PRETTY:
399*946379e7Schristos 	  printf ("s");
400*946379e7Schristos 	  break;
401*946379e7Schristos 	case FAT_OBJECT:
402*946379e7Schristos 	  printf ("*");
403*946379e7Schristos 	  break;
404*946379e7Schristos 	default:
405*946379e7Schristos 	  abort ();
406*946379e7Schristos 	}
407*946379e7Schristos       last = number + 1;
408*946379e7Schristos     }
409*946379e7Schristos   printf (")");
410*946379e7Schristos }
411*946379e7Schristos 
412*946379e7Schristos int
main()413*946379e7Schristos main ()
414*946379e7Schristos {
415*946379e7Schristos   for (;;)
416*946379e7Schristos     {
417*946379e7Schristos       char *line = NULL;
418*946379e7Schristos       size_t line_size = 0;
419*946379e7Schristos       int line_len;
420*946379e7Schristos       char *invalid_reason;
421*946379e7Schristos       void *descr;
422*946379e7Schristos 
423*946379e7Schristos       line_len = getline (&line, &line_size, stdin);
424*946379e7Schristos       if (line_len < 0)
425*946379e7Schristos 	break;
426*946379e7Schristos       if (line_len > 0 && line[line_len - 1] == '\n')
427*946379e7Schristos 	line[--line_len] = '\0';
428*946379e7Schristos 
429*946379e7Schristos       invalid_reason = NULL;
430*946379e7Schristos       descr = format_parse (line, false, &invalid_reason);
431*946379e7Schristos 
432*946379e7Schristos       format_print (descr);
433*946379e7Schristos       printf ("\n");
434*946379e7Schristos       if (descr == NULL)
435*946379e7Schristos 	printf ("%s\n", invalid_reason);
436*946379e7Schristos 
437*946379e7Schristos       free (invalid_reason);
438*946379e7Schristos       free (line);
439*946379e7Schristos     }
440*946379e7Schristos 
441*946379e7Schristos   return 0;
442*946379e7Schristos }
443*946379e7Schristos 
444*946379e7Schristos /*
445*946379e7Schristos  * For Emacs M-x compile
446*946379e7Schristos  * Local Variables:
447*946379e7Schristos  * compile-command: "/bin/sh ../libtool --mode=link gcc -o a.out -static -O -g -Wall -I.. -I../lib -I../intl -DHAVE_CONFIG_H -DTEST format-librep.c ../lib/libgettextlib.la"
448*946379e7Schristos  * End:
449*946379e7Schristos  */
450*946379e7Schristos 
451*946379e7Schristos #endif /* TEST */
452