Fix up mix of man(7)/mdoc(7).
[netbsd-mini2440.git] / lib / libc / stdio / printf.3
blob55b3c7ccd4f30e55717da370e3838c5e96a7a61d
1 .\"     $NetBSD: printf.3,v 1.48 2009/01/11 02:46:29 christos Exp $
2 .\"
3 .\" Copyright (c) 1990, 1991, 1993
4 .\"     The Regents of the University of California.  All rights reserved.
5 .\"
6 .\" This code is derived from software contributed to Berkeley by
7 .\" Chris Torek and the American National Standards Committee X3,
8 .\" on Information Processing Systems.
9 .\"
10 .\" Redistribution and use in source and binary forms, with or without
11 .\" modification, are permitted provided that the following conditions
12 .\" are met:
13 .\" 1. Redistributions of source code must retain the above copyright
14 .\"    notice, this list of conditions and the following disclaimer.
15 .\" 2. Redistributions in binary form must reproduce the above copyright
16 .\"    notice, this list of conditions and the following disclaimer in the
17 .\"    documentation and/or other materials provided with the distribution.
18 .\" 3. Neither the name of the University nor the names of its contributors
19 .\"    may be used to endorse or promote products derived from this software
20 .\"    without specific prior written permission.
21 .\"
22 .\" THIS SOFTWARE IS PROVIDED BY THE REGENTS AND CONTRIBUTORS ``AS IS'' AND
23 .\" ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE
24 .\" IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE
25 .\" ARE DISCLAIMED.  IN NO EVENT SHALL THE REGENTS OR CONTRIBUTORS BE LIABLE
26 .\" FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL
27 .\" DAMAGES (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS
28 .\" OR SERVICES; LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION)
29 .\" HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT
30 .\" LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY
31 .\" OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF
32 .\" SUCH DAMAGE.
33 .\"
34 .\"     @(#)printf.3    8.1 (Berkeley) 6/4/93
35 .\"
36 .Dd December 16, 2008
37 .Dt PRINTF 3
38 .Os
39 .Sh NAME
40 .Nm printf ,
41 .Nm fprintf ,
42 .Nm sprintf ,
43 .Nm snprintf ,
44 .Nm asprintf ,
45 .Nm vprintf ,
46 .Nm vfprintf ,
47 .Nm vsprintf ,
48 .Nm vsnprintf ,
49 .Nm vasprintf
50 .Nd formatted output conversion
51 .Sh LIBRARY
52 .Lb libc
53 .Sh SYNOPSIS
54 .In stdio.h
55 .Ft int
56 .Fn printf "const char * restrict format" ...
57 .Ft int
58 .Fn fprintf "FILE * restrict stream" "const char * restrict format" ...
59 .Ft int
60 .Fn sprintf "char * restrict str" "const char * restrict format" ...
61 .Ft int
62 .Fn snprintf "char * restrict str" "size_t size" "const char * restrict format" ...
63 .Ft int
64 .Fn asprintf "char ** restrict ret" "const char * restrict format" ...
65 .In stdarg.h
66 .Ft int
67 .Fn vprintf "const char * restrict format" "va_list ap"
68 .Ft int
69 .Fn vfprintf "FILE * restrict stream" "const char * restrict format" "va_list ap"
70 .Ft int
71 .Fn vsprintf "char * restrict str" "const char * restrict format" "va_list ap"
72 .Ft int
73 .Fn vsnprintf "char * restrict str" "size_t size" "const char * restrict format" "va_list ap"
74 .Ft int
75 .Fn vasprintf "char ** restrict ret" "const char * restrict format" "va_list ap"
76 .Sh DESCRIPTION
77 The
78 .Fn printf
79 family of functions produces output according to a
80 .Fa format
81 as described below.
82 The
83 .Fn printf
84 and
85 .Fn vprintf
86 functions
87 write output to
88 .Em stdout ,
89 the standard output stream;
90 .Fn fprintf
91 and
92 .Fn vfprintf
93 write output to the given output
94 .Fa stream ;
95 .Fn sprintf ,
96 .Fn snprintf ,
97 .Fn vsprintf ,
98 and
99 .Fn vsnprintf
100 write to the character string
101 .Fa str ;
103 .Fn asprintf
105 .Fn vasprintf
106 write to a dynamically allocated string that is stored in
107 .Fa ret .
109 These functions write the output under the control of a
110 .Fa format
111 string that specifies how subsequent arguments
112 (or arguments accessed via the variable-length argument facilities of
113 .Xr stdarg 3 )
114 are converted for output.
116 .Fn asprintf
118 .Fn vasprintf
119 return a pointer to a buffer sufficiently large to hold the
120 string in the
121 .Fa ret
122 argument.
123 This pointer should be passed to
124 .Xr free 3
125 to release the allocated storage when it is no longer needed.
126 If sufficient space cannot be allocated, these functions
127 will return \-1 and set
128 .Fa ret
129 to be a
130 .Dv NULL
131 pointer.
132 Please note that these functions are not standardized, and not all
133 implementations can be assumed to set the
134 .Fa ret
135 argument to
136 .Dv NULL
137 on error.
138 It is more portable to check for a return value of \-1 instead.
140 .Fn snprintf
142 .Fn vsnprintf
143 will write at most
144 .Fa size Ns \-1
145 of the characters printed into the output string
146 (the
147 .Fa size Ns 'th
148 character then gets the terminating
149 .Ql \e0 ) ;
150 if the return value is greater than or equal to the
151 .Fa size
152 argument, the string was too short
153 and some of the printed characters were discarded.
155 .Fa size
156 is zero, nothing is written and
157 .Fa str
158 may be a
159 .Dv NULL
160 pointer.
162 .Fn sprintf
164 .Fn vsprintf
165 effectively assume an infinite
166 .Fa size .
168 The format string is composed of zero or more directives:
169 ordinary
170 .\" multibyte
171 characters (not
172 .Cm % ) ,
173 which are copied unchanged to the output stream;
174 and conversion specifications, each of which results
175 in fetching zero or more subsequent arguments.
176 Each conversion specification is introduced by
177 the character
178 .Cm % .
179 The arguments must correspond properly (after type promotion)
180 with the conversion specifier.
181 After the
182 .Cm % ,
183 the following appear in sequence:
184 .Bl -bullet
186 An optional field, consisting of a decimal digit string followed by a
187 .Cm $ ,
188 specifying the next argument to access.
189 If this field is not provided, the argument following the last
190 argument accessed will be used.
191 Arguments are numbered starting at
192 .Cm 1 .
193 If unaccessed arguments in the format string are interspersed with ones that
194 are accessed the results will be indeterminate.
196 Zero or more of the following flags:
197 .Bl -tag -width ".So \  Sc (space)"
198 .It Sq Cm #
199 The value should be converted to an
200 .Dq alternate form .
202 .Cm c ,
203 .Cm d ,
204 .Cm i ,
205 .Cm n ,
206 .Cm p ,
207 .Cm s ,
209 .Cm u
210 conversions, this option has no effect.
212 .Cm o
213 conversions, the precision of the number is increased to force the first
214 character of the output string to a zero (except if a zero value is printed
215 with an explicit precision of zero).
217 .Cm x
219 .Cm X
220 conversions, a non-zero result has the string
221 .Ql 0x
223 .Ql 0X
225 .Cm X
226 conversions) prepended to it.
228 .Cm a ,
229 .Cm A ,
230 .Cm e ,
231 .Cm E ,
232 .Cm f ,
233 .Cm F ,
234 .Cm g ,
236 .Cm G
237 conversions, the result will always contain a decimal point, even if no
238 digits follow it (normally, a decimal point appears in the results of
239 those conversions only if a digit follows).
241 .Cm g
243 .Cm G
244 conversions, trailing zeros are not removed from the result as they
245 would otherwise be.
246 .It So Cm 0 Sc (zero)
247 Zero padding.
248 For all conversions except
249 .Cm n ,
250 the converted value is padded on the left with zeros rather than blanks.
251 If a precision is given with a numeric conversion
252 .Pf ( Cm d ,
253 .Cm i ,
254 .Cm o ,
255 .Cm u ,
256 .Cm i ,
257 .Cm x ,
259 .Cm X ) ,
261 .Cm 0
262 flag is ignored.
263 .It Sq Cm \-
264 A negative field width flag;
265 the converted value is to be left adjusted on the field boundary.
266 Except for
267 .Cm n
268 conversions, the converted value is padded on the right with blanks,
269 rather than on the left with blanks or zeros.
271 .Sq Cm \-
272 overrides a
273 .Sq Cm \&0
274 if both are given.
275 .It So "\ " Sc (space)
276 A blank should be left before a positive number
277 produced by a signed conversion
278 .Pf ( Cm a ,
279 .Cm A
280 .Cm d ,
281 .Cm e ,
282 .Cm E ,
283 .Cm f ,
284 .Cm F ,
285 .Cm g ,
286 .Cm G ,
288 .Cm i ) .
289 .It Sq Cm +
290 A sign must always be placed before a
291 number produced by a signed conversion.
293 .Sq Cm +
294 overrides a space if both are used.
295 .It Sq Cm '
296 Decimal conversions
297 .Cm ( d , u ,
299 .Cm i )
300 or the integral portion of a floating point conversion
301 .Cm ( f
303 .Cm F )
304 should be grouped and separated by thousands using
305 the non-monetary separator returned by
306 .Xr localeconv 3 .
309 An optional decimal digit string specifying a minimum field width.
310 If the converted value has fewer characters than the field width, it will
311 be padded with spaces on the left (or right, if the left-adjustment
312 flag has been given) to fill out the field width.
314 An optional precision, in the form of a period
315 .Sq Cm \&.
316 followed by an optional digit string.
317 If the digit string is omitted, the precision is taken as zero.
318 This gives the minimum number of digits to appear for
319 .Cm d ,
320 .Cm i ,
321 .Cm o ,
322 .Cm u ,
323 .Cm x ,
325 .Cm X
326 conversions, the number of digits to appear after the decimal-point for
327 .Cm a ,
328 .Cm A ,
329 .Cm e ,
330 .Cm E ,
331 .Cm f ,
333 .Cm F
334 conversions, the maximum number of significant digits for
335 .Cm g
337 .Cm G
338 conversions, or the maximum number of characters to be printed from a
339 string for
340 .Cm s
341 conversions.
343 An optional length modifier, that specifies the size of the argument.
344 The following length modifiers are valid for the
345 .Cm d , i , n , o , u , x ,
347 .Cm X
348 conversion:
349 .Bl -column ".Cm q Em (deprecated)" ".Vt signed char" ".Vt unsigned long long" ".Vt long long *"
350 .It Sy Modifier Ta Cm d , i Ta Cm o , u , x , X Ta Cm n
351 .It Cm hh Ta Vt "signed char" Ta Vt "unsigned char" Ta Vt "signed char *"
352 .It Cm h Ta Vt short Ta Vt "unsigned short" Ta Vt "short *"
353 .It Cm l No (ell) Ta Vt long Ta Vt "unsigned long" Ta Vt "long *"
354 .It Cm ll No (ell ell) Ta Vt "long long" Ta Vt "unsigned long long" Ta Vt "long long *"
355 .It Cm j Ta Vt intmax_t Ta Vt uintmax_t Ta Vt "intmax_t *"
356 .It Cm t Ta Vt ptrdiff_t Ta (see note) Ta Vt "ptrdiff_t *"
357 .It Cm z Ta (see note) Ta Vt size_t Ta (see note)
358 .It Cm q Em (deprecated) Ta Vt quad_t Ta Vt u_quad_t Ta Vt "quad_t *"
361 Note:
363 .Cm t
364 modifier, when applied to a
365 .Cm o , u , x ,
367 .Cm X
368 conversion, indicates that the argument is of an unsigned type
369 equivalent in size to a
370 .Vt ptrdiff_t .
372 .Cm z
373 modifier, when applied to a
374 .Cm d
376 .Cm i
377 conversion, indicates that the argument is of a signed type equivalent in
378 size to a
379 .Vt size_t .
380 Similarly, when applied to an
381 .Cm n
382 conversion, it indicates that the argument is a pointer to a signed type
383 equivalent in size to a
384 .Vt size_t .
386 The following length modifier is valid for the
387 .Cm a ,
388 .Cm A ,
389 .Cm e ,
390 .Cm E ,
391 .Cm f ,
392 .Cm F ,
393 .Cm g ,
395 .Cm G
396 conversion:
397 .Bl -column ".Sy Modifier" ".Cm a , A , e , E , f , F , g , G"
398 .It Sy Modifier Ta Cm a , A , e , E , f , F , g , G
399 .It Cm l No (ell) Ta Vt double
400 (ignored, same behavior as without it)
401 .It Cm L Ta Vt "long double"
404 The following length modifier is valid for the
405 .Cm c
407 .Cm s
408 conversion:
409 .Bl -column ".Sy Modifier" ".Vt wint_t" ".Vt wchar_t *"
410 .It Sy Modifier Ta Cm c Ta Cm s
411 .It Cm l No (ell) Ta Vt wint_t Ta Vt "wchar_t *"
414 A character that specifies the type of conversion to be applied.
417 A field width or precision, or both, may be indicated by
418 an asterisk
419 .Ql *
420 or an asterisk followed by one or more decimal digits and a
421 .Ql $
422 instead of a
423 digit string.
424 In this case, an
425 .Vt int
426 argument supplies the field width or precision.
427 A negative field width is treated as a left adjustment flag followed by a
428 positive field width; a negative precision is treated as though it were
429 missing.
430 If a single format directive mixes positional
431 .Pq Li nn$
432 and non-positional arguments, the results are undefined.
434 The conversion specifiers and their meanings are:
435 .Bl -tag -width ".Cm diouxX"
436 .It Cm diouxX
438 .Vt int
439 (or appropriate variant) argument is converted to signed decimal
440 .Pf ( Cm d
442 .Cm i ) ,
443 unsigned octal
444 .Pq Cm o ,
445 unsigned decimal
446 .Pq Cm u ,
447 or unsigned hexadecimal
448 .Pf ( Cm x
450 .Cm X )
451 notation.
452 The letters
453 .Dq Li abcdef
454 are used for
455 .Cm x
456 conversions; the letters
457 .Dq Li ABCDEF
458 are used for
459 .Cm X
460 conversions.
461 The precision, if any, gives the minimum number of digits that must
462 appear; if the converted value requires fewer digits, it is padded on
463 the left with zeros.
464 .It Cm DOU
466 .Vt long int
467 argument is converted to signed decimal, unsigned octal, or unsigned
468 decimal, as if the format had been
469 .Cm ld ,
470 .Cm lo ,
472 .Cm lu
473 respectively.
474 These conversion characters are deprecated, and will eventually disappear.
475 .It Cm eE
477 .Vt double
478 argument is rounded and converted in the style
479 .Sm off
480 .Oo \- Oc Ar d Li \&. Ar ddd Li e \\*[Pm] Ar dd
481 .Sm on
482 where there is one digit before the
483 decimal-point character
484 and the number of digits after it is equal to the precision;
485 if the precision is missing,
486 it is taken as 6; if the precision is
487 zero, no decimal-point character appears.
489 .Cm E
490 conversion uses the letter
491 .Ql E
492 (rather than
493 .Ql e )
494 to introduce the exponent.
495 The exponent always contains at least two digits; if the value is zero,
496 the exponent is 00.
499 .Cm a ,
500 .Cm A ,
501 .Cm e ,
502 .Cm E ,
503 .Cm f ,
504 .Cm F ,
505 .Cm g ,
507 .Cm G
508 conversions, positive and negative infinity are represented as
509 .Li inf
511 .Li -inf
512 respectively when using the lowercase conversion character, and
513 .Li INF
515 .Li -INF
516 respectively when using the uppercase conversion character.
517 Similarly, NaN is represented as
518 .Li nan
519 when using the lowercase conversion, and
520 .Li NAN
521 when using the uppercase conversion.
522 .It Cm fF
524 .Vt double
525 argument is rounded and converted to decimal notation in the style
526 .Sm off
527 .Oo \- Oc Ar ddd Li \&. Ar ddd ,
528 .Sm on
529 where the number of digits after the decimal-point character
530 is equal to the precision specification.
531 If the precision is missing, it is taken as 6; if the precision is
532 explicitly zero, no decimal-point character appears.
533 If a decimal point appears, at least one digit appears before it.
534 .It Cm gG
536 .Vt double
537 argument is converted in style
538 .Cm f
540 .Cm e
541 (or in style
542 .Cm F
544 .Cm E
546 .Cm G
547 conversions).
548 The precision specifies the number of significant digits.
549 If the precision is missing, 6 digits are given; if the precision is zero,
550 it is treated as 1.
551 Style
552 .Cm e
553 is used if the exponent from its conversion is less than \-4 or greater than
554 or equal to the precision.
555 Trailing zeros are removed from the fractional part of the result; a
556 decimal point appears only if it is followed by at least one digit.
557 .It Cm aA
559 .Vt double
560 argument is rounded and converted to hexadecimal notation in the style
561 .Sm off
562 .Oo \- Oc Li 0x Ar h Li \&. Ar hhhp Oo \\*[Pm] Oc Ar d ,
563 .Sm on
564 where the number of digits after the hexadecimal-point character
565 is equal to the precision specification.
566 If the precision is missing, it is taken as enough to represent
567 the floating-point number exactly, and no rounding occurs.
568 If the precision is zero, no hexadecimal-point character appears.
570 .Cm p
571 is a literal character
572 .Ql p ,
573 and the exponent consists of a positive or negative sign
574 followed by a decimal number representing an exponent of 2.
576 .Cm A
577 conversion uses the prefix
578 .Dq Li 0X
579 (rather than
580 .Dq Li 0x ) ,
581 the letters
582 .Dq Li ABCDEF
583 (rather than
584 .Dq Li abcdef )
585 to represent the hex digits, and the letter
586 .Ql P
587 (rather than
588 .Ql p )
589 to separate the mantissa and exponent.
591 Note that there may be multiple valid ways to represent floating-point
592 numbers in this hexadecimal format.
593 For example,
594 .Li 0x3.24p+0 , 0x6.48p-1
596 .Li 0xc.9p-2
597 are all equivalent.
598 The format chosen depends on the internal representation of the
599 number, but the implementation guarantees that the length of the
600 mantissa will be minimized.
601 Zeroes are always represented with a mantissa of 0 (preceded by a
602 .Ql -
603 if appropriate) and an exponent of
604 .Li +0 .
605 .It Cm C
606 Treated as
607 .Cm c
608 with the
609 .Cm l
610 (ell) modifier.
611 .It Cm c
613 .Vt int
614 argument is converted to an
615 .Vt "unsigned char" ,
616 and the resulting character is written.
618 If the
619 .Cm l
620 (ell) modifier is used, the
621 .Vt wint_t
622 argument shall be converted to a
623 .Vt wchar_t ,
624 and the (potentially multi-byte) sequence representing the
625 single wide character is written, including any shift sequences.
626 If a shift sequence is used, the shift state is also restored
627 to the original state after the character.
628 .It Cm S
629 Treated as
630 .Cm s
631 with the
632 .Cm l
633 (ell) modifier.
634 .It Cm s
636 .Vt "char *"
637 argument is expected to be a pointer to an array of character type (pointer
638 to a string).
639 Characters from the array are written up to (but not including)
640 a terminating
641 .Dv NUL
642 character;
643 if a precision is specified, no more than the number specified are
644 written.
645 If a precision is given, no null character
646 need be present; if the precision is not specified, or is greater than
647 the size of the array, the array must contain a terminating
648 .Dv NUL
649 character.
651 If the
652 .Cm l
653 (ell) modifier is used, the
654 .Vt "wchar_t *"
655 argument is expected to be a pointer to an array of wide characters
656 (pointer to a wide string).
657 For each wide character in the string, the (potentially multi-byte)
658 sequence representing the
659 wide character is written, including any shift sequences.
660 If any shift sequence is used, the shift state is also restored
661 to the original state after the string.
662 Wide characters from the array are written up to (but not including)
663 a terminating wide
664 .Dv NUL
665 character;
666 if a precision is specified, no more than the number of bytes specified are
667 written (including shift sequences).
668 Partial characters are never written.
669 If a precision is given, no null character
670 need be present; if the precision is not specified, or is greater than
671 the number of bytes required to render the multibyte representation of
672 the string, the array must contain a terminating wide
673 .Dv NUL
674 character.
675 .It Cm p
677 .Vt "void *"
678 pointer argument is printed in hexadecimal (as if by
679 .Ql %#x
681 .Ql %#lx ) .
682 .It Cm n
683 The number of characters written so far is stored into the
684 integer indicated by the
685 .Vt "int *"
686 (or variant) pointer argument.
687 No argument is converted.
688 .It Cm %
690 .Ql %
691 is written.
692 No argument is converted.
693 The complete conversion specification is
694 .Ql %% .
697 The decimal point
698 character is defined in the program's locale (category
699 .Dv LC_NUMERIC ) .
701 In no case does a non-existent or small field width cause truncation of
702 a numeric field; if the result of a conversion is wider than the field
703 width, the
704 field is expanded to contain the conversion result.
705 .Sh RETURN VALUES
706 These functions return
707 the number of characters printed, or that would be printed if there
708 was adequate space in case of
709 .Fn snprintf
711 .Fn vsnprintf ,
712 (not including the trailing
713 .Ql \e0
714 used to end output to strings).
715 If an output error was encountered, these functions shall return a
716 negative value.
717 .Sh EXAMPLES
718 To print a date and time in the form
719 .Dq Li "Sunday, July 3, 10:02" ,
720 where
721 .Fa weekday
723 .Fa month
724 are pointers to strings:
725 .Bd -literal -offset indent
726 #include \*[Lt]stdio.h\*[Gt]
727 fprintf(stdout, "%s, %s %d, %.2d:%.2d\en",
728         weekday, month, day, hour, min);
731 To print \*(Pi
732 to five decimal places:
733 .Bd -literal -offset indent
734 #include \*[Lt]math.h\*[Gt]
735 #include \*[Lt]stdio.h\*[Gt]
736 fprintf(stdout, "pi = %.5f\en", 4 * atan(1.0));
739 To allocate a 128 byte string and print into it:
740 .Bd -literal -offset indent
741 #include \*[Lt]stdio.h\*[Gt]
742 #include \*[Lt]stdlib.h\*[Gt]
743 #include \*[Lt]stdarg.h\*[Gt]
744 char *newfmt(const char *fmt, ...)
746                 char *p;
747                 va_list ap;
748                 if ((p = malloc(128)) == NULL)
749                         return (NULL);
750                 va_start(ap, fmt);
751                 (void) vsnprintf(p, 128, fmt, ap);
752                 va_end(ap);
753                 return (p);
756 .Sh ERRORS
757 In addition to the errors documented for the
758 .Xr write 2
759 system call, the
760 .Fn printf
761 family of functions may fail if:
762 .Bl -tag -width Er
763 .It Bq Er EILSEQ
764 An invalid wide character code was encountered.
765 .It Bq Er ENOMEM
766 Insufficient storage space is available.
768 .Sh SEE ALSO
769 .Xr printf 1 ,
770 .Xr fmtcheck 3 ,
771 .Xr scanf 3 ,
772 .Xr setlocale 3 ,
773 .Xr wprintf 3 ,
774 .Xr printf 9
775 .Sh STANDARDS
776 Subject to the caveats noted in the
777 .Sx BUGS
778 section below, the
779 .Fn fprintf ,
780 .Fn printf ,
781 .Fn sprintf ,
782 .Fn vprintf ,
783 .Fn vfprintf ,
785 .Fn vsprintf
786 functions
787 conform to
788 .St -ansiC
790 .St -isoC-99 .
791 With the same reservation, the
792 .Fn snprintf
794 .Fn vsnprintf
795 functions conform to
796 .St -isoC-99 .
797 .Sh HISTORY
798 The functions
799 .Fn snprintf
801 .Fn vsnprintf
802 first appeared in
803 .Bx 4.4 .
804 The functions
805 .Fn asprintf
807 .Fn vasprintf
808 are modeled on the ones that first appeared in the GNU C library.
809 .Sh CAVEATS
810 Because
811 .Fn sprintf
813 .Fn vsprintf
814 assume an infinitely long string, callers must be careful not to
815 overflow the actual space; this is often impossible to assure.
816 For safety, programmers should use the
817 .Fn snprintf
819 .Fn asprintf
820 family of interfaces instead.
821 Unfortunately, the
822 .Fn snprintf
823 interfaces are not available on older
824 systems and the
825 .Fn asprintf
826 interfaces are not yet portable.
828 It is important never to pass a string with user-supplied data as a
829 format without using
830 .Ql %s .
831 An attacker can put format specifiers in the string to mangle your stack,
832 leading to a possible security hole.
833 This holds true even if you have built the string
834 .Dq by hand
835 using a function like
836 .Fn snprintf ,
837 as the resulting string may still contain user-supplied conversion specifiers
838 for later interpolation by
839 .Fn printf .
841 Be sure to use the proper secure idiom:
842 .Bd -literal -offset indent
843 snprintf(buffer, sizeof(buffer), "%s", string);
846 There is no way for printf to know the size of each argument passed.
847 If you use positional arguments you must ensure that all parameters, up to the
848 last positionally specified parameter, are used in the format string.
849 This allows for the format string to be parsed for this information.
850 Failure to do this will mean your code is non-portable and liable to fail.
852 In this implementation, passing a
853 .Dv NULL
854 .Vt char *
855 argument to the
856 .Cm %s
857 format specifier will output
858 .Em "(null)"
859 instead of crashing.
860 Programs that depend on this behavior are non-portable and may crash
861 on other systems or in the future.
862 .Sh BUGS
863 The conversion formats
864 .Cm \&%D ,
865 .Cm \&%O ,
867 .Cm %U
868 are not standard and are provided only for backward compatibility.
869 The effect of padding the
870 .Cm %p
871 format with zeros (either by the
872 .Sq Cm 0
873 flag or by specifying a precision), and the benign effect (i.e. none)
874 of the
875 .Sq Cm #
876 flag on
877 .Cm %n
879 .Cm %p
880 conversions, as well as other nonsensical combinations such as
881 .Cm %Ld ,
882 are not standard; such combinations should be avoided.
886 family of functions do not correctly handle multibyte characters in the
887 .Fa format
888 argument.
889 .Sh SECURITY CONSIDERATIONS
891 .Fn sprintf
893 .Fn vsprintf
894 functions are easily misused in a manner which enables malicious users
895 to arbitrarily change a running program's functionality through
896 a buffer overflow attack.
897 Because
898 .Fn sprintf
900 .Fn vsprintf
901 assume an infinitely long string,
902 callers must be careful not to overflow the actual space;
903 this is often hard to assure.
904 For safety, programmers should use the
905 .Fn snprintf
906 interface instead.
907 For example:
908 .Bd -literal
909 void
910 foo(const char *arbitrary_string, const char *and_another)
912         char onstack[8];
914 #ifdef BAD
915         /*
916          * This first sprintf is bad behavior.  Do not use sprintf!
917          */
918         sprintf(onstack, "%s, %s", arbitrary_string, and_another);
919 #else
920         /*
921          * The following two lines demonstrate better use of
922          * snprintf().
923          */
924         snprintf(onstack, sizeof(onstack), "%s, %s", arbitrary_string,
925             and_another);
926 #endif
931 .Fn printf
933 .Fn sprintf
934 family of functions are also easily misused in a manner
935 allowing malicious users to arbitrarily change a running program's
936 functionality by either causing the program
937 to print potentially sensitive data
938 .Dq "left on the stack" ,
939 or causing it to generate a memory fault or bus error
940 by dereferencing an invalid pointer.
942 .Cm %n
943 can be used to write arbitrary data to potentially carefully-selected
944 addresses.
945 Programmers are therefore strongly advised to never pass untrusted strings
946 as the
947 .Fa format
948 argument, as an attacker can put format specifiers in the string
949 to mangle your stack,
950 leading to a possible security hole.
951 This holds true even if the string was built using a function like
952 .Fn snprintf ,
953 as the resulting string may still contain user-supplied conversion specifiers
954 for later interpolation by
955 .Fn printf .
957 Always use the proper secure idiom:
959 .Dl "snprintf(buffer, sizeof(buffer), \*q%s\*q, string);"