add ext4,vfat and tar.bz2
[u-tools.git] / u-tools / apps / tar / doc / genfile.texi
blobb37e26ecc35f49d4ad39def3048e0dada7a34e43
1 @c This is part of the paxutils manual.
2 @c Copyright (C) 2005, 2006, 2009 Free Software Foundation, Inc.
3 @c Written by Sergey Poznyakoff
4 @c This file is distributed under GFDL 1.1 or any later version
5 @c published by the Free Software Foundation.
7 @cindex genfile
8     This appendix describes @command{genfile}, an auxiliary program
9 used in the GNU tar testsuite. If you are not interested in developing
10 GNU tar, skip this appendix.
12     Initially, @command{genfile} was used to generate data files for
13 the testsuite, hence its name. However, new operation modes were being
14 implemented as the testsuite grew more sophisticated, and now
15 @command{genfile} is a multi-purpose instrument.
17     There are three basic operation modes:
19 @table @asis
20 @item File Generation
21     This is the default mode. In this mode, @command{genfile}
22 generates data files.
24 @item File Status
25     In this mode @command{genfile} displays status of specified files.
27 @item Synchronous Execution.
28     In this mode @command{genfile} executes the given program with
29 @option{--checkpoint} option and executes a set of actions when
30 specified checkpoints are reached.
31 @end table
33 @menu
34 * Generate Mode::     File Generation Mode.
35 * Status Mode::       File Status Mode.
36 * Exec Mode::         Synchronous Execution mode.
37 @end menu
39 @node Generate Mode
40 @appendixsec Generate Mode
42 @cindex Generate Mode, @command{genfile}
43 @cindex @command{genfile}, generate mode
44 @cindex @command{genfile}, create file
45     In this mode @command{genfile} creates a data file for the test
46 suite. The size of the file is given with the @option{--length}
47 (@option{-l}) option. By default the file contents is written to the
48 standard output, this can be changed using @option{--file}
49 (@option{-f}) command line option. Thus, the following two commands
50 are equivalent:
52 @smallexample
53 @group
54 genfile --length 100 > outfile
55 genfile --length 100 --file outfile
56 @end group
57 @end smallexample
59     If @option{--length} is not given, @command{genfile} will
60 generate an empty (zero-length) file.
62 @cindex @command{genfile}, seeking to a given offset
63     The command line option @option{--seek=@var{N}} istructs @command{genfile}
64 to skip the given number of bytes (@var{N}) in the output file before
65 writing to it.  It is similar to the @option{seek=@var{N}} of the
66 @command{dd} utility.
68 @cindex @command{genfile}, reading a list of file names
69     You can instruct @command{genfile} to create several files at one
70 go, by giving it @option{--files-from} (@option{-T}) option followed
71 by a name of file containing a list of file names. Using dash
72 (@samp{-}) instead of the file name causes @command{genfile} to read
73 file list from the standard input. For example:
75 @smallexample
76 @group
77 # Read file names from file @file{file.list}
78 genfile --files-from file.list
79 # Read file names from standard input
80 genfile --files-from -
81 @end group
82 @end smallexample
84 @cindex File lists separated by NUL characters
85     The list file is supposed to contain one file name per line. To
86 use file lists separated by ASCII NUL character, use @option{--null}
87 (@option{-0}) command line option:
89 @smallexample
90 genfile --null --files-from file.list
91 @end smallexample
93 @cindex pattern, @command{genfile}
94     The default data pattern for filling the generated file consists
95 of first 256 letters of ASCII code, repeated enough times to fill the
96 entire file. This behavior can be changed with @option{--pattern}
97 option. This option takes a mandatory argument, specifying pattern
98 name to use. Currently two patterns are implemented:
100 @table @option
101 @item --pattern=default
102     The default pattern as described above.
104 @item --pattern=zero
105     Fills the file with zeroes.
106 @end table
108     If no file name was given, the program exits with the code
109 @code{0}.  Otherwise, it exits with @code{0} only if it was able to
110 create a file of the specified length.
111     
112 @cindex Sparse files, creating using @command{genfile}
113 @cindex @command{genfile}, creating sparse files
114     Special option @option{--sparse} (@option{-s}) instructs
115 @command{genfile} to create a sparse file. Sparse files consist of
116 @dfn{data fragments}, separated by @dfn{holes} or blocks of zeros. On
117 many operating systems, actual disk storage is not allocated for
118 holes, but they are counted in the length of the file. To create a
119 sparse file, @command{genfile} should know where to put data fragments,
120 and what data to use to fill them. So, when @option{--sparse} is given
121 the rest of the command line specifies a so-called @dfn{file map}.
123     The file map consists of any number of @dfn{fragment
124 descriptors}. Each descriptor is composed of two values: a number,
125 specifying fragment offset from the end of the previous fragment or,
126 for the very first fragment, from the beginning of the file, and
127 @dfn{contents string}, i.e., a string of characters, specifying the
128 pattern to fill the fragment with. File offset can be suffixed with
129 the following quantifiers:
131 @table @samp
132 @item k
133 @itemx K
134 The number is expressed in kilobytes.
135 @item m
136 @itemx M
137 The number is expressed in megabytes.
138 @item g
139 @itemx G
140 The number is expressed in gigabytes.
141 @end table
143     For each letter in contents string @command{genfile} will generate
144 a @dfn{block} of data, filled with this letter and will write it to
145 the fragment. The size of block is given by @option{--block-size}
146 option. It defaults to 512. Thus, if the string consists of @var{n}
147 characters, the resulting file fragment will contain
148 @code{@var{n}*@var{block-size}} of data. 
150     Last fragment descriptor can have only file offset part. In this
151 case @command{genfile} will create a hole at the end of the file up to
152 the given offset.
154     For example, consider the following invocation:
156 @smallexample
157 genfile --sparse --file sparsefile 0 ABCD 1M EFGHI 2000K 
158 @end smallexample
160 @noindent
161 It will create 3101184-bytes long file of the following structure:
163 @multitable @columnfractions .35 .20 .45
164 @item Offset  @tab Length       @tab Contents
165 @item 0       @tab 4*512=2048   @tab Four 512-byte blocks, filled with
166 letters @samp{A}, @samp{B}, @samp{C} and @samp{D}.
167 @item 2048    @tab 1046528      @tab Zero bytes 
168 @item 1050624 @tab 5*512=2560   @tab Five blocks, filled with letters
169 @samp{E}, @samp{F}, @samp{G}, @samp{H}, @samp{I}.
170 @item 1053184  @tab 2048000     @tab Zero bytes
171 @end multitable
173     The exit code of @command{genfile --status} command is @code{0}
174 only if created file is actually sparse.
175     
176 @node Status Mode
177 @appendixsec Status Mode
179     In status mode, @command{genfile} prints file system status for
180 each file specified in the command line. This mode is toggled by
181 @option{--stat} (@option{-S}) command line option. An optional argument to this
182 option specifies output @dfn{format}: a comma-separated list of
183 @code{struct stat} fields to be displayed. This list can contain
184 following identifiers @FIXME{should we also support @samp{%} notations
185 as in stat(1)??}:
187 @table @asis
188 @item name
189     The file name.
190     
191 @item dev
192 @itemx st_dev
193     Device number in decimal.
194     
195 @item ino
196 @itemx st_ino
197     Inode number.
198     
199 @item mode[.@var{number}]
200 @itemx st_mode[.@var{number}]
201     File mode in octal.  Optional @var{number} specifies octal mask to
202 be applied to the mode before outputting.  For example, @code{--stat
203 mode.777} will preserve lower nine bits of it.  Notice, that you can
204 use any punctuation character in place of @samp{.}.
205     
206 @item nlink
207 @itemx st_nlink
208     Number of hard links.
209     
210 @item uid
211 @itemx st_uid
212     User ID of owner.
213     
214 @item gid
215 @itemx st_gid
216     Group ID of owner.
217     
218 @item size
219 @itemx st_size
220     File size in decimal.
221     
222 @item blksize
223 @itemx st_blksize
224     The size in bytes of each file block.
225     
226 @item blocks
227 @itemx st_blocks
228     Number of blocks allocated.
229      
230 @item atime
231 @itemx st_atime
232     Time of last access.
233     
234 @item mtime
235 @itemx st_mtime
236     Time of last modification
238 @item ctime
239 @itemx st_ctime
240     Time of last status change
242 @item sparse
243     A boolean value indicating whether the file is @samp{sparse}.     
244 @end table
246     Modification times are displayed in @acronym{UTC} as
247 @acronym{UNIX} timestamps, unless suffixed with @samp{H} (for
248 ``human-readable''), as in @samp{ctimeH}, in which case usual
249 @code{tar tv} output format is used.
251     The default output format is: @samp{name,dev,ino,mode,
252 nlink,uid,gid,size,blksize,blocks,atime,mtime,ctime}. 
254     For example, the following command will display file names and
255 corresponding times of last access for each file in the current working
256 directory:
258 @smallexample
259 genfile --stat=name,atime *
260 @end smallexample
262 @node Exec Mode
263 @appendixsec Exec Mode
265 @cindex Exec Mode, @command{genfile}
266     This mode is designed for testing the behavior of @code{paxutils}
267 commands when some of the files change during archiving. It is an
268 experimental mode.
270     The @samp{Exec Mode} is toggled by @option{--run} command line
271 option (or its alias @option{-r}). The non-optional arguments to
272 @command{getopt} give the command line to be executed. Normally,
273 it should contain at least the @option{--checkpoint} option.
275     A set of options is provided for defining checkpoint values and
276 actions to be executed upon reaching them. Checkpoint values are
277 introduced with the @option{--checkpoint} command line
278 option. Argument to this option is the number of checkpoint in decimal.
280     Any number of @dfn{actions} may be specified after a
281 checkpoint. Available actions are
283 @table @option
284 @item --cut @var{file}
285 @itemx --truncate @var{file}
286     Truncate @var{file} to the size specified by previous
287 @option{--length} option (or 0, if it is not given).
288     
289 @item --append @var{file}
290     Append data to @var{file}. The size of data and its pattern are
291 given by previous @option{--length} and @option{pattern} options.
293 @item --touch @var{file}
294     Update the access and modification times of @var{file}. These
295 timestamps are changed to the current time, unless @option{--date}
296 option was given, in which case they are changed to the specified
297 time. Argument to @option{--date} option is a date specification in
298 an almost arbitrary format (@pxref{Date input formats}).
300 @item --exec @var{command}
301     Execute given shell command.
303 @item --unlink @var{file}
304     Unlink the @var{file}.
305 @end table
307     Option @option{--verbose} instructs @command{genfile} to print on
308 standard output notifications about checkpoints being executed and to
309 verbosely describe exit status of the command.
311     While the command is being executed its standard output remains
312 connected to descriptor 1. All messages it prints to file descriptor
313 2, except checkpoint notifications, are forwarded to standard
314 error.
316     @command{Genfile} exits with the exit status of the executed command.
318     For compatibility with previous @command{genfile} versions, the
319 @option{--run} option takes an optional argument. If used this way,
320 its argument supplies the command line to be executed. There should
321 be no non-optional arguments in the @command{genfile} command line.
323     The actual command line is constructed by inserting
324 the @option{--checkpoint} option between the command name and its
325 first argument (if any). Due to this, the argument to @option{--run}
326 may not use traditional @command{tar} option syntax, i.e., the
327 following is wrong:
329 @smallexample
330 # Wrong!
331 genfile --run='tar cf foo bar'
332 @end smallexample
334 @noindent
336 Use the following syntax instead:
338 @smallexample
339 genfile --run='tar -cf foo bar' @var{actions}...
340 @end smallexample
342 The above command line is equivalent to
344 @smallexample
345 genfile @var{actions}... -- tar -cf foo bar
346 @end smallexample
348 Notice, that the use of compatibility mode is deprecated.