stat,tail: recognize new file system type: aufs
[coreutils.git] / HACKING
blobf8d3a9b577a499dd7b6a20a3e905797e92693c3a
1 Coreutils Contribution Guidelines
4 Prerequisites
5 =============
6 You will need the "git" version control tools.
7 On Fedora-based systems, do "yum install git".
8 On Debian-based ones install the "git-core" package.
9 Then run "git --version".  If that says it's older than
10 version 1.4.4, then you'd do well to get a newer version.
11 At worst, just download the latest stable release from
12 http://git.or.cz/ and build from source.
14 For details on building the programs in this package, see
15 the file, README-hacking.
18 Use the latest upstream sources
19 ===============================
20 Base any changes you make on the latest upstream sources.
21 You can get a copy of the latest with this command:
23     git clone git://git.sv.gnu.org/coreutils
25 That downloads the entire repository, including revision control history
26 dating back to 1991.  The repository (the part you download, and which
27 resides in coreutils/.git) currently weighs in at about 30MB.  So you
28 don't want to download it more often than necessary.  Once downloaded,
29 you can get incremental updates by running one of these commands from
30 inside your new coreutils/ directory:
32 If you have made *no* changes:
33     git pull
35 If you *have* made changes and mistakenly committed them to "master",
36 do the following to put your changes on a private branch, "br", and
37 to restore master to its unmodified (relative-to-upstream) state:
38     git checkout -b br
39     git checkout master
40     git reset --hard origin
42 Then "git pull" should work.
45 *Before* you commit changes
46 ===========================
48 In this project, we much prefer patches that automatically record
49 authorship.  That is important not just to give credit where due, but
50 also from a legal standpoint (see below).  To create author-annotated
51 patches with git, you must first tell git who you are.  That information
52 is best recorded in your ~/.gitconfig file.  Edit that file, creating
53 it if needed, and put your name and email address in place of these
54 example values:
56 [user]
57   name = Joe X. User
58   email = joe.user@example.com
61 Your first commit: the quick and dirty way
62 ==========================================
63 First of all, realize that to "commit" a change in git is a purely
64 local operation.  It affects only the local repository (the .git/ dir)
65 in your current coreutils/ hierarchy.
67 To try this out, modify a file or two.  If you create a new file, you'll
68 need to tell git about it with "git add new-file.c".  Commit all changes
69 with "git commit -a".  That prompts you for a log message, which should
70 include a one-line summary, a blank line, and ChangeLog-style entries
71 for all affected files.  More on that below.
73 Once your change is committed, you can create a proper patch that includes
74 a log message and authorship information as well as any permissions
75 changes.  Use this command to save that single, most-recent change set:
77   git format-patch --stdout -1 > DIFF
79 The trouble with this approach is that you've just checked in a change
80 (remember, it's only local) on the "master" branch, and that's where new
81 changes would normally appear when you pull the latest from "upstream".
82 When you "pull" from a remote repository to get the latest, your local
83 changes on "master" may well induce conflicts.   For this reason, you
84 may want to keep "master" free of any local changes, so that you can
85 use it to track unadulterated upstream sources.
87 However, if your cloned directory is for a one-shot patch submission and
88 you're going to remove it right afterwards, then this approach is fine.
89 Otherwise, for a more sustainable (and more generally useful, IMHO)
90 process, read on about "topic" branches.
93 Make your changes on a private "topic" branch
94 =============================================
95 So you checked out coreutils like this:
97   git clone git://git.sv.gnu.org/coreutils
99 Now, cd into the coreutils/ directory and run:
101   git checkout -b my-topic
103 That creates the my-topic branch and puts you on it.
104 To see which branch you're on, type "git branch".
105 Right after the clone, you were on "master" (aka the trunk).
106 To get back to the trunk, do this:
108   git checkout master
110 Note 1:
111     Be careful to run "git pull" only when on the "master" branch,
112     not when on a branch.  With newer versions of git, you can't cause
113     trouble if you forget, so this is a good reason to ensure you're
114     using 1.5.3.1 or newer.
116 Note 2:
117     It's best not to try to switch from one branch to another if
118     you have pending (uncommitted) changes.  Sometimes it works,
119     sometimes the checkout will fail, telling you that your local
120     modifications conflict with changes required to switch branches.
121     However, in any case, you will *not* lose your uncommitted changes.
123 Anyhow, get back onto your just-created branch:
125   git checkout my-topic
127 Now, modify some file and commit it:
129   git commit some-file.c
131 Personally, no matter what package I'm working on, I find it useful to
132 put the ChangeLog entries *only* in the commit log, initially, unless
133 I plan to commit/push right away.  Otherwise, I tend to get unnecessary
134 merge conflicts with each rebase (see below).  In coreutils, I've gone
135 a step further, and no longer maintain an explicit ChangeLog file in
136 version control.  Instead, in a git working directory, you can view
137 ChangeLog information via "git log".  However, each distribution tarball
138 does include a ChangeLog file that is automatically generated from the
139 git logs.
141 So, you've committed a change.  But it's only in your local repository,
142 and only on your "my-topic" branch.  Let's say you wait a day, and
143 then see that someone else changed something and pushed it to the
144 public repository.  Now, you want to update your trunk and "rebase"
145 your changes on the branch so that they are once again relative to the
146 tip of the trunk.  Currently, your branch is attached to the trunk at
147 the next-to-last change set.
149 First: update the trunk from the public repo:
150 [you've first made sure that "git diff" produces no output]
152   git checkout master
153   git pull
155 Now, return to your branch, and "rebase" relative to trunk (master):
157   git checkout my-topic
158   git rebase master
160 If there are no conflicts, this requires no more work from you.
161 However, let's say there was one in ChangeLog, since you didn't
162 follow my advice and modified it anyway.
163 git rebase will tell you there was a conflict and in which
164 file, and instruct you to resolve it and then resume with
165 "git rebase --continue" once that's done.
167 So you resolve as usual, by editing ChangeLog (which has the
168 usual conflict markers), then type "git rebase --continue".
169 That will fail, with a diagnostic telling you to mark
170 the file as "conflict resolved" by doing this:
172   git add ChangeLog
174 Then, finally, you can proceed (possibly onto more conflict resolution,
175 if there are conflicts in other files):
177   git rebase --continue
179 Once it finishes, your changes on the branch are now relative to
180 the tip of the trunk.
182 Now use git format-patch, as above.
185 Amending the most recent change on your private branch
186 ======================================================
187 Let's say you've just committed a change on your private
188 branch, and then realize that something about it is not right.
189 It's easy to adjust:
191   edit your files # this can include running "git add NEW" or "git rm BAD"
192   git commit --amend -a
193   git format-patch --stdout -1 > your-branch.diff
195 That replaces the most recent change-set with the revised one.
199 Coreutils-specific:
201 No more ChangeLog files
202 =======================
203 Do not modify any of the ChangeLog files in coreutils.  Starting in
204 2008, the policy changed.  Before, we would insert the exact same text
205 (or worse, sometimes slightly differing) into both the ChangeLog file
206 and the commit log.  Now we put that information only in the commit log,
207 and generate the top-level ChangeLog file from logs at "make dist" time.
208 As such, there are strict requirements on the form of the commit log
209 messages.
212 Commit log requirements
213 =======================
214 Your commit log should always start with a one-line summary, the second
215 line should be blank, and the remaining lines are usually ChangeLog-style
216 entries for all affected files.  However, it's fine -- even recommended --
217 to write a few lines of prose describing the change, when the summary
218 and ChangeLog entries don't give enough of the big picture.  Omit the
219 leading TABs that you're used to seeing in a "real" ChangeLog file, but
220 keep the maximum line length at 72 or smaller, so that the generated
221 ChangeLog lines, each with its leading TAB, will not exceed 80 columns.
222 As for the ChangeLog-style content, please follow these guidelines:
224   http://www.gnu.org/software/guile/changelogs/guile-changelogs_3.html
226 Try to make the summary line fit one of the following forms:
228   program_name: change-description
229   prog1, prog2: change-description
230   doc: change-description
231   tests: change-description
232   build: change-description
233   maint: change-description
235 If your commit fixes a bug, try to find the commit that introduced that
236 bug.  If you do that, add a note in your new commit log saying something
237 like "Introduced by commit v8.12-103-g54cbe6e." and add something like
238 [bug introduced in coreutils-8.13] in the corresponding NEWS blurb.
239 Assuming you found the bug in commit 54cbe6e6, "git describe 54cbe6e6"
240 will print the longer tag-relative string that you'll need.
241 Note that we used to use an 8-byte SHA1 prefix like "54cbe6e6", because
242 that was automatically rendered as a clickable link by "gitk", but with
243 git-1.7.10, the more descriptive version-containing "git describe" format
244 that we now require is also highlighted.
247 Curly braces: use judiciously
248 =============================
249 Omit the curly braces around an "if", "while", "for" etc. body only when
250 that body occupies a single line.  In every other case we require the braces.
251 This ensures that it is trivially easy to identify a single-*statement* loop:
252 each has only one *line* in its body.
254 Omitting braces with a single-line body is fine:
256      while (expr)
257        single_line_stmt ();
259 However, the moment your loop/if/else body extends onto a second line,
260 for whatever reason (even if it's just an added comment), then you should
261 add braces.  Otherwise, it would be too easy to insert a statement just
262 before that comment (without adding braces), thinking it is already a
263 multi-statement loop:
265      while (true)
266        /* comment... */      // BAD: multi-line body without braces
267        single_line_stmt ();
269 Do this instead:
271      while (true)
272        {  /* Always put braces around a multi-line body.  */
273          /* explanation... */
274          single_line_stmt ();
275        }
277 There is one exception: when the second body line is not at the same
278 indentation level as the first body line.
280      if (expr)
281        error (0, 0, _("a diagnostic that would make this line"
282                       " extend past the 80-column limit"));
284 It is safe to omit the braces in the code above, since the
285 further-indented second body line makes it obvious that this is still
286 a single-statement body.
288 To reiterate, don't do this:
290      if (expr)
291        while (expr_2)        // BAD: multi-line body without braces
292          {
293            ...
294          }
296 Do this, instead:
298      if (expr)
299        {
300          while (expr_2)
301            {
302              ...
303            }
304        }
306 However, there is one exception in the other direction, when even a
307 one-line block should have braces.  That occurs when that one-line,
308 brace-less block is an "else" block, and the corresponding "then" block
309 *does* use braces.  In that case, either put braces around the "else"
310 block, or negate the "if"-condition and swap the bodies, putting the
311 one-line block first and making the longer, multi-line block be the
312 "else" block.
314     if (expr)
315       {
316         ...
317         ...
318       }
319     else
320       x = y;    // BAD: braceless "else" with braced "then"
322 This is preferred, especially when the multi-line body is more than a
323 few lines long, because it is easier to read and grasp the semantics of
324 an if-then-else block when the simpler block occurs first, rather than
325 after the more involved block:
327     if (!expr)
328       x = y;                  /* more readable */
329     else
330       {
331         ...
332         ...
333       }
335 If you'd rather not negate the condition, then add braces:
337     if (expr)
338       {
339         ...
340         ...
341       }
342     else
343       {
344         x = y;
345       }
348 Use SPACE-only indentation in all[*] files
349 ==========================================
350 We use space-only indentation in nearly all files.
351 If you use Emacs and your coreutils working directory name matches,
352 this code enables the right mode:
354   ;; In coreutils, indent with spaces everywhere (not TABs).
355   ;; Exceptions: Makefile and ChangeLog modes.
356   (add-hook 'find-file-hook '(lambda ()
357     (if (and buffer-file-name
358              (string-match "/coreutils\\>" (buffer-file-name))
359              (not (string-equal mode-name "Change Log"))
360              (not (string-equal mode-name "Makefile")))
361         (setq indent-tabs-mode nil))))
363 If you use vim (7+ compiled with autocommands), and coreutils working
364 directory name also matches, add the following in ~/.vimrc:
366   " Set GNU style indentation, spaces instead of TABs
367   function! CoreutilsIndent()
368       " Check if 'coreutils' is part of the current working directory
369       if match(getcwd(), "coreutils") > 0
370           " The next 3 lines below set the GNU indentation
371           setlocal cinoptions=>4,n-2,{2,^-2,:2,=2,g0,h2,p5,t0,+2,(0,u0,w1,m1
372           setlocal shiftwidth=2
373           setlocal tabstop=8
374           " Coreutils specific, expand TABs with spaces
375           setlocal expandtab
376       endif
377   endfunction
379   autocmd BufEnter *.c,*.h call CoreutilsIndent()
381 [*] Makefile and ChangeLog files are exempt, of course.
384 Send patches to the address listed in --help output
385 ===================================================
386 Please follow the guidelines in the "Sending your patches." section of
387 git's own SubmittingPatches:
389   http://git.kernel.org/?p=git/git.git;a=blob;f=Documentation/SubmittingPatches
392 Add documentation
393 =================
394 If you add a feature or change some user-visible aspect of a program,
395 document it.  If you add an option, document it both in --help output
396 (i.e., in the usage function that generates the --help output) and in
397 doc/*.texi.  The man pages are generated from --help output, so
398 you shouldn't need to change anything under man/.  User-visible changes
399 are usually documented in NEWS, too.
401 When writing prose (documentation, comments, log entries), use an
402 active voice, not a passive one.  I.e., say "print the frobnozzle",
403 not "the frobnozzle will be printed".
405 Please add comments per the GNU Coding Standard:
406   http://www.gnu.org/prep/standards/html_node/Comments.html
409 Minor syntactic preferences
410 ===========================
411 [I hesitate to write this one down, because it appears to be an
412  acquired taste, at least for native-English speakers.  It seems odd
413  (if not truly backwards) to nearly anyone who doesn't have a strong
414  mathematics background and perhaps a streak of something odd in their
415  character ;-) ]
416 In writing arithmetic comparisons, use "<" and "<=" rather than
417 ">" and ">=".  For some justification, read this:
418   http://thread.gmane.org/gmane.comp.version-control.git/3903/focus=4126
420 const placement:
421 Write "Type const *var", not "const Type *var".
422 FIXME: dig up justification
425 Be nice to translators
426 ======================
427 Don't change translatable strings if you can avoid it.
428 If you must rearrange individual lines (e.g., in multi-line --help
429 strings), extract and create new strings, rather than extracting
430 and moving into existing blocks.  This avoids making unnecessary
431 work for translators.
434 Add tests
435 ==========
436 Nearly every significant change must be accompanied by a test suite
437 addition that exercises it.  If you fix a bug, add at least one test that
438 fails without the patch, but that succeeds once your patch is applied.
439 If you add a feature, add tests to exercise as much of the new code
440 as possible. Note to run tests/misc/new-test in isolation you can do:
442   (cd tests && make check TESTS=misc/new-test VERBOSE=yes)
444 Variables that are significant for tests with their default values are:
446   VERBOSE=yes
447   RUN_EXPENSIVE_TESTS=no
448   RUN_VERY_EXPENSIVE_TESTS=no
449   SHELL=/bin/sh
450   NON_ROOT_USERNAME=nobody
451   NON_ROOT_GROUP=$(id -g $NON_ROOT_USERNAME)
452   COREUTILS_GROUPS=$(id -G)
454 There are hundreds of tests in the tests/ directories.  You can use
455 tests/sample-test as a template, or one of the various Perl-based ones
456 in tests/misc.
458 If writing tests is not your thing, don't worry too much about it,
459 but do provide scenarios, input/output pairs, or whatever, along with
460 examples of running the tool to demonstrate the new or changed feature,
461 and someone else will massage that into a test (writing portable tests
462 can be a challenge).
465 Copyright assignment
466 ====================
467 If your change is significant (i.e., if it adds more than ~10 lines),
468 then you'll have to have a copyright assignment on file with the FSF.
469 Since that involves first an email exchange between you and the FSF,
470 and then the exchange (FSF to you, then back) of an actual sheet of paper
471 with your signature on it, and finally, some administrative processing
472 in Boston, the process can take a few weeks.
474 The forms to choose from are in gnulib's doc/Copyright/ directory.
475 If you want to assign a single change, you should use the file,
476 doc/Copyright/request-assign.changes:
478     http://www.gnu.org/software/gnulib/Copyright/request-assign.changes
480 If you would like to assign past and future contributions to a project,
481 you'd use doc/Copyright/request-assign.future:
483     http://www.gnu.org/software/gnulib/Copyright/request-assign.future
485 You may make assignments for up to four projects at a time.
487 In case you're wondering why we bother with all of this, read this:
489     http://www.gnu.org/licenses/why-assign.html
492 Run "make syntax-check", or even "make distcheck"
493 ================================================
494 Making either of those targets runs many integrity and
495 project-specific policy-conformance tests.  For example, the former
496 ensures that you add no trailing blanks and no uses of certain deprecated
497 functions.  The latter performs all "syntax-check" tests, and also
498 ensures that the build completes with no warnings when using a certain
499 set of gcc -W... options.  Don't even bother running "make distcheck"
500 unless you have a reasonably up to date installation including recent
501 versions of gcc and the linux kernel, and modern GNU tools.
504 Ensure that your changes are indented properly.
505 ===============================================
506 Format the code the way GNU indent does.
507 Filtering most source files through "indent --no-tabs" should
508 induce no change in indentation.  Try not to add any more.
511 Avoid trailing white space
512 ==========================
513 You may notice that the only trailing blanks in coreutils'
514 version-controlled files are in a single directory: tests/pr,
515 which contains expected output from various invocations of pr.
517 Do not add any more trailing blanks anywhere.  While "make syntax-check"
518 will alert you if you slip up, it's better to nip any problem in the
519 bud, as you're typing.  A good way to help you adapt to this rule is
520 to configure your editor to highlight any offending characters in the
521 files you edit.  If you use Emacs, customize its font-lock mode
522 or use its WhiteSpace mode:
524     http://www.emacswiki.org/emacs/WhiteSpace
526 If you use vim, add this to ~/.vimrc:
528     let c_space_errors=1
529     highlight RedundantSpaces ctermbg=red guibg=red
530     match RedundantSpaces /\s\+$\| \+\ze\t/
533 Git can help too, by stopping you from committing any change that would
534 add trailing blanks.  The example pre-commit hook contains code to check
535 for trailing whitespace and spaces before tabs; enable it by moving it
536 to the right place and making sure it is executable:
538     mv .git/hooks/pre-commit.sample .git/hooks/pre-commit
540 With a repository created by git-1.5.6 or older, use this command:
542     chmod +x .git/hooks/pre-commit
544 To manually check for whitespace errors before committing, you can use
546     git diff --check
548 Git also has some settings to enable suitable internal whitespace checks.
549 See the manpage for git-apply for details.
552 -------------------------------------------
554 Miscellaneous useful git commands
555 =================================
557   * gitk: give a graphical view of the revision graph of the current branch
558   * gitk --all: same, but display all branches
559   * git log: to get most of the same info in text form
560   * git log -p: same as above, but with diffs
561   * git log -p SOME_FILE: same as above, but limit to SOME_FILE
562   * git log -p -2 SOME_FILE: same as above, but print only two deltas
563   * git log -p -1: print the most recently committed change set
564   * git format-patch --stdout -1 > FILE: output the most recently committed
565       change set, in a format suitable to be submitted and/or applied via
566       "git am FILE".
567   * git reset --soft HEAD^: Commit the delta required to restore
568       state to the revision just before HEAD (i.e., next-to-last).
569   * git rebase -i master: run this from on a branch, and it gives
570       you an interface with which you can reorder and modify arbitrary
571       change sets on that branch.
573   * if you "misplace" a change set, i.e., via git reset --hard ..., so that
574     it's no longer reachable by any branch, you can use "git fsck" to find
575     its SHA1 and then tag it or cherry-pick it onto an existing branch.
576     For example, run this:
577       git fsck --lost-found HEAD && cd .git/lost-found/commit \
578         && for i in *; do git show $i|grep SOME_IDENTIFYING_STRING \
579         && echo $i; done
580     The "git fsck ..." command creates the .git/lost-found/... hierarchy
581     listing all unreachable objects.  Then the for loop
582     print SHA1s for commits that match via log or patch.
583     For example, say that found 556fbb57216b119155cdda824c98dc579b8121c8,
584     you could run "git show 556fbb57216b119" to examine the change set,
585     or "git checkout -b found 556fbb5721" to give it a branch name.
586     Finally, you might run "git checkout master && git cherry-pick 556fbb5721"
587     to put that change on the tip of "master".
589 -------------------------------------------
591 Finding things to do
592 ====================
593 If you don't know where to start, check out the TODO file for projects
594 that look like they're at your skill-/interest-level.  Another good
595 option is always to improve tests.  You never know what you might
596 uncover when you improve test coverage, and even if you don't find
597 any bugs your contribution is sure to be appreciated.
599 A good way to quickly assess current test coverage is to use "lcov"
600 to generate HTML coverage reports.  Follow these steps:
602   # configure with coverage information
603   ./configure CFLAGS="-g -fprofile-arcs -ftest-coverage"
604   make
605   # run whatever tests you want, i.e.:
606   make check
607   # run lcov
608   lcov -t coreutils -q -d lib -b lib -o lib.lcov -c
609   lcov -t coreutils -q -d src -b src -o src.lcov -c
610   # generate HTML from the output
611   genhtml -p `pwd` -t coreutils -q --output-directory lcov-html *.lcov
613 Then just open the index.html file (in the generated lcov-html directory)
614 in your favorite web browser.
616 ========================================================================
617 Copyright (C) 2009-2012 Free Software Foundation, Inc.
619 Permission is granted to copy, distribute and/or modify this document
620 under the terms of the GNU Free Documentation License, Version 1.3 or
621 any later version published by the Free Software Foundation; with no
622 Invariant Sections, with no Front-Cover Texts, and with no Back-Cover
623 Texts.  A copy of the license is included in the "GNU Free
624 Documentation License" file as part of this distribution.