include: convert various register fcns to macros to avoid include chaining
[linux-2.6/next.git] / Documentation / sysctl / kernel.txt
blob704e474a93df8539e093aa3569bb889faa1adb70
1 Documentation for /proc/sys/kernel/*    kernel version 2.2.10
2         (c) 1998, 1999,  Rik van Riel <riel@nl.linux.org>
3         (c) 2009,        Shen Feng<shen@cn.fujitsu.com>
5 For general info and legal blurb, please look in README.
7 ==============================================================
9 This file contains documentation for the sysctl files in
10 /proc/sys/kernel/ and is valid for Linux kernel version 2.2.
12 The files in this directory can be used to tune and monitor
13 miscellaneous and general things in the operation of the Linux
14 kernel. Since some of the files _can_ be used to screw up your
15 system, it is advisable to read both documentation and source
16 before actually making adjustments.
18 Currently, these files might (depending on your configuration)
19 show up in /proc/sys/kernel:
21 - acct
22 - acpi_video_flags
23 - auto_msgmni
24 - bootloader_type            [ X86 only ]
25 - bootloader_version         [ X86 only ]
26 - callhome                   [ S390 only ]
27 - core_pattern
28 - core_pipe_limit
29 - core_uses_pid
30 - ctrl-alt-del
31 - dmesg_restrict
32 - domainname
33 - hostname
34 - hotplug
35 - kptr_restrict
36 - kstack_depth_to_print       [ X86 only ]
37 - l2cr                        [ PPC only ]
38 - modprobe                    ==> Documentation/debugging-modules.txt
39 - modules_disabled
40 - msgmax
41 - msgmnb
42 - msgmni
43 - nmi_watchdog
44 - osrelease
45 - ostype
46 - overflowgid
47 - overflowuid
48 - panic
49 - panic_on_oops
50 - panic_on_unrecovered_nmi
51 - pid_max
52 - powersave-nap               [ PPC only ]
53 - printk
54 - printk_delay
55 - printk_ratelimit
56 - printk_ratelimit_burst
57 - randomize_va_space
58 - real-root-dev               ==> Documentation/initrd.txt
59 - reboot-cmd                  [ SPARC only ]
60 - rtsig-max
61 - rtsig-nr
62 - sem
63 - sg-big-buff                 [ generic SCSI device (sg) ]
64 - shm_rmid_forced
65 - shmall
66 - shmmax                      [ sysv ipc ]
67 - shmmni
68 - softlockup_thresh
69 - stop-a                      [ SPARC only ]
70 - sysrq                       ==> Documentation/sysrq.txt
71 - tainted
72 - threads-max
73 - unknown_nmi_panic
74 - version
76 ==============================================================
78 acct:
80 highwater lowwater frequency
82 If BSD-style process accounting is enabled these values control
83 its behaviour. If free space on filesystem where the log lives
84 goes below <lowwater>% accounting suspends. If free space gets
85 above <highwater>% accounting resumes. <Frequency> determines
86 how often do we check the amount of free space (value is in
87 seconds). Default:
88 4 2 30
89 That is, suspend accounting if there left <= 2% free; resume it
90 if we got >=4%; consider information about amount of free space
91 valid for 30 seconds.
93 ==============================================================
95 acpi_video_flags:
97 flags
99 See Doc*/kernel/power/video.txt, it allows mode of video boot to be
100 set during run time.
102 ==============================================================
104 auto_msgmni:
106 Enables/Disables automatic recomputing of msgmni upon memory add/remove
107 or upon ipc namespace creation/removal (see the msgmni description
108 above). Echoing "1" into this file enables msgmni automatic recomputing.
109 Echoing "0" turns it off. auto_msgmni default value is 1.
112 ==============================================================
114 bootloader_type:
116 x86 bootloader identification
118 This gives the bootloader type number as indicated by the bootloader,
119 shifted left by 4, and OR'd with the low four bits of the bootloader
120 version.  The reason for this encoding is that this used to match the
121 type_of_loader field in the kernel header; the encoding is kept for
122 backwards compatibility.  That is, if the full bootloader type number
123 is 0x15 and the full version number is 0x234, this file will contain
124 the value 340 = 0x154.
126 See the type_of_loader and ext_loader_type fields in
127 Documentation/x86/boot.txt for additional information.
129 ==============================================================
131 bootloader_version:
133 x86 bootloader version
135 The complete bootloader version number.  In the example above, this
136 file will contain the value 564 = 0x234.
138 See the type_of_loader and ext_loader_ver fields in
139 Documentation/x86/boot.txt for additional information.
141 ==============================================================
143 callhome:
145 Controls the kernel's callhome behavior in case of a kernel panic.
147 The s390 hardware allows an operating system to send a notification
148 to a service organization (callhome) in case of an operating system panic.
150 When the value in this file is 0 (which is the default behavior)
151 nothing happens in case of a kernel panic. If this value is set to "1"
152 the complete kernel oops message is send to the IBM customer service
153 organization in case the mainframe the Linux operating system is running
154 on has a service contract with IBM.
156 ==============================================================
158 core_pattern:
160 core_pattern is used to specify a core dumpfile pattern name.
161 . max length 128 characters; default value is "core"
162 . core_pattern is used as a pattern template for the output filename;
163   certain string patterns (beginning with '%') are substituted with
164   their actual values.
165 . backward compatibility with core_uses_pid:
166         If core_pattern does not include "%p" (default does not)
167         and core_uses_pid is set, then .PID will be appended to
168         the filename.
169 . corename format specifiers:
170         %<NUL>  '%' is dropped
171         %%      output one '%'
172         %p      pid
173         %u      uid
174         %g      gid
175         %s      signal number
176         %t      UNIX time of dump
177         %h      hostname
178         %e      executable filename (may be shortened)
179         %E      executable path
180         %<OTHER> both are dropped
181 . If the first character of the pattern is a '|', the kernel will treat
182   the rest of the pattern as a command to run.  The core dump will be
183   written to the standard input of that program instead of to a file.
185 ==============================================================
187 core_pipe_limit:
189 This sysctl is only applicable when core_pattern is configured to pipe
190 core files to a user space helper (when the first character of
191 core_pattern is a '|', see above).  When collecting cores via a pipe
192 to an application, it is occasionally useful for the collecting
193 application to gather data about the crashing process from its
194 /proc/pid directory.  In order to do this safely, the kernel must wait
195 for the collecting process to exit, so as not to remove the crashing
196 processes proc files prematurely.  This in turn creates the
197 possibility that a misbehaving userspace collecting process can block
198 the reaping of a crashed process simply by never exiting.  This sysctl
199 defends against that.  It defines how many concurrent crashing
200 processes may be piped to user space applications in parallel.  If
201 this value is exceeded, then those crashing processes above that value
202 are noted via the kernel log and their cores are skipped.  0 is a
203 special value, indicating that unlimited processes may be captured in
204 parallel, but that no waiting will take place (i.e. the collecting
205 process is not guaranteed access to /proc/<crashing pid>/).  This
206 value defaults to 0.
208 ==============================================================
210 core_uses_pid:
212 The default coredump filename is "core".  By setting
213 core_uses_pid to 1, the coredump filename becomes core.PID.
214 If core_pattern does not include "%p" (default does not)
215 and core_uses_pid is set, then .PID will be appended to
216 the filename.
218 ==============================================================
220 ctrl-alt-del:
222 When the value in this file is 0, ctrl-alt-del is trapped and
223 sent to the init(1) program to handle a graceful restart.
224 When, however, the value is > 0, Linux's reaction to a Vulcan
225 Nerve Pinch (tm) will be an immediate reboot, without even
226 syncing its dirty buffers.
228 Note: when a program (like dosemu) has the keyboard in 'raw'
229 mode, the ctrl-alt-del is intercepted by the program before it
230 ever reaches the kernel tty layer, and it's up to the program
231 to decide what to do with it.
233 ==============================================================
235 dmesg_restrict:
237 This toggle indicates whether unprivileged users are prevented
238 from using dmesg(8) to view messages from the kernel's log buffer.
239 When dmesg_restrict is set to (0) there are no restrictions. When
240 dmesg_restrict is set set to (1), users must have CAP_SYSLOG to use
241 dmesg(8).
243 The kernel config option CONFIG_SECURITY_DMESG_RESTRICT sets the
244 default value of dmesg_restrict.
246 ==============================================================
248 domainname & hostname:
250 These files can be used to set the NIS/YP domainname and the
251 hostname of your box in exactly the same way as the commands
252 domainname and hostname, i.e.:
253 # echo "darkstar" > /proc/sys/kernel/hostname
254 # echo "mydomain" > /proc/sys/kernel/domainname
255 has the same effect as
256 # hostname "darkstar"
257 # domainname "mydomain"
259 Note, however, that the classic darkstar.frop.org has the
260 hostname "darkstar" and DNS (Internet Domain Name Server)
261 domainname "frop.org", not to be confused with the NIS (Network
262 Information Service) or YP (Yellow Pages) domainname. These two
263 domain names are in general different. For a detailed discussion
264 see the hostname(1) man page.
266 ==============================================================
268 hotplug:
270 Path for the hotplug policy agent.
271 Default value is "/sbin/hotplug".
273 ==============================================================
275 kptr_restrict:
277 This toggle indicates whether restrictions are placed on
278 exposing kernel addresses via /proc and other interfaces.  When
279 kptr_restrict is set to (0), there are no restrictions.  When
280 kptr_restrict is set to (1), the default, kernel pointers
281 printed using the %pK format specifier will be replaced with 0's
282 unless the user has CAP_SYSLOG.  When kptr_restrict is set to
283 (2), kernel pointers printed using %pK will be replaced with 0's
284 regardless of privileges.
286 ==============================================================
288 kstack_depth_to_print: (X86 only)
290 Controls the number of words to print when dumping the raw
291 kernel stack.
293 ==============================================================
295 l2cr: (PPC only)
297 This flag controls the L2 cache of G3 processor boards. If
298 0, the cache is disabled. Enabled if nonzero.
300 ==============================================================
302 modules_disabled:
304 A toggle value indicating if modules are allowed to be loaded
305 in an otherwise modular kernel.  This toggle defaults to off
306 (0), but can be set true (1).  Once true, modules can be
307 neither loaded nor unloaded, and the toggle cannot be set back
308 to false.
310 ==============================================================
312 nmi_watchdog:
314 Enables/Disables the NMI watchdog on x86 systems. When the value is
315 non-zero the NMI watchdog is enabled and will continuously test all
316 online cpus to determine whether or not they are still functioning
317 properly. Currently, passing "nmi_watchdog=" parameter at boot time is
318 required for this function to work.
320 If LAPIC NMI watchdog method is in use (nmi_watchdog=2 kernel
321 parameter), the NMI watchdog shares registers with oprofile. By
322 disabling the NMI watchdog, oprofile may have more registers to
323 utilize.
325 ==============================================================
327 osrelease, ostype & version:
329 # cat osrelease
330 2.1.88
331 # cat ostype
332 Linux
333 # cat version
334 #5 Wed Feb 25 21:49:24 MET 1998
336 The files osrelease and ostype should be clear enough. Version
337 needs a little more clarification however. The '#5' means that
338 this is the fifth kernel built from this source base and the
339 date behind it indicates the time the kernel was built.
340 The only way to tune these values is to rebuild the kernel :-)
342 ==============================================================
344 overflowgid & overflowuid:
346 if your architecture did not always support 32-bit UIDs (i.e. arm,
347 i386, m68k, sh, and sparc32), a fixed UID and GID will be returned to
348 applications that use the old 16-bit UID/GID system calls, if the
349 actual UID or GID would exceed 65535.
351 These sysctls allow you to change the value of the fixed UID and GID.
352 The default is 65534.
354 ==============================================================
356 panic:
358 The value in this file represents the number of seconds the kernel
359 waits before rebooting on a panic. When you use the software watchdog,
360 the recommended setting is 60.
362 ==============================================================
364 panic_on_unrecovered_nmi:
366 The default Linux behaviour on an NMI of either memory or unknown is
367 to continue operation. For many environments such as scientific
368 computing it is preferable that the box is taken out and the error
369 dealt with than an uncorrected parity/ECC error get propagated.
371 A small number of systems do generate NMI's for bizarre random reasons
372 such as power management so the default is off. That sysctl works like
373 the existing panic controls already in that directory.
375 ==============================================================
377 panic_on_oops:
379 Controls the kernel's behaviour when an oops or BUG is encountered.
381 0: try to continue operation
383 1: panic immediately.  If the `panic' sysctl is also non-zero then the
384    machine will be rebooted.
386 ==============================================================
388 pid_max:
390 PID allocation wrap value.  When the kernel's next PID value
391 reaches this value, it wraps back to a minimum PID value.
392 PIDs of value pid_max or larger are not allocated.
394 ==============================================================
396 powersave-nap: (PPC only)
398 If set, Linux-PPC will use the 'nap' mode of powersaving,
399 otherwise the 'doze' mode will be used.
401 ==============================================================
403 printk:
405 The four values in printk denote: console_loglevel,
406 default_message_loglevel, minimum_console_loglevel and
407 default_console_loglevel respectively.
409 These values influence printk() behavior when printing or
410 logging error messages. See 'man 2 syslog' for more info on
411 the different loglevels.
413 - console_loglevel: messages with a higher priority than
414   this will be printed to the console
415 - default_message_loglevel: messages without an explicit priority
416   will be printed with this priority
417 - minimum_console_loglevel: minimum (highest) value to which
418   console_loglevel can be set
419 - default_console_loglevel: default value for console_loglevel
421 ==============================================================
423 printk_delay:
425 Delay each printk message in printk_delay milliseconds
427 Value from 0 - 10000 is allowed.
429 ==============================================================
431 printk_ratelimit:
433 Some warning messages are rate limited. printk_ratelimit specifies
434 the minimum length of time between these messages (in jiffies), by
435 default we allow one every 5 seconds.
437 A value of 0 will disable rate limiting.
439 ==============================================================
441 printk_ratelimit_burst:
443 While long term we enforce one message per printk_ratelimit
444 seconds, we do allow a burst of messages to pass through.
445 printk_ratelimit_burst specifies the number of messages we can
446 send before ratelimiting kicks in.
448 ==============================================================
450 randomize_va_space:
452 This option can be used to select the type of process address
453 space randomization that is used in the system, for architectures
454 that support this feature.
456 0 - Turn the process address space randomization off.  This is the
457     default for architectures that do not support this feature anyways,
458     and kernels that are booted with the "norandmaps" parameter.
460 1 - Make the addresses of mmap base, stack and VDSO page randomized.
461     This, among other things, implies that shared libraries will be
462     loaded to random addresses.  Also for PIE-linked binaries, the
463     location of code start is randomized.  This is the default if the
464     CONFIG_COMPAT_BRK option is enabled.
466 2 - Additionally enable heap randomization.  This is the default if
467     CONFIG_COMPAT_BRK is disabled.
469     There are a few legacy applications out there (such as some ancient
470     versions of libc.so.5 from 1996) that assume that brk area starts
471     just after the end of the code+bss.  These applications break when
472     start of the brk area is randomized.  There are however no known
473     non-legacy applications that would be broken this way, so for most
474     systems it is safe to choose full randomization.
476     Systems with ancient and/or broken binaries should be configured
477     with CONFIG_COMPAT_BRK enabled, which excludes the heap from process
478     address space randomization.
480 ==============================================================
482 reboot-cmd: (Sparc only)
484 ??? This seems to be a way to give an argument to the Sparc
485 ROM/Flash boot loader. Maybe to tell it what to do after
486 rebooting. ???
488 ==============================================================
490 rtsig-max & rtsig-nr:
492 The file rtsig-max can be used to tune the maximum number
493 of POSIX realtime (queued) signals that can be outstanding
494 in the system.
496 rtsig-nr shows the number of RT signals currently queued.
498 ==============================================================
500 sg-big-buff:
502 This file shows the size of the generic SCSI (sg) buffer.
503 You can't tune it just yet, but you could change it on
504 compile time by editing include/scsi/sg.h and changing
505 the value of SG_BIG_BUFF.
507 There shouldn't be any reason to change this value. If
508 you can come up with one, you probably know what you
509 are doing anyway :)
511 ==============================================================
513 shmmax:
515 This value can be used to query and set the run time limit
516 on the maximum shared memory segment size that can be created.
517 Shared memory segments up to 1Gb are now supported in the
518 kernel.  This value defaults to SHMMAX.
520 ==============================================================
522 shm_rmid_forced:
524 Linux lets you set resource limits, including how much memory one
525 process can consume, via setrlimit(2).  Unfortunately, shared memory
526 segments are allowed to exist without association with any process, and
527 thus might not be counted against any resource limits.  If enabled,
528 shared memory segments are automatically destroyed when their attach
529 count becomes zero after a detach or a process termination.  It will
530 also destroy segments that were created, but never attached to, on exit
531 from the process.  The only use left for IPC_RMID is to immediately
532 destroy an unattached segment.  Of course, this breaks the way things are
533 defined, so some applications might stop working.  Note that this
534 feature will do you no good unless you also configure your resource
535 limits (in particular, RLIMIT_AS and RLIMIT_NPROC).  Most systems don't
536 need this.
538 Note that if you change this from 0 to 1, already created segments
539 without users and with a dead originative process will be destroyed.
541 ==============================================================
543 softlockup_thresh:
545 This value can be used to lower the softlockup tolerance threshold.  The
546 default threshold is 60 seconds.  If a cpu is locked up for 60 seconds,
547 the kernel complains.  Valid values are 1-60 seconds.  Setting this
548 tunable to zero will disable the softlockup detection altogether.
550 ==============================================================
552 tainted:
554 Non-zero if the kernel has been tainted.  Numeric values, which
555 can be ORed together:
557    1 - A module with a non-GPL license has been loaded, this
558        includes modules with no license.
559        Set by modutils >= 2.4.9 and module-init-tools.
560    2 - A module was force loaded by insmod -f.
561        Set by modutils >= 2.4.9 and module-init-tools.
562    4 - Unsafe SMP processors: SMP with CPUs not designed for SMP.
563    8 - A module was forcibly unloaded from the system by rmmod -f.
564   16 - A hardware machine check error occurred on the system.
565   32 - A bad page was discovered on the system.
566   64 - The user has asked that the system be marked "tainted".  This
567        could be because they are running software that directly modifies
568        the hardware, or for other reasons.
569  128 - The system has died.
570  256 - The ACPI DSDT has been overridden with one supplied by the user
571         instead of using the one provided by the hardware.
572  512 - A kernel warning has occurred.
573 1024 - A module from drivers/staging was loaded.
575 ==============================================================
577 unknown_nmi_panic:
579 The value in this file affects behavior of handling NMI. When the
580 value is non-zero, unknown NMI is trapped and then panic occurs. At
581 that time, kernel debugging information is displayed on console.
583 NMI switch that most IA32 servers have fires unknown NMI up, for
584 example.  If a system hangs up, try pressing the NMI switch.