Merge tag 'trace-printf-v6.13' of git://git.kernel.org/pub/scm/linux/kernel/git/trace...
[drm/drm-misc.git] / Documentation / block / writeback_cache_control.rst
blobc3707d071780458425d89760f23e648186ccf94e
1 ==========================================
2 Explicit volatile write back cache control
3 ==========================================
5 Introduction
6 ------------
8 Many storage devices, especially in the consumer market, come with volatile
9 write back caches.  That means the devices signal I/O completion to the
10 operating system before data actually has hit the non-volatile storage.  This
11 behavior obviously speeds up various workloads, but it means the operating
12 system needs to force data out to the non-volatile storage when it performs
13 a data integrity operation like fsync, sync or an unmount.
15 The Linux block layer provides two simple mechanisms that let filesystems
16 control the caching behavior of the storage device.  These mechanisms are
17 a forced cache flush, and the Force Unit Access (FUA) flag for requests.
20 Explicit cache flushes
21 ----------------------
23 The REQ_PREFLUSH flag can be OR ed into the r/w flags of a bio submitted from
24 the filesystem and will make sure the volatile cache of the storage device
25 has been flushed before the actual I/O operation is started.  This explicitly
26 guarantees that previously completed write requests are on non-volatile
27 storage before the flagged bio starts. In addition the REQ_PREFLUSH flag can be
28 set on an otherwise empty bio structure, which causes only an explicit cache
29 flush without any dependent I/O.  It is recommend to use
30 the blkdev_issue_flush() helper for a pure cache flush.
33 Forced Unit Access
34 ------------------
36 The REQ_FUA flag can be OR ed into the r/w flags of a bio submitted from the
37 filesystem and will make sure that I/O completion for this request is only
38 signaled after the data has been committed to non-volatile storage.
41 Implementation details for filesystems
42 --------------------------------------
44 Filesystems can simply set the REQ_PREFLUSH and REQ_FUA bits and do not have to
45 worry if the underlying devices need any explicit cache flushing and how
46 the Forced Unit Access is implemented.  The REQ_PREFLUSH and REQ_FUA flags
47 may both be set on a single bio.
49 Feature settings for block drivers
50 ----------------------------------
52 For devices that do not support volatile write caches there is no driver
53 support required, the block layer completes empty REQ_PREFLUSH requests before
54 entering the driver and strips off the REQ_PREFLUSH and REQ_FUA bits from
55 requests that have a payload.
57 For devices with volatile write caches the driver needs to tell the block layer
58 that it supports flushing caches by setting the
60    BLK_FEAT_WRITE_CACHE
62 flag in the queue_limits feature field.  For devices that also support the FUA
63 bit the block layer needs to be told to pass on the REQ_FUA bit by also setting
64 the
66    BLK_FEAT_FUA
68 flag in the features field of the queue_limits structure.
70 Implementation details for bio based block drivers
71 --------------------------------------------------
73 For bio based drivers the REQ_PREFLUSH and REQ_FUA bit are simply passed on to
74 the driver if the driver sets the BLK_FEAT_WRITE_CACHE flag and the driver
75 needs to handle them.
77 *NOTE*: The REQ_FUA bit also gets passed on when the BLK_FEAT_FUA flags is
78 _not_ set.  Any bio based driver that sets BLK_FEAT_WRITE_CACHE also needs to
79 handle REQ_FUA.
81 For remapping drivers the REQ_FUA bits need to be propagated to underlying
82 devices, and a global flush needs to be implemented for bios with the
83 REQ_PREFLUSH bit set.
85 Implementation details for blk-mq drivers
86 -----------------------------------------
88 When the BLK_FEAT_WRITE_CACHE flag is set, REQ_OP_WRITE | REQ_PREFLUSH requests
89 with a payload are automatically turned into a sequence of a REQ_OP_FLUSH
90 request followed by the actual write by the block layer.
92 When the BLK_FEAT_FUA flags is set, the REQ_FUA bit is simply passed on for the
93 REQ_OP_WRITE request, else a REQ_OP_FLUSH request is sent by the block layer
94 after the completion of the write request for bio submissions with the REQ_FUA
95 bit set.