gpio: rcar: Fix runtime PM imbalance on error
[linux/fpc-iii.git] / Documentation / core-api / refcount-vs-atomic.rst
blob79a009ce11df9fe9c2df9bcad8f2a697469392b9
1 ===================================
2 refcount_t API compared to atomic_t
3 ===================================
5 .. contents:: :local:
7 Introduction
8 ============
10 The goal of refcount_t API is to provide a minimal API for implementing
11 an object's reference counters. While a generic architecture-independent
12 implementation from lib/refcount.c uses atomic operations underneath,
13 there are a number of differences between some of the ``refcount_*()`` and
14 ``atomic_*()`` functions with regards to the memory ordering guarantees.
15 This document outlines the differences and provides respective examples
16 in order to help maintainers validate their code against the change in
17 these memory ordering guarantees.
19 The terms used through this document try to follow the formal LKMM defined in
20 tools/memory-model/Documentation/explanation.txt.
22 memory-barriers.txt and atomic_t.txt provide more background to the
23 memory ordering in general and for atomic operations specifically.
25 Relevant types of memory ordering
26 =================================
28 .. note:: The following section only covers some of the memory
29    ordering types that are relevant for the atomics and reference
30    counters and used through this document. For a much broader picture
31    please consult memory-barriers.txt document.
33 In the absence of any memory ordering guarantees (i.e. fully unordered)
34 atomics & refcounters only provide atomicity and
35 program order (po) relation (on the same CPU). It guarantees that
36 each ``atomic_*()`` and ``refcount_*()`` operation is atomic and instructions
37 are executed in program order on a single CPU.
38 This is implemented using READ_ONCE()/WRITE_ONCE() and
39 compare-and-swap primitives.
41 A strong (full) memory ordering guarantees that all prior loads and
42 stores (all po-earlier instructions) on the same CPU are completed
43 before any po-later instruction is executed on the same CPU.
44 It also guarantees that all po-earlier stores on the same CPU
45 and all propagated stores from other CPUs must propagate to all
46 other CPUs before any po-later instruction is executed on the original
47 CPU (A-cumulative property). This is implemented using smp_mb().
49 A RELEASE memory ordering guarantees that all prior loads and
50 stores (all po-earlier instructions) on the same CPU are completed
51 before the operation. It also guarantees that all po-earlier
52 stores on the same CPU and all propagated stores from other CPUs
53 must propagate to all other CPUs before the release operation
54 (A-cumulative property). This is implemented using
55 smp_store_release().
57 An ACQUIRE memory ordering guarantees that all post loads and
58 stores (all po-later instructions) on the same CPU are
59 completed after the acquire operation. It also guarantees that all
60 po-later stores on the same CPU must propagate to all other CPUs
61 after the acquire operation executes. This is implemented using
62 smp_acquire__after_ctrl_dep().
64 A control dependency (on success) for refcounters guarantees that
65 if a reference for an object was successfully obtained (reference
66 counter increment or addition happened, function returned true),
67 then further stores are ordered against this operation.
68 Control dependency on stores are not implemented using any explicit
69 barriers, but rely on CPU not to speculate on stores. This is only
70 a single CPU relation and provides no guarantees for other CPUs.
73 Comparison of functions
74 =======================
76 case 1) - non-"Read/Modify/Write" (RMW) ops
77 -------------------------------------------
79 Function changes:
81  * atomic_set() --> refcount_set()
82  * atomic_read() --> refcount_read()
84 Memory ordering guarantee changes:
86  * none (both fully unordered)
89 case 2) - increment-based ops that return no value
90 --------------------------------------------------
92 Function changes:
94  * atomic_inc() --> refcount_inc()
95  * atomic_add() --> refcount_add()
97 Memory ordering guarantee changes:
99  * none (both fully unordered)
101 case 3) - decrement-based RMW ops that return no value
102 ------------------------------------------------------
104 Function changes:
106  * atomic_dec() --> refcount_dec()
108 Memory ordering guarantee changes:
110  * fully unordered --> RELEASE ordering
113 case 4) - increment-based RMW ops that return a value
114 -----------------------------------------------------
116 Function changes:
118  * atomic_inc_not_zero() --> refcount_inc_not_zero()
119  * no atomic counterpart --> refcount_add_not_zero()
121 Memory ordering guarantees changes:
123  * fully ordered --> control dependency on success for stores
125 .. note:: We really assume here that necessary ordering is provided as a
126    result of obtaining pointer to the object!
129 case 5) - generic dec/sub decrement-based RMW ops that return a value
130 ---------------------------------------------------------------------
132 Function changes:
134  * atomic_dec_and_test() --> refcount_dec_and_test()
135  * atomic_sub_and_test() --> refcount_sub_and_test()
137 Memory ordering guarantees changes:
139  * fully ordered --> RELEASE ordering + ACQUIRE ordering on success
142 case 6) other decrement-based RMW ops that return a value
143 ---------------------------------------------------------
145 Function changes:
147  * no atomic counterpart --> refcount_dec_if_one()
148  * ``atomic_add_unless(&var, -1, 1)`` --> ``refcount_dec_not_one(&var)``
150 Memory ordering guarantees changes:
152  * fully ordered --> RELEASE ordering + control dependency
154 .. note:: atomic_add_unless() only provides full order on success.
157 case 7) - lock-based RMW
158 ------------------------
160 Function changes:
162  * atomic_dec_and_lock() --> refcount_dec_and_lock()
163  * atomic_dec_and_mutex_lock() --> refcount_dec_and_mutex_lock()
165 Memory ordering guarantees changes:
167  * fully ordered --> RELEASE ordering + control dependency + hold
168    spin_lock() on success