[docs] Add LICENSE.txt to the root of the mono-repo
[llvm-project.git] / clang / docs / BlockLanguageSpec.rst
blob3632d566838a6388006430fd5c349e248fde74b4
2 .. role:: block-term
4 =================================
5 Language Specification for Blocks
6 =================================
8 .. contents::
9    :local:
11 Revisions
12 =========
14 - 2008/2/25 --- created
15 - 2008/7/28 --- revised, ``__block`` syntax
16 - 2008/8/13 --- revised, Block globals
17 - 2008/8/21 --- revised, C++ elaboration
18 - 2008/11/1 --- revised, ``__weak`` support
19 - 2009/1/12 --- revised, explicit return types
20 - 2009/2/10 --- revised, ``__block`` objects need retain
22 Overview
23 ========
25 A new derived type is introduced to C and, by extension, Objective-C,
26 C++, and Objective-C++
28 The Block Type
29 ==============
31 Like function types, the :block-term:`Block type` is a pair consisting
32 of a result value type and a list of parameter types very similar to a
33 function type. Blocks are intended to be used much like functions with
34 the key distinction being that in addition to executable code they
35 also contain various variable bindings to automatic (stack) or managed
36 (heap) memory.
38 The abstract declarator,
40 .. code-block:: c
42    int (^)(char, float)
44 describes a reference to a Block that, when invoked, takes two
45 parameters, the first of type char and the second of type float, and
46 returns a value of type int.  The Block referenced is of opaque data
47 that may reside in automatic (stack) memory, global memory, or heap
48 memory.
50 Block Variable Declarations
51 ===========================
53 A :block-term:`variable with Block type` is declared using function
54 pointer style notation substituting ``^`` for ``*``. The following are
55 valid Block variable declarations:
57 .. code-block:: c
59     void (^blockReturningVoidWithVoidArgument)(void);
60     int (^blockReturningIntWithIntAndCharArguments)(int, char);
61     void (^arrayOfTenBlocksReturningVoidWithIntArgument[10])(int);
63 Variadic ``...`` arguments are supported. [variadic.c] A Block that
64 takes no arguments must specify void in the argument list [voidarg.c].
65 An empty parameter list does not represent, as K&R provide, an
66 unspecified argument list.  Note: both gcc and clang support K&R style
67 as a convenience.
69 A Block reference may be cast to a pointer of arbitrary type and vice
70 versa. [cast.c] A Block reference may not be dereferenced via the
71 pointer dereference operator ``*``, and thus a Block's size may not be
72 computed at compile time. [sizeof.c]
74 Block Literal Expressions
75 =========================
77 A :block-term:`Block literal expression` produces a reference to a
78 Block. It is introduced by the use of the ``^`` token as a unary
79 operator.
81 .. code-block:: c
83     Block_literal_expression ::=   ^ block_decl compound_statement_body
84     block_decl ::=
85     block_decl ::= parameter_list
86     block_decl ::= type_expression
88 where type expression is extended to allow ``^`` as a Block reference
89 (pointer) where ``*`` is allowed as a function reference (pointer).
91 The following Block literal:
93 .. code-block:: c
95     ^ void (void) { printf("hello world\n"); }
97 produces a reference to a Block with no arguments with no return value.
99 The return type is optional and is inferred from the return
100 statements. If the return statements return a value, they all must
101 return a value of the same type. If there is no value returned the
102 inferred type of the Block is void; otherwise it is the type of the
103 return statement value.
105 If the return type is omitted and the argument list is ``( void )``,
106 the ``( void )`` argument list may also be omitted.
110 .. code-block:: c
112     ^ ( void ) { printf("hello world\n"); }
114 and:
116 .. code-block:: c
118     ^ { printf("hello world\n"); }
120 are exactly equivalent constructs for the same expression.
122 The type_expression extends C expression parsing to accommodate Block
123 reference declarations as it accommodates function pointer
124 declarations.
126 Given:
128 .. code-block:: c
130     typedef int (*pointerToFunctionThatReturnsIntWithCharArg)(char);
131     pointerToFunctionThatReturnsIntWithCharArg functionPointer;
132     ^ pointerToFunctionThatReturnsIntWithCharArg (float x) { return functionPointer; }
134 and:
136 .. code-block:: c
138     ^ int ((*)(float x))(char) { return functionPointer; }
140 are equivalent expressions, as is:
142 .. code-block:: c
144     ^(float x) { return functionPointer; }
146 [returnfunctionptr.c]
148 The compound statement body establishes a new lexical scope within
149 that of its parent. Variables used within the scope of the compound
150 statement are bound to the Block in the normal manner with the
151 exception of those in automatic (stack) storage. Thus one may access
152 functions and global variables as one would expect, as well as static
153 local variables. [testme]
155 Local automatic (stack) variables referenced within the compound
156 statement of a Block are imported and captured by the Block as const
157 copies. The capture (binding) is performed at the time of the Block
158 literal expression evaluation.
160 The compiler is not required to capture a variable if it can prove
161 that no references to the variable will actually be evaluated.
162 Programmers can force a variable to be captured by referencing it in a
163 statement at the beginning of the Block, like so:
165 .. code-block:: c
167   (void) foo;
169 This matters when capturing the variable has side-effects, as it can
170 in Objective-C or C++.
172 The lifetime of variables declared in a Block is that of a function;
173 each activation frame contains a new copy of variables declared within
174 the local scope of the Block. Such variable declarations should be
175 allowed anywhere [testme] rather than only when C99 parsing is
176 requested, including for statements. [testme]
178 Block literal expressions may occur within Block literal expressions
179 (nest) and all variables captured by any nested blocks are implicitly
180 also captured in the scopes of their enclosing Blocks.
182 A Block literal expression may be used as the initialization value for
183 Block variables at global or local static scope.
185 The Invoke Operator
186 ===================
188 Blocks are :block-term:`invoked` using function call syntax with a
189 list of expression parameters of types corresponding to the
190 declaration and returning a result type also according to the
191 declaration. Given:
193 .. code-block:: c
195     int (^x)(char);
196     void (^z)(void);
197     int (^(*y))(char) = &x;
199 the following are all legal Block invocations:
201 .. code-block:: c
203     x('a');
204     (*y)('a');
205     (true ? x : *y)('a')
207 The Copy and Release Operations
208 ===============================
210 The compiler and runtime provide :block-term:`copy` and
211 :block-term:`release` operations for Block references that create and,
212 in matched use, release allocated storage for referenced Blocks.
214 The copy operation ``Block_copy()`` is styled as a function that takes
215 an arbitrary Block reference and returns a Block reference of the same
216 type. The release operation, ``Block_release()``, is styled as a
217 function that takes an arbitrary Block reference and, if dynamically
218 matched to a Block copy operation, allows recovery of the referenced
219 allocated memory.
222 The ``__block`` Storage Qualifier
223 =================================
225 In addition to the new Block type we also introduce a new storage
226 qualifier, :block-term:`__block`, for local variables. [testme: a
227 __block declaration within a block literal] The ``__block`` storage
228 qualifier is mutually exclusive to the existing local storage
229 qualifiers auto, register, and static. [testme] Variables qualified by
230 ``__block`` act as if they were in allocated storage and this storage
231 is automatically recovered after last use of said variable.  An
232 implementation may choose an optimization where the storage is
233 initially automatic and only "moved" to allocated (heap) storage upon
234 a Block_copy of a referencing Block.  Such variables may be mutated as
235 normal variables are.
237 In the case where a ``__block`` variable is a Block one must assume
238 that the ``__block`` variable resides in allocated storage and as such
239 is assumed to reference a Block that is also in allocated storage
240 (that it is the result of a ``Block_copy`` operation).  Despite this
241 there is no provision to do a ``Block_copy`` or a ``Block_release`` if
242 an implementation provides initial automatic storage for Blocks.  This
243 is due to the inherent race condition of potentially several threads
244 trying to update the shared variable and the need for synchronization
245 around disposing of older values and copying new ones.  Such
246 synchronization is beyond the scope of this language specification.
249 Control Flow
250 ============
252 The compound statement of a Block is treated much like a function body
253 with respect to control flow in that goto, break, and continue do not
254 escape the Block.  Exceptions are treated *normally* in that when
255 thrown they pop stack frames until a catch clause is found.
258 Objective-C Extensions
259 ======================
261 Objective-C extends the definition of a Block reference type to be
262 that also of id.  A variable or expression of Block type may be
263 messaged or used as a parameter wherever an id may be. The converse is
264 also true. Block references may thus appear as properties and are
265 subject to the assign, retain, and copy attribute logic that is
266 reserved for objects.
268 All Blocks are constructed to be Objective-C objects regardless of
269 whether the Objective-C runtime is operational in the program or
270 not. Blocks using automatic (stack) memory are objects and may be
271 messaged, although they may not be assigned into ``__weak`` locations
272 if garbage collection is enabled.
274 Within a Block literal expression within a method definition
275 references to instance variables are also imported into the lexical
276 scope of the compound statement. These variables are implicitly
277 qualified as references from self, and so self is imported as a const
278 copy. The net effect is that instance variables can be mutated.
280 The :block-term:`Block_copy` operator retains all objects held in
281 variables of automatic storage referenced within the Block expression
282 (or form strong references if running under garbage collection).
283 Object variables of ``__block`` storage type are assumed to hold
284 normal pointers with no provision for retain and release messages.
286 Foundation defines (and supplies) ``-copy`` and ``-release`` methods for
287 Blocks.
289 In the Objective-C and Objective-C++ languages, we allow the
290 ``__weak`` specifier for ``__block`` variables of object type.  If
291 garbage collection is not enabled, this qualifier causes these
292 variables to be kept without retain messages being sent. This
293 knowingly leads to dangling pointers if the Block (or a copy) outlives
294 the lifetime of this object.
296 In garbage collected environments, the ``__weak`` variable is set to
297 nil when the object it references is collected, as long as the
298 ``__block`` variable resides in the heap (either by default or via
299 ``Block_copy()``).  The initial Apple implementation does in fact
300 start ``__block`` variables on the stack and migrate them to the heap
301 only as a result of a ``Block_copy()`` operation.
303 It is a runtime error to attempt to assign a reference to a
304 stack-based Block into any storage marked ``__weak``, including
305 ``__weak`` ``__block`` variables.
308 C++ Extensions
309 ==============
311 Block literal expressions within functions are extended to allow const
312 use of C++ objects, pointers, or references held in automatic storage.
314 As usual, within the block, references to captured variables become
315 const-qualified, as if they were references to members of a const
316 object.  Note that this does not change the type of a variable of
317 reference type.
319 For example, given a class Foo:
321 .. code-block:: c
323       Foo foo;
324       Foo &fooRef = foo;
325       Foo *fooPtr = &foo;
327 A Block that referenced these variables would import the variables as
328 const variations:
330 .. code-block:: c
332       const Foo block_foo = foo;
333       Foo &block_fooRef = fooRef;
334       Foo *const block_fooPtr = fooPtr;
336 Captured variables are copied into the Block at the instant of
337 evaluating the Block literal expression.  They are also copied when
338 calling ``Block_copy()`` on a Block allocated on the stack.  In both
339 cases, they are copied as if the variable were const-qualified, and
340 it's an error if there's no such constructor.
342 Captured variables in Blocks on the stack are destroyed when control
343 leaves the compound statement that contains the Block literal
344 expression.  Captured variables in Blocks on the heap are destroyed
345 when the reference count of the Block drops to zero.
347 Variables declared as residing in ``__block`` storage may be initially
348 allocated in the heap or may first appear on the stack and be copied
349 to the heap as a result of a ``Block_copy()`` operation. When copied
350 from the stack, ``__block`` variables are copied using their normal
351 qualification (i.e. without adding const).  In C++11, ``__block``
352 variables are copied as x-values if that is possible, then as l-values
353 if not; if both fail, it's an error.  The destructor for any initial
354 stack-based version is called at the variable's normal end of scope.
356 References to ``this``, as well as references to non-static members of
357 any enclosing class, are evaluated by capturing ``this`` just like a
358 normal variable of C pointer type.
360 Member variables that are Blocks may not be overloaded by the types of
361 their arguments.