[NFC][LLVM][CodeGen] Move LiveDebugVariables.h into llvm/include/llvm/CodeGen (#88374)
[llvm-project.git] / lldb / docs / use / variable.rst
blob8eaed6405315b43238ea6167645bd694b65b3b99
1 Variable Formatting
2 ===================
4 LLDB has a data formatters subsystem that allows users to define custom display
5 options for their variables.
7 Usually, when you type ``frame variable`` or run some expression LLDB will
8 automatically choose the way to display your results on a per-type basis, as in
9 the following example:
13    (lldb) frame variable
14    (uint8_t) x = 'a'
15    (intptr_t) y = 124752287
17 Note: ``frame variable`` without additional arguments prints the list of
18 variables of the current frame.
20 However, in certain cases, you may want to associate a different style to the
21 display for certain datatypes. To do so, you need to give hints to the debugger
22 as to how variables should be displayed. The LLDB type command allows you to do
23 just that.
25 Using it you can change your visualization to look like this:
29    (lldb) frame variable
30    (uint8_t) x = chr='a' dec=65 hex=0x41
31    (intptr_t) y = 0x76f919f
33 In addition, some data structures can encode their data in a way that is not
34 easily readable to the user, in which case a data formatter can be used to
35 show the data in a human readable way. For example, without a formatter,
36 printing a ``std::deque<int>`` with the elements ``{2, 3, 4, 5, 6}`` would
37 result in something like:
41    (lldb) frame variable a_deque
42    (std::deque<Foo, std::allocator<int> >) $0 = {
43       std::_Deque_base<Foo, std::allocator<int> > = {
44          _M_impl = {
45             _M_map = 0x000000000062ceb0
46             _M_map_size = 8
47             _M_start = {
48                _M_cur = 0x000000000062cf00
49                _M_first = 0x000000000062cf00
50                _M_last = 0x000000000062d2f4
51                _M_node = 0x000000000062cec8
52             }
53             _M_finish = {
54                _M_cur = 0x000000000062d300
55                _M_first = 0x000000000062d300
56                _M_last = 0x000000000062d6f4
57                _M_node = 0x000000000062ced0
58             }
59          }
60       }
61    }
63 which is very hard to make sense of.
65 Note: ``frame variable <var>`` prints out the variable ``<var>`` in the current
66 frame.
68 On the other hand, a proper formatter is able to produce the following output:
72    (lldb) frame variable a_deque
73    (std::deque<Foo, std::allocator<int> >) $0 = size=5 {
74       [0] = 2
75       [1] = 3
76       [2] = 4
77       [3] = 5
78       [4] = 6
79    }
81 which is what the user would expect from a good debugger.
83 Note: you can also use ``v <var>`` instead of ``frame variable <var>``.
85 It's worth mentioning that the ``size=5`` string is produced by a summary
86 provider and the list of children is produced by a synthetic child provider.
87 More information about these providers is available later in this document.
90 There are several features related to data visualization: formats, summaries,
91 filters, synthetic children.
93 To reflect this, the type command has five subcommands:
97    type format
98    type summary
99    type filter
100    type synthetic
101    type category
103 These commands are meant to bind printing options to types. When variables are
104 printed, LLDB will first check if custom printing options have been associated
105 to a variable's type and, if so, use them instead of picking the default
106 choices.
108 Each of the commands (except ``type category``) has four subcommands available:
110 - ``add``: associates a new printing option to one or more types
111 - ``delete``: deletes an existing association
112 - ``list``: provides a listing of all associations
113 - ``clear``: deletes all associations
115 Type Format
116 -----------
118 Type formats enable you to quickly override the default format for displaying
119 primitive types (the usual basic C/C++/ObjC types: int, float, char, ...).
121 If for some reason you want all int variables in your program to print out as
122 hex, you can add a format to the int type.
124 This is done by typing
128    (lldb) type format add --format hex int
130 at the LLDB command line.
132 The ``--format`` (which you can shorten to -f) option accepts a `format
133 name`_. Then, you provide one or more types to which you want the
134 new format applied.
136 A frequent scenario is that your program has a typedef for a numeric type that
137 you know represents something that must be printed in a certain way. Again, you
138 can add a format just to that typedef by using type format add with the name
139 alias.
141 But things can quickly get hierarchical. Let's say you have a situation like
142 the following:
146    typedef int A;
147    typedef A B;
148    typedef B C;
149    typedef C D;
151 and you want to show all A's as hex, all C's as byte arrays and leave the
152 defaults untouched for other types (albeit its contrived look, the example is
153 far from unrealistic in large software systems).
155 If you simply type
159    (lldb) type format add -f hex A
160    (lldb) type format add -f uint8_t[] C
162 values of type B will be shown as hex and values of type D as byte arrays, as in:
166    (lldb) frame variable -T
167    (A) a = 0x00000001
168    (B) b = 0x00000002
169    (C) c = {0x03 0x00 0x00 0x00}
170    (D) d = {0x04 0x00 0x00 0x00}
172 This is because by default LLDB cascades formats through typedef chains. In
173 order to avoid that you can use the option -C no to prevent cascading, thus
174 making the two commands required to achieve your goal:
178    (lldb) type format add -C no -f hex A
179    (lldb) type format add -C no -f uint8_t[] C
182 which provides the desired output:
186    (lldb) frame variable -T
187    (A) a = 0x00000001
188    (B) b = 2
189    (C) c = {0x03 0x00 0x00 0x00}
190    (D) d = 4
192 Note, that qualifiers such as const and volatile will be stripped when matching types for example:
196    (lldb) frame var x y z
197    (int) x = 1
198    (const int) y = 2
199    (volatile int) z = 4
200    (lldb) type format add -f hex int
201    (lldb) frame var x y z
202    (int) x = 0x00000001
203    (const int) y = 0x00000002
204    (volatile int) z = 0x00000004
206 Two additional options that you will want to look at are --skip-pointers (-p)
207 and --skip-references (-r). These two options prevent LLDB from applying a
208 format for type T to values of type T* and T& respectively.
212    (lldb) type format add -f float32[] int
213    (lldb) frame variable pointer *pointer -T
214    (int *) pointer = {1.46991e-39 1.4013e-45}
215    (int) *pointer = {1.53302e-42}
216    (lldb) type format add -f float32[] int -p
217    (lldb) frame variable pointer *pointer -T
218    (int *) pointer = 0x0000000100100180
219    (int) *pointer = {1.53302e-42}
221 While they can be applied to pointers and references, formats will make no
222 attempt to dereference the pointer and extract the value before applying the
223 format, which means you are effectively formatting the address stored in the
224 pointer rather than the pointee value. For this reason, you may want to use the
225 -p option when defining formats.
227 If you need to delete a custom format simply type type format delete followed
228 by the name of the type to which the format applies.Even if you defined the
229 same format for multiple types on the same command, type format delete will
230 only remove the format for the type name passed as argument.
232 To delete ALL formats, use ``type format clear``. To see all the formats
233 defined, use type format list.
235 If all you need to do, however, is display one variable in a custom format,
236 while leaving the others of the same type untouched, you can simply type:
240    (lldb) frame variable counter -f hex
242 This has the effect of displaying the value of counter as an hexadecimal
243 number, and will keep showing it this way until you either pick a different
244 format or till you let your program run again.
246 Finally, this is a list of formatting options available out of which you can
247 pick:
249 .. _`format name`:
251 +-----------------------------------------------+------------------+--------------------------------------------------------------------------+
252 | **Format name**                               | **Abbreviation** | **Description**                                                          |
253 +-----------------------------------------------+------------------+--------------------------------------------------------------------------+
254 | ``default``                                   |                  | the default LLDB algorithm is used to pick a format                      |
255 +-----------------------------------------------+------------------+--------------------------------------------------------------------------+
256 | ``boolean``                                   | B                | show this as a true/false boolean, using the customary rule that 0 is    |
257 |                                               |                  | false and everything else is true                                        |
258 +-----------------------------------------------+------------------+--------------------------------------------------------------------------+
259 | ``binary``                                    | b                | show this as a sequence of bits                                          |
260 +-----------------------------------------------+------------------+--------------------------------------------------------------------------+
261 | ``bytes``                                     | y                | show the bytes one after the other                                       |
262 +-----------------------------------------------+------------------+--------------------------------------------------------------------------+
263 | ``bytes with ASCII``                          | Y                | show the bytes, but try to display them as ASCII characters as well      |
264 +-----------------------------------------------+------------------+--------------------------------------------------------------------------+
265 | ``character``                                 | c                | show the bytes as ASCII characters                                       |
266 +-----------------------------------------------+------------------+--------------------------------------------------------------------------+
267 | ``printable character``                       | C                | show the bytes as printable ASCII characters                             |
268 +-----------------------------------------------+------------------+--------------------------------------------------------------------------+
269 | ``complex float``                             | F                | interpret this value as the real and imaginary part of a complex         |
270 |                                               |                  | floating-point number                                                    |
271 +-----------------------------------------------+------------------+--------------------------------------------------------------------------+
272 | ``c-string``                                  | s                | show this as a 0-terminated C string                                     |
273 +-----------------------------------------------+------------------+--------------------------------------------------------------------------+
274 | ``decimal``                                   | d                | show this as a signed integer number (this does not perform a cast, it   |
275 |                                               |                  | simply shows the bytes as  an integer with sign)                         |
276 +-----------------------------------------------+------------------+--------------------------------------------------------------------------+
277 | ``enumeration``                               | E                | show this as an enumeration, printing the                                |
278 |                                               |                  | value's name if available or the integer value otherwise                 |
279 +-----------------------------------------------+------------------+--------------------------------------------------------------------------+
280 | ``hex``                                       | x                | show this as in hexadecimal notation (this does                          |
281 |                                               |                  | not perform a cast, it simply shows the bytes as hex)                    |
282 +-----------------------------------------------+------------------+--------------------------------------------------------------------------+
283 | ``float``                                     | f                | show this as a floating-point number (this does not perform a cast, it   |
284 |                                               |                  | simply interprets the bytes as an IEEE754 floating-point value)          |
285 +-----------------------------------------------+------------------+--------------------------------------------------------------------------+
286 | ``octal``                                     | o                | show this in octal notation                                              |
287 +-----------------------------------------------+------------------+--------------------------------------------------------------------------+
288 | ``OSType``                                    | O                | show this as a MacOS OSType                                              |
289 +-----------------------------------------------+------------------+--------------------------------------------------------------------------+
290 | ``unicode16``                                 | U                | show this as UTF-16 characters                                           |
291 +-----------------------------------------------+------------------+--------------------------------------------------------------------------+
292 | ``unicode32``                                 |                  | show this as UTF-32 characters                                           |
293 +-----------------------------------------------+------------------+--------------------------------------------------------------------------+
294 | ``unsigned decimal``                          | u                | show this as an unsigned integer number (this does not perform a cast,   |
295 |                                               |                  | it simply shows the bytes as unsigned integer)                           |
296 +-----------------------------------------------+------------------+--------------------------------------------------------------------------+
297 | ``pointer``                                   | p                | show this as a native pointer (unless this is really a pointer, the      |
298 |                                               |                  | resulting address will probably be invalid)                              |
299 +-----------------------------------------------+------------------+--------------------------------------------------------------------------+
300 | ``char[]``                                    |                  | show this as an array of characters                                      |
301 +-----------------------------------------------+------------------+--------------------------------------------------------------------------+
302 | ``int8_t[], uint8_t[]``                       |                  | show this as an array of the corresponding integer type                  |
303 | ``int16_t[], uint16_t[]``                     |                  |                                                                          |
304 | ``int32_t[], uint32_t[]``                     |                  |                                                                          |
305 | ``int64_t[], uint64_t[]``                     |                  |                                                                          |
306 | ``uint128_t[]``                               |                  |                                                                          |
307 +-----------------------------------------------+------------------+--------------------------------------------------------------------------+
308 | ``float32[], float64[]``                      |                  | show this as an array of the corresponding                               |
309 |                                               |                  |                       floating-point type                                |
310 +-----------------------------------------------+------------------+--------------------------------------------------------------------------+
311 | ``complex integer``                           | I                | interpret this value as the real and imaginary part of a complex integer |
312 |                                               |                  | number                                                                   |
313 +-----------------------------------------------+------------------+--------------------------------------------------------------------------+
314 | ``character array``                           | a                | show this as a character array                                           |
315 +-----------------------------------------------+------------------+--------------------------------------------------------------------------+
316 | ``address``                                   | A                | show this as an address target (symbol/file/line + offset), possibly     |
317 |                                               |                  | also the string this address is pointing to                              |
318 +-----------------------------------------------+------------------+--------------------------------------------------------------------------+
319 | ``hex float``                                 |                  | show this as hexadecimal floating point                                  |
320 +-----------------------------------------------+------------------+--------------------------------------------------------------------------+
321 | ``instruction``                               | i                | show this as an disassembled opcode                                      |
322 +-----------------------------------------------+------------------+--------------------------------------------------------------------------+
323 | ``void``                                      | v                | don't show anything                                                      |
324 +-----------------------------------------------+------------------+--------------------------------------------------------------------------+
326 Type Summary
327 ------------
329 Type formats work by showing a different kind of display for the value of a
330 variable. However, they only work for basic types. When you want to display a
331 class or struct in a custom format, you cannot do that using formats.
333 A different feature, type summaries, works by extracting information from
334 classes, structures, ... (aggregate types) and arranging it in a user-defined
335 format, as in the following example:
337 before adding a summary...
341    (lldb) frame variable -T one
342    (i_am_cool) one = {
343       (int) x = 3
344       (float) y = 3.14159
345       (char) z = 'E'
346    }
348 after adding a summary...
352    (lldb) frame variable one
353    (i_am_cool) one = int = 3, float = 3.14159, char = 69
355 There are two ways to use type summaries: the first one is to bind a summary
356 string to the type; the second is to write a Python script that returns the
357 string to be used as summary. Both options are enabled by the type summary add
358 command.
360 The command to obtain the output shown in the example is:
364 (lldb) type summary add --summary-string "int = ${var.x}, float = ${var.y}, char = ${var.z%u}" i_am_cool
366 Initially, we will focus on summary strings, and then describe the Python
367 binding mechanism.
369 Summary Strings
370 ---------------
372 Summary strings are written using a simple control language, exemplified by the
373 snippet above. A summary string contains a sequence of tokens that are
374 processed by LLDB to generate the summary.
376 Summary strings can contain plain text, control characters and special
377 variables that have access to information about the current object and the
378 overall program state.
380 Plain text is any sequence of characters that doesn't contain a ``{``, ``}``, ``$``,
381 or ``\`` character, which are the syntax control characters.
383 The special variables are found in between a "${" prefix, and end with a "}"
384 suffix. Variables can be a simple name or they can refer to complex objects
385 that have subitems themselves. In other words, a variable looks like
386 ``${object}`` or ``${object.child.otherchild}``. A variable can also be
387 prefixed or suffixed with other symbols meant to change the way its value is
388 handled. An example is ``${*var.int_pointer[0-3]}``.
390 Basically, the syntax is the same one described Frame and Thread Formatting
391 plus additional symbols specific for summary strings. The main of them is
392 ${var, which is used refer to the variable that a summary is being created for.
394 The simplest thing you can do is grab a member variable of a class or structure
395 by typing its expression path. In the previous example, the expression path for
396 the field float y is simply .y. Thus, to ask the summary string to display y
397 you would type ${var.y}.
399 If you have code like the following:
403    struct A {
404       int x;
405       int y;
406    };
407    struct B {
408       A x;
409       A y;
410       int *z;
411    };
413 the expression path for the y member of the x member of an object of type B
414 would be .x.y and you would type ``${var.x.y}`` to display it in a summary
415 string for type B.
417 By default, a summary defined for type T, also works for types T* and T& (you
418 can disable this behavior if desired). For this reason, expression paths do not
419 differentiate between . and ->, and the above expression path .x.y would be
420 just as good if you were displaying a B*, or even if the actual definition of B
421 were:
425    struct B {
426       A *x;
427       A y;
428       int *z;
429    };
431 This is unlike the behavior of frame variable which, on the contrary, will
432 enforce the distinction. As hinted above, the rationale for this choice is that
433 waiving this distinction enables you to write a summary string once for type T
434 and use it for both T and T* instances. As a summary string is mostly about
435 extracting nested members' information, a pointer to an object is just as good
436 as the object itself for the purpose.
438 If you need to access the value of the integer pointed to by B::z, you cannot
439 simply say ${var.z} because that symbol refers to the pointer z. In order to
440 dereference it and get the pointed value, you should say ``${*var.z}``. The
441 ``${*var`` tells LLDB to get the object that the expression paths leads to, and
442 then dereference it. In this example is it equivalent to ``*(bObject.z)`` in
443 C/C++ syntax. Because ``.`` and ``->`` operators can both be used, there is no
444 need to have dereferences in the middle of an expression path (e.g. you do not
445 need to type ``${*(var.x).x}``) to read A::x as contained in ``*(B::x)``. To
446 achieve that effect you can simply write ``${var.x->x}``, or even
447 ``${var.x.x}``. The ``*`` operator only binds to the result of the whole
448 expression path, rather than piecewise, and there is no way to use parentheses
449 to change that behavior.
451 Of course, a summary string can contain more than one ${var specifier, and can
452 use ``${var`` and ``${*var`` specifiers together.
454 Formatting Summary Elements
455 ---------------------------
457 An expression path can include formatting codes. Much like the type formats
458 discussed previously, you can also customize the way variables are displayed in
459 summary strings, regardless of the format they have applied to their types. To
460 do that, you can use %format inside an expression path, as in ${var.x->x%u},
461 which would display the value of x as an unsigned integer.
463 You can also use some other special format markers, not available for formats
464 themselves, but which carry a special meaning when used in this context:
466 +------------+--------------------------------------------------------------------------+
467 | **Symbol** | **Description**                                                          |
468 +------------+--------------------------------------------------------------------------+
469 | ``Symbol`` | ``Description``                                                          |
470 +------------+--------------------------------------------------------------------------+
471 | ``%S``     | Use this object's summary (the default for aggregate types)              |
472 +------------+--------------------------------------------------------------------------+
473 | ``%V``     | Use this object's value (the default for non-aggregate types)            |
474 +------------+--------------------------------------------------------------------------+
475 | ``%@``     | Use a language-runtime specific description (for C++ this does nothing,  |
476 |            |                     for Objective-C it calls the NSPrintForDebugger API) |
477 +------------+--------------------------------------------------------------------------+
478 | ``%L``     | Use this object's location (memory address, register name, ...)          |
479 +------------+--------------------------------------------------------------------------+
480 | ``%#``     | Use the count of the children of this object                             |
481 +------------+--------------------------------------------------------------------------+
482 | ``%T``     | Use this object's datatype name                                          |
483 +------------+--------------------------------------------------------------------------+
484 | ``%N``     | Print the variable's basename                                            |
485 +------------+--------------------------------------------------------------------------+
486 | ``%>``     | Print the expression path for this item                                  |
487 +------------+--------------------------------------------------------------------------+
489 Since lldb 3.7.0, you can also specify ``${script.var:pythonFuncName}``.
491 It is expected that the function name you use specifies a function whose
492 signature is the same as a Python summary function. The return string from the
493 function will be placed verbatim in the output.
495 You cannot use element access, or formatting symbols, in combination with this
496 syntax. For example the following:
500    ${script.var.element[0]:myFunctionName%@}
502 is not valid and will cause the summary to fail to evaluate.
505 Element Inlining
506 ----------------
508 Option --inline-children (-c) to type summary add tells LLDB not to look for a summary string, but instead to just print a listing of all the object's children on one line.
510 As an example, given a type pair:
514    (lldb) frame variable --show-types a_pair
515    (pair) a_pair = {
516       (int) first = 1;
517       (int) second = 2;
518    }
520 If one types the following commands:
524    (lldb) type summary add --inline-children pair
526 the output becomes:
530    (lldb) frame variable a_pair
531    (pair) a_pair = (first=1, second=2)
534 Of course, one can obtain the same effect by typing
538    (lldb) type summary add pair --summary-string "(first=${var.first}, second=${var.second})"
540 While the final result is the same, using --inline-children can often save
541 time. If one does not need to see the names of the variables, but just their
542 values, the option --omit-names (-O, uppercase letter o), can be combined with
543 --inline-children to obtain:
547    (lldb) frame variable a_pair
548    (pair) a_pair = (1, 2)
550 which is of course the same as typing
554    (lldb) type summary add pair --summary-string "(${var.first}, ${var.second})"
556 Bitfields And Array Syntax
557 --------------------------
559 Sometimes, a basic type's value actually represents several different values
560 packed together in a bitfield.
562 With the classical view, there is no way to look at them. Hexadecimal display
563 can help, but if the bits actually span nibble boundaries, the help is limited.
565 Binary view would show it all without ambiguity, but is often too detailed and
566 hard to read for real-life scenarios.
568 To cope with the issue, LLDB supports native bitfield formatting in summary
569 strings. If your expression paths leads to a so-called scalar type (the usual
570 int, float, char, double, short, long, long long, double, long double and
571 unsigned variants), you can ask LLDB to only grab some bits out of the value
572 and display them in any format you like. If you only need one bit you can use
573 the [n], just like indexing an array. To extract multiple bits, you can use a
574 slice-like syntax: [n-m], e.g.
578    (lldb) frame variable float_point
579    (float) float_point = -3.14159
583    (lldb) type summary add --summary-string "Sign: ${var[31]%B} Exponent: ${var[30-23]%x} Mantissa: ${var[0-22]%u}" float
584    (lldb) frame variable float_point
585    (float) float_point = -3.14159 Sign: true Exponent: 0x00000080 Mantissa: 4788184
587 In this example, LLDB shows the internal representation of a float variable by
588 extracting bitfields out of a float object.
590 When typing a range, the extremes n and m are always included, and the order of
591 the indices is irrelevant.
593 LLDB also allows to use a similar syntax to display array members inside a summary string. For instance, you may want to display all arrays of a given type using a more compact notation than the default, and then just delve into individual array members that prove interesting to your debugging task. You can tell LLDB to format arrays in special ways, possibly independent of the way the array members' datatype is formatted.
594 e.g.
598    (lldb) frame variable sarray
599    (Simple [3]) sarray = {
600       [0] = {
601          x = 1
602          y = 2
603          z = '\x03'
604       }
605       [1] = {
606          x = 4
607          y = 5
608          z = '\x06'
609       }
610       [2] = {
611          x = 7
612          y = 8
613          z = '\t'
614       }
615    }
617    (lldb) type summary add --summary-string "${var[].x}" "Simple [3]"
619    (lldb) frame variable sarray
620    (Simple [3]) sarray = [1,4,7]
622 The [] symbol amounts to: if var is an array and I know its size, apply this summary string to every element of the array. Here, we are asking LLDB to display .x for every element of the array, and in fact this is what happens. If you find some of those integers anomalous, you can then inspect that one item in greater detail, without the array format getting in the way:
626    (lldb) frame variable sarray[1]
627    (Simple) sarray[1] = {
628       x = 4
629       y = 5
630       z = '\x06'
631    }
633 You can also ask LLDB to only print a subset of the array range by using the
634 same syntax used to extract bit for bitfields:
638    (lldb) type summary add --summary-string "${var[1-2].x}" "Simple [3]"
640    (lldb) frame variable sarray
641    (Simple [3]) sarray = [4,7]
643 If you are dealing with a pointer that you know is an array, you can use this
644 syntax to display the elements contained in the pointed array instead of just
645 the pointer value. However, because pointers have no notion of their size, the
646 empty brackets [] operator does not work, and you must explicitly provide
647 higher and lower bounds.
649 In general, LLDB needs the square brackets ``operator []`` in order to handle
650 arrays and pointers correctly, and for pointers it also needs a range. However,
651 a few special cases are defined to make your life easier:
653 you can print a 0-terminated string (C-string) using the %s format, omitting
654 square brackets, as in:
658    (lldb) type summary add --summary-string "${var%s}" "char *"
660 This syntax works for char* as well as for char[] because LLDB can rely on the
661 final \0 terminator to know when the string has ended.
663 LLDB has default summary strings for char* and char[] that use this special
664 case. On debugger startup, the following are defined automatically:
668    (lldb) type summary add --summary-string "${var%s}" "char *"
669    (lldb) type summary add --summary-string "${var%s}" -x "char \[[0-9]+]"
671 any of the array formats (int8_t[], float32{}, ...), and the y, Y and a formats
672 work to print an array of a non-aggregate type, even if square brackets are
673 omitted.
677    (lldb) type summary add --summary-string "${var%int32_t[]}" "int [10]"
679 This feature, however, is not enabled for pointers because there is no way for
680 LLDB to detect the end of the pointed data.
682 This also does not work for other formats (e.g. boolean), and you must specify
683 the square brackets operator to get the expected output.
685 Python Scripting
686 ----------------
688 Most of the times, summary strings prove good enough for the job of summarizing
689 the contents of a variable. However, as soon as you need to do more than
690 picking some values and rearranging them for display, summary strings stop
691 being an effective tool. This is because summary strings lack the power to
692 actually perform any kind of computation on the value of variables.
694 To solve this issue, you can bind some Python scripting code as a summary for
695 your datatype, and that script has the ability to both extract children
696 variables as the summary strings do and to perform active computation on the
697 extracted values. As a small example, let's say we have a Rectangle class:
702    class Rectangle
703    {
704    private:
705       int height;
706       int width;
707    public:
708       Rectangle() : height(3), width(5) {}
709       Rectangle(int H) : height(H), width(H*2-1) {}
710       Rectangle(int H, int W) : height(H), width(W) {}
711       int GetHeight() { return height; }
712       int GetWidth() { return width; }
713    };
715 Summary strings are effective to reduce the screen real estate used by the
716 default viewing mode, but are not effective if we want to display the area and
717 perimeter of Rectangle objects
719 To obtain this, we can simply attach a small Python script to the Rectangle
720 class, as shown in this example:
724    (lldb) type summary add -P Rectangle
725    Enter your Python command(s). Type 'DONE' to end.
726    def function (valobj,internal_dict,options):
727       height_val = valobj.GetChildMemberWithName('height')
728       width_val = valobj.GetChildMemberWithName('width')
729       height = height_val.GetValueAsUnsigned(0)
730       width = width_val.GetValueAsUnsigned(0)
731       area = height*width
732       perimeter = 2*(height + width)
733       return 'Area: ' + str(area) + ', Perimeter: ' + str(perimeter)
734       DONE
735    (lldb) frame variable
736    (Rectangle) r1 = Area: 20, Perimeter: 18
737    (Rectangle) r2 = Area: 72, Perimeter: 36
738    (Rectangle) r3 = Area: 16, Perimeter: 16
740 In order to write effective summary scripts, you need to know the LLDB public
741 API, which is the way Python code can access the LLDB object model. For further
742 details on the API you should look at the LLDB API reference documentation.
745 As a brief introduction, your script is encapsulated into a function that is
746 passed two parameters: ``valobj`` and ``internal_dict``.
748 ``internal_dict`` is an internal support parameter used by LLDB and you should
749 not touch it.
751 ``valobj`` is the object encapsulating the actual variable being displayed, and
752 its type is `SBValue`. Out of the many possible operations on an `SBValue`, the
753 basic one is retrieve the children objects it contains (essentially, the fields
754 of the object wrapped by it), by calling ``GetChildMemberWithName()``, passing
755 it the child's name as a string.
757 If the variable has a value, you can ask for it, and return it as a string
758 using ``GetValue()``, or as a signed/unsigned number using
759 ``GetValueAsSigned()``, ``GetValueAsUnsigned()``. It is also possible to
760 retrieve an `SBData` object by calling ``GetData()`` and then read the object's
761 contents out of the `SBData`.
763 If you need to delve into several levels of hierarchy, as you can do with
764 summary strings, you can use the method ``GetValueForExpressionPath()``,
765 passing it an expression path just like those you could use for summary strings
766 (one of the differences is that dereferencing a pointer does not occur by
767 prefixing the path with a ``*```, but by calling the ``Dereference()`` method
768 on the returned `SBValue`). If you need to access array slices, you cannot do
769 that (yet) via this method call, and you must use ``GetChildAtIndex()``
770 querying it for the array items one by one. Also, handling custom formats is
771 something you have to deal with on your own.
773 ``options`` Python summary formatters can optionally define this
774 third argument, which is an object of type ``lldb.SBTypeSummaryOptions``,
775 allowing for a few customizations of the result. The decision to
776 adopt or not this third argument - and the meaning of options
777 thereof - is up to the individual formatter's writer.
779 Other than interactively typing a Python script there are two other ways for
780 you to input a Python script as a summary:
782 - using the --python-script option to type summary add and typing the script
783   code as an option argument; as in:
787    (lldb) type summary add --python-script "height = valobj.GetChildMemberWithName('height').GetValueAsUnsigned(0);width = valobj.GetChildMemberWithName('width').GetValueAsUnsigned(0); return 'Area: %d' % (height*width)" Rectangle
790 - using the --python-function (-F) option to type summary add and giving the
791   name of a Python function with the correct prototype. Most probably, you will
792   define (or have already defined) the function in the interactive interpreter,
793   or somehow loaded it from a file, using the command script import command.
794   LLDB will emit a warning if it is unable to find the function you passed, but
795   will still register the binding.
797 Regular Expression Typenames
798 ----------------------------
800 As you noticed, in order to associate the custom summary string to the array
801 types, one must give the array size as part of the typename. This can long
802 become tiresome when using arrays of different sizes, Simple [3], Simple [9],
803 Simple [12], ...
805 If you use the -x option, type names are treated as regular expressions instead
806 of type names. This would let you rephrase the above example for arrays of type
807 Simple [3] as:
811    (lldb) type summary add --summary-string "${var[].x}" -x "Simple \[[0-9]+\]"
812    (lldb) frame variable
813    (Simple [3]) sarray = [1,4,7]
814    (Simple [2]) sother = [3,6]
816 The above scenario works for Simple [3] as well as for any other array of
817 Simple objects.
819 While this feature is mostly useful for arrays, you could also use regular
820 expressions to catch other type sets grouped by name. However, as regular
821 expression matching is slower than normal name matching, LLDB will first try to
822 match by name in any way it can, and only when this fails, will it resort to
823 regular expression matching.
825 One of the ways LLDB uses this feature internally, is to match the names of STL
826 container classes, regardless of the template arguments provided. The details
827 for this are found at FormatManager.cpp
829 The regular expression language used by LLDB is the POSIX extended language, as
830 defined by the Single UNIX Specification, of which macOS is a compliant
831 implementation.
833 Names Summaries
834 ---------------
836 For a given type, there may be different meaningful summary representations.
837 However, currently, only one summary can be associated to a type at each
838 moment. If you need to temporarily override the association for a variable,
839 without changing the summary string for to its type, you can use named
840 summaries.
842 Named summaries work by attaching a name to a summary when creating it. Then,
843 when there is a need to attach the summary to a variable, the frame variable
844 command, supports a --summary option that tells LLDB to use the named summary
845 given instead of the default one.
849    (lldb) type summary add --summary-string "x=${var.integer}" --name NamedSummary
850    (lldb) frame variable one
851    (i_am_cool) one = int = 3, float = 3.14159, char = 69
852    (lldb) frame variable one --summary NamedSummary
853    (i_am_cool) one = x=3
855 When defining a named summary, binding it to one or more types becomes
856 optional. Even if you bind the named summary to a type, and later change the
857 summary string for that type, the named summary will not be changed by that.
858 You can delete named summaries by using the type summary delete command, as if
859 the summary name was the datatype that the summary is applied to
861 A summary attached to a variable using the --summary option, has the same
862 semantics that a custom format attached using the -f option has: it stays
863 attached till you attach a new one, or till you let your program run again.
865 Synthetic Children
866 ------------------
868 Summaries work well when one is able to navigate through an expression path. In
869 order for LLDB to do so, appropriate debugging information must be available.
871 Some types are opaque, i.e. no knowledge of their internals is provided. When
872 that's the case, expression paths do not work correctly.
874 In other cases, the internals are available to use in expression paths, but
875 they do not provide a user-friendly representation of the object's value.
877 For instance, consider an STL vector, as implemented by the GNU C++ Library:
881    (lldb) frame variable numbers -T
882    (std::vector<int>) numbers = {
883       (std::_Vector_base<int, std::allocator<int> >) std::_Vector_base<int, std::allocator<int> > = {
884          (std::_Vector_base<int, std::allocator&tl;int> >::_Vector_impl) _M_impl = {
885                (int *) _M_start = 0x00000001001008a0
886                (int *) _M_finish = 0x00000001001008a8
887                (int *) _M_end_of_storage = 0x00000001001008a8
888          }
889       }
890    }
892 Here, you can see how the type is implemented, and you can write a summary for
893 that implementation but that is not going to help you infer what items are
894 actually stored in the vector.
896 What you would like to see is probably something like:
900    (lldb) frame variable numbers -T
901    (std::vector<int>) numbers = {
902       (int) [0] = 1
903       (int) [1] = 12
904       (int) [2] = 123
905       (int) [3] = 1234
906    }
908 Synthetic children are a way to get that result.
910 The feature is based upon the idea of providing a new set of children for a
911 variable that replaces the ones available by default through the debug
912 information. In the example, we can use synthetic children to provide the
913 vector items as children for the std::vector object.
915 In order to create synthetic children, you need to provide a Python class that
916 adheres to a given interface (the word is italicized because Python has no
917 explicit notion of interface, by that word we mean a given set of methods must
918 be implemented by the Python class):
920 .. code-block:: python
922    class SyntheticChildrenProvider:
923       def __init__(self, valobj, internal_dict):
924          this call should initialize the Python object using valobj as the variable to provide synthetic children for
925       def num_children(self):
926          this call should return the number of children that you want your object to have
927       def get_child_index(self,name):
928          this call should return the index of the synthetic child whose name is given as argument
929       def get_child_at_index(self,index):
930          this call should return a new LLDB SBValue object representing the child at the index given as argument
931       def update(self):
932          this call should be used to update the internal state of this Python object whenever the state of the variables in LLDB changes.[1]
933          Also, this method is invoked before any other method in the interface.
934       def has_children(self):
935          this call should return True if this object might have children, and False if this object can be guaranteed not to have children.[2]
936       def get_value(self):
937          this call can return an SBValue to be presented as the value of the synthetic value under consideration.[3]
939 As a warning, exceptions that are thrown by python formatters are caught
940 silently by LLDB and should be handled appropriately by the formatter itself.
941 Being more specific, in case of exceptions, LLDB might assume that the given
942 object has no children or it might skip printing some children, as they are
943 printed one by one.
945 [1] This method is optional. Also, a boolean value must be returned (since lldb
946 3.1.0). If ``False`` is returned, then whenever the process reaches a new stop,
947 this method will be invoked again to generate an updated list of the children
948 for a given variable. Otherwise, if ``True`` is returned, then the value is
949 cached and this method won't be called again, effectively freezing the state of
950 the value in subsequent stops. Beware that returning ``True`` incorrectly could
951 show misleading information to the user.
953 [2] This method is optional (since lldb 3.2.0). While implementing it in terms
954 of num_children is acceptable, implementors are encouraged to look for
955 optimized coding alternatives whenever reasonable.
957 [3] This method is optional (since lldb 3.5.2). The `SBValue` you return here
958 will most likely be a numeric type (int, float, ...) as its value bytes will be
959 used as-if they were the value of the root `SBValue` proper.  As a shortcut for
960 this, you can inherit from lldb.SBSyntheticValueProvider, and just define
961 get_value as other methods are defaulted in the superclass as returning default
962 no-children responses.
964 If a synthetic child provider supplies a special child named
965 ``$$dereference$$`` then it will be used when evaluating ``operator *`` and
966 ``operator ->`` in the frame variable command and related SB API
967 functions. It is possible to declare this synthetic child without
968 including it in the range of children displayed by LLDB. For example,
969 this subset of a synthetic children provider class would allow the
970 synthetic value to be dereferenced without actually showing any
971 synthetic children in the UI:
973 .. code-block:: python
975       class SyntheticChildrenProvider:
976           [...]
977           def num_children(self):
978               return 0
979           def get_child_index(self, name):
980               if name == '$$dereference$$':
981                   return 0
982               return -1
983           def get_child_at_index(self, index):
984               if index == 0:
985                   return <valobj resulting from dereference>
986               return None
989 For examples of how synthetic children are created, you are encouraged to look
990 at examples/synthetic in the LLDB trunk. Please, be aware that the code in
991 those files (except bitfield/) is legacy code and is not maintained. You may
992 especially want to begin looking at this example to get a feel for this
993 feature, as it is a very easy and well commented example.
995 The design pattern consistently used in synthetic providers shipping with LLDB
996 is to use the __init__ to store the `SBValue` instance as a part of self. The
997 update function is then used to perform the actual initialization. Once a
998 synthetic children provider is written, one must load it into LLDB before it
999 can be used. Currently, one can use the LLDB script command to type Python code
1000 interactively, or use the command script import fileName command to load Python
1001 code from a Python module (ordinary rules apply to importing modules this way).
1002 A third option is to type the code for the provider class interactively while
1003 adding it.
1005 For example, let's pretend we have a class Foo for which a synthetic children
1006 provider class Foo_Provider is available, in a Python module contained in file
1007 ~/Foo_Tools.py. The following interaction sets Foo_Provider as a synthetic
1008 children provider in LLDB:
1012    (lldb) command script import ~/Foo_Tools.py
1013    (lldb) type synthetic add Foo --python-class Foo_Tools.Foo_Provider
1014    (lldb) frame variable a_foo
1015    (Foo) a_foo = {
1016       x = 1
1017       y = "Hello world"
1018    }
1020 LLDB has synthetic children providers for a core subset of STL classes, both in
1021 the version provided by libstdcpp and by libcxx, as well as for several
1022 Foundation classes.
1024 Synthetic children extend summary strings by enabling a new special variable:
1025 ``${svar``.
1027 This symbol tells LLDB to refer expression paths to the synthetic children
1028 instead of the real ones. For instance,
1032    (lldb) type summary add --expand -x "std::vector<" --summary-string "${svar%#} items"
1033    (lldb) frame variable numbers
1034    (std::vector<int>) numbers = 4 items {
1035       (int) [0] = 1
1036       (int) [1] = 12
1037       (int) [2] = 123
1038       (int) [3] = 1234
1039    }
1041 It's important to mention that LLDB invokes the synthetic child provider before
1042 invoking the summary string provider, which allows the latter to have access to
1043 the actual displayable children. This applies to both inlined summary strings
1044 and python-based summary providers.
1047 As a warning, when programmatically accessing the children or children count of
1048 a variable that has a synthetic child provider, notice that LLDB hides the
1049 actual raw children. For example, suppose we have a ``std::vector``, which has
1050 an actual in-memory property ``__begin`` marking the beginning of its data.
1051 After the synthetic child provider is executed, the ``std::vector`` variable
1052 won't show ``__begin`` as child anymore, even through the SB API. It will have
1053 instead the children calculated by the provider. In case the actual raw
1054 children are needed, a call to ``value.GetNonSyntheticValue()`` is enough to
1055 get a raw version of the value. It is import to remember this when implementing
1056 summary string providers, as they run after the synthetic child provider.
1059 In some cases, if LLDB is unable to use the real object to get a child
1060 specified in an expression path, it will automatically refer to the synthetic
1061 children. While in summaries it is best to always use ${svar to make your
1062 intentions clearer, interactive debugging can benefit from this behavior, as
1067    (lldb) frame variable numbers[0] numbers[1]
1068    (int) numbers[0] = 1
1069    (int) numbers[1] = 12
1071 Unlike many other visualization features, however, the access to synthetic
1072 children only works when using frame variable, and is not supported in
1073 expression:
1077    (lldb) expression numbers[0]
1078    Error [IRForTarget]: Call to a function '_ZNSt33vector<int, std::allocator<int> >ixEm' that is not present in the target
1079    error: Couldn't convert the expression to DWARF
1081 The reason for this is that classes might have an overloaded ``operator []``,
1082 or other special provisions and the expression command chooses to ignore
1083 synthetic children in the interest of equivalency with code you asked to have
1084 compiled from source.
1086 Filters
1087 -------
1089 Filters are a solution to the display of complex classes. At times, classes
1090 have many member variables but not all of these are actually necessary for the
1091 user to see.
1093 A filter will solve this issue by only letting the user see those member
1094 variables they care about. Of course, the equivalent of a filter can be
1095 implemented easily using synthetic children, but a filter lets you get the job
1096 done without having to write Python code.
1098 For instance, if your class Foobar has member variables named A thru Z, but you
1099 only need to see the ones named B, H and Q, you can define a filter:
1103    (lldb) type filter add Foobar --child B --child H --child Q
1104    (lldb) frame variable a_foobar
1105    (Foobar) a_foobar = {
1106       (int) B = 1
1107       (char) H = 'H'
1108       (std::string) Q = "Hello world"
1109    }
1111 Callback-based type matching
1112 ----------------------------
1114 Even though regular expression matching works well for the vast majority of data
1115 formatters (you normally know the name of the type you're writing a formatter
1116 for), there are some cases where it's useful to look at the type before deciding
1117 what formatter to apply.
1119 As an example scenario, imagine we have a code generator that produces some
1120 classes that inherit from a common ``GeneratedObject`` class, and we have a
1121 summary function and a synthetic child provider that work for all
1122 ``GeneratedObject`` instances (they all follow the same pattern). However, there
1123 is no common pattern in the name of these classes, so we can't register the
1124 formatter neither by name nor by regular expression.
1126 In that case, you can write a recognizer function like this:
1130    def is_generated_object(sbtype, internal_dict):
1131      for base in sbtype.get_bases_array():
1132        if base.GetName() == "GeneratedObject"
1133          return True
1134      return False
1136 And pass this function to ``type summary add`` and ``type synthetic add`` using
1137 the flag ``--recognizer-function``.
1141    (lldb) type summary add --expand --python-function my_summary_function --recognizer-function is_generated_object
1142    (lldb) type synthetic add --python-class my_child_provider --recognizer-function is_generated_object
1144 Objective-C Dynamic Type Discovery
1145 ----------------------------------
1147 When doing Objective-C development, you may notice that some of your variables
1148 come out as of type id (for instance, items extracted from NSArray). By
1149 default, LLDB will not show you the real type of the object. it can actually
1150 dynamically discover the type of an Objective-C variable, much like the runtime
1151 itself does when invoking a selector. In order to be shown the result of that
1152 discovery that, however, a special option to frame variable or expression is
1153 required: ``--dynamic-type``.
1156 ``--dynamic-type`` can have one of three values:
1158 - ``no-dynamic-values``: the default, prevents dynamic type discovery
1159 - ``no-run-target``: enables dynamic type discovery as long as running code on
1160   the target is not required
1161 - ``run-target``: enables code execution on the target in order to perform
1162   dynamic type discovery
1164 If you specify a value of either no-run-target or run-target, LLDB will detect
1165 the dynamic type of your variables and show the appropriate formatters for
1166 them. As an example:
1170    (lldb) expr @"Hello"
1171    (NSString *) $0 = 0x00000001048000b0 @"Hello"
1172    (lldb) expr -d no-run @"Hello"
1173    (__NSCFString *) $1 = 0x00000001048000b0 @"Hello"
1175 Because LLDB uses a detection algorithm that does not need to invoke any
1176 functions on the target process, no-run-target is enough for this to work.
1178 As a side note, the summary for NSString shown in the example is built right
1179 into LLDB. It was initially implemented through Python (the code is still
1180 available for reference at CFString.py). However, this is out of sync with the
1181 current implementation of the NSString formatter (which is a C++ function
1182 compiled into the LLDB core).
1184 Categories
1185 ----------
1187 Categories are a way to group related formatters. For instance, LLDB itself
1188 groups the formatters for the libstdc++ types in a category named
1189 gnu-libstdc++. Basically, categories act like containers in which to store
1190 formatters for a same library or OS release.
1192 By default, several categories are created in LLDB:
1194 - default: this is the category where every formatter ends up, unless another category is specified
1195 - objc: formatters for basic and common Objective-C types that do not specifically depend on macOS
1196 - gnu-libstdc++: formatters for std::string, std::vector, std::list and std::map as implemented by libstdcpp
1197 - libcxx: formatters for std::string, std::vector, std::list and std::map as implemented by libcxx
1198 - system: truly basic types for which a formatter is required
1199 - AppKit: Cocoa classes
1200 - CoreFoundation: CF classes
1201 - CoreGraphics: CG classes
1202 - CoreServices: CS classes
1203 - VectorTypes: compact display for several vector types
1205 If you want to use a custom category for your formatters, all the type ... add
1206 provide a --category (-w) option, that names the category to add the formatter
1207 to. To delete the formatter, you then have to specify the correct category.
1209 Categories can be in one of two states: enabled and disabled. A category is
1210 initially disabled, and can be enabled using the type category enable command.
1211 To disable an enabled category, the command to use is type category disable.
1213 The order in which categories are enabled or disabled is significant, in that
1214 LLDB uses that order when looking for formatters. Therefore, when you enable a
1215 category, it becomes the second one to be searched (after default, which always
1216 stays on top of the list). The default categories are enabled in such a way
1217 that the search order is:
1219 - default
1220 - objc
1221 - CoreFoundation
1222 - AppKit
1223 - CoreServices
1224 - CoreGraphics
1225 - gnu-libstdc++
1226 - libcxx
1227 - VectorTypes
1228 - system
1230 As said, gnu-libstdc++ and libcxx contain formatters for C++ STL data types.
1231 system contains formatters for char* and char[], which reflect the behavior of
1232 older versions of LLDB which had built-in formatters for these types. Because
1233 now these are formatters, you can even replace them with your own if so you
1234 wish.
1236 There is no special command to create a category. When you place a formatter in
1237 a category, if that category does not exist, it is automatically created. For
1238 instance,
1242    (lldb) type summary add Foobar --summary-string "a foobar" --category newcategory
1244 automatically creates a (disabled) category named newcategory.
1246 Another way to create a new (empty) category, is to enable it, as in:
1250    (lldb) type category enable newcategory
1252 However, in this case LLDB warns you that enabling an empty category has no
1253 effect. If you add formatters to the category after enabling it, they will be
1254 honored. But an empty category per se does not change the way any type is
1255 displayed. The reason the debugger warns you is that enabling an empty category
1256 might be a typo, and you effectively wanted to enable a similarly-named but
1257 not-empty category.
1259 Finding Formatters 101
1260 ----------------------
1262 Searching for a formatter (including formats, since lldb 3.4.0) given a
1263 variable goes through a rather intricate set of rules. Namely, what happens is
1264 that LLDB starts looking in each enabled category, according to the order in
1265 which they were enabled (latest enabled first). In each category, LLDB does the
1266 following:
1268 - If there is a formatter for the type of the variable, use it
1269 - If this object is a pointer, and there is a formatter for the pointee type
1270   that does not skip pointers, use it
1271 - If this object is a reference, and there is a formatter for the referred type
1272   that does not skip references, use it
1273 - If this object is an Objective-C class and dynamic types are enabled, look
1274   for a formatter for the dynamic type of the object. If dynamic types are
1275   disabled, or the search failed, look for a formatter for the declared type of
1276   the object
1277 - If this object's type is a typedef, go through typedef hierarchy (LLDB might
1278   not be able to do this if the compiler has not emitted enough information. If
1279   the required information to traverse typedef hierarchies is missing, type
1280   cascading will not work. The clang compiler, part of the LLVM project, emits
1281   the correct debugging information for LLDB to cascade). If at any level of
1282   the hierarchy there is a valid formatter that can cascade, use it.
1283 - If everything has failed, repeat the above search, looking for regular
1284   expressions instead of exact matches
1286 If any of those attempts returned a valid formatter to be used, that one is
1287 used, and the search is terminated (without going to look in other categories).
1288 If nothing was found in the current category, the next enabled category is
1289 scanned according to the same algorithm. If there are no more enabled
1290 categories, the search has failed.
1292 **Warning**: previous versions of LLDB defined cascading to mean not only going
1293 through typedef chains, but also through inheritance chains. This feature has
1294 been removed since it significantly degrades performance. You need to set up
1295 your formatters for every type in inheritance chains to which you want the
1296 formatter to apply.