Run DCE after a LoopFlatten test to reduce spurious output [nfc]
[llvm-project.git] / llvm / docs / TableGen / ProgRef.rst
blobe5420a05dad78c1b3d973374d72a778a8140c220
1 ===============================
2 TableGen Programmer's Reference
3 ===============================
5 .. sectnum::
7 .. contents::
8    :local:
10 Introduction
11 ============
13 The purpose of TableGen is to generate complex output files based on
14 information from source files that are significantly easier to code than the
15 output files would be, and also easier to maintain and modify over time. The
16 information is coded in a declarative style involving classes and records,
17 which are then processed by TableGen. The internalized records are passed on
18 to various *backends*, which extract information from a subset of the records
19 and generate one or more output files. These output files are typically
20 ``.inc`` files for C++, but may be any type of file that the backend
21 developer needs.
23 This document describes the LLVM TableGen facility in detail. It is intended
24 for the programmer who is using TableGen to produce code for a project. If
25 you are looking for a simple overview, check out the :doc:`TableGen Overview
26 <./index>`.  The various ``*-tblgen`` commands used to invoke TableGen are
27 described in :doc:`tblgen Family - Description to C++
28 Code<../CommandGuide/tblgen>`.
30 An example of a backend is ``RegisterInfo``, which generates the register
31 file information for a particular target machine, for use by the LLVM
32 target-independent code generator. See :doc:`TableGen Backends <./BackEnds>`
33 for a description of the LLVM TableGen backends, and :doc:`TableGen
34 Backend Developer's Guide <./BackGuide>` for a guide to writing a new
35 backend.
37 Here are a few of the things backends can do.
39 * Generate the register file information for a particular target machine.
41 * Generate the instruction definitions for a target.
43 * Generate the patterns that the code generator uses to match instructions
44   to intermediate representation (IR) nodes.
46 * Generate semantic attribute identifiers for Clang.
48 * Generate abstract syntax tree (AST) declaration node definitions for Clang.
50 * Generate AST statement node definitions for Clang.
53 Concepts
54 --------
56 TableGen source files contain two primary items: *abstract records* and
57 *concrete records*. In this and other TableGen documents, abstract records
58 are called *classes.* (These classes are different from C++ classes and do
59 not map onto them.) In addition, concrete records are usually just called
60 records, although sometimes the term *record* refers to both classes and
61 concrete records. The distinction should be clear in context.
63 Classes and concrete records have a unique *name*, either chosen by
64 the programmer or generated by TableGen. Associated with that name
65 is a list of *fields* with values and an optional list of *parent classes*
66 (sometimes called base or super classes). The fields are the primary data that
67 backends will process. Note that TableGen assigns no meanings to fields; the
68 meanings are entirely up to the backends and the programs that incorporate
69 the output of those backends.
71 .. note::
73   The term "parent class" can refer to a class that is a parent of another
74   class, and also to a class from which a concrete record inherits. This
75   nonstandard use of the term arises because TableGen treats classes and
76   concrete records similarly.
78 A backend processes some subset of the concrete records built by the
79 TableGen parser and emits the output files. These files are usually C++
80 ``.inc`` files that are included by the programs that require the data in
81 those records. However, a backend can produce any type of output files. For
82 example, it could produce a data file containing messages tagged with
83 identifiers and substitution parameters. In a complex use case such as the
84 LLVM code generator, there can be many concrete records and some of them can
85 have an unexpectedly large number of fields, resulting in large output files.
87 In order to reduce the complexity of TableGen files, classes are used to
88 abstract out groups of record fields. For example, a few classes may
89 abstract the concept of a machine register file, while other classes may
90 abstract the instruction formats, and still others may abstract the
91 individual instructions. TableGen allows an arbitrary hierarchy of classes,
92 so that the abstract classes for two concepts can share a third superclass that
93 abstracts common "sub-concepts" from the two original concepts.
95 In order to make classes more useful, a concrete record (or another class)
96 can request a class as a parent class and pass *template arguments* to it.
97 These template arguments can be used in the fields of the parent class to
98 initialize them in a custom manner. That is, record or class ``A`` can
99 request parent class ``S`` with one set of template arguments, while record or class
100 ``B`` can request ``S`` with a different set of arguments. Without template
101 arguments, many more classes would be required, one for each combination of
102 the template arguments.
104 Both classes and concrete records can include fields that are uninitialized.
105 The uninitialized "value" is represented by a question mark (``?``). Classes
106 often have uninitialized fields that are expected to be filled in when those
107 classes are inherited by concrete records. Even so, some fields of concrete
108 records may remain uninitialized.
110 TableGen provides *multiclasses* to collect a group of record definitions in
111 one place. A multiclass is a sort of macro that can be "invoked" to define
112 multiple concrete records all at once. A multiclass can inherit from other
113 multiclasses, which means that the multiclass inherits all the definitions
114 from its parent multiclasses.
116 `Appendix C: Sample Record`_ illustrates a complex record in the Intel X86
117 target and the simple way in which it is defined.
119 Source Files
120 ============
122 TableGen source files are plain ASCII text files. The files can contain
123 statements, comments, and blank lines (see `Lexical Analysis`_). The standard file
124 extension for TableGen files is ``.td``.
126 TableGen files can grow quite large, so there is an include mechanism that
127 allows one file to include the content of another file (see `Include
128 Files`_). This allows large files to be broken up into smaller ones, and
129 also provides a simple library mechanism where multiple source files can
130 include the same library file.
132 TableGen supports a simple preprocessor that can be used to conditionalize
133 portions of ``.td`` files. See `Preprocessing Facilities`_ for more
134 information.
136 Lexical Analysis
137 ================
139 The lexical and syntax notation used here is intended to imitate
140 `Python's`_ notation. In particular, for lexical definitions, the productions
141 operate at the character level and there is no implied whitespace between
142 elements. The syntax definitions operate at the token level, so there is
143 implied whitespace between tokens.
145 .. _`Python's`: http://docs.python.org/py3k/reference/introduction.html#notation
147 TableGen supports BCPL-style comments (``// ...``) and nestable C-style
148 comments (``/* ... */``).
149 TableGen also provides simple `Preprocessing Facilities`_.
151 Formfeed characters may be used freely in files to produce page breaks when
152 the file is printed for review.
154 The following are the basic punctuation tokens::
156    - + [ ] { } ( ) < > : ; . ... = ? #
158 Literals
159 --------
161 Numeric literals take one of the following forms:
163 .. productionlist::
164    TokInteger: `DecimalInteger` | `HexInteger` | `BinInteger`
165    DecimalInteger: ["+" | "-"] ("0"..."9")+
166    HexInteger: "0x" ("0"..."9" | "a"..."f" | "A"..."F")+
167    BinInteger: "0b" ("0" | "1")+
169 Observe that the :token:`DecimalInteger` token includes the optional ``+``
170 or ``-`` sign, unlike most languages where the sign would be treated as a
171 unary operator.
173 TableGen has two kinds of string literals:
175 .. productionlist::
176    TokString: '"' (non-'"' characters and escapes) '"'
177    TokCode: "[{" (shortest text not containing "}]") "}]"
179 A :token:`TokCode` is nothing more than a multi-line string literal
180 delimited by ``[{`` and ``}]``. It can break across lines and the
181 line breaks are retained in the string.
183 The current implementation accepts the following escape sequences::
185    \\ \' \" \t \n
187 Identifiers
188 -----------
190 TableGen has name- and identifier-like tokens, which are case-sensitive.
192 .. productionlist::
193    ualpha: "a"..."z" | "A"..."Z" | "_"
194    TokIdentifier: ("0"..."9")* `ualpha` (`ualpha` | "0"..."9")*
195    TokVarName: "$" `ualpha` (`ualpha` |  "0"..."9")*
197 Note that, unlike most languages, TableGen allows :token:`TokIdentifier` to
198 begin with an integer. In case of ambiguity, a token is interpreted as a
199 numeric literal rather than an identifier.
201 TableGen has the following reserved keywords, which cannot be used as
202 identifiers::
204    assert     bit           bits          class         code
205    dag        def           dump          else          false
206    foreach    defm          defset        defvar        field
207    if         in            include       int           let
208    list       multiclass    string        then          true
210 .. warning::
211   The ``field`` reserved word is deprecated, except when used with the
212   CodeEmitterGen backend where it's used to distinguish normal record
213   fields from encoding fields.
215 Bang operators
216 --------------
218 TableGen provides "bang operators" that have a wide variety of uses:
220 .. productionlist::
221    BangOperator: one of
222                : !add         !and         !cast        !con         !dag
223                : !div         !empty       !eq          !exists      !filter
224                : !find        !foldl       !foreach     !ge          !getdagarg
225                : !getdagname  !getdagop    !gt          !head        !if
226                : !interleave  !isa         !le          !listconcat  !listremove
227                : !listsplat   !logtwo      !lt          !mul         !ne
228                : !not         !or          !range       !repr        !setdagarg
229                : !setdagname  !setdagop    !shl         !size        !sra
230                : !srl         !strconcat   !sub         !subst       !substr
231                : !tail        !tolower     !toupper     !xor
233 The ``!cond`` operator has a slightly different
234 syntax compared to other bang operators, so it is defined separately:
236 .. productionlist::
237    CondOperator: !cond
239 See `Appendix A: Bang Operators`_ for a description of each bang operator.
241 Include files
242 -------------
244 TableGen has an include mechanism. The content of the included file
245 lexically replaces the ``include`` directive and is then parsed as if it was
246 originally in the main file.
248 .. productionlist::
249    IncludeDirective: "include" `TokString`
251 Portions of the main file and included files can be conditionalized using
252 preprocessor directives.
254 .. productionlist::
255    PreprocessorDirective: "#define" | "#ifdef" | "#ifndef"
257 Types
258 =====
260 The TableGen language is statically typed, using a simple but complete type
261 system. Types are used to check for errors, to perform implicit conversions,
262 and to help interface designers constrain the allowed input. Every value is
263 required to have an associated type.
265 TableGen supports a mixture of low-level types (e.g., ``bit``) and
266 high-level types (e.g., ``dag``). This flexibility allows you to describe a
267 wide range of records conveniently and compactly.
269 .. productionlist::
270    Type: "bit" | "int" | "string" | "dag"
271        :| "bits" "<" `TokInteger` ">"
272        :| "list" "<" `Type` ">"
273        :| `ClassID`
274    ClassID: `TokIdentifier`
276 ``bit``
277     A ``bit`` is a boolean value that can be 0 or 1.
279 ``int``
280     The ``int`` type represents a simple 64-bit integer value, such as 5 or
281     -42.
283 ``string``
284     The ``string`` type represents an ordered sequence of characters of arbitrary
285     length.
287 ``bits<``\ *n*\ ``>``
288     The ``bits`` type is a fixed-sized integer of arbitrary length *n* that
289     is treated as separate bits. These bits can be accessed individually.
290     A field of this type is useful for representing an instruction operation
291     code, register number, or address mode/register/displacement.  The bits of
292     the field can be set individually or as subfields. For example, in an
293     instruction address, the addressing mode, base register number, and
294     displacement can be set separately.
296 ``list<``\ *type*\ ``>``
297     This type represents a list whose elements are of the *type* specified in
298     angle brackets. The element type is arbitrary; it can even be another
299     list type. List elements are indexed from 0.
301 ``dag``
302     This type represents a nestable directed acyclic graph (DAG) of nodes.
303     Each node has an *operator* and zero or more *arguments* (or *operands*).
304     An argument can be
305     another ``dag`` object, allowing an arbitrary tree of nodes and edges.
306     As an example, DAGs are used to represent code patterns for use by
307     the code generator instruction selection algorithms. See `Directed
308     acyclic graphs (DAGs)`_ for more details;
310 :token:`ClassID`
311     Specifying a class name in a type context indicates
312     that the type of the defined value must
313     be a subclass of the specified class. This is useful in conjunction with
314     the ``list`` type; for example, to constrain the elements of the list to a
315     common base class (e.g., a ``list<Register>`` can only contain definitions
316     derived from the ``Register`` class).
317     The :token:`ClassID` must name a class that has been previously
318     declared or defined.
321 Values and Expressions
322 ======================
324 There are many contexts in TableGen statements where a value is required. A
325 common example is in the definition of a record, where each field is
326 specified by a name and an optional value. TableGen allows for a reasonable
327 number of different forms when building up value expressions. These forms
328 allow the TableGen file to be written in a syntax that is natural for the
329 application.
331 Note that all of the values have rules for converting them from one type to
332 another. For example, these rules allow you to assign a value like ``7``
333 to an entity of type ``bits<4>``.
335 .. productionlist::
336    Value: `SimpleValue` `ValueSuffix`*
337         :| `Value` "#" [`Value`]
338    ValueSuffix: "{" `RangeList` "}"
339               :| "[" `SliceElements` "]"
340               :| "." `TokIdentifier`
341    RangeList: `RangePiece` ("," `RangePiece`)*
342    RangePiece: `TokInteger`
343              :| `TokInteger` "..." `TokInteger`
344              :| `TokInteger` "-" `TokInteger`
345              :| `TokInteger` `TokInteger`
346    SliceElements: (`SliceElement` ",")* `SliceElement` ","?
347    SliceElement: `Value`
348                :| `Value` "..." `Value`
349                :| `Value` "-" `Value`
350                :| `Value` `TokInteger`
352 .. warning::
353   The peculiar last form of :token:`RangePiece` and :token:`SliceElement` is
354   due to the fact that the "``-``" is included in the :token:`TokInteger`,
355   hence ``1-5`` gets lexed as two consecutive tokens, with values ``1`` and
356   ``-5``, instead of "1", "-", and "5".
357   The use of hyphen as the range punctuation is deprecated.
359 Simple values
360 -------------
362 The :token:`SimpleValue` has a number of forms.
364 .. productionlist::
365    SimpleValue: `TokInteger` | `TokString`+ | `TokCode`
367 A value can be an integer literal, a string literal, or a code literal.
368 Multiple adjacent string literals are concatenated as in C/C++; the simple
369 value is the concatenation of the strings. Code literals become strings and
370 are then indistinguishable from them.
372 .. productionlist::
373    SimpleValue2: "true" | "false"
375 The ``true`` and ``false`` literals are essentially syntactic sugar for the
376 integer values 1 and 0. They improve the readability of TableGen files when
377 boolean values are used in field initializations, bit sequences, ``if``
378 statements, etc. When parsed, these literals are converted to integers.
380 .. note::
382   Although ``true`` and ``false`` are literal names for 1 and 0, we
383   recommend as a stylistic rule that you use them for boolean
384   values only.
386 .. productionlist::
387    SimpleValue3: "?"
389 A question mark represents an uninitialized value.
391 .. productionlist::
392    SimpleValue4: "{" [`ValueList`] "}"
393    ValueList: `ValueListNE`
394    ValueListNE: `Value` ("," `Value`)*
396 This value represents a sequence of bits, which can be used to initialize a
397 ``bits<``\ *n*\ ``>`` field (note the braces). When doing so, the values
398 must represent a total of *n* bits.
400 .. productionlist::
401    SimpleValue5: "[" `ValueList` "]" ["<" `Type` ">"]
403 This value is a list initializer (note the brackets). The values in brackets
404 are the elements of the list. The optional :token:`Type` can be used to
405 indicate a specific element type; otherwise the element type is inferred
406 from the given values. TableGen can usually infer the type, although
407 sometimes not when the value is the empty list (``[]``).
409 .. productionlist::
410    SimpleValue6: "(" `DagArg` [`DagArgList`] ")"
411    DagArgList: `DagArg` ("," `DagArg`)*
412    DagArg: `Value` [":" `TokVarName`] | `TokVarName`
414 This represents a DAG initializer (note the parentheses).  The first
415 :token:`DagArg` is called the "operator" of the DAG and must be a record.
416 See `Directed acyclic graphs (DAGs)`_ for more details.
418 .. productionlist::
419    SimpleValue7: `TokIdentifier`
421 The resulting value is the value of the entity named by the identifier. The
422 possible identifiers are described here, but the descriptions will make more
423 sense after reading the remainder of this guide.
425 .. The code for this is exceptionally abstruse. These examples are a
426    best-effort attempt.
428 * A template argument of a ``class``, such as the use of ``Bar`` in::
430      class Foo <int Bar> {
431        int Baz = Bar;
432      }
434 * The implicit template argument ``NAME`` in a ``class`` or ``multiclass``
435   definition (see `NAME`_).
437 * A field local to a ``class``, such as the use of ``Bar`` in::
439      class Foo {
440        int Bar = 5;
441        int Baz = Bar;
442      }
444 * The name of a record definition, such as the use of ``Bar`` in the
445   definition of ``Foo``::
447      def Bar : SomeClass {
448        int X = 5;
449      }
451      def Foo {
452        SomeClass Baz = Bar;
453      }
455 * A field local to a record definition, such as the use of ``Bar`` in::
457      def Foo {
458        int Bar = 5;
459        int Baz = Bar;
460      }
462   Fields inherited from the record's parent classes can be accessed the same way.
464 * A template argument of a ``multiclass``, such as the use of ``Bar`` in::
466      multiclass Foo <int Bar> {
467        def : SomeClass<Bar>;
468      }
470 * A variable defined with the ``defvar`` or ``defset`` statements.
472 * The iteration variable of a ``foreach``, such as the use of ``i`` in::
474      foreach i = 0...5 in
475        def Foo#i;
477 .. productionlist::
478    SimpleValue8: `ClassID` "<" `ArgValueList` ">"
480 This form creates a new anonymous record definition (as would be created by an
481 unnamed ``def`` inheriting from the given class with the given template
482 arguments; see `def`_) and the value is that record. A field of the record can be
483 obtained using a suffix; see `Suffixed Values`_.
485 Invoking a class in this manner can provide a simple subroutine facility.
486 See `Using Classes as Subroutines`_ for more information.
488 .. productionlist::
489    SimpleValue9: `BangOperator` ["<" `Type` ">"] "(" `ValueListNE` ")"
490               :| `CondOperator` "(" `CondClause` ("," `CondClause`)* ")"
491    CondClause: `Value` ":" `Value`
493 The bang operators provide functions that are not available with the other
494 simple values. Except in the case of ``!cond``, a bang operator takes a list
495 of arguments enclosed in parentheses and performs some function on those
496 arguments, producing a value for that bang operator. The ``!cond`` operator
497 takes a list of pairs of arguments separated by colons. See `Appendix A:
498 Bang Operators`_ for a description of each bang operator.
501 Suffixed values
502 ---------------
504 The :token:`SimpleValue` values described above can be specified with
505 certain suffixes. The purpose of a suffix is to obtain a subvalue of the
506 primary value. Here are the possible suffixes for some primary *value*.
508 *value*\ ``{17}``
509     The final value is bit 17 of the integer *value* (note the braces).
511 *value*\ ``{8...15}``
512     The final value is bits 8--15 of the integer *value*. The order of the
513     bits can be reversed by specifying ``{15...8}``.
515 *value*\ ``[i]``
516     The final value is element `i` of the list *value* (note the brackets).
517     In other words, the brackets act as a subscripting operator on the list.
518     This is the case only when a single element is specified.
520 *value*\ ``[i,]``
521     The final value is a list that contains a single element `i` of the list.
522     In short, a list slice with a single element.
524 *value*\ ``[4...7,17,2...3,4]``
525     The final value is a new list that is a slice of the list *value*.
526     The new list contains elements 4, 5, 6, 7, 17, 2, 3, and 4.
527     Elements may be included multiple times and in any order. This is the result
528     only when more than one element is specified.
530     *value*\ ``[i,m...n,j,ls]``
531         Each element may be an expression (variables, bang operators).
532         The type of `m` and `n` should be `int`.
533         The type of `i`, `j`, and `ls` should be either `int` or `list<int>`.
535 *value*\ ``.``\ *field*
536     The final value is the value of the specified *field* in the specified
537     record *value*.
539 The paste operator
540 ------------------
542 The paste operator (``#``) is the only infix operator available in TableGen
543 expressions. It allows you to concatenate strings or lists, but has a few
544 unusual features.
546 The paste operator can be used when specifying the record name in a
547 :token:`Def` or :token:`Defm` statement, in which case it must construct a
548 string. If an operand is an undefined name (:token:`TokIdentifier`) or the
549 name of a global :token:`Defvar` or :token:`Defset`, it is treated as a
550 verbatim string of characters. The value of a global name is not used.
552 The paste operator can be used in all other value expressions, in which case
553 it can construct a string or a list. Rather oddly, but consistent with the
554 previous case, if the *right-hand-side* operand is an undefined name or a
555 global name, it is treated as a verbatim string of characters. The
556 left-hand-side operand is treated normally.
558 Values can have a trailing paste operator, in which case the left-hand-side 
559 operand is concatenated to an empty string.
561 `Appendix B: Paste Operator Examples`_ presents examples of the behavior of
562 the paste operator.
564 Statements
565 ==========
567 The following statements may appear at the top level of TableGen source
568 files.
570 .. productionlist::
571    TableGenFile: (`Statement` | `IncludeDirective`
572             :| `PreprocessorDirective`)*
573    Statement: `Assert` | `Class` | `Def` | `Defm` | `Defset` | `Defvar`
574             :| `Dump`  | `Foreach` | `If` | `Let` | `MultiClass`
576 The following sections describe each of these top-level statements.
579 ``class`` --- define an abstract record class
580 ---------------------------------------------
582 A ``class`` statement defines an abstract record class from which other
583 classes and records can inherit.
585 .. productionlist::
586    Class: "class" `ClassID` [`TemplateArgList`] `RecordBody`
587    TemplateArgList: "<" `TemplateArgDecl` ("," `TemplateArgDecl`)* ">"
588    TemplateArgDecl: `Type` `TokIdentifier` ["=" `Value`]
590 A class can be parameterized by a list of "template arguments," whose values
591 can be used in the class's record body. These template arguments are
592 specified each time the class is inherited by another class or record.
594 If a template argument is not assigned a default value with ``=``, it is
595 uninitialized (has the "value" ``?``) and must be specified in the template
596 argument list when the class is inherited (required argument). If an
597 argument is assigned a default value, then it need not be specified in the
598 argument list (optional argument). In the declaration, all required template
599 arguments must precede any optional arguments. The template argument default
600 values are evaluated from left to right.
602 The :token:`RecordBody` is defined below. It can include a list of
603 parent classes from which the current class inherits, along with field
604 definitions and other statements. When a class ``C`` inherits from another
605 class ``D``, the fields of ``D`` are effectively merged into the fields of
606 ``C``.
608 A given class can only be defined once. A ``class`` statement is
609 considered to define the class if *any* of the following are true (the
610 :token:`RecordBody` elements are described below).
612 * The :token:`TemplateArgList` is present, or
613 * The :token:`ParentClassList` in the :token:`RecordBody` is present, or
614 * The :token:`Body` in the :token:`RecordBody` is present and not empty.
616 You can declare an empty class by specifying an empty :token:`TemplateArgList`
617 and an empty :token:`RecordBody`. This can serve as a restricted form of
618 forward declaration. Note that records derived from a forward-declared
619 class will inherit no fields from it, because those records are built when
620 their declarations are parsed, and thus before the class is finally defined.
622 .. _NAME:
624 Every class has an implicit template argument named ``NAME`` (uppercase),
625 which is bound to the name of the :token:`Def` or :token:`Defm` inheriting
626 from the class. If the class is inherited by an anonymous record, the name
627 is unspecified but globally unique.
629 See `Examples: classes and records`_ for examples.
631 Record Bodies
632 `````````````
634 Record bodies appear in both class and record definitions. A record body can
635 include a parent class list, which specifies the classes from which the
636 current class or record inherits fields. Such classes are called the
637 parent classes of the class or record. The record body also
638 includes the main body of the definition, which contains the specification
639 of the fields of the class or record.
641 .. productionlist::
642    RecordBody: `ParentClassList` `Body`
643    ParentClassList: [":" `ParentClassListNE`]
644    ParentClassListNE: `ClassRef` ("," `ClassRef`)*
645    ClassRef: (`ClassID` | `MultiClassID`) ["<" [`ArgValueList`] ">"]
646    ArgValueList: `PostionalArgValueList` [","] `NamedArgValueList`
647    PostionalArgValueList: [`Value` {"," `Value`}*]
648    NamedArgValueList: [`NameValue` "=" `Value` {"," `NameValue` "=" `Value`}*]
650 A :token:`ParentClassList` containing a :token:`MultiClassID` is valid only
651 in the class list of a ``defm`` statement. In that case, the ID must be the
652 name of a multiclass.
654 The argument values can be specified in two forms:
656 * Positional argument (``value``). The value is assigned to the argument in the
657   corresponding position. For ``Foo<a0, a1>``, ``a0`` will be assigned to first
658   argument and ``a1`` will be assigned to second argument.
659 * Named argument (``name=value``). The value is assigned to the argument with
660   the specified name. For ``Foo<a=a0, b=a1>``, ``a0`` will be assigned to the
661   argument with name ``a`` and ``a1`` will be assigned to the argument with
662   name ``b``.
664 Required arguments can alse be specified as named argument.
666 Note that the argument can only be specified once regardless of the way (named
667 or positional) to specify and positional arguments should be put before named
668 arguments.
670 .. productionlist::
671    Body: ";" | "{" `BodyItem`* "}"
672    BodyItem: (`Type` | "code") `TokIdentifier` ["=" `Value`] ";"
673            :| "let" `TokIdentifier` ["{" `RangeList` "}"] "=" `Value` ";"
674            :| "defvar" `TokIdentifier` "=" `Value` ";"
675            :| `Assert`
677 A field definition in the body specifies a field to be included in the class
678 or record. If no initial value is specified, then the field's value is
679 uninitialized. The type must be specified; TableGen will not infer it from
680 the value. The keyword ``code`` may be used to emphasize that the field
681 has a string value that is code.
683 The ``let`` form is used to reset a field to a new value. This can be done
684 for fields defined directly in the body or fields inherited from parent
685 classes.  A :token:`RangeList` can be specified to reset certain bits in a
686 ``bit<n>`` field.
688 The ``defvar`` form defines a variable whose value can be used in other
689 value expressions within the body. The variable is not a field: it does not
690 become a field of the class or record being defined. Variables are provided
691 to hold temporary values while processing the body. See `Defvar in a Record
692 Body`_ for more details.
694 When class ``C2`` inherits from class ``C1``, it acquires all the field
695 definitions of ``C1``. As those definitions are merged into class ``C2``, any
696 template arguments passed to ``C1`` by ``C2`` are substituted into the
697 definitions. In other words, the abstract record fields defined by ``C1`` are
698 expanded with the template arguments before being merged into ``C2``.
701 .. _def:
703 ``def`` --- define a concrete record
704 ------------------------------------
706 A ``def`` statement defines a new concrete record.
708 .. productionlist::
709    Def: "def" [`NameValue`] `RecordBody`
710    NameValue: `Value` (parsed in a special mode)
712 The name value is optional. If specified, it is parsed in a special mode
713 where undefined (unrecognized) identifiers are interpreted as literal
714 strings. In particular, global identifiers are considered unrecognized.
715 These include global variables defined by ``defvar`` and ``defset``. A
716 record name can be the null string.
718 If no name value is given, the record is *anonymous*. The final name of an
719 anonymous record is unspecified but globally unique.
721 Special handling occurs if a ``def`` appears inside a ``multiclass``
722 statement. See the ``multiclass`` section below for details.
724 A record can inherit from one or more classes by specifying the
725 :token:`ParentClassList` clause at the beginning of its record body. All of
726 the fields in the parent classes are added to the record. If two or more
727 parent classes provide the same field, the record ends up with the field value
728 of the last parent class.
730 As a special case, the name of a record can be passed as a template argument
731 to that record's parent classes. For example:
733 .. code-block:: text
735   class A <dag d> {
736     dag the_dag = d;
737   }
739   def rec1 : A<(ops rec1)>;
741 The DAG ``(ops rec1)`` is passed as a template argument to class ``A``. Notice
742 that the DAG includes ``rec1``, the record being defined.
744 The steps taken to create a new record are somewhat complex. See `How
745 records are built`_.
747 See `Examples: classes and records`_ for examples.
750 Examples: classes and records
751 -----------------------------
753 Here is a simple TableGen file with one class and two record definitions.
755 .. code-block:: text
757   class C {
758     bit V = true;
759   }
761   def X : C;
762   def Y : C {
763     let V = false;
764     string Greeting = "Hello!";
765   }
767 First, the abstract class ``C`` is defined. It has one field named ``V``
768 that is a bit initialized to true.
770 Next, two records are defined, derived from class ``C``; that is, with ``C``
771 as their parent class. Thus they both inherit the ``V`` field. Record ``Y``
772 also defines another string field, ``Greeting``, which is initialized to
773 ``"Hello!"``. In addition, ``Y`` overrides the inherited ``V`` field,
774 setting it to false.
776 A class is useful for isolating the common features of multiple records in
777 one place. A class can initialize common fields to default values, but
778 records inheriting from that class can override the defaults.
780 TableGen supports the definition of parameterized classes as well as
781 nonparameterized ones. Parameterized classes specify a list of variable
782 declarations, which may optionally have defaults, that are bound when the
783 class is specified as a parent class of another class or record.
785 .. code-block:: text
787   class FPFormat <bits<3> val> {
788     bits<3> Value = val;
789   }
791   def NotFP      : FPFormat<0>;
792   def ZeroArgFP  : FPFormat<1>;
793   def OneArgFP   : FPFormat<2>;
794   def OneArgFPRW : FPFormat<3>;
795   def TwoArgFP   : FPFormat<4>;
796   def CompareFP  : FPFormat<5>;
797   def CondMovFP  : FPFormat<6>;
798   def SpecialFP  : FPFormat<7>;
800 The purpose of the ``FPFormat`` class is to act as a sort of enumerated
801 type. It provides a single field, ``Value``, which holds a 3-bit number. Its
802 template argument, ``val``, is used to set the ``Value`` field.  Each of the
803 eight records is defined with ``FPFormat`` as its parent class. The
804 enumeration value is passed in angle brackets as the template argument. Each
805 record will inherent the ``Value`` field with the appropriate enumeration
806 value.
808 Here is a more complex example of classes with template arguments. First, we
809 define a class similar to the ``FPFormat`` class above. It takes a template
810 argument and uses it to initialize a field named ``Value``. Then we define
811 four records that inherit the ``Value`` field with its four different
812 integer values.
814 .. code-block:: text
816   class ModRefVal <bits<2> val> {
817     bits<2> Value = val;
818   }
820   def None   : ModRefVal<0>;
821   def Mod    : ModRefVal<1>;
822   def Ref    : ModRefVal<2>;
823   def ModRef : ModRefVal<3>;
825 This is somewhat contrived, but let's say we would like to examine the two
826 bits of the ``Value`` field independently. We can define a class that
827 accepts a ``ModRefVal`` record as a template argument and splits up its
828 value into two fields, one bit each. Then we can define records that inherit from
829 ``ModRefBits`` and so acquire two fields from it, one for each bit in the
830 ``ModRefVal`` record passed as the template argument.
832 .. code-block:: text
834   class ModRefBits <ModRefVal mrv> {
835     // Break the value up into its bits, which can provide a nice
836     // interface to the ModRefVal values.
837     bit isMod = mrv.Value{0};
838     bit isRef = mrv.Value{1};
839   }
841   // Example uses.
842   def foo   : ModRefBits<Mod>;
843   def bar   : ModRefBits<Ref>;
844   def snork : ModRefBits<ModRef>;
846 This illustrates how one class can be defined to reorganize the
847 fields in another class, thus hiding the internal representation of that
848 other class.
850 Running ``llvm-tblgen`` on the example prints the following definitions:
852 .. code-block:: text
854   def bar {      // Value
855     bit isMod = 0;
856     bit isRef = 1;
857   }
858   def foo {      // Value
859     bit isMod = 1;
860     bit isRef = 0;
861   }
862   def snork {      // Value
863     bit isMod = 1;
864     bit isRef = 1;
865   }
867 ``let`` --- override fields in classes or records
868 -------------------------------------------------
870 A ``let`` statement collects a set of field values (sometimes called
871 *bindings*) and applies them to all the classes and records defined by
872 statements within the scope of the ``let``.
874 .. productionlist::
875    Let:  "let" `LetList` "in" "{" `Statement`* "}"
876       :| "let" `LetList` "in" `Statement`
877    LetList: `LetItem` ("," `LetItem`)*
878    LetItem: `TokIdentifier` ["<" `RangeList` ">"] "=" `Value`
880 The ``let`` statement establishes a scope, which is a sequence of statements
881 in braces or a single statement with no braces. The bindings in the
882 :token:`LetList` apply to the statements in that scope.
884 The field names in the :token:`LetList` must name fields in classes inherited by
885 the classes and records defined in the statements. The field values are
886 applied to the classes and records *after* the records inherit all the fields from
887 their parent classes. So the ``let`` acts to override inherited field
888 values. A ``let`` cannot override the value of a template argument.
890 Top-level ``let`` statements are often useful when a few fields need to be
891 overridden in several records. Here are two examples. Note that ``let``
892 statements can be nested.
894 .. code-block:: text
896   let isTerminator = true, isReturn = true, isBarrier = true, hasCtrlDep = true in
897     def RET : I<0xC3, RawFrm, (outs), (ins), "ret", [(X86retflag 0)]>;
899   let isCall = true in
900     // All calls clobber the non-callee saved registers...
901     let Defs = [EAX, ECX, EDX, FP0, FP1, FP2, FP3, FP4, FP5, FP6, ST0,
902                 MM0, MM1, MM2, MM3, MM4, MM5, MM6, MM7, XMM0, XMM1, XMM2,
903                 XMM3, XMM4, XMM5, XMM6, XMM7, EFLAGS] in {
904       def CALLpcrel32 : Ii32<0xE8, RawFrm, (outs), (ins i32imm:$dst, variable_ops),
905                              "call\t${dst:call}", []>;
906       def CALL32r     : I<0xFF, MRM2r, (outs), (ins GR32:$dst, variable_ops),
907                           "call\t{*}$dst", [(X86call GR32:$dst)]>;
908       def CALL32m     : I<0xFF, MRM2m, (outs), (ins i32mem:$dst, variable_ops),
909                           "call\t{*}$dst", []>;
910     }
912 Note that a top-level ``let`` will not override fields defined in the classes or records
913 themselves.
916 ``multiclass`` --- define multiple records
917 ------------------------------------------
919 While classes with template arguments are a good way to factor out commonality
920 between multiple records, multiclasses allow a convenient method for
921 defining many records at once. For example, consider a 3-address
922 instruction architecture whose instructions come in two formats: ``reg = reg
923 op reg`` and ``reg = reg op imm`` (e.g., SPARC). We would like to specify in
924 one place that these two common formats exist, then in a separate place
925 specify what all the operations are. The ``multiclass`` and ``defm``
926 statements accomplish this goal. You can think of a multiclass as a macro or
927 template that expands into multiple records.
929 .. productionlist::
930    MultiClass: "multiclass" `TokIdentifier` [`TemplateArgList`]
931              : `ParentClassList`
932              : "{" `MultiClassStatement`+ "}"
933    MultiClassID: `TokIdentifier`
934    MultiClassStatement: `Assert` | `Def` | `Defm` | `Defvar` | `Foreach` | `If` | `Let`
936 As with regular classes, the multiclass has a name and can accept template
937 arguments. A multiclass can inherit from other multiclasses, which causes
938 the other multiclasses to be expanded and contribute to the record
939 definitions in the inheriting multiclass. The body of the multiclass
940 contains a series of statements that define records, using :token:`Def` and
941 :token:`Defm`. In addition, :token:`Defvar`, :token:`Foreach`, and
942 :token:`Let` statements can be used to factor out even more common elements.
943 The :token:`If` and :token:`Assert` statements can also be used.
945 Also as with regular classes, the multiclass has the implicit template
946 argument ``NAME`` (see NAME_). When a named (non-anonymous) record is
947 defined in a multiclass and the record's name does not include a use of the
948 template argument ``NAME``, such a use is automatically *prepended*
949 to the name.  That is, the following are equivalent inside a multiclass::
951     def Foo ...
952     def NAME # Foo ...
954 The records defined in a multiclass are created when the multiclass is
955 "instantiated" or "invoked" by a ``defm`` statement outside the multiclass
956 definition. Each ``def`` statement in the multiclass produces a record. As
957 with top-level ``def`` statements, these definitions can inherit from
958 multiple parent classes.
960 See `Examples: multiclasses and defms`_ for examples.
963 ``defm`` --- invoke multiclasses to define multiple records
964 -----------------------------------------------------------
966 Once multiclasses have been defined, you use the ``defm`` statement to
967 "invoke" them and process the multiple record definitions in those
968 multiclasses. Those record definitions are specified by ``def``
969 statements in the multiclasses, and indirectly by ``defm`` statements.
971 .. productionlist::
972    Defm: "defm" [`NameValue`] `ParentClassList` ";"
974 The optional :token:`NameValue` is formed in the same way as the name of a
975 ``def``. The :token:`ParentClassList` is a colon followed by a list of at
976 least one multiclass and any number of regular classes. The multiclasses
977 must precede the regular classes. Note that the ``defm`` does not have a
978 body.
980 This statement instantiates all the records defined in all the specified
981 multiclasses, either directly by ``def`` statements or indirectly by
982 ``defm`` statements. These records also receive the fields defined in any
983 regular classes included in the parent class list. This is useful for adding
984 a common set of fields to all the records created by the ``defm``.
986 The name is parsed in the same special mode used by ``def``. If the name is
987 not included, an unspecified but globally unique name is provided. That is,
988 the following examples end up with different names::
990     defm    : SomeMultiClass<...>;   // A globally unique name.
991     defm "" : SomeMultiClass<...>;   // An empty name.
993 The ``defm`` statement can be used in a multiclass body. When this occurs,
994 the second variant is equivalent to::
996   defm NAME : SomeMultiClass<...>;
998 More generally, when ``defm`` occurs in a multiclass and its name does not
999 include a use of the implicit template argument ``NAME``, then ``NAME`` will
1000 be prepended automatically. That is, the following are equivalent inside a
1001 multiclass::
1003     defm Foo        : SomeMultiClass<...>;
1004     defm NAME # Foo : SomeMultiClass<...>;
1006 See `Examples: multiclasses and defms`_ for examples.
1008 Examples: multiclasses and defms
1009 --------------------------------
1011 Here is a simple example using ``multiclass`` and ``defm``.  Consider a
1012 3-address instruction architecture whose instructions come in two formats:
1013 ``reg = reg op reg`` and ``reg = reg op imm`` (immediate). The SPARC is an
1014 example of such an architecture.
1016 .. code-block:: text
1018   def ops;
1019   def GPR;
1020   def Imm;
1021   class inst <int opc, string asmstr, dag operandlist>;
1023   multiclass ri_inst <int opc, string asmstr> {
1024     def _rr : inst<opc, !strconcat(asmstr, " $dst, $src1, $src2"),
1025                      (ops GPR:$dst, GPR:$src1, GPR:$src2)>;
1026     def _ri : inst<opc, !strconcat(asmstr, " $dst, $src1, $src2"),
1027                      (ops GPR:$dst, GPR:$src1, Imm:$src2)>;
1028   }
1030   // Define records for each instruction in the RR and RI formats.
1031   defm ADD : ri_inst<0b111, "add">;
1032   defm SUB : ri_inst<0b101, "sub">;
1033   defm MUL : ri_inst<0b100, "mul">;
1035 Each use of the ``ri_inst`` multiclass defines two records, one with the
1036 ``_rr`` suffix and one with ``_ri``. Recall that the name of the ``defm``
1037 that uses a multiclass is prepended to the names of the records defined in
1038 that multiclass. So the resulting definitions are named::
1040   ADD_rr, ADD_ri
1041   SUB_rr, SUB_ri
1042   MUL_rr, MUL_ri
1044 Without the ``multiclass`` feature, the instructions would have to be
1045 defined as follows.
1047 .. code-block:: text
1049   def ops;
1050   def GPR;
1051   def Imm;
1052   class inst <int opc, string asmstr, dag operandlist>;
1054   class rrinst <int opc, string asmstr>
1055     : inst<opc, !strconcat(asmstr, " $dst, $src1, $src2"),
1056              (ops GPR:$dst, GPR:$src1, GPR:$src2)>;
1058   class riinst <int opc, string asmstr>
1059     : inst<opc, !strconcat(asmstr, " $dst, $src1, $src2"),
1060              (ops GPR:$dst, GPR:$src1, Imm:$src2)>;
1062   // Define records for each instruction in the RR and RI formats.
1063   def ADD_rr : rrinst<0b111, "add">;
1064   def ADD_ri : riinst<0b111, "add">;
1065   def SUB_rr : rrinst<0b101, "sub">;
1066   def SUB_ri : riinst<0b101, "sub">;
1067   def MUL_rr : rrinst<0b100, "mul">;
1068   def MUL_ri : riinst<0b100, "mul">;
1070 A ``defm`` can be used in a multiclass to "invoke" other multiclasses and
1071 create the records defined in those multiclasses in addition to the records
1072 defined in the current multiclass. In the following example, the ``basic_s``
1073 and ``basic_p`` multiclasses contain ``defm`` statements that refer to the
1074 ``basic_r`` multiclass. The ``basic_r`` multiclass contains only ``def``
1075 statements.
1077 .. code-block:: text
1079   class Instruction <bits<4> opc, string Name> {
1080     bits<4> opcode = opc;
1081     string name = Name;
1082   }
1084   multiclass basic_r <bits<4> opc> {
1085     def rr : Instruction<opc, "rr">;
1086     def rm : Instruction<opc, "rm">;
1087   }
1089   multiclass basic_s <bits<4> opc> {
1090     defm SS : basic_r<opc>;
1091     defm SD : basic_r<opc>;
1092     def X : Instruction<opc, "x">;
1093   }
1095   multiclass basic_p <bits<4> opc> {
1096     defm PS : basic_r<opc>;
1097     defm PD : basic_r<opc>;
1098     def Y : Instruction<opc, "y">;
1099   }
1101   defm ADD : basic_s<0xf>, basic_p<0xf>;
1103 The final ``defm`` creates the following records, five from the ``basic_s``
1104 multiclass and five from the ``basic_p`` multiclass::
1106   ADDSSrr, ADDSSrm
1107   ADDSDrr, ADDSDrm
1108   ADDX
1109   ADDPSrr, ADDPSrm
1110   ADDPDrr, ADDPDrm
1111   ADDY
1113 A ``defm`` statement, both at top level and in a multiclass, can inherit
1114 from regular classes in addition to multiclasses. The rule is that the
1115 regular classes must be listed after the multiclasses, and there must be at least
1116 one multiclass.
1118 .. code-block:: text
1120   class XD {
1121     bits<4> Prefix = 11;
1122   }
1123   class XS {
1124     bits<4> Prefix = 12;
1125   }
1126   class I <bits<4> op> {
1127     bits<4> opcode = op;
1128   }
1130   multiclass R {
1131     def rr : I<4>;
1132     def rm : I<2>;
1133   }
1135   multiclass Y {
1136     defm SS : R, XD;    // First multiclass R, then regular class XD.
1137     defm SD : R, XS;
1138   }
1140   defm Instr : Y;
1142 This example will create four records, shown here in alphabetical order with
1143 their fields.
1145 .. code-block:: text
1147   def InstrSDrm {
1148     bits<4> opcode = { 0, 0, 1, 0 };
1149     bits<4> Prefix = { 1, 1, 0, 0 };
1150   }
1152   def InstrSDrr {
1153     bits<4> opcode = { 0, 1, 0, 0 };
1154     bits<4> Prefix = { 1, 1, 0, 0 };
1155   }
1157   def InstrSSrm {
1158     bits<4> opcode = { 0, 0, 1, 0 };
1159     bits<4> Prefix = { 1, 0, 1, 1 };
1160   }
1162   def InstrSSrr {
1163     bits<4> opcode = { 0, 1, 0, 0 };
1164     bits<4> Prefix = { 1, 0, 1, 1 };
1165   }
1167 It's also possible to use ``let`` statements inside multiclasses, providing
1168 another way to factor out commonality from the records, especially when
1169 using several levels of multiclass instantiations.
1171 .. code-block:: text
1173   multiclass basic_r <bits<4> opc> {
1174     let Predicates = [HasSSE2] in {
1175       def rr : Instruction<opc, "rr">;
1176       def rm : Instruction<opc, "rm">;
1177     }
1178     let Predicates = [HasSSE3] in
1179       def rx : Instruction<opc, "rx">;
1180   }
1182   multiclass basic_ss <bits<4> opc> {
1183     let IsDouble = false in
1184       defm SS : basic_r<opc>;
1186     let IsDouble = true in
1187       defm SD : basic_r<opc>;
1188   }
1190   defm ADD : basic_ss<0xf>;
1193 ``defset`` --- create a definition set
1194 --------------------------------------
1196 The ``defset`` statement is used to collect a set of records into a global
1197 list of records.
1199 .. productionlist::
1200    Defset: "defset" `Type` `TokIdentifier` "=" "{" `Statement`* "}"
1202 All records defined inside the braces via ``def`` and ``defm`` are defined
1203 as usual, and they are also collected in a global list of the given name
1204 (:token:`TokIdentifier`).
1206 The specified type must be ``list<``\ *class*\ ``>``, where *class* is some
1207 record class.  The ``defset`` statement establishes a scope for its
1208 statements. It is an error to define a record in the scope of the
1209 ``defset`` that is not of type *class*.
1211 The ``defset`` statement can be nested. The inner ``defset`` adds the
1212 records to its own set, and all those records are also added to the outer
1213 set.
1215 Anonymous records created inside initialization expressions using the
1216 ``ClassID<...>`` syntax are not collected in the set.
1219 ``defvar`` --- define a variable
1220 --------------------------------
1222 A ``defvar`` statement defines a global variable. Its value can be used
1223 throughout the statements that follow the definition.
1225 .. productionlist::
1226    Defvar: "defvar" `TokIdentifier` "=" `Value` ";"
1228 The identifier on the left of the ``=`` is defined to be a global variable
1229 whose value is given by the value expression on the right of the ``=``. The
1230 type of the variable is automatically inferred.
1232 Once a variable has been defined, it cannot be set to another value.
1234 Variables defined in a top-level ``foreach`` go out of scope at the end of
1235 each loop iteration, so their value in one iteration is not available in
1236 the next iteration.  The following ``defvar`` will not work::
1238   defvar i = !add(i, 1);
1240 Variables can also be defined with ``defvar`` in a record body. See
1241 `Defvar in a Record Body`_ for more details.
1243 ``foreach`` --- iterate over a sequence of statements
1244 -----------------------------------------------------
1246 The ``foreach`` statement iterates over a series of statements, varying a
1247 variable over a sequence of values.
1249 .. productionlist::
1250    Foreach: "foreach" `ForeachIterator` "in" "{" `Statement`* "}"
1251           :| "foreach" `ForeachIterator` "in" `Statement`
1252    ForeachIterator: `TokIdentifier` "=" ("{" `RangeList` "}" | `RangePiece` | `Value`)
1254 The body of the ``foreach`` is a series of statements in braces or a
1255 single statement with no braces. The statements are re-evaluated once for
1256 each value in the range list, range piece, or single value. On each
1257 iteration, the :token:`TokIdentifier` variable is set to the value and can
1258 be used in the statements.
1260 The statement list establishes an inner scope. Variables local to a
1261 ``foreach`` go out of scope at the end of each loop iteration, so their
1262 values do not carry over from one iteration to the next. Foreach loops may
1263 be nested.
1265 .. Note that the productions involving RangeList and RangePiece have precedence
1266    over the more generic value parsing based on the first token.
1268 .. code-block:: text
1270   foreach i = [0, 1, 2, 3] in {
1271     def R#i : Register<...>;
1272     def F#i : Register<...>;
1273   }
1275 This loop defines records named ``R0``, ``R1``, ``R2``, and ``R3``, along
1276 with ``F0``, ``F1``, ``F2``, and ``F3``.
1278 ``dump`` --- print messages to stderr
1279 -------------------------------------
1281 A ``dump`` statement prints the input string to standard error
1282 output. It is intended for debugging purpose.
1284 * At top level, the message is printed immediately.
1286 * Within a record/class/multiclass, `dump` gets evaluated at each
1287   instantiation point of the containing record.
1289 .. productionlist::
1290    Dump: "dump"  `string` ";"
1292 For example, it can be used in combination with `!repr` to investigate
1293 the values passed to a multiclass:
1295 .. code-block:: text
1297   multiclass MC<dag s> {
1298     dump "s = " # !repr(s);
1299   }
1302 ``if`` --- select statements based on a test
1303 --------------------------------------------
1305 The ``if`` statement allows one of two statement groups to be selected based
1306 on the value of an expression.
1308 .. productionlist::
1309    If: "if" `Value` "then" `IfBody`
1310      :| "if" `Value` "then" `IfBody` "else" `IfBody`
1311    IfBody: "{" `Statement`* "}" | `Statement`
1313 The value expression is evaluated. If it evaluates to true (in the same
1314 sense used by the bang operators), then the statements following the
1315 ``then`` reserved word are processed. Otherwise, if there is an ``else``
1316 reserved word, the statements following the ``else`` are processed. If the
1317 value is false and there is no ``else`` arm, no statements are processed.
1319 Because the braces around the ``then`` statements are optional, this grammar rule
1320 has the usual ambiguity with "dangling else" clauses, and it is resolved in
1321 the usual way: in a case like ``if v1 then if v2 then {...} else {...}``, the
1322 ``else`` associates with the inner ``if`` rather than the outer one.
1324 The :token:`IfBody` of the then and else arms of the ``if`` establish an
1325 inner scope. Any ``defvar`` variables defined in the bodies go out of scope
1326 when the bodies are finished (see `Defvar in a Record Body`_ for more details).
1328 The ``if`` statement can also be used in a record :token:`Body`.
1331 ``assert`` --- check that a condition is true
1332 ---------------------------------------------
1334 The ``assert`` statement checks a boolean condition to be sure that it is true
1335 and prints an error message if it is not.
1337 .. productionlist::
1338    Assert: "assert" `condition` "," `message` ";"
1340 If the boolean condition is true, the statement does nothing. If the
1341 condition is false, it prints a nonfatal error message. The **message**, which
1342 can be an arbitrary string expression, is included in the error message as a
1343 note. The exact behavior of the ``assert`` statement depends on its
1344 placement.
1346 * At top level, the assertion is checked immediately.
1348 * In a record definition, the statement is saved and all assertions are
1349   checked after the record is completely built.
1351 * In a class definition, the assertions are saved and inherited by all
1352   the subclasses and records that inherit from the class. The assertions are
1353   then checked when the records are completely built.
1355 * In a multiclass definition, the assertions are saved with the other
1356   components of the multiclass and then checked each time the multiclass
1357   is instantiated with ``defm``.
1359 Using assertions in TableGen files can simplify record checking in TableGen
1360 backends. Here is an example of an ``assert`` in two class definitions.
1362 .. code-block:: text
1364   class PersonName<string name> {
1365     assert !le(!size(name), 32), "person name is too long: " # name;
1366     string Name = name;
1367   }
1369   class Person<string name, int age> : PersonName<name> {
1370     assert !and(!ge(age, 1), !le(age, 120)), "person age is invalid: " # age;
1371     int Age = age;
1372   }
1374   def Rec20 : Person<"Donald Knuth", 60> {
1375     ...
1376   }
1379 Additional Details
1380 ==================
1382 Directed acyclic graphs (DAGs)
1383 ------------------------------
1385 A directed acyclic graph can be represented directly in TableGen using the
1386 ``dag`` datatype. A DAG node consists of an operator and zero or more
1387 arguments (or operands). Each argument can be of any desired type. By using
1388 another DAG node as an argument, an arbitrary graph of DAG nodes can be
1389 built.
1391 The syntax of a ``dag`` instance is:
1393   ``(`` *operator* *argument1*\ ``,`` *argument2*\ ``,`` ... ``)``
1395 The operator must be present and must be a record. There can be zero or more
1396 arguments, separated by commas. The operator and arguments can have three
1397 formats.
1399 ====================== =============================================
1400 Format                 Meaning
1401 ====================== =============================================
1402 *value*                argument value
1403 *value*\ ``:``\ *name* argument value and associated name
1404 *name*                 argument name with unset (uninitialized) value
1405 ====================== =============================================
1407 The *value* can be any TableGen value. The *name*, if present, must be a
1408 :token:`TokVarName`, which starts with a dollar sign (``$``). The purpose of
1409 a name is to tag an operator or argument in a DAG with a particular meaning,
1410 or to associate an argument in one DAG with a like-named argument in another
1411 DAG.
1413 The following bang operators are useful for working with DAGs:
1414 ``!con``, ``!dag``, ``!empty``, ``!foreach``, ``!getdagarg``, ``!getdagname``,
1415 ``!getdagop``, ``!setdagarg``, ``!setdagname``, ``!setdagop``, ``!size``.
1417 Defvar in a record body
1418 -----------------------
1420 In addition to defining global variables, the ``defvar`` statement can
1421 be used inside the :token:`Body` of a class or record definition to define
1422 local variables. Template arguments of ``class`` or ``multiclass`` can be
1423 used in the value expression. The scope of the variable extends from the
1424 ``defvar`` statement to the end of the body. It cannot be set to a different
1425 value within its scope. The ``defvar`` statement can also be used in the statement
1426 list of a ``foreach``, which establishes a scope.
1428 A variable named ``V`` in an inner scope shadows (hides) any variables ``V``
1429 in outer scopes. In particular, there are several cases:
1431 * ``V`` in a record body shadows a global ``V``.
1433 * ``V`` in a record body shadows template argument ``V``.
1435 * ``V`` in template arguments shadows a global ``V``.
1437 * ``V`` in a ``foreach`` statement list shadows any ``V`` in surrounding record or
1438   global scopes.
1440 Variables defined in a ``foreach`` go out of scope at the end of
1441 each loop iteration, so their value in one iteration is not available in
1442 the next iteration.  The following ``defvar`` will not work::
1444   defvar i = !add(i, 1)
1446 How records are built
1447 ---------------------
1449 The following steps are taken by TableGen when a record is built. Classes are simply
1450 abstract records and so go through the same steps.
1452 1. Build the record name (:token:`NameValue`) and create an empty record.
1454 2. Parse the parent classes in the :token:`ParentClassList` from left to
1455    right, visiting each parent class's ancestor classes from top to bottom.
1457   a. Add the fields from the parent class to the record.
1458   b. Substitute the template arguments into those fields.
1459   c. Add the parent class to the record's list of inherited classes.
1461 3. Apply any top-level ``let`` bindings to the record. Recall that top-level
1462    bindings only apply to inherited fields.
1464 4. Parse the body of the record.
1466   * Add any fields to the record.
1467   * Modify the values of fields according to local ``let`` statements.
1468   * Define any ``defvar`` variables.
1470 5. Make a pass over all the fields to resolve any inter-field references.
1472 6. Add the record to the final record list.
1474 Because references between fields are resolved (step 5) after ``let`` bindings are
1475 applied (step 3), the ``let`` statement has unusual power. For example:
1477 .. code-block:: text
1479   class C <int x> {
1480     int Y = x;
1481     int Yplus1 = !add(Y, 1);
1482     int xplus1 = !add(x, 1);
1483   }
1485   let Y = 10 in {
1486     def rec1 : C<5> {
1487     }
1488   }
1490   def rec2 : C<5> {
1491     let Y = 10;
1492   }
1494 In both cases, one where a top-level ``let`` is used to bind ``Y`` and one
1495 where a local ``let`` does the same thing, the results are:
1497 .. code-block:: text
1499   def rec1 {      // C
1500     int Y = 10;
1501     int Yplus1 = 11;
1502     int xplus1 = 6;
1503   }
1504   def rec2 {      // C
1505     int Y = 10;
1506     int Yplus1 = 11;
1507     int xplus1 = 6;
1508   }
1510 ``Yplus1`` is 11 because the ``let Y`` is performed before the ``!add(Y,
1511 1)`` is resolved. Use this power wisely.
1514 Using Classes as Subroutines
1515 ============================
1517 As described in `Simple values`_, a class can be invoked in an expression
1518 and passed template arguments. This causes TableGen to create a new anonymous
1519 record inheriting from that class. As usual, the record receives all the
1520 fields defined in the class.
1522 This feature can be employed as a simple subroutine facility. The class can
1523 use the template arguments to define various variables and fields, which end
1524 up in the anonymous record. Those fields can then be retrieved in the
1525 expression invoking the class as follows. Assume that the field ``ret``
1526 contains the final value of the subroutine.
1528 .. code-block:: text
1530   int Result = ... CalcValue<arg>.ret ...;
1532 The ``CalcValue`` class is invoked with the template argument ``arg``. It
1533 calculates a value for the ``ret`` field, which is then retrieved at the
1534 "point of call" in the initialization for the Result field. The anonymous
1535 record created in this example serves no other purpose than to carry the
1536 result value.
1538 Here is a practical example. The class ``isValidSize`` determines whether a
1539 specified number of bytes represents a valid data size. The bit ``ret`` is
1540 set appropriately. The field ``ValidSize`` obtains its initial value by
1541 invoking ``isValidSize`` with the data size and retrieving the ``ret`` field
1542 from the resulting anonymous record.
1544 .. code-block:: text
1546   class isValidSize<int size> {
1547     bit ret = !cond(!eq(size,  1): 1,
1548                     !eq(size,  2): 1,
1549                     !eq(size,  4): 1,
1550                     !eq(size,  8): 1,
1551                     !eq(size, 16): 1,
1552                     true: 0);
1553   }
1555   def Data1 {
1556     int Size = ...;
1557     bit ValidSize = isValidSize<Size>.ret;
1558   }
1560 Preprocessing Facilities
1561 ========================
1563 The preprocessor embedded in TableGen is intended only for simple
1564 conditional compilation. It supports the following directives, which are
1565 specified somewhat informally.
1567 .. productionlist::
1568    LineBegin: beginning of line
1569    LineEnd: newline | return | EOF
1570    WhiteSpace: space | tab
1571    CComment: "/*" ... "*/"
1572    BCPLComment: "//" ... `LineEnd`
1573    WhiteSpaceOrCComment: `WhiteSpace` | `CComment`
1574    WhiteSpaceOrAnyComment: `WhiteSpace` | `CComment` | `BCPLComment`
1575    MacroName: `ualpha` (`ualpha` | "0"..."9")*
1576    PreDefine: `LineBegin` (`WhiteSpaceOrCComment`)*
1577             : "#define" (`WhiteSpace`)+ `MacroName`
1578             : (`WhiteSpaceOrAnyComment`)* `LineEnd`
1579    PreIfdef: `LineBegin` (`WhiteSpaceOrCComment`)*
1580            : ("#ifdef" | "#ifndef") (`WhiteSpace`)+ `MacroName`
1581            : (`WhiteSpaceOrAnyComment`)* `LineEnd`
1582    PreElse: `LineBegin` (`WhiteSpaceOrCComment`)*
1583           : "#else" (`WhiteSpaceOrAnyComment`)* `LineEnd`
1584    PreEndif: `LineBegin` (`WhiteSpaceOrCComment`)*
1585            : "#endif" (`WhiteSpaceOrAnyComment`)* `LineEnd`
1588    PreRegContentException: `PreIfdef` | `PreElse` | `PreEndif` | EOF
1589    PreRegion: .* - `PreRegContentException`
1590              :| `PreIfdef`
1591              :  (`PreRegion`)*
1592              :  [`PreElse`]
1593              :  (`PreRegion`)*
1594              :  `PreEndif`
1596 A :token:`MacroName` can be defined anywhere in a TableGen file. The name has
1597 no value; it can only be tested to see whether it is defined.
1599 A macro test region begins with an ``#ifdef`` or ``#ifndef`` directive. If
1600 the macro name is defined (``#ifdef``) or undefined (``#ifndef``), then the
1601 source code between the directive and the corresponding ``#else`` or
1602 ``#endif`` is processed. If the test fails but there is an ``#else``
1603 clause, the source code between the ``#else`` and the ``#endif`` is
1604 processed. If the test fails and there is no ``#else`` clause, then no
1605 source code in the test region is processed.
1607 Test regions may be nested, but they must be properly nested. A region
1608 started in a file must end in that file; that is, must have its
1609 ``#endif`` in the same file.
1611 A :token:`MacroName` may be defined externally using the ``-D`` option on the
1612 ``*-tblgen`` command line::
1614   llvm-tblgen self-reference.td -Dmacro1 -Dmacro3
1616 Appendix A: Bang Operators
1617 ==========================
1619 Bang operators act as functions in value expressions. A bang operator takes
1620 one or more arguments, operates on them, and produces a result. If the
1621 operator produces a boolean result, the result value will be 1 for true or 0
1622 for false. When an operator tests a boolean argument, it interprets 0 as false
1623 and non-0 as true.
1625 .. warning::
1626   The ``!getop`` and ``!setop`` bang operators are deprecated in favor of
1627   ``!getdagop`` and ``!setdagop``.
1629 ``!add(``\ *a*\ ``,`` *b*\ ``, ...)``
1630     This operator adds *a*, *b*, etc., and produces the sum.
1632 ``!and(``\ *a*\ ``,`` *b*\ ``, ...)``
1633     This operator does a bitwise AND on *a*, *b*, etc., and produces the
1634     result. A logical AND can be performed if all the arguments are either
1635     0 or 1.
1637 ``!cast<``\ *type*\ ``>(``\ *a*\ ``)``
1638     This operator performs a cast on *a* and produces the result.
1639     If *a* is not a string, then a straightforward cast is performed, say
1640     between an ``int`` and a ``bit``, or between record types. This allows
1641     casting a record to a class. If a record is cast to ``string``, the
1642     record's name is produced.
1644     If *a* is a string, then it is treated as a record name and looked up in
1645     the list of all defined records. The resulting record is expected to be of
1646     the specified *type*.
1648     For example, if ``!cast<``\ *type*\ ``>(``\ *name*\ ``)``
1649     appears in a multiclass definition, or in a
1650     class instantiated inside a multiclass definition, and the *name* does not
1651     reference any template arguments of the multiclass, then a record by
1652     that name must have been instantiated earlier
1653     in the source file. If *name* does reference
1654     a template argument, then the lookup is delayed until ``defm`` statements
1655     instantiating the multiclass (or later, if the defm occurs in another
1656     multiclass and template arguments of the inner multiclass that are
1657     referenced by *name* are substituted by values that themselves contain
1658     references to template arguments of the outer multiclass).
1660     If the type of *a* does not match *type*, TableGen raises an error.
1662 ``!con(``\ *a*\ ``,`` *b*\ ``, ...)``
1663     This operator concatenates the DAG nodes *a*, *b*, etc. Their operations
1664     must equal.
1666     ``!con((op a1:$name1, a2:$name2), (op b1:$name3))``
1668     results in the DAG node ``(op a1:$name1, a2:$name2, b1:$name3)``.
1670 ``!cond(``\ *cond1* ``:`` *val1*\ ``,`` *cond2* ``:`` *val2*\ ``, ...,`` *condn* ``:`` *valn*\ ``)``
1671     This operator tests *cond1* and returns *val1* if the result is true.
1672     If false, the operator tests *cond2* and returns *val2* if the result is
1673     true. And so forth. An error is reported if no conditions are true.
1675     This example produces the sign word for an integer::
1677     !cond(!lt(x, 0) : "negative", !eq(x, 0) : "zero", true : "positive")
1679 ``!dag(``\ *op*\ ``,`` *arguments*\ ``,`` *names*\ ``)``
1680     This operator creates a DAG node with the given operator and
1681     arguments. The *arguments* and *names* arguments must be lists
1682     of equal length or uninitialized (``?``). The *names* argument
1683     must be of type ``list<string>``.
1685     Due to limitations of the type system, *arguments* must be a list of items
1686     of a common type. In practice, this means that they should either have the
1687     same type or be records with a common parent class. Mixing ``dag`` and
1688     non-``dag`` items is not possible. However, ``?`` can be used.
1690     Example: ``!dag(op, [a1, a2, ?], ["name1", "name2", "name3"])`` results in
1691     ``(op a1-value:$name1, a2-value:$name2, ?:$name3)``.
1693 ``!div(``\ *a*\ ``,`` *b*\ ``)``
1694     This operator performs signed division of *a* by *b*, and produces the quotient.
1695     Division by 0 produces an error. Division of INT64_MIN by -1 produces an error.
1697 ``!empty(``\ *a*\ ``)``
1698     This operator produces 1 if the string, list, or DAG *a* is empty; 0 otherwise.
1699     A dag is empty if it has no arguments; the operator does not count.
1701 ``!eq(`` *a*\ `,` *b*\ ``)``
1702     This operator produces 1 if *a* is equal to *b*; 0 otherwise.
1703     The arguments must be ``bit``, ``bits``, ``int``, ``string``, or
1704     record values. Use ``!cast<string>`` to compare other types of objects.
1706 ``!exists<``\ *type*\ ``>(``\ *name*\ ``)``
1707     This operator produces 1 if a record of the given *type* whose name is *name*
1708     exists; 0 otherwise. *name* should be of type *string*.
1710 ``!filter(``\ *var*\ ``,`` *list*\ ``,`` *predicate*\ ``)``
1712     This operator creates a new ``list`` by filtering the elements in
1713     *list*. To perform the filtering, TableGen binds the variable *var* to each
1714     element and then evaluates the *predicate* expression, which presumably
1715     refers to *var*. The predicate must
1716     produce a boolean value (``bit``, ``bits``, or ``int``). The value is
1717     interpreted as with ``!if``:
1718     if the value is 0, the element is not included in the new list. If the value
1719     is anything else, the element is included.
1721 ``!find(``\ *string1*\ ``,`` *string2*\ [``,`` *start*]\ ``)``
1722     This operator searches for *string2* in *string1* and produces its
1723     position. The starting position of the search may be specified by *start*,
1724     which can range between 0 and the length of *string1*; the default is 0.
1725     If the string is not found, the result is -1.
1727 ``!foldl(``\ *init*\ ``,`` *list*\ ``,`` *acc*\ ``,`` *var*\ ``,`` *expr*\ ``)``
1728     This operator performs a left-fold over the items in *list*. The
1729     variable *acc* acts as the accumulator and is initialized to *init*.
1730     The variable *var* is bound to each element in the *list*. The
1731     expression is evaluated for each element and presumably uses *acc* and
1732     *var* to calculate the accumulated value, which ``!foldl`` stores back in
1733     *acc*. The type of *acc* is the same as *init*; the type of *var* is the
1734     same as the elements of *list*; *expr* must have the same type as *init*.
1736     The following example computes the total of the ``Number`` field in the
1737     list of records in ``RecList``::
1739       int x = !foldl(0, RecList, total, rec, !add(total, rec.Number));
1741     If your goal is to filter the list and produce a new list that includes only
1742     some of the elements, see ``!filter``.
1744 ``!foreach(``\ *var*\ ``,`` *sequence*\ ``,`` *expr*\ ``)``
1745     This operator creates a new ``list``/``dag`` in which each element is a
1746     function of the corresponding element in the *sequence* ``list``/``dag``.
1747     To perform the function, TableGen binds the variable *var* to an element
1748     and then evaluates the expression. The expression presumably refers
1749     to the variable *var* and calculates the result value.
1751     If you simply want to create a list of a certain length containing
1752     the same value repeated multiple times, see ``!listsplat``.
1754 ``!ge(``\ *a*\ `,` *b*\ ``)``
1755     This operator produces 1 if *a* is greater than or equal to *b*; 0 otherwise.
1756     The arguments must be ``bit``, ``bits``, ``int``, or ``string`` values.
1758 ``!getdagarg<``\ *type*\ ``>(``\ *dag*\ ``,``\ *key*\ ``)``
1759     This operator retrieves the argument from the given *dag* node by the
1760     specified *key*, which is either an integer index or a string name. If that
1761     argument is not convertible to the specified *type*, ``?`` is returned.
1763 ``!getdagname(``\ *dag*\ ``,``\ *index*\ ``)``
1764     This operator retrieves the argument name from the given *dag* node by the
1765     specified *index*. If that argument has no name associated, ``?`` is
1766     returned.
1768 ``!getdagop(``\ *dag*\ ``)`` --or-- ``!getdagop<``\ *type*\ ``>(``\ *dag*\ ``)``
1769     This operator produces the operator of the given *dag* node.
1770     Example: ``!getdagop((foo 1, 2))`` results in ``foo``. Recall that
1771     DAG operators are always records.
1773     The result of ``!getdagop`` can be used directly in a context where
1774     any record class at all is acceptable (typically placing it into
1775     another dag value). But in other contexts, it must be explicitly
1776     cast to a particular class. The ``<``\ *type*\ ``>`` syntax is
1777     provided to make this easy.
1779     For example, to assign the result to a value of type ``BaseClass``, you
1780     could write either of these::
1782       BaseClass b = !getdagop<BaseClass>(someDag);
1783       BaseClass b = !cast<BaseClass>(!getdagop(someDag));
1785     But to create a new DAG node that reuses the operator from another, no
1786     cast is necessary::
1788       dag d = !dag(!getdagop(someDag), args, names);
1790 ``!gt(``\ *a*\ `,` *b*\ ``)``
1791     This operator produces 1 if *a* is greater than *b*; 0 otherwise.
1792     The arguments must be ``bit``, ``bits``, ``int``, or ``string`` values.
1794 ``!head(``\ *a*\ ``)``
1795     This operator produces the zeroth element of the list *a*.
1796     (See also ``!tail``.)
1798 ``!if(``\ *test*\ ``,`` *then*\ ``,`` *else*\ ``)``
1799   This operator evaluates the *test*, which must produce a ``bit`` or
1800   ``int``. If the result is not 0, the *then* expression is produced; otherwise
1801   the *else* expression is produced.
1803 ``!interleave(``\ *list*\ ``,`` *delim*\ ``)``
1804     This operator concatenates the items in the *list*, interleaving the
1805     *delim* string between each pair, and produces the resulting string.
1806     The list can be a list of string, int, bits, or bit. An empty list
1807     results in an empty string. The delimiter can be the empty string.
1809 ``!isa<``\ *type*\ ``>(``\ *a*\ ``)``
1810     This operator produces 1 if the type of *a* is a subtype of the given *type*; 0
1811     otherwise.
1813 ``!le(``\ *a*\ ``,`` *b*\ ``)``
1814     This operator produces 1 if *a* is less than or equal to *b*; 0 otherwise.
1815     The arguments must be ``bit``, ``bits``, ``int``, or ``string`` values.
1817 ``!listconcat(``\ *list1*\ ``,`` *list2*\ ``, ...)``
1818     This operator concatenates the list arguments *list1*, *list2*, etc., and
1819     produces the resulting list. The lists must have the same element type.
1821 ``!listremove(``\ *list1*\ ``,`` *list2*\ ``)``
1822     This operator returns a copy of *list1* removing all elements that also occur in
1823     *list2*. The lists must have the same element type.
1825 ``!listsplat(``\ *value*\ ``,`` *count*\ ``)``
1826     This operator produces a list of length *count* whose elements are all
1827     equal to the *value*. For example, ``!listsplat(42, 3)`` results in
1828     ``[42, 42, 42]``.
1830 ``!logtwo(``\ *a*\ ``)``
1831     This operator produces the base 2 log of *a* and produces the integer
1832     result. The log of 0 or a negative number produces an error. This
1833     is a flooring operation.
1835 ``!lt(``\ *a*\ `,` *b*\ ``)``
1836     This operator produces 1 if *a* is less than *b*; 0 otherwise.
1837     The arguments must be ``bit``, ``bits``, ``int``, or ``string`` values.
1839 ``!mul(``\ *a*\ ``,`` *b*\ ``, ...)``
1840     This operator multiplies *a*, *b*, etc., and produces the product.
1842 ``!ne(``\ *a*\ `,` *b*\ ``)``
1843     This operator produces 1 if *a* is not equal to *b*; 0 otherwise.
1844     The arguments must be ``bit``, ``bits``, ``int``, ``string``,
1845     or record values. Use ``!cast<string>`` to compare other types of objects.
1847 ``!not(``\ *a*\ ``)``
1848     This operator performs a logical NOT on *a*, which must be
1849     an integer. The argument 0 results in 1 (true); any other
1850     argument results in 0 (false).
1852 ``!or(``\ *a*\ ``,`` *b*\ ``, ...)``
1853     This operator does a bitwise OR on *a*, *b*, etc., and produces the
1854     result. A logical OR can be performed if all the arguments are either
1855     0 or 1.
1857 ``!range([``\ *start*\ ``,]`` *end*\ ``[, ``\ *step*\ ``])``
1858     This operator produces half-open range sequence ``[start : end : step)`` as
1859     ``list<int>``. *start* is ``0`` and *step* is ``1`` by default. *step* can
1860     be negative and cannot be 0. If *start* ``<`` *end* and *step* is negative,
1861     or *start* ``>`` *end* and *step* is positive, the result is an empty list
1862     ``[]<list<int>>``.
1864     For example:
1866     * ``!range(4)`` is equivalent to ``!range(0, 4, 1)`` and the result is
1867       `[0, 1, 2, 3]`.
1868     * ``!range(1, 4)`` is equivalent to ``!range(1, 4, 1)`` and the result is
1869       `[1, 2, 3]`.
1870     * The result of ``!range(0, 4, 2)`` is `[0, 2]`.
1871     * The results of ``!range(0, 4, -1)`` and ``!range(4, 0, 1)`` are empty.
1873 ``!range(``\ *list*\ ``)``
1874     Equivalent to ``!range(0, !size(list))``.
1876 ``!repr(``\ *value*\ ``)``
1877     Represents *value* as a string. String format for the value is not
1878     guaranteed to be stable. Intended for debugging purposes only.
1880 ``!setdagarg(``\ *dag*\ ``,``\ *key*\ ``,``\ *arg*\ ``)``
1881     This operator produces a DAG node with the same operator and arguments as
1882     *dag*, but replacing the value of the argument specified by the *key* with
1883     *arg*. That *key* could be either an integer index or a string name.
1885 ``!setdagname(``\ *dag*\ ``,``\ *key*\ ``,``\ *name*\ ``)``
1886     This operator produces a DAG node with the same operator and arguments as
1887     *dag*, but replacing the name of the argument specified by the *key* with
1888     *name*. That *key* could be either an integer index or a string name.
1890 ``!setdagop(``\ *dag*\ ``,`` *op*\ ``)``
1891     This operator produces a DAG node with the same arguments as *dag*, but with its
1892     operator replaced with *op*.
1894     Example: ``!setdagop((foo 1, 2), bar)`` results in ``(bar 1, 2)``.
1896 ``!shl(``\ *a*\ ``,`` *count*\ ``)``
1897     This operator shifts *a* left logically by *count* bits and produces the resulting
1898     value. The operation is performed on a 64-bit integer; the result
1899     is undefined for shift counts outside 0...63.
1901 ``!size(``\ *a*\ ``)``
1902     This operator produces the size of the string, list, or dag *a*.
1903     The size of a DAG is the number of arguments; the operator does not count.
1905 ``!sra(``\ *a*\ ``,`` *count*\ ``)``
1906     This operator shifts *a* right arithmetically by *count* bits and produces the resulting
1907     value. The operation is performed on a 64-bit integer; the result
1908     is undefined for shift counts outside 0...63.
1910 ``!srl(``\ *a*\ ``,`` *count*\ ``)``
1911     This operator shifts *a* right logically by *count* bits and produces the resulting
1912     value. The operation is performed on a 64-bit integer; the result
1913     is undefined for shift counts outside 0...63.
1915 ``!strconcat(``\ *str1*\ ``,`` *str2*\ ``, ...)``
1916     This operator concatenates the string arguments *str1*, *str2*, etc., and
1917     produces the resulting string.
1919 ``!sub(``\ *a*\ ``,`` *b*\ ``)``
1920     This operator subtracts *b* from *a* and produces the arithmetic difference.
1922 ``!subst(``\ *target*\ ``,`` *repl*\ ``,`` *value*\ ``)``
1923     This operator replaces all occurrences of the *target* in the *value* with
1924     the *repl* and produces the resulting value. The *value* can
1925     be a string, in which case substring substitution is performed.
1927     The *value* can be a record name, in which case the operator produces the *repl*
1928     record if the *target* record name equals the *value* record name; otherwise it
1929     produces the *value*.
1931 ``!substr(``\ *string*\ ``,`` *start*\ [``,`` *length*]\ ``)``
1932     This operator extracts a substring of the given *string*. The starting
1933     position of the substring is specified by *start*, which can range
1934     between 0 and the length of the string. The length of the substring
1935     is specified by *length*; if not specified, the rest of the string is
1936     extracted. The *start* and *length* arguments must be integers.
1938 ``!tail(``\ *a*\ ``)``
1939     This operator produces a new list with all the elements
1940     of the list *a* except for the zeroth one. (See also ``!head``.)
1942 ``!tolower(``\ *a*\ ``)``
1943   This operator converts a string input *a* to lower case.
1945 ``!toupper(``\ *a*\ ``)``
1946   This operator converts a string input *a* to upper case.
1948 ``!xor(``\ *a*\ ``,`` *b*\ ``, ...)``
1949     This operator does a bitwise EXCLUSIVE OR on *a*, *b*, etc., and produces
1950     the result. A logical XOR can be performed if all the arguments are either
1951     0 or 1.
1953 Appendix B: Paste Operator Examples
1954 ===================================
1956 Here is an example illustrating the use of the paste operator in record names.
1958 .. code-block:: text
1960   defvar suffix = "_suffstring";
1961   defvar some_ints = [0, 1, 2, 3];
1963   def name # suffix {
1964   }
1966   foreach i = [1, 2] in {
1967   def rec # i {
1968   }
1969   }
1971 The first ``def`` does not use the value of the ``suffix`` variable. The
1972 second def does use the value of the ``i`` iterator variable, because it is not a
1973 global name. The following records are produced.
1975 .. code-block:: text
1977   def namesuffix {
1978   }
1979   def rec1 {
1980   }
1981   def rec2 {
1982   }
1984 Here is a second example illustrating the paste operator in field value expressions.
1986 .. code-block:: text
1988   def test {
1989     string strings = suffix # suffix;
1990     list<int> integers = some_ints # [4, 5, 6];
1991   }
1993 The ``strings`` field expression uses ``suffix`` on both sides of the paste
1994 operator. It is evaluated normally on the left hand side, but taken verbatim
1995 on the right hand side. The ``integers`` field expression uses the value of
1996 the ``some_ints`` variable and a literal list. The following record is
1997 produced.
1999 .. code-block:: text
2001   def test {
2002     string strings = "_suffstringsuffix";
2003     list<int> ints = [0, 1, 2, 3, 4, 5, 6];
2004   }
2007 Appendix C: Sample Record
2008 =========================
2010 One target machine supported by LLVM is the Intel x86. The following output
2011 from TableGen shows the record that is created to represent the 32-bit
2012 register-to-register ADD instruction.
2014 .. code-block:: text
2016   def ADD32rr { // InstructionEncoding Instruction X86Inst I ITy Sched BinOpRR BinOpRR_RF
2017     int Size = 0;
2018     string DecoderNamespace = "";
2019     list<Predicate> Predicates = [];
2020     string DecoderMethod = "";
2021     bit hasCompleteDecoder = 1;
2022     string Namespace = "X86";
2023     dag OutOperandList = (outs GR32:$dst);
2024     dag InOperandList = (ins GR32:$src1, GR32:$src2);
2025     string AsmString = "add{l}  {$src2, $src1|$src1, $src2}";
2026     EncodingByHwMode EncodingInfos = ?;
2027     list<dag> Pattern = [(set GR32:$dst, EFLAGS, (X86add_flag GR32:$src1, GR32:$src2))];
2028     list<Register> Uses = [];
2029     list<Register> Defs = [EFLAGS];
2030     int CodeSize = 3;
2031     int AddedComplexity = 0;
2032     bit isPreISelOpcode = 0;
2033     bit isReturn = 0;
2034     bit isBranch = 0;
2035     bit isEHScopeReturn = 0;
2036     bit isIndirectBranch = 0;
2037     bit isCompare = 0;
2038     bit isMoveImm = 0;
2039     bit isMoveReg = 0;
2040     bit isBitcast = 0;
2041     bit isSelect = 0;
2042     bit isBarrier = 0;
2043     bit isCall = 0;
2044     bit isAdd = 0;
2045     bit isTrap = 0;
2046     bit canFoldAsLoad = 0;
2047     bit mayLoad = ?;
2048     bit mayStore = ?;
2049     bit mayRaiseFPException = 0;
2050     bit isConvertibleToThreeAddress = 1;
2051     bit isCommutable = 1;
2052     bit isTerminator = 0;
2053     bit isReMaterializable = 0;
2054     bit isPredicable = 0;
2055     bit isUnpredicable = 0;
2056     bit hasDelaySlot = 0;
2057     bit usesCustomInserter = 0;
2058     bit hasPostISelHook = 0;
2059     bit hasCtrlDep = 0;
2060     bit isNotDuplicable = 0;
2061     bit isConvergent = 0;
2062     bit isAuthenticated = 0;
2063     bit isAsCheapAsAMove = 0;
2064     bit hasExtraSrcRegAllocReq = 0;
2065     bit hasExtraDefRegAllocReq = 0;
2066     bit isRegSequence = 0;
2067     bit isPseudo = 0;
2068     bit isExtractSubreg = 0;
2069     bit isInsertSubreg = 0;
2070     bit variadicOpsAreDefs = 0;
2071     bit hasSideEffects = ?;
2072     bit isCodeGenOnly = 0;
2073     bit isAsmParserOnly = 0;
2074     bit hasNoSchedulingInfo = 0;
2075     InstrItinClass Itinerary = NoItinerary;
2076     list<SchedReadWrite> SchedRW = [WriteALU];
2077     string Constraints = "$src1 = $dst";
2078     string DisableEncoding = "";
2079     string PostEncoderMethod = "";
2080     bits<64> TSFlags = { 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 1, 0, 1, 0, 0, 0 };
2081     string AsmMatchConverter = "";
2082     string TwoOperandAliasConstraint = "";
2083     string AsmVariantName = "";
2084     bit UseNamedOperandTable = 0;
2085     bit FastISelShouldIgnore = 0;
2086     bits<8> Opcode = { 0, 0, 0, 0, 0, 0, 0, 1 };
2087     Format Form = MRMDestReg;
2088     bits<7> FormBits = { 0, 1, 0, 1, 0, 0, 0 };
2089     ImmType ImmT = NoImm;
2090     bit ForceDisassemble = 0;
2091     OperandSize OpSize = OpSize32;
2092     bits<2> OpSizeBits = { 1, 0 };
2093     AddressSize AdSize = AdSizeX;
2094     bits<2> AdSizeBits = { 0, 0 };
2095     Prefix OpPrefix = NoPrfx;
2096     bits<3> OpPrefixBits = { 0, 0, 0 };
2097     Map OpMap = OB;
2098     bits<3> OpMapBits = { 0, 0, 0 };
2099     bit hasREX_WPrefix = 0;
2100     FPFormat FPForm = NotFP;
2101     bit hasLockPrefix = 0;
2102     Domain ExeDomain = GenericDomain;
2103     bit hasREPPrefix = 0;
2104     Encoding OpEnc = EncNormal;
2105     bits<2> OpEncBits = { 0, 0 };
2106     bit HasVEX_W = 0;
2107     bit IgnoresVEX_W = 0;
2108     bit EVEX_W1_VEX_W0 = 0;
2109     bit hasVEX_4V = 0;
2110     bit hasVEX_L = 0;
2111     bit ignoresVEX_L = 0;
2112     bit hasEVEX_K = 0;
2113     bit hasEVEX_Z = 0;
2114     bit hasEVEX_L2 = 0;
2115     bit hasEVEX_B = 0;
2116     bits<3> CD8_Form = { 0, 0, 0 };
2117     int CD8_EltSize = 0;
2118     bit hasEVEX_RC = 0;
2119     bit hasNoTrackPrefix = 0;
2120     bits<7> VectSize = { 0, 0, 1, 0, 0, 0, 0 };
2121     bits<7> CD8_Scale = { 0, 0, 0, 0, 0, 0, 0 };
2122     string FoldGenRegForm = ?;
2123     string EVEX2VEXOverride = ?;
2124     bit isMemoryFoldable = 1;
2125     bit notEVEX2VEXConvertible = 0;
2126   }
2128 On the first line of the record, you can see that the ``ADD32rr`` record
2129 inherited from eight classes. Although the inheritance hierarchy is complex,
2130 using parent classes is much simpler than specifying the 109 individual
2131 fields for each instruction.
2133 Here is the code fragment used to define ``ADD32rr`` and multiple other
2134 ``ADD`` instructions:
2136 .. code-block:: text
2138   defm ADD : ArithBinOp_RF<0x00, 0x02, 0x04, "add", MRM0r, MRM0m,
2139                            X86add_flag, add, 1, 1, 1>;
2141 The ``defm`` statement tells TableGen that ``ArithBinOp_RF`` is a
2142 multiclass, which contains multiple concrete record definitions that inherit
2143 from ``BinOpRR_RF``. That class, in turn, inherits from ``BinOpRR``, which
2144 inherits from ``ITy`` and ``Sched``, and so forth. The fields are inherited
2145 from all the parent classes; for example, ``IsIndirectBranch`` is inherited
2146 from the ``Instruction`` class.