Recommit r310809 with a fix for the spill problem
[llvm-core.git] / docs / TableGen / BackEnds.rst
blob993134386f76965299b5f64e269e19e687e881bc
1 =================
2 TableGen BackEnds
3 =================
5 .. contents::
6    :local:
8 Introduction
9 ============
11 TableGen backends are at the core of TableGen's functionality. The source files
12 provide the semantics to a generated (in memory) structure, but it's up to the
13 backend to print this out in a way that is meaningful to the user (normally a
14 C program including a file or a textual list of warnings, options and error
15 messages).
17 TableGen is used by both LLVM and Clang with very different goals. LLVM uses it
18 as a way to automate the generation of massive amounts of information regarding
19 instructions, schedules, cores and architecture features. Some backends generate
20 output that is consumed by more than one source file, so they need to be created
21 in a way that is easy to use pre-processor tricks. Some backends can also print
22 C code structures, so that they can be directly included as-is.
24 Clang, on the other hand, uses it mainly for diagnostic messages (errors,
25 warnings, tips) and attributes, so more on the textual end of the scale.
27 LLVM BackEnds
28 =============
30 .. warning::
31    This document is raw. Each section below needs three sub-sections: description
32    of its purpose with a list of users, output generated from generic input, and
33    finally why it needed a new backend (in case there's something similar).
35 Overall, each backend will take the same TableGen file type and transform into
36 similar output for different targets/uses. There is an implicit contract between
37 the TableGen files, the back-ends and their users.
39 For instance, a global contract is that each back-end produces macro-guarded
40 sections. Based on whether the file is included by a header or a source file,
41 or even in which context of each file the include is being used, you have
42 todefine a macro just before including it, to get the right output:
44 .. code-block:: c++
46   #define GET_REGINFO_TARGET_DESC
47   #include "ARMGenRegisterInfo.inc"
49 And just part of the generated file would be included. This is useful if
50 you need the same information in multiple formats (instantiation, initialization,
51 getter/setter functions, etc) from the same source TableGen file without having
52 to re-compile the TableGen file multiple times.
54 Sometimes, multiple macros might be defined before the same include file to
55 output multiple blocks:
57 .. code-block:: c++
59   #define GET_REGISTER_MATCHER
60   #define GET_SUBTARGET_FEATURE_NAME
61   #define GET_MATCHER_IMPLEMENTATION
62   #include "ARMGenAsmMatcher.inc"
64 The macros will be undef'd automatically as they're used, in the include file.
66 On all LLVM back-ends, the ``llvm-tblgen`` binary will be executed on the root
67 TableGen file ``<Target>.td``, which should include all others. This guarantees
68 that all information needed is accessible, and that no duplication is needed
69 in the TableGen files.
71 CodeEmitter
72 -----------
74 **Purpose**: CodeEmitterGen uses the descriptions of instructions and their fields to
75 construct an automated code emitter: a function that, given a MachineInstr,
76 returns the (currently, 32-bit unsigned) value of the instruction.
78 **Output**: C++ code, implementing the target's CodeEmitter
79 class by overriding the virtual functions as ``<Target>CodeEmitter::function()``.
81 **Usage**: Used to include directly at the end of ``<Target>MCCodeEmitter.cpp``.
83 RegisterInfo
84 ------------
86 **Purpose**: This tablegen backend is responsible for emitting a description of a target
87 register file for a code generator.  It uses instances of the Register,
88 RegisterAliases, and RegisterClass classes to gather this information.
90 **Output**: C++ code with enums and structures representing the register mappings,
91 properties, masks, etc.
93 **Usage**: Both on ``<Target>BaseRegisterInfo`` and ``<Target>MCTargetDesc`` (headers
94 and source files) with macros defining in which they are for declaration vs.
95 initialization issues.
97 InstrInfo
98 ---------
100 **Purpose**: This tablegen backend is responsible for emitting a description of the target
101 instruction set for the code generator. (what are the differences from CodeEmitter?)
103 **Output**: C++ code with enums and structures representing the instruction mappings,
104 properties, masks, etc.
106 **Usage**: Both on ``<Target>BaseInstrInfo`` and ``<Target>MCTargetDesc`` (headers
107 and source files) with macros defining in which they are for declaration vs.
108 initialization issues.
110 AsmWriter
111 ---------
113 **Purpose**: Emits an assembly printer for the current target.
115 **Output**: Implementation of ``<Target>InstPrinter::printInstruction()``, among
116 other things.
118 **Usage**: Included directly into ``InstPrinter/<Target>InstPrinter.cpp``.
120 AsmMatcher
121 ----------
123 **Purpose**: Emits a target specifier matcher for
124 converting parsed assembly operands in the MCInst structures. It also
125 emits a matcher for custom operand parsing. Extensive documentation is
126 written on the ``AsmMatcherEmitter.cpp`` file.
128 **Output**: Assembler parsers' matcher functions, declarations, etc.
130 **Usage**: Used in back-ends' ``AsmParser/<Target>AsmParser.cpp`` for
131 building the AsmParser class.
133 Disassembler
134 ------------
136 **Purpose**: Contains disassembler table emitters for various
137 architectures. Extensive documentation is written on the
138 ``DisassemblerEmitter.cpp`` file.
140 **Output**: Decoding tables, static decoding functions, etc.
142 **Usage**: Directly included in ``Disassembler/<Target>Disassembler.cpp``
143 to cater for all default decodings, after all hand-made ones.
145 PseudoLowering
146 --------------
148 **Purpose**: Generate pseudo instruction lowering.
150 **Output**: Implements ``<Target>AsmPrinter::emitPseudoExpansionLowering()``.
152 **Usage**: Included directly into ``<Target>AsmPrinter.cpp``.
154 CallingConv
155 -----------
157 **Purpose**: Responsible for emitting descriptions of the calling
158 conventions supported by this target.
160 **Output**: Implement static functions to deal with calling conventions
161 chained by matching styles, returning false on no match.
163 **Usage**: Used in ISelLowering and FastIsel as function pointers to
164 implementation returned by a CC selection function.
166 DAGISel
167 -------
169 **Purpose**: Generate a DAG instruction selector.
171 **Output**: Creates huge functions for automating DAG selection.
173 **Usage**: Included in ``<Target>ISelDAGToDAG.cpp`` inside the target's
174 implementation of ``SelectionDAGISel``.
176 DFAPacketizer
177 -------------
179 **Purpose**: This class parses the Schedule.td file and produces an API that
180 can be used to reason about whether an instruction can be added to a packet
181 on a VLIW architecture. The class internally generates a deterministic finite
182 automaton (DFA) that models all possible mappings of machine instructions
183 to functional units as instructions are added to a packet.
185 **Output**: Scheduling tables for GPU back-ends (Hexagon, AMD).
187 **Usage**: Included directly on ``<Target>InstrInfo.cpp``.
189 FastISel
190 --------
192 **Purpose**: This tablegen backend emits code for use by the "fast"
193 instruction selection algorithm. See the comments at the top of
194 lib/CodeGen/SelectionDAG/FastISel.cpp for background. This file
195 scans through the target's tablegen instruction-info files
196 and extracts instructions with obvious-looking patterns, and it emits
197 code to look up these instructions by type and operator.
199 **Output**: Generates ``Predicate`` and ``FastEmit`` methods.
201 **Usage**: Implements private methods of the targets' implementation
202 of ``FastISel`` class.
204 Subtarget
205 ---------
207 **Purpose**: Generate subtarget enumerations.
209 **Output**: Enums, globals, local tables for sub-target information.
211 **Usage**: Populates ``<Target>Subtarget`` and
212 ``MCTargetDesc/<Target>MCTargetDesc`` files (both headers and source).
214 Intrinsic
215 ---------
217 **Purpose**: Generate (target) intrinsic information.
219 OptParserDefs
220 -------------
222 **Purpose**: Print enum values for a class.
224 CTags
225 -----
227 **Purpose**: This tablegen backend emits an index of definitions in ctags(1)
228 format. A helper script, utils/TableGen/tdtags, provides an easier-to-use
229 interface; run 'tdtags -H' for documentation.
231 X86EVEX2VEX
232 -----------
234 **Purpose**: This X86 specific tablegen backend emits tables that map EVEX
235 encoded instructions to their VEX encoded identical instruction.
237 Clang BackEnds
238 ==============
240 ClangAttrClasses
241 ----------------
243 **Purpose**: Creates Attrs.inc, which contains semantic attribute class
244 declarations for any attribute in ``Attr.td`` that has not set ``ASTNode = 0``.
245 This file is included as part of ``Attr.h``.
247 ClangAttrParserStringSwitches
248 -----------------------------
250 **Purpose**: Creates AttrParserStringSwitches.inc, which contains
251 StringSwitch::Case statements for parser-related string switches. Each switch
252 is given its own macro (such as ``CLANG_ATTR_ARG_CONTEXT_LIST``, or
253 ``CLANG_ATTR_IDENTIFIER_ARG_LIST``), which is expected to be defined before
254 including AttrParserStringSwitches.inc, and undefined after.
256 ClangAttrImpl
257 -------------
259 **Purpose**: Creates AttrImpl.inc, which contains semantic attribute class
260 definitions for any attribute in ``Attr.td`` that has not set ``ASTNode = 0``.
261 This file is included as part of ``AttrImpl.cpp``.
263 ClangAttrList
264 -------------
266 **Purpose**: Creates AttrList.inc, which is used when a list of semantic
267 attribute identifiers is required. For instance, ``AttrKinds.h`` includes this
268 file to generate the list of ``attr::Kind`` enumeration values. This list is
269 separated out into multiple categories: attributes, inheritable attributes, and
270 inheritable parameter attributes. This categorization happens automatically
271 based on information in ``Attr.td`` and is used to implement the ``classof``
272 functionality required for ``dyn_cast`` and similar APIs.
274 ClangAttrPCHRead
275 ----------------
277 **Purpose**: Creates AttrPCHRead.inc, which is used to deserialize attributes
278 in the ``ASTReader::ReadAttributes`` function.
280 ClangAttrPCHWrite
281 -----------------
283 **Purpose**: Creates AttrPCHWrite.inc, which is used to serialize attributes in
284 the ``ASTWriter::WriteAttributes`` function.
286 ClangAttrSpellings
287 ---------------------
289 **Purpose**: Creates AttrSpellings.inc, which is used to implement the
290 ``__has_attribute`` feature test macro.
292 ClangAttrSpellingListIndex
293 --------------------------
295 **Purpose**: Creates AttrSpellingListIndex.inc, which is used to map parsed
296 attribute spellings (including which syntax or scope was used) to an attribute
297 spelling list index. These spelling list index values are internal
298 implementation details exposed via
299 ``AttributeList::getAttributeSpellingListIndex``.
301 ClangAttrVisitor
302 -------------------
304 **Purpose**: Creates AttrVisitor.inc, which is used when implementing 
305 recursive AST visitors.
307 ClangAttrTemplateInstantiate
308 ----------------------------
310 **Purpose**: Creates AttrTemplateInstantiate.inc, which implements the
311 ``instantiateTemplateAttribute`` function, used when instantiating a template
312 that requires an attribute to be cloned.
314 ClangAttrParsedAttrList
315 -----------------------
317 **Purpose**: Creates AttrParsedAttrList.inc, which is used to generate the
318 ``AttributeList::Kind`` parsed attribute enumeration.
320 ClangAttrParsedAttrImpl
321 -----------------------
323 **Purpose**: Creates AttrParsedAttrImpl.inc, which is used by
324 ``AttributeList.cpp`` to implement several functions on the ``AttributeList``
325 class. This functionality is implemented via the ``AttrInfoMap ParsedAttrInfo``
326 array, which contains one element per parsed attribute object.
328 ClangAttrParsedAttrKinds
329 ------------------------
331 **Purpose**: Creates AttrParsedAttrKinds.inc, which is used to implement the
332 ``AttributeList::getKind`` function, mapping a string (and syntax) to a parsed
333 attribute ``AttributeList::Kind`` enumeration.
335 ClangAttrDump
336 -------------
338 **Purpose**: Creates AttrDump.inc, which dumps information about an attribute.
339 It is used to implement ``ASTDumper::dumpAttr``.
341 ClangDiagsDefs
342 --------------
344 Generate Clang diagnostics definitions.
346 ClangDiagGroups
347 ---------------
349 Generate Clang diagnostic groups.
351 ClangDiagsIndexName
352 -------------------
354 Generate Clang diagnostic name index.
356 ClangCommentNodes
357 -----------------
359 Generate Clang AST comment nodes.
361 ClangDeclNodes
362 --------------
364 Generate Clang AST declaration nodes.
366 ClangStmtNodes
367 --------------
369 Generate Clang AST statement nodes.
371 ClangSACheckers
372 ---------------
374 Generate Clang Static Analyzer checkers.
376 ClangCommentHTMLTags
377 --------------------
379 Generate efficient matchers for HTML tag names that are used in documentation comments.
381 ClangCommentHTMLTagsProperties
382 ------------------------------
384 Generate efficient matchers for HTML tag properties.
386 ClangCommentHTMLNamedCharacterReferences
387 ----------------------------------------
389 Generate function to translate named character references to UTF-8 sequences.
391 ClangCommentCommandInfo
392 -----------------------
394 Generate command properties for commands that are used in documentation comments.
396 ClangCommentCommandList
397 -----------------------
399 Generate list of commands that are used in documentation comments.
401 ArmNeon
402 -------
404 Generate arm_neon.h for clang.
406 ArmNeonSema
407 -----------
409 Generate ARM NEON sema support for clang.
411 ArmNeonTest
412 -----------
414 Generate ARM NEON tests for clang.
416 AttrDocs
417 --------
419 **Purpose**: Creates ``AttributeReference.rst`` from ``AttrDocs.td``, and is
420 used for documenting user-facing attributes.
422 How to write a back-end
423 =======================
425 TODO.
427 Until we get a step-by-step HowTo for writing TableGen backends, you can at
428 least grab the boilerplate (build system, new files, etc.) from Clang's
429 r173931.
431 TODO: How they work, how to write one.  This section should not contain details
432 about any particular backend, except maybe ``-print-enums`` as an example.  This
433 should highlight the APIs in ``TableGen/Record.h``.