Fix think-o: emit all 8 bytes of the EOF marker. Also reflow a line in a
[llvm/stm8.git] / tools / llvmc / doc / LLVMC-Reference.rst
blob44d1e17f04f565f5015dffc746d66f19cdb75f1f
1 ===================================
2 Customizing LLVMC: Reference Manual
3 ===================================
4 ..
5    This file was automatically generated by rst2html.
6    Please do not edit directly!
7    The ReST source lives in the directory 'tools/llvmc/doc'.
9 .. contents::
11 .. raw:: html
13    <div class="doc_author">
14    <p>Written by <a href="mailto:foldr@codedgers.com">Mikhail Glushenkov</a></p>
15    </div>
17 Introduction
18 ============
20 LLVMC is a generic compiler driver, designed to be customizable and
21 extensible. It plays the same role for LLVM as the ``gcc`` program
22 does for GCC - LLVMC's job is essentially to transform a set of input
23 files into a set of targets depending on configuration rules and user
24 options. What makes LLVMC different is that these transformation rules
25 are completely customizable - in fact, LLVMC knows nothing about the
26 specifics of transformation (even the command-line options are mostly
27 not hard-coded) and regards the transformation structure as an
28 abstract graph. The structure of this graph is completely determined
29 by plugins, which can be either statically or dynamically linked. This
30 makes it possible to easily adapt LLVMC for other purposes - for
31 example, as a build tool for game resources.
33 Because LLVMC employs TableGen_ as its configuration language, you
34 need to be familiar with it to customize LLVMC.
36 .. _TableGen: http://llvm.org/docs/TableGenFundamentals.html
39 Compiling with LLVMC
40 ====================
42 LLVMC tries hard to be as compatible with ``gcc`` as possible,
43 although there are some small differences. Most of the time, however,
44 you shouldn't be able to notice them::
46      $ # This works as expected:
47      $ llvmc -O3 -Wall hello.cpp
48      $ ./a.out
49      hello
51 One nice feature of LLVMC is that one doesn't have to distinguish between
52 different compilers for different languages (think ``g++`` vs.  ``gcc``) - the
53 right toolchain is chosen automatically based on input language names (which
54 are, in turn, determined from file extensions). If you want to force files
55 ending with ".c" to compile as C++, use the ``-x`` option, just like you would
56 do it with ``gcc``::
58       $ # hello.c is really a C++ file
59       $ llvmc -x c++ hello.c
60       $ ./a.out
61       hello
63 On the other hand, when using LLVMC as a linker to combine several C++
64 object files you should provide the ``--linker`` option since it's
65 impossible for LLVMC to choose the right linker in that case::
67     $ llvmc -c hello.cpp
68     $ llvmc hello.o
69     [A lot of link-time errors skipped]
70     $ llvmc --linker=c++ hello.o
71     $ ./a.out
72     hello
74 By default, LLVMC uses ``llvm-gcc`` to compile the source code. It is also
75 possible to choose the ``clang`` compiler with the ``-clang`` option.
78 Predefined options
79 ==================
81 LLVMC has some built-in options that can't be overridden in the
82 configuration libraries:
84 * ``-o FILE`` - Output file name.
86 * ``-x LANGUAGE`` - Specify the language of the following input files
87   until the next -x option.
89 * ``-load PLUGIN_NAME`` - Load the specified plugin DLL. Example:
90   ``-load $LLVM_DIR/Release/lib/LLVMCSimple.so``.
92 * ``-v`` - Enable verbose mode, i.e. print out all executed commands.
94 * ``--save-temps`` - Write temporary files to the current directory and do not
95   delete them on exit. This option can also take an argument: the
96   ``--save-temps=obj`` switch will write files into the directory specified with
97   the ``-o`` option. The ``--save-temps=cwd`` and ``--save-temps`` switches are
98   both synonyms for the default behaviour.
100 * ``--temp-dir DIRECTORY`` - Store temporary files in the given directory. This
101   directory is deleted on exit unless ``--save-temps`` is specified. If
102   ``--save-temps=obj`` is also specified, ``--temp-dir`` is given the
103   precedence.
105 * ``--check-graph`` - Check the compilation for common errors like mismatched
106   output/input language names, multiple default edges and cycles. Because of
107   plugins, these checks can't be performed at compile-time. Exit with code zero
108   if no errors were found, and return the number of found errors
109   otherwise. Hidden option, useful for debugging LLVMC plugins.
111 * ``--view-graph`` - Show a graphical representation of the compilation graph
112   and exit. Requires that you have ``dot`` and ``gv`` programs installed. Hidden
113   option, useful for debugging LLVMC plugins.
115 * ``--write-graph`` - Write a ``compilation-graph.dot`` file in the current
116   directory with the compilation graph description in Graphviz format (identical
117   to the file used by the ``--view-graph`` option). The ``-o`` option can be
118   used to set the output file name. Hidden option, useful for debugging LLVMC
119   plugins.
121 * ``--help``, ``--help-hidden``, ``--version`` - These options have
122   their standard meaning.
124 Compiling LLVMC plugins
125 =======================
127 It's easiest to start working on your own LLVMC plugin by copying the
128 skeleton project which lives under ``$LLVMC_DIR/plugins/Simple``::
130    $ cd $LLVMC_DIR/plugins
131    $ cp -r Simple MyPlugin
132    $ cd MyPlugin
133    $ ls
134    Makefile PluginMain.cpp Simple.td
136 As you can see, our basic plugin consists of only two files (not
137 counting the build script). ``Simple.td`` contains TableGen
138 description of the compilation graph; its format is documented in the
139 following sections. ``PluginMain.cpp`` is just a helper file used to
140 compile the auto-generated C++ code produced from TableGen source. It
141 can also contain hook definitions (see `below`__).
143 __ hooks_
145 The first thing that you should do is to change the ``LLVMC_PLUGIN``
146 variable in the ``Makefile`` to avoid conflicts (since this variable
147 is used to name the resulting library)::
149    LLVMC_PLUGIN=MyPlugin
151 It is also a good idea to rename ``Simple.td`` to something less
152 generic::
154    $ mv Simple.td MyPlugin.td
156 To build your plugin as a dynamic library, just ``cd`` to its source
157 directory and run ``make``. The resulting file will be called
158 ``plugin_llvmc_$(LLVMC_PLUGIN).$(DLL_EXTENSION)`` (in our case,
159 ``plugin_llvmc_MyPlugin.so``). This library can be then loaded in with the
160 ``-load`` option. Example::
162     $ cd $LLVMC_DIR/plugins/Simple
163     $ make
164     $ llvmc -load $LLVM_DIR/Release/lib/plugin_llvmc_Simple.so
166 Compiling standalone LLVMC-based drivers
167 ========================================
169 By default, the ``llvmc`` executable consists of a driver core plus several
170 statically linked plugins (``Base`` and ``Clang`` at the moment). You can
171 produce a standalone LLVMC-based driver executable by linking the core with your
172 own plugins. The recommended way to do this is by starting with the provided
173 ``Skeleton`` example (``$LLVMC_DIR/example/Skeleton``)::
175     $ cd $LLVMC_DIR/example/
176     $ cp -r Skeleton mydriver
177     $ cd mydriver
178     $ vim Makefile
179     [...]
180     $ make
182 If you're compiling LLVM with different source and object directories, then you
183 must perform the following additional steps before running ``make``::
185     # LLVMC_SRC_DIR = $LLVM_SRC_DIR/tools/llvmc/
186     # LLVMC_OBJ_DIR = $LLVM_OBJ_DIR/tools/llvmc/
187     $ cp $LLVMC_SRC_DIR/example/mydriver/Makefile \
188       $LLVMC_OBJ_DIR/example/mydriver/
189     $ cd $LLVMC_OBJ_DIR/example/mydriver
190     $ make
192 Another way to do the same thing is by using the following command::
194     $ cd $LLVMC_DIR
195     $ make LLVMC_BUILTIN_PLUGINS=MyPlugin LLVMC_BASED_DRIVER_NAME=mydriver
197 This works with both srcdir == objdir and srcdir != objdir, but assumes that the
198 plugin source directory was placed under ``$LLVMC_DIR/plugins``.
200 Sometimes, you will want a 'bare-bones' version of LLVMC that has no
201 built-in plugins. It can be compiled with the following command::
203     $ cd $LLVMC_DIR
204     $ make LLVMC_BUILTIN_PLUGINS=""
207 Customizing LLVMC: the compilation graph
208 ========================================
210 Each TableGen configuration file should include the common
211 definitions::
213    include "llvm/CompilerDriver/Common.td"
215 Internally, LLVMC stores information about possible source
216 transformations in form of a graph. Nodes in this graph represent
217 tools, and edges between two nodes represent a transformation path. A
218 special "root" node is used to mark entry points for the
219 transformations. LLVMC also assigns a weight to each edge (more on
220 this later) to choose between several alternative edges.
222 The definition of the compilation graph (see file
223 ``plugins/Base/Base.td`` for an example) is just a list of edges::
225     def CompilationGraph : CompilationGraph<[
226         Edge<"root", "llvm_gcc_c">,
227         Edge<"root", "llvm_gcc_assembler">,
228         ...
230         Edge<"llvm_gcc_c", "llc">,
231         Edge<"llvm_gcc_cpp", "llc">,
232         ...
234         OptionalEdge<"llvm_gcc_c", "opt", (case (switch_on "opt"),
235                                           (inc_weight))>,
236         OptionalEdge<"llvm_gcc_cpp", "opt", (case (switch_on "opt"),
237                                                   (inc_weight))>,
238         ...
240         OptionalEdge<"llvm_gcc_assembler", "llvm_gcc_cpp_linker",
241             (case (input_languages_contain "c++"), (inc_weight),
242                   (or (parameter_equals "linker", "g++"),
243                       (parameter_equals "linker", "c++")), (inc_weight))>,
244         ...
246         ]>;
248 As you can see, the edges can be either default or optional, where
249 optional edges are differentiated by an additional ``case`` expression
250 used to calculate the weight of this edge. Notice also that we refer
251 to tools via their names (as strings). This makes it possible to add
252 edges to an existing compilation graph in plugins without having to
253 know about all tool definitions used in the graph.
255 The default edges are assigned a weight of 1, and optional edges get a
256 weight of 0 + 2*N where N is the number of tests that evaluated to
257 true in the ``case`` expression. It is also possible to provide an
258 integer parameter to ``inc_weight`` and ``dec_weight`` - in this case,
259 the weight is increased (or decreased) by the provided value instead
260 of the default 2. It is also possible to change the default weight of
261 an optional edge by using the ``default`` clause of the ``case``
262 construct.
264 When passing an input file through the graph, LLVMC picks the edge
265 with the maximum weight. To avoid ambiguity, there should be only one
266 default edge between two nodes (with the exception of the root node,
267 which gets a special treatment - there you are allowed to specify one
268 default edge *per language*).
270 When multiple plugins are loaded, their compilation graphs are merged
271 together. Since multiple edges that have the same end nodes are not
272 allowed (i.e. the graph is not a multigraph), an edge defined in
273 several plugins will be replaced by the definition from the plugin
274 that was loaded last. Plugin load order can be controlled by using the
275 plugin priority feature described above.
277 To get a visual representation of the compilation graph (useful for
278 debugging), run ``llvmc --view-graph``. You will need ``dot`` and
279 ``gsview`` installed for this to work properly.
281 Describing options
282 ==================
284 Command-line options that the plugin supports are defined by using an
285 ``OptionList``::
287     def Options : OptionList<[
288     (switch_option "E", (help "Help string")),
289     (alias_option "quiet", "q")
290     ...
291     ]>;
293 As you can see, the option list is just a list of DAGs, where each DAG
294 is an option description consisting of the option name and some
295 properties. A plugin can define more than one option list (they are
296 all merged together in the end), which can be handy if one wants to
297 separate option groups syntactically.
299 * Possible option types:
301    - ``switch_option`` - a simple boolean switch without arguments, for example
302      ``-O2`` or ``-time``. At most one occurrence is allowed by default.
304    - ``parameter_option`` - option that takes one argument, for example
305      ``-std=c99``. It is also allowed to use spaces instead of the equality
306      sign: ``-std c99``. At most one occurrence is allowed.
308    - ``parameter_list_option`` - same as the above, but more than one option
309      occurrence is allowed.
311    - ``prefix_option`` - same as the parameter_option, but the option name and
312      argument do not have to be separated. Example: ``-ofile``. This can be also
313      specified as ``-o file``; however, ``-o=file`` will be parsed incorrectly
314      (``=file`` will be interpreted as option value). At most one occurrence is
315      allowed.
317    - ``prefix_list_option`` - same as the above, but more than one occurrence of
318      the option is allowed; example: ``-lm -lpthread``.
320    - ``alias_option`` - a special option type for creating aliases. Unlike other
321      option types, aliases are not allowed to have any properties besides the
322      aliased option name.
323      Usage example: ``(alias_option "preprocess", "E")``
325    - ``switch_list_option`` - like ``switch_option`` with the ``zero_or_more``
326      property, but remembers how many times the switch was turned on. Useful
327      mostly for forwarding. Example: when ``-foo`` is a switch option (with the
328      ``zero_or_more`` property), the command ``driver -foo -foo`` is forwarded
329      as ``some-tool -foo``, but when ``-foo`` is a switch list, the same command
330      is forwarded as ``some-tool -foo -foo``.
333 * Possible option properties:
335    - ``help`` - help string associated with this option. Used for ``--help``
336      output.
338    - ``required`` - this option must be specified exactly once (or, in case of
339      the list options without the ``multi_val`` property, at least
340      once). Incompatible with ``optional`` and ``one_or_more``.
342    - ``optional`` - the option can be specified either zero times or exactly
343      once. The default for switch options. Useful only for list options in
344      conjunction with ``multi_val``. Incompatible with ``required``,
345      ``zero_or_more`` and ``one_or_more``.
347    - ``one_or_more`` - the option must be specified at least once. Can be useful
348      to allow switch options be both obligatory and be specified multiple
349      times. For list options is useful only in conjunction with ``multi_val``;
350      for ordinary it is synonymous with ``required``. Incompatible with
351      ``required``, ``optional`` and ``zero_or_more``.
353    - ``zero_or_more`` - the option can be specified zero or more times. Useful
354      to allow a single switch option to be specified more than
355      once. Incompatible with ``required``, ``optional`` and ``one_or_more``.
357    - ``hidden`` - the description of this option will not appear in
358      the ``--help`` output (but will appear in the ``--help-hidden``
359      output).
361    - ``really_hidden`` - the option will not be mentioned in any help
362      output.
364    - ``comma_separated`` - Indicates that any commas specified for an option's
365      value should be used to split the value up into multiple values for the
366      option. This property is valid only for list options. In conjunction with
367      ``forward_value`` can be used to implement option forwarding in style of
368      gcc's ``-Wa,``.
370    - ``multi_val n`` - this option takes *n* arguments (can be useful in some
371      special cases). Usage example: ``(parameter_list_option "foo", (multi_val
372      3))``; the command-line syntax is '-foo a b c'. Only list options can have
373      this attribute; you can, however, use the ``one_or_more``, ``optional``
374      and ``required`` properties.
376    - ``init`` - this option has a default value, either a string (if it is a
377      parameter), or a boolean (if it is a switch; as in C++, boolean constants
378      are called ``true`` and ``false``). List options can't have ``init``
379      attribute.
380      Usage examples: ``(switch_option "foo", (init true))``; ``(prefix_option
381      "bar", (init "baz"))``.
383    - ``extern`` - this option is defined in some other plugin, see `below`__.
385    __ extern_
387 .. _extern:
389 External options
390 ----------------
392 Sometimes, when linking several plugins together, one plugin needs to
393 access options defined in some other plugin. Because of the way
394 options are implemented, such options must be marked as
395 ``extern``. This is what the ``extern`` option property is
396 for. Example::
398      ...
399      (switch_option "E", (extern))
400      ...
402 If an external option has additional attributes besides 'extern', they are
403 ignored. See also the section on plugin `priorities`__.
405 __ priorities_
407 .. _case:
409 Conditional evaluation
410 ======================
412 The 'case' construct is the main means by which programmability is
413 achieved in LLVMC. It can be used to calculate edge weights, program
414 actions and modify the shell commands to be executed. The 'case'
415 expression is designed after the similarly-named construct in
416 functional languages and takes the form ``(case (test_1), statement_1,
417 (test_2), statement_2, ... (test_N), statement_N)``. The statements
418 are evaluated only if the corresponding tests evaluate to true.
420 Examples::
422     // Edge weight calculation
424     // Increases edge weight by 5 if "-A" is provided on the
425     // command-line, and by 5 more if "-B" is also provided.
426     (case
427         (switch_on "A"), (inc_weight 5),
428         (switch_on "B"), (inc_weight 5))
431     // Tool command line specification
433     // Evaluates to "cmdline1" if the option "-A" is provided on the
434     // command line; to "cmdline2" if "-B" is provided;
435     // otherwise to "cmdline3".
437     (case
438         (switch_on "A"), "cmdline1",
439         (switch_on "B"), "cmdline2",
440         (default), "cmdline3")
442 Note the slight difference in 'case' expression handling in contexts
443 of edge weights and command line specification - in the second example
444 the value of the ``"B"`` switch is never checked when switch ``"A"`` is
445 enabled, and the whole expression always evaluates to ``"cmdline1"`` in
446 that case.
448 Case expressions can also be nested, i.e. the following is legal::
450     (case (switch_on "E"), (case (switch_on "o"), ..., (default), ...)
451           (default), ...)
453 You should, however, try to avoid doing that because it hurts
454 readability. It is usually better to split tool descriptions and/or
455 use TableGen inheritance instead.
457 * Possible tests are:
459   - ``switch_on`` - Returns true if a given command-line switch is provided by
460     the user. Can be given multiple arguments, in that case ``(switch_on "foo",
461     "bar", "baz")`` is equivalent to ``(and (switch_on "foo"), (switch_on
462     "bar"), (switch_on "baz"))``.
463     Example: ``(switch_on "opt")``.
465   - ``any_switch_on`` - Given a number of switch options, returns true if any of
466     the switches is turned on.
467     Example: ``(any_switch_on "foo", "bar", "baz")`` is equivalent to ``(or
468     (switch_on "foo"), (switch_on "bar"), (switch_on "baz"))``.
470   - ``parameter_equals`` - Returns true if a command-line parameter (first
471     argument) equals a given value (second argument).
472     Example: ``(parameter_equals "W", "all")``.
474   - ``element_in_list`` - Returns true if a command-line parameter list (first
475     argument) contains a given value (second argument).
476     Example: ``(element_in_list "l", "pthread")``.
478   - ``input_languages_contain`` - Returns true if a given language
479     belongs to the current input language set.
480     Example: ``(input_languages_contain "c++")``.
482   - ``in_language`` - Evaluates to true if the input file language is equal to
483     the argument. At the moment works only with ``command`` and ``actions`` (on
484     non-join nodes).
485     Example: ``(in_language "c++")``.
487   - ``not_empty`` - Returns true if a given option (which should be either a
488     parameter or a parameter list) is set by the user. Like ``switch_on``, can
489     be also given multiple arguments.
490     Examples: ``(not_empty "o")``, ``(not_empty "o", "l")``.
492   - ``any_not_empty`` - Returns true if ``not_empty`` returns true for any of
493     the provided options.
494     Example: ``(any_not_empty "foo", "bar", "baz")`` is equivalent to ``(or
495     (not_empty "foo"), (not_empty "bar"), (not_empty "baz"))``.
497   - ``empty`` - The opposite of ``not_empty``. Equivalent to ``(not (not_empty
498     X))``. Can be given multiple arguments.
500   - ``any_not_empty`` - Returns true if ``not_empty`` returns true for any of
501     the provided options.
502     Example: ``(any_empty "foo", "bar", "baz")`` is equivalent to ``(or
503     (not_empty "foo"), (not_empty "bar"), (not_empty "baz"))``.
505   - ``single_input_file`` - Returns true if there was only one input file
506     provided on the command-line. Used without arguments:
507     ``(single_input_file)``.
509   - ``multiple_input_files`` - Equivalent to ``(not (single_input_file))`` (the
510     case of zero input files is considered an error).
512   - ``default`` - Always evaluates to true. Should always be the last
513     test in the ``case`` expression.
515   - ``and`` - A standard logical combinator that returns true iff all of
516     its arguments return true. Used like this: ``(and (test1), (test2),
517     ... (testN))``. Nesting of ``and`` and ``or`` is allowed, but not
518     encouraged.
520   - ``or`` - A logical combinator that returns true iff any of its arguments
521     return true.
522     Example: ``(or (test1), (test2), ... (testN))``.
524   - ``not`` - Standard unary logical combinator that negates its
525     argument.
526     Example: ``(not (or (test1), (test2), ... (testN)))``.
530 Writing a tool description
531 ==========================
533 As was said earlier, nodes in the compilation graph represent tools,
534 which are described separately. A tool definition looks like this
535 (taken from the ``include/llvm/CompilerDriver/Tools.td`` file)::
537   def llvm_gcc_cpp : Tool<[
538       (in_language "c++"),
539       (out_language "llvm-assembler"),
540       (output_suffix "bc"),
541       (cmd_line "llvm-g++ -c $INFILE -o $OUTFILE -emit-llvm"),
542       (sink)
543       ]>;
545 This defines a new tool called ``llvm_gcc_cpp``, which is an alias for
546 ``llvm-g++``. As you can see, a tool definition is just a list of
547 properties; most of them should be self-explanatory. The ``sink``
548 property means that this tool should be passed all command-line
549 options that aren't mentioned in the option list.
551 The complete list of all currently implemented tool properties follows.
553 * Possible tool properties:
555   - ``in_language`` - input language name. Can be given multiple arguments, in
556     case the tool supports multiple input languages.
558   - ``out_language`` - output language name. Multiple output languages are
559     allowed.
561   - ``output_suffix`` - output file suffix. Can also be changed
562     dynamically, see documentation on actions.
564   - ``cmd_line`` - the actual command used to run the tool. You can
565     use ``$INFILE`` and ``$OUTFILE`` variables, output redirection
566     with ``>``, hook invocations (``$CALL``), environment variables
567     (via ``$ENV``) and the ``case`` construct.
569   - ``join`` - this tool is a "join node" in the graph, i.e. it gets a
570     list of input files and joins them together. Used for linkers.
572   - ``sink`` - all command-line options that are not handled by other
573     tools are passed to this tool.
575   - ``actions`` - A single big ``case`` expression that specifies how
576     this tool reacts on command-line options (described in more detail
577     `below`__).
579 __ actions_
581 .. _actions:
583 Actions
584 -------
586 A tool often needs to react to command-line options, and this is
587 precisely what the ``actions`` property is for. The next example
588 illustrates this feature::
590   def llvm_gcc_linker : Tool<[
591       (in_language "object-code"),
592       (out_language "executable"),
593       (output_suffix "out"),
594       (cmd_line "llvm-gcc $INFILE -o $OUTFILE"),
595       (join),
596       (actions (case (not_empty "L"), (forward "L"),
597                      (not_empty "l"), (forward "l"),
598                      (not_empty "dummy"),
599                                [(append_cmd "-dummy1"), (append_cmd "-dummy2")])
600       ]>;
602 The ``actions`` tool property is implemented on top of the omnipresent
603 ``case`` expression. It associates one or more different *actions*
604 with given conditions - in the example, the actions are ``forward``,
605 which forwards a given option unchanged, and ``append_cmd``, which
606 appends a given string to the tool execution command. Multiple actions
607 can be associated with a single condition by using a list of actions
608 (used in the example to append some dummy options). The same ``case``
609 construct can also be used in the ``cmd_line`` property to modify the
610 tool command line.
612 The "join" property used in the example means that this tool behaves
613 like a linker.
615 The list of all possible actions follows.
617 * Possible actions:
619    - ``append_cmd`` - Append a string to the tool invocation command.
620      Example: ``(case (switch_on "pthread"), (append_cmd "-lpthread"))``.
622    - ``error`` - Exit with error.
623      Example: ``(error "Mixing -c and -S is not allowed!")``.
625    - ``warning`` - Print a warning.
626      Example: ``(warning "Specifying both -O1 and -O2 is meaningless!")``.
628    - ``forward`` - Forward the option unchanged.
629      Example: ``(forward "Wall")``.
631    - ``forward_as`` - Change the option's name, but forward the argument
632      unchanged.
633      Example: ``(forward_as "O0", "--disable-optimization")``.
635    - ``forward_value`` - Forward only option's value. Cannot be used with switch
636      options (since they don't have values), but works fine with lists.
637      Example: ``(forward_value "Wa,")``.
639    - ``forward_transformed_value`` - As above, but applies a hook to the
640      option's value before forwarding (see `below`__). When
641      ``forward_transformed_value`` is applied to a list
642      option, the hook must have signature
643      ``std::string hooks::HookName (const std::vector<std::string>&)``.
644      Example: ``(forward_transformed_value "m", "ConvertToMAttr")``.
646      __ hooks_
648    - ``output_suffix`` - Modify the output suffix of this tool.
649      Example: ``(output_suffix "i")``.
651    - ``stop_compilation`` - Stop compilation after this tool processes its
652      input. Used without arguments.
653      Example: ``(stop_compilation)``.
656 Language map
657 ============
659 If you are adding support for a new language to LLVMC, you'll need to
660 modify the language map, which defines mappings from file extensions
661 to language names. It is used to choose the proper toolchain(s) for a
662 given input file set. Language map definition looks like this::
664     def LanguageMap : LanguageMap<
665         [LangToSuffixes<"c++", ["cc", "cp", "cxx", "cpp", "CPP", "c++", "C"]>,
666          LangToSuffixes<"c", ["c"]>,
667          ...
668         ]>;
670 For example, without those definitions the following command wouldn't work::
672     $ llvmc hello.cpp
673     llvmc: Unknown suffix: cpp
675 The language map entries are needed only for the tools that are linked from the
676 root node. Since a tool can't have multiple output languages, for inner nodes of
677 the graph the input and output languages should match. This is enforced at
678 compile-time.
680 Option preprocessor
681 ===================
683 It is sometimes useful to run error-checking code before processing the
684 compilation graph. For example, if optimization options "-O1" and "-O2" are
685 implemented as switches, we might want to output a warning if the user invokes
686 the driver with both of these options enabled.
688 The ``OptionPreprocessor`` feature is reserved specially for these
689 occasions. Example (adapted from the built-in Base plugin)::
692     def Preprocess : OptionPreprocessor<
693     (case (not (any_switch_on "O0", "O1", "O2", "O3")),
694                (set_option "O2"),
695           (and (switch_on "O3"), (any_switch_on "O0", "O1", "O2")),
696                (unset_option "O0", "O1", "O2"),
697           (and (switch_on "O2"), (any_switch_on "O0", "O1")),
698                (unset_option "O0", "O1"),
699           (and (switch_on "O1"), (switch_on "O0")),
700                (unset_option "O0"))
701     >;
703 Here, ``OptionPreprocessor`` is used to unset all spurious ``-O`` options so
704 that they are not forwarded to the compiler. If no optimization options are
705 specified, ``-O2`` is enabled.
707 ``OptionPreprocessor`` is basically a single big ``case`` expression, which is
708 evaluated only once right after the plugin is loaded. The only allowed actions
709 in ``OptionPreprocessor`` are ``error``, ``warning``, and two special actions:
710 ``unset_option`` and ``set_option``. As their names suggest, they can be used to
711 set or unset a given option. To set an option with ``set_option``, use the
712 two-argument form: ``(set_option "parameter", VALUE)``. Here, ``VALUE`` can be
713 either a string, a string list, or a boolean constant.
715 For convenience, ``set_option`` and ``unset_option`` also work with multiple
716 arguments. That is, instead of ``[(unset_option "A"), (unset_option "B")]`` you
717 can use ``(unset_option "A", "B")``. Obviously, ``(set_option "A", "B")`` is
718 only valid if both ``A`` and ``B`` are switches.
721 More advanced topics
722 ====================
724 .. _hooks:
726 Hooks and environment variables
727 -------------------------------
729 Normally, LLVMC executes programs from the system ``PATH``. Sometimes,
730 this is not sufficient: for example, we may want to specify tool paths
731 or names in the configuration file. This can be easily achieved via
732 the hooks mechanism. To write your own hooks, just add their
733 definitions to the ``PluginMain.cpp`` or drop a ``.cpp`` file into the
734 your plugin directory. Hooks should live in the ``hooks`` namespace
735 and have the signature ``std::string hooks::MyHookName ([const char*
736 Arg0 [ const char* Arg2 [, ...]]])``. They can be used from the
737 ``cmd_line`` tool property::
739     (cmd_line "$CALL(MyHook)/path/to/file -o $CALL(AnotherHook)")
741 To pass arguments to hooks, use the following syntax::
743     (cmd_line "$CALL(MyHook, 'Arg1', 'Arg2', 'Arg # 3')/path/to/file -o1 -o2")
745 It is also possible to use environment variables in the same manner::
747    (cmd_line "$ENV(VAR1)/path/to/file -o $ENV(VAR2)")
749 To change the command line string based on user-provided options use
750 the ``case`` expression (documented `above`__)::
752     (cmd_line
753       (case
754         (switch_on "E"),
755            "llvm-g++ -E -x c $INFILE -o $OUTFILE",
756         (default),
757            "llvm-g++ -c -x c $INFILE -o $OUTFILE -emit-llvm"))
759 __ case_
761 .. _priorities:
763 How plugins are loaded
764 ----------------------
766 It is possible for LLVMC plugins to depend on each other. For example,
767 one can create edges between nodes defined in some other plugin. To
768 make this work, however, that plugin should be loaded first. To
769 achieve this, the concept of plugin priority was introduced. By
770 default, every plugin has priority zero; to specify the priority
771 explicitly, put the following line in your plugin's TableGen file::
773     def Priority : PluginPriority<$PRIORITY_VALUE>;
774     # Where PRIORITY_VALUE is some integer > 0
776 Plugins are loaded in order of their (increasing) priority, starting
777 with 0. Therefore, the plugin with the highest priority value will be
778 loaded last.
780 Debugging
781 ---------
783 When writing LLVMC plugins, it can be useful to get a visual view of
784 the resulting compilation graph. This can be achieved via the command
785 line option ``--view-graph``. This command assumes that Graphviz_ and
786 Ghostview_ are installed. There is also a ``--write-graph`` option that
787 creates a Graphviz source file (``compilation-graph.dot``) in the
788 current directory.
790 Another useful ``llvmc`` option is ``--check-graph``. It checks the
791 compilation graph for common errors like mismatched output/input
792 language names, multiple default edges and cycles. These checks can't
793 be performed at compile-time because the plugins can load code
794 dynamically. When invoked with ``--check-graph``, ``llvmc`` doesn't
795 perform any compilation tasks and returns the number of encountered
796 errors as its status code.
798 .. _Graphviz: http://www.graphviz.org/
799 .. _Ghostview: http://pages.cs.wisc.edu/~ghost/
801 Conditioning on the executable name
802 -----------------------------------
804 For now, the executable name (the value passed to the driver in ``argv[0]``) is
805 accessible only in the C++ code (i.e. hooks). Use the following code::
807     namespace llvmc {
808     extern const char* ProgramName;
809     }
811     namespace hooks {
813     std::string MyHook() {
814     //...
815     if (strcmp(ProgramName, "mydriver") == 0) {
816        //...
818     }
820     } // end namespace hooks
822 In general, you're encouraged not to make the behaviour dependent on the
823 executable file name, and use command-line switches instead. See for example how
824 the ``Base`` plugin behaves when it needs to choose the correct linker options
825 (think ``g++`` vs. ``gcc``).
827 .. raw:: html
829    <hr />
830    <address>
831    <a href="http://jigsaw.w3.org/css-validator/check/referer">
832    <img src="http://jigsaw.w3.org/css-validator/images/vcss-blue"
833       alt="Valid CSS" /></a>
834    <a href="http://validator.w3.org/check?uri=referer">
835    <img src="http://www.w3.org/Icons/valid-xhtml10-blue"
836       alt="Valid XHTML 1.0 Transitional"/></a>
838    <a href="mailto:foldr@codedgers.com">Mikhail Glushenkov</a><br />
839    <a href="http://llvm.org">LLVM Compiler Infrastructure</a><br />
841    Last modified: $Date: 2008-12-11 11:34:48 -0600 (Thu, 11 Dec 2008) $
842    </address>