Add gfx950 mfma instructions to ROCDL dialect (#123361)
[llvm-project.git] / llvm / docs / tutorial / MyFirstLanguageFrontend / LangImpl08.rst
blob2e3d4ed0a30873e2ecc8f82f1d02ca4be41a3665
1 ========================================
2  Kaleidoscope: Compiling to Object Code
3 ========================================
5 .. contents::
6    :local:
8 Chapter 8 Introduction
9 ======================
11 Welcome to Chapter 8 of the "`Implementing a language with LLVM
12 <index.html>`_" tutorial. This chapter describes how to compile our
13 language down to object files.
15 Choosing a target
16 =================
18 LLVM has native support for cross-compilation. You can compile to the
19 architecture of your current machine, or just as easily compile for
20 other architectures. In this tutorial, we'll target the current
21 machine.
23 To specify the architecture that you want to target, we use a string
24 called a "target triple". This takes the form
25 ``<arch><sub>-<vendor>-<sys>-<abi>`` (see the `cross compilation docs
26 <https://clang.llvm.org/docs/CrossCompilation.html#target-triple>`_).
28 As an example, we can see what clang thinks is our current target
29 triple:
33     $ clang --version | grep Target
34     Target: x86_64-unknown-linux-gnu
36 Running this command may show something different on your machine as
37 you might be using a different architecture or operating system to me.
39 Fortunately, we don't need to hard-code a target triple to target the
40 current machine. LLVM provides ``sys::getDefaultTargetTriple``, which
41 returns the target triple of the current machine.
43 .. code-block:: c++
45     auto TargetTriple = sys::getDefaultTargetTriple();
47 LLVM doesn't require us to link in all the target
48 functionality. For example, if we're just using the JIT, we don't need
49 the assembly printers. Similarly, if we're only targeting certain
50 architectures, we can only link in the functionality for those
51 architectures.
53 For this example, we'll initialize all the targets for emitting object
54 code.
56 .. code-block:: c++
58     InitializeAllTargetInfos();
59     InitializeAllTargets();
60     InitializeAllTargetMCs();
61     InitializeAllAsmParsers();
62     InitializeAllAsmPrinters();
64 We can now use our target triple to get a ``Target``:
66 .. code-block:: c++
68   std::string Error;
69   auto Target = TargetRegistry::lookupTarget(TargetTriple, Error);
71   // Print an error and exit if we couldn't find the requested target.
72   // This generally occurs if we've forgotten to initialise the
73   // TargetRegistry or we have a bogus target triple.
74   if (!Target) {
75     errs() << Error;
76     return 1;
77   }
79 Target Machine
80 ==============
82 We will also need a ``TargetMachine``. This class provides a complete
83 machine description of the machine we're targeting. If we want to
84 target a specific feature (such as SSE) or a specific CPU (such as
85 Intel's Sandylake), we do so now.
87 To see which features and CPUs that LLVM knows about, we can use
88 ``llc``. For example, let's look at x86:
92     $ llvm-as < /dev/null | llc -march=x86 -mattr=help
93     Available CPUs for this target:
95       amdfam10      - Select the amdfam10 processor.
96       athlon        - Select the athlon processor.
97       athlon-4      - Select the athlon-4 processor.
98       ...
100     Available features for this target:
102       16bit-mode            - 16-bit mode (i8086).
103       32bit-mode            - 32-bit mode (80386).
104       3dnow                 - Enable 3DNow! instructions.
105       3dnowa                - Enable 3DNow! Athlon instructions.
106       ...
108 For our example, we'll use the generic CPU without any additional feature or
109 target option.
111 .. code-block:: c++
113   auto CPU = "generic";
114   auto Features = "";
116   TargetOptions opt;
117   auto TargetMachine = Target->createTargetMachine(TargetTriple, CPU, Features, opt, Reloc::PIC_);
120 Configuring the Module
121 ======================
123 We're now ready to configure our module, to specify the target and
124 data layout. This isn't strictly necessary, but the `frontend
125 performance guide <../../Frontend/PerformanceTips.html>`_ recommends
126 this. Optimizations benefit from knowing about the target and data
127 layout.
129 .. code-block:: c++
131   TheModule->setDataLayout(TargetMachine->createDataLayout());
132   TheModule->setTargetTriple(TargetTriple);
134 Emit Object Code
135 ================
137 We're ready to emit object code! Let's define where we want to write
138 our file to:
140 .. code-block:: c++
142   auto Filename = "output.o";
143   std::error_code EC;
144   raw_fd_ostream dest(Filename, EC, sys::fs::OF_None);
146   if (EC) {
147     errs() << "Could not open file: " << EC.message();
148     return 1;
149   }
151 Finally, we define a pass that emits object code, then we run that
152 pass:
154 .. code-block:: c++
156   legacy::PassManager pass;
157   auto FileType = CodeGenFileType::ObjectFile;
159   if (TargetMachine->addPassesToEmitFile(pass, dest, nullptr, FileType)) {
160     errs() << "TargetMachine can't emit a file of this type";
161     return 1;
162   }
164   pass.run(*TheModule);
165   dest.flush();
167 Putting It All Together
168 =======================
170 Does it work? Let's give it a try. We need to compile our code, but
171 note that the arguments to ``llvm-config`` are different to the previous chapters.
175     $ clang++ -g -O3 toy.cpp `llvm-config --cxxflags --ldflags --system-libs --libs all` -o toy
177 Let's run it, and define a simple ``average`` function. Press Ctrl-D
178 when you're done.
182     $ ./toy
183     ready> def average(x y) (x + y) * 0.5;
184     ^D
185     Wrote output.o
187 We have an object file! To test it, let's write a simple program and
188 link it with our output. Here's the source code:
190 .. code-block:: c++
192     #include <iostream>
194     extern "C" {
195         double average(double, double);
196     }
198     int main() {
199         std::cout << "average of 3.0 and 4.0: " << average(3.0, 4.0) << std::endl;
200     }
202 We link our program to output.o and check the result is what we
203 expected:
207     $ clang++ main.cpp output.o -o main
208     $ ./main
209     average of 3.0 and 4.0: 3.5
211 Full Code Listing
212 =================
214 .. literalinclude:: ../../../examples/Kaleidoscope/Chapter8/toy.cpp
215    :language: c++
217 `Next: Adding Debug Information <LangImpl09.html>`_