[llvm-exegesis] Mark x86 segment register instructions as unsupported.
[llvm-complete.git] / docs / GettingStarted.rst
blobff6b6961ffd6cb9a9c50d959759a2c04114c05cd
1 ====================================
2 Getting Started with the LLVM System
3 ====================================
5 .. contents::
6    :local:
8 Overview
9 ========
11 Welcome to LLVM! In order to get started, you first need to know some basic
12 information.
14 First, LLVM comes in three pieces. The first piece is the LLVM suite. This
15 contains all of the tools, libraries, and header files needed to use LLVM.  It
16 contains an assembler, disassembler, bitcode analyzer and bitcode optimizer.  It
17 also contains basic regression tests that can be used to test the LLVM tools and
18 the Clang front end.
20 The second piece is the `Clang <http://clang.llvm.org/>`_ front end.  This
21 component compiles C, C++, Objective C, and Objective C++ code into LLVM
22 bitcode. Once compiled into LLVM bitcode, a program can be manipulated with the
23 LLVM tools from the LLVM suite.
25 There is a third, optional piece called Test Suite.  It is a suite of programs
26 with a testing harness that can be used to further test LLVM's functionality
27 and performance.
29 Getting Started Quickly (A Summary)
30 ===================================
32 The LLVM Getting Started documentation may be out of date.  So, the `Clang
33 Getting Started <http://clang.llvm.org/get_started.html>`_ page might also be a
34 good place to start.
36 Here's the short story for getting up and running quickly with LLVM:
38 #. Read the documentation.
39 #. Read the documentation.
40 #. Remember that you were warned twice about reading the documentation.
42    * In particular, the *relative paths specified are important*.
44 #. Checkout LLVM:
46    * ``cd where-you-want-llvm-to-live``
47    * ``svn co http://llvm.org/svn/llvm-project/llvm/trunk llvm``
49 #. Checkout Clang:
51    * ``cd where-you-want-llvm-to-live``
52    * ``cd llvm/tools``
53    * ``svn co http://llvm.org/svn/llvm-project/cfe/trunk clang``
55 #. Checkout Extra Clang Tools **[Optional]**:
57    * ``cd where-you-want-llvm-to-live``
58    * ``cd llvm/tools/clang/tools``
59    * ``svn co http://llvm.org/svn/llvm-project/clang-tools-extra/trunk extra``
61 #. Checkout LLD linker **[Optional]**:
63    * ``cd where-you-want-llvm-to-live``
64    * ``cd llvm/tools``
65    * ``svn co http://llvm.org/svn/llvm-project/lld/trunk lld``
67 #. Checkout Polly Loop Optimizer **[Optional]**:
69    * ``cd where-you-want-llvm-to-live``
70    * ``cd llvm/tools``
71    * ``svn co http://llvm.org/svn/llvm-project/polly/trunk polly``
73 #. Checkout Compiler-RT (required to build the sanitizers) **[Optional]**:
75    * ``cd where-you-want-llvm-to-live``
76    * ``cd llvm/projects``
77    * ``svn co http://llvm.org/svn/llvm-project/compiler-rt/trunk compiler-rt``
79 #. Checkout Libomp (required for OpenMP support) **[Optional]**:
81    * ``cd where-you-want-llvm-to-live``
82    * ``cd llvm/projects``
83    * ``svn co http://llvm.org/svn/llvm-project/openmp/trunk openmp``
85 #. Checkout libcxx and libcxxabi **[Optional]**:
87    * ``cd where-you-want-llvm-to-live``
88    * ``cd llvm/projects``
89    * ``svn co http://llvm.org/svn/llvm-project/libcxx/trunk libcxx``
90    * ``svn co http://llvm.org/svn/llvm-project/libcxxabi/trunk libcxxabi``
92 #. Get the Test Suite Source Code **[Optional]**
94    * ``cd where-you-want-llvm-to-live``
95    * ``cd llvm/projects``
96    * ``svn co http://llvm.org/svn/llvm-project/test-suite/trunk test-suite``
98 #. Configure and build LLVM and Clang:
100    *Warning:* Make sure you've checked out *all of* the source code
101    before trying to configure with cmake.  cmake does not pickup newly
102    added source directories in incremental builds.
104    The build uses `CMake <CMake.html>`_. LLVM requires CMake 3.4.3 to build. It
105    is generally recommended to use a recent CMake, especially if you're
106    generating Ninja build files. This is because the CMake project is constantly
107    improving the quality of the generators, and the Ninja generator gets a lot
108    of attention.
110    * ``cd where you want to build llvm``
111    * ``mkdir build``
112    * ``cd build``
113    * ``cmake -G <generator> [options] <path to llvm sources>``
115      Some common generators are:
117      * ``Unix Makefiles`` --- for generating make-compatible parallel makefiles.
118      * ``Ninja`` --- for generating `Ninja <https://ninja-build.org>`_
119        build files. Most llvm developers use Ninja.
120      * ``Visual Studio`` --- for generating Visual Studio projects and
121        solutions.
122      * ``Xcode`` --- for generating Xcode projects.
124      Some Common options:
126      * ``-DCMAKE_INSTALL_PREFIX=directory`` --- Specify for *directory* the full
127        pathname of where you want the LLVM tools and libraries to be installed
128        (default ``/usr/local``).
130      * ``-DCMAKE_BUILD_TYPE=type`` --- Valid options for *type* are Debug,
131        Release, RelWithDebInfo, and MinSizeRel. Default is Debug.
133      * ``-DLLVM_ENABLE_ASSERTIONS=On`` --- Compile with assertion checks enabled
134        (default is Yes for Debug builds, No for all other build types).
136    * Run your build tool of choice!
138      * The default target (i.e. ``make``) will build all of LLVM
140      * The ``check-all`` target (i.e. ``make check-all``) will run the
141        regression tests to ensure everything is in working order.
143      * CMake will generate build targets for each tool and library, and most
144        LLVM sub-projects generate their own ``check-<project>`` target.
146      * Running a serial build will be *slow*.  Make sure you run a
147        parallel build; for ``make``, use ``make -j``.
149    * For more information see `CMake <CMake.html>`_
151    * If you get an "internal compiler error (ICE)" or test failures, see
152      `below`_.
154 Consult the `Getting Started with LLVM`_ section for detailed information on
155 configuring and compiling LLVM.  Go to `Directory Layout`_ to learn about the
156 layout of the source code tree.
158 Requirements
159 ============
161 Before you begin to use the LLVM system, review the requirements given below.
162 This may save you some trouble by knowing ahead of time what hardware and
163 software you will need.
165 Hardware
166 --------
168 LLVM is known to work on the following host platforms:
170 ================== ===================== =============
171 OS                 Arch                  Compilers
172 ================== ===================== =============
173 Linux              x86\ :sup:`1`         GCC, Clang
174 Linux              amd64                 GCC, Clang
175 Linux              ARM\ :sup:`4`         GCC, Clang
176 Linux              PowerPC               GCC, Clang
177 Solaris            V9 (Ultrasparc)       GCC
178 FreeBSD            x86\ :sup:`1`         GCC, Clang
179 FreeBSD            amd64                 GCC, Clang
180 NetBSD             x86\ :sup:`1`         GCC, Clang
181 NetBSD             amd64                 GCC, Clang
182 MacOS X\ :sup:`2`  PowerPC               GCC
183 MacOS X            x86                   GCC, Clang
184 Cygwin/Win32       x86\ :sup:`1, 3`      GCC
185 Windows            x86\ :sup:`1`         Visual Studio
186 Windows x64        x86-64                Visual Studio
187 ================== ===================== =============
189 .. note::
191   #. Code generation supported for Pentium processors and up
192   #. Code generation supported for 32-bit ABI only
193   #. To use LLVM modules on Win32-based system, you may configure LLVM
194      with ``-DBUILD_SHARED_LIBS=On``.
195   #. MCJIT not working well pre-v7, old JIT engine not supported any more.
197 Note that Debug builds require a lot of time and disk space.  An LLVM-only build
198 will need about 1-3 GB of space.  A full build of LLVM and Clang will need around
199 15-20 GB of disk space.  The exact space requirements will vary by system.  (It
200 is so large because of all the debugging information and the fact that the
201 libraries are statically linked into multiple tools).
203 If you are space-constrained, you can build only selected tools or only
204 selected targets.  The Release build requires considerably less space.
206 The LLVM suite *may* compile on other platforms, but it is not guaranteed to do
207 so.  If compilation is successful, the LLVM utilities should be able to
208 assemble, disassemble, analyze, and optimize LLVM bitcode.  Code generation
209 should work as well, although the generated native code may not work on your
210 platform.
212 Software
213 --------
215 Compiling LLVM requires that you have several software packages installed. The
216 table below lists those required packages. The Package column is the usual name
217 for the software package that LLVM depends on. The Version column provides
218 "known to work" versions of the package. The Notes column describes how LLVM
219 uses the package and provides other details.
221 =========================================================== ============ ==========================================
222 Package                                                     Version      Notes
223 =========================================================== ============ ==========================================
224 `GNU Make <http://savannah.gnu.org/projects/make>`_         3.79, 3.79.1 Makefile/build processor
225 `GCC <http://gcc.gnu.org/>`_                                >=4.8.0      C/C++ compiler\ :sup:`1`
226 `python <http://www.python.org/>`_                          >=2.7        Automated test suite\ :sup:`2`
227 `zlib <http://zlib.net>`_                                   >=1.2.3.4    Compression library\ :sup:`3`
228 =========================================================== ============ ==========================================
230 .. note::
232    #. Only the C and C++ languages are needed so there's no need to build the
233       other languages for LLVM's purposes. See `below` for specific version
234       info.
235    #. Only needed if you want to run the automated test suite in the
236       ``llvm/test`` directory.
237    #. Optional, adds compression / uncompression capabilities to selected LLVM
238       tools.
240 Additionally, your compilation host is expected to have the usual plethora of
241 Unix utilities. Specifically:
243 * **ar** --- archive library builder
244 * **bzip2** --- bzip2 command for distribution generation
245 * **bunzip2** --- bunzip2 command for distribution checking
246 * **chmod** --- change permissions on a file
247 * **cat** --- output concatenation utility
248 * **cp** --- copy files
249 * **date** --- print the current date/time
250 * **echo** --- print to standard output
251 * **egrep** --- extended regular expression search utility
252 * **find** --- find files/dirs in a file system
253 * **grep** --- regular expression search utility
254 * **gzip** --- gzip command for distribution generation
255 * **gunzip** --- gunzip command for distribution checking
256 * **install** --- install directories/files
257 * **mkdir** --- create a directory
258 * **mv** --- move (rename) files
259 * **ranlib** --- symbol table builder for archive libraries
260 * **rm** --- remove (delete) files and directories
261 * **sed** --- stream editor for transforming output
262 * **sh** --- Bourne shell for make build scripts
263 * **tar** --- tape archive for distribution generation
264 * **test** --- test things in file system
265 * **unzip** --- unzip command for distribution checking
266 * **zip** --- zip command for distribution generation
268 .. _below:
269 .. _check here:
271 Host C++ Toolchain, both Compiler and Standard Library
272 ------------------------------------------------------
274 LLVM is very demanding of the host C++ compiler, and as such tends to expose
275 bugs in the compiler. We are also planning to follow improvements and
276 developments in the C++ language and library reasonably closely. As such, we
277 require a modern host C++ toolchain, both compiler and standard library, in
278 order to build LLVM.
280 For the most popular host toolchains we check for specific minimum versions in
281 our build systems:
283 * Clang 3.1
284 * GCC 4.8
285 * Visual Studio 2015 (Update 3)
287 Anything older than these toolchains *may* work, but will require forcing the
288 build system with a special option and is not really a supported host platform.
289 Also note that older versions of these compilers have often crashed or
290 miscompiled LLVM.
292 For less widely used host toolchains such as ICC or xlC, be aware that a very
293 recent version may be required to support all of the C++ features used in LLVM.
295 We track certain versions of software that are *known* to fail when used as
296 part of the host toolchain. These even include linkers at times.
298 **GNU ld 2.16.X**. Some 2.16.X versions of the ld linker will produce very long
299 warning messages complaining that some "``.gnu.linkonce.t.*``" symbol was
300 defined in a discarded section. You can safely ignore these messages as they are
301 erroneous and the linkage is correct.  These messages disappear using ld 2.17.
303 **GNU binutils 2.17**: Binutils 2.17 contains `a bug
304 <http://sourceware.org/bugzilla/show_bug.cgi?id=3111>`__ which causes huge link
305 times (minutes instead of seconds) when building LLVM.  We recommend upgrading
306 to a newer version (2.17.50.0.4 or later).
308 **GNU Binutils 2.19.1 Gold**: This version of Gold contained `a bug
309 <http://sourceware.org/bugzilla/show_bug.cgi?id=9836>`__ which causes
310 intermittent failures when building LLVM with position independent code.  The
311 symptom is an error about cyclic dependencies.  We recommend upgrading to a
312 newer version of Gold.
314 Getting a Modern Host C++ Toolchain
315 ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
317 This section mostly applies to Linux and older BSDs. On Mac OS X, you should
318 have a sufficiently modern Xcode, or you will likely need to upgrade until you
319 do. Windows does not have a "system compiler", so you must install either Visual
320 Studio 2015 or a recent version of mingw64. FreeBSD 10.0 and newer have a modern
321 Clang as the system compiler.
323 However, some Linux distributions and some other or older BSDs sometimes have
324 extremely old versions of GCC. These steps attempt to help you upgrade you
325 compiler even on such a system. However, if at all possible, we encourage you
326 to use a recent version of a distribution with a modern system compiler that
327 meets these requirements. Note that it is tempting to install a prior
328 version of Clang and libc++ to be the host compiler, however libc++ was not
329 well tested or set up to build on Linux until relatively recently. As
330 a consequence, this guide suggests just using libstdc++ and a modern GCC as the
331 initial host in a bootstrap, and then using Clang (and potentially libc++).
333 The first step is to get a recent GCC toolchain installed. The most common
334 distribution on which users have struggled with the version requirements is
335 Ubuntu Precise, 12.04 LTS. For this distribution, one easy option is to install
336 the `toolchain testing PPA`_ and use it to install a modern GCC. There is
337 a really nice discussions of this on the `ask ubuntu stack exchange`_. However,
338 not all users can use PPAs and there are many other distributions, so it may be
339 necessary (or just useful, if you're here you *are* doing compiler development
340 after all) to build and install GCC from source. It is also quite easy to do
341 these days.
343 .. _toolchain testing PPA:
344   https://launchpad.net/~ubuntu-toolchain-r/+archive/test
345 .. _ask ubuntu stack exchange:
346   http://askubuntu.com/questions/271388/how-to-install-gcc-4-8-in-ubuntu-12-04-from-the-terminal
348 Easy steps for installing GCC 4.8.2:
350 .. code-block:: console
352   % wget https://ftp.gnu.org/gnu/gcc/gcc-4.8.2/gcc-4.8.2.tar.bz2
353   % wget https://ftp.gnu.org/gnu/gcc/gcc-4.8.2/gcc-4.8.2.tar.bz2.sig
354   % wget https://ftp.gnu.org/gnu/gnu-keyring.gpg
355   % signature_invalid=`gpg --verify --no-default-keyring --keyring ./gnu-keyring.gpg gcc-4.8.2.tar.bz2.sig`
356   % if [ $signature_invalid ]; then echo "Invalid signature" ; exit 1 ; fi
357   % tar -xvjf gcc-4.8.2.tar.bz2
358   % cd gcc-4.8.2
359   % ./contrib/download_prerequisites
360   % cd ..
361   % mkdir gcc-4.8.2-build
362   % cd gcc-4.8.2-build
363   % $PWD/../gcc-4.8.2/configure --prefix=$HOME/toolchains --enable-languages=c,c++
364   % make -j$(nproc)
365   % make install
367 For more details, check out the excellent `GCC wiki entry`_, where I got most
368 of this information from.
370 .. _GCC wiki entry:
371   http://gcc.gnu.org/wiki/InstallingGCC
373 Once you have a GCC toolchain, configure your build of LLVM to use the new
374 toolchain for your host compiler and C++ standard library. Because the new
375 version of libstdc++ is not on the system library search path, you need to pass
376 extra linker flags so that it can be found at link time (``-L``) and at runtime
377 (``-rpath``). If you are using CMake, this invocation should produce working
378 binaries:
380 .. code-block:: console
382   % mkdir build
383   % cd build
384   % CC=$HOME/toolchains/bin/gcc CXX=$HOME/toolchains/bin/g++ \
385     cmake .. -DCMAKE_CXX_LINK_FLAGS="-Wl,-rpath,$HOME/toolchains/lib64 -L$HOME/toolchains/lib64"
387 If you fail to set rpath, most LLVM binaries will fail on startup with a message
388 from the loader similar to ``libstdc++.so.6: version `GLIBCXX_3.4.20' not
389 found``. This means you need to tweak the -rpath linker flag.
391 When you build Clang, you will need to give *it* access to modern C++11
392 standard library in order to use it as your new host in part of a bootstrap.
393 There are two easy ways to do this, either build (and install) libc++ along
394 with Clang and then use it with the ``-stdlib=libc++`` compile and link flag,
395 or install Clang into the same prefix (``$HOME/toolchains`` above) as GCC.
396 Clang will look within its own prefix for libstdc++ and use it if found. You
397 can also add an explicit prefix for Clang to look in for a GCC toolchain with
398 the ``--gcc-toolchain=/opt/my/gcc/prefix`` flag, passing it to both compile and
399 link commands when using your just-built-Clang to bootstrap.
401 .. _Getting Started with LLVM:
403 Getting Started with LLVM
404 =========================
406 The remainder of this guide is meant to get you up and running with LLVM and to
407 give you some basic information about the LLVM environment.
409 The later sections of this guide describe the `general layout`_ of the LLVM
410 source tree, a `simple example`_ using the LLVM tool chain, and `links`_ to find
411 more information about LLVM or to get help via e-mail.
413 Terminology and Notation
414 ------------------------
416 Throughout this manual, the following names are used to denote paths specific to
417 the local system and working environment.  *These are not environment variables
418 you need to set but just strings used in the rest of this document below*.  In
419 any of the examples below, simply replace each of these names with the
420 appropriate pathname on your local system.  All these paths are absolute:
422 ``SRC_ROOT``
424   This is the top level directory of the LLVM source tree.
426 ``OBJ_ROOT``
428   This is the top level directory of the LLVM object tree (i.e. the tree where
429   object files and compiled programs will be placed.  It can be the same as
430   SRC_ROOT).
432 Unpacking the LLVM Archives
433 ---------------------------
435 If you have the LLVM distribution, you will need to unpack it before you can
436 begin to compile it.  LLVM is distributed as a set of two files: the LLVM suite
437 and the LLVM GCC front end compiled for your platform.  There is an additional
438 test suite that is optional.  Each file is a TAR archive that is compressed with
439 the gzip program.
441 The files are as follows, with *x.y* marking the version number:
443 ``llvm-x.y.tar.gz``
445   Source release for the LLVM libraries and tools.
447 ``llvm-test-x.y.tar.gz``
449   Source release for the LLVM test-suite.
451 .. _checkout:
453 Checkout LLVM from Subversion
454 -----------------------------
456 If you have access to our Subversion repository, you can get a fresh copy of the
457 entire source code.  All you need to do is check it out from Subversion as
458 follows:
460 * ``cd where-you-want-llvm-to-live``
461 * Read-Only: ``svn co http://llvm.org/svn/llvm-project/llvm/trunk llvm``
462 * Read-Write: ``svn co https://user@llvm.org/svn/llvm-project/llvm/trunk llvm``
464 This will create an '``llvm``' directory in the current directory and fully
465 populate it with the LLVM source code, Makefiles, test directories, and local
466 copies of documentation files.
468 If you want to get a specific release (as opposed to the most recent revision),
469 you can check it out from the '``tags``' directory (instead of '``trunk``'). The
470 following releases are located in the following subdirectories of the '``tags``'
471 directory:
473 * Release 3.5.0 and later: **RELEASE_350/final** and so on
474 * Release 2.9 through 3.4: **RELEASE_29/final** and so on
475 * Release 1.1 through 2.8: **RELEASE_11** and so on
476 * Release 1.0: **RELEASE_1**
478 If you would like to get the LLVM test suite (a separate package as of 1.4), you
479 get it from the Subversion repository:
481 .. code-block:: console
483   % cd llvm/projects
484   % svn co http://llvm.org/svn/llvm-project/test-suite/trunk test-suite
486 By placing it in the ``llvm/projects``, it will be automatically configured by
487 the LLVM cmake configuration.
489 Git Mirror
490 ----------
492 Git mirrors are available for a number of LLVM subprojects. These mirrors sync
493 automatically with each Subversion commit and contain all necessary git-svn
494 marks (so, you can recreate git-svn metadata locally). Note that right now
495 mirrors reflect only ``trunk`` for each project.
497 .. note::
499   On Windows, first you will want to do ``git config --global core.autocrlf
500   false`` before you clone. This goes a long way toward ensuring that
501   line-endings will be handled correctly (the LLVM project mostly uses Linux
502   line-endings).
504 You can do the read-only Git clone of LLVM via:
506 .. code-block:: console
508   % git clone https://git.llvm.org/git/llvm.git/
510 If you want to check out clang too, run:
512 .. code-block:: console
514   % cd llvm/tools
515   % git clone https://git.llvm.org/git/clang.git/
517 If you want to check out compiler-rt (required to build the sanitizers), run:
519 .. code-block:: console
521   % cd llvm/projects
522   % git clone https://git.llvm.org/git/compiler-rt.git/
524 If you want to check out libomp (required for OpenMP support), run:
526 .. code-block:: console
528   % cd llvm/projects
529   % git clone https://git.llvm.org/git/openmp.git/
531 If you want to check out libcxx and libcxxabi (optional), run:
533 .. code-block:: console
535   % cd llvm/projects
536   % git clone https://git.llvm.org/git/libcxx.git/
537   % git clone https://git.llvm.org/git/libcxxabi.git/
539 If you want to check out the Test Suite Source Code (optional), run:
541 .. code-block:: console
543   % cd llvm/projects
544   % git clone https://git.llvm.org/git/test-suite.git/
546 Since the upstream repository is in Subversion, you should use ``git
547 pull --rebase`` instead of ``git pull`` to avoid generating a non-linear history
548 in your clone.  To configure ``git pull`` to pass ``--rebase`` by default on the
549 master branch, run the following command:
551 .. code-block:: console
553   % git config branch.master.rebase true
555 Sending patches with Git
556 ^^^^^^^^^^^^^^^^^^^^^^^^
558 Please read `Developer Policy <DeveloperPolicy.html#one-off-patches>`_, too.
560 Assume ``master`` points the upstream and ``mybranch`` points your working
561 branch, and ``mybranch`` is rebased onto ``master``.  At first you may check
562 sanity of whitespaces:
564 .. code-block:: console
566   % git diff --check master..mybranch
568 The easiest way to generate a patch is as below:
570 .. code-block:: console
572   % git diff master..mybranch > /path/to/mybranch.diff
574 It is a little different from svn-generated diff. git-diff-generated diff has
575 prefixes like ``a/`` and ``b/``. Don't worry, most developers might know it
576 could be accepted with ``patch -p1 -N``.
578 But you may generate patchset with git-format-patch. It generates by-each-commit
579 patchset. To generate patch files to attach to your article:
581 .. code-block:: console
583   % git format-patch --no-attach master..mybranch -o /path/to/your/patchset
585 If you would like to send patches directly, you may use git-send-email or
586 git-imap-send. Here is an example to generate the patchset in Gmail's [Drafts].
588 .. code-block:: console
590   % git format-patch --attach master..mybranch --stdout | git imap-send
592 Then, your .git/config should have [imap] sections.
594 .. code-block:: ini
596   [imap]
597         host = imaps://imap.gmail.com
598         user = your.gmail.account@gmail.com
599         pass = himitsu!
600         port = 993
601         sslverify = false
602   ; in English
603         folder = "[Gmail]/Drafts"
604   ; example for Japanese, "Modified UTF-7" encoded.
605         folder = "[Gmail]/&Tgtm+DBN-"
606   ; example for Traditional Chinese
607         folder = "[Gmail]/&g0l6Pw-"
609 .. _developers-work-with-git-svn:
611 For developers to work with git-svn
612 ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
614 To set up clone from which you can submit code using ``git-svn``, run:
616 .. code-block:: console
618   % git clone https://git.llvm.org/git/llvm.git/
619   % cd llvm
620   % git svn init https://llvm.org/svn/llvm-project/llvm/trunk --username=<username>
621   % git config svn-remote.svn.fetch :refs/remotes/origin/master
622   % git svn rebase -l  # -l avoids fetching ahead of the git mirror.
624   # If you have clang too:
625   % cd tools
626   % git clone https://git.llvm.org/git/clang.git/
627   % cd clang
628   % git svn init https://llvm.org/svn/llvm-project/cfe/trunk --username=<username>
629   % git config svn-remote.svn.fetch :refs/remotes/origin/master
630   % git svn rebase -l
632 Likewise for compiler-rt, libomp and test-suite.
634 To update this clone without generating git-svn tags that conflict with the
635 upstream Git repo, run:
637 .. code-block:: console
639   % git fetch && (cd tools/clang && git fetch)  # Get matching revisions of both trees.
640   % git checkout master
641   % git svn rebase -l
642   % (cd tools/clang &&
643      git checkout master &&
644      git svn rebase -l)
646 Likewise for compiler-rt, libomp and test-suite.
648 This leaves your working directories on their master branches, so you'll need to
649 ``checkout`` each working branch individually and ``rebase`` it on top of its
650 parent branch.
652 For those who wish to be able to update an llvm repo/revert patches easily using
653 git-svn, please look in the directory for the scripts ``git-svnup`` and
654 ``git-svnrevert``.
656 To perform the aforementioned update steps go into your source directory and
657 just type ``git-svnup`` or ``git svnup`` and everything will just work.
659 If one wishes to revert a commit with git-svn, but do not want the git hash to
660 escape into the commit message, one can use the script ``git-svnrevert`` or
661 ``git svnrevert`` which will take in the git hash for the commit you want to
662 revert, look up the appropriate svn revision, and output a message where all
663 references to the git hash have been replaced with the svn revision.
665 To commit back changes via git-svn, use ``git svn dcommit``:
667 .. code-block:: console
669   % git svn dcommit
671 Note that git-svn will create one SVN commit for each Git commit you have pending,
672 so squash and edit each commit before executing ``dcommit`` to make sure they all
673 conform to the coding standards and the developers' policy.
675 On success, ``dcommit`` will rebase against the HEAD of SVN, so to avoid conflict,
676 please make sure your current branch is up-to-date (via fetch/rebase) before
677 proceeding.
679 The git-svn metadata can get out of sync after you mess around with branches and
680 ``dcommit``. When that happens, ``git svn dcommit`` stops working, complaining
681 about files with uncommitted changes. The fix is to rebuild the metadata:
683 .. code-block:: console
685   % rm -rf .git/svn
686   % git svn rebase -l
688 Please, refer to the Git-SVN manual (``man git-svn``) for more information.
690 For developers to work with a git monorepo
691 ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
693 .. note::
695    This set-up is using an unofficial mirror hosted on GitHub, use with caution.
697 To set up a clone of all the llvm projects using a unified repository:
699 .. code-block:: console
701   % export TOP_LEVEL_DIR=`pwd`
702   % git clone https://github.com/llvm-project/llvm-project-20170507/ llvm-project
703   % cd llvm-project
704   % git config branch.master.rebase true
706 You can configure various build directory from this clone, starting with a build
707 of LLVM alone:
709 .. code-block:: console
711   % cd $TOP_LEVEL_DIR
712   % mkdir llvm-build && cd llvm-build
713   % cmake -GNinja ../llvm-project/llvm
715 Or lldb:
717 .. code-block:: console
719   % cd $TOP_LEVEL_DIR
720   % mkdir lldb-build && cd lldb-build
721   % cmake -GNinja ../llvm-project/llvm -DLLVM_ENABLE_PROJECTS=lldb
723 Or a combination of multiple projects:
725 .. code-block:: console
727   % cd $TOP_LEVEL_DIR
728   % mkdir clang-build && cd clang-build
729   % cmake -GNinja ../llvm-project/llvm -DLLVM_ENABLE_PROJECTS="clang;libcxx;libcxxabi"
731 A helper script is provided in ``llvm/utils/git-svn/git-llvm``. After you add it
732 to your path, you can push committed changes upstream with ``git llvm push``.
734 .. code-block:: console
736   % export PATH=$PATH:$TOP_LEVEL_DIR/llvm-project/llvm/utils/git-svn/
737   % git llvm push
739 While this is using SVN under the hood, it does not require any interaction from
740 you with git-svn.
741 After a few minutes, ``git pull`` should get back the changes as they were
742 committed. Note that a current limitation is that ``git`` does not directly
743 record file rename, and thus it is propagated to SVN as a combination of
744 delete-add instead of a file rename.
746 The SVN revision of each monorepo commit can be found in the commit notes.  git
747 does not fetch notes by default. The following commands will fetch the notes and
748 configure git to fetch future notes. Use ``git notes show $commit`` to look up
749 the SVN revision of a git commit. The notes show up ``git log``, and searching
750 the log is currently the recommended way to look up the git commit for a given
751 SVN revision.
753 .. code-block:: console
755   % git config --add remote.origin.fetch +refs/notes/commits:refs/notes/commits
756   % git fetch
758 If you are using `arc` to interact with Phabricator, you need to manually put it
759 at the root of the checkout:
761 .. code-block:: console
763   % cd $TOP_LEVEL_DIR
764   % cp llvm/.arcconfig ./
765   % mkdir -p .git/info/
766   % echo .arcconfig >> .git/info/exclude
769 Local LLVM Configuration
770 ------------------------
772 Once checked out from the Subversion repository, the LLVM suite source code must
773 be configured before being built. This process uses CMake.
774 Unlinke the normal ``configure`` script, CMake
775 generates the build files in whatever format you request as well as various
776 ``*.inc`` files, and ``llvm/include/Config/config.h``.
778 Variables are passed to ``cmake`` on the command line using the format
779 ``-D<variable name>=<value>``. The following variables are some common options
780 used by people developing LLVM.
782 +-------------------------+----------------------------------------------------+
783 | Variable                | Purpose                                            |
784 +=========================+====================================================+
785 | CMAKE_C_COMPILER        | Tells ``cmake`` which C compiler to use. By        |
786 |                         | default, this will be /usr/bin/cc.                 |
787 +-------------------------+----------------------------------------------------+
788 | CMAKE_CXX_COMPILER      | Tells ``cmake`` which C++ compiler to use. By      |
789 |                         | default, this will be /usr/bin/c++.                |
790 +-------------------------+----------------------------------------------------+
791 | CMAKE_BUILD_TYPE        | Tells ``cmake`` what type of build you are trying  |
792 |                         | to generate files for. Valid options are Debug,    |
793 |                         | Release, RelWithDebInfo, and MinSizeRel. Default   |
794 |                         | is Debug.                                          |
795 +-------------------------+----------------------------------------------------+
796 | CMAKE_INSTALL_PREFIX    | Specifies the install directory to target when     |
797 |                         | running the install action of the build files.     |
798 +-------------------------+----------------------------------------------------+
799 | LLVM_TARGETS_TO_BUILD   | A semicolon delimited list controlling which       |
800 |                         | targets will be built and linked into llc. This is |
801 |                         | equivalent to the ``--enable-targets`` option in   |
802 |                         | the configure script. The default list is defined  |
803 |                         | as ``LLVM_ALL_TARGETS``, and can be set to include |
804 |                         | out-of-tree targets. The default value includes:   |
805 |                         | ``AArch64, AMDGPU, ARM, BPF, Hexagon, Mips,        |
806 |                         | MSP430, NVPTX, PowerPC, Sparc, SystemZ, X86,       |
807 |                         | XCore``.                                           |
808 +-------------------------+----------------------------------------------------+
809 | LLVM_ENABLE_DOXYGEN     | Build doxygen-based documentation from the source  |
810 |                         | code This is disabled by default because it is     |
811 |                         | slow and generates a lot of output.                |
812 +-------------------------+----------------------------------------------------+
813 | LLVM_ENABLE_SPHINX      | Build sphinx-based documentation from the source   |
814 |                         | code. This is disabled by default because it is    |
815 |                         | slow and generates a lot of output. Sphinx version |
816 |                         | 1.5 or later recommended.                          |
817 +-------------------------+----------------------------------------------------+
818 | LLVM_BUILD_LLVM_DYLIB   | Generate libLLVM.so. This library contains a       |
819 |                         | default set of LLVM components that can be         |
820 |                         | overridden with ``LLVM_DYLIB_COMPONENTS``. The     |
821 |                         | default contains most of LLVM and is defined in    |
822 |                         | ``tools/llvm-shlib/CMakelists.txt``.               |
823 +-------------------------+----------------------------------------------------+
824 | LLVM_OPTIMIZED_TABLEGEN | Builds a release tablegen that gets used during    |
825 |                         | the LLVM build. This can dramatically speed up     |
826 |                         | debug builds.                                      |
827 +-------------------------+----------------------------------------------------+
829 To configure LLVM, follow these steps:
831 #. Change directory into the object root directory:
833    .. code-block:: console
835      % cd OBJ_ROOT
837 #. Run the ``cmake``:
839    .. code-block:: console
841      % cmake -G "Unix Makefiles" -DCMAKE_INSTALL_PREFIX=/install/path
842        [other options] SRC_ROOT
844 Compiling the LLVM Suite Source Code
845 ------------------------------------
847 Unlike with autotools, with CMake your build type is defined at configuration.
848 If you want to change your build type, you can re-run cmake with the following
849 invocation:
851    .. code-block:: console
853      % cmake -G "Unix Makefiles" -DCMAKE_BUILD_TYPE=type SRC_ROOT
855 Between runs, CMake preserves the values set for all options. CMake has the
856 following build types defined:
858 Debug
860   These builds are the default. The build system will compile the tools and
861   libraries unoptimized, with debugging information, and asserts enabled.
863 Release
865   For these builds, the build system will compile the tools and libraries
866   with optimizations enabled and not generate debug info. CMakes default
867   optimization level is -O3. This can be configured by setting the
868   ``CMAKE_CXX_FLAGS_RELEASE`` variable on the CMake command line.
870 RelWithDebInfo
872   These builds are useful when debugging. They generate optimized binaries with
873   debug information. CMakes default optimization level is -O2. This can be
874   configured by setting the ``CMAKE_CXX_FLAGS_RELWITHDEBINFO`` variable on the
875   CMake command line.
877 Once you have LLVM configured, you can build it by entering the *OBJ_ROOT*
878 directory and issuing the following command:
880 .. code-block:: console
882   % make
884 If the build fails, please `check here`_ to see if you are using a version of
885 GCC that is known not to compile LLVM.
887 If you have multiple processors in your machine, you may wish to use some of the
888 parallel build options provided by GNU Make.  For example, you could use the
889 command:
891 .. code-block:: console
893   % make -j2
895 There are several special targets which are useful when working with the LLVM
896 source code:
898 ``make clean``
900   Removes all files generated by the build.  This includes object files,
901   generated C/C++ files, libraries, and executables.
903 ``make install``
905   Installs LLVM header files, libraries, tools, and documentation in a hierarchy
906   under ``$PREFIX``, specified with ``CMAKE_INSTALL_PREFIX``, which
907   defaults to ``/usr/local``.
909 ``make docs-llvm-html``
911   If configured with ``-DLLVM_ENABLE_SPHINX=On``, this will generate a directory
912   at ``OBJ_ROOT/docs/html`` which contains the HTML formatted documentation.
914 Cross-Compiling LLVM
915 --------------------
917 It is possible to cross-compile LLVM itself. That is, you can create LLVM
918 executables and libraries to be hosted on a platform different from the platform
919 where they are built (a Canadian Cross build). To generate build files for
920 cross-compiling CMake provides a variable ``CMAKE_TOOLCHAIN_FILE`` which can
921 define compiler flags and variables used during the CMake test operations.
923 The result of such a build is executables that are not runnable on the build
924 host but can be executed on the target. As an example the following CMake
925 invocation can generate build files targeting iOS. This will work on Mac OS X
926 with the latest Xcode:
928 .. code-block:: console
930   % cmake -G "Ninja" -DCMAKE_OSX_ARCHITECTURES="armv7;armv7s;arm64"
931     -DCMAKE_TOOLCHAIN_FILE=<PATH_TO_LLVM>/cmake/platforms/iOS.cmake
932     -DCMAKE_BUILD_TYPE=Release -DLLVM_BUILD_RUNTIME=Off -DLLVM_INCLUDE_TESTS=Off
933     -DLLVM_INCLUDE_EXAMPLES=Off -DLLVM_ENABLE_BACKTRACES=Off [options]
934     <PATH_TO_LLVM>
936 Note: There are some additional flags that need to be passed when building for
937 iOS due to limitations in the iOS SDK.
939 Check :doc:`HowToCrossCompileLLVM` and `Clang docs on how to cross-compile in general
940 <http://clang.llvm.org/docs/CrossCompilation.html>`_ for more information
941 about cross-compiling.
943 The Location of LLVM Object Files
944 ---------------------------------
946 The LLVM build system is capable of sharing a single LLVM source tree among
947 several LLVM builds.  Hence, it is possible to build LLVM for several different
948 platforms or configurations using the same source tree.
950 * Change directory to where the LLVM object files should live:
952   .. code-block:: console
954     % cd OBJ_ROOT
956 * Run ``cmake``:
958   .. code-block:: console
960     % cmake -G "Unix Makefiles" SRC_ROOT
962 The LLVM build will create a structure underneath *OBJ_ROOT* that matches the
963 LLVM source tree. At each level where source files are present in the source
964 tree there will be a corresponding ``CMakeFiles`` directory in the *OBJ_ROOT*.
965 Underneath that directory there is another directory with a name ending in
966 ``.dir`` under which you'll find object files for each source.
968 For example:
970   .. code-block:: console
972     % cd llvm_build_dir
973     % find lib/Support/ -name APFloat*
974     lib/Support/CMakeFiles/LLVMSupport.dir/APFloat.cpp.o
976 Optional Configuration Items
977 ----------------------------
979 If you're running on a Linux system that supports the `binfmt_misc
980 <http://en.wikipedia.org/wiki/binfmt_misc>`_
981 module, and you have root access on the system, you can set your system up to
982 execute LLVM bitcode files directly. To do this, use commands like this (the
983 first command may not be required if you are already using the module):
985 .. code-block:: console
987   % mount -t binfmt_misc none /proc/sys/fs/binfmt_misc
988   % echo ':llvm:M::BC::/path/to/lli:' > /proc/sys/fs/binfmt_misc/register
989   % chmod u+x hello.bc   (if needed)
990   % ./hello.bc
992 This allows you to execute LLVM bitcode files directly.  On Debian, you can also
993 use this command instead of the 'echo' command above:
995 .. code-block:: console
997   % sudo update-binfmts --install llvm /path/to/lli --magic 'BC'
999 .. _Program Layout:
1000 .. _general layout:
1002 Directory Layout
1003 ================
1005 One useful source of information about the LLVM source base is the LLVM `doxygen
1006 <http://www.doxygen.org/>`_ documentation available at
1007 `<http://llvm.org/doxygen/>`_.  The following is a brief introduction to code
1008 layout:
1010 ``llvm/examples``
1011 -----------------
1013 Simple examples using the LLVM IR and JIT.
1015 ``llvm/include``
1016 ----------------
1018 Public header files exported from the LLVM library. The three main subdirectories:
1020 ``llvm/include/llvm``
1022   All LLVM-specific header files, and  subdirectories for different portions of
1023   LLVM: ``Analysis``, ``CodeGen``, ``Target``, ``Transforms``, etc...
1025 ``llvm/include/llvm/Support``
1027   Generic support libraries provided with LLVM but not necessarily specific to
1028   LLVM. For example, some C++ STL utilities and a Command Line option processing
1029   library store header files here.
1031 ``llvm/include/llvm/Config``
1033   Header files configured by the ``configure`` script.
1034   They wrap "standard" UNIX and C header files.  Source code can include these
1035   header files which automatically take care of the conditional #includes that
1036   the ``configure`` script generates.
1038 ``llvm/lib``
1039 ------------
1041 Most source files are here. By putting code in libraries, LLVM makes it easy to
1042 share code among the `tools`_.
1044 ``llvm/lib/IR/``
1046   Core LLVM source files that implement core classes like Instruction and
1047   BasicBlock.
1049 ``llvm/lib/AsmParser/``
1051   Source code for the LLVM assembly language parser library.
1053 ``llvm/lib/Bitcode/``
1055   Code for reading and writing bitcode.
1057 ``llvm/lib/Analysis/``
1059   A variety of program analyses, such as Call Graphs, Induction Variables,
1060   Natural Loop Identification, etc.
1062 ``llvm/lib/Transforms/``
1064   IR-to-IR program transformations, such as Aggressive Dead Code Elimination,
1065   Sparse Conditional Constant Propagation, Inlining, Loop Invariant Code Motion,
1066   Dead Global Elimination, and many others.
1068 ``llvm/lib/Target/``
1070   Files describing target architectures for code generation.  For example,
1071   ``llvm/lib/Target/X86`` holds the X86 machine description.
1073 ``llvm/lib/CodeGen/``
1075   The major parts of the code generator: Instruction Selector, Instruction
1076   Scheduling, and Register Allocation.
1078 ``llvm/lib/MC/``
1080   (FIXME: T.B.D.)  ....?
1082 ``llvm/lib/ExecutionEngine/``
1084   Libraries for directly executing bitcode at runtime in interpreted and
1085   JIT-compiled scenarios.
1087 ``llvm/lib/Support/``
1089   Source code that corresponding to the header files in ``llvm/include/ADT/``
1090   and ``llvm/include/Support/``.
1092 ``llvm/projects``
1093 -----------------
1095 Projects not strictly part of LLVM but shipped with LLVM. This is also the
1096 directory for creating your own LLVM-based projects which leverage the LLVM
1097 build system.
1099 ``llvm/test``
1100 -------------
1102 Feature and regression tests and other sanity checks on LLVM infrastructure. These
1103 are intended to run quickly and cover a lot of territory without being exhaustive.
1105 ``test-suite``
1106 --------------
1108 A comprehensive correctness, performance, and benchmarking test suite for LLVM.
1109 Comes in a separate Subversion module because not every LLVM user is interested
1110 in such a comprehensive suite. For details see the :doc:`Testing Guide
1111 <TestingGuide>` document.
1113 .. _tools:
1115 ``llvm/tools``
1116 --------------
1118 Executables built out of the libraries
1119 above, which form the main part of the user interface.  You can always get help
1120 for a tool by typing ``tool_name -help``.  The following is a brief introduction
1121 to the most important tools.  More detailed information is in
1122 the `Command Guide <CommandGuide/index.html>`_.
1124 ``bugpoint``
1126   ``bugpoint`` is used to debug optimization passes or code generation backends
1127   by narrowing down the given test case to the minimum number of passes and/or
1128   instructions that still cause a problem, whether it is a crash or
1129   miscompilation. See `<HowToSubmitABug.html>`_ for more information on using
1130   ``bugpoint``.
1132 ``llvm-ar``
1134   The archiver produces an archive containing the given LLVM bitcode files,
1135   optionally with an index for faster lookup.
1137 ``llvm-as``
1139   The assembler transforms the human readable LLVM assembly to LLVM bitcode.
1141 ``llvm-dis``
1143   The disassembler transforms the LLVM bitcode to human readable LLVM assembly.
1145 ``llvm-link``
1147   ``llvm-link``, not surprisingly, links multiple LLVM modules into a single
1148   program.
1150 ``lli``
1152   ``lli`` is the LLVM interpreter, which can directly execute LLVM bitcode
1153   (although very slowly...). For architectures that support it (currently x86,
1154   Sparc, and PowerPC), by default, ``lli`` will function as a Just-In-Time
1155   compiler (if the functionality was compiled in), and will execute the code
1156   *much* faster than the interpreter.
1158 ``llc``
1160   ``llc`` is the LLVM backend compiler, which translates LLVM bitcode to a
1161   native code assembly file.
1163 ``opt``
1165   ``opt`` reads LLVM bitcode, applies a series of LLVM to LLVM transformations
1166   (which are specified on the command line), and outputs the resultant
1167   bitcode.   '``opt -help``'  is a good way to get a list of the
1168   program transformations available in LLVM.
1170   ``opt`` can also  run a specific analysis on an input LLVM bitcode
1171   file and print  the results.  Primarily useful for debugging
1172   analyses, or familiarizing yourself with what an analysis does.
1174 ``llvm/utils``
1175 --------------
1177 Utilities for working with LLVM source code; some are part of the build process
1178 because they are code generators for parts of the infrastructure.
1181 ``codegen-diff``
1183   ``codegen-diff`` finds differences between code that LLC
1184   generates and code that LLI generates. This is useful if you are
1185   debugging one of them, assuming that the other generates correct output. For
1186   the full user manual, run ```perldoc codegen-diff'``.
1188 ``emacs/``
1190    Emacs and XEmacs syntax highlighting  for LLVM   assembly files and TableGen
1191    description files.  See the ``README`` for information on using them.
1193 ``getsrcs.sh``
1195   Finds and outputs all non-generated source files,
1196   useful if one wishes to do a lot of development across directories
1197   and does not want to find each file. One way to use it is to run,
1198   for example: ``xemacs `utils/getsources.sh``` from the top of the LLVM source
1199   tree.
1201 ``llvmgrep``
1203   Performs an ``egrep -H -n`` on each source file in LLVM and
1204   passes to it a regular expression provided on ``llvmgrep``'s command
1205   line. This is an efficient way of searching the source base for a
1206   particular regular expression.
1208 ``TableGen/``
1210   Contains the tool used to generate register
1211   descriptions, instruction set descriptions, and even assemblers from common
1212   TableGen description files.
1214 ``vim/``
1216   vim syntax-highlighting for LLVM assembly files
1217   and TableGen description files. See the    ``README`` for how to use them.
1219 .. _simple example:
1221 An Example Using the LLVM Tool Chain
1222 ====================================
1224 This section gives an example of using LLVM with the Clang front end.
1226 Example with clang
1227 ------------------
1229 #. First, create a simple C file, name it 'hello.c':
1231    .. code-block:: c
1233      #include <stdio.h>
1235      int main() {
1236        printf("hello world\n");
1237        return 0;
1238      }
1240 #. Next, compile the C file into a native executable:
1242    .. code-block:: console
1244      % clang hello.c -o hello
1246    .. note::
1248      Clang works just like GCC by default.  The standard -S and -c arguments
1249      work as usual (producing a native .s or .o file, respectively).
1251 #. Next, compile the C file into an LLVM bitcode file:
1253    .. code-block:: console
1255      % clang -O3 -emit-llvm hello.c -c -o hello.bc
1257    The -emit-llvm option can be used with the -S or -c options to emit an LLVM
1258    ``.ll`` or ``.bc`` file (respectively) for the code.  This allows you to use
1259    the `standard LLVM tools <CommandGuide/index.html>`_ on the bitcode file.
1261 #. Run the program in both forms. To run the program, use:
1263    .. code-block:: console
1265       % ./hello
1267    and
1269    .. code-block:: console
1271      % lli hello.bc
1273    The second examples shows how to invoke the LLVM JIT, :doc:`lli
1274    <CommandGuide/lli>`.
1276 #. Use the ``llvm-dis`` utility to take a look at the LLVM assembly code:
1278    .. code-block:: console
1280      % llvm-dis < hello.bc | less
1282 #. Compile the program to native assembly using the LLC code generator:
1284    .. code-block:: console
1286      % llc hello.bc -o hello.s
1288 #. Assemble the native assembly language file into a program:
1290    .. code-block:: console
1292      % /opt/SUNWspro/bin/cc -xarch=v9 hello.s -o hello.native   # On Solaris
1294      % gcc hello.s -o hello.native                              # On others
1296 #. Execute the native code program:
1298    .. code-block:: console
1300      % ./hello.native
1302    Note that using clang to compile directly to native code (i.e. when the
1303    ``-emit-llvm`` option is not present) does steps 6/7/8 for you.
1305 Common Problems
1306 ===============
1308 If you are having problems building or using LLVM, or if you have any other
1309 general questions about LLVM, please consult the `Frequently Asked
1310 Questions <FAQ.html>`_ page.
1312 .. _links:
1314 Links
1315 =====
1317 This document is just an **introduction** on how to use LLVM to do some simple
1318 things... there are many more interesting and complicated things that you can do
1319 that aren't documented here (but we'll gladly accept a patch if you want to
1320 write something up!).  For more information about LLVM, check out:
1322 * `LLVM Homepage <http://llvm.org/>`_
1323 * `LLVM Doxygen Tree <http://llvm.org/doxygen/>`_
1324 * `Starting a Project that Uses LLVM <http://llvm.org/docs/Projects.html>`_