Run DCE after a LoopFlatten test to reduce spurious output [nfc]
[llvm-project.git] / llvm / docs / AMDGPU / gfx940_hwreg.rst
blob89eb5303d29d7990b6879a1c15b90bacaedc6648
1 ..
2     **************************************************
3     *                                                *
4     *   Automatically generated file, do not edit!   *
5     *                                                *
6     **************************************************
8 .. _amdgpu_synid_gfx940_hwreg:
10 hwreg
11 =====
13 Bits of a hardware register being accessed.
15 The bits of this operand have the following meaning:
17     ======= ===================== ============
18     Bits    Description           Value Range
19     ======= ===================== ============
20     5:0     Register *id*.        0..63
21     10:6    First bit *offset*.   0..31
22     15:11   *Size* in bits.       1..32
23     ======= ===================== ============
25 This operand may be specified as one of the following:
27 * An :ref:`integer_number<amdgpu_synid_integer_number>` or an :ref:`absolute_expression<amdgpu_synid_absolute_expression>`. The value must be in the range from 0 to 0xFFFF.
28 * An *hwreg* value which is described below.
30     ==================================== ===============================================================================
31     Hwreg Value Syntax                   Description
32     ==================================== ===============================================================================
33     hwreg({0..63})                       All bits of a register indicated by the register *id*.
34     hwreg(<*name*>)                      All bits of a register indicated by the register *name*.
35     hwreg({0..63}, {0..31}, {1..32})     Register bits indicated by the register *id*, first bit *offset* and *size*.
36     hwreg(<*name*>, {0..31}, {1..32})    Register bits indicated by the register *name*, first bit *offset* and *size*.
37     ==================================== ===============================================================================
39 Numeric values may be specified as positive :ref:`integer numbers<amdgpu_synid_integer_number>`
40 or :ref:`absolute expressions<amdgpu_synid_absolute_expression>`.
42 Predefined register *names* include:
44     ============================== ==========================================
45     Name                           Description
46     ============================== ==========================================
47     HW_REG_MODE                    Shader writable mode bits.
48     HW_REG_STATUS                  Shader read-only status.
49     HW_REG_TRAPSTS                 Trap status.
50     HW_REG_HW_ID                   Id of wave, simd, compute unit, etc.
51     HW_REG_GPR_ALLOC               Per-wave SGPR and VGPR allocation.
52     HW_REG_LDS_ALLOC               Per-wave LDS allocation.
53     HW_REG_IB_STS                  Counters of outstanding instructions.
54     HW_REG_SH_MEM_BASES            Memory aperture.
55     HW_REG_TBA_LO                  tba_lo register.
56     HW_REG_TBA_HI                  tba_hi register.
57     HW_REG_TMA_LO                  tma_lo register.
58     HW_REG_TMA_HI                  tma_hi register.
59     HW_REG_XCC_ID                  ID of this XCC (compute accelerator chip).
60     HW_REG_SQ_PERF_SNAPSHOT_DATA   Performance snapshot data (first part).
61     HW_REG_SQ_PERF_SNAPSHOT_DATA1  Performance snapshot data (second part).
62     HW_REG_SQ_PERF_SNAPSHOT_PC_LO  PC.lo of wave when snapshot was taken.
63     HW_REG_SQ_PERF_SNAPSHOT_PC_HI  PC.hi of wave when snapshot was taken.
64     ============================== ==========================================
66 Examples:
68 .. parsed-literal::
70     reg = 1
71     offset = 2
72     size = 4
73     hwreg_enc = reg | (offset << 6) | ((size - 1) << 11)
75     s_getreg_b32 s2, 0x1881
76     s_getreg_b32 s2, hwreg_enc                     // the same as above
77     s_getreg_b32 s2, hwreg(1, 2, 4)                // the same as above
78     s_getreg_b32 s2, hwreg(reg, offset, size)      // the same as above
80     s_getreg_b32 s2, hwreg(15)
81     s_getreg_b32 s2, hwreg(51, 1, 31)
82     s_getreg_b32 s2, hwreg(HW_REG_LDS_ALLOC, 0, 1)