Run DCE after a LoopFlatten test to reduce spurious output [nfc]
[llvm-project.git] / llvm / test / CodeGen / AMDGPU / fastregalloc-self-loop-heuristic.mir
blob24b82f4862afdaddd3731a34f29276cf848a24e4
1 # NOTE: Assertions have been autogenerated by utils/update_mir_test_checks.py
2 # RUN: llc -verify-machineinstrs -mtriple=amdgcn-amd-amdhsa -mcpu=gfx900 -run-pass=regallocfast -o - %s | FileCheck -check-prefix=GCN %s
4 ---
5 name: self_loop_single_def_use
6 tracksRegLiveness: true
7 machineFunctionInfo:
8   isEntryFunction: true
9   scratchRSrcReg:  '$sgpr0_sgpr1_sgpr2_sgpr3'
10   stackPtrOffsetReg: '$sgpr32'
11 body:             |
12   ; GCN-LABEL: name: self_loop_single_def_use
13   ; GCN: bb.0:
14   ; GCN-NEXT:   successors: %bb.1(0x80000000)
15   ; GCN-NEXT:   liveins: $vgpr0_vgpr1
16   ; GCN-NEXT: {{  $}}
17   ; GCN-NEXT:   SI_SPILL_V64_SAVE killed $vgpr0_vgpr1, %stack.0, $sgpr32, 0, implicit $exec :: (store (s64) into %stack.0, align 4, addrspace 5)
18   ; GCN-NEXT: {{  $}}
19   ; GCN-NEXT: bb.1:
20   ; GCN-NEXT:   successors: %bb.1(0x40000000), %bb.2(0x40000000)
21   ; GCN-NEXT: {{  $}}
22   ; GCN-NEXT:   $vgpr0_vgpr1 = SI_SPILL_V64_RESTORE %stack.0, $sgpr32, 0, implicit $exec :: (load (s64) from %stack.0, align 4, addrspace 5)
23   ; GCN-NEXT:   renamable $vgpr2 = GLOBAL_LOAD_DWORD renamable $vgpr0_vgpr1, 0, 0, implicit $exec
24   ; GCN-NEXT:   GLOBAL_STORE_DWORD renamable $vgpr0_vgpr1, killed renamable $vgpr2, 0, 0, implicit $exec
25   ; GCN-NEXT:   S_CBRANCH_EXECZ %bb.1, implicit $exec
26   ; GCN-NEXT: {{  $}}
27   ; GCN-NEXT: bb.2:
28   ; GCN-NEXT:   S_ENDPGM 0
29   bb.0:
30     liveins: $vgpr0_vgpr1
31     %0:vreg_64 = COPY $vgpr0_vgpr1
33   bb.1:
34     %1:vgpr_32 = GLOBAL_LOAD_DWORD %0, 0, 0, implicit $exec
35     GLOBAL_STORE_DWORD %0, %1, 0, 0, implicit $exec
36     S_CBRANCH_EXECZ %bb.1, implicit $exec
38   bb.2:
39     S_ENDPGM 0
41 ...
43 ---
44 name: self_loop_multi_def
45 tracksRegLiveness: true
46 machineFunctionInfo:
47   isEntryFunction: true
48   scratchRSrcReg:  '$sgpr0_sgpr1_sgpr2_sgpr3'
49   stackPtrOffsetReg: '$sgpr32'
50 body:             |
51   ; GCN-LABEL: name: self_loop_multi_def
52   ; GCN: bb.0:
53   ; GCN-NEXT:   successors: %bb.1(0x80000000)
54   ; GCN-NEXT:   liveins: $vgpr0_vgpr1
55   ; GCN-NEXT: {{  $}}
56   ; GCN-NEXT:   SI_SPILL_V64_SAVE killed $vgpr0_vgpr1, %stack.0, $sgpr32, 0, implicit $exec :: (store (s64) into %stack.0, align 4, addrspace 5)
57   ; GCN-NEXT: {{  $}}
58   ; GCN-NEXT: bb.1:
59   ; GCN-NEXT:   successors: %bb.1(0x40000000), %bb.2(0x40000000)
60   ; GCN-NEXT: {{  $}}
61   ; GCN-NEXT:   $vgpr0_vgpr1 = SI_SPILL_V64_RESTORE %stack.0, $sgpr32, 0, implicit $exec :: (load (s64) from %stack.0, align 4, addrspace 5)
62   ; GCN-NEXT:   renamable $vgpr2 = GLOBAL_LOAD_DWORD renamable $vgpr0_vgpr1, 0, 0, implicit $exec
63   ; GCN-NEXT:   GLOBAL_STORE_DWORD renamable $vgpr0_vgpr1, renamable $vgpr2, 0, 0, implicit $exec
64   ; GCN-NEXT:   renamable $vgpr2 = GLOBAL_LOAD_DWORD renamable $vgpr0_vgpr1, 0, 0, implicit $exec
65   ; GCN-NEXT:   GLOBAL_STORE_DWORD renamable $vgpr0_vgpr1, killed renamable $vgpr2, 0, 0, implicit $exec
66   ; GCN-NEXT:   S_CBRANCH_EXECZ %bb.1, implicit $exec
67   ; GCN-NEXT: {{  $}}
68   ; GCN-NEXT: bb.2:
69   ; GCN-NEXT:   S_ENDPGM 0
71   bb.0:
72     liveins: $vgpr0_vgpr1
73     %0:vreg_64 = COPY $vgpr0_vgpr1
75   bb.1:
76     %1:vgpr_32 = GLOBAL_LOAD_DWORD %0, 0, 0, implicit $exec
77     GLOBAL_STORE_DWORD %0, %1, 0, 0, implicit $exec
78     %1:vgpr_32 = GLOBAL_LOAD_DWORD %0, 0, 0, implicit $exec
79     GLOBAL_STORE_DWORD %0, %1, 0, 0, implicit $exec
80     S_CBRANCH_EXECZ %bb.1, implicit $exec
82   bb.2:
83     S_ENDPGM 0
85 ...
87 # There's a single def inside the self loop, but it's also a use.
89 ---
90 name: self_loop_def_use_same_inst
91 tracksRegLiveness: true
92 machineFunctionInfo:
93   isEntryFunction: true
94   scratchRSrcReg:  '$sgpr0_sgpr1_sgpr2_sgpr3'
95   stackPtrOffsetReg: '$sgpr32'
96 body:             |
97   ; GCN-LABEL: name: self_loop_def_use_same_inst
98   ; GCN: bb.0:
99   ; GCN-NEXT:   successors: %bb.1(0x80000000)
100   ; GCN-NEXT:   liveins: $vgpr0_vgpr1
101   ; GCN-NEXT: {{  $}}
102   ; GCN-NEXT:   SI_SPILL_V64_SAVE killed $vgpr0_vgpr1, %stack.0, $sgpr32, 0, implicit $exec :: (store (s64) into %stack.0, align 4, addrspace 5)
103   ; GCN-NEXT: {{  $}}
104   ; GCN-NEXT: bb.1:
105   ; GCN-NEXT:   successors: %bb.1(0x40000000), %bb.2(0x40000000)
106   ; GCN-NEXT: {{  $}}
107   ; GCN-NEXT:   $vgpr0_vgpr1 = SI_SPILL_V64_RESTORE %stack.0, $sgpr32, 0, implicit $exec :: (load (s64) from %stack.0, align 4, addrspace 5)
108   ; GCN-NEXT:   renamable $vgpr2 = V_ADD_U32_e32 1, undef $vgpr0, implicit $exec
109   ; GCN-NEXT:   SI_SPILL_V32_SAVE $vgpr2, %stack.1, $sgpr32, 0, implicit $exec :: (store (s32) into %stack.1, addrspace 5)
110   ; GCN-NEXT:   GLOBAL_STORE_DWORD renamable $vgpr0_vgpr1, renamable $vgpr2, 0, 0, implicit $exec
111   ; GCN-NEXT:   S_CBRANCH_EXECZ %bb.1, implicit $exec
112   ; GCN-NEXT: {{  $}}
113   ; GCN-NEXT: bb.2:
114   ; GCN-NEXT:   S_ENDPGM 0
115   bb.0:
116     liveins: $vgpr0_vgpr1
117     %0:vreg_64 = COPY $vgpr0_vgpr1
119   bb.1:
120     %1:vgpr_32 = V_ADD_U32_e32 1, undef %1, implicit $exec
121     GLOBAL_STORE_DWORD %0, %1, 0, 0, implicit $exec
122     S_CBRANCH_EXECZ %bb.1, implicit $exec
124   bb.2:
125     S_ENDPGM 0
130 name: self_loop_def_after_use
131 tracksRegLiveness: true
132 machineFunctionInfo:
133   isEntryFunction: true
134   scratchRSrcReg:  '$sgpr0_sgpr1_sgpr2_sgpr3'
135   stackPtrOffsetReg: '$sgpr32'
136 body:             |
137   ; GCN-LABEL: name: self_loop_def_after_use
138   ; GCN: bb.0:
139   ; GCN-NEXT:   successors: %bb.1(0x80000000)
140   ; GCN-NEXT:   liveins: $vgpr0_vgpr1
141   ; GCN-NEXT: {{  $}}
142   ; GCN-NEXT:   SI_SPILL_V64_SAVE killed $vgpr0_vgpr1, %stack.0, $sgpr32, 0, implicit $exec :: (store (s64) into %stack.0, align 4, addrspace 5)
143   ; GCN-NEXT: {{  $}}
144   ; GCN-NEXT: bb.1:
145   ; GCN-NEXT:   successors: %bb.1(0x40000000), %bb.2(0x40000000)
146   ; GCN-NEXT: {{  $}}
147   ; GCN-NEXT:   $vgpr0_vgpr1 = SI_SPILL_V64_RESTORE %stack.0, $sgpr32, 0, implicit $exec :: (load (s64) from %stack.0, align 4, addrspace 5)
148   ; GCN-NEXT:   GLOBAL_STORE_DWORD renamable $vgpr0_vgpr1, undef renamable $vgpr0, 0, 0, implicit $exec
149   ; GCN-NEXT:   renamable $vgpr0 = V_ADD_U32_e64 1, 1, 0, implicit $exec
150   ; GCN-NEXT:   SI_SPILL_V32_SAVE killed $vgpr0, %stack.1, $sgpr32, 0, implicit $exec :: (store (s32) into %stack.1, addrspace 5)
151   ; GCN-NEXT:   S_CBRANCH_EXECZ %bb.1, implicit $exec
152   ; GCN-NEXT: {{  $}}
153   ; GCN-NEXT: bb.2:
154   ; GCN-NEXT:   S_ENDPGM 0
155   bb.0:
156     liveins: $vgpr0_vgpr1
157     %0:vreg_64 = COPY $vgpr0_vgpr1
159   bb.1:
160     GLOBAL_STORE_DWORD %0, undef %1, 0, 0, implicit $exec
161     %1:vgpr_32 = V_ADD_U32_e64 1, 1, 0, implicit $exec
162     S_CBRANCH_EXECZ %bb.1, implicit $exec
164   bb.2:
165     S_ENDPGM 0
170 name: self_loop_single_subreg_def_use
171 tracksRegLiveness: true
172 machineFunctionInfo:
173   isEntryFunction: true
174   scratchRSrcReg:  '$sgpr0_sgpr1_sgpr2_sgpr3'
175   stackPtrOffsetReg: '$sgpr32'
176 body:             |
177   ; GCN-LABEL: name: self_loop_single_subreg_def_use
178   ; GCN: bb.0:
179   ; GCN-NEXT:   successors: %bb.1(0x80000000)
180   ; GCN-NEXT:   liveins: $vgpr0_vgpr1
181   ; GCN-NEXT: {{  $}}
182   ; GCN-NEXT:   SI_SPILL_V64_SAVE killed $vgpr0_vgpr1, %stack.0, $sgpr32, 0, implicit $exec :: (store (s64) into %stack.0, align 4, addrspace 5)
183   ; GCN-NEXT: {{  $}}
184   ; GCN-NEXT: bb.1:
185   ; GCN-NEXT:   successors: %bb.1(0x40000000), %bb.2(0x40000000)
186   ; GCN-NEXT: {{  $}}
187   ; GCN-NEXT:   $vgpr0_vgpr1 = SI_SPILL_V64_RESTORE %stack.0, $sgpr32, 0, implicit $exec :: (load (s64) from %stack.0, align 4, addrspace 5)
188   ; GCN-NEXT:   undef renamable $vgpr3 = GLOBAL_LOAD_DWORD renamable $vgpr0_vgpr1, 0, 0, implicit $exec, implicit-def dead $vgpr2_vgpr3
189   ; GCN-NEXT:   GLOBAL_STORE_DWORD renamable $vgpr0_vgpr1, undef renamable $vgpr1, 0, 0, implicit $exec
190   ; GCN-NEXT:   S_CBRANCH_EXECZ %bb.1, implicit $exec
191   ; GCN-NEXT: {{  $}}
192   ; GCN-NEXT: bb.2:
193   ; GCN-NEXT:   S_ENDPGM 0
194   bb.0:
195     liveins: $vgpr0_vgpr1
196     %0:vreg_64 = COPY $vgpr0_vgpr1
198   bb.1:
199     undef %1.sub1:vreg_64 = GLOBAL_LOAD_DWORD %0, 0, 0, implicit $exec
200     GLOBAL_STORE_DWORD %0, undef %1.sub1, 0, 0, implicit $exec
201     S_CBRANCH_EXECZ %bb.1, implicit $exec
203   bb.2:
204     S_ENDPGM 0