[AMDGPU] Add True16 register classes.
[llvm-project.git] / llvm / test / CodeGen / AMDGPU / tuple-allocation-failure.ll
blobd4941235680bf90b08ff4eee88f1429cec265784
1 ; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
2 ; RUN: llc -mtriple=amdgcn-amd-amdhsa -mcpu=gfx90a -greedy-regclass-priority-trumps-globalness=1 -o - %s | FileCheck -check-prefixes=GFX90A,GLOBALNESS1 %s
3 ; RUN: llc -mtriple=amdgcn-amd-amdhsa -mcpu=gfx90a -greedy-regclass-priority-trumps-globalness=0 -o - %s | FileCheck -check-prefixes=GFX90A,GLOBALNESS0 %s
5 declare void @wobble()
7 define internal fastcc void @widget() {
8 ; GFX90A-LABEL: widget:
9 ; GFX90A:       ; %bb.0: ; %bb
10 ; GFX90A-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
11 ; GFX90A-NEXT:    s_mov_b32 s16, s33
12 ; GFX90A-NEXT:    s_mov_b32 s33, s32
13 ; GFX90A-NEXT:    s_or_saveexec_b64 s[18:19], -1
14 ; GFX90A-NEXT:    buffer_store_dword v40, off, s[0:3], s33 ; 4-byte Folded Spill
15 ; GFX90A-NEXT:    s_mov_b64 exec, s[18:19]
16 ; GFX90A-NEXT:    s_addk_i32 s32, 0x400
17 ; GFX90A-NEXT:    v_writelane_b32 v40, s16, 2
18 ; GFX90A-NEXT:    s_getpc_b64 s[16:17]
19 ; GFX90A-NEXT:    s_add_u32 s16, s16, wobble@gotpcrel32@lo+4
20 ; GFX90A-NEXT:    s_addc_u32 s17, s17, wobble@gotpcrel32@hi+12
21 ; GFX90A-NEXT:    s_load_dwordx2 s[16:17], s[16:17], 0x0
22 ; GFX90A-NEXT:    v_writelane_b32 v40, s30, 0
23 ; GFX90A-NEXT:    v_writelane_b32 v40, s31, 1
24 ; GFX90A-NEXT:    s_waitcnt lgkmcnt(0)
25 ; GFX90A-NEXT:    s_swappc_b64 s[30:31], s[16:17]
26 bb:
27   tail call void @wobble()
28   unreachable
31 define amdgpu_kernel void @kernel(ptr addrspace(1) %arg1.global, i1 %tmp3.i.i, i32 %tmp5.i.i, i32 %tmp427.i, i1 %tmp438.i, double %tmp27.i, i1 %tmp48.i) {
32 ; GLOBALNESS1-LABEL: kernel:
33 ; GLOBALNESS1:       ; %bb.0: ; %bb
34 ; GLOBALNESS1-NEXT:    s_mov_b64 s[36:37], s[6:7]
35 ; GLOBALNESS1-NEXT:    s_load_dwordx4 s[76:79], s[8:9], 0x0
36 ; GLOBALNESS1-NEXT:    s_load_dword s6, s[8:9], 0x14
37 ; GLOBALNESS1-NEXT:    v_mov_b32_e32 v41, v0
38 ; GLOBALNESS1-NEXT:    v_mov_b32_e32 v42, 0
39 ; GLOBALNESS1-NEXT:    v_pk_mov_b32 v[0:1], 0, 0
40 ; GLOBALNESS1-NEXT:    global_store_dword v[0:1], v42, off
41 ; GLOBALNESS1-NEXT:    s_waitcnt lgkmcnt(0)
42 ; GLOBALNESS1-NEXT:    global_load_dword v0, v42, s[76:77]
43 ; GLOBALNESS1-NEXT:    s_mov_b64 s[40:41], s[4:5]
44 ; GLOBALNESS1-NEXT:    s_load_dwordx2 s[4:5], s[8:9], 0x18
45 ; GLOBALNESS1-NEXT:    s_load_dword s7, s[8:9], 0x20
46 ; GLOBALNESS1-NEXT:    s_add_u32 flat_scratch_lo, s12, s17
47 ; GLOBALNESS1-NEXT:    s_addc_u32 flat_scratch_hi, s13, 0
48 ; GLOBALNESS1-NEXT:    s_add_u32 s0, s0, s17
49 ; GLOBALNESS1-NEXT:    s_addc_u32 s1, s1, 0
50 ; GLOBALNESS1-NEXT:    v_mov_b32_e32 v43, 0x40994400
51 ; GLOBALNESS1-NEXT:    s_bitcmp1_b32 s78, 0
52 ; GLOBALNESS1-NEXT:    s_waitcnt lgkmcnt(0)
53 ; GLOBALNESS1-NEXT:    v_cmp_ngt_f64_e32 vcc, s[4:5], v[42:43]
54 ; GLOBALNESS1-NEXT:    v_cmp_ngt_f64_e64 s[4:5], s[4:5], 0
55 ; GLOBALNESS1-NEXT:    v_cndmask_b32_e64 v2, 0, 1, s[4:5]
56 ; GLOBALNESS1-NEXT:    s_cselect_b64 s[4:5], -1, 0
57 ; GLOBALNESS1-NEXT:    v_cndmask_b32_e64 v3, 0, 1, s[4:5]
58 ; GLOBALNESS1-NEXT:    s_xor_b64 s[4:5], s[4:5], -1
59 ; GLOBALNESS1-NEXT:    v_cndmask_b32_e64 v1, 0, 1, vcc
60 ; GLOBALNESS1-NEXT:    s_bitcmp1_b32 s6, 0
61 ; GLOBALNESS1-NEXT:    v_cmp_ne_u32_e64 s[42:43], 1, v1
62 ; GLOBALNESS1-NEXT:    v_cndmask_b32_e64 v1, 0, 1, s[4:5]
63 ; GLOBALNESS1-NEXT:    s_cselect_b64 s[4:5], -1, 0
64 ; GLOBALNESS1-NEXT:    s_xor_b64 s[4:5], s[4:5], -1
65 ; GLOBALNESS1-NEXT:    s_bitcmp1_b32 s7, 0
66 ; GLOBALNESS1-NEXT:    v_cmp_ne_u32_e64 s[48:49], 1, v1
67 ; GLOBALNESS1-NEXT:    v_cndmask_b32_e64 v1, 0, 1, s[4:5]
68 ; GLOBALNESS1-NEXT:    s_cselect_b64 s[4:5], -1, 0
69 ; GLOBALNESS1-NEXT:    s_getpc_b64 s[6:7]
70 ; GLOBALNESS1-NEXT:    s_add_u32 s6, s6, wobble@gotpcrel32@lo+4
71 ; GLOBALNESS1-NEXT:    s_addc_u32 s7, s7, wobble@gotpcrel32@hi+12
72 ; GLOBALNESS1-NEXT:    s_xor_b64 s[4:5], s[4:5], -1
73 ; GLOBALNESS1-NEXT:    v_cmp_ne_u32_e64 s[50:51], 1, v1
74 ; GLOBALNESS1-NEXT:    v_cndmask_b32_e64 v1, 0, 1, s[4:5]
75 ; GLOBALNESS1-NEXT:    s_load_dwordx2 s[76:77], s[6:7], 0x0
76 ; GLOBALNESS1-NEXT:    v_cmp_ne_u32_e64 s[52:53], 1, v1
77 ; GLOBALNESS1-NEXT:    v_cmp_ne_u32_e64 s[44:45], 1, v2
78 ; GLOBALNESS1-NEXT:    v_cmp_ne_u32_e64 s[46:47], 1, v3
79 ; GLOBALNESS1-NEXT:    s_mov_b32 s70, s16
80 ; GLOBALNESS1-NEXT:    s_mov_b64 s[38:39], s[8:9]
81 ; GLOBALNESS1-NEXT:    s_mov_b32 s71, s15
82 ; GLOBALNESS1-NEXT:    s_mov_b32 s72, s14
83 ; GLOBALNESS1-NEXT:    s_mov_b64 s[34:35], s[10:11]
84 ; GLOBALNESS1-NEXT:    s_mov_b64 s[74:75], 0x80
85 ; GLOBALNESS1-NEXT:    s_mov_b32 s32, 0
86 ; GLOBALNESS1-NEXT:    ; implicit-def: $vgpr44_vgpr45
87 ; GLOBALNESS1-NEXT:    s_waitcnt vmcnt(0)
88 ; GLOBALNESS1-NEXT:    v_cmp_gt_i32_e32 vcc, 0, v0
89 ; GLOBALNESS1-NEXT:    v_cndmask_b32_e64 v1, 0, 1, vcc
90 ; GLOBALNESS1-NEXT:    v_cmp_gt_i32_e32 vcc, 1, v0
91 ; GLOBALNESS1-NEXT:    v_cndmask_b32_e64 v2, 0, 1, vcc
92 ; GLOBALNESS1-NEXT:    v_cmp_eq_u32_e32 vcc, 1, v0
93 ; GLOBALNESS1-NEXT:    v_cndmask_b32_e64 v3, 0, 1, vcc
94 ; GLOBALNESS1-NEXT:    v_cmp_eq_u32_e32 vcc, 0, v0
95 ; GLOBALNESS1-NEXT:    v_cndmask_b32_e64 v0, 0, 1, vcc
96 ; GLOBALNESS1-NEXT:    v_cmp_ne_u32_e64 s[54:55], 1, v1
97 ; GLOBALNESS1-NEXT:    v_cmp_ne_u32_e64 s[56:57], 1, v2
98 ; GLOBALNESS1-NEXT:    v_cmp_ne_u32_e64 s[58:59], 1, v3
99 ; GLOBALNESS1-NEXT:    v_cmp_ne_u32_e64 s[60:61], 1, v0
100 ; GLOBALNESS1-NEXT:    s_branch .LBB1_4
101 ; GLOBALNESS1-NEXT:  .LBB1_1: ; %bb70.i
102 ; GLOBALNESS1-NEXT:    ; in Loop: Header=BB1_4 Depth=1
103 ; GLOBALNESS1-NEXT:    s_and_b64 vcc, exec, s[60:61]
104 ; GLOBALNESS1-NEXT:    s_cbranch_vccz .LBB1_29
105 ; GLOBALNESS1-NEXT:  .LBB1_2: ; %Flow15
106 ; GLOBALNESS1-NEXT:    ; in Loop: Header=BB1_4 Depth=1
107 ; GLOBALNESS1-NEXT:    s_or_b64 exec, exec, s[4:5]
108 ; GLOBALNESS1-NEXT:    s_mov_b64 s[6:7], 0
109 ; GLOBALNESS1-NEXT:    ; implicit-def: $sgpr4_sgpr5
110 ; GLOBALNESS1-NEXT:  .LBB1_3: ; %Flow28
111 ; GLOBALNESS1-NEXT:    ; in Loop: Header=BB1_4 Depth=1
112 ; GLOBALNESS1-NEXT:    s_and_b64 vcc, exec, s[6:7]
113 ; GLOBALNESS1-NEXT:    v_pk_mov_b32 v[44:45], v[0:1], v[0:1] op_sel:[0,1]
114 ; GLOBALNESS1-NEXT:    s_cbranch_vccnz .LBB1_30
115 ; GLOBALNESS1-NEXT:  .LBB1_4: ; %bb5
116 ; GLOBALNESS1-NEXT:    ; =>This Loop Header: Depth=1
117 ; GLOBALNESS1-NEXT:    ; Child Loop BB1_15 Depth 2
118 ; GLOBALNESS1-NEXT:    v_pk_mov_b32 v[0:1], s[74:75], s[74:75] op_sel:[0,1]
119 ; GLOBALNESS1-NEXT:    flat_load_dword v40, v[0:1]
120 ; GLOBALNESS1-NEXT:    s_add_u32 s8, s38, 40
121 ; GLOBALNESS1-NEXT:    buffer_store_dword v42, off, s[0:3], 0
122 ; GLOBALNESS1-NEXT:    flat_load_dword v46, v[0:1]
123 ; GLOBALNESS1-NEXT:    s_addc_u32 s9, s39, 0
124 ; GLOBALNESS1-NEXT:    s_mov_b64 s[4:5], s[40:41]
125 ; GLOBALNESS1-NEXT:    s_mov_b64 s[6:7], s[36:37]
126 ; GLOBALNESS1-NEXT:    s_mov_b64 s[10:11], s[34:35]
127 ; GLOBALNESS1-NEXT:    s_mov_b32 s12, s72
128 ; GLOBALNESS1-NEXT:    s_mov_b32 s13, s71
129 ; GLOBALNESS1-NEXT:    s_mov_b32 s14, s70
130 ; GLOBALNESS1-NEXT:    v_mov_b32_e32 v31, v41
131 ; GLOBALNESS1-NEXT:    s_waitcnt lgkmcnt(0)
132 ; GLOBALNESS1-NEXT:    s_swappc_b64 s[30:31], s[76:77]
133 ; GLOBALNESS1-NEXT:    s_and_b64 vcc, exec, s[46:47]
134 ; GLOBALNESS1-NEXT:    s_mov_b64 s[6:7], -1
135 ; GLOBALNESS1-NEXT:    ; implicit-def: $sgpr4_sgpr5
136 ; GLOBALNESS1-NEXT:    s_cbranch_vccnz .LBB1_8
137 ; GLOBALNESS1-NEXT:  ; %bb.5: ; %NodeBlock
138 ; GLOBALNESS1-NEXT:    ; in Loop: Header=BB1_4 Depth=1
139 ; GLOBALNESS1-NEXT:    s_cmp_lt_i32 s79, 1
140 ; GLOBALNESS1-NEXT:    s_cbranch_scc1 .LBB1_7
141 ; GLOBALNESS1-NEXT:  ; %bb.6: ; %LeafBlock12
142 ; GLOBALNESS1-NEXT:    ; in Loop: Header=BB1_4 Depth=1
143 ; GLOBALNESS1-NEXT:    s_cmp_lg_u32 s79, 1
144 ; GLOBALNESS1-NEXT:    s_mov_b64 s[4:5], -1
145 ; GLOBALNESS1-NEXT:    s_cselect_b64 s[6:7], -1, 0
146 ; GLOBALNESS1-NEXT:    s_cbranch_execnz .LBB1_8
147 ; GLOBALNESS1-NEXT:    s_branch .LBB1_23
148 ; GLOBALNESS1-NEXT:  .LBB1_7: ; in Loop: Header=BB1_4 Depth=1
149 ; GLOBALNESS1-NEXT:    s_mov_b64 s[6:7], 0
150 ; GLOBALNESS1-NEXT:    ; implicit-def: $sgpr4_sgpr5
151 ; GLOBALNESS1-NEXT:    s_branch .LBB1_23
152 ; GLOBALNESS1-NEXT:  .LBB1_8: ; %Flow25
153 ; GLOBALNESS1-NEXT:    ; in Loop: Header=BB1_4 Depth=1
154 ; GLOBALNESS1-NEXT:    s_and_b64 vcc, exec, s[6:7]
155 ; GLOBALNESS1-NEXT:    s_cbranch_vccz .LBB1_24
156 ; GLOBALNESS1-NEXT:  .LBB1_9: ; %baz.exit.i
157 ; GLOBALNESS1-NEXT:    ; in Loop: Header=BB1_4 Depth=1
158 ; GLOBALNESS1-NEXT:    v_pk_mov_b32 v[2:3], 0, 0
159 ; GLOBALNESS1-NEXT:    flat_load_dword v0, v[2:3]
160 ; GLOBALNESS1-NEXT:    s_waitcnt vmcnt(0) lgkmcnt(0)
161 ; GLOBALNESS1-NEXT:    v_cmp_gt_i32_e64 s[62:63], 0, v0
162 ; GLOBALNESS1-NEXT:    v_mov_b32_e32 v0, 0
163 ; GLOBALNESS1-NEXT:    v_mov_b32_e32 v1, 0x3ff00000
164 ; GLOBALNESS1-NEXT:    s_and_saveexec_b64 s[80:81], s[62:63]
165 ; GLOBALNESS1-NEXT:    s_cbranch_execz .LBB1_26
166 ; GLOBALNESS1-NEXT:  ; %bb.10: ; %bb33.i
167 ; GLOBALNESS1-NEXT:    ; in Loop: Header=BB1_4 Depth=1
168 ; GLOBALNESS1-NEXT:    global_load_dwordx2 v[0:1], v[2:3], off
169 ; GLOBALNESS1-NEXT:    s_and_b64 vcc, exec, s[54:55]
170 ; GLOBALNESS1-NEXT:    s_cbranch_vccnz .LBB1_12
171 ; GLOBALNESS1-NEXT:  ; %bb.11: ; %bb39.i
172 ; GLOBALNESS1-NEXT:    ; in Loop: Header=BB1_4 Depth=1
173 ; GLOBALNESS1-NEXT:    v_mov_b32_e32 v43, v42
174 ; GLOBALNESS1-NEXT:    v_pk_mov_b32 v[2:3], 0, 0
175 ; GLOBALNESS1-NEXT:    global_store_dwordx2 v[2:3], v[42:43], off
176 ; GLOBALNESS1-NEXT:  .LBB1_12: ; %bb44.lr.ph.i
177 ; GLOBALNESS1-NEXT:    ; in Loop: Header=BB1_4 Depth=1
178 ; GLOBALNESS1-NEXT:    v_cmp_ne_u32_e32 vcc, 0, v46
179 ; GLOBALNESS1-NEXT:    v_cndmask_b32_e32 v2, 0, v40, vcc
180 ; GLOBALNESS1-NEXT:    s_waitcnt vmcnt(0)
181 ; GLOBALNESS1-NEXT:    v_cmp_nlt_f64_e64 s[64:65], 0, v[0:1]
182 ; GLOBALNESS1-NEXT:    v_cmp_eq_u32_e64 s[66:67], 0, v2
183 ; GLOBALNESS1-NEXT:    s_branch .LBB1_15
184 ; GLOBALNESS1-NEXT:  .LBB1_13: ; %Flow16
185 ; GLOBALNESS1-NEXT:    ; in Loop: Header=BB1_15 Depth=2
186 ; GLOBALNESS1-NEXT:    s_or_b64 exec, exec, s[4:5]
187 ; GLOBALNESS1-NEXT:  .LBB1_14: ; %bb63.i
188 ; GLOBALNESS1-NEXT:    ; in Loop: Header=BB1_15 Depth=2
189 ; GLOBALNESS1-NEXT:    s_and_b64 vcc, exec, s[52:53]
190 ; GLOBALNESS1-NEXT:    s_cbranch_vccz .LBB1_25
191 ; GLOBALNESS1-NEXT:  .LBB1_15: ; %bb44.i
192 ; GLOBALNESS1-NEXT:    ; Parent Loop BB1_4 Depth=1
193 ; GLOBALNESS1-NEXT:    ; => This Inner Loop Header: Depth=2
194 ; GLOBALNESS1-NEXT:    s_and_b64 vcc, exec, s[48:49]
195 ; GLOBALNESS1-NEXT:    s_cbranch_vccnz .LBB1_14
196 ; GLOBALNESS1-NEXT:  ; %bb.16: ; %bb46.i
197 ; GLOBALNESS1-NEXT:    ; in Loop: Header=BB1_15 Depth=2
198 ; GLOBALNESS1-NEXT:    s_and_b64 vcc, exec, s[50:51]
199 ; GLOBALNESS1-NEXT:    s_cbranch_vccnz .LBB1_14
200 ; GLOBALNESS1-NEXT:  ; %bb.17: ; %bb50.i
201 ; GLOBALNESS1-NEXT:    ; in Loop: Header=BB1_15 Depth=2
202 ; GLOBALNESS1-NEXT:    s_and_b64 vcc, exec, s[42:43]
203 ; GLOBALNESS1-NEXT:    s_cbranch_vccnz .LBB1_20
204 ; GLOBALNESS1-NEXT:  ; %bb.18: ; %bb3.i.i
205 ; GLOBALNESS1-NEXT:    ; in Loop: Header=BB1_15 Depth=2
206 ; GLOBALNESS1-NEXT:    s_and_b64 vcc, exec, s[44:45]
207 ; GLOBALNESS1-NEXT:    s_cbranch_vccnz .LBB1_20
208 ; GLOBALNESS1-NEXT:  ; %bb.19: ; %bb6.i.i
209 ; GLOBALNESS1-NEXT:    ; in Loop: Header=BB1_15 Depth=2
210 ; GLOBALNESS1-NEXT:    s_andn2_b64 vcc, exec, s[64:65]
211 ; GLOBALNESS1-NEXT:  .LBB1_20: ; %spam.exit.i
212 ; GLOBALNESS1-NEXT:    ; in Loop: Header=BB1_15 Depth=2
213 ; GLOBALNESS1-NEXT:    s_and_b64 vcc, exec, s[56:57]
214 ; GLOBALNESS1-NEXT:    s_cbranch_vccnz .LBB1_14
215 ; GLOBALNESS1-NEXT:  ; %bb.21: ; %bb55.i
216 ; GLOBALNESS1-NEXT:    ; in Loop: Header=BB1_15 Depth=2
217 ; GLOBALNESS1-NEXT:    s_add_u32 s68, s38, 40
218 ; GLOBALNESS1-NEXT:    s_addc_u32 s69, s39, 0
219 ; GLOBALNESS1-NEXT:    s_mov_b64 s[4:5], s[40:41]
220 ; GLOBALNESS1-NEXT:    s_mov_b64 s[6:7], s[36:37]
221 ; GLOBALNESS1-NEXT:    s_mov_b64 s[8:9], s[68:69]
222 ; GLOBALNESS1-NEXT:    s_mov_b64 s[10:11], s[34:35]
223 ; GLOBALNESS1-NEXT:    s_mov_b32 s12, s72
224 ; GLOBALNESS1-NEXT:    s_mov_b32 s13, s71
225 ; GLOBALNESS1-NEXT:    s_mov_b32 s14, s70
226 ; GLOBALNESS1-NEXT:    v_mov_b32_e32 v31, v41
227 ; GLOBALNESS1-NEXT:    s_swappc_b64 s[30:31], s[76:77]
228 ; GLOBALNESS1-NEXT:    v_pk_mov_b32 v[46:47], 0, 0
229 ; GLOBALNESS1-NEXT:    s_mov_b64 s[4:5], s[40:41]
230 ; GLOBALNESS1-NEXT:    s_mov_b64 s[6:7], s[36:37]
231 ; GLOBALNESS1-NEXT:    s_mov_b64 s[8:9], s[68:69]
232 ; GLOBALNESS1-NEXT:    s_mov_b64 s[10:11], s[34:35]
233 ; GLOBALNESS1-NEXT:    s_mov_b32 s12, s72
234 ; GLOBALNESS1-NEXT:    s_mov_b32 s13, s71
235 ; GLOBALNESS1-NEXT:    s_mov_b32 s14, s70
236 ; GLOBALNESS1-NEXT:    v_mov_b32_e32 v31, v41
237 ; GLOBALNESS1-NEXT:    global_store_dwordx2 v[46:47], v[44:45], off
238 ; GLOBALNESS1-NEXT:    s_swappc_b64 s[30:31], s[76:77]
239 ; GLOBALNESS1-NEXT:    s_and_saveexec_b64 s[4:5], s[66:67]
240 ; GLOBALNESS1-NEXT:    s_cbranch_execz .LBB1_13
241 ; GLOBALNESS1-NEXT:  ; %bb.22: ; %bb62.i
242 ; GLOBALNESS1-NEXT:    ; in Loop: Header=BB1_15 Depth=2
243 ; GLOBALNESS1-NEXT:    v_mov_b32_e32 v43, v42
244 ; GLOBALNESS1-NEXT:    global_store_dwordx2 v[46:47], v[42:43], off
245 ; GLOBALNESS1-NEXT:    s_branch .LBB1_13
246 ; GLOBALNESS1-NEXT:  .LBB1_23: ; %LeafBlock
247 ; GLOBALNESS1-NEXT:    ; in Loop: Header=BB1_4 Depth=1
248 ; GLOBALNESS1-NEXT:    s_cmp_lg_u32 s79, 0
249 ; GLOBALNESS1-NEXT:    s_mov_b64 s[4:5], 0
250 ; GLOBALNESS1-NEXT:    s_cselect_b64 s[6:7], -1, 0
251 ; GLOBALNESS1-NEXT:    s_and_b64 vcc, exec, s[6:7]
252 ; GLOBALNESS1-NEXT:    s_cbranch_vccnz .LBB1_9
253 ; GLOBALNESS1-NEXT:  .LBB1_24: ; in Loop: Header=BB1_4 Depth=1
254 ; GLOBALNESS1-NEXT:    s_mov_b64 s[6:7], -1
255 ; GLOBALNESS1-NEXT:    ; implicit-def: $vgpr0_vgpr1
256 ; GLOBALNESS1-NEXT:    s_branch .LBB1_3
257 ; GLOBALNESS1-NEXT:  .LBB1_25: ; %Flow23
258 ; GLOBALNESS1-NEXT:    ; in Loop: Header=BB1_4 Depth=1
259 ; GLOBALNESS1-NEXT:    v_pk_mov_b32 v[0:1], 0, 0
260 ; GLOBALNESS1-NEXT:  .LBB1_26: ; %Flow24
261 ; GLOBALNESS1-NEXT:    ; in Loop: Header=BB1_4 Depth=1
262 ; GLOBALNESS1-NEXT:    s_or_b64 exec, exec, s[80:81]
263 ; GLOBALNESS1-NEXT:    s_and_saveexec_b64 s[4:5], s[62:63]
264 ; GLOBALNESS1-NEXT:    s_cbranch_execz .LBB1_2
265 ; GLOBALNESS1-NEXT:  ; %bb.27: ; %bb67.i
266 ; GLOBALNESS1-NEXT:    ; in Loop: Header=BB1_4 Depth=1
267 ; GLOBALNESS1-NEXT:    s_and_b64 vcc, exec, s[58:59]
268 ; GLOBALNESS1-NEXT:    s_cbranch_vccnz .LBB1_1
269 ; GLOBALNESS1-NEXT:  ; %bb.28: ; %bb69.i
270 ; GLOBALNESS1-NEXT:    ; in Loop: Header=BB1_4 Depth=1
271 ; GLOBALNESS1-NEXT:    v_mov_b32_e32 v43, v42
272 ; GLOBALNESS1-NEXT:    v_pk_mov_b32 v[2:3], 0, 0
273 ; GLOBALNESS1-NEXT:    global_store_dwordx2 v[2:3], v[42:43], off
274 ; GLOBALNESS1-NEXT:    s_branch .LBB1_1
275 ; GLOBALNESS1-NEXT:  .LBB1_29: ; %bb73.i
276 ; GLOBALNESS1-NEXT:    ; in Loop: Header=BB1_4 Depth=1
277 ; GLOBALNESS1-NEXT:    v_mov_b32_e32 v43, v42
278 ; GLOBALNESS1-NEXT:    v_pk_mov_b32 v[2:3], 0, 0
279 ; GLOBALNESS1-NEXT:    global_store_dwordx2 v[2:3], v[42:43], off
280 ; GLOBALNESS1-NEXT:    s_branch .LBB1_2
281 ; GLOBALNESS1-NEXT:  .LBB1_30: ; %loop.exit.guard
282 ; GLOBALNESS1-NEXT:    s_andn2_b64 vcc, exec, s[4:5]
283 ; GLOBALNESS1-NEXT:    s_mov_b64 s[4:5], -1
284 ; GLOBALNESS1-NEXT:    s_cbranch_vccz .LBB1_32
285 ; GLOBALNESS1-NEXT:  ; %bb.31: ; %bb7.i.i
286 ; GLOBALNESS1-NEXT:    s_add_u32 s8, s38, 40
287 ; GLOBALNESS1-NEXT:    s_addc_u32 s9, s39, 0
288 ; GLOBALNESS1-NEXT:    s_mov_b64 s[4:5], s[40:41]
289 ; GLOBALNESS1-NEXT:    s_mov_b64 s[6:7], s[36:37]
290 ; GLOBALNESS1-NEXT:    s_mov_b64 s[10:11], s[34:35]
291 ; GLOBALNESS1-NEXT:    s_mov_b32 s12, s72
292 ; GLOBALNESS1-NEXT:    s_mov_b32 s13, s71
293 ; GLOBALNESS1-NEXT:    s_mov_b32 s14, s70
294 ; GLOBALNESS1-NEXT:    v_mov_b32_e32 v31, v41
295 ; GLOBALNESS1-NEXT:    s_getpc_b64 s[16:17]
296 ; GLOBALNESS1-NEXT:    s_add_u32 s16, s16, widget@rel32@lo+4
297 ; GLOBALNESS1-NEXT:    s_addc_u32 s17, s17, widget@rel32@hi+12
298 ; GLOBALNESS1-NEXT:    s_swappc_b64 s[30:31], s[16:17]
299 ; GLOBALNESS1-NEXT:    s_mov_b64 s[4:5], 0
300 ; GLOBALNESS1-NEXT:  .LBB1_32: ; %Flow
301 ; GLOBALNESS1-NEXT:    s_andn2_b64 vcc, exec, s[4:5]
302 ; GLOBALNESS1-NEXT:    s_cbranch_vccnz .LBB1_34
303 ; GLOBALNESS1-NEXT:  ; %bb.33: ; %bb11.i.i
304 ; GLOBALNESS1-NEXT:    s_add_u32 s8, s38, 40
305 ; GLOBALNESS1-NEXT:    s_addc_u32 s9, s39, 0
306 ; GLOBALNESS1-NEXT:    s_mov_b64 s[4:5], s[40:41]
307 ; GLOBALNESS1-NEXT:    s_mov_b64 s[6:7], s[36:37]
308 ; GLOBALNESS1-NEXT:    s_mov_b64 s[10:11], s[34:35]
309 ; GLOBALNESS1-NEXT:    s_mov_b32 s12, s72
310 ; GLOBALNESS1-NEXT:    s_mov_b32 s13, s71
311 ; GLOBALNESS1-NEXT:    s_mov_b32 s14, s70
312 ; GLOBALNESS1-NEXT:    v_mov_b32_e32 v31, v41
313 ; GLOBALNESS1-NEXT:    s_getpc_b64 s[16:17]
314 ; GLOBALNESS1-NEXT:    s_add_u32 s16, s16, widget@rel32@lo+4
315 ; GLOBALNESS1-NEXT:    s_addc_u32 s17, s17, widget@rel32@hi+12
316 ; GLOBALNESS1-NEXT:    s_swappc_b64 s[30:31], s[16:17]
317 ; GLOBALNESS1-NEXT:  .LBB1_34: ; %UnifiedUnreachableBlock
319 ; GLOBALNESS0-LABEL: kernel:
320 ; GLOBALNESS0:       ; %bb.0: ; %bb
321 ; GLOBALNESS0-NEXT:    s_mov_b64 s[36:37], s[6:7]
322 ; GLOBALNESS0-NEXT:    s_load_dwordx4 s[72:75], s[8:9], 0x0
323 ; GLOBALNESS0-NEXT:    s_load_dword s6, s[8:9], 0x14
324 ; GLOBALNESS0-NEXT:    v_mov_b32_e32 v41, v0
325 ; GLOBALNESS0-NEXT:    v_mov_b32_e32 v42, 0
326 ; GLOBALNESS0-NEXT:    v_pk_mov_b32 v[0:1], 0, 0
327 ; GLOBALNESS0-NEXT:    global_store_dword v[0:1], v42, off
328 ; GLOBALNESS0-NEXT:    s_waitcnt lgkmcnt(0)
329 ; GLOBALNESS0-NEXT:    global_load_dword v0, v42, s[72:73]
330 ; GLOBALNESS0-NEXT:    s_mov_b64 s[40:41], s[4:5]
331 ; GLOBALNESS0-NEXT:    s_load_dwordx2 s[4:5], s[8:9], 0x18
332 ; GLOBALNESS0-NEXT:    s_load_dword s7, s[8:9], 0x20
333 ; GLOBALNESS0-NEXT:    s_add_u32 flat_scratch_lo, s12, s17
334 ; GLOBALNESS0-NEXT:    s_addc_u32 flat_scratch_hi, s13, 0
335 ; GLOBALNESS0-NEXT:    s_add_u32 s0, s0, s17
336 ; GLOBALNESS0-NEXT:    s_addc_u32 s1, s1, 0
337 ; GLOBALNESS0-NEXT:    v_mov_b32_e32 v43, 0x40994400
338 ; GLOBALNESS0-NEXT:    s_bitcmp1_b32 s74, 0
339 ; GLOBALNESS0-NEXT:    s_waitcnt lgkmcnt(0)
340 ; GLOBALNESS0-NEXT:    v_cmp_ngt_f64_e32 vcc, s[4:5], v[42:43]
341 ; GLOBALNESS0-NEXT:    v_cmp_ngt_f64_e64 s[4:5], s[4:5], 0
342 ; GLOBALNESS0-NEXT:    v_cndmask_b32_e64 v2, 0, 1, s[4:5]
343 ; GLOBALNESS0-NEXT:    s_cselect_b64 s[4:5], -1, 0
344 ; GLOBALNESS0-NEXT:    v_cndmask_b32_e64 v3, 0, 1, s[4:5]
345 ; GLOBALNESS0-NEXT:    s_xor_b64 s[4:5], s[4:5], -1
346 ; GLOBALNESS0-NEXT:    v_cndmask_b32_e64 v1, 0, 1, vcc
347 ; GLOBALNESS0-NEXT:    s_bitcmp1_b32 s6, 0
348 ; GLOBALNESS0-NEXT:    v_cmp_ne_u32_e64 s[42:43], 1, v1
349 ; GLOBALNESS0-NEXT:    v_cndmask_b32_e64 v1, 0, 1, s[4:5]
350 ; GLOBALNESS0-NEXT:    s_cselect_b64 s[4:5], -1, 0
351 ; GLOBALNESS0-NEXT:    s_xor_b64 s[4:5], s[4:5], -1
352 ; GLOBALNESS0-NEXT:    s_bitcmp1_b32 s7, 0
353 ; GLOBALNESS0-NEXT:    v_cmp_ne_u32_e64 s[48:49], 1, v1
354 ; GLOBALNESS0-NEXT:    v_cndmask_b32_e64 v1, 0, 1, s[4:5]
355 ; GLOBALNESS0-NEXT:    s_cselect_b64 s[4:5], -1, 0
356 ; GLOBALNESS0-NEXT:    s_getpc_b64 s[6:7]
357 ; GLOBALNESS0-NEXT:    s_add_u32 s6, s6, wobble@gotpcrel32@lo+4
358 ; GLOBALNESS0-NEXT:    s_addc_u32 s7, s7, wobble@gotpcrel32@hi+12
359 ; GLOBALNESS0-NEXT:    s_xor_b64 s[4:5], s[4:5], -1
360 ; GLOBALNESS0-NEXT:    v_cmp_ne_u32_e64 s[50:51], 1, v1
361 ; GLOBALNESS0-NEXT:    v_cndmask_b32_e64 v1, 0, 1, s[4:5]
362 ; GLOBALNESS0-NEXT:    s_load_dwordx2 s[78:79], s[6:7], 0x0
363 ; GLOBALNESS0-NEXT:    v_cmp_ne_u32_e64 s[52:53], 1, v1
364 ; GLOBALNESS0-NEXT:    v_cmp_ne_u32_e64 s[44:45], 1, v2
365 ; GLOBALNESS0-NEXT:    v_cmp_ne_u32_e64 s[46:47], 1, v3
366 ; GLOBALNESS0-NEXT:    s_mov_b32 s68, s16
367 ; GLOBALNESS0-NEXT:    s_mov_b64 s[38:39], s[8:9]
368 ; GLOBALNESS0-NEXT:    s_mov_b32 s69, s15
369 ; GLOBALNESS0-NEXT:    s_mov_b32 s70, s14
370 ; GLOBALNESS0-NEXT:    s_mov_b64 s[34:35], s[10:11]
371 ; GLOBALNESS0-NEXT:    s_mov_b64 s[76:77], 0x80
372 ; GLOBALNESS0-NEXT:    s_mov_b32 s32, 0
373 ; GLOBALNESS0-NEXT:    ; implicit-def: $vgpr44_vgpr45
374 ; GLOBALNESS0-NEXT:    s_waitcnt vmcnt(0)
375 ; GLOBALNESS0-NEXT:    v_cmp_gt_i32_e32 vcc, 0, v0
376 ; GLOBALNESS0-NEXT:    v_cndmask_b32_e64 v1, 0, 1, vcc
377 ; GLOBALNESS0-NEXT:    v_cmp_gt_i32_e32 vcc, 1, v0
378 ; GLOBALNESS0-NEXT:    v_cndmask_b32_e64 v2, 0, 1, vcc
379 ; GLOBALNESS0-NEXT:    v_cmp_eq_u32_e32 vcc, 1, v0
380 ; GLOBALNESS0-NEXT:    v_cndmask_b32_e64 v3, 0, 1, vcc
381 ; GLOBALNESS0-NEXT:    v_cmp_eq_u32_e32 vcc, 0, v0
382 ; GLOBALNESS0-NEXT:    v_cndmask_b32_e64 v0, 0, 1, vcc
383 ; GLOBALNESS0-NEXT:    v_cmp_ne_u32_e64 s[54:55], 1, v1
384 ; GLOBALNESS0-NEXT:    v_cmp_ne_u32_e64 s[56:57], 1, v2
385 ; GLOBALNESS0-NEXT:    v_cmp_ne_u32_e64 s[58:59], 1, v3
386 ; GLOBALNESS0-NEXT:    v_cmp_ne_u32_e64 s[60:61], 1, v0
387 ; GLOBALNESS0-NEXT:    s_branch .LBB1_4
388 ; GLOBALNESS0-NEXT:  .LBB1_1: ; %bb70.i
389 ; GLOBALNESS0-NEXT:    ; in Loop: Header=BB1_4 Depth=1
390 ; GLOBALNESS0-NEXT:    s_and_b64 vcc, exec, s[60:61]
391 ; GLOBALNESS0-NEXT:    s_cbranch_vccz .LBB1_29
392 ; GLOBALNESS0-NEXT:  .LBB1_2: ; %Flow15
393 ; GLOBALNESS0-NEXT:    ; in Loop: Header=BB1_4 Depth=1
394 ; GLOBALNESS0-NEXT:    s_or_b64 exec, exec, s[4:5]
395 ; GLOBALNESS0-NEXT:    s_mov_b64 s[6:7], 0
396 ; GLOBALNESS0-NEXT:    ; implicit-def: $sgpr4_sgpr5
397 ; GLOBALNESS0-NEXT:  .LBB1_3: ; %Flow28
398 ; GLOBALNESS0-NEXT:    ; in Loop: Header=BB1_4 Depth=1
399 ; GLOBALNESS0-NEXT:    s_and_b64 vcc, exec, s[6:7]
400 ; GLOBALNESS0-NEXT:    v_pk_mov_b32 v[44:45], v[0:1], v[0:1] op_sel:[0,1]
401 ; GLOBALNESS0-NEXT:    s_cbranch_vccnz .LBB1_30
402 ; GLOBALNESS0-NEXT:  .LBB1_4: ; %bb5
403 ; GLOBALNESS0-NEXT:    ; =>This Loop Header: Depth=1
404 ; GLOBALNESS0-NEXT:    ; Child Loop BB1_15 Depth 2
405 ; GLOBALNESS0-NEXT:    v_pk_mov_b32 v[0:1], s[76:77], s[76:77] op_sel:[0,1]
406 ; GLOBALNESS0-NEXT:    flat_load_dword v40, v[0:1]
407 ; GLOBALNESS0-NEXT:    s_add_u32 s8, s38, 40
408 ; GLOBALNESS0-NEXT:    buffer_store_dword v42, off, s[0:3], 0
409 ; GLOBALNESS0-NEXT:    flat_load_dword v46, v[0:1]
410 ; GLOBALNESS0-NEXT:    s_addc_u32 s9, s39, 0
411 ; GLOBALNESS0-NEXT:    s_mov_b64 s[4:5], s[40:41]
412 ; GLOBALNESS0-NEXT:    s_mov_b64 s[6:7], s[36:37]
413 ; GLOBALNESS0-NEXT:    s_mov_b64 s[10:11], s[34:35]
414 ; GLOBALNESS0-NEXT:    s_mov_b32 s12, s70
415 ; GLOBALNESS0-NEXT:    s_mov_b32 s13, s69
416 ; GLOBALNESS0-NEXT:    s_mov_b32 s14, s68
417 ; GLOBALNESS0-NEXT:    v_mov_b32_e32 v31, v41
418 ; GLOBALNESS0-NEXT:    s_waitcnt lgkmcnt(0)
419 ; GLOBALNESS0-NEXT:    s_swappc_b64 s[30:31], s[78:79]
420 ; GLOBALNESS0-NEXT:    s_and_b64 vcc, exec, s[46:47]
421 ; GLOBALNESS0-NEXT:    s_mov_b64 s[6:7], -1
422 ; GLOBALNESS0-NEXT:    ; implicit-def: $sgpr4_sgpr5
423 ; GLOBALNESS0-NEXT:    s_cbranch_vccnz .LBB1_8
424 ; GLOBALNESS0-NEXT:  ; %bb.5: ; %NodeBlock
425 ; GLOBALNESS0-NEXT:    ; in Loop: Header=BB1_4 Depth=1
426 ; GLOBALNESS0-NEXT:    s_cmp_lt_i32 s75, 1
427 ; GLOBALNESS0-NEXT:    s_cbranch_scc1 .LBB1_7
428 ; GLOBALNESS0-NEXT:  ; %bb.6: ; %LeafBlock12
429 ; GLOBALNESS0-NEXT:    ; in Loop: Header=BB1_4 Depth=1
430 ; GLOBALNESS0-NEXT:    s_cmp_lg_u32 s75, 1
431 ; GLOBALNESS0-NEXT:    s_mov_b64 s[4:5], -1
432 ; GLOBALNESS0-NEXT:    s_cselect_b64 s[6:7], -1, 0
433 ; GLOBALNESS0-NEXT:    s_cbranch_execnz .LBB1_8
434 ; GLOBALNESS0-NEXT:    s_branch .LBB1_23
435 ; GLOBALNESS0-NEXT:  .LBB1_7: ; in Loop: Header=BB1_4 Depth=1
436 ; GLOBALNESS0-NEXT:    s_mov_b64 s[6:7], 0
437 ; GLOBALNESS0-NEXT:    ; implicit-def: $sgpr4_sgpr5
438 ; GLOBALNESS0-NEXT:    s_branch .LBB1_23
439 ; GLOBALNESS0-NEXT:  .LBB1_8: ; %Flow25
440 ; GLOBALNESS0-NEXT:    ; in Loop: Header=BB1_4 Depth=1
441 ; GLOBALNESS0-NEXT:    s_and_b64 vcc, exec, s[6:7]
442 ; GLOBALNESS0-NEXT:    s_cbranch_vccz .LBB1_24
443 ; GLOBALNESS0-NEXT:  .LBB1_9: ; %baz.exit.i
444 ; GLOBALNESS0-NEXT:    ; in Loop: Header=BB1_4 Depth=1
445 ; GLOBALNESS0-NEXT:    v_pk_mov_b32 v[2:3], 0, 0
446 ; GLOBALNESS0-NEXT:    flat_load_dword v0, v[2:3]
447 ; GLOBALNESS0-NEXT:    s_waitcnt vmcnt(0) lgkmcnt(0)
448 ; GLOBALNESS0-NEXT:    v_cmp_gt_i32_e64 s[62:63], 0, v0
449 ; GLOBALNESS0-NEXT:    v_mov_b32_e32 v0, 0
450 ; GLOBALNESS0-NEXT:    v_mov_b32_e32 v1, 0x3ff00000
451 ; GLOBALNESS0-NEXT:    s_and_saveexec_b64 s[80:81], s[62:63]
452 ; GLOBALNESS0-NEXT:    s_cbranch_execz .LBB1_26
453 ; GLOBALNESS0-NEXT:  ; %bb.10: ; %bb33.i
454 ; GLOBALNESS0-NEXT:    ; in Loop: Header=BB1_4 Depth=1
455 ; GLOBALNESS0-NEXT:    global_load_dwordx2 v[0:1], v[2:3], off
456 ; GLOBALNESS0-NEXT:    s_and_b64 vcc, exec, s[54:55]
457 ; GLOBALNESS0-NEXT:    s_cbranch_vccnz .LBB1_12
458 ; GLOBALNESS0-NEXT:  ; %bb.11: ; %bb39.i
459 ; GLOBALNESS0-NEXT:    ; in Loop: Header=BB1_4 Depth=1
460 ; GLOBALNESS0-NEXT:    v_mov_b32_e32 v43, v42
461 ; GLOBALNESS0-NEXT:    v_pk_mov_b32 v[2:3], 0, 0
462 ; GLOBALNESS0-NEXT:    global_store_dwordx2 v[2:3], v[42:43], off
463 ; GLOBALNESS0-NEXT:  .LBB1_12: ; %bb44.lr.ph.i
464 ; GLOBALNESS0-NEXT:    ; in Loop: Header=BB1_4 Depth=1
465 ; GLOBALNESS0-NEXT:    v_cmp_ne_u32_e32 vcc, 0, v46
466 ; GLOBALNESS0-NEXT:    v_cndmask_b32_e32 v2, 0, v40, vcc
467 ; GLOBALNESS0-NEXT:    s_waitcnt vmcnt(0)
468 ; GLOBALNESS0-NEXT:    v_cmp_nlt_f64_e64 s[64:65], 0, v[0:1]
469 ; GLOBALNESS0-NEXT:    v_cmp_eq_u32_e64 s[66:67], 0, v2
470 ; GLOBALNESS0-NEXT:    s_branch .LBB1_15
471 ; GLOBALNESS0-NEXT:  .LBB1_13: ; %Flow16
472 ; GLOBALNESS0-NEXT:    ; in Loop: Header=BB1_15 Depth=2
473 ; GLOBALNESS0-NEXT:    s_or_b64 exec, exec, s[4:5]
474 ; GLOBALNESS0-NEXT:  .LBB1_14: ; %bb63.i
475 ; GLOBALNESS0-NEXT:    ; in Loop: Header=BB1_15 Depth=2
476 ; GLOBALNESS0-NEXT:    s_and_b64 vcc, exec, s[52:53]
477 ; GLOBALNESS0-NEXT:    s_cbranch_vccz .LBB1_25
478 ; GLOBALNESS0-NEXT:  .LBB1_15: ; %bb44.i
479 ; GLOBALNESS0-NEXT:    ; Parent Loop BB1_4 Depth=1
480 ; GLOBALNESS0-NEXT:    ; => This Inner Loop Header: Depth=2
481 ; GLOBALNESS0-NEXT:    s_and_b64 vcc, exec, s[48:49]
482 ; GLOBALNESS0-NEXT:    s_cbranch_vccnz .LBB1_14
483 ; GLOBALNESS0-NEXT:  ; %bb.16: ; %bb46.i
484 ; GLOBALNESS0-NEXT:    ; in Loop: Header=BB1_15 Depth=2
485 ; GLOBALNESS0-NEXT:    s_and_b64 vcc, exec, s[50:51]
486 ; GLOBALNESS0-NEXT:    s_cbranch_vccnz .LBB1_14
487 ; GLOBALNESS0-NEXT:  ; %bb.17: ; %bb50.i
488 ; GLOBALNESS0-NEXT:    ; in Loop: Header=BB1_15 Depth=2
489 ; GLOBALNESS0-NEXT:    s_and_b64 vcc, exec, s[42:43]
490 ; GLOBALNESS0-NEXT:    s_cbranch_vccnz .LBB1_20
491 ; GLOBALNESS0-NEXT:  ; %bb.18: ; %bb3.i.i
492 ; GLOBALNESS0-NEXT:    ; in Loop: Header=BB1_15 Depth=2
493 ; GLOBALNESS0-NEXT:    s_and_b64 vcc, exec, s[44:45]
494 ; GLOBALNESS0-NEXT:    s_cbranch_vccnz .LBB1_20
495 ; GLOBALNESS0-NEXT:  ; %bb.19: ; %bb6.i.i
496 ; GLOBALNESS0-NEXT:    ; in Loop: Header=BB1_15 Depth=2
497 ; GLOBALNESS0-NEXT:    s_andn2_b64 vcc, exec, s[64:65]
498 ; GLOBALNESS0-NEXT:  .LBB1_20: ; %spam.exit.i
499 ; GLOBALNESS0-NEXT:    ; in Loop: Header=BB1_15 Depth=2
500 ; GLOBALNESS0-NEXT:    s_and_b64 vcc, exec, s[56:57]
501 ; GLOBALNESS0-NEXT:    s_cbranch_vccnz .LBB1_14
502 ; GLOBALNESS0-NEXT:  ; %bb.21: ; %bb55.i
503 ; GLOBALNESS0-NEXT:    ; in Loop: Header=BB1_15 Depth=2
504 ; GLOBALNESS0-NEXT:    s_add_u32 s72, s38, 40
505 ; GLOBALNESS0-NEXT:    s_addc_u32 s73, s39, 0
506 ; GLOBALNESS0-NEXT:    s_mov_b64 s[4:5], s[40:41]
507 ; GLOBALNESS0-NEXT:    s_mov_b64 s[6:7], s[36:37]
508 ; GLOBALNESS0-NEXT:    s_mov_b64 s[8:9], s[72:73]
509 ; GLOBALNESS0-NEXT:    s_mov_b64 s[10:11], s[34:35]
510 ; GLOBALNESS0-NEXT:    s_mov_b32 s12, s70
511 ; GLOBALNESS0-NEXT:    s_mov_b32 s13, s69
512 ; GLOBALNESS0-NEXT:    s_mov_b32 s14, s68
513 ; GLOBALNESS0-NEXT:    v_mov_b32_e32 v31, v41
514 ; GLOBALNESS0-NEXT:    s_swappc_b64 s[30:31], s[78:79]
515 ; GLOBALNESS0-NEXT:    v_pk_mov_b32 v[46:47], 0, 0
516 ; GLOBALNESS0-NEXT:    s_mov_b64 s[4:5], s[40:41]
517 ; GLOBALNESS0-NEXT:    s_mov_b64 s[6:7], s[36:37]
518 ; GLOBALNESS0-NEXT:    s_mov_b64 s[8:9], s[72:73]
519 ; GLOBALNESS0-NEXT:    s_mov_b64 s[10:11], s[34:35]
520 ; GLOBALNESS0-NEXT:    s_mov_b32 s12, s70
521 ; GLOBALNESS0-NEXT:    s_mov_b32 s13, s69
522 ; GLOBALNESS0-NEXT:    s_mov_b32 s14, s68
523 ; GLOBALNESS0-NEXT:    v_mov_b32_e32 v31, v41
524 ; GLOBALNESS0-NEXT:    global_store_dwordx2 v[46:47], v[44:45], off
525 ; GLOBALNESS0-NEXT:    s_swappc_b64 s[30:31], s[78:79]
526 ; GLOBALNESS0-NEXT:    s_and_saveexec_b64 s[4:5], s[66:67]
527 ; GLOBALNESS0-NEXT:    s_cbranch_execz .LBB1_13
528 ; GLOBALNESS0-NEXT:  ; %bb.22: ; %bb62.i
529 ; GLOBALNESS0-NEXT:    ; in Loop: Header=BB1_15 Depth=2
530 ; GLOBALNESS0-NEXT:    v_mov_b32_e32 v43, v42
531 ; GLOBALNESS0-NEXT:    global_store_dwordx2 v[46:47], v[42:43], off
532 ; GLOBALNESS0-NEXT:    s_branch .LBB1_13
533 ; GLOBALNESS0-NEXT:  .LBB1_23: ; %LeafBlock
534 ; GLOBALNESS0-NEXT:    ; in Loop: Header=BB1_4 Depth=1
535 ; GLOBALNESS0-NEXT:    s_cmp_lg_u32 s75, 0
536 ; GLOBALNESS0-NEXT:    s_mov_b64 s[4:5], 0
537 ; GLOBALNESS0-NEXT:    s_cselect_b64 s[6:7], -1, 0
538 ; GLOBALNESS0-NEXT:    s_and_b64 vcc, exec, s[6:7]
539 ; GLOBALNESS0-NEXT:    s_cbranch_vccnz .LBB1_9
540 ; GLOBALNESS0-NEXT:  .LBB1_24: ; in Loop: Header=BB1_4 Depth=1
541 ; GLOBALNESS0-NEXT:    s_mov_b64 s[6:7], -1
542 ; GLOBALNESS0-NEXT:    ; implicit-def: $vgpr0_vgpr1
543 ; GLOBALNESS0-NEXT:    s_branch .LBB1_3
544 ; GLOBALNESS0-NEXT:  .LBB1_25: ; %Flow23
545 ; GLOBALNESS0-NEXT:    ; in Loop: Header=BB1_4 Depth=1
546 ; GLOBALNESS0-NEXT:    v_pk_mov_b32 v[0:1], 0, 0
547 ; GLOBALNESS0-NEXT:  .LBB1_26: ; %Flow24
548 ; GLOBALNESS0-NEXT:    ; in Loop: Header=BB1_4 Depth=1
549 ; GLOBALNESS0-NEXT:    s_or_b64 exec, exec, s[80:81]
550 ; GLOBALNESS0-NEXT:    s_and_saveexec_b64 s[4:5], s[62:63]
551 ; GLOBALNESS0-NEXT:    s_cbranch_execz .LBB1_2
552 ; GLOBALNESS0-NEXT:  ; %bb.27: ; %bb67.i
553 ; GLOBALNESS0-NEXT:    ; in Loop: Header=BB1_4 Depth=1
554 ; GLOBALNESS0-NEXT:    s_and_b64 vcc, exec, s[58:59]
555 ; GLOBALNESS0-NEXT:    s_cbranch_vccnz .LBB1_1
556 ; GLOBALNESS0-NEXT:  ; %bb.28: ; %bb69.i
557 ; GLOBALNESS0-NEXT:    ; in Loop: Header=BB1_4 Depth=1
558 ; GLOBALNESS0-NEXT:    v_mov_b32_e32 v43, v42
559 ; GLOBALNESS0-NEXT:    v_pk_mov_b32 v[2:3], 0, 0
560 ; GLOBALNESS0-NEXT:    global_store_dwordx2 v[2:3], v[42:43], off
561 ; GLOBALNESS0-NEXT:    s_branch .LBB1_1
562 ; GLOBALNESS0-NEXT:  .LBB1_29: ; %bb73.i
563 ; GLOBALNESS0-NEXT:    ; in Loop: Header=BB1_4 Depth=1
564 ; GLOBALNESS0-NEXT:    v_mov_b32_e32 v43, v42
565 ; GLOBALNESS0-NEXT:    v_pk_mov_b32 v[2:3], 0, 0
566 ; GLOBALNESS0-NEXT:    global_store_dwordx2 v[2:3], v[42:43], off
567 ; GLOBALNESS0-NEXT:    s_branch .LBB1_2
568 ; GLOBALNESS0-NEXT:  .LBB1_30: ; %loop.exit.guard
569 ; GLOBALNESS0-NEXT:    s_andn2_b64 vcc, exec, s[4:5]
570 ; GLOBALNESS0-NEXT:    s_mov_b64 s[4:5], -1
571 ; GLOBALNESS0-NEXT:    s_cbranch_vccz .LBB1_32
572 ; GLOBALNESS0-NEXT:  ; %bb.31: ; %bb7.i.i
573 ; GLOBALNESS0-NEXT:    s_add_u32 s8, s38, 40
574 ; GLOBALNESS0-NEXT:    s_addc_u32 s9, s39, 0
575 ; GLOBALNESS0-NEXT:    s_mov_b64 s[4:5], s[40:41]
576 ; GLOBALNESS0-NEXT:    s_mov_b64 s[6:7], s[36:37]
577 ; GLOBALNESS0-NEXT:    s_mov_b64 s[10:11], s[34:35]
578 ; GLOBALNESS0-NEXT:    s_mov_b32 s12, s70
579 ; GLOBALNESS0-NEXT:    s_mov_b32 s13, s69
580 ; GLOBALNESS0-NEXT:    s_mov_b32 s14, s68
581 ; GLOBALNESS0-NEXT:    v_mov_b32_e32 v31, v41
582 ; GLOBALNESS0-NEXT:    s_getpc_b64 s[16:17]
583 ; GLOBALNESS0-NEXT:    s_add_u32 s16, s16, widget@rel32@lo+4
584 ; GLOBALNESS0-NEXT:    s_addc_u32 s17, s17, widget@rel32@hi+12
585 ; GLOBALNESS0-NEXT:    s_swappc_b64 s[30:31], s[16:17]
586 ; GLOBALNESS0-NEXT:    s_mov_b64 s[4:5], 0
587 ; GLOBALNESS0-NEXT:  .LBB1_32: ; %Flow
588 ; GLOBALNESS0-NEXT:    s_andn2_b64 vcc, exec, s[4:5]
589 ; GLOBALNESS0-NEXT:    s_cbranch_vccnz .LBB1_34
590 ; GLOBALNESS0-NEXT:  ; %bb.33: ; %bb11.i.i
591 ; GLOBALNESS0-NEXT:    s_add_u32 s8, s38, 40
592 ; GLOBALNESS0-NEXT:    s_addc_u32 s9, s39, 0
593 ; GLOBALNESS0-NEXT:    s_mov_b64 s[4:5], s[40:41]
594 ; GLOBALNESS0-NEXT:    s_mov_b64 s[6:7], s[36:37]
595 ; GLOBALNESS0-NEXT:    s_mov_b64 s[10:11], s[34:35]
596 ; GLOBALNESS0-NEXT:    s_mov_b32 s12, s70
597 ; GLOBALNESS0-NEXT:    s_mov_b32 s13, s69
598 ; GLOBALNESS0-NEXT:    s_mov_b32 s14, s68
599 ; GLOBALNESS0-NEXT:    v_mov_b32_e32 v31, v41
600 ; GLOBALNESS0-NEXT:    s_getpc_b64 s[16:17]
601 ; GLOBALNESS0-NEXT:    s_add_u32 s16, s16, widget@rel32@lo+4
602 ; GLOBALNESS0-NEXT:    s_addc_u32 s17, s17, widget@rel32@hi+12
603 ; GLOBALNESS0-NEXT:    s_swappc_b64 s[30:31], s[16:17]
604 ; GLOBALNESS0-NEXT:  .LBB1_34: ; %UnifiedUnreachableBlock
606   store i32 0, ptr addrspace(1) null, align 4
607   %tmp4 = load i32, ptr addrspace(1) %arg1.global, align 4
608   br label %bb5
610 bb5:                                              ; preds = %bb5.backedge, %bb
611   %tmp4.i.sroa.0.0 = phi <9 x double> [ undef, %bb ], [ %tmp4.i.sroa.0.1, %bb5.backedge ]
612   %tmp14.1.i = load i32, ptr inttoptr (i64 128 to ptr), align 128
613   store i32 0, ptr addrspace(5) null, align 4
614   %tmp14.2.i = load i32, ptr inttoptr (i64 128 to ptr), align 128
615   %tmp15.2.i = icmp eq i32 %tmp14.2.i, 0
616   %spec.select.2.i = select i1 %tmp15.2.i, i32 0, i32 %tmp14.1.i
617   tail call void @wobble()
618   br i1 %tmp3.i.i, label %bb4.i.i, label %baz.exit.i
620 bb4.i.i:                                          ; preds = %bb5
621   switch i32 %tmp5.i.i, label %baz.exit.i [
622     i32 0, label %bb7.i.i
623     i32 1, label %bb11.i.i
624   ]
626 bb7.i.i:                                          ; preds = %bb4.i.i
627   tail call fastcc void @widget()
628   unreachable
630 bb11.i.i:                                         ; preds = %bb4.i.i
631   tail call fastcc void @widget()
632   unreachable
634 baz.exit.i:                                       ; preds = %bb4.i.i, %bb5
635   %tmp26.i = load i32, ptr null, align 4
636   %tmp27.i4 = load double, ptr addrspace(1) null, align 8
637   %tmp31.i = icmp slt i32 %tmp26.i, 0
638   br i1 %tmp31.i, label %bb33.i, label %bb64.i
640 bb33.i:                                           ; preds = %baz.exit.i
641   %tmp38.i = icmp slt i32 %tmp4, 0
642   br i1 %tmp38.i, label %bb39.i, label %bb44.lr.ph.i
644 bb39.i:                                           ; preds = %bb33.i
645   store double 0.000000e+00, ptr addrspace(1) null, align 8
646   br label %bb44.lr.ph.i
648 bb44.lr.ph.i:                                     ; preds = %bb39.i, %bb33.i
649   br label %bb44.i
651 bb44.i:                                           ; preds = %bb63.i, %bb44.lr.ph.i
652   br i1 %tmp3.i.i, label %bb63.i, label %bb46.i
654 bb46.i:                                           ; preds = %bb44.i
655   br i1 %tmp438.i, label %bb63.i, label %bb50.i
657 bb50.i:                                           ; preds = %bb46.i
658   switch i32 0, label %spam.exit.i [
659     i32 0, label %bb1.i.i
660   ]
662 bb1.i.i:                                          ; preds = %bb50.i
663   %tmp2.i.i = fcmp ogt double %tmp27.i, 1.617000e+03
664   br i1 %tmp2.i.i, label %spam.exit.i, label %bb3.i.i
666 bb3.i.i:                                          ; preds = %bb1.i.i
667   %tmp4.i.i = fcmp ogt double %tmp27.i, 0.000000e+00
668   br i1 %tmp4.i.i, label %spam.exit.i, label %bb6.i.i
670 bb6.i.i:                                          ; preds = %bb3.i.i
671   %tmp7.i.i = fcmp ogt double %tmp27.i4, 0.000000e+00
672   br i1 %tmp7.i.i, label %spam.exit.i, label %bb8.i.i
674 bb8.i.i:                                          ; preds = %bb6.i.i
675   tail call void null()
676   br label %spam.exit.i
678 spam.exit.i:                                      ; preds = %bb8.i.i, %bb6.i.i, %bb3.i.i, %bb1.i.i, %bb50.i
679   %tmp22.i = icmp sgt i32 %tmp4, 0
680   br i1 %tmp22.i, label %bb63.i, label %bb55.i
682 bb55.i:                                           ; preds = %spam.exit.i
683   tail call void @wobble()
684   %tmp0 = extractelement <9 x double> %tmp4.i.sroa.0.0, i32 0
685   store double %tmp0, ptr addrspace(1) null, align 8
686   tail call void @wobble()
687   %tmp61.i = icmp eq i32 %spec.select.2.i, 0
688   br i1 %tmp61.i, label %bb62.i, label %bb63.i
690 bb62.i:                                           ; preds = %bb55.i
691   store double 0.000000e+00, ptr addrspace(1) null, align 8
692   br label %bb63.i
694 bb63.i:                                           ; preds = %bb62.i, %bb55.i, %spam.exit.i, %bb46.i, %bb44.i
695   br i1 %tmp48.i, label %bb44.i, label %bb64.i
697 bb64.i:                                           ; preds = %bb63.i, %baz.exit.i
698   %tmp4.i.sroa.0.1 = phi <9 x double> [ <double 1.000000e+00, double 1.000000e+00, double 1.000000e+00, double 1.000000e+00, double 1.000000e+00, double 1.000000e+00, double 1.000000e+00, double 1.000000e+00, double 1.000000e+00>, %baz.exit.i ], [ zeroinitializer, %bb63.i ]
699   br i1 %tmp31.i, label %bb67.i, label %bb5.backedge
701 bb5.backedge:                                     ; preds = %bb73.i, %bb70.i, %bb64.i
702   br label %bb5
704 bb67.i:                                           ; preds = %bb64.i
705   %tmp68.i = icmp eq i32 %tmp4, 1
706   br i1 %tmp68.i, label %bb69.i, label %bb70.i
708 bb69.i:                                           ; preds = %bb67.i
709   store double 0.000000e+00, ptr addrspace(1) null, align 8
710   br label %bb70.i
712 bb70.i:                                           ; preds = %bb69.i, %bb67.i
713   %tmp3.i.i2 = icmp eq i32 %tmp4, 0
714   br i1 %tmp3.i.i2, label %bb73.i, label %bb5.backedge
716 bb73.i:                                           ; preds = %bb70.i
717   store double 0.000000e+00, ptr addrspace(1) null, align 8
718   br label %bb5.backedge