1 ; RUN: llc < %s -march=x86-64 > %t
2 ; RUN: not grep {,%rsp)} %t
5 target datalayout = "e-p:64:64"
6 @i6000 = global [128 x i64] zeroinitializer, align 16
9 define void @foo(i32* %a0, i32* %a1, i32* %a2, i32* %a3, i32* %a4, i32* %a5) {
17 %rx = sext i32 %r2 to i64
18 %r9 = sext i32 %r to i64
20 %ras = icmp slt i64 %r11, 0
21 %r12 = select i1 %ras, i64 0, i64 %r11
22 %r16 = sext i32 %r14 to i64
23 %r17 = sext i32 %r8 to i64
24 %r18 = sub i64 %r16, 0
25 %r19 = add i64 %r18, 0
26 %r20 = icmp slt i64 %r19, 0
27 %r19h = add i64 %r18, 0
28 %r22 = select i1 %r20, i64 1, i64 %r19h
29 %r23 = mul i64 %r22, 0
30 %r23a = trunc i64 %r23 to i32
31 %r24 = shl i32 %r23a, 0
32 %r25 = add i32 %r24, 0
33 %ras2 = alloca i8, i32 %r25, align 16
34 %r28 = getelementptr i8* %ras2, i32 0
35 %r38 = shl i64 %r12, 0
36 %s2013 = add i64 %r38, 0
37 %c22012 = getelementptr i8* %ras2, i64 %s2013
38 %r42 = shl i64 %r12, 0
39 %s2011 = add i64 %r42, 16
40 %c22010 = getelementptr i8* %ras2, i64 %s2011
41 %r50 = add i64 %r16, 0
42 %r51 = icmp slt i64 %r50, 0
43 %r50sh = shl i64 %r50, 0
44 %r50j = add i64 %r50sh, 0
45 %r54 = select i1 %r51, i64 0, i64 %r50j
46 %r56 = mul i64 %r54, %r12
47 %r28s = add i64 %r56, 16
48 %c2 = getelementptr i8* %ras2, i64 %r28s
49 %r60 = sub i32 %r2, %r
50 %r61 = icmp slt i32 %r60, 0
51 br i1 %r61, label %a29b, label %b63
53 %r155 = sub i32 %r6, %r4
54 %r156 = icmp slt i32 %r155, 0
55 br i1 %r156, label %a109b, label %b158
57 %r66 = sext i32 %r60 to i64
58 %r67 = add i64 %r66, 0
59 %r76 = mul i64 %r17, 0
60 %r82 = add i64 %r76, 0
61 %r84 = icmp slt i64 %r67, 0
62 br i1 %r84, label %b85, label %a25b
64 %e641 = phi i64 [ 0, %b63 ], [ %r129, %a25b ]
65 %r137 = icmp slt i64 %e641, 0
66 br i1 %r137, label %a25b140q, label %a29b
70 %w1989 = phi i64 [ 0, %b63 ], [ %v1990, %a25b ]
71 %e642 = shl i64 %w1989, 0
72 %r129 = add i64 %e642, 0
73 %r132 = add i64 %e642, 0
74 %r134 = icmp slt i64 %r132, 0
75 %v1990 = add i64 %w1989, 0
76 br i1 %r134, label %b85, label %a25b
78 %w1982 = phi i64 [ 0, %a25b140q ], [ %v1983, %a25b140 ]
79 %r145 = add i64 %r82, 0
80 %v1983 = add i64 %w1982, 0
81 %u1987 = icmp slt i64 %v1983, 0
82 br i1 %u1987, label %a29b, label %a25b140
84 %r161 = sext i32 %r to i64
85 %r163 = sext i32 %r4 to i64
88 %w1964 = phi i64 [ 0, %b158 ], [ %v1973, %b1606 ]
89 %b1974 = mul i64 %r163, 0
90 %b1975 = add i64 %r161, 0
91 %b1976 = mul i64 %w1964, 0
92 %b1977 = add i64 %b1976, 0
93 %s761 = bitcast i64 %b1977 to i64
94 %b1980 = mul i64 %w1964, 0
95 %s661 = add i64 %b1980, 0
96 br i1 %r61, label %a33b, label %b179
98 %r328 = icmp slt i32 %r14, 0
99 %r335 = or i1 %r328, %r61
100 br i1 %r335, label %a50b, label %b341
102 %r182 = sext i32 %r60 to i64
103 %r183 = add i64 %r182, 0
104 %r187 = icmp slt i64 %r183, 0
105 br i1 %r187, label %b188, label %a30b
107 %e653 = phi i64 [ 0, %b179 ], [ %r283, %a30b ]
108 %r291 = icmp slt i64 %e653, 0
109 br i1 %r291, label %a30b294q, label %a33b
113 %w = phi i64 [ 0, %b179 ], [ %v, %a30b ]
115 %r283 = add i64 %b2, 0
116 %r286 = add i64 %b2, 0
117 %r288 = icmp slt i64 %r286, 0
119 br i1 %r288, label %b188, label %a30b
121 %w1847 = phi i64 [ 0, %a30b294q ], [ %v1848, %a30b294 ]
122 %v1848 = add i64 %w1847, 0
123 %u = icmp slt i64 %v1848, 0
124 br i1 %u, label %a33b, label %a30b294
126 %r814 = add i32 %r14, 0
127 %r815 = icmp slt i32 %r814, 0
128 %r817 = or i1 %r61, %r815
129 br i1 %r817, label %a57b, label %b820
131 %w1874 = phi i64 [ 0, %a33b ], [ %v1880, %b463 ]
132 %d753 = bitcast i64 %w1874 to i64
133 %r343 = add i64 %s661, 0
134 %r346 = add i64 %r343, 0
135 %r347 = getelementptr float* bitcast ([128 x i64]* @i6000 to float*), i64 %r346
136 %r348 = load float* %r347
137 %r352 = add i64 %r343, 0
138 %r353 = getelementptr float* bitcast ([128 x i64]* @i6000 to float*), i64 %r352
139 %r354 = load float* %r353
140 %r362 = load float* bitcast ([128 x i64]* @i6000 to float*)
141 %r363 = fadd float 0.000000e+00, %r362
142 %r370 = load float* bitcast ([128 x i64]* @i6000 to float*)
143 %r376 = icmp slt i64 %r16, 0
144 br i1 %r376, label %b377, label %a35b
146 %d753p = phi i64 [ %d753, %b341 ], [ %r411, %a35b ]
147 %s761p = phi i64 [ %s761, %b341 ], [ 322, %a35b ]
148 %e784 = phi i64 [ 0, %b341 ], [ %r454, %a35b ]
149 %s794 = add i64 %d753p, 0
150 %r462 = icmp slt i64 %e784, 0
151 br i1 %r462, label %a35b465, label %b463
153 %w1865 = phi i64 [ 0, %b341 ], [ %v1866, %a35b ]
154 %e785 = shl i64 %w1865, 0
155 %b1877 = mul i64 %w1865, 0
156 %s795 = add i64 %b1877, 0
157 %r399 = fadd float %r354, 0.000000e+00
158 %r402 = fadd float %r370, 0.000000e+00
159 %r403 = fadd float %r348, 0.000000e+00
160 %r411 = add i64 %s795, 0
161 %r431 = fadd float %r362, 0.000000e+00
162 %r454 = add i64 %e785, 0
163 %r457 = add i64 %e785, 0
164 %r459 = icmp slt i64 %r457, 0
165 %v1866 = add i64 %w1865, 0
166 br i1 %r459, label %b377, label %a35b
168 %r506 = add i64 %d753, 0
169 %r511 = sext i32 %r60 to i64
170 %r512 = add i64 %r511, 0
171 %r513 = icmp slt i64 %r506, 0
172 %v1880 = add i64 %w1874, 0
173 br i1 %r513, label %b341, label %b514
175 %r469 = add i64 %s794, 0
178 %r525 = mul i64 %r17, 0
179 %r533 = add i64 %r525, 0
182 %w1855 = phi i64 [ 0, %b514 ], [ %v1856, %b712 ]
183 %s923 = phi i64 [ 0, %b514 ], [ %r799, %b712 ]
184 %s933 = phi i64 [ %r533, %b514 ], [ %r795, %b712 ]
185 %r538 = add i64 %w1855, 0
186 %r539 = getelementptr float* bitcast ([128 x i64]* @i6000 to float*), i64 %r538
187 %r540 = load float* %r539
188 %r551 = load float* bitcast ([128 x i64]* @i6000 to float*)
189 %r562 = sub i64 %s933, 0
190 %r564 = icmp slt i64 %r512, 0
191 br i1 %r564, label %b565, label %a45b
193 %e944 = phi i64 [ 0, %b535 ], [ %r703, %a45b ]
194 %r711 = icmp slt i64 %e944, 0
195 br i1 %r711, label %a45b714, label %b712
197 %w1852 = phi i64 [ 0, %b535 ], [ %v1853, %a45b ]
198 %e945 = shl i64 %w1852, 0
199 %r609 = add i64 %r562, 0
200 %r703 = add i64 %e945, 0
201 %r706 = add i64 %e945, 0
202 %r708 = icmp slt i64 %r706, 0
203 %v1853 = add i64 %w1852, 0
204 br i1 %r708, label %b565, label %a45b
206 %r795 = add i64 %rx, 0
207 %r799 = add i64 %s923, 0
208 %r802 = add i64 %w1855, 0
209 %r807 = icmp slt i64 %r802, 0
210 %v1856 = add i64 %w1855, 0
211 br i1 %r807, label %b535, label %a50b
213 %r717 = add i64 %e944, 0
214 %r720 = add i64 %r717, 0
215 %r721 = getelementptr float* bitcast ([128 x i64]* @i6000 to float*), i64 %r720
216 %r722 = load float* %r721
217 %r726 = add i64 %r717, 0
218 %r727 = getelementptr float* bitcast ([128 x i64]* @i6000 to float*), i64 %r726
219 %r728 = load float* %r727
220 %r732 = add i64 %r717, 0
221 %r733 = getelementptr float* bitcast ([128 x i64]* @i6000 to float*), i64 %r732
222 %r734 = load float* %r733
223 %r738 = add i64 %r717, 0
224 %r739 = getelementptr float* bitcast ([128 x i64]* @i6000 to float*), i64 %r738
225 %r740 = load float* %r739
226 %r744 = add i64 %r717, 0
227 %r745 = getelementptr float* bitcast ([128 x i64]* @i6000 to float*), i64 %r744
228 %r746 = load float* %r745
229 %r750 = add i64 %r717, 0
230 %r751 = getelementptr float* bitcast ([128 x i64]* @i6000 to float*), i64 %r750
231 %r752 = load float* %r751
232 %r753 = fadd float %r752, %r746
233 %r754 = fadd float %r728, %r722
234 %r755 = fadd float %r734, %r754
235 %r756 = fadd float %r755, %r740
236 %r757 = fadd float %r753, %r756
237 %r759 = fadd float %r757, %r540
238 %r770 = add i64 %r717, 0
239 %r771 = getelementptr float* bitcast ([128 x i64]* @i6000 to float*), i64 %r770
240 %r772 = load float* %r771
241 %r776 = add i64 %r717, 0
242 %r777 = getelementptr float* bitcast ([128 x i64]* @i6000 to float*), i64 %r776
243 %r778 = load float* %r777
244 %r781 = fadd float %r363, %r772
245 %r782 = fadd float %r781, %r778
246 %r783 = fadd float %r551, %r782
249 br i1 %r335, label %a66b, label %b1086
251 %r823 = sext i32 %r2 to i64
252 %r834 = sext i32 %r8 to i64
253 %r844 = add i64 %r16, 0
254 %r846 = sext i32 %r60 to i64
255 %r847 = add i64 %r846, 0
256 %r851 = load float* bitcast ([128 x i64]* @i6000 to float*)
257 %r856 = sub i64 %rx, 0
260 %w1891 = phi i64 [ 0, %b820 ], [ %v1892, %b1016 ]
261 %s1193 = phi i64 [ 0, %b820 ], [ %r1068, %b1016 ]
262 %b1894 = mul i64 %r834, 0
263 %b1896 = shl i64 %r823, 0
264 %b1902 = mul i64 %w1891, 0
265 %s1173 = add i64 %b1902, 0
266 %r859 = add i64 %r856, 0
267 %r862 = add i64 %w1891, 0
268 %r863 = getelementptr float* bitcast ([128 x i64]* @i6000 to float*), i64 %r862
269 %r864 = load float* %r863
270 %r868 = add i64 %w1891, 0
271 %r869 = getelementptr float* bitcast ([128 x i64]* @i6000 to float*), i64 %r868
272 %r870 = load float* %r869
273 %r873 = sub i64 %r859, 0
274 %r876 = sub i64 %s1173, 0
275 %r878 = icmp slt i64 %r847, 0
276 br i1 %r878, label %b879, label %a53b
278 %e1204 = phi i64 [ 0, %b858 ], [ %r1007, %a53b ]
279 %r1015 = icmp slt i64 %e1204, 0
280 br i1 %r1015, label %a53b1019q, label %b1016
282 %b1888 = sub i64 %r846, 0
283 %b1889 = add i64 %b1888, 0
286 %w1881 = phi i64 [ 0, %b858 ], [ %v1882, %a53b ]
287 %e1205 = shl i64 %w1881, 0
288 %r1007 = add i64 %e1205, 0
289 %r1010 = add i64 %e1205, 0
290 %r1012 = icmp slt i64 %r1010, 0
291 %v1882 = add i64 %w1881, 0
292 br i1 %r1012, label %b879, label %a53b
294 %r1068 = add i64 %s1193, 0
295 %r1071 = add i64 %w1891, 0
296 %r1073 = icmp slt i64 %r1071, %r844
297 %v1892 = add i64 %w1891, 0
298 br i1 %r1073, label %b858, label %a57b
300 %w1885 = phi i64 [ 0, %a53b1019q ], [ %v1886, %a53b1019 ]
301 %r1022 = add i64 %r876, 0
302 %r1024 = bitcast i8* %c2 to float*
303 %r1025 = add i64 %r1022, 0
304 %r1026 = getelementptr float* %r1024, i64 %r1025
305 %r1027 = load float* %r1026
306 %r1032 = add i64 %r873, 0
307 %r1033 = add i64 %r1032, 0
308 %r1034 = getelementptr float* %r1024, i64 %r1033
309 %r1035 = load float* %r1034
310 %r1037 = bitcast i8* %c22010 to float*
311 %r1040 = getelementptr float* %r1037, i64 %r1025
312 %r1044 = fadd float %r864, %r1035
313 %r1046 = fadd float %r870, %r1027
314 %r1047 = fadd float %r1044, %r1046
315 %r1048 = fadd float %r851, %r1047
316 %v1886 = add i64 %w1885, 0
317 %u1890 = icmp slt i64 %v1886, %b1889
318 br i1 %u1890, label %b1016, label %a53b1019
320 br i1 %r817, label %a93b, label %b1321
322 %r1089 = sext i32 %r2 to i64
323 %r1090 = add i64 %rx, 0
324 %r1096 = mul i64 %r9, 0
325 %r1101 = sext i32 %r8 to i64
326 %r1104 = add i64 %r1096, 0
327 %r1108 = sub i64 %r1104, 0
328 %r1110 = sext i32 %r60 to i64
329 %r1111 = add i64 %r1110, 0
330 %r1113 = sext i32 %r14 to i64
331 %r1114 = add i64 %r16, 0
334 %w1915 = phi i64 [ 0, %b1086 ], [ %v1957, %b1263 ]
335 %d1353 = bitcast i64 %w1915 to i64
336 %r1120 = add i64 %s661, 0
337 %r1121 = add i64 %r1120, 0
338 %r1122 = getelementptr float* bitcast ([128 x i64]* @i6000 to float*), i64 %r1121
339 %r1123 = load float* %r1122
340 %r1132 = bitcast i8* %c22012 to float*
341 %r1134 = getelementptr float* %r1132, i64 %w1915
342 %r1135 = load float* %r1134
343 %r1136 = fadd float %r1123, %r1135
344 %r1138 = icmp slt i64 %r1114, 0
345 br i1 %r1138, label %b1139, label %a63b
347 %e1364 = phi i64 [ 0, %b1117 ], [ %r1254, %a63b ]
348 %p1998 = phi i64 [ %s761, %b1117 ], [ %r1216, %a63b ]
349 %r1108p = phi i64 [ %r1108, %b1117 ], [ %r1219, %a63b ]
350 %p2004 = phi i64 [ %d1353, %b1117 ], [ %r1090, %a63b ]
351 %s1374 = phi i64 [ 0, %b1117 ], [ %r1251, %a63b ]
352 %s1384 = add i64 %r1108p, 0
353 %s1394 = add i64 %p1998, 0
354 %r1262 = icmp slt i64 %e1364, %r1114
355 br i1 %r1262, label %a63b1266q, label %b1263
357 %b1947 = sub i64 %r1113, 0
358 %b1948 = add i64 %b1947, 0
361 %w1904 = phi i64 [ 0, %b1117 ], [ %v1905, %a63b ]
362 %s1375 = phi i64 [ 0, %b1117 ], [ %r1251, %a63b ]
363 %b1906 = add i64 %r1089, 0
364 %b1907 = mul i64 %r1101, 0
365 %b1929 = mul i64 %w1904, 0
366 %s1395 = add i64 %b1929, 0
367 %e1365 = shl i64 %w1904, 0
368 %r1163 = add i64 %r1090, 0
369 %r1167 = add i64 %s1375, 0
370 %r1191 = add i64 %r1163, 0
371 %r1195 = add i64 %r1167, 0
372 %r1216 = add i64 %s1395, 0
373 %r1219 = add i64 %r1191, 0
374 %r1223 = add i64 %r1195, 0
375 %r1251 = add i64 %r1223, 0
376 %r1254 = add i64 %e1365, 0
377 %r1257 = add i64 %e1365, 0
378 %r1259 = icmp slt i64 %r1257, %r1114
379 %v1905 = add i64 %w1904, 0
380 br i1 %r1259, label %b1139, label %a63b
382 %r1306 = add i64 %d1353, 0
383 %r1308 = icmp slt i64 %r1306, %r1111
384 %v1957 = add i64 %w1915, 0
385 br i1 %r1308, label %b1117, label %a66b
387 %w1944 = phi i64 [ 0, %a63b1266q ], [ %v1945, %a63b1266 ]
388 %s1377 = phi i64 [ %s1374, %a63b1266q ], [ %r1297, %a63b1266 ]
389 %r1282 = fadd float %r1136, 0.000000e+00
390 %r1297 = add i64 %s1377, 0
391 %v1945 = add i64 %w1944, 0
392 %u1949 = icmp slt i64 %v1945, %b1948
393 br i1 %u1949, label %b1263, label %a63b1266
395 br i1 %r61, label %b1606, label %a97b
397 %r1331 = mul i64 %r17, 0
398 %r1339 = add i64 %r1331, 0
401 %w1960 = phi i64 [ 0, %b1321 ], [ %v1961, %b1582 ]
402 %s1523 = phi i64 [ %r1339, %b1321 ], [ %r1587, %b1582 ]
403 %s1563 = phi i64 [ 0, %b1321 ], [ %r1591, %b1582 ]
404 %d1533 = bitcast i64 %w1960 to i64
405 %b1968 = mul i64 %w1960, 0
406 %s1543 = add i64 %b1968, 0
407 %r1345 = add i64 %s1523, 0
408 %r1348 = sub i64 %r1345, 0
409 %r1352 = add i64 %s1523, 0
410 %r1355 = sub i64 %r1352, 0
411 %r1370 = add i64 %d1533, 0
412 %r1371 = getelementptr float* bitcast ([128 x i64]* @i6000 to float*), i64 %r1370
413 %r1372 = load float* %r1371
416 %w1958 = phi i64 [ 0, %b1342 ], [ %v1959, %a74b ]
417 %r1379 = add i64 %s1543, 0
418 %r1403 = add i64 %r1355, 0
419 %r1422 = add i64 %r1348, 0
420 %r1526 = fadd float %r1372, 0.000000e+00
421 %r1573 = add i64 %w1958, 0
422 %r1581 = icmp slt i64 %r1573, 0
423 %v1959 = add i64 %w1958, 0
424 br i1 %r1581, label %a74b, label %b1582
426 %r1587 = add i64 %rx, 0
427 %r1591 = add i64 %s1563, 0
428 %r1596 = add i64 %d1533, 0
429 %r1601 = icmp slt i64 %r1596, 0
430 %v1961 = add i64 %w1960, 0
431 br i1 %r1601, label %b1342, label %a93b
433 %r1833 = add i64 %w1964, 0
434 %r1840 = icmp slt i64 %r1833, 0
435 %v1973 = add i64 %w1964, 0
436 br i1 %r1840, label %a29b173, label %a109b
438 %w1970 = phi i64 [ 0, %a93b ], [ %v1971, %a97b ]
439 %r1613 = add i64 %w1964, 0
440 %r1614 = mul i64 %r1613, 0
441 %r1622 = add i64 %r1614, 0
442 %r1754 = bitcast i8* %r28 to float*
443 %r1756 = getelementptr float* %r1754, i64 %w1970
444 %r1757 = load float* %r1756
445 %r1761 = add i64 %r1622, 0
446 %r1762 = getelementptr float* bitcast ([128 x i64]* @i6000 to float*), i64 %r1761
447 %r1763 = load float* %r1762
448 %r1767 = add i64 %r1622, 0
449 %r1768 = getelementptr float* bitcast ([128 x i64]* @i6000 to float*), i64 %r1767
450 %r1772 = fadd float %r1763, 0.000000e+00
451 %r1773 = fadd float %r1772, 0.000000e+00
452 %r1809 = fadd float %r1757, 0.000000e+00
453 %r1810 = fadd float %r1773, %r1809
454 store float %r1810, float* %r1768
455 %r1818 = add i64 %w1970, 0
456 %r1826 = icmp slt i64 %r1818, 0
457 %v1971 = add i64 %w1970, 0
458 br i1 %r1826, label %a97b, label %b1606