Run DCE after a LoopFlatten test to reduce spurious output [nfc]
[llvm-project.git] / llvm / test / Analysis / ScalarEvolution / max-trip-count.ll
blob1f8746d0a4a27f9f1345809a076eecf8e0aa1621
1 ; RUN: opt < %s -disable-output "-passes=print<scalar-evolution>" 2>&1 | FileCheck %s
3 ; ScalarEvolution should be able to understand the loop and eliminate the casts.
5 ; CHECK: {%d,+,4}
7 define void @foo(ptr nocapture %d, i32 %n) nounwind {
8 entry:
9         %0 = icmp sgt i32 %n, 0         ; <i1> [#uses=1]
10         br i1 %0, label %bb.nph, label %return
12 bb.nph:         ; preds = %entry
13         br label %bb
15 bb:             ; preds = %bb1, %bb.nph
16         %i.02 = phi i32 [ %5, %bb1 ], [ 0, %bb.nph ]            ; <i32> [#uses=2]
17         %p.01 = phi i8 [ %4, %bb1 ], [ -1, %bb.nph ]            ; <i8> [#uses=2]
18         %1 = sext i8 %p.01 to i32               ; <i32> [#uses=1]
19         %2 = sext i32 %i.02 to i64              ; <i64> [#uses=1]
20         %3 = getelementptr i32, ptr %d, i64 %2          ; <ptr> [#uses=1]
21         store i32 %1, ptr %3, align 4
22         %4 = add i8 %p.01, 1            ; <i8> [#uses=1]
23         %5 = add i32 %i.02, 1           ; <i32> [#uses=2]
24         br label %bb1
26 bb1:            ; preds = %bb
27         %6 = icmp slt i32 %5, %n                ; <i1> [#uses=1]
28         br i1 %6, label %bb, label %bb1.return_crit_edge
30 bb1.return_crit_edge:           ; preds = %bb1
31         br label %return
33 return:         ; preds = %bb1.return_crit_edge, %entry
34         ret void
37 ; ScalarEvolution should be able to find the maximum tripcount
38 ; of this multiple-exit loop, and if it doesn't know the exact
39 ; count, it should say so.
41 ; PR7845
42 ; CHECK: Loop %for.cond: <multiple exits> Unpredictable backedge-taken count.
43 ; CHECK: Loop %for.cond: constant max backedge-taken count is 5
45 @.str = private constant [4 x i8] c"%d\0A\00"     ; <ptr> [#uses=2]
47 define i32 @main() nounwind {
48 entry:
49   br label %for.cond
51 for.cond:                                         ; preds = %for.inc, %entry
52   %g_4.0 = phi i32 [ 0, %entry ], [ %add, %for.inc ] ; <i32> [#uses=5]
53   %cmp = icmp slt i32 %g_4.0, 5                   ; <i1> [#uses=1]
54   br i1 %cmp, label %for.body, label %for.end
56 for.body:                                         ; preds = %for.cond
57   %conv = trunc i32 %g_4.0 to i16                 ; <i16> [#uses=1]
58   %tobool.not = icmp eq i16 %conv, 0              ; <i1> [#uses=1]
59   %tobool3 = icmp ne i32 %g_4.0, 0                ; <i1> [#uses=1]
60   %or.cond = and i1 %tobool.not, %tobool3         ; <i1> [#uses=1]
61   br i1 %or.cond, label %for.end, label %for.inc
63 for.inc:                                          ; preds = %for.body
64   %add = add nsw i32 %g_4.0, 1                    ; <i32> [#uses=1]
65   br label %for.cond
67 for.end:                                          ; preds = %for.body, %for.cond
68   %call = call i32 (ptr, ...) @printf(ptr @.str, i32 %g_4.0) nounwind ; <i32> [#uses=0]
69   ret i32 0
72 declare i32 @printf(ptr, ...)
74 define void @test(ptr %a, i32 %n) nounwind {
75 entry:
76   %cmp1 = icmp sgt i32 %n, 0
77   br i1 %cmp1, label %for.body.lr.ph, label %for.end
79 for.body.lr.ph:                                   ; preds = %entry
80   %tmp = zext i32 %n to i64
81   br label %for.body
83 for.body:                                         ; preds = %for.body, %for.body.lr.ph
84   %indvar = phi i64 [ %indvar.next, %for.body ], [ 0, %for.body.lr.ph ]
85   %arrayidx = getelementptr i8, ptr %a, i64 %indvar
86   store i8 0, ptr %arrayidx, align 1
87   %indvar.next = add i64 %indvar, 1
88   %exitcond = icmp ne i64 %indvar.next, %tmp
89   br i1 %exitcond, label %for.body, label %for.cond.for.end_crit_edge
91 for.cond.for.end_crit_edge:                       ; preds = %for.body
92   br label %for.end
94 for.end:                                          ; preds = %for.cond.for.end_crit_edge, %entry
95   ret void
98 ; CHECK: Determining loop execution counts for: @test
99 ; CHECK-NEXT: backedge-taken count is
100 ; CHECK-NEXT: constant max backedge-taken count is 2147483646
102 ; PR19799: Indvars miscompile due to an incorrect max backedge taken count from SCEV.
103 ; CHECK-LABEL: @pr19799
104 ; CHECK: Loop %for.body.i: <multiple exits> Unpredictable backedge-taken count.
105 ; CHECK: Loop %for.body.i: constant max backedge-taken count is 1
106 @a = common global i32 0, align 4
108 define i32 @pr19799() {
109 entry:
110   store i32 -1, ptr @a, align 4
111   br label %for.body.i
113 for.body.i:                                       ; preds = %for.cond.i, %entry
114   %storemerge1.i = phi i32 [ -1, %entry ], [ %add.i.i, %for.cond.i ]
115   %tobool.i = icmp eq i32 %storemerge1.i, 0
116   %add.i.i = add nsw i32 %storemerge1.i, 2
117   br i1 %tobool.i, label %bar.exit, label %for.cond.i
119 for.cond.i:                                       ; preds = %for.body.i
120   store i32 %add.i.i, ptr @a, align 4
121   %cmp.i = icmp slt i32 %storemerge1.i, 0
122   br i1 %cmp.i, label %for.body.i, label %bar.exit
124 bar.exit:                                         ; preds = %for.cond.i, %for.body.i
125   ret i32 0
128 ; PR18886: Indvars miscompile due to an incorrect max backedge taken count from SCEV.
129 ; CHECK-LABEL: @pr18886
130 ; CHECK: Loop %for.body: <multiple exits> Unpredictable backedge-taken count.
131 ; CHECK: Loop %for.body: constant max backedge-taken count is 3
132 @aa = global i64 0, align 8
134 define i32 @pr18886() {
135 entry:
136   store i64 -21, ptr @aa, align 8
137   br label %for.body
139 for.body:
140   %storemerge1 = phi i64 [ -21, %entry ], [ %add, %for.cond ]
141   %tobool = icmp eq i64 %storemerge1, 0
142   %add = add nsw i64 %storemerge1, 8
143   br i1 %tobool, label %return, label %for.cond
145 for.cond:
146   store i64 %add, ptr @aa, align 8
147   %cmp = icmp slt i64 %add, 9
148   br i1 %cmp, label %for.body, label %return
150 return:
151   %retval.0 = phi i32 [ 1, %for.body ], [ 0, %for.cond ]
152   ret i32 %retval.0
155 ; Here we have a must-exit loop latch that is not computable and a
156 ; may-exit early exit that can only have one non-exiting iteration
157 ; before the check is forever skipped.
159 ; CHECK-LABEL: @cannot_compute_mustexit
160 ; CHECK: Loop %for.body.i: <multiple exits> Unpredictable backedge-taken count.
161 ; CHECK: Loop %for.body.i: Unpredictable constant max backedge-taken count.
162 @b = common global i32 0, align 4
164 define i32 @cannot_compute_mustexit() {
165 entry:
166   store i32 -1, ptr @a, align 4
167   br label %for.body.i
169 for.body.i:                                       ; preds = %for.cond.i, %entry
170   %storemerge1.i = phi i32 [ -1, %entry ], [ %add.i.i, %for.cond.i ]
171   %tobool.i = icmp eq i32 %storemerge1.i, 0
172   %add.i.i = add nsw i32 %storemerge1.i, 2
173   br i1 %tobool.i, label %bar.exit, label %for.cond.i
175 for.cond.i:                                       ; preds = %for.body.i
176   store i32 %add.i.i, ptr @a, align 4
177   %ld = load volatile i32, ptr @b
178   %cmp.i = icmp ne i32 %ld, 0
179   br i1 %cmp.i, label %for.body.i, label %bar.exit
181 bar.exit:                                         ; preds = %for.cond.i, %for.body.i
182   ret i32 0
185 ; This loop has two must-exits, both of which dominate the latch. The
186 ; MaxBECount should be the minimum of them.
188 ; CHECK-LABEL: @two_mustexit
189 ; CHECK: Loop %for.body.i: <multiple exits> backedge-taken count is 1
190 ; CHECK: Loop %for.body.i: constant max backedge-taken count is 1
191 define i32 @two_mustexit() {
192 entry:
193   store i32 -1, ptr @a, align 4
194   br label %for.body.i
196 for.body.i:                                       ; preds = %for.cond.i, %entry
197   %storemerge1.i = phi i32 [ -1, %entry ], [ %add.i.i, %for.cond.i ]
198   %tobool.i = icmp sgt i32 %storemerge1.i, 0
199   %add.i.i = add nsw i32 %storemerge1.i, 2
200   br i1 %tobool.i, label %bar.exit, label %for.cond.i
202 for.cond.i:                                       ; preds = %for.body.i
203   store i32 %add.i.i, ptr @a, align 4
204   %cmp.i = icmp slt i32 %storemerge1.i, 3
205   br i1 %cmp.i, label %for.body.i, label %bar.exit
207 bar.exit:                                         ; preds = %for.cond.i, %for.body.i
208   ret i32 0
211 ; CHECK-LABEL: @ne_max_trip_count_1
212 ; CHECK: Loop %for.body: constant max backedge-taken count is 7
213 define i32 @ne_max_trip_count_1(i32 %n) {
214 entry:
215   %masked = and i32 %n, 7
216   br label %for.body
218 for.body:
219   %i = phi i32 [ 0, %entry ], [ %add, %for.body ]
220   %add = add nsw i32 %i, 1
221   %cmp = icmp ne i32 %i, %masked
222   br i1 %cmp, label %for.body, label %bar.exit
224 bar.exit:
225   ret i32 0
228 ; CHECK-LABEL: @ne_max_trip_count_2
229 ; CHECK: Loop %for.body: constant max backedge-taken count is -1
230 define i32 @ne_max_trip_count_2(i32 %n) {
231 entry:
232   %masked = and i32 %n, 7
233   br label %for.body
235 for.body:
236   %i = phi i32 [ 0, %entry ], [ %add, %for.body ]
237   %add = add nsw i32 %i, 1
238   %cmp = icmp ne i32 %add, %masked
239   br i1 %cmp, label %for.body, label %bar.exit
241 bar.exit:
242   ret i32 0
245 ; CHECK-LABEL: @ne_max_trip_count_3
246 ; CHECK: Loop %for.body: constant max backedge-taken count is 6
247 define i32 @ne_max_trip_count_3(i32 %n) {
248 entry:
249   %masked = and i32 %n, 7
250   %guard = icmp eq i32 %masked, 0
251   br i1 %guard, label %exit, label %for.preheader
253 for.preheader:
254   br label %for.body
256 for.body:
257   %i = phi i32 [ 0, %for.preheader ], [ %add, %for.body ]
258   %add = add nsw i32 %i, 1
259   %cmp = icmp ne i32 %add, %masked
260   br i1 %cmp, label %for.body, label %loop.exit
262 loop.exit:
263   br label %exit
265 exit:
266   ret i32 0
269 ; CHECK-LABEL: @ne_max_trip_count_4
270 ; CHECK: Loop %for.body: constant max backedge-taken count is -2
271 define i32 @ne_max_trip_count_4(i32 %n) {
272 entry:
273   %guard = icmp eq i32 %n, 0
274   br i1 %guard, label %exit, label %for.preheader
276 for.preheader:
277   br label %for.body
279 for.body:
280   %i = phi i32 [ 0, %for.preheader ], [ %add, %for.body ]
281   %add = add nsw i32 %i, 1
282   %cmp = icmp ne i32 %add, %n
283   br i1 %cmp, label %for.body, label %loop.exit
285 loop.exit:
286   br label %exit
288 exit:
289   ret i32 0
292 ; The end bound of the loop can change between iterations, so the exact trip
293 ; count is unknown, but SCEV can calculate the max trip count.
294 define void @changing_end_bound(ptr %n_addr, ptr %addr) {
295 ; CHECK-LABEL: Determining loop execution counts for: @changing_end_bound
296 ; CHECK: Loop %loop: Unpredictable backedge-taken count.
297 ; CHECK: Loop %loop: constant max backedge-taken count is 2147483646
298 entry:
299   br label %loop
301 loop:
302   %iv = phi i32 [ 0, %entry ], [ %iv.next, %loop ]
303   %acc = phi i32 [ 0, %entry ], [ %acc.next, %loop ]
304   %val = load atomic i32, ptr %addr unordered, align 4
305   fence acquire
306   %acc.next = add i32 %acc, %val
307   %iv.next = add nsw i32 %iv, 1
308   %n = load atomic i32, ptr %n_addr unordered, align 4
309   %cmp = icmp slt i32 %iv.next, %n
310   br i1 %cmp, label %loop, label %loop.exit
312 loop.exit:
313   ret void
316 ; Similar test as above, but unknown start value.
317 ; Also, there's no nsw on the iv.next, but SCEV knows 
318 ; the termination condition is LT, so the IV cannot wrap.
319 define void @changing_end_bound2(i32 %start, ptr %n_addr, ptr %addr) {
320 ; CHECK-LABEL: Determining loop execution counts for: @changing_end_bound2
321 ; CHECK: Loop %loop: Unpredictable backedge-taken count.
322 ; CHECK: Loop %loop: constant max backedge-taken count is -1
323 entry:
324   br label %loop
326 loop:
327   %iv = phi i32 [ %start, %entry ], [ %iv.next, %loop ]
328   %acc = phi i32 [ 0, %entry ], [ %acc.next, %loop ]
329   %val = load atomic i32, ptr %addr unordered, align 4
330   fence acquire
331   %acc.next = add i32 %acc, %val
332   %iv.next = add i32 %iv, 1
333   %n = load atomic i32, ptr %n_addr unordered, align 4
334   %cmp = icmp slt i32 %iv.next, %n
335   br i1 %cmp, label %loop, label %loop.exit
337 loop.exit:
338   ret void
341 ; changing end bound and greater than one stride
342 define void @changing_end_bound3(i32 %start, ptr %n_addr, ptr %addr) {
343 ; CHECK-LABEL: Determining loop execution counts for: @changing_end_bound3
344 ; CHECK: Loop %loop: Unpredictable backedge-taken count.
345 ; CHECK: Loop %loop: constant max backedge-taken count is 1073741822
346 entry:
347   br label %loop
349 loop:
350   %iv = phi i32 [ %start, %entry ], [ %iv.next, %loop ]
351   %acc = phi i32 [ 0, %entry ], [ %acc.next, %loop ]
352   %val = load atomic i32, ptr %addr unordered, align 4
353   fence acquire
354   %acc.next = add i32 %acc, %val
355   %iv.next = add nsw i32 %iv, 4
356   %n = load atomic i32, ptr %n_addr unordered, align 4
357   %cmp = icmp slt i32 %iv.next, %n
358   br i1 %cmp, label %loop, label %loop.exit
360 loop.exit:
361   ret void
364 ; same as above test, but the IV can wrap around.
365 ; so the max backedge taken count is unpredictable.
366 define void @changing_end_bound4(i32 %start, ptr %n_addr, ptr %addr) {
367 ; CHECK-LABEL: Determining loop execution counts for: @changing_end_bound4
368 ; CHECK: Loop %loop: Unpredictable backedge-taken count.
369 ; CHECK: Loop %loop: Unpredictable constant max backedge-taken count.
370 entry:
371   br label %loop
373 loop:
374   %iv = phi i32 [ %start, %entry ], [ %iv.next, %loop ]
375   %acc = phi i32 [ 0, %entry ], [ %acc.next, %loop ]
376   %val = load atomic i32, ptr %addr unordered, align 4
377   fence acquire
378   %acc.next = add i32 %acc, %val
379   %iv.next = add i32 %iv, 4
380   %n = load atomic i32, ptr %n_addr unordered, align 4
381   %cmp = icmp slt i32 %iv.next, %n
382   br i1 %cmp, label %loop, label %loop.exit
384 loop.exit:
385   ret void
388 ; unknown stride. Since it's not knownPositive, we do not estimate the max
389 ; backedge taken count.
390 define void @changing_end_bound5(i32 %stride, i32 %start, ptr %n_addr, ptr %addr) {
391 ; CHECK-LABEL: Determining loop execution counts for: @changing_end_bound5
392 ; CHECK: Loop %loop: Unpredictable backedge-taken count.
393 ; CHECK: Loop %loop: Unpredictable constant max backedge-taken count.
394 entry:
395   br label %loop
397 loop:
398   %iv = phi i32 [ %start, %entry ], [ %iv.next, %loop ]
399   %acc = phi i32 [ 0, %entry ], [ %acc.next, %loop ]
400   %val = load atomic i32, ptr %addr unordered, align 4
401   fence acquire
402   %acc.next = add i32 %acc, %val
403   %iv.next = add nsw i32 %iv, %stride
404   %n = load atomic i32, ptr %n_addr unordered, align 4
405   %cmp = icmp slt i32 %iv.next, %n
406   br i1 %cmp, label %loop, label %loop.exit
408 loop.exit:
409   ret void
412 ; negative stride value
413 define void @changing_end_bound6(i32 %start, ptr %n_addr, ptr %addr) {
414 ; CHECK-LABEL: Determining loop execution counts for: @changing_end_bound6
415 ; CHECK: Loop %loop: Unpredictable backedge-taken count.
416 ; CHECK: Loop %loop: Unpredictable constant max backedge-taken count.
417 entry:
418   br label %loop
420 loop:
421   %iv = phi i32 [ %start, %entry ], [ %iv.next, %loop ]
422   %acc = phi i32 [ 0, %entry ], [ %acc.next, %loop ]
423   %val = load atomic i32, ptr %addr unordered, align 4
424   fence acquire
425   %acc.next = add i32 %acc, %val
426   %iv.next = add nsw i32 %iv, -1
427   %n = load atomic i32, ptr %n_addr unordered, align 4
428   %cmp = icmp slt i32 %iv.next, %n
429   br i1 %cmp, label %loop, label %loop.exit
431 loop.exit:
432   ret void
435 ; sgt with negative stride
436 define void @changing_end_bound7(i32 %start, ptr %n_addr, ptr %addr) {
437 ; CHECK-LABEL: Determining loop execution counts for: @changing_end_bound7
438 ; CHECK: Loop %loop: Unpredictable backedge-taken count.
439 ; CHECK: Loop %loop: Unpredictable constant max backedge-taken count.
440 entry:
441   br label %loop
443 loop:
444   %iv = phi i32 [ %start, %entry ], [ %iv.next, %loop ]
445   %acc = phi i32 [ 0, %entry ], [ %acc.next, %loop ]
446   %val = load atomic i32, ptr %addr unordered, align 4
447   fence acquire
448   %acc.next = add i32 %acc, %val
449   %iv.next = add i32 %iv, -1
450   %n = load atomic i32, ptr %n_addr unordered, align 4
451   %cmp = icmp sgt i32 %iv.next, %n
452   br i1 %cmp, label %loop, label %loop.exit
454 loop.exit:
455   ret void
458 define void @max_overflow_se(i8 %n) mustprogress {
459 ; CHECK-LABEL: Determining loop execution counts for: @max_overflow_se
460 ; CHECK: Loop %loop: backedge-taken count is 0
461 ; CHECK: Loop %loop: constant max backedge-taken count is 0
462 entry:
463   br label %loop
465 loop:
466   %i = phi i8 [ 63, %entry ], [ %i.next, %loop ]
467   %i.next = add nsw i8 %i, 63
468   %t = icmp slt i8 %i.next, %n
469   br i1 %t, label %loop, label %exit
471 exit:
472   ret void
475 ; Show that we correctly realize that %i can overflow here as long as
476 ; the early exit is taken before we branch on poison.
477 define void @max_overflow_me(i8 %n) mustprogress {
478 ; CHECK-LABEL: Determining loop execution counts for: @max_overflow_me
479 ; CHECK: Loop %loop: <multiple exits> Unpredictable backedge-taken count.
480 ; CHECK:   exit count for loop: 1
481 ; CHECK:   exit count for latch: ***COULDNOTCOMPUTE***
482 ; CHECK: Loop %loop: constant max backedge-taken count is 1
483 entry:
484   br label %loop
486 loop:
487   %i = phi i8 [ 63, %entry ], [ %i.next, %latch ]
488   %j = phi i8 [  0, %entry ], [ %j.next, %latch ]
489   %early.exit = icmp ne i8 %j, 1
490   br i1 %early.exit, label %latch, label %exit
491 latch:
492   %i.next = add nsw i8 %i, 63
493   %j.next = add nsw nuw i8 %j, 1
494   %t = icmp slt i8 %i.next, %n
495   br i1 %t, label %loop, label %exit
497 exit:
498   ret void
502 ; Max backedge-taken count is zero.
503 define void @bool_stride(i1 %s, i1 %n) mustprogress {
504 ; CHECK-LABEL: Determining loop execution counts for: @bool_stride
505 ; CHECK: Loop %loop: backedge-taken count is false
506 ; CHECK: Loop %loop: constant max backedge-taken count is false
507 entry:
508   br label %loop
510 loop:
511   %i = phi i1 [ -1, %entry ], [ %i.next, %loop ]
512   %i.next = add nsw i1 %i, %s
513   %t = icmp slt i1 %i.next, %n
514   br i1 %t, label %loop, label %exit
516 exit:
517   ret void
520 ; This is a case where our max-backedge taken count logic happens to be
521 ; able to prove a zero btc, but our symbolic logic doesn't due to a lack
522 ; of context sensativity.
523 define void @ne_zero_max_btc(i32 %a) {
524 ; CHECK-LABEL: Determining loop execution counts for: @ne_zero_max_btc
525 ; CHECK: Loop %for.body: backedge-taken count is 0
526 ; CHECK: Loop %for.body: constant max backedge-taken count is 0
527 entry:
528   %cmp = icmp slt i32 %a, 1
529   %spec.select = select i1 %cmp, i32 %a, i32 1
530   %cmp8 = icmp sgt i32 %a, 0
531   br i1 %cmp8, label %for.body.preheader, label %loopexit
533 for.body.preheader:                         ; preds = %if.then4.i.i
534   %umax = call i32 @llvm.umax.i32(i32 %spec.select, i32 1)
535   %umax.i.i = zext i32 %umax to i64
536   br label %for.body
538 for.body:                                   ; preds = %for.inc, %for.body.preheader
539   %indvars.iv = phi i64 [ 0, %for.body.preheader ], [ %indvars.iv.next, %for.inc ]
540   call void @unknown()
541   br label %for.inc
543 for.inc:                                    ; preds = %for.body
544   %indvars.iv.next = add nuw nsw i64 %indvars.iv, 1
545   %exitcond.i.not.i534 = icmp ne i64 %indvars.iv.next, %umax.i.i
546   br i1 %exitcond.i.not.i534, label %for.body, label %loopexit
548 loopexit:
549   ret void
552 declare void @unknown()
553 declare i32 @llvm.umax.i32(i32, i32)