Bump version to 19.1.0-rc3
[llvm-project.git] / llvm / test / Transforms / IndVarSimplify / rewrite-loop-exit-value.ll
blob653970cc34022a069742c4f20b8312f7cfeaeebe
1 ; NOTE: Assertions have been autogenerated by utils/update_test_checks.py
2 ; RUN: opt -passes='loop(indvars),instcombine' -replexitval=always -S < %s | FileCheck %s
4 ;; Test that loop's exit value is rewritten to its initial
5 ;; value from loop preheader
6 define i32 @test1(ptr %var) {
7 ; CHECK-LABEL: @test1(
8 ; CHECK-NEXT:  entry:
9 ; CHECK-NEXT:    [[COND:%.*]] = icmp eq ptr [[VAR:%.*]], null
10 ; CHECK-NEXT:    br label [[HEADER:%.*]]
11 ; CHECK:       header:
12 ; CHECK-NEXT:    br i1 [[COND]], label [[LOOP:%.*]], label [[EXIT:%.*]]
13 ; CHECK:       loop:
14 ; CHECK-NEXT:    br label [[HEADER]]
15 ; CHECK:       exit:
16 ; CHECK-NEXT:    ret i32 0
18 entry:
19   %cond = icmp eq ptr %var, null
20   br label %header
22 header:
23   %phi_indvar = phi i32 [0, %entry], [%indvar, %loop]
24   br i1 %cond, label %loop, label %exit
26 loop:
27   %indvar = add i32 %phi_indvar, 1
28   br label %header
30 exit:
31   ret i32 %phi_indvar
34 ;; Test that we can not rewrite loop exit value if it's not
35 ;; a phi node (%indvar is an add instruction in this test).
36 define i32 @test2(ptr %var) {
37 ; CHECK-LABEL: @test2(
38 ; CHECK-NEXT:  entry:
39 ; CHECK-NEXT:    [[COND:%.*]] = icmp eq ptr [[VAR:%.*]], null
40 ; CHECK-NEXT:    br label [[HEADER:%.*]]
41 ; CHECK:       header:
42 ; CHECK-NEXT:    [[PHI_INDVAR:%.*]] = phi i32 [ 0, [[ENTRY:%.*]] ], [ [[INDVAR:%.*]], [[HEADER]] ]
43 ; CHECK-NEXT:    [[INDVAR]] = add i32 [[PHI_INDVAR]], 1
44 ; CHECK-NEXT:    br i1 [[COND]], label [[HEADER]], label [[EXIT:%.*]]
45 ; CHECK:       exit:
46 ; CHECK-NEXT:    ret i32 [[INDVAR]]
48 entry:
49   %cond = icmp eq ptr %var, null
50   br label %header
52 header:
53   %phi_indvar = phi i32 [0, %entry], [%indvar, %header]
54   %indvar = add i32 %phi_indvar, 1
55   br i1 %cond, label %header, label %exit
57 exit:
58   ret i32 %indvar
61 ;; Test that we can not rewrite loop exit value if the condition
62 ;; is not in loop header.
63 define i32 @test3(ptr %var) {
64 ; CHECK-LABEL: @test3(
65 ; CHECK-NEXT:  entry:
66 ; CHECK-NEXT:    [[COND1:%.*]] = icmp eq ptr [[VAR:%.*]], null
67 ; CHECK-NEXT:    br label [[HEADER:%.*]]
68 ; CHECK:       header:
69 ; CHECK-NEXT:    [[PHI_INDVAR:%.*]] = phi i32 [ 0, [[ENTRY:%.*]] ], [ [[INDVAR:%.*]], [[HEADER_BACKEDGE:%.*]] ]
70 ; CHECK-NEXT:    [[INDVAR]] = add i32 [[PHI_INDVAR]], 1
71 ; CHECK-NEXT:    [[COND2:%.*]] = icmp eq i32 [[INDVAR]], 10
72 ; CHECK-NEXT:    br i1 [[COND2]], label [[HEADER_BACKEDGE]], label [[BODY:%.*]]
73 ; CHECK:       header.backedge:
74 ; CHECK-NEXT:    br label [[HEADER]]
75 ; CHECK:       body:
76 ; CHECK-NEXT:    br i1 [[COND1]], label [[HEADER_BACKEDGE]], label [[EXIT:%.*]]
77 ; CHECK:       exit:
78 ; CHECK-NEXT:    ret i32 [[PHI_INDVAR]]
80 entry:
81   %cond1 = icmp eq ptr %var, null
82   br label %header
84 header:
85   %phi_indvar = phi i32 [0, %entry], [%indvar, %header], [%indvar, %body]
86   %indvar = add i32 %phi_indvar, 1
87   %cond2 = icmp eq i32 %indvar, 10
88   br i1 %cond2, label %header, label %body
90 body:
91   br i1 %cond1, label %header, label %exit
93 exit:
94   ret i32 %phi_indvar
98 ; Multiple exits dominating latch
99 define i32 @test4(i1 %cond1, i1 %cond2) {
100 ; CHECK-LABEL: @test4(
101 ; CHECK-NEXT:  entry:
102 ; CHECK-NEXT:    br label [[HEADER:%.*]]
103 ; CHECK:       header:
104 ; CHECK-NEXT:    br i1 [[COND1:%.*]], label [[LOOP:%.*]], label [[EXIT:%.*]]
105 ; CHECK:       loop:
106 ; CHECK-NEXT:    br i1 [[COND2:%.*]], label [[HEADER]], label [[EXIT]]
107 ; CHECK:       exit:
108 ; CHECK-NEXT:    ret i32 0
110 entry:
111   br label %header
113 header:
114   %phi_indvar = phi i32 [0, %entry], [%indvar, %loop]
115   br i1 %cond1, label %loop, label %exit
117 loop:
118   %indvar = add i32 %phi_indvar, 1
119   br i1 %cond2, label %header, label %exit
121 exit:
122   ret i32 %phi_indvar
125 ; A conditionally executed exit.
126 define i32 @test5(ptr %addr, i1 %cond2) {
127 ; CHECK-LABEL: @test5(
128 ; CHECK-NEXT:  entry:
129 ; CHECK-NEXT:    br label [[HEADER:%.*]]
130 ; CHECK:       header:
131 ; CHECK-NEXT:    [[PHI_INDVAR:%.*]] = phi i32 [ 0, [[ENTRY:%.*]] ], [ [[INDVAR:%.*]], [[LOOP:%.*]] ]
132 ; CHECK-NEXT:    [[COND1:%.*]] = load volatile i1, ptr [[ADDR:%.*]], align 1
133 ; CHECK-NEXT:    br i1 [[COND1]], label [[LOOP]], label [[MAYBE:%.*]]
134 ; CHECK:       maybe:
135 ; CHECK-NEXT:    br i1 [[COND2:%.*]], label [[LOOP]], label [[EXIT:%.*]]
136 ; CHECK:       loop:
137 ; CHECK-NEXT:    [[INDVAR]] = add i32 [[PHI_INDVAR]], 1
138 ; CHECK-NEXT:    br label [[HEADER]]
139 ; CHECK:       exit:
140 ; CHECK-NEXT:    ret i32 [[PHI_INDVAR]]
142 entry:
143   br label %header
145 header:
146   %phi_indvar = phi i32 [0, %entry], [%indvar, %loop]
147   %cond1 = load volatile i1, ptr %addr
148   br i1 %cond1, label %loop, label %maybe
150 maybe:
151   br i1 %cond2, label %loop, label %exit
153 loop:
154   %indvar = add i32 %phi_indvar, 1
155   br label %header
157 exit:
158   ret i32 %phi_indvar
161 define i16 @pr57336(i16 %end, i16 %m) mustprogress {
162 ; CHECK-LABEL: @pr57336(
163 ; CHECK-NEXT:  entry:
164 ; CHECK-NEXT:    br label [[FOR_BODY:%.*]]
165 ; CHECK:       for.body:
166 ; CHECK-NEXT:    [[INC8:%.*]] = phi i16 [ [[INC:%.*]], [[FOR_BODY]] ], [ 0, [[ENTRY:%.*]] ]
167 ; CHECK-NEXT:    [[INC]] = add nuw nsw i16 [[INC8]], 1
168 ; CHECK-NEXT:    [[MUL:%.*]] = mul nsw i16 [[INC8]], [[M:%.*]]
169 ; CHECK-NEXT:    [[CMP_NOT:%.*]] = icmp sgt i16 [[MUL]], [[END:%.*]]
170 ; CHECK-NEXT:    br i1 [[CMP_NOT]], label [[CRIT_EDGE:%.*]], label [[FOR_BODY]]
171 ; CHECK:       crit_edge:
172 ; CHECK-NEXT:    [[TMP0:%.*]] = add i16 [[END]], 1
173 ; CHECK-NEXT:    [[SMAX:%.*]] = call i16 @llvm.smax.i16(i16 [[TMP0]], i16 0)
174 ; CHECK-NEXT:    [[TMP1:%.*]] = icmp ult i16 [[END]], 32767
175 ; CHECK-NEXT:    [[UMIN:%.*]] = zext i1 [[TMP1]] to i16
176 ; CHECK-NEXT:    [[TMP2:%.*]] = sub nsw i16 [[SMAX]], [[UMIN]]
177 ; CHECK-NEXT:    [[UMAX:%.*]] = call i16 @llvm.umax.i16(i16 [[M]], i16 1)
178 ; CHECK-NEXT:    [[TMP3:%.*]] = udiv i16 [[TMP2]], [[UMAX]]
179 ; CHECK-NEXT:    [[TMP4:%.*]] = add i16 [[TMP3]], [[UMIN]]
180 ; CHECK-NEXT:    ret i16 [[TMP4]]
182 entry:
183   br label %for.body
185 for.body:
186   %inc8 = phi i16 [ %inc, %for.body ], [ 0, %entry ]
187   %inc137 = phi i32 [ %inc1, %for.body ], [ 0, %entry ]
188   %inc1 = add nsw i32 %inc137, 1
189   %inc = add nsw i16 %inc8, 1
190   %mul = mul nsw i16 %m, %inc8
191   %cmp.not = icmp slt i16 %end, %mul
192   br i1 %cmp.not, label %crit_edge, label %for.body
194 crit_edge:
195   %inc137.lcssa = phi i32 [ %inc137, %for.body ]
196   %conv = trunc i32 %inc137.lcssa to i16
197   ret i16 %conv
200 define i32 @vscale_slt_with_vp_umin(ptr nocapture %A, i32 %n) mustprogress vscale_range(2,1024) {
201 ; CHECK-LABEL: @vscale_slt_with_vp_umin(
202 ; CHECK-NEXT:  entry:
203 ; CHECK-NEXT:    [[VSCALE:%.*]] = call i32 @llvm.vscale.i32()
204 ; CHECK-NEXT:    [[VF:%.*]] = shl nuw nsw i32 [[VSCALE]], 2
205 ; CHECK-NEXT:    [[CMP4:%.*]] = icmp sgt i32 [[N:%.*]], 0
206 ; CHECK-NEXT:    br i1 [[CMP4]], label [[FOR_BODY_PREHEADER:%.*]], label [[EARLY_EXIT:%.*]]
207 ; CHECK:       for.body.preheader:
208 ; CHECK-NEXT:    br label [[FOR_BODY:%.*]]
209 ; CHECK:       early.exit:
210 ; CHECK-NEXT:    ret i32 0
211 ; CHECK:       for.body:
212 ; CHECK-NEXT:    [[I_05:%.*]] = phi i32 [ [[ADD:%.*]], [[FOR_BODY]] ], [ 0, [[FOR_BODY_PREHEADER]] ]
213 ; CHECK-NEXT:    [[LEFT:%.*]] = sub nsw i32 [[N]], [[I_05]]
214 ; CHECK-NEXT:    [[VF_CAPPED:%.*]] = call i32 @llvm.umin.i32(i32 [[VF]], i32 [[LEFT]])
215 ; CHECK-NEXT:    store i32 [[VF_CAPPED]], ptr [[A:%.*]], align 4
216 ; CHECK-NEXT:    [[ADD]] = add nuw nsw i32 [[I_05]], [[VF]]
217 ; CHECK-NEXT:    [[CMP:%.*]] = icmp slt i32 [[ADD]], [[N]]
218 ; CHECK-NEXT:    br i1 [[CMP]], label [[FOR_BODY]], label [[FOR_END:%.*]]
219 ; CHECK:       for.end:
220 ; CHECK-NEXT:    [[TMP0:%.*]] = add nsw i32 [[N]], -1
221 ; CHECK-NEXT:    [[TMP1:%.*]] = udiv i32 [[TMP0]], [[VF]]
222 ; CHECK-NEXT:    [[TMP2:%.*]] = mul i32 [[TMP1]], [[VSCALE]]
223 ; CHECK-NEXT:    [[TMP3:%.*]] = shl i32 [[TMP2]], 2
224 ; CHECK-NEXT:    [[TMP4:%.*]] = sub i32 [[N]], [[TMP3]]
225 ; CHECK-NEXT:    [[UMIN:%.*]] = call i32 @llvm.umin.i32(i32 [[VF]], i32 [[TMP4]])
226 ; CHECK-NEXT:    ret i32 [[UMIN]]
228 entry:
229   %vscale = call i32 @llvm.vscale.i32()
230   %VF = shl nuw nsw i32 %vscale, 2
231   %cmp4 = icmp sgt i32 %n, 0
232   br i1 %cmp4, label %for.body, label %early.exit
234 early.exit:
235   ret i32 0
237 for.body:
238   %i.05 = phi i32 [ %add, %for.body ], [ 0, %entry ]
239   %arrayidx = getelementptr inbounds i32, ptr %A, i32 %i.05
240   %left = sub i32 %n, %i.05
241   %VF.capped = call i32 @llvm.umin.i32(i32 %VF, i32 %left)
242   store i32 %VF.capped, ptr %A
244   %add = add nsw i32 %i.05, %VF
245   %cmp = icmp slt i32 %add, %n
246   br i1 %cmp, label %for.body, label %for.end
248 for.end:
249   ret i32 %VF.capped
252 define i32 @vscale_slt_with_vp_umin2(ptr nocapture %A, i32 %n) mustprogress vscale_range(2,1024) {
253 ; CHECK-LABEL: @vscale_slt_with_vp_umin2(
254 ; CHECK-NEXT:  entry:
255 ; CHECK-NEXT:    [[VSCALE:%.*]] = call i32 @llvm.vscale.i32()
256 ; CHECK-NEXT:    [[VF:%.*]] = shl nuw nsw i32 [[VSCALE]], 2
257 ; CHECK-NEXT:    [[CMP4:%.*]] = icmp slt i32 [[VF]], [[N:%.*]]
258 ; CHECK-NEXT:    br i1 [[CMP4]], label [[FOR_BODY_PREHEADER:%.*]], label [[EARLY_EXIT:%.*]]
259 ; CHECK:       for.body.preheader:
260 ; CHECK-NEXT:    br label [[FOR_BODY:%.*]]
261 ; CHECK:       early.exit:
262 ; CHECK-NEXT:    ret i32 0
263 ; CHECK:       for.body:
264 ; CHECK-NEXT:    [[I_05:%.*]] = phi i32 [ [[ADD:%.*]], [[FOR_BODY]] ], [ 0, [[FOR_BODY_PREHEADER]] ]
265 ; CHECK-NEXT:    [[LEFT:%.*]] = sub i32 [[N]], [[I_05]]
266 ; CHECK-NEXT:    [[VF_CAPPED:%.*]] = call i32 @llvm.umin.i32(i32 [[VF]], i32 [[LEFT]])
267 ; CHECK-NEXT:    store i32 [[VF_CAPPED]], ptr [[A:%.*]], align 4
268 ; CHECK-NEXT:    [[ADD]] = add nuw nsw i32 [[I_05]], [[VF]]
269 ; CHECK-NEXT:    [[CMP:%.*]] = icmp slt i32 [[ADD]], [[N]]
270 ; CHECK-NEXT:    br i1 [[CMP]], label [[FOR_BODY]], label [[FOR_END:%.*]]
271 ; CHECK:       for.end:
272 ; CHECK-NEXT:    [[TMP0:%.*]] = add i32 [[N]], -1
273 ; CHECK-NEXT:    [[TMP1:%.*]] = udiv i32 [[TMP0]], [[VF]]
274 ; CHECK-NEXT:    [[TMP2:%.*]] = mul i32 [[TMP1]], [[VSCALE]]
275 ; CHECK-NEXT:    [[TMP3:%.*]] = shl i32 [[TMP2]], 2
276 ; CHECK-NEXT:    [[TMP4:%.*]] = sub i32 [[N]], [[TMP3]]
277 ; CHECK-NEXT:    [[UMIN:%.*]] = call i32 @llvm.umin.i32(i32 [[VF]], i32 [[TMP4]])
278 ; CHECK-NEXT:    ret i32 [[UMIN]]
280 entry:
281   %vscale = call i32 @llvm.vscale.i32()
282   %VF = shl nuw nsw i32 %vscale, 2
283   %cmp4 = icmp sgt i32 %n, %VF
284   br i1 %cmp4, label %for.body, label %early.exit
286 early.exit:
287   ret i32 0
289 for.body:
290   %i.05 = phi i32 [ %add, %for.body ], [ 0, %entry ]
291   %arrayidx = getelementptr inbounds i32, ptr %A, i32 %i.05
292   %left = sub i32 %n, %i.05
293   %VF.capped = call i32 @llvm.umin.i32(i32 %VF, i32 %left)
294   store i32 %VF.capped, ptr %A
296   %add = add nsw i32 %i.05, %VF
297   %cmp = icmp slt i32 %add, %n
298   br i1 %cmp, label %for.body, label %for.end
300 for.end:
301   ret i32 %VF.capped