[DAGCombiner] Add target hook function to decide folding (mul (add x, c1), c2)
[llvm-project.git] / llvm / test / Transforms / LoopUnrollAndJam / dependencies_multidims.ll
blobf8f33e975981cb6fbcacf5e39121db00c32bc895
1 ; RUN: opt -da-disable-delinearization-checks -basic-aa -loop-unroll-and-jam -allow-unroll-and-jam -unroll-and-jam-count=4 < %s -S | FileCheck %s
2 ; RUN: opt -da-disable-delinearization-checks -aa-pipeline=basic-aa -passes='loop-unroll-and-jam' -allow-unroll-and-jam -unroll-and-jam-count=4 < %s -S | FileCheck %s
4 target datalayout = "e-m:e-p:32:32-i64:64-v128:64:128-a:0:32-n32-S64"
6 ; CHECK-LABEL: sub_sub_less
7 ; CHECK: %j = phi
8 ; CHECK-NOT: %j.1 = phi
9 define void @sub_sub_less([100 x i32]* noalias nocapture %A, i32 %N, i32* noalias nocapture readonly %B) {
10 entry:
11   %cmp = icmp sgt i32 %N, 0
12   br i1 %cmp, label %for.outer, label %cleanup
14 for.outer:
15   %i = phi i32 [ %add7, %for.latch ], [ 0, %entry ]
16   br label %for.inner
18 for.inner:
19   %j = phi i32 [ %add6, %for.inner ], [ 0, %for.outer ]
20   %sum = phi i32 [ %add, %for.inner ], [ 0, %for.outer ]
21   %arrayidx5 = getelementptr inbounds i32, i32* %B, i32 %j
22   %0 = load i32, i32* %arrayidx5, align 4
23   %mul = mul nsw i32 %0, %i
24   %add = add nsw i32 %mul, %sum
25   %add6 = add nuw nsw i32 %j, 1
26   %arrayidx = getelementptr inbounds [100 x i32], [100 x i32]* %A, i32 %i, i32 %j
27   store i32 1, i32* %arrayidx, align 4
28   %add72 = add nuw nsw i32 %i, 1
29   %add73 = add nuw nsw i32 %j, -1
30   %arrayidx8 = getelementptr inbounds [100 x i32], [100 x i32]* %A, i32 %add72, i32 %add73
31   store i32 %add, i32* %arrayidx8, align 4
32   %exitcond = icmp eq i32 %add6, %N
33   br i1 %exitcond, label %for.latch, label %for.inner
35 for.latch:
36   %add7 = add nuw nsw i32 %i, 1
37   %exitcond29 = icmp eq i32 %add7, %N
38   br i1 %exitcond29, label %cleanup, label %for.outer
40 cleanup:
41   ret void
45 ; CHECK-LABEL: sub_sub_eq
46 ; CHECK: %j = phi
47 ; CHECK: %j.1 = phi
48 ; CHECK: %j.2 = phi
49 ; CHECK: %j.3 = phi
50 define void @sub_sub_eq([100 x i32]* noalias nocapture %A, i32 %N, i32* noalias nocapture readonly %B) {
51 entry:
52   %cmp = icmp sgt i32 %N, 0
53   br i1 %cmp, label %for.outer, label %cleanup
55 for.outer:
56   %i = phi i32 [ %add7, %for.latch ], [ 0, %entry ]
57   br label %for.inner
59 for.inner:
60   %j = phi i32 [ %add6, %for.inner ], [ 0, %for.outer ]
61   %sum = phi i32 [ %add, %for.inner ], [ 0, %for.outer ]
62   %arrayidx5 = getelementptr inbounds i32, i32* %B, i32 %j
63   %0 = load i32, i32* %arrayidx5, align 4
64   %mul = mul nsw i32 %0, %i
65   %add = add nsw i32 %mul, %sum
66   %add6 = add nuw nsw i32 %j, 1
67   %arrayidx = getelementptr inbounds [100 x i32], [100 x i32]* %A, i32 %i, i32 %j
68   store i32 1, i32* %arrayidx, align 4
69   %add72 = add nuw nsw i32 %i, 1
70   %add73 = add nuw nsw i32 %j, 0
71   %arrayidx8 = getelementptr inbounds [100 x i32], [100 x i32]* %A, i32 %add72, i32 %add73
72   store i32 %add, i32* %arrayidx8, align 4
73   %exitcond = icmp eq i32 %add6, %N
74   br i1 %exitcond, label %for.latch, label %for.inner
76 for.latch:
77   %add7 = add nuw nsw i32 %i, 1
78   %exitcond29 = icmp eq i32 %add7, %N
79   br i1 %exitcond29, label %cleanup, label %for.outer
81 cleanup:
82   ret void
86 ; CHECK-LABEL: sub_sub_more
87 ; CHECK: %j = phi
88 ; CHECK: %j.1 = phi
89 ; CHECK: %j.2 = phi
90 ; CHECK: %j.3 = phi
91 define void @sub_sub_more([100 x i32]* noalias nocapture %A, i32 %N, i32* noalias nocapture readonly %B) {
92 entry:
93   %cmp = icmp sgt i32 %N, 0
94   br i1 %cmp, label %for.outer, label %cleanup
96 for.outer:
97   %i = phi i32 [ %add7, %for.latch ], [ 0, %entry ]
98   br label %for.inner
100 for.inner:
101   %j = phi i32 [ %add6, %for.inner ], [ 0, %for.outer ]
102   %sum = phi i32 [ %add, %for.inner ], [ 0, %for.outer ]
103   %arrayidx5 = getelementptr inbounds i32, i32* %B, i32 %j
104   %0 = load i32, i32* %arrayidx5, align 4
105   %mul = mul nsw i32 %0, %i
106   %add = add nsw i32 %mul, %sum
107   %add6 = add nuw nsw i32 %j, 1
108   %arrayidx = getelementptr inbounds [100 x i32], [100 x i32]* %A, i32 %i, i32 %j
109   store i32 1, i32* %arrayidx, align 4
110   %add72 = add nuw nsw i32 %i, 1
111   %add73 = add nuw nsw i32 %j, 1
112   %arrayidx8 = getelementptr inbounds [100 x i32], [100 x i32]* %A, i32 %add72, i32 %add73
113   store i32 %add, i32* %arrayidx8, align 4
114   %exitcond = icmp eq i32 %add6, %N
115   br i1 %exitcond, label %for.latch, label %for.inner
117 for.latch:
118   %add7 = add nuw nsw i32 %i, 1
119   %exitcond29 = icmp eq i32 %add7, %N
120   br i1 %exitcond29, label %cleanup, label %for.outer
122 cleanup:
123   ret void
126 ; CHECK-LABEL: sub_sub_less_3d
127 ; CHECK: %k = phi
128 ; CHECK-NOT: %k.1 = phi
130 ; for (long i = 0; i < 100; ++i)
131 ;   for (long j = 0; j < 100; ++j)
132 ;     for (long k = 0; k < 100; ++k) {
133 ;       A[i][j][k] = 0;
134 ;       A[i+1][j][k-1] = 0;
135 ;     }
137 define void @sub_sub_less_3d([100 x [100 x i32]]* noalias %A) {
138 entry:
139   br label %for.i
141 for.i:
142   %i = phi i32 [ 0, %entry ], [ %inc.i, %for.i.latch ]
143   br label %for.j
145 for.j:
146   %j = phi i32 [ 0, %for.i ], [ %inc.j, %for.j.latch ]
147   br label %for.k
149 for.k:
150   %k = phi i32 [ 0, %for.j ], [ %inc.k, %for.k ]
151   %arrayidx = getelementptr inbounds [100 x [100 x i32]], [100 x [100 x i32]]* %A, i32 %i, i32 %j, i32 %k
152   store i32 0, i32* %arrayidx, align 4
153   %add.i = add nsw i32 %i, 1
154   %sub.k = add nsw i32 %k, -1
155   %arrayidx2 = getelementptr inbounds [100 x [100 x i32]], [100 x [100 x i32]]* %A, i32 %add.i, i32 %j, i32 %sub.k
156   store i32 0, i32* %arrayidx2, align 4
157   %inc.k = add nsw i32 %k, 1
158   %cmp.k = icmp slt i32 %inc.k, 100
159   br i1 %cmp.k, label %for.k, label %for.j.latch
161 for.j.latch:
162   %inc.j = add nsw i32 %j, 1
163   %cmp.j = icmp slt i32 %inc.j, 100
164   br i1 %cmp.j, label %for.j, label %for.i.latch, !llvm.loop !1
166 for.i.latch:
167   %inc.i = add nsw i32 %i, 1
168   %cmp.i = icmp slt i32 %inc.i, 100
169   br i1 %cmp.i, label %for.i, label %for.end
171 for.end:
172   ret void
175 ; CHECK-LABEL: sub_sub_outer_scalar
176 ; CHECK: %k = phi
177 ; CHECK-NOT: %k.1 = phi
179 define void @sub_sub_outer_scalar([100 x i32]* %A) {
180 entry:
181   br label %for.i
183 for.i:
184   %i = phi i64 [ 0, %entry ], [ %inc.i, %for.i.latch ]
185   br label %for.j
187 for.j:
188   %j = phi i64 [ 0, %for.i ], [ %inc.j, %for.j.latch ]
189   br label %for.k
191 for.k:
192   %k = phi i64 [ 0, %for.j ], [ %inc.k, %for.k ]
193   %arrayidx = getelementptr inbounds [100 x i32], [100 x i32]* %A, i64 %j
194   %arrayidx7 = getelementptr inbounds [100 x i32], [100 x i32]* %arrayidx, i64 0, i64 %k
195   %0 = load i32, i32* %arrayidx7, align 4
196   %sub.j = sub nsw i64 %j, 1
197   %arrayidx8 = getelementptr inbounds [100 x i32], [100 x i32]* %A, i64 %sub.j
198   %arrayidx9 = getelementptr inbounds [100 x i32], [100 x i32]* %arrayidx8, i64 0, i64 %k
199   store i32 %0, i32* %arrayidx9, align 4
200   %inc.k = add nsw i64 %k, 1
201   %cmp.k = icmp slt i64 %inc.k, 100
202   br i1 %cmp.k, label %for.k, label %for.j.latch
204 for.j.latch:
205   %inc.j = add nsw i64 %j, 1
206   %cmp.j = icmp slt i64 %inc.j, 100
207   br i1 %cmp.j, label %for.j, label %for.i.latch
209 for.i.latch:
210   %inc.i = add nsw i64 %i, 1
211   %cmp.i = icmp slt i64 %inc.i, 100
212   br i1 %cmp.i, label %for.i, label %for.end
214 for.end:
215   ret void
218 !1 = distinct !{!1, !2}
219 !2 = !{!"llvm.loop.unroll_and_jam.disable"}