[ORC] Add std::tuple support to SimplePackedSerialization.
[llvm-project.git] / llvm / test / Transforms / LoopInterchange / reductions-across-inner-and-outer-loop.ll
blob03bd5b71af9477206d426ec51c4ee87a4dec8f79
1 ; RUN: opt < %s -basic-aa -loop-interchange -pass-remarks-missed='loop-interchange' -pass-remarks-output=%t -S \
2 ; RUN:     -verify-dom-info -verify-loop-info -verify-loop-lcssa -stats 2>&1 | FileCheck %s
3 ; RUN: FileCheck --input-file=%t --check-prefix=REMARKS %s
6 target datalayout = "e-m:e-i64:64-f80:128-n8:16:32:64-S128"
7 target triple = "x86_64-unknown-linux-gnu"
9 ; REMARKS: --- !Passed
10 ; REMARKS-NEXT: Pass:            loop-interchange
11 ; REMARKS-NEXT: Name:            Interchanged
12 ; REMARKS-NEXT: Function:        test1
14 define i64 @test1([100 x [100 x i64]]* %Arr) {
15 ; CHECK-LABEL: @test1(
16 ; CHECK-NEXT:  entry:
17 ; CHECK-NEXT:    br label [[FOR2_PREHEADER:%.*]]
18 ; CHECK:       for1.header.preheader:
19 ; CHECK-NEXT:    br label [[FOR1_HEADER:%.*]]
20 ; CHECK:       for1.header:
21 ; CHECK-NEXT:    [[INDVARS_IV23:%.*]] = phi i64 [ [[INDVARS_IV_NEXT24:%.*]], [[FOR1_INC:%.*]] ], [ 0, [[FOR1_HEADER_PREHEADER:%.*]] ]
22 ; CHECK-NEXT:    [[SUM_INNER:%.*]] = phi i64 [ [[SUM_INC:%.*]], [[FOR1_INC]] ], [ [[SUM_OUTER:%.*]], [[FOR1_HEADER_PREHEADER]] ]
23 ; CHECK-NEXT:    br label [[FOR2_SPLIT1:%.*]]
24 ; CHECK:       for2.preheader:
25 ; CHECK-NEXT:    br label [[FOR2:%.*]]
26 ; CHECK:       for2:
27 ; CHECK-NEXT:    [[INDVARS_IV:%.*]] = phi i64 [ [[INDVARS_IV_NEXT_3:%.*]], [[FOR2_SPLIT:%.*]] ], [ 0, [[FOR2_PREHEADER]] ]
28 ; CHECK-NEXT:    [[SUM_OUTER]] = phi i64 [ [[SUM_INC_LCSSA:%.*]], [[FOR2_SPLIT]] ], [ 0, [[FOR2_PREHEADER]] ]
29 ; CHECK-NEXT:    br label [[FOR1_HEADER_PREHEADER]]
30 ; CHECK:       for2.split1:
31 ; CHECK-NEXT:    [[ARRAYIDX:%.*]] = getelementptr inbounds [100 x [100 x i64]], [100 x [100 x i64]]* [[ARR:%.*]], i64 0, i64 [[INDVARS_IV]], i64 [[INDVARS_IV23]]
32 ; CHECK-NEXT:    [[LV:%.*]] = load i64, i64* [[ARRAYIDX]], align 4
33 ; CHECK-NEXT:    [[SUM_INC]] = add i64 [[SUM_INNER]], [[LV]]
34 ; CHECK-NEXT:    [[IV_ORIGINAL:%.*]] = add nuw nsw i64 [[INDVARS_IV]], 1
35 ; CHECK-NEXT:    [[EXIT1_ORIGINAL:%.*]] = icmp eq i64 [[IV_ORIGINAL]], 100
36 ; CHECK-NEXT:    br label [[FOR1_INC]]
37 ; CHECK:       for2.split:
38 ; CHECK-NEXT:    [[SUM_INC_LCSSA]] = phi i64 [ [[SUM_INC]], %for1.inc ]
39 ; CHECK-NEXT:    [[INDVARS_IV_NEXT_3]] = add nuw nsw i64 [[INDVARS_IV]], 1
40 ; CHECK-NEXT:    [[EXIT1:%.*]] = icmp eq i64 [[INDVARS_IV_NEXT_3]], 100
41 ; CHECK-NEXT:    br i1 [[EXIT1]], label [[FOR1_LOOPEXIT:%.*]], label [[FOR2]]
42 ; CHECK:       for1.inc:
43 ; CHECK-NEXT:    [[INDVARS_IV_NEXT24]] = add nuw nsw i64 [[INDVARS_IV23]], 1
44 ; CHECK-NEXT:    [[EXIT2:%.*]] = icmp eq i64 [[INDVARS_IV_NEXT24]], 100
45 ; CHECK-NEXT:    br i1 [[EXIT2]], label [[FOR2_SPLIT]], label [[FOR1_HEADER]]
46 ; CHECK:       for1.loopexit:
47 ; CHECK-NEXT:    [[SUM_INC_LCSSA2:%.*]] = phi i64 [ [[SUM_INC_LCSSA]], [[FOR2_SPLIT]] ]
48 ; CHECK-NEXT:    ret i64 [[SUM_INC_LCSSA2]]
50 entry:
51   br label %for1.header
53 for1.header:                                         ; preds = %for1.inc, %entry
54   %indvars.iv23 = phi i64 [ 0, %entry ], [ %indvars.iv.next24, %for1.inc ]
55   %sum.outer = phi i64 [ 0, %entry ], [ %sum.inc.lcssa, %for1.inc ]
56   br label %for2
58 for2:                                        ; preds = %for2, %for1.header
59   %indvars.iv = phi i64 [ 0, %for1.header ], [ %indvars.iv.next.3, %for2 ]
60   %sum.inner = phi i64 [ %sum.outer, %for1.header ], [ %sum.inc, %for2 ]
61   %arrayidx = getelementptr inbounds [100 x [100 x i64]], [100 x [100 x i64]]* %Arr, i64 0, i64 %indvars.iv, i64 %indvars.iv23
62   %lv = load i64, i64* %arrayidx, align 4
63   %sum.inc = add i64 %sum.inner, %lv
64   %indvars.iv.next.3 = add nuw nsw i64 %indvars.iv, 1
65   %exit1 = icmp eq i64 %indvars.iv.next.3, 100
66   br i1 %exit1, label %for1.inc, label %for2
68 for1.inc:                                ; preds = %for2
69   %sum.inc.lcssa = phi i64 [ %sum.inc, %for2 ]
70   %indvars.iv.next24 = add nuw nsw i64 %indvars.iv23, 1
71   %exit2 = icmp eq i64 %indvars.iv.next24, 100
72   br i1 %exit2, label %for1.loopexit, label %for1.header
74 for1.loopexit:                                 ; preds = %for1.inc
75   %sum.inc.lcssa2 = phi i64 [ %sum.inc.lcssa, %for1.inc ]
76   ret i64 %sum.inc.lcssa2
79 ; In this test case, the inner reduction PHI %inner does not involve the outer
80 ; reduction PHI %sum.outer, do not interchange.
81 ; REMARKS: --- !Missed
82 ; REMARKS-NEXT: Pass:            loop-interchange
83 ; REMARKS-NEXT: Name:            UnsupportedPHIOuter
84 ; REMARKS-NEXT: Function:        test2
86 define i64 @test2([100 x [100 x i64]]* %Arr) {
87 entry:
88   br label %for1.header
90 for1.header:                                         ; preds = %for1.inc, %entry
91   %indvars.iv23 = phi i64 [ 0, %entry ], [ %indvars.iv.next24, %for1.inc ]
92   %sum.outer = phi i64 [ 0, %entry ], [ %sum.inc.lcssa, %for1.inc ]
93   br label %for2
95 for2:                                        ; preds = %for2, %for1.header
96   %indvars.iv = phi i64 [ 0, %for1.header ], [ %indvars.iv.next.3, %for2 ]
97   %inner = phi i64 [ %indvars.iv23, %for1.header ], [ %sum.inc, %for2 ]
98   %arrayidx = getelementptr inbounds [100 x [100 x i64]], [100 x [100 x i64]]* %Arr, i64 0, i64 %indvars.iv, i64 %indvars.iv23
99   %lv = load i64, i64* %arrayidx, align 4
100   %sum.inc = add i64 %inner, %lv
101   %indvars.iv.next.3 = add nuw nsw i64 %indvars.iv, 1
102   %exit1 = icmp eq i64 %indvars.iv.next.3, 100
103   br i1 %exit1, label %for1.inc, label %for2
105 for1.inc:                                ; preds = %for2
106   %sum.inc.lcssa = phi i64 [ %sum.inc, %for2 ]
107   %indvars.iv.next24 = add nuw nsw i64 %indvars.iv23, 1
108   %exit2 = icmp eq i64 %indvars.iv.next24, 100
109   br i1 %exit2, label %for1.loopexit, label %for1.header
111 for1.loopexit:                                 ; preds = %for1.inc
112   %sum.inc.lcssa2 = phi i64 [ %sum.inc.lcssa, %for1.inc ]
113   ret i64 %sum.inc.lcssa2
116 ; Check that we do not interchange if there is an additional instruction
117 ; between the outer and inner reduction PHIs.
118 ; REMARKS: --- !Missed
119 ; REMARKS-NEXT: Pass:            loop-interchange
120 ; REMARKS-NEXT: Name:            UnsupportedPHIOuter
121 ; REMARKS-NEXT: Function:        test3
123 define i64 @test3([100 x [100 x i64]]* %Arr) {
124 entry:
125   br label %for1.header
127 for1.header:                                         ; preds = %for1.inc, %entry
128   %indvars.iv23 = phi i64 [ 0, %entry ], [ %indvars.iv.next24, %for1.inc ]
129   %sum.outer = phi i64 [ 0, %entry ], [ %sum.inc.lcssa, %for1.inc ]
130   %so = add i64 %sum.outer, 10
131   br label %for2
133 for2:                                        ; preds = %for2, %for1.header
134   %indvars.iv = phi i64 [ 0, %for1.header ], [ %indvars.iv.next.3, %for2 ]
135   %sum.inner = phi i64 [ %so, %for1.header ], [ %sum.inc, %for2 ]
136   %arrayidx = getelementptr inbounds [100 x [100 x i64]], [100 x [100 x i64]]* %Arr, i64 0, i64 %indvars.iv, i64 %indvars.iv23
137   %lv = load i64, i64* %arrayidx, align 4
138   %sum.inc = add i64 %sum.inner, %lv
139   %indvars.iv.next.3 = add nuw nsw i64 %indvars.iv, 1
140   %exit1 = icmp eq i64 %indvars.iv.next.3, 100
141   br i1 %exit1, label %for1.inc, label %for2
143 for1.inc:                                ; preds = %for2
144   %sum.inc.lcssa = phi i64 [ %sum.inc, %for2 ]
145   %indvars.iv.next24 = add nuw nsw i64 %indvars.iv23, 1
146   %exit2 = icmp eq i64 %indvars.iv.next24, 100
147   br i1 %exit2, label %for1.loopexit, label %for1.header
149 for1.loopexit:                                 ; preds = %for1.inc
150   %sum.inc.lcssa2 = phi i64 [ %sum.inc.lcssa, %for1.inc ]
151   ret i64 %sum.inc.lcssa2
154 ; Check that we do not interchange or crash if the PHI in the outer loop gets a
155 ; constant from the inner loop.
156 ; REMARKS: --- !Missed
157 ; REMARKS-NEXT: Pass:            loop-interchange
158 ; REMARKS-NEXT: Name:            UnsupportedPHIOuter
159 ; REMARKS-NEXT: Function:        test_constant_inner_loop_res
161 define i64 @test_constant_inner_loop_res([100 x [100 x i64]]* %Arr) {
162 entry:
163   br label %for1.header
165 for1.header:                                         ; preds = %for1.inc, %entry
166   %indvars.iv23 = phi i64 [ 0, %entry ], [ %indvars.iv.next24, %for1.inc ]
167   %sum.outer = phi i64 [ 0, %entry ], [ %sum.inc.amend, %for1.inc ]
168   br label %for2
170 for2:                                        ; preds = %for2, %for1.header
171   %indvars.iv = phi i64 [ 0, %for1.header ], [ %indvars.iv.next.3, %for2 ]
172   %sum.inner = phi i64 [ %sum.outer, %for1.header ], [ %sum.inc, %for2 ]
173   %arrayidx = getelementptr inbounds [100 x [100 x i64]], [100 x [100 x i64]]* %Arr, i64 0, i64 %indvars.iv, i64 %indvars.iv23
174   %lv = load i64, i64* %arrayidx, align 4
175   %sum.inc = add i64 %sum.inner, %lv
176   %indvars.iv.next.3 = add nuw nsw i64 %indvars.iv, 1
177   %exit1 = icmp eq i64 %indvars.iv.next.3, 100
178   br i1 %exit1, label %for1.inc, label %for2
180 for1.inc:                                ; preds = %for2
181   %sum.inc.lcssa = phi i64 [ %sum.inc, %for2 ]
182   %const.lcssa = phi i64 [ 0, %for2 ]
183   %sum.inc.amend = add i64 %const.lcssa, %sum.inc.lcssa
184   %indvars.iv.next24 = add nuw nsw i64 %indvars.iv23, 1
185   %exit2 = icmp eq i64 %indvars.iv.next24, 100
186   br i1 %exit2, label %for1.loopexit, label %for1.header
188 for1.loopexit:                                 ; preds = %for1.inc
189   %il.res.lcssa2 = phi i64 [ %sum.inc.amend, %for1.inc ]
190   ret i64 %il.res.lcssa2