Bump version to 19.1.0-rc3
[llvm-project.git] / llvm / test / Analysis / LoopCacheAnalysis / PowerPC / LoopnestFixedSize.ll
blob5209d290c83daa180ef3efabd44bf4efb1046b60
1 ; RUN: opt < %s -passes='print<loop-cache-cost>' -disable-output 2>&1 | FileCheck %s
3 target datalayout = "e-m:e-i64:64-n32:64"
4 target triple = "powerpc64le-unknown-linux-gnu"
6 ; Check delinearization in loop cache analysis can handle fixed-size arrays.
7 ; The IR is copied from llvm/test/Analysis/DependenceAnalysis/SimpleSIVNoValidityCheckFixedSize.ll
9 ; CHECK: Loop 'for.body' has cost = 4186116
10 ; CHECK-NEXT: Loop 'for.body4' has cost = 130944
12 ;; #define N 1024
13 ;; #define M 2048
14 ;; void t1(int a[N][M]) {
15 ;;   for (int i = 0; i < N-1; ++i)
16 ;;     for (int j = 2; j < M; ++j)
17 ;;       a[i][j] = a[i+1][j-2];
18 ;; }
20 define void @t1(ptr %a) {
21 entry:
22   br label %for.body
24 for.body:                                         ; preds = %entry, %for.inc11
25   %indvars.iv4 = phi i64 [ 0, %entry ], [ %indvars.iv.next5, %for.inc11 ]
26   br label %for.body4
28 for.body4:                                        ; preds = %for.body, %for.body4
29   %indvars.iv = phi i64 [ 2, %for.body ], [ %indvars.iv.next, %for.body4 ]
30   %0 = add nuw nsw i64 %indvars.iv4, 1
31   %1 = add nsw i64 %indvars.iv, -2
32   %arrayidx6 = getelementptr inbounds [2048 x i32], ptr %a, i64 %0, i64 %1
33   %2 = load i32, ptr %arrayidx6, align 4
34   %a_gep = getelementptr inbounds [2048 x i32], ptr %a, i64 0
35   %arrayidx10 = getelementptr inbounds [2048 x i32], ptr %a_gep, i64 %indvars.iv4, i64 %indvars.iv
36   store i32 %2, ptr %arrayidx10, align 4
37   %indvars.iv.next = add nuw nsw i64 %indvars.iv, 1
38   %exitcond = icmp ne i64 %indvars.iv.next, 2048
39   br i1 %exitcond, label %for.body4, label %for.inc11
41 for.inc11:                                        ; preds = %for.body4
42   %indvars.iv.next5 = add nuw nsw i64 %indvars.iv4, 1
43   %exitcond7 = icmp ne i64 %indvars.iv.next5, 1023
44   br i1 %exitcond7, label %for.body, label %for.end13
46 for.end13:                                        ; preds = %for.inc11
47   ret void
51 ; CHECK: Loop 'for.body' has cost = 4186116
52 ; CHECK-NEXT: Loop 'for.body4' has cost = 130944
54 define void @t2(ptr %a) {
55 entry:
56   br label %for.body
58 for.body:                                         ; preds = %entry, %for.inc11
59   %indvars.iv4 = phi i64 [ 0, %entry ], [ %indvars.iv.next5, %for.inc11 ]
60   br label %for.body4
62 for.body4:                                        ; preds = %for.body, %for.body4
63   %indvars.iv = phi i64 [ 2, %for.body ], [ %indvars.iv.next, %for.body4 ]
64   %0 = add nuw nsw i64 %indvars.iv4, 1
65   %1 = add nsw i64 %indvars.iv, -2
66   %arrayidx6 = getelementptr inbounds [2048 x i32], ptr %a, i64 %0, i64 %1
67   %2 = load i32, ptr %arrayidx6, align 4
68   %call = call ptr @func_with_returned_arg(ptr returned %a)
69   %arrayidx10 = getelementptr inbounds [2048 x i32], ptr %call, i64 %indvars.iv4, i64 %indvars.iv
70   store i32 %2, ptr %arrayidx10, align 4
71   %indvars.iv.next = add nuw nsw i64 %indvars.iv, 1
72   %exitcond = icmp ne i64 %indvars.iv.next, 2048
73   br i1 %exitcond, label %for.body4, label %for.inc11
75 for.inc11:                                        ; preds = %for.body4
76   %indvars.iv.next5 = add nuw nsw i64 %indvars.iv4, 1
77   %exitcond7 = icmp ne i64 %indvars.iv.next5, 1023
78   br i1 %exitcond7, label %for.body, label %for.end13
80 for.end13:                                        ; preds = %for.inc11
81   ret void
84 declare ptr @func_with_returned_arg(ptr returned %arg)
86 ; CHECK: Loop 'for.body' has cost = 2112128815104000000
87 ; CHECK-NEXT: Loop 'for.body4' has cost = 16762927104000000
88 ; CHECK-NEXT: Loop 'for.body8' has cost = 130960368000000
89 ; CHECK-NEXT: Loop 'for.body12' has cost = 1047682944000
90 ; CHECK-NEXT: Loop 'for.body16' has cost = 32772096000
92 ;; #define N 128
93 ;; #define M 2048
94 ;; void t3(int a[][N][N][N][M]) {
95 ;;   for (int i1 = 0; i1 < N-1; ++i1)
96 ;;     for (int i2 = 2; i2 < N; ++i2)
97 ;;       for (int i3 = 0; i3 < N; ++i3)
98 ;;         for (int i4 = 3; i4 < N; ++i4)
99 ;;           for (int i5 = 0; i5 < M-2; ++i5)
100 ;;             a[i1][i2][i3][i4][i5] = a[i1+1][i2-2][i3][i4-3][i5+2];
101 ;; }
103 define void @t3(ptr %a) {
104 entry:
105   br label %for.body
107 for.body:                                         ; preds = %entry, %for.inc46
108   %indvars.iv18 = phi i64 [ 0, %entry ], [ %indvars.iv.next19, %for.inc46 ]
109   br label %for.body4
111 for.body4:                                        ; preds = %for.body, %for.inc43
112   %indvars.iv14 = phi i64 [ 2, %for.body ], [ %indvars.iv.next15, %for.inc43 ]
113   br label %for.body8
115 for.body8:                                        ; preds = %for.body4, %for.inc40
116   %indvars.iv11 = phi i64 [ 0, %for.body4 ], [ %indvars.iv.next12, %for.inc40 ]
117   br label %for.body12
119 for.body12:                                       ; preds = %for.body8, %for.inc37
120   %indvars.iv7 = phi i64 [ 3, %for.body8 ], [ %indvars.iv.next8, %for.inc37 ]
121   br label %for.body16
123 for.body16:                                       ; preds = %for.body12, %for.body16
124   %indvars.iv = phi i64 [ 0, %for.body12 ], [ %indvars.iv.next, %for.body16 ]
125   %0 = add nuw nsw i64 %indvars.iv18, 1
126   %1 = add nsw i64 %indvars.iv14, -2
127   %2 = add nsw i64 %indvars.iv7, -3
128   %3 = add nuw nsw i64 %indvars.iv, 2
129   %arrayidx26 = getelementptr inbounds [128 x [128 x [128 x [2048 x i32]]]], ptr %a, i64 %0, i64 %1, i64 %indvars.iv11, i64 %2, i64 %3
130   %4 = load i32, ptr %arrayidx26, align 4
131   %arrayidx36 = getelementptr inbounds [128 x [128 x [128 x [2048 x i32]]]], ptr %a, i64 %indvars.iv18, i64 %indvars.iv14, i64 %indvars.iv11, i64 %indvars.iv7, i64 %indvars.iv
132   store i32 %4, ptr %arrayidx36, align 4
133   %indvars.iv.next = add nuw nsw i64 %indvars.iv, 1
134   %exitcond = icmp ne i64 %indvars.iv.next, 2046
135   br i1 %exitcond, label %for.body16, label %for.inc37
137 for.inc37:                                        ; preds = %for.body16
138   %indvars.iv.next8 = add nuw nsw i64 %indvars.iv7, 1
139   %exitcond10 = icmp ne i64 %indvars.iv.next8, 128
140   br i1 %exitcond10, label %for.body12, label %for.inc40
142 for.inc40:                                        ; preds = %for.inc37
143   %indvars.iv.next12 = add nuw nsw i64 %indvars.iv11, 1
144   %exitcond13 = icmp ne i64 %indvars.iv.next12, 128
145   br i1 %exitcond13, label %for.body8, label %for.inc43
147 for.inc43:                                        ; preds = %for.inc40
148   %indvars.iv.next15 = add nuw nsw i64 %indvars.iv14, 1
149   %exitcond17 = icmp ne i64 %indvars.iv.next15, 128
150   br i1 %exitcond17, label %for.body4, label %for.inc46
152 for.inc46:                                        ; preds = %for.inc43
153   %indvars.iv.next19 = add nuw nsw i64 %indvars.iv18, 1
154   %exitcond21 = icmp ne i64 %indvars.iv.next19, 127
155   br i1 %exitcond21, label %for.body, label %for.end48
157 for.end48:                                        ; preds = %for.inc46
158   ret void