[TTI] getTypeBasedIntrinsicInstrCost - add basic handling for strided load/store...
[llvm-project.git] / llvm / test / Transforms / PhaseOrdering / X86 / SROA-after-loop-unrolling.ll
blobc6dc7b374b00ff6985657f016c650850af0f14dd
1 ; NOTE: Assertions have been autogenerated by utils/update_test_checks.py
2 ; RUN: opt < %s -O3 -S                                        | FileCheck %s
3 ; RUN: opt < %s -passes="default<O3>" -S | FileCheck %s
5 ; This is based on the following most basic C++ code:
7 ; #include <array>
8 ; void use(int);
9 ; void foo(int cnt) {
10 ;   std::array<int, 6> arr;
11 ;   for(int& elt : arr)
12 ;     elt = ++cnt;
13 ;   for(int& elt : arr)
14 ;     use(elt);
15 ; }
17 ; Not only should the loops be unrolled, no alloca's should be left there.
19 target datalayout = "e-m:e-p270:32:32-p271:32:32-p272:64:64-i64:64-f80:128-n8:16:32:64-S128"
20 target triple = "x86_64-unknown-linux-gnu"
22 %"struct.std::array" = type { [6 x i32] }
24 define dso_local void @_Z3fooi(i32 %cnt) {
25 ; CHECK-LABEL: @_Z3fooi(
26 ; CHECK-NEXT:  entry:
27 ; CHECK-NEXT:    [[INC:%.*]] = add nsw i32 [[CNT:%.*]], 1
28 ; CHECK-NEXT:    [[INC_1:%.*]] = add nsw i32 [[CNT]], 2
29 ; CHECK-NEXT:    [[INC_2:%.*]] = add nsw i32 [[CNT]], 3
30 ; CHECK-NEXT:    [[INC_3:%.*]] = add nsw i32 [[CNT]], 4
31 ; CHECK-NEXT:    [[INC_4:%.*]] = add nsw i32 [[CNT]], 5
32 ; CHECK-NEXT:    [[INC_5:%.*]] = add nsw i32 [[CNT]], 6
33 ; CHECK-NEXT:    call void @_Z3usei(i32 [[INC]])
34 ; CHECK-NEXT:    call void @_Z3usei(i32 [[INC_1]])
35 ; CHECK-NEXT:    call void @_Z3usei(i32 [[INC_2]])
36 ; CHECK-NEXT:    call void @_Z3usei(i32 [[INC_3]])
37 ; CHECK-NEXT:    call void @_Z3usei(i32 [[INC_4]])
38 ; CHECK-NEXT:    call void @_Z3usei(i32 [[INC_5]])
39 ; CHECK-NEXT:    ret void
41 entry:
42   %cnt.addr = alloca i32
43   %arr = alloca %"struct.std::array"
44   %__range1 = alloca ptr
45   %__begin1 = alloca ptr
46   %__end1 = alloca ptr
47   %elt = alloca ptr
48   %__range12 = alloca ptr
49   %__begin13 = alloca ptr
50   %__end15 = alloca ptr
51   %elt11 = alloca ptr
52   store i32 %cnt, ptr %cnt.addr
53   call void @llvm.lifetime.start.p0(i64 24, ptr %arr)
54   call void @llvm.lifetime.start.p0(i64 8, ptr %__range1)
55   store ptr %arr, ptr %__range1
56   call void @llvm.lifetime.start.p0(i64 8, ptr %__begin1)
57   %0 = load ptr, ptr %__range1
58   %call = call ptr @_ZNSt5arrayIiLm6EE5beginEv(ptr %0)
59   store ptr %call, ptr %__begin1
60   call void @llvm.lifetime.start.p0(i64 8, ptr %__end1)
61   %1 = load ptr, ptr %__range1
62   %call1 = call ptr @_ZNSt5arrayIiLm6EE3endEv(ptr %1)
63   store ptr %call1, ptr %__end1
64   br label %for.cond
66 for.cond:
67   %2 = load ptr, ptr %__begin1
68   %3 = load ptr, ptr %__end1
69   %cmp = icmp ne ptr %2, %3
70   br i1 %cmp, label %for.body, label %for.cond.cleanup
72 for.cond.cleanup:
73   call void @llvm.lifetime.end.p0(i64 8, ptr %__end1)
74   call void @llvm.lifetime.end.p0(i64 8, ptr %__begin1)
75   call void @llvm.lifetime.end.p0(i64 8, ptr %__range1)
76   br label %for.end
78 for.body:
79   call void @llvm.lifetime.start.p0(i64 8, ptr %elt)
80   %4 = load ptr, ptr %__begin1
81   store ptr %4, ptr %elt
82   %5 = load i32, ptr %cnt.addr
83   %inc = add nsw i32 %5, 1
84   store i32 %inc, ptr %cnt.addr
85   %6 = load ptr, ptr %elt
86   store i32 %inc, ptr %6
87   call void @llvm.lifetime.end.p0(i64 8, ptr %elt)
88   br label %for.inc
90 for.inc:
91   %7 = load ptr, ptr %__begin1
92   %incdec.ptr = getelementptr inbounds i32, ptr %7, i32 1
93   store ptr %incdec.ptr, ptr %__begin1
94   br label %for.cond
96 for.end:
97   call void @llvm.lifetime.start.p0(i64 8, ptr %__range12)
98   store ptr %arr, ptr %__range12
99   call void @llvm.lifetime.start.p0(i64 8, ptr %__begin13)
100   %8 = load ptr, ptr %__range12
101   %call4 = call ptr @_ZNSt5arrayIiLm6EE5beginEv(ptr %8)
102   store ptr %call4, ptr %__begin13
103   call void @llvm.lifetime.start.p0(i64 8, ptr %__end15)
104   %9 = load ptr, ptr %__range12
105   %call6 = call ptr @_ZNSt5arrayIiLm6EE3endEv(ptr %9)
106   store ptr %call6, ptr %__end15
107   br label %for.cond7
109 for.cond7:
110   %10 = load ptr, ptr %__begin13
111   %11 = load ptr, ptr %__end15
112   %cmp8 = icmp ne ptr %10, %11
113   br i1 %cmp8, label %for.body10, label %for.cond.cleanup9
115 for.cond.cleanup9:
116   call void @llvm.lifetime.end.p0(i64 8, ptr %__end15)
117   call void @llvm.lifetime.end.p0(i64 8, ptr %__begin13)
118   call void @llvm.lifetime.end.p0(i64 8, ptr %__range12)
119   br label %for.end14
121 for.body10:
122   call void @llvm.lifetime.start.p0(i64 8, ptr %elt11)
123   %12 = load ptr, ptr %__begin13
124   store ptr %12, ptr %elt11
125   %13 = load ptr, ptr %elt11
126   %14 = load i32, ptr %13
127   call void @_Z3usei(i32 %14)
128   call void @llvm.lifetime.end.p0(i64 8, ptr %elt11)
129   br label %for.inc12
131 for.inc12:
132   %15 = load ptr, ptr %__begin13
133   %incdec.ptr13 = getelementptr inbounds i32, ptr %15, i32 1
134   store ptr %incdec.ptr13, ptr %__begin13
135   br label %for.cond7
137 for.end14:
138   call void @llvm.lifetime.end.p0(i64 24, ptr %arr)
139   ret void
142 declare void @llvm.lifetime.start.p0(i64 immarg, ptr nocapture)
144 define linkonce_odr dso_local ptr @_ZNSt5arrayIiLm6EE5beginEv(ptr %this) {
145 entry:
146   %this.addr = alloca ptr
147   store ptr %this, ptr %this.addr
148   %this1 = load ptr, ptr %this.addr
149   %call = call ptr @_ZNSt5arrayIiLm6EE4dataEv(ptr %this1)
150   ret ptr %call
153 define linkonce_odr dso_local ptr @_ZNSt5arrayIiLm6EE3endEv(ptr %this) {
154 entry:
155   %this.addr = alloca ptr
156   store ptr %this, ptr %this.addr
157   %this1 = load ptr, ptr %this.addr
158   %call = call ptr @_ZNSt5arrayIiLm6EE4dataEv(ptr %this1)
159   %add.ptr = getelementptr inbounds i32, ptr %call, i64 6
160   ret ptr %add.ptr
163 declare void @llvm.lifetime.end.p0(i64 immarg, ptr nocapture)
165 declare dso_local void @_Z3usei(i32)
167 define linkonce_odr dso_local ptr @_ZNSt5arrayIiLm6EE4dataEv(ptr %this) {
168 entry:
169   %this.addr = alloca ptr
170   store ptr %this, ptr %this.addr
171   %this1 = load ptr, ptr %this.addr
172   %call = call ptr @_ZNSt14__array_traitsIiLm6EE6_S_ptrERA6_Ki(ptr nonnull align 4 dereferenceable(24) %this1)
173   ret ptr %call
176 define linkonce_odr dso_local ptr @_ZNSt14__array_traitsIiLm6EE6_S_ptrERA6_Ki(ptr nonnull align 4 dereferenceable(24) %__t) {
177 entry:
178   %__t.addr = alloca ptr
179   store ptr %__t, ptr %__t.addr
180   %0 = load ptr, ptr %__t.addr
181   ret ptr %0