[ARM] Split large truncating MVE stores
[llvm-complete.git] / test / Transforms / LoopReroll / reduction.ll
blobb1e92478f264ce33dc0cece5de06027ad437c7d7
1 ; RUN: opt < %s -loop-reroll -S | FileCheck %s
2 target datalayout = "e-p:64:64:64-i1:8:8-i8:8:8-i16:16:16-i32:32:32-i64:64:64-f32:32:32-f64:64:64-v64:64:64-v128:128:128-a0:0:64-s0:64:64-f80:128:128-n8:16:32:64-S128"
3 target triple = "x86_64-unknown-linux-gnu"
5 define i32 @foo(i32* nocapture readonly %x) #0 {
6 entry:
7   br label %for.body
9 for.body:                                         ; preds = %entry, %for.body
10   %indvars.iv = phi i64 [ 0, %entry ], [ %indvars.iv.next, %for.body ]
11   %r.029 = phi i32 [ 0, %entry ], [ %add12, %for.body ]
12   %arrayidx = getelementptr inbounds i32, i32* %x, i64 %indvars.iv
13   %0 = load i32, i32* %arrayidx, align 4
14   %add = add nsw i32 %0, %r.029
15   %1 = or i64 %indvars.iv, 1
16   %arrayidx3 = getelementptr inbounds i32, i32* %x, i64 %1
17   %2 = load i32, i32* %arrayidx3, align 4
18   %add4 = add nsw i32 %add, %2
19   %3 = or i64 %indvars.iv, 2
20   %arrayidx7 = getelementptr inbounds i32, i32* %x, i64 %3
21   %4 = load i32, i32* %arrayidx7, align 4
22   %add8 = add nsw i32 %add4, %4
23   %5 = or i64 %indvars.iv, 3
24   %arrayidx11 = getelementptr inbounds i32, i32* %x, i64 %5
25   %6 = load i32, i32* %arrayidx11, align 4
26   %add12 = add nsw i32 %add8, %6
27   %indvars.iv.next = add nuw nsw i64 %indvars.iv, 4
28   %7 = trunc i64 %indvars.iv.next to i32
29   %cmp = icmp slt i32 %7, 400
30   br i1 %cmp, label %for.body, label %for.end
32 ; CHECK-LABEL: @foo
34 ; CHECK: for.body:
35 ; CHECK: %indvar = phi i64 [ %indvar.next, %for.body ], [ 0, %entry ]
36 ; CHECK: %r.029 = phi i32 [ 0, %entry ], [ %add, %for.body ]
37 ; CHECK: %arrayidx = getelementptr inbounds i32, i32* %x, i64 %indvar
38 ; CHECK: %1 = load i32, i32* %arrayidx, align 4
39 ; CHECK: %add = add nsw i32 %1, %r.029
40 ; CHECK: %indvar.next = add i64 %indvar, 1
41 ; CHECK: %exitcond = icmp eq i32 %0, 399
42 ; CHECK: br i1 %exitcond, label %for.end, label %for.body
44 ; CHECK: ret
46 for.end:                                          ; preds = %for.body
47   ret i32 %add12
50 define float @bar(float* nocapture readonly %x) #0 {
51 entry:
52   br label %for.body
54 for.body:                                         ; preds = %entry, %for.body
55   %indvars.iv = phi i64 [ 0, %entry ], [ %indvars.iv.next, %for.body ]
56   %r.029 = phi float [ 0.0, %entry ], [ %add12, %for.body ]
57   %arrayidx = getelementptr inbounds float, float* %x, i64 %indvars.iv
58   %0 = load float, float* %arrayidx, align 4
59   %add = fadd float %0, %r.029
60   %1 = or i64 %indvars.iv, 1
61   %arrayidx3 = getelementptr inbounds float, float* %x, i64 %1
62   %2 = load float, float* %arrayidx3, align 4
63   %add4 = fadd float %add, %2
64   %3 = or i64 %indvars.iv, 2
65   %arrayidx7 = getelementptr inbounds float, float* %x, i64 %3
66   %4 = load float, float* %arrayidx7, align 4
67   %add8 = fadd float %add4, %4
68   %5 = or i64 %indvars.iv, 3
69   %arrayidx11 = getelementptr inbounds float, float* %x, i64 %5
70   %6 = load float, float* %arrayidx11, align 4
71   %add12 = fadd float %add8, %6
72   %indvars.iv.next = add nuw nsw i64 %indvars.iv, 4
73   %7 = trunc i64 %indvars.iv.next to i32
74   %cmp = icmp slt i32 %7, 400
75   br i1 %cmp, label %for.body, label %for.end
77 ; CHECK-LABEL: @bar
79 ; CHECK: for.body:
80 ; CHECK: %indvar = phi i64 [ %indvar.next, %for.body ], [ 0, %entry ]
81 ; CHECK: %r.029 = phi float [ 0.000000e+00, %entry ], [ %add, %for.body ]
82 ; CHECK: %arrayidx = getelementptr inbounds float, float* %x, i64 %indvar
83 ; CHECK: %1 = load float, float* %arrayidx, align 4
84 ; CHECK: %add = fadd float %1, %r.029
85 ; CHECK: %indvar.next = add i64 %indvar, 1
86 ; CHECK: %exitcond = icmp eq i32 %0, 399
87 ; CHECK: br i1 %exitcond, label %for.end, label %for.body
89 ; CHECK: ret
91 for.end:                                          ; preds = %for.body
92   ret float %add12
95 define i32 @foo_unusedphi(i32* nocapture readonly %x) #0 {
96 entry:
97   br label %for.body
99 for.body:                                         ; preds = %entry, %for.body
100   %indvars.iv = phi i64 [ 0, %entry ], [ %indvars.iv.next, %for.body ]
101   %r.029 = phi i32 [ 0, %entry ], [ %add12, %for.body ]
102   %arrayidx = getelementptr inbounds i32, i32* %x, i64 %indvars.iv
103   %0 = load i32, i32* %arrayidx, align 4
104   %add = add nsw i32 %0, %0
105   %1 = or i64 %indvars.iv, 1
106   %arrayidx3 = getelementptr inbounds i32, i32* %x, i64 %1
107   %2 = load i32, i32* %arrayidx3, align 4
108   %add4 = add nsw i32 %add, %2
109   %3 = or i64 %indvars.iv, 2
110   %arrayidx7 = getelementptr inbounds i32, i32* %x, i64 %3
111   %4 = load i32, i32* %arrayidx7, align 4
112   %add8 = add nsw i32 %add4, %4
113   %5 = or i64 %indvars.iv, 3
114   %arrayidx11 = getelementptr inbounds i32, i32* %x, i64 %5
115   %6 = load i32, i32* %arrayidx11, align 4
116   %add12 = add nsw i32 %add8, %6
117   %indvars.iv.next = add nuw nsw i64 %indvars.iv, 4
118   %7 = trunc i64 %indvars.iv.next to i32
119   %cmp = icmp slt i32 %7, 400
120   br i1 %cmp, label %for.body, label %for.end
122 ; CHECK-LABEL: @foo_unusedphi
123 ; The above is just testing for a crash - no specific output expected.
125 ; CHECK: ret
127 for.end:                                          ; preds = %for.body
128   ret i32 %add12
131 attributes #0 = { nounwind readonly uwtable }