Add compile command to each testcase
[gcc-vect-testsuite.git] / vect-widen-mult-sum.ll
blob5d4260a18ea8b29a0f6047ef34dec0f0d3950876
1 ; RUN: opt %loadPolly %defaultOpts -polly-codegen -enable-polly-vector -dce -S %s | FileCheck %s
2 ; Obtained from C source as:
3 ; clang -S -emit-llvm -O0 vect-widen-mult-sum.c
4 ; opt -correlated-propagation -mem2reg -instcombine -loop-simplify -indvars -instnamer vect-widen-mult-sum.s > vect-widen-mult-sum.ll
6 ; ModuleID = 'vect-widen-mult-sum.s'
7 target datalayout = "e-p:64:64:64-i1:8:8-i8:8:8-i16:16:16-i32:32:32-i64:64:64-f32:32:32-f64:64:64-v64:64:64-v128:128:128-a0:0:64-s0:64:64-f80:128:128-n8:16:32:64"
8 target triple = "x86_64-unknown-linux-gnu"
10 define i32 @main1(i16* %in, i32 %off, i16 signext %scale, i32 %n) nounwind uwtable noinline {
11 entry:
12   %tmp = icmp sgt i32 %n, 0
13   %smax = select i1 %tmp, i32 %n, i32 0
14   %tmp1 = zext i32 %smax to i64
15   %tmp2 = zext i32 %off to i64
16   br label %for.cond
18 for.cond:                                         ; preds = %for.inc, %entry
19   %indvar = phi i64 [ %indvar.next, %for.inc ], [ 0, %entry ]
20   %sum.0 = phi i32 [ 0, %entry ], [ %add15, %for.inc ]
21   %tmp3 = add i64 %tmp2, %indvar
22   %add = trunc i64 %tmp3 to i32
23   %arrayidx = getelementptr i16* %in, i64 %indvar
24   %exitcond = icmp ne i64 %indvar, %tmp1
25   br i1 %exitcond, label %for.body, label %for.end
27 for.body:                                         ; preds = %for.cond
28   br label %for.inc
30 for.inc:                                          ; preds = %for.body
31   %idxprom7 = sext i32 %add to i64
32   %arrayidx9 = getelementptr inbounds i16* %in, i64 %idxprom7
33   %tmp10 = load i16* %arrayidx9, align 2
34   %tmp4 = load i16* %arrayidx, align 2
35   %conv11 = sext i16 %tmp10 to i32
36   %conv = sext i16 %tmp4 to i32
37   %conv13 = sext i16 %scale to i32
38   %mul = mul nsw i32 %conv, %conv11
39   %shr = ashr i32 %mul, %conv13
40   %add15 = add nsw i32 %sum.0, %shr
41   %indvar.next = add i64 %indvar, 1
42   br label %for.cond
44 for.end:                                          ; preds = %for.cond
45   %sum.0.lcssa = phi i32 [ %sum.0, %for.cond ]
46   ret i32 %sum.0.lcssa
49 define i32 @main() nounwind uwtable {
50 entry:
51   %X = alloca [64 x i16], align 16
52   call void @check_vect()
53   br label %for.cond
55 for.cond:                                         ; preds = %for.inc, %entry
56   %indvar = phi i64 [ %indvar.next, %for.inc ], [ 0, %entry ]
57   %arrayidx = getelementptr [64 x i16]* %X, i64 0, i64 %indvar
58   %tmp = mul i64 %indvar, -1
59   %tmp1 = add i64 %tmp, 16
60   %conv = trunc i64 %tmp1 to i16
61   %exitcond = icmp ne i64 %indvar, 64
62   br i1 %exitcond, label %for.body, label %for.end
64 for.body:                                         ; preds = %for.cond
65   store i16 %conv, i16* %arrayidx, align 2
66   call void asm sideeffect "", "~{dirflag},~{fpsr},~{flags}"() nounwind, !srcloc !0
67   br label %for.inc
69 for.inc:                                          ; preds = %for.body
70   %indvar.next = add i64 %indvar, 1
71   br label %for.cond
73 for.end:                                          ; preds = %for.cond
74   %arraydecay = getelementptr inbounds [64 x i16]* %X, i64 0, i64 0
75   %call = call i32 @main1(i16* %arraydecay, i32 1, i16 signext 16, i32 63)
76   %cmp5 = icmp eq i32 %call, 0
77   br i1 %cmp5, label %if.end, label %if.then
79 if.then:                                          ; preds = %for.end
80   call void @abort() noreturn nounwind
81   unreachable
83 if.end:                                           ; preds = %for.end
84   ret i32 0
87 define internal void @check_vect() nounwind uwtable noinline {
88 entry:
89   %a = alloca i32, align 4
90   %b = alloca i32, align 4
91   %c = alloca i32, align 4
92   %d = alloca i32, align 4
93   %call = call void (i32)* (i32, void (i32)*)* @signal(i32 4, void (i32)* @sig_ill_handler) nounwind
94   %call1 = call i32 @__get_cpuid(i32 1, i32* %a, i32* %b, i32* %c, i32* %d)
95   %tobool = icmp eq i32 %call1, 0
96   br i1 %tobool, label %if.then, label %lor.lhs.false
98 lor.lhs.false:                                    ; preds = %entry
99   %tmp4 = load i32* %d, align 4
100   %and6 = and i32 %tmp4, 67108864
101   %cmp = icmp eq i32 %and6, 0
102   br i1 %cmp, label %if.then, label %if.end
104 if.then:                                          ; preds = %entry, %lor.lhs.false
105   call void @exit(i32 0) noreturn nounwind
106   unreachable
108 if.end:                                           ; preds = %lor.lhs.false
109   %call7 = call void (i32)* (i32, void (i32)*)* @signal(i32 4, void (i32)* null) nounwind
110   ret void
113 declare void @abort() noreturn
115 declare void (i32)* @signal(i32, void (i32)*) nounwind
117 define internal void @sig_ill_handler(i32 %sig) nounwind uwtable {
118 entry:
119   call void @exit(i32 0) noreturn nounwind
120   unreachable
122 return:                                           ; No predecessors!
123   ret void
126 define internal i32 @__get_cpuid(i32 %__level, i32* %__eax, i32* %__ebx, i32* %__ecx, i32* %__edx) nounwind uwtable inlinehint {
127 entry:
128   %and = and i32 %__level, -2147483648
129   %call = call i32 @__get_cpuid_max(i32 %and, i32* null)
130   %cmp = icmp ult i32 %call, %__level
131   br i1 %cmp, label %if.then, label %if.end
133 if.then:                                          ; preds = %entry
134   br label %return
136 if.end:                                           ; preds = %entry
137   %tmp = call { i32, i32, i32, i32 } asm "cpuid\0A\09", "={ax},={bx},={cx},={dx},0,~{dirflag},~{fpsr},~{flags}"(i32 %__level) nounwind, !srcloc !1
138   %asmresult = extractvalue { i32, i32, i32, i32 } %tmp, 0
139   %asmresult8 = extractvalue { i32, i32, i32, i32 } %tmp, 1
140   %asmresult9 = extractvalue { i32, i32, i32, i32 } %tmp, 2
141   %asmresult10 = extractvalue { i32, i32, i32, i32 } %tmp, 3
142   store i32 %asmresult, i32* %__eax, align 4
143   store i32 %asmresult8, i32* %__ebx, align 4
144   store i32 %asmresult9, i32* %__ecx, align 4
145   store i32 %asmresult10, i32* %__edx, align 4
146   br label %return
148 return:                                           ; preds = %if.end, %if.then
149   %retval.0 = phi i32 [ 0, %if.then ], [ 1, %if.end ]
150   ret i32 %retval.0
153 declare void @exit(i32) noreturn
155 define internal i32 @__get_cpuid_max(i32 %__ext, i32* %__sig) nounwind uwtable inlinehint {
156 entry:
157   %tmp = call { i32, i32, i32, i32 } asm "cpuid\0A\09", "={ax},={bx},={cx},={dx},0,~{dirflag},~{fpsr},~{flags}"(i32 %__ext) nounwind, !srcloc !2
158   %asmresult = extractvalue { i32, i32, i32, i32 } %tmp, 0
159   %tobool = icmp eq i32* %__sig, null
160   br i1 %tobool, label %if.end, label %if.then
162 if.then:                                          ; preds = %entry
163   %asmresult1 = extractvalue { i32, i32, i32, i32 } %tmp, 1
164   store i32 %asmresult1, i32* %__sig, align 4
165   br label %if.end
167 if.end:                                           ; preds = %entry, %if.then
168   ret i32 %asmresult
171 !0 = metadata !{i32 534}
172 !1 = metadata !{i32 -2147343444, i32 -2147343436} 
173 !2 = metadata !{i32 -2147343567, i32 -2147343559} 
174 ; CHECK: define