1 ; RUN: opt %loadPolly %defaultOpts -polly-codegen -enable-polly-vector -dce -S %s | FileCheck %s
2 ; Obtained from C source as:
3 ; clang -S -emit-llvm -O0 vect-complex-4.c
4 ; opt -correlated-propagation -mem2reg -instcombine -loop-simplify -indvars -instnamer vect-complex-4.s > vect-complex-4.ll
6 ; ModuleID = 'vect-complex-4.s'
7 target datalayout = "e-p:64:64:64-i1:8:8-i8:8:8-i16:16:16-i32:32:32-i64:64:64-f32:32:32-f64:64:64-v64:64:64-v128:128:128-a0:0:64-s0:64:64-f80:128:128-n8:16:32:64"
8 target triple = "x86_64-unknown-linux-gnu"
10 %struct.foostr = type { { i16, i16 }, { i16, i16 } }
12 @a = global [16 x %struct.foostr] [%struct.foostr { { i16, i16 } { i16 11, i16 23 }, { i16, i16 } { i16 24, i16 22 } }, %struct.foostr { { i16, i16 } { i16 11, i16 26 }, { i16, i16 } { i16 24, i16 35 } }, %struct.foostr { { i16, i16 } { i16 19, i16 20 }, { i16, i16 } { i16 29, i16 14 } }, %struct.foostr { { i16, i16 } { i16 23, i16 31 }, { i16, i16 } { i16 26, i16 30 } }, %struct.foostr { { i16, i16 } { i16 29, i16 39 }, { i16, i16 } { i16 24, i16 18 } }, %struct.foostr { { i16, i16 } { i16 20, i16 32 }, { i16, i16 } { i16 16, i16 23 } }, %struct.foostr { { i16, i16 } { i16 13, i16 26 }, { i16, i16 } { i16 37, i16 34 } }, %struct.foostr { { i16, i16 } { i16 12, i16 23 }, { i16, i16 } { i16 26, i16 14 } }, %struct.foostr { { i16, i16 } { i16 36, i16 14 }, { i16, i16 } { i16 31, i16 17 } }, %struct.foostr { { i16, i16 } { i16 35, i16 17 }, { i16, i16 } { i16 17, i16 36 } }, %struct.foostr { { i16, i16 } { i16 13, i16 34 }, { i16, i16 } { i16 19, i16 12 } }, %struct.foostr { { i16, i16 } { i16 27, i16 34 }, { i16, i16 } { i16 36, i16 19 } }, %struct.foostr { { i16, i16 } { i16 21, i16 39 }, { i16, i16 } { i16 16, i16 33 } }, %struct.foostr { { i16, i16 } { i16 28, i16 18 }, { i16, i16 } { i16 39, i16 26 } }, %struct.foostr { { i16, i16 } { i16 32, i16 27 }, { i16, i16 } { i16 13, i16 38 } }, %struct.foostr { { i16, i16 } { i16 35, i16 36 }, { i16, i16 } { i16 34, i16 28 } }], align 16
13 @b = global [16 x %struct.foostr] [%struct.foostr { { i16, i16 } { i16 37, i16 12 }, { i16, i16 } { i16 23, i16 15 } }, %struct.foostr { { i16, i16 } { i16 14, i16 11 }, { i16, i16 } { i16 13, i16 25 } }, %struct.foostr { { i16, i16 } { i16 35, i16 29 }, { i16, i16 } { i16 22, i16 34 } }, %struct.foostr { { i16, i16 } { i16 24, i16 34 }, { i16, i16 } { i16 16, i16 39 } }, %struct.foostr { { i16, i16 } { i16 34, i16 32 }, { i16, i16 } { i16 26, i16 21 } }, %struct.foostr { { i16, i16 } { i16 34, i16 36 }, { i16, i16 } { i16 11, i16 37 } }, %struct.foostr { { i16, i16 } { i16 25, i16 21 }, { i16, i16 } { i16 10, i16 39 } }, %struct.foostr { { i16, i16 } { i16 10, i16 36 }, { i16, i16 } { i16 35, i16 22 } }, %struct.foostr { { i16, i16 } { i16 39, i16 29 }, { i16, i16 } { i16 23, i16 21 } }, %struct.foostr { { i16, i16 } { i16 34, i16 33 }, { i16, i16 } { i16 39, i16 14 } }, %struct.foostr { { i16, i16 } { i16 16, i16 31 }, { i16, i16 } { i16 32, i16 33 } }, %struct.foostr { { i16, i16 } { i16 20, i16 14 }, { i16, i16 } { i16 35, i16 30 } }, %struct.foostr { { i16, i16 } { i16 26, i16 24 }, { i16, i16 } { i16 36, i16 37 } }, %struct.foostr { { i16, i16 } { i16 31, i16 20 }, { i16, i16 } { i16 32, i16 28 } }, %struct.foostr { { i16, i16 } { i16 25, i16 27 }, { i16, i16 } { i16 15, i16 30 } }, %struct.foostr { { i16, i16 } { i16 10, i16 31 }, { i16, i16 } { i16 37, i16 37 } }], align 16
14 @res = global [16 x %struct.foostr] [%struct.foostr { { i16, i16 } { i16 48, i16 35 }, { i16, i16 } { i16 47, i16 37 } }, %struct.foostr { { i16, i16 } { i16 25, i16 37 }, { i16, i16 } { i16 37, i16 60 } }, %struct.foostr { { i16, i16 } { i16 54, i16 49 }, { i16, i16 } { i16 51, i16 48 } }, %struct.foostr { { i16, i16 } { i16 47, i16 65 }, { i16, i16 } { i16 42, i16 69 } }, %struct.foostr { { i16, i16 } { i16 63, i16 71 }, { i16, i16 } { i16 50, i16 39 } }, %struct.foostr { { i16, i16 } { i16 54, i16 68 }, { i16, i16 } { i16 27, i16 60 } }, %struct.foostr { { i16, i16 } { i16 38, i16 47 }, { i16, i16 } { i16 47, i16 73 } }, %struct.foostr { { i16, i16 } { i16 22, i16 59 }, { i16, i16 } { i16 61, i16 36 } }, %struct.foostr { { i16, i16 } { i16 75, i16 43 }, { i16, i16 } { i16 54, i16 38 } }, %struct.foostr { { i16, i16 } { i16 69, i16 50 }, { i16, i16 } { i16 56, i16 50 } }, %struct.foostr { { i16, i16 } { i16 29, i16 65 }, { i16, i16 } { i16 51, i16 45 } }, %struct.foostr { { i16, i16 } { i16 47, i16 48 }, { i16, i16 } { i16 71, i16 49 } }, %struct.foostr { { i16, i16 } { i16 47, i16 63 }, { i16, i16 } { i16 52, i16 70 } }, %struct.foostr { { i16, i16 } { i16 59, i16 38 }, { i16, i16 } { i16 71, i16 54 } }, %struct.foostr { { i16, i16 } { i16 57, i16 54 }, { i16, i16 } { i16 28, i16 68 } }, %struct.foostr { { i16, i16 } { i16 45, i16 67 }, { i16, i16 } { i16 71, i16 65 } }], align 16
15 @c = common global [16 x %struct.foostr] zeroinitializer, align 16
17 define void @foo() nounwind uwtable noinline {
21 for.cond: ; preds = %for.inc, %entry
22 %indvar = phi i64 [ %indvar.next, %for.inc ], [ 0, %entry ]
23 %real23 = getelementptr [16 x %struct.foostr]* @c, i64 0, i64 %indvar, i32 1, i32 0
24 %imag24 = getelementptr [16 x %struct.foostr]* @c, i64 0, i64 %indvar, i32 1, i32 1
25 %f216.realp = getelementptr [16 x %struct.foostr]* @b, i64 0, i64 %indvar, i32 1, i32 0
26 %f216.imagp = getelementptr [16 x %struct.foostr]* @b, i64 0, i64 %indvar, i32 1, i32 1
27 %f2.realp = getelementptr [16 x %struct.foostr]* @a, i64 0, i64 %indvar, i32 1, i32 0
28 %f2.imagp = getelementptr [16 x %struct.foostr]* @a, i64 0, i64 %indvar, i32 1, i32 1
29 %scevgep = getelementptr [16 x %struct.foostr]* @c, i64 0, i64 %indvar
30 %real = bitcast %struct.foostr* %scevgep to i16*
31 %imag = getelementptr [16 x %struct.foostr]* @c, i64 0, i64 %indvar, i32 0, i32 1
32 %scevgep3 = getelementptr [16 x %struct.foostr]* @b, i64 0, i64 %indvar
33 %f15.realp = bitcast %struct.foostr* %scevgep3 to i16*
34 %f15.imagp = getelementptr [16 x %struct.foostr]* @b, i64 0, i64 %indvar, i32 0, i32 1
35 %scevgep6 = getelementptr [16 x %struct.foostr]* @a, i64 0, i64 %indvar
36 %f1.realp = bitcast %struct.foostr* %scevgep6 to i16*
37 %f1.imagp = getelementptr [16 x %struct.foostr]* @a, i64 0, i64 %indvar, i32 0, i32 1
38 %exitcond = icmp ne i64 %indvar, 16
39 br i1 %exitcond, label %for.body, label %for.end
41 for.body: ; preds = %for.cond
42 %f1.real = load i16* %f1.realp, align 8
43 %f1.imag = load i16* %f1.imagp, align 2
44 %f15.real = load i16* %f15.realp, align 8
45 %f15.imag = load i16* %f15.imagp, align 2
46 %add.r = add i16 %f1.real, %f15.real
47 %add.i = add i16 %f1.imag, %f15.imag
48 store i16 %add.r, i16* %real, align 8
49 store i16 %add.i, i16* %imag, align 2
50 %f2.real = load i16* %f2.realp, align 4
51 %f2.imag = load i16* %f2.imagp, align 2
52 %f216.real = load i16* %f216.realp, align 4
53 %f216.imag = load i16* %f216.imagp, align 2
54 %add.r17 = add i16 %f2.real, %f216.real
55 %add.i18 = add i16 %f2.imag, %f216.imag
56 store i16 %add.r17, i16* %real23, align 4
57 store i16 %add.i18, i16* %imag24, align 2
60 for.inc: ; preds = %for.body
61 %indvar.next = add i64 %indvar, 1
64 for.end: ; preds = %for.cond
68 define i32 @main() nounwind uwtable {
70 call void @check_vect()
74 for.cond: ; preds = %for.inc, %entry
75 %indvar = phi i64 [ %indvar.next, %for.inc ], [ 0, %entry ]
76 %f212.realp = getelementptr [16 x %struct.foostr]* @res, i64 0, i64 %indvar, i32 1, i32 0
77 %f212.imagp = getelementptr [16 x %struct.foostr]* @res, i64 0, i64 %indvar, i32 1, i32 1
78 %f2.realp = getelementptr [16 x %struct.foostr]* @c, i64 0, i64 %indvar, i32 1, i32 0
79 %f2.imagp = getelementptr [16 x %struct.foostr]* @c, i64 0, i64 %indvar, i32 1, i32 1
80 %scevgep = getelementptr [16 x %struct.foostr]* @res, i64 0, i64 %indvar
81 %f15.realp = bitcast %struct.foostr* %scevgep to i16*
82 %f15.imagp = getelementptr [16 x %struct.foostr]* @res, i64 0, i64 %indvar, i32 0, i32 1
83 %scevgep3 = getelementptr [16 x %struct.foostr]* @c, i64 0, i64 %indvar
84 %f1.realp = bitcast %struct.foostr* %scevgep3 to i16*
85 %f1.imagp = getelementptr [16 x %struct.foostr]* @c, i64 0, i64 %indvar, i32 0, i32 1
86 %i.0 = trunc i64 %indvar to i32
87 %cmp = icmp slt i32 %i.0, 16
88 br i1 %cmp, label %for.body, label %for.end
90 for.body: ; preds = %for.cond
91 %f1.real = load i16* %f1.realp, align 8
92 %f1.imag = load i16* %f1.imagp, align 2
93 %f15.real = load i16* %f15.realp, align 8
94 %f15.imag = load i16* %f15.imagp, align 2
95 %cmp.r = icmp ne i16 %f1.real, %f15.real
96 %cmp.i = icmp ne i16 %f1.imag, %f15.imag
97 %or.ri = or i1 %cmp.r, %cmp.i
98 br i1 %or.ri, label %if.then, label %if.end
100 if.then: ; preds = %for.body
101 call void @abort() noreturn nounwind
104 if.end: ; preds = %for.body
105 %f2.real = load i16* %f2.realp, align 4
106 %f2.imag = load i16* %f2.imagp, align 2
107 %f212.real = load i16* %f212.realp, align 4
108 %f212.imag = load i16* %f212.imagp, align 2
109 %cmp.r13 = icmp ne i16 %f2.real, %f212.real
110 %cmp.i14 = icmp ne i16 %f2.imag, %f212.imag
111 %or.ri15 = or i1 %cmp.r13, %cmp.i14
112 br i1 %or.ri15, label %if.then16, label %if.end17
114 if.then16: ; preds = %if.end
115 call void @abort() noreturn nounwind
118 if.end17: ; preds = %if.end
121 for.inc: ; preds = %if.end17
122 %indvar.next = add i64 %indvar, 1
125 for.end: ; preds = %for.cond
129 define internal void @check_vect() nounwind uwtable noinline {
131 %a = alloca i32, align 4
132 %b = alloca i32, align 4
133 %c = alloca i32, align 4
134 %d = alloca i32, align 4
135 %call = call void (i32)* (i32, void (i32)*)* @signal(i32 4, void (i32)* @sig_ill_handler) nounwind
136 %call1 = call i32 @__get_cpuid(i32 1, i32* %a, i32* %b, i32* %c, i32* %d)
137 %tobool = icmp eq i32 %call1, 0
138 br i1 %tobool, label %if.then, label %lor.lhs.false
140 lor.lhs.false: ; preds = %entry
141 %tmp4 = load i32* %d, align 4
142 %and6 = and i32 %tmp4, 67108864
143 %cmp = icmp eq i32 %and6, 0
144 br i1 %cmp, label %if.then, label %if.end
146 if.then: ; preds = %entry, %lor.lhs.false
147 call void @exit(i32 0) noreturn nounwind
150 if.end: ; preds = %lor.lhs.false
151 %call7 = call void (i32)* (i32, void (i32)*)* @signal(i32 4, void (i32)* null) nounwind
155 declare void @abort() noreturn
157 declare void (i32)* @signal(i32, void (i32)*) nounwind
159 define internal void @sig_ill_handler(i32 %sig) nounwind uwtable {
161 call void @exit(i32 0) noreturn nounwind
164 return: ; No predecessors!
168 define internal i32 @__get_cpuid(i32 %__level, i32* %__eax, i32* %__ebx, i32* %__ecx, i32* %__edx) nounwind uwtable inlinehint {
170 %and = and i32 %__level, -2147483648
171 %call = call i32 @__get_cpuid_max(i32 %and, i32* null)
172 %cmp = icmp ult i32 %call, %__level
173 br i1 %cmp, label %if.then, label %if.end
175 if.then: ; preds = %entry
178 if.end: ; preds = %entry
179 %tmp = call { i32, i32, i32, i32 } asm "cpuid\0A\09", "={ax},={bx},={cx},={dx},0,~{dirflag},~{fpsr},~{flags}"(i32 %__level) nounwind, !srcloc !0
180 %asmresult = extractvalue { i32, i32, i32, i32 } %tmp, 0
181 %asmresult8 = extractvalue { i32, i32, i32, i32 } %tmp, 1
182 %asmresult9 = extractvalue { i32, i32, i32, i32 } %tmp, 2
183 %asmresult10 = extractvalue { i32, i32, i32, i32 } %tmp, 3
184 store i32 %asmresult, i32* %__eax, align 4
185 store i32 %asmresult8, i32* %__ebx, align 4
186 store i32 %asmresult9, i32* %__ecx, align 4
187 store i32 %asmresult10, i32* %__edx, align 4
190 return: ; preds = %if.end, %if.then
191 %retval.0 = phi i32 [ 0, %if.then ], [ 1, %if.end ]
195 declare void @exit(i32) noreturn
197 define internal i32 @__get_cpuid_max(i32 %__ext, i32* %__sig) nounwind uwtable inlinehint {
199 %tmp = call { i32, i32, i32, i32 } asm "cpuid\0A\09", "={ax},={bx},={cx},={dx},0,~{dirflag},~{fpsr},~{flags}"(i32 %__ext) nounwind, !srcloc !1
200 %asmresult = extractvalue { i32, i32, i32, i32 } %tmp, 0
201 %tobool = icmp eq i32* %__sig, null
202 br i1 %tobool, label %if.end, label %if.then
204 if.then: ; preds = %entry
205 %asmresult1 = extractvalue { i32, i32, i32, i32 } %tmp, 1
206 store i32 %asmresult1, i32* %__sig, align 4
209 if.end: ; preds = %entry, %if.then
213 !0 = metadata !{i32 -2147342131, i32 -2147342123}
214 !1 = metadata !{i32 -2147342254, i32 -2147342246}