[ARM] Cortex-M4 schedule additions
[llvm-complete.git] / test / CodeGen / ARM / out-of-registers.ll
blob891319881f45d9e8918ae6e0fe55418d368e455c
1 ; RUN: llc -O3 %s -o - | FileCheck %s
2 ; ModuleID = 'fo.c'
3 target datalayout = "e-p:32:32:32-i1:8:32-i8:8:32-i16:16:32-i32:32:32-i64:64:64-f32:32:32-f64:64:64-v64:64:64-v128:64:128-a0:0:32-n8:16:32-S64"
4 target triple = "thumbv7-none-linux-gnueabi"
6 ; CHECK: vpush
7 ; CHECK: vpop
9 define void @foo(float* nocapture %A) #0 {
10   %1= bitcast float* %A to i8*
11   %2 = tail call { <4 x float>, <4 x float>, <4 x float>, <4 x float> } @llvm.arm.neon.vld4.v4f32.p0i8(i8* %1, i32 4)
12   %3 = extractvalue { <4 x float>, <4 x float>, <4 x float>, <4 x float> } %2, 0
13   %divp_vec = fdiv <4 x float> <float 1.000000e+00, float 1.000000e+00, float 1.000000e+00, float 1.000000e+00>, %3
14   %4 = extractvalue { <4 x float>, <4 x float>, <4 x float>, <4 x float> } %2, 1
15   %div3p_vec = fdiv <4 x float> <float 1.000000e+00, float 1.000000e+00, float 1.000000e+00, float 1.000000e+00>, %4
16   %5 = extractvalue { <4 x float>, <4 x float>, <4 x float>, <4 x float> } %2, 2
17   %div8p_vec = fdiv <4 x float> <float 1.000000e+00, float 1.000000e+00, float 1.000000e+00, float 1.000000e+00>, %5
18   %6 = extractvalue { <4 x float>, <4 x float>, <4 x float>, <4 x float> } %2, 3
19   %div13p_vec = fdiv <4 x float> <float 1.000000e+00, float 1.000000e+00, float 1.000000e+00, float 1.000000e+00>, %6
20   tail call void @llvm.arm.neon.vst4.p0i8.v4f32(i8* %1, <4 x float> %divp_vec, <4 x float> %div3p_vec, <4 x float> %div8p_vec, <4 x float> %div13p_vec, i32 4)
21  ret void
24 ; Function Attrs: nounwind
25 declare i32 @llvm.annotation.i32(i32, i8*, i8*, i32) #1
27 ; Function Attrs: nounwind readonly
29 ; Function Attrs: nounwind
30 declare void @llvm.arm.neon.vst4.p0i8.v4f32(i8*, <4 x float>, <4 x float>, <4 x float>, <4 x float>, i32) #1
31 declare { <4 x float>, <4 x float>, <4 x float>, <4 x float> } @llvm.arm.neon.vld4.v4f32.p0i8(i8*, i32) #2
33 ; Function Attrs: nounwind
35 attributes #0 = { nounwind "less-precise-fpmad"="false" "no-frame-pointer-elim"="false" "no-infs-fp-math"="true" "no-nans-fp-math"="true" "stack-protector-buffer-size"="8" "unsafe-fp-math"="true" "use-soft-float"="false" }
36 attributes #1 = { nounwind }
37 attributes #2 = { nounwind readonly }
39 !llvm.ident = !{!0}
41 !0 = !{!"Snapdragon LLVM ARM Compiler 3.4"}
42 !1 = !{!1}