[ARM] Cortex-M4 schedule additions
[llvm-complete.git] / test / CodeGen / X86 / win32-spill-xmm.ll
blobc6b163b88b24d9a33543dc51dc7ffad69a579d30
1 ; RUN: llc -mcpu=generic -mtriple=i686-pc-windows-msvc -mattr=+sse < %s | FileCheck %s
3 ; Check proper alignment of spilled vector
5 ; CHECK-LABEL: spill_ok
6 ; CHECK: subl    $32, %esp
7 ; CHECK: movaps  %xmm3, (%esp)
8 ; CHECK: movl    $0, 16(%esp)
9 ; CHECK: calll   _bar
10 define void @spill_ok(i32, <16 x float> *) {
11 entry:
12   %2 = alloca i32, i32 %0
13   %3 = load <16 x float>, <16 x float> * %1, align 64
14   tail call void @bar(<16 x float> %3, i32 0) nounwind
15   ret void
18 declare void @bar(<16 x float> %a, i32 %b)
20 ; Check that proper alignment of spilled vector does not affect vargs
22 ; CHECK-LABEL: vargs_not_affected
23 ; CHECK: movl 28(%ebp), %eax
24 define i32 @vargs_not_affected(<4 x float> %v, i8* %f, ...) {
25 entry:
26   %ap = alloca i8*, align 4
27   %0 = bitcast i8** %ap to i8*
28   call void @llvm.va_start(i8* %0)
29   %argp.cur = load i8*, i8** %ap, align 4
30   %argp.next = getelementptr inbounds i8, i8* %argp.cur, i32 4
31   store i8* %argp.next, i8** %ap, align 4
32   %1 = bitcast i8* %argp.cur to i32*
33   %2 = load i32, i32* %1, align 4
34   call void @llvm.va_end(i8* %0)
35   ret i32 %2
38 declare void @llvm.va_start(i8*)
40 declare void @llvm.va_end(i8*)