[x86] fix assert with horizontal math + broadcast of vector (PR43402)
[llvm-core.git] / test / CodeGen / X86 / stack-align.ll
blob338ced0ebf19357e8b241063809538d7442dcf7b
1 ; RUN: llc < %s -relocation-model=static -mcpu=yonah | FileCheck %s
3 ; The double argument is at 4(esp) which is 16-byte aligned, but we
4 ; are required to read in extra bytes of memory in order to fold the
5 ; load. Bad Things may happen when reading/processing undefined bytes,
6 ; so don't fold the load.
7 ; PR22371 / http://reviews.llvm.org/D7474
9 target datalayout = "e-p:32:32:32-i1:8:8-i8:8:8-i16:16:16-i32:32:32-i64:32:64-f32:32:32-f64:32:64-v64:64:64-v128:128:128-a0:0:64-f80:128:128"
10 target triple = "i686-apple-darwin8"
11 @G = external global double
13 define void @test({ double, double }* byval  %z, double* %P) nounwind {
14 entry:
15         %tmp3 = load double, double* @G, align 16               ; <double> [#uses=1]
16         %tmp4 = tail call double @fabs( double %tmp3 ) readnone ; <double> [#uses=1]
17         store volatile double %tmp4, double* %P
18         %tmp = getelementptr { double, double }, { double, double }* %z, i32 0, i32 0           ; <double*> [#uses=1]
19         %tmp1 = load volatile double, double* %tmp, align 8             ; <double> [#uses=1]
20         %tmp2 = tail call double @fabs( double %tmp1 ) readnone ; <double> [#uses=1]
21         %tmp6 = fadd double %tmp4, %tmp2                ; <double> [#uses=1]
22         store volatile double %tmp6, double* %P, align 8
23         ret void
25 ; CHECK-LABEL: test:
26 ; CHECK:       movsd    {{.*}}G, %xmm{{.*}}
27 ; CHECK:       andpd    %xmm{{.*}}, %xmm{{.*}}
28 ; CHECK:       movsd    4(%esp), %xmm{{.*}}
29 ; CHECK:       andpd    %xmm{{.*}}, %xmm{{.*}}
34 define void @test2() alignstack(16) nounwind {
35 entry:
36 ; CHECK-LABEL: test2:
37 ; CHECK: andl{{.*}}$-16, %esp
38     ret void
41 ; Use a call to force a spill.
42 define <2 x double> @test3(<2 x double> %x, <2 x double> %y) alignstack(32) nounwind {
43 entry:
44 ; CHECK-LABEL: test3:
45 ; CHECK: andl{{.*}}$-32, %esp
46     call void @test2()
47     %A = fmul <2 x double> %x, %y
48     ret <2 x double> %A
51 declare double @fabs(double)
53 ; The pointer is already known aligned, so and x,-16 is eliminable.
54 define i32 @test4() nounwind {
55 entry:
56   %buffer = alloca [2048 x i8], align 16
57   %0 = ptrtoint [2048 x i8]* %buffer to i32
58   %and = and i32 %0, -16
59   ret i32 %and
60 ; CHECK-LABEL: test4:
61 ; CHECK-NOT: and
62 ; CHECK: ret
65 %struct.sixteen = type { [16 x i8] }
67 ; Accessing stack parameters shouldn't assume stack alignment. Here we should
68 ; emit two 8-byte loads, followed by two 8-byte stores.
69 define x86_stdcallcc void @test5(%struct.sixteen* byval nocapture readonly align 4 %s) #0 {
70   %d.sroa.0 = alloca [16 x i8], align 1
71   %1 = getelementptr inbounds [16 x i8], [16 x i8]* %d.sroa.0, i32 0, i32 0
72   call void @llvm.lifetime.start.p0i8(i64 16, i8* %1)
73   %2 = getelementptr inbounds %struct.sixteen, %struct.sixteen* %s, i32 0, i32 0, i32 0
74   call void @llvm.memcpy.p0i8.p0i8.i32(i8* %1, i8* %2, i32 16, i1 true)
75   call void @llvm.lifetime.end.p0i8(i64 16, i8* %1)
76   ret void
77 ; CHECK-LABEL: test5:
78 ; CHECK: and
79 ; CHECK: movsd
80 ; CHECK-NEXT: movsd
81 ; CHECK-NEXT: movsd
82 ; CHECK-NEXT: movsd
85 declare void @llvm.lifetime.start.p0i8(i64, i8* nocapture) argmemonly nounwind
87 declare void @llvm.memcpy.p0i8.p0i8.i32(i8* nocapture, i8* nocapture readonly, i32, i1) argmemonly nounwind
89 declare void @llvm.lifetime.end.p0i8(i64, i8* nocapture) argmemonly nounwind
91 attributes #0 = { nounwind alignstack=16 "no-frame-pointer-elim"="true" "no-frame-pointer-elim-non-leaf" }