[ORC] Add std::tuple support to SimplePackedSerialization.
[llvm-project.git] / llvm / test / CodeGen / X86 / 2008-02-22-LocalRegAllocBug.ll
blobc4572d3f64b4f3e3a864a4ebcd7669c2e6f9b696
1 ; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
2 ; RUN: llc < %s -regalloc=fast -optimize-regalloc=0 -mtriple=i686-- -mattr=+mmx | FileCheck %s
3 ; PR2082
4 ; Local register allocator was refusing to use ESI, EDI, and EBP so it ran out of
5 ; registers.
6 define void @transpose4x4(i8* %dst, i8* %src, i32 %dst_stride, i32 %src_stride) {
7 ; CHECK-LABEL: transpose4x4:
8 ; CHECK:       # %bb.0: # %entry
9 ; CHECK-NEXT:    pushl %ebx
10 ; CHECK-NEXT:    .cfi_def_cfa_offset 8
11 ; CHECK-NEXT:    pushl %edi
12 ; CHECK-NEXT:    .cfi_def_cfa_offset 12
13 ; CHECK-NEXT:    pushl %esi
14 ; CHECK-NEXT:    .cfi_def_cfa_offset 16
15 ; CHECK-NEXT:    .cfi_offset %esi, -16
16 ; CHECK-NEXT:    .cfi_offset %edi, -12
17 ; CHECK-NEXT:    .cfi_offset %ebx, -8
18 ; CHECK-NEXT:    movl {{[0-9]+}}(%esp), %eax
19 ; CHECK-NEXT:    movl {{[0-9]+}}(%esp), %ecx
20 ; CHECK-NEXT:    leal (%ecx,%ecx,2), %edx
21 ; CHECK-NEXT:    movl {{[0-9]+}}(%esp), %esi
22 ; CHECK-NEXT:    movl {{[0-9]+}}(%esp), %edi
23 ; CHECK-NEXT:    leal (%edi,%edi,2), %ebx
24 ; CHECK-NEXT:    #APP
25 ; CHECK-NEXT:    movd (%esi), %mm0
26 ; CHECK-NEXT:    movd (%esi,%edi), %mm1
27 ; CHECK-NEXT:    movd (%esi,%edi,2), %mm2
28 ; CHECK-NEXT:    movd (%esi,%ebx), %mm3
29 ; CHECK-NEXT:    punpcklbw %mm1, %mm0 # mm0 = mm0[0],mm1[0],mm0[1],mm1[1],mm0[2],mm1[2],mm0[3],mm1[3]
30 ; CHECK-NEXT:    punpcklbw %mm3, %mm2 # mm2 = mm2[0],mm3[0],mm2[1],mm3[1],mm2[2],mm3[2],mm2[3],mm3[3]
31 ; CHECK-NEXT:    movq %mm0, %mm1
32 ; CHECK-NEXT:    punpcklwd %mm2, %mm0 # mm0 = mm0[0],mm2[0],mm0[1],mm2[1]
33 ; CHECK-NEXT:    punpckhwd %mm2, %mm1 # mm1 = mm1[2],mm2[2],mm1[3],mm2[3]
34 ; CHECK-NEXT:    movd %mm0, (%eax)
35 ; CHECK-NEXT:    punpckhdq %mm0, %mm0 # mm0 = mm0[1,1]
36 ; CHECK-NEXT:    movd %mm0, (%eax,%ecx)
37 ; CHECK-NEXT:    movd %mm1, (%eax,%ecx,2)
38 ; CHECK-NEXT:    punpckhdq %mm1, %mm1 # mm1 = mm1[1,1]
39 ; CHECK-NEXT:    movd %mm1, (%eax,%edx)
40 ; CHECK-EMPTY:
41 ; CHECK-NEXT:    #NO_APP
42 ; CHECK-NEXT:    popl %esi
43 ; CHECK-NEXT:    .cfi_def_cfa_offset 12
44 ; CHECK-NEXT:    popl %edi
45 ; CHECK-NEXT:    .cfi_def_cfa_offset 8
46 ; CHECK-NEXT:    popl %ebx
47 ; CHECK-NEXT:    .cfi_def_cfa_offset 4
48 ; CHECK-NEXT:    retl
49 entry:
50         %dst_addr = alloca i8*          ; <i8**> [#uses=5]
51         %src_addr = alloca i8*          ; <i8**> [#uses=5]
52         %dst_stride_addr = alloca i32           ; <i32*> [#uses=4]
53         %src_stride_addr = alloca i32           ; <i32*> [#uses=4]
54         %"alloca point" = bitcast i32 0 to i32          ; <i32> [#uses=0]
55         store i8* %dst, i8** %dst_addr
56         store i8* %src, i8** %src_addr
57         store i32 %dst_stride, i32* %dst_stride_addr
58         store i32 %src_stride, i32* %src_stride_addr
59         %tmp = load i8*, i8** %dst_addr, align 4                ; <i8*> [#uses=1]
60         %tmp1 = getelementptr i8, i8* %tmp, i32 0               ; <i8*> [#uses=1]
61         %tmp12 = bitcast i8* %tmp1 to i32*              ; <i32*> [#uses=1]
62         %tmp3 = load i8*, i8** %dst_addr, align 4               ; <i8*> [#uses=1]
63         %tmp4 = load i32, i32* %dst_stride_addr, align 4                ; <i32> [#uses=1]
64         %tmp5 = getelementptr i8, i8* %tmp3, i32 %tmp4          ; <i8*> [#uses=1]
65         %tmp56 = bitcast i8* %tmp5 to i32*              ; <i32*> [#uses=1]
66         %tmp7 = load i32, i32* %dst_stride_addr, align 4                ; <i32> [#uses=1]
67         %tmp8 = mul i32 %tmp7, 2                ; <i32> [#uses=1]
68         %tmp9 = load i8*, i8** %dst_addr, align 4               ; <i8*> [#uses=1]
69         %tmp10 = getelementptr i8, i8* %tmp9, i32 %tmp8         ; <i8*> [#uses=1]
70         %tmp1011 = bitcast i8* %tmp10 to i32*           ; <i32*> [#uses=1]
71         %tmp13 = load i32, i32* %dst_stride_addr, align 4               ; <i32> [#uses=1]
72         %tmp14 = mul i32 %tmp13, 3              ; <i32> [#uses=1]
73         %tmp15 = load i8*, i8** %dst_addr, align 4              ; <i8*> [#uses=1]
74         %tmp16 = getelementptr i8, i8* %tmp15, i32 %tmp14               ; <i8*> [#uses=1]
75         %tmp1617 = bitcast i8* %tmp16 to i32*           ; <i32*> [#uses=1]
76         %tmp18 = load i8*, i8** %src_addr, align 4              ; <i8*> [#uses=1]
77         %tmp19 = getelementptr i8, i8* %tmp18, i32 0            ; <i8*> [#uses=1]
78         %tmp1920 = bitcast i8* %tmp19 to i32*           ; <i32*> [#uses=1]
79         %tmp21 = load i8*, i8** %src_addr, align 4              ; <i8*> [#uses=1]
80         %tmp22 = load i32, i32* %src_stride_addr, align 4               ; <i32> [#uses=1]
81         %tmp23 = getelementptr i8, i8* %tmp21, i32 %tmp22               ; <i8*> [#uses=1]
82         %tmp2324 = bitcast i8* %tmp23 to i32*           ; <i32*> [#uses=1]
83         %tmp25 = load i32, i32* %src_stride_addr, align 4               ; <i32> [#uses=1]
84         %tmp26 = mul i32 %tmp25, 2              ; <i32> [#uses=1]
85         %tmp27 = load i8*, i8** %src_addr, align 4              ; <i8*> [#uses=1]
86         %tmp28 = getelementptr i8, i8* %tmp27, i32 %tmp26               ; <i8*> [#uses=1]
87         %tmp2829 = bitcast i8* %tmp28 to i32*           ; <i32*> [#uses=1]
88         %tmp30 = load i32, i32* %src_stride_addr, align 4               ; <i32> [#uses=1]
89         %tmp31 = mul i32 %tmp30, 3              ; <i32> [#uses=1]
90         %tmp32 = load i8*, i8** %src_addr, align 4              ; <i8*> [#uses=1]
91         %tmp33 = getelementptr i8, i8* %tmp32, i32 %tmp31               ; <i8*> [#uses=1]
92         %tmp3334 = bitcast i8* %tmp33 to i32*           ; <i32*> [#uses=1]
93         call void asm sideeffect "movd  $4, %mm0                \0A\09movd  $5, %mm1                \0A\09movd  $6, %mm2                \0A\09movd  $7, %mm3                \0A\09punpcklbw %mm1, %mm0         \0A\09punpcklbw %mm3, %mm2         \0A\09movq %mm0, %mm1              \0A\09punpcklwd %mm2, %mm0         \0A\09punpckhwd %mm2, %mm1         \0A\09movd  %mm0, $0                \0A\09punpckhdq %mm0, %mm0         \0A\09movd  %mm0, $1                \0A\09movd  %mm1, $2                \0A\09punpckhdq %mm1, %mm1         \0A\09movd  %mm1, $3                \0A\09", "=*m,=*m,=*m,=*m,*m,*m,*m,*m,~{dirflag},~{fpsr},~{flags}"( i32* %tmp12, i32* %tmp56, i32* %tmp1011, i32* %tmp1617, i32* %tmp1920, i32* %tmp2324, i32* %tmp2829, i32* %tmp3334 ) nounwind
94         br label %return
96 return:         ; preds = %entry
97         ret void