[ARM] Cortex-M4 schedule additions
[llvm-complete.git] / test / CodeGen / ARM / 2011-04-26-SchedTweak.ll
blob3c5579acf6aec266187ef0e508d36500e9eae368
1 ; RUN: llc < %s -mtriple=thumbv7-apple-ios -relocation-model=pic -mcpu=cortex-a8 | FileCheck %s
3 ; Do not move the umull above previous call which would require use of
4 ; more callee-saved registers and introduce copies.
5 ; rdar://9329627
7 %struct.FF = type { i32 (i32*)*, i32 (i32*, i32*, i32, i32, i32, i32)*, i32 (i32, i32, i8*)*, void ()*, i32 (i32, i8*, i32*)*, i32 ()* }
8 %struct.BD = type { %struct.BD*, i32, i32, i32, i32, i64, i32 (%struct.BD*, i8*, i64, i32)*, i32 (%struct.BD*, i8*, i32, i32)*, i32 (%struct.BD*, i8*, i64, i32)*, i32 (%struct.BD*, i8*, i32, i32)*, i32 (%struct.BD*, i64, i32)*, [16 x i8], i64, i64 }
10 @FuncPtr = external hidden unnamed_addr global %struct.FF*
11 @.str1 = external hidden unnamed_addr constant [6 x i8], align 4
12 @G = external unnamed_addr global i32
13 @.str2 = external hidden unnamed_addr constant [58 x i8], align 4
14 @.str3 = external hidden unnamed_addr constant [58 x i8], align 4
16 define i32 @test() nounwind optsize ssp {
17 entry:
18 ; CHECK-LABEL: test:
19 ; CHECK: push
20 ; CHECK-NOT: push
21   %block_size = alloca i32, align 4
22   %block_count = alloca i32, align 4
23   %index_cache = alloca i32, align 4
24   store i32 0, i32* %index_cache, align 4
25   %tmp = load i32, i32* @G, align 4
26   %tmp1 = call i32 @bar(i32 0, i32 0, i32 %tmp) nounwind
27   switch i32 %tmp1, label %bb8 [
28     i32 0, label %bb
29     i32 536870913, label %bb4
30     i32 536870914, label %bb6
31   ]
33 bb:
34   %tmp2 = load i32, i32* @G, align 4
35   %tmp4 = icmp eq i32 %tmp2, 0
36   br i1 %tmp4, label %bb1, label %bb8
38 bb1:
39 ; CHECK: %bb1
40 ; CHECK-NOT: umull
41 ; CHECK: bl _Get
42 ; CHECK: umull
43 ; CHECK: bl _foo
44   %tmp5 = load i32, i32* %block_size, align 4
45   %tmp6 = load i32, i32* %block_count, align 4
46   %tmp7 = call %struct.FF* @Get() nounwind
47   store %struct.FF* %tmp7, %struct.FF** @FuncPtr, align 4
48   %tmp10 = zext i32 %tmp6 to i64
49   %tmp11 = zext i32 %tmp5 to i64
50   %tmp12 = mul nsw i64 %tmp10, %tmp11
51   %tmp13 = call i32 @foo(i8* getelementptr inbounds ([6 x i8], [6 x i8]* @.str1, i32 0, i32 0), i64 %tmp12, i32 %tmp5) nounwind
52   br label %bb8
54 bb4:
55   ret i32 0
57 bb6:
58   ret i32 1
60 bb8:
61   ret i32 -1
64 declare i32 @printf(i8*, ...)
66 declare %struct.FF* @Get()
68 declare i32 @foo(i8*, i64, i32)
70 declare i32 @bar(i32, i32, i32)