[X86] X86DAGToDAGISel - attempt to merge XMM/YMM loads with YMM/ZMM loads of the...
[llvm-project.git] / llvm / test / CodeGen / Thumb2 / 2009-09-01-PostRAProlog.ll
blobb03c120d399bc68d9dd2fcf59264ecc625a81380
1 ; RUN: llc -asm-verbose=false -O3 -relocation-model=pic -frame-pointer=all -mtriple=thumbv7-apple-darwin -mcpu=cortex-a8 < %s | FileCheck %s
3 target datalayout = "e-p:32:32:32-i1:8:32-i8:8:32-i16:16:32-i32:32:32-i64:32:32-f32:32:32-f64:32:32-v64:64:64-v128:128:128-a0:0:32"
4 target triple = "thumbv7-apple-darwin9"
6 @history = internal global [2 x [56 x i32]] [[56 x i32] [i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 0, i32 1, i32 2, i32 4, i32 2, i32 1, i32 0, i32 -1, i32 1, i32 3, i32 5, i32 7, i32 5, i32 3, i32 1, i32 -1, i32 2, i32 5, i32 8, i32 10, i32 8, i32 5, i32 2, i32 -1, i32 2, i32 5, i32 8, i32 10, i32 8, i32 5, i32 2, i32 -1, i32 1, i32 3, i32 5, i32 7, i32 5, i32 3, i32 1, i32 -1, i32 0, i32 1, i32 2, i32 4, i32 2, i32 1, i32 0], [56 x i32] [i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 -1, i32 0, i32 1, i32 2, i32 4, i32 2, i32 1, i32 0, i32 -1, i32 1, i32 3, i32 5, i32 7, i32 5, i32 3, i32 1, i32 -1, i32 2, i32 5, i32 8, i32 10, i32 8, i32 5, i32 2, i32 -1, i32 2, i32 5, i32 8, i32 10, i32 8, i32 5, i32 2, i32 -1, i32 1, i32 3, i32 5, i32 7, i32 5, i32 3, i32 1, i32 -1, i32 0, i32 1, i32 2, i32 4, i32 2, i32 1, i32 0]] ; <ptr> [#uses=3]
7 @nodes = internal global i64 0                    ; <ptr> [#uses=4]
8 @.str = private constant [9 x i8] c"##-<=>+#\00", align 1 ; <ptr> [#uses=2]
9 @.str1 = private constant [6 x i8] c"%c%d\0A\00", align 1 ; <ptr> [#uses=1]
10 @.str2 = private constant [16 x i8] c"Fhourstones 2.0\00", align 1 ; <ptr> [#uses=1]
11 @.str3 = private constant [54 x i8] c"Using %d transposition table entries with %d probes.\0A\00", align 1 ; <ptr> [#uses=1]
12 @.str4 = private constant [31 x i8] c"Solving %d-ply position after \00", align 1 ; <ptr> [#uses=1]
13 @.str5 = private constant [7 x i8] c" . . .\00", align 1 ; <ptr> [#uses=1]
14 @.str6 = private constant [28 x i8] c"score = %d (%c)  work = %d\0A\00", align 1 ; <ptr> [#uses=1]
15 @.str7 = private constant [36 x i8] c"%lu pos / %lu msec = %.1f Kpos/sec\0A\00", align 1 ; <ptr> [#uses=1]
16 @plycnt = internal global i32 0                   ; <ptr> [#uses=21]
17 @dias = internal global [19 x i32] zeroinitializer ; <ptr> [#uses=43]
18 @columns = internal global [128 x i32] zeroinitializer ; <ptr> [#uses=18]
19 @height = internal global [128 x i32] zeroinitializer ; <ptr> [#uses=21]
20 @rows = internal global [8 x i32] zeroinitializer ; <ptr> [#uses=20]
21 @colthr = internal global [128 x i32] zeroinitializer ; <ptr> [#uses=5]
22 @moves = internal global [44 x i32] zeroinitializer ; <ptr> [#uses=9]
23 @.str8 = private constant [3 x i8] c"%d\00", align 1 ; <ptr> [#uses=1]
24 @he = internal global ptr null                    ; <ptr> [#uses=9]
25 @hits = internal global i64 0                     ; <ptr> [#uses=8]
26 @posed = internal global i64 0                    ; <ptr> [#uses=7]
27 @ht = internal global ptr null                   ; <ptr> [#uses=5]
28 @.str16 = private constant [19 x i8] c"store rate = %.3f\0A\00", align 1 ; <ptr> [#uses=1]
29 @.str117 = private constant [45 x i8] c"- %5.3f  < %5.3f  = %5.3f  > %5.3f  + %5.3f\0A\00", align 1 ; <ptr> [#uses=1]
30 @.str218 = private constant [6 x i8] c"%7d%c\00", align 1 ; <ptr> [#uses=1]
31 @.str319 = private constant [30 x i8] c"Failed to allocate %u bytes.\0A\00", align 1 ; <ptr> [#uses=1]
33 declare i32 @puts(ptr nocapture) nounwind
35 declare i32 @getchar() nounwind
37 define internal i32 @transpose() nounwind readonly {
38 ; CHECK: push
39 entry:
40   %0 = load i32, ptr getelementptr inbounds ([128 x i32], ptr @columns, i32 0, i32 1), align 4 ; <i32> [#uses=1]
41   %1 = shl i32 %0, 7                              ; <i32> [#uses=1]
42   %2 = load i32, ptr getelementptr inbounds ([128 x i32], ptr @columns, i32 0, i32 2), align 4 ; <i32> [#uses=1]
43   %3 = or i32 %1, %2                              ; <i32> [#uses=1]
44   %4 = shl i32 %3, 7                              ; <i32> [#uses=1]
45   %5 = load i32, ptr getelementptr inbounds ([128 x i32], ptr @columns, i32 0, i32 3), align 4 ; <i32> [#uses=1]
46   %6 = or i32 %4, %5                              ; <i32> [#uses=3]
47   %7 = load i32, ptr getelementptr inbounds ([128 x i32], ptr @columns, i32 0, i32 7), align 4 ; <i32> [#uses=1]
48   %8 = shl i32 %7, 7                              ; <i32> [#uses=1]
49   %9 = load i32, ptr getelementptr inbounds ([128 x i32], ptr @columns, i32 0, i32 6), align 4 ; <i32> [#uses=1]
50   %10 = or i32 %8, %9                             ; <i32> [#uses=1]
51   %11 = shl i32 %10, 7                            ; <i32> [#uses=1]
52   %12 = load i32, ptr getelementptr inbounds ([128 x i32], ptr @columns, i32 0, i32 5), align 4 ; <i32> [#uses=1]
53   %13 = or i32 %11, %12                           ; <i32> [#uses=3]
54   %14 = icmp ugt i32 %6, %13                      ; <i1> [#uses=2]
55   %.pn2.in.i = select i1 %14, i32 %6, i32 %13     ; <i32> [#uses=1]
56   %.pn1.in.i = select i1 %14, i32 %13, i32 %6     ; <i32> [#uses=1]
57   %.pn2.i = shl i32 %.pn2.in.i, 7                 ; <i32> [#uses=1]
58   %.pn3.i = load i32, ptr getelementptr inbounds ([128 x i32], ptr @columns, i32 0, i32 4) ; <i32> [#uses=1]
59   %.pn.in.in.i = or i32 %.pn2.i, %.pn3.i          ; <i32> [#uses=1]
60   %.pn.in.i = zext i32 %.pn.in.in.i to i64        ; <i64> [#uses=1]
61   %.pn.i = shl i64 %.pn.in.i, 21                  ; <i64> [#uses=1]
62   %.pn1.i = zext i32 %.pn1.in.i to i64            ; <i64> [#uses=1]
63   %iftmp.22.0.i = or i64 %.pn.i, %.pn1.i          ; <i64> [#uses=2]
64   %15 = lshr i64 %iftmp.22.0.i, 17                ; <i64> [#uses=1]
65   %16 = trunc i64 %15 to i32                      ; <i32> [#uses=2]
66   %17 = urem i64 %iftmp.22.0.i, 1050011           ; <i64> [#uses=1]
67   %18 = trunc i64 %17 to i32                      ; <i32> [#uses=1]
68   %19 = urem i32 %16, 179                         ; <i32> [#uses=1]
69   %20 = or i32 %19, 131072                        ; <i32> [#uses=1]
70   %21 = load ptr, ptr @ht, align 4                   ; <ptr> [#uses=1]
71   br label %bb5
73 bb:                                               ; preds = %bb5
74   %22 = getelementptr inbounds i32, ptr %21, i32 %x.0 ; <ptr> [#uses=1]
75   %23 = load i32, ptr %22, align 4                    ; <i32> [#uses=1]
76   %24 = icmp eq i32 %23, %16                      ; <i1> [#uses=1]
77   br i1 %24, label %bb1, label %bb2
79 bb1:                                              ; preds = %bb
80   %25 = load ptr, ptr @he, align 4                    ; <ptr> [#uses=1]
81   %26 = getelementptr inbounds i8, ptr %25, i32 %x.0  ; <ptr> [#uses=1]
82   %27 = load i8, ptr %26, align 1                     ; <i8> [#uses=1]
83   %28 = sext i8 %27 to i32                        ; <i32> [#uses=1]
84   ret i32 %28
86 bb2:                                              ; preds = %bb
87   %29 = add nsw i32 %20, %x.0                     ; <i32> [#uses=3]
88   %30 = add i32 %29, -1050011                     ; <i32> [#uses=1]
89   %31 = icmp sgt i32 %29, 1050010                 ; <i1> [#uses=1]
90   %. = select i1 %31, i32 %30, i32 %29            ; <i32> [#uses=1]
91   %32 = add i32 %33, 1                            ; <i32> [#uses=1]
92   br label %bb5
94 bb5:                                              ; preds = %bb2, %entry
95   %33 = phi i32 [ 0, %entry ], [ %32, %bb2 ]      ; <i32> [#uses=2]
96   %x.0 = phi i32 [ %18, %entry ], [ %., %bb2 ]    ; <i32> [#uses=3]
97   %34 = icmp sgt i32 %33, 7                       ; <i1> [#uses=1]
98   br i1 %34, label %bb7, label %bb
100 bb7:                                              ; preds = %bb5
101   ret i32 -128
104 declare noalias ptr @calloc(i32, i32) nounwind