[ARM] Cortex-M4 schedule additions
[llvm-complete.git] / test / CodeGen / ARM / select.ll
blobdbec6dd57090c6dbd9087e57ae270c71530dc08b
1 ; RUN: llc -mtriple=arm-apple-darwin %s -o - | FileCheck %s
3 ; RUN: llc -mtriple=arm-eabi -mattr=+vfp2 %s -o - \
4 ; RUN:  | FileCheck %s --check-prefix=CHECK-VFP
6 ; RUN: llc -mtriple=thumbv7-apple-darwin -mattr=+neon,+thumb2 %s -o - \
7 ; RUN:  | FileCheck %s --check-prefix=CHECK-NEON
9 define i32 @f1(i32 %a.s) {
10 ;CHECK-LABEL: f1:
11 ;CHECK: moveq
12 entry:
13     %tmp = icmp eq i32 %a.s, 4
14     %tmp1.s = select i1 %tmp, i32 2, i32 3
15     ret i32 %tmp1.s
18 define i32 @f2(i32 %a.s) {
19 ;CHECK-LABEL: f2:
20 ;CHECK: movgt
21 entry:
22     %tmp = icmp sgt i32 %a.s, 4
23     %tmp1.s = select i1 %tmp, i32 2, i32 3
24     ret i32 %tmp1.s
27 define i32 @f3(i32 %a.s, i32 %b.s) {
28 ;CHECK-LABEL: f3:
29 ;CHECK: movlt
30 entry:
31     %tmp = icmp slt i32 %a.s, %b.s
32     %tmp1.s = select i1 %tmp, i32 2, i32 3
33     ret i32 %tmp1.s
36 define i32 @f4(i32 %a.s, i32 %b.s) {
37 ;CHECK-LABEL: f4:
38 ;CHECK: movle
39 entry:
40     %tmp = icmp sle i32 %a.s, %b.s
41     %tmp1.s = select i1 %tmp, i32 2, i32 3
42     ret i32 %tmp1.s
45 define i32 @f5(i32 %a.u, i32 %b.u) {
46 ;CHECK-LABEL: f5:
47 ;CHECK: movls
48 entry:
49     %tmp = icmp ule i32 %a.u, %b.u
50     %tmp1.s = select i1 %tmp, i32 2, i32 3
51     ret i32 %tmp1.s
54 define i32 @f6(i32 %a.u, i32 %b.u) {
55 ;CHECK-LABEL: f6:
56 ;CHECK: movhi
57 entry:
58     %tmp = icmp ugt i32 %a.u, %b.u
59     %tmp1.s = select i1 %tmp, i32 2, i32 3
60     ret i32 %tmp1.s
63 define double @f7(double %a, double %b) {
64 ;CHECK-LABEL: f7:
65 ;CHECK: movmi
66 ;CHECK: movpl
67 ;CHECK-VFP-LABEL: f7:
68 ;CHECK-VFP: vmovmi
69     %tmp = fcmp olt double %a, 1.234e+00
70     %tmp1 = select i1 %tmp, double -1.000e+00, double %b
71     ret double %tmp1
74 ; <rdar://problem/7260094>
76 ; We used to generate really horrible code for this function. The main cause was
77 ; a lack of a custom lowering routine for an ISD::SELECT. This would result in
78 ; two "it" blocks in the code: one for the "icmp" and another to move the index
79 ; into the constant pool based on the value of the "icmp". If we have one "it"
80 ; block generated, odds are good that we have close to the ideal code for this:
82 ; CHECK-NEON-LABEL: f8:
83 ; CHECK-NEON:      adr     [[R2:r[0-9]+]], LCPI7_0
84 ; CHECK-NEON:      movw    [[R3:r[0-9]+]], #1123
85 ; CHECK-NEON-NEXT: cmp     r0, [[R3]]
86 ; CHECK-NEON-NEXT: it      eq
87 ; CHECK-NEON-NEXT: addeq{{.*}} [[R2]], #4
88 ; CHECK-NEON-NEXT: ldr
89 ; CHECK-NEON:      bx
91 define arm_apcscc float @f8(i32 %a) nounwind {
92   %tmp = icmp eq i32 %a, 1123
93   %tmp1 = select i1 %tmp, float 0x3FF3BE76C0000000, float 0x40030E9A20000000
94   ret float %tmp1
97 ; <rdar://problem/9049552>
98 ; Glue values can only have a single use, but the following test exposed a
99 ; case where a SELECT was lowered with 2 uses of a comparison, causing the
100 ; scheduler to assert.
101 ; CHECK-VFP-LABEL: f9:
103 declare i8* @objc_msgSend(i8*, i8*, ...)
104 define void @f9() optsize {
105 entry:
106   %cmp = icmp eq i8* undef, inttoptr (i32 4 to i8*)
107   %conv191 = select i1 %cmp, float -3.000000e+00, float 0.000000e+00
108   %conv195 = select i1 %cmp, double -1.000000e+00, double 0.000000e+00
109   %add = fadd double %conv195, 1.100000e+01
110   %conv196 = fptrunc double %add to float
111   %add201 = fadd float undef, %conv191
112   %tmp484 = bitcast float %conv196 to i32
113   %tmp478 = bitcast float %add201 to i32
114   %tmp490 = insertvalue [2 x i32] undef, i32 %tmp484, 0
115   %tmp493 = insertvalue [2 x i32] %tmp490, i32 %tmp478, 1
116   call void bitcast (i8* (i8*, i8*, ...)* @objc_msgSend to void (i8*, i8*, [2 x i32], i32, float)*)(i8* undef, i8* undef, [2 x i32] %tmp493, i32 0, float 1.000000e+00) optsize
117   ret void
120 ; CHECK-LABEL: f10:
121 define float @f10(i32 %a, i32 %b) nounwind uwtable readnone ssp {
122 ; CHECK-NOT: floatsisf
123   %1 = icmp eq i32 %a, %b
124   %2 = zext i1 %1 to i32
125   %3 = sitofp i32 %2 to float
126   ret float %3
129 ; CHECK-LABEL: f11:
130 define float @f11(i32 %a, i32 %b) nounwind uwtable readnone ssp {
131 ; CHECK-NOT: floatsisf
132   %1 = icmp eq i32 %a, %b
133   %2 = sitofp i1 %1 to float
134   ret float %2
137 ; CHECK-LABEL: f12:
138 define float @f12(i32 %a, i32 %b) nounwind uwtable readnone ssp {
139 ; CHECK-NOT: floatunsisf
140   %1 = icmp eq i32 %a, %b
141   %2 = uitofp i1 %1 to float
142   ret float %2
145 ; CHECK-LABEL: test_overflow_recombine:
146 define i1 @test_overflow_recombine(i32 %in1, i32 %in2) {
147 ; CHECK: smull [[LO:r[0-9]+]], [[HI:r[0-9]+]]
148 ; CHECK: subs [[ZERO:r[0-9]+]], [[HI]], [[LO]], asr #31
149 ; CHECK: movne [[ZERO]], #1
150   %prod = call { i32, i1 } @llvm.smul.with.overflow.i32(i32 %in1, i32 %in2)
151   %overflow = extractvalue { i32, i1 } %prod, 1
152   ret i1 %overflow
155 declare { i32, i1 } @llvm.smul.with.overflow.i32(i32, i32)