[ARM] More MVE compare vector splat combines for ANDs
[llvm-complete.git] / test / CodeGen / ARM / neon-spfp.ll
blob4eeaa8abfab2311640e3e91014d33a82a8379475
1 ; RUN: llc < %s -mtriple armv7a-none-linux-gnueabihf -mcpu=cortex-a5 | FileCheck %s -check-prefix=CHECK-LINUXA5
2 ; RUN: llc < %s -mtriple armv7a-none-linux-gnueabihf -mcpu=cortex-a8 | FileCheck %s -check-prefix=CHECK-LINUXA8
3 ; RUN: llc < %s -mtriple armv7a-none-linux-gnueabihf -mcpu=cortex-a9 | FileCheck %s -check-prefix=CHECK-LINUXA9
4 ; RUN: llc < %s -mtriple armv7a-none-linux-gnueabihf -mcpu=cortex-a15 | FileCheck %s -check-prefix=CHECK-LINUXA15
5 ; RUN: llc < %s -mtriple armv7a-none-linux-gnueabihf -mcpu=swift | FileCheck %s -check-prefix=CHECK-LINUXSWIFT
7 ; RUN: llc < %s -mtriple armv7a-none-linux-gnueabihf -mcpu=cortex-a5 --enable-unsafe-fp-math | FileCheck %s -check-prefix=CHECK-UNSAFEA5
8 ; RUN: llc < %s -mtriple armv7a-none-linux-gnueabihf -mcpu=cortex-a8 --enable-unsafe-fp-math | FileCheck %s -check-prefix=CHECK-UNSAFEA8
9 ; RUN: llc < %s -mtriple armv7a-none-linux-gnueabihf -mcpu=cortex-a9 --enable-unsafe-fp-math | FileCheck %s -check-prefix=CHECK-UNSAFEA9
10 ; RUN: llc < %s -mtriple armv7a-none-linux-gnueabihf -mcpu=cortex-a15 --enable-unsafe-fp-math | FileCheck %s -check-prefix=CHECK-UNSAFEA15
11 ; RUN: llc < %s -mtriple armv7a-none-linux-gnueabihf -mcpu=swift --enable-unsafe-fp-math | FileCheck %s -check-prefix=CHECK-UNSAFESWIFT
13 ; RUN: llc < %s -mtriple armv7a-none-darwin -mcpu=cortex-a5 | FileCheck %s -check-prefix=CHECK-DARWINA5
14 ; RUN: llc < %s -mtriple armv7a-none-darwin -mcpu=cortex-a8 | FileCheck %s -check-prefix=CHECK-DARWINA8
15 ; RUN: llc < %s -mtriple armv7a-none-darwin -mcpu=cortex-a9 | FileCheck %s -check-prefix=CHECK-DARWINA9
16 ; RUN: llc < %s -mtriple armv7a-none-darwin -mcpu=cortex-a15 | FileCheck %s -check-prefix=CHECK-DARWINA15
17 ; RUN: llc < %s -mtriple armv7a-none-darwin -mcpu=swift | FileCheck %s -check-prefix=CHECK-DARWINSWIFT
19 ; This test makes sure we're not lowering VMUL.f32 D* (aka. NEON) for single-prec. FP ops, since
20 ; NEON is not fully IEEE 754 compliant, unless unsafe-math is selected.
22 @.str = private unnamed_addr constant [12 x i8] c"S317\09%.5g \0A\00", align 1
24 ; CHECK-LINUXA5-LABEL: main:
25 ; CHECK-LINUXA8-LABEL: main:
26 ; CHECK-LINUXA9-LABEL: main:
27 ; CHECK-LINUXA15-LABEL: main:
28 ; CHECK-LINUXSWIFT-LABEL: main:
29 ; CHECK-UNSAFEA5-LABEL: main:
30 ; CHECK-UNSAFEA8-LABEL: main:
31 ; CHECK-UNSAFEA9-LABEL: main:
32 ; CHECK-UNSAFEA15-LABEL: main:
33 ; CHECK-UNSAFESWIFT-LABEL: main:
34 ; CHECK-DARWINA5-LABEL: main:
35 ; CHECK-DARWINA8-LABEL: main:
36 ; CHECK-DARWINA9-LABEL: main:
37 ; CHECK-DARWINA15-LABEL: main:
38 ; CHECK-DARWINSWIFT-LABEL: main:
39 define i32 @main() {
40 entry:
41   br label %for.body
43 for.body:                                         ; preds = %for.body, %entry
44   %i.04 = phi i32 [ 0, %entry ], [ %inc, %for.body ]
45   %q.03 = phi float [ 1.000000e+00, %entry ], [ %mul, %for.body ]
46   %mul = fmul float %q.03, 0x3FEFAE1480000000
47 ; CHECK-LINUXA5: vmul.f32 s{{[0-9]*}}
48 ; CHECK-LINUXA8: vmul.f32 s{{[0-9]*}}
49 ; CHECK-LINUXA9: vmul.f32 s{{[0-9]*}}
50 ; CHECK-LINUXA15: vmul.f32 s{{[0-9]*}}
51 ; Swift is *always* unsafe
52 ; CHECK-LINUXSWIFT: vmul.f32 d{{[0-9]*}}
54 ; CHECK-UNSAFEA5: vmul.f32 d{{[0-9]*}}
55 ; CHECK-UNSAFEA8: vmul.f32 d{{[0-9]*}}
56 ; A9 and A15 don't need this
57 ; CHECK-UNSAFEA9: vmul.f32 s{{[0-9]*}}
58 ; CHECK-UNSAFEA15: vmul.f32 s{{[0-9]*}}
59 ; CHECK-UNSAFESWIFT: vmul.f32 d{{[0-9]*}}
61 ; CHECK-DARWINA5: vmul.f32 d{{[0-9]*}}
62 ; CHECK-DARWINA8: vmul.f32 d{{[0-9]*}}
63 ; CHECK-DARWINA9: vmul.f32 s{{[0-9]*}}
64 ; CHECK-DARWINA15: vmul.f32 s{{[0-9]*}}
65 ; CHECK-DARWINSWIFT: vmul.f32 d{{[0-9]*}}
66   %conv = fpext float %mul to double
67   %call = tail call i32 (i8*, ...) @printf(i8* getelementptr inbounds ([12 x i8], [12 x i8]* @.str, i32 0, i32 0), double %conv) #1
68   %inc = add nsw i32 %i.04, 1
69   %exitcond = icmp eq i32 %inc, 16000
70   br i1 %exitcond, label %for.end, label %for.body
72 for.end:                                          ; preds = %for.body
73   ret i32 0
76 declare i32 @printf(i8* nocapture, ...)