Run DCE after a LoopFlatten test to reduce spurious output [nfc]
[llvm-project.git] / llvm / test / CodeGen / ARM / fp16-no-condition.ll
blobedfa61f773f9d3fbc0136cdf0a499fcf50f19c83
1 ; RUN: llc -O3 -mtriple=armv8a-none-eabi -mattr=+fullfp16 -arm-restrict-it -o - %s | FileCheck %s
2 ; RUN: llc -O3 -mtriple=thumbv8a-none-eabi -mattr=+fullfp16 -o - %s | FileCheck %s
4 ; Require the vmul.f16 not to be predicated, because it's illegal to
5 ; do so with fp16 instructions
6 define half @conditional_fmul_f16(ptr %p) {
7 ; CHECK-LABEL: conditional_fmul_f16:
8 ; CHECK: vmul.f16
9 entry:
10   %p1 = getelementptr half, ptr %p, i32 1
11   %a = load half, ptr %p, align 2
12   %threshold = load half, ptr %p1, align 2
13   %flag = fcmp ogt half %a, %threshold
14   br i1 %flag, label %mul, label %out
16 mul:
17   %p2 = getelementptr half, ptr %p, i32 2
18   %mult = load half, ptr %p2, align 2
19   %b = fmul half %a, %mult
20   br label %out
22 out:
23   %sel = phi half [ %a, %entry ], [ %b, %mul ]
24   ret half %sel
27 ; Expect that the corresponding vmul.f32 _will_ be predicated (to make
28 ; sure the previous test is really testing something)
29 define float @conditional_fmul_f32(ptr %p) {
30 ; CHECK-LABEL: conditional_fmul_f32:
31 ; CHECK: vmulgt.f32
32 entry:
33   %p1 = getelementptr float, ptr %p, i32 1
34   %a = load float, ptr %p, align 2
35   %threshold = load float, ptr %p1, align 2
36   %flag = fcmp ogt float %a, %threshold
37   br i1 %flag, label %mul, label %out
39 mul:
40   %p2 = getelementptr float, ptr %p, i32 2
41   %mult = load float, ptr %p2, align 2
42   %b = fmul float %a, %mult
43   br label %out
45 out:
46   %sel = phi float [ %a, %entry ], [ %b, %mul ]
47   ret float %sel
50 ; Require the two comparisons to be done with unpredicated vcmp.f16
51 ; instructions (again, it is illegal to predicate them)
52 define void @chained_comparisons_f16(ptr %p) {
53 ; CHECK-LABEL: chained_comparisons_f16:
54 ; CHECK: vcmp.f16
55 ; CHECK: vcmp.f16
56 entry:
57   %p1 = getelementptr half, ptr %p, i32 1
59   %a = load half, ptr %p, align 2
60   %b = load half, ptr %p1, align 2
62   %aflag = fcmp oeq half %a, 0xH0000
63   %bflag = fcmp oeq half %b, 0xH0000
64   %flag = or i1 %aflag, %bflag
65   br i1 %flag, label %call, label %out
67 call:
68   call void @external_function()
69   br label %out
71 out:
72   ret void
75 ; Again, do the corresponding test with 32-bit floats and check that
76 ; the second comparison _is_ predicated on the result of the first.
77 define void @chained_comparisons_f32(ptr %p) {
78 ; CHECK-LABEL: chained_comparisons_f32:
79 ; CHECK: vcmp.f32
80 ; CHECK: vcmpne.f32
81 entry:
82   %p1 = getelementptr float, ptr %p, i32 1
84   %a = load float, ptr %p, align 2
85   %b = load float, ptr %p1, align 2
87   %aflag = fcmp oeq float %a, 0x00000000
88   %bflag = fcmp oeq float %b, 0x00000000
89   %flag = or i1 %aflag, %bflag
90   br i1 %flag, label %call, label %out
92 call:
93   call void @external_function()
94   br label %out
96 out:
97   ret void
100 declare void @external_function()