Run DCE after a LoopFlatten test to reduce spurious output [nfc]
[llvm-project.git] / llvm / test / CodeGen / AArch64 / convert-highly-predictable-select-to-branch.ll
blob156ec400d5e7f1a1d9a12f4339d8ccdcb8aa4712
1 ; NOTE: Assertions have been autogenerated by utils/update_test_checks.py
2 ; RUN: opt -select-optimize -mtriple=aarch64-linux-gnu -mcpu=generic -S < %s | FileCheck %s --check-prefix=CHECK-GENERIC
3 ; RUN: opt -select-optimize -mtriple=aarch64-linux-gnu -mcpu=neoverse-n1 -S < %s | FileCheck %s
4 ; RUN: opt -select-optimize -mtriple=aarch64-linux-gnu -mcpu=neoverse-v2 -S < %s | FileCheck %s
5 ; RUN: opt -select-optimize -mtriple=aarch64-linux-gnu -mcpu=cortex-a72 -S < %s | FileCheck %s
7 ; Test has not predictable select, which should not be transformed to a branch
8 define i32 @test1(i32 %a) {
9 ; CHECK-GENERIC-LABEL: @test1(
10 ; CHECK-GENERIC-NEXT:  entry:
11 ; CHECK-GENERIC-NEXT:    [[CMP:%.*]] = icmp slt i32 [[A:%.*]], 1
12 ; CHECK-GENERIC-NEXT:    [[DEC:%.*]] = sub i32 [[A]], 1
13 ; CHECK-GENERIC-NEXT:    [[RES:%.*]] = select i1 [[CMP]], i32 0, i32 [[DEC]], !prof [[PROF0:![0-9]+]]
14 ; CHECK-GENERIC-NEXT:    ret i32 [[RES]]
16 ; CHECK-LABEL: @test1(
17 ; CHECK-NEXT:  entry:
18 ; CHECK-NEXT:    [[CMP:%.*]] = icmp slt i32 [[A:%.*]], 1
19 ; CHECK-NEXT:    [[DEC:%.*]] = sub i32 [[A]], 1
20 ; CHECK-NEXT:    [[RES:%.*]] = select i1 [[CMP]], i32 0, i32 [[DEC]], !prof [[PROF0:![0-9]+]]
21 ; CHECK-NEXT:    ret i32 [[RES]]
23 entry:
24   %cmp = icmp slt i32 %a, 1
25   %dec = sub i32 %a, 1
26   %res = select i1 %cmp, i32 0, i32 %dec, !prof !0
27   ret i32 %res
30 ; Test has highly predictable select according to profile data,
31 ; which should be transformed to a branch on cores with enabled FeaturePredictableSelectIsExpensive
32 define i32 @test2(i32 %a) {
33 ; CHECK-GENERIC-LABEL: @test2(
34 ; CHECK-GENERIC-NEXT:  entry:
35 ; CHECK-GENERIC-NEXT:    [[CMP:%.*]] = icmp slt i32 [[A:%.*]], 1
36 ; CHECK-GENERIC-NEXT:    [[DEC:%.*]] = sub i32 [[A]], 1
37 ; CHECK-GENERIC-NEXT:    [[RES:%.*]] = select i1 [[CMP]], i32 0, i32 [[DEC]], !prof [[PROF1:![0-9]+]]
38 ; CHECK-GENERIC-NEXT:    ret i32 [[RES]]
40 ; CHECK-LABEL: @test2(
41 ; CHECK-NEXT:  entry:
42 ; CHECK-NEXT:    [[CMP:%.*]] = icmp slt i32 [[A:%.*]], 1
43 ; CHECK-NEXT:    [[RES_FROZEN:%.*]] = freeze i1 [[CMP]]
44 ; CHECK-NEXT:    br i1 [[RES_FROZEN]], label [[SELECT_END:%.*]], label [[SELECT_FALSE_SINK:%.*]], !prof [[PROF1:![0-9]+]]
45 ; CHECK:       select.false.sink:
46 ; CHECK-NEXT:    [[DEC:%.*]] = sub i32 [[A]], 1
47 ; CHECK-NEXT:    br label [[SELECT_END]]
48 ; CHECK:       select.end:
49 ; CHECK-NEXT:    [[RES:%.*]] = phi i32 [ 0, [[ENTRY:%.*]] ], [ [[DEC]], [[SELECT_FALSE_SINK]] ]
50 ; CHECK-NEXT:    ret i32 [[RES]]
52 entry:
53   %cmp = icmp slt i32 %a, 1
54   %dec = sub i32 %a, 1
55   %res = select i1 %cmp, i32 0, i32 %dec, !prof !1
56   ret i32 %res
59 !0 = !{!"branch_weights", i32 1, i32 1}
60 !1 = !{!"branch_weights", i32 1, i32 1000}