Run DCE after a LoopFlatten test to reduce spurious output [nfc]
[llvm-project.git] / bolt / test / X86 / jump-table-icp.test
blob34339dc327fae52b88bf09602ab32a2dba249af5
1 RUN: llvm-mc -filetype=obj -triple x86_64-unknown-unknown \
2 RUN:   %p/Inputs/jump_table_icp.s -o %t.o
3 RUN: link_fdata %p/Inputs/jump_table_icp.s %t.o %t.fdata --nmtool llvm-nm
4 RUN: llvm-strip --strip-unneeded %t.o
5 RUN: %clang %cflags -no-pie %t.o -o %t.exe -Wl,-q
7 # This test has commands that rely on shell capabilities that won't execute
8 # correctly on Windows e.g. subshell execution
9 REQUIRES: shell
11 RUN: (llvm-bolt %t.exe --data %t.fdata -o %t --relocs \
12 RUN:   --reorder-blocks=cache --split-functions --split-all-cold \
13 RUN:   --use-gnu-stack --dyno-stats --indirect-call-promotion=jump-tables \
14 RUN:   --print-icp -v=0 \
15 RUN:   --enable-bat --print-cache-metrics \
16 RUN:   --icp-jt-remaining-percent-threshold=10 \
17 RUN:   --icp-jt-total-percent-threshold=2 \
18 RUN:   --indirect-call-promotion-topn=1 \
19 RUN:   --icp-jump-tables-targets --align-functions-max-bytes=7 2>&1 && \
20 RUN:   llvm-objdump -d %t --print-imm-hex) | FileCheck %s
22 BOLT-INFO: ICP total indirect callsites = 0
23 BOLT-INFO: ICP total jump table callsites = 2
24 BOLT-INFO: ICP total number of calls = 2137
25 BOLT-INFO: ICP percentage of calls that are indirect = 0.0%
26 BOLT-INFO: ICP percentage of indirect calls that can be optimized = 0.0%
27 BOLT-INFO: ICP percentage of indirect calls that are optimized = 0.0%
28 BOLT-INFO: ICP percentage of jump table calls that can be optimized = 17.7%
29 BOLT-INFO: ICP percentage of jump table calls that are optimized = 100.0%
31 CHECK: Binary Function "_Z3inci" after indirect-call-promotion
32 CHECK: .LBB{{.*}} (8 instructions, align : 1)
33 CHECK-NEXT:   Entry Point
34 CHECK-NEXT:   Exec Count : 1073
35 CHECK:   Successors: .Ltmp{{.*}} (mispreds: 189, count: 189), .LFT{{.*}} (mispreds: 0, count: 881)
37 CHECK: .LFT{{.*}} (4 instructions, align : 1)
38 CHECK-NEXT:   Exec Count : 881
39 CHECK:   Predecessors: .LBB{{.*}}
40 CHECK:   Successors: .Ltmp{{.*}} (mispreds: 138, count: 155), .Ltmp{{.*}} (mispreds: 0, count: 726)
42 CHECK: .Ltmp{{.*}} (1 instructions, align : 1)
43 CHECK-NEXT:   Exec Count : 726
44 CHECK:   Predecessors: .LFT{{.*}}
45 CHECK:   Successors: .L{{.*}} (mispreds: 126, count: 157), .L{{.*}} (mispreds: 140, count: 156), .L{{.*}} (mispreds: 134, count: 152), .L{{.*}} (mispreds: 137, count: 150), .L{{.*}} (mispreds: 129, count: 148), .L{{.*}} (mispreds: 0, count: 0)
47 CHECK: .Ltmp{{.*}} (5 instructions, align : 1)
48 CHECK-NEXT:  Exec Count : 167
49 CHECK:  Predecessors: .Ltmp{{.*}}, .LFT{{.*}}
51 CHECK: .Ltmp{{.*}} (5 instructions, align : 1)
52 CHECK-NEXT:  Exec Count : 156
53 CHECK:  Predecessors: .Ltmp{{.*}}
55 CHECK: .Ltmp{{.*}} (5 instructions, align : 1)
56 CHECK-NEXT:  Exec Count : 157
57 CHECK:  Predecessors: .Ltmp{{.*}}
59 CHECK: .Ltmp{{.*}} (5 instructions, align : 1)
60 CHECK-NEXT:  Exec Count : 148
61 CHECK:  Predecessors: .Ltmp{{.*}}
63 CHECK: .Ltmp{{.*}} (5 instructions, align : 1)
64 CHECK-NEXT:  Exec Count : 150
65 CHECK:  Predecessors: .Ltmp{{.*}}
67 CHECK: Binary Function "_Z7inc_dupi" after indirect-call-promotion
68 CHECK: .LBB{{.*}} (8 instructions, align : 1)
69 CHECK-NEXT:   Entry Point
70 CHECK-NEXT:   Exec Count : 1064
71 CHECK:   Successors: .Ltmp{{.*}} (mispreds: 143, count: 144), .LFT{{.*}} (mispreds: 0, count: 777)
73 CHECK: .LFT{{.*}} (4 instructions, align : 1)
74 CHECK-NEXT:   Exec Count : 777
75 CHECK:   Predecessors: .LBB{{.*}}
76 CHECK:   Successors: .Ltmp{{.*}} (mispreds: 120, count: 138), .Ltmp{{.*}} (mispreds: 0, count: 639)
78 CHECK: .Ltmp{{.*}} (1 instructions, align : 1)
79 CHECK-NEXT:   Exec Count : 639
80 CHECK:   Predecessors: .LFT{{.*}}
81 CHECK:   Successors: .L{{.*}} (mispreds: 130, count: 137), .L{{.*}} (mispreds: 126, count: 136), .L{{.*}} (mispreds: 122, count: 130), .L{{.*}} (mispreds: 111, count: 130), .L{{.*}} (mispreds: 104, count: 114), .L{{.*}} (mispreds: 0, count: 0)
83 CHECK: .Ltmp{{.*}} (5 instructions, align : 1)
84 CHECK-NEXT:   Exec Count : 137
85 CHECK:   Predecessors: .Ltmp{{.*}}
86 CHECK:   Successors: .Ltmp{{.*}} (mispreds: 0, count: 106)
88 CHECK: .Ltmp{{.*}} (5 instructions, align : 1)
89 CHECK-NEXT:   Exec Count : 136
90 CHECK:   Predecessors: .Ltmp{{.*}}
91 CHECK:   Successors: .Ltmp{{.*}} (mispreds: 0, count: 113)
93 CHECK: .Ltmp{{.*}} (5 instructions, align : 1)
94 CHECK-NEXT:   Exec Count : 130
95 CHECK:   Predecessors: .Ltmp{{.*}}
96 CHECK:   Successors: .Ltmp{{.*}} (mispreds: 0, count: 97)
98 CHECK: .Ltmp{{.*}} (5 instructions, align : 1)
99 CHECK-NEXT:   Exec Count : 130
100 CHECK:   Predecessors: .Ltmp{{.*}}
101 CHECK:   Successors: .Ltmp{{.*}} (mispreds: 0, count: 105)
103 CHECK: .Ltmp{{.*}} (5 instructions, align : 1)
104 CHECK-NEXT:   Exec Count : 140
105 CHECK:   Predecessors: .Ltmp{{.*}}, .LFT{{.*}}
106 CHECK:   Successors: .Ltmp{{.*}} (mispreds: 0, count: 98)
108 CHECK:     <_Z3inci>:
109 CHECK:          movq    0x{{.*}}(,%rax,8), %rax
110 CHECK-NEXT:    cmpq    $0x{{.*}}, %rax
111 CHECK-NEXT:    je {{.*}} <_Z3inci+0x{{.*}}>
112 CHECK-NEXT:     jmpq   *%rax
114 CHECK:     <_Z7inc_dupi>:
115 CHECK:          movq    0x{{.*}}(,%rax,8), %rax
116 CHECK-NEXT:    cmpq $0x{{.*}}, %rax
117 CHECK-NEXT:    je {{.*}} <_Z7inc_dupi+0x{{.*}}>
118 CHECK-NEXT:     jmpq   *%rax