[llvm-objdump] - Remove one overload of reportError. NFCI.
[llvm-complete.git] / test / CodeGen / X86 / bypass-slow-division-tune.ll
bloba387d6873f3ab348fdeb232dc91dc93f7e1d93dc
1 ; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
2 ; Check that a division is bypassed when appropriate only.
3 ; RUN: llc -mtriple=x86_64-unknown-linux-gnu -mcpu=atom       < %s | FileCheck -check-prefixes=CHECK,ATOM %s
4 ; RUN: llc -mtriple=x86_64-unknown-linux-gnu -mcpu=silvermont < %s | FileCheck -check-prefixes=CHECK,REST,SLM %s
5 ; RUN: llc -mtriple=x86_64-unknown-linux-gnu -mcpu=skylake    < %s | FileCheck -check-prefixes=CHECK,REST,SKL %s
6 ; RUN: llc -profile-summary-huge-working-set-size-threshold=1 -mtriple=x86_64-unknown-linux-gnu -mcpu=skylake    < %s | FileCheck -check-prefixes=HUGEWS %s
8 ; Verify that div32 is bypassed only for Atoms.
9 define i32 @div32(i32 %a, i32 %b) {
10 ; ATOM-LABEL: div32:
11 ; ATOM:       # %bb.0: # %entry
12 ; ATOM-NEXT:    movl %edi, %eax
13 ; ATOM-NEXT:    orl %esi, %eax
14 ; ATOM-NEXT:    testl $-256, %eax
15 ; ATOM-NEXT:    je .LBB0_1
16 ; ATOM-NEXT:  # %bb.2:
17 ; ATOM-NEXT:    movl %edi, %eax
18 ; ATOM-NEXT:    cltd
19 ; ATOM-NEXT:    idivl %esi
20 ; ATOM-NEXT:    retq
21 ; ATOM-NEXT:  .LBB0_1:
22 ; ATOM-NEXT:    movzbl %dil, %eax
23 ; ATOM-NEXT:    # kill: def $eax killed $eax def $ax
24 ; ATOM-NEXT:    divb %sil
25 ; ATOM-NEXT:    movzbl %al, %eax
26 ; ATOM-NEXT:    retq
28 ; REST-LABEL: div32:
29 ; REST:       # %bb.0: # %entry
30 ; REST-NEXT:    movl %edi, %eax
31 ; REST-NEXT:    cltd
32 ; REST-NEXT:    idivl %esi
33 ; REST-NEXT:    retq
35 ; HUGEWS-LABEL: div32:
36 ; HUGEWS:       # %bb.0: # %entry
37 ; HUGEWS-NEXT:    movl %edi, %eax
38 ; HUGEWS-NEXT:    cltd
39 ; HUGEWS-NEXT:    idivl %esi
40 ; HUGEWS-NEXT:    retq
41 entry:
42   %div = sdiv i32 %a, %b
43   ret i32 %div
46 ; Verify that div64 is always bypassed.
47 define i64 @div64(i64 %a, i64 %b) {
48 ; ATOM-LABEL: div64:
49 ; ATOM:       # %bb.0: # %entry
50 ; ATOM-NEXT:    movq %rdi, %rcx
51 ; ATOM-NEXT:    movq %rdi, %rax
52 ; ATOM-NEXT:    orq %rsi, %rcx
53 ; ATOM-NEXT:    shrq $32, %rcx
54 ; ATOM-NEXT:    je .LBB1_1
55 ; ATOM-NEXT:  # %bb.2:
56 ; ATOM-NEXT:    cqto
57 ; ATOM-NEXT:    idivq %rsi
58 ; ATOM-NEXT:    retq
59 ; ATOM-NEXT:  .LBB1_1:
60 ; ATOM-NEXT:    # kill: def $eax killed $eax killed $rax
61 ; ATOM-NEXT:    xorl %edx, %edx
62 ; ATOM-NEXT:    divl %esi
63 ; ATOM-NEXT:    # kill: def $eax killed $eax def $rax
64 ; ATOM-NEXT:    retq
66 ; SLM-LABEL: div64:
67 ; SLM:       # %bb.0: # %entry
68 ; SLM-NEXT:    movq %rdi, %rcx
69 ; SLM-NEXT:    movq %rdi, %rax
70 ; SLM-NEXT:    orq %rsi, %rcx
71 ; SLM-NEXT:    shrq $32, %rcx
72 ; SLM-NEXT:    je .LBB1_1
73 ; SLM-NEXT:  # %bb.2:
74 ; SLM-NEXT:    cqto
75 ; SLM-NEXT:    idivq %rsi
76 ; SLM-NEXT:    retq
77 ; SLM-NEXT:  .LBB1_1:
78 ; SLM-NEXT:    xorl %edx, %edx
79 ; SLM-NEXT:    # kill: def $eax killed $eax killed $rax
80 ; SLM-NEXT:    divl %esi
81 ; SLM-NEXT:    # kill: def $eax killed $eax def $rax
82 ; SLM-NEXT:    retq
84 ; SKL-LABEL: div64:
85 ; SKL:       # %bb.0: # %entry
86 ; SKL-NEXT:    movq %rdi, %rax
87 ; SKL-NEXT:    movq %rdi, %rcx
88 ; SKL-NEXT:    orq %rsi, %rcx
89 ; SKL-NEXT:    shrq $32, %rcx
90 ; SKL-NEXT:    je .LBB1_1
91 ; SKL-NEXT:  # %bb.2:
92 ; SKL-NEXT:    cqto
93 ; SKL-NEXT:    idivq %rsi
94 ; SKL-NEXT:    retq
95 ; SKL-NEXT:  .LBB1_1:
96 ; SKL-NEXT:    # kill: def $eax killed $eax killed $rax
97 ; SKL-NEXT:    xorl %edx, %edx
98 ; SKL-NEXT:    divl %esi
99 ; SKL-NEXT:    # kill: def $eax killed $eax def $rax
100 ; SKL-NEXT:    retq
102 ; HUGEWS-LABEL: div64:
103 ; HUGEWS:       # %bb.0: # %entry
104 ; HUGEWS-NEXT:    movq %rdi, %rax
105 ; HUGEWS-NEXT:    cqto
106 ; HUGEWS-NEXT:    idivq %rsi
107 ; HUGEWS-NEXT:    retq
108 entry:
109   %div = sdiv i64 %a, %b
110   ret i64 %div
114 ; Verify that no extra code is generated when optimizing for size.
116 define i64 @div64_optsize(i64 %a, i64 %b) optsize {
117 ; CHECK-LABEL: div64_optsize:
118 ; CHECK:       # %bb.0:
119 ; CHECK-NEXT:    movq %rdi, %rax
120 ; CHECK-NEXT:    cqto
121 ; CHECK-NEXT:    idivq %rsi
122 ; CHECK-NEXT:    retq
124 ; HUGEWS-LABEL: div64_optsize:
125 ; HUGEWS:       # %bb.0:
126 ; HUGEWS-NEXT:    movq %rdi, %rax
127 ; HUGEWS-NEXT:    cqto
128 ; HUGEWS-NEXT:    idivq %rsi
129 ; HUGEWS-NEXT:    retq
130   %div = sdiv i64 %a, %b
131   ret i64 %div
134 define i64 @div64_hugews(i64 %a, i64 %b) {
135 ; ATOM-LABEL: div64_hugews:
136 ; ATOM:       # %bb.0:
137 ; ATOM-NEXT:    movq %rdi, %rcx
138 ; ATOM-NEXT:    movq %rdi, %rax
139 ; ATOM-NEXT:    orq %rsi, %rcx
140 ; ATOM-NEXT:    shrq $32, %rcx
141 ; ATOM-NEXT:    je .LBB3_1
142 ; ATOM-NEXT:  # %bb.2:
143 ; ATOM-NEXT:    cqto
144 ; ATOM-NEXT:    idivq %rsi
145 ; ATOM-NEXT:    retq
146 ; ATOM-NEXT:  .LBB3_1:
147 ; ATOM-NEXT:    # kill: def $eax killed $eax killed $rax
148 ; ATOM-NEXT:    xorl %edx, %edx
149 ; ATOM-NEXT:    divl %esi
150 ; ATOM-NEXT:    # kill: def $eax killed $eax def $rax
151 ; ATOM-NEXT:    retq
153 ; SLM-LABEL: div64_hugews:
154 ; SLM:       # %bb.0:
155 ; SLM-NEXT:    movq %rdi, %rcx
156 ; SLM-NEXT:    movq %rdi, %rax
157 ; SLM-NEXT:    orq %rsi, %rcx
158 ; SLM-NEXT:    shrq $32, %rcx
159 ; SLM-NEXT:    je .LBB3_1
160 ; SLM-NEXT:  # %bb.2:
161 ; SLM-NEXT:    cqto
162 ; SLM-NEXT:    idivq %rsi
163 ; SLM-NEXT:    retq
164 ; SLM-NEXT:  .LBB3_1:
165 ; SLM-NEXT:    xorl %edx, %edx
166 ; SLM-NEXT:    # kill: def $eax killed $eax killed $rax
167 ; SLM-NEXT:    divl %esi
168 ; SLM-NEXT:    # kill: def $eax killed $eax def $rax
169 ; SLM-NEXT:    retq
171 ; SKL-LABEL: div64_hugews:
172 ; SKL:       # %bb.0:
173 ; SKL-NEXT:    movq %rdi, %rax
174 ; SKL-NEXT:    movq %rdi, %rcx
175 ; SKL-NEXT:    orq %rsi, %rcx
176 ; SKL-NEXT:    shrq $32, %rcx
177 ; SKL-NEXT:    je .LBB3_1
178 ; SKL-NEXT:  # %bb.2:
179 ; SKL-NEXT:    cqto
180 ; SKL-NEXT:    idivq %rsi
181 ; SKL-NEXT:    retq
182 ; SKL-NEXT:  .LBB3_1:
183 ; SKL-NEXT:    # kill: def $eax killed $eax killed $rax
184 ; SKL-NEXT:    xorl %edx, %edx
185 ; SKL-NEXT:    divl %esi
186 ; SKL-NEXT:    # kill: def $eax killed $eax def $rax
187 ; SKL-NEXT:    retq
189 ; HUGEWS-LABEL: div64_hugews:
190 ; HUGEWS:       # %bb.0:
191 ; HUGEWS-NEXT:    movq %rdi, %rax
192 ; HUGEWS-NEXT:    cqto
193 ; HUGEWS-NEXT:    idivq %rsi
194 ; HUGEWS-NEXT:    retq
195   %div = sdiv i64 %a, %b
196   ret i64 %div
199 define i32 @div32_optsize(i32 %a, i32 %b) optsize {
200 ; CHECK-LABEL: div32_optsize:
201 ; CHECK:       # %bb.0:
202 ; CHECK-NEXT:    movl %edi, %eax
203 ; CHECK-NEXT:    cltd
204 ; CHECK-NEXT:    idivl %esi
205 ; CHECK-NEXT:    retq
207 ; HUGEWS-LABEL: div32_optsize:
208 ; HUGEWS:       # %bb.0:
209 ; HUGEWS-NEXT:    movl %edi, %eax
210 ; HUGEWS-NEXT:    cltd
211 ; HUGEWS-NEXT:    idivl %esi
212 ; HUGEWS-NEXT:    retq
213   %div = sdiv i32 %a, %b
214   ret i32 %div
217 define i32 @div32_minsize(i32 %a, i32 %b) minsize {
218 ; CHECK-LABEL: div32_minsize:
219 ; CHECK:       # %bb.0:
220 ; CHECK-NEXT:    movl %edi, %eax
221 ; CHECK-NEXT:    cltd
222 ; CHECK-NEXT:    idivl %esi
223 ; CHECK-NEXT:    retq
225 ; HUGEWS-LABEL: div32_minsize:
226 ; HUGEWS:       # %bb.0:
227 ; HUGEWS-NEXT:    movl %edi, %eax
228 ; HUGEWS-NEXT:    cltd
229 ; HUGEWS-NEXT:    idivl %esi
230 ; HUGEWS-NEXT:    retq
231   %div = sdiv i32 %a, %b
232   ret i32 %div
235 !llvm.module.flags = !{!1}
236 !1 = !{i32 1, !"ProfileSummary", !2}
237 !2 = !{!3, !4, !5, !6, !7, !8, !9, !10}
238 !3 = !{!"ProfileFormat", !"InstrProf"}
239 !4 = !{!"TotalCount", i64 10000}
240 !5 = !{!"MaxCount", i64 1000}
241 !6 = !{!"MaxInternalCount", i64 1}
242 !7 = !{!"MaxFunctionCount", i64 1000}
243 !8 = !{!"NumCounts", i64 3}
244 !9 = !{!"NumFunctions", i64 3}
245 !10 = !{!"DetailedSummary", !11}
246 !11 = !{!12, !13, !14}
247 !12 = !{i32 10000, i64 1000, i32 1}
248 !13 = !{i32 999000, i64 1000, i32 3}
249 !14 = !{i32 999999, i64 5, i32 3}