Run DCE after a LoopFlatten test to reduce spurious output [nfc]
[llvm-project.git] / llvm / test / CodeGen / X86 / divide-by-constant.ll
blobba150e7ea405e797b26c397a02afc4efaf7a184a
1 ; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
2 ; RUN: llc < %s -mtriple=i686-pc-linux-gnu | FileCheck %s --check-prefix=X32
3 ; RUN: llc < %s -mtriple=x86_64-pc-linux-gnu | FileCheck %s --check-prefix=X64 --check-prefix=X64-FAST
4 ; RUN: llc < %s -mtriple=x86_64-pc-linux-gnu -mattr=idivq-to-divl | FileCheck %s --check-prefix=X64 --check-prefix=X64-SLOW
6 define zeroext i16 @test1(i16 zeroext %x) nounwind {
7 ; X32-LABEL: test1:
8 ; X32:       # %bb.0: # %entry
9 ; X32-NEXT:    movzwl {{[0-9]+}}(%esp), %eax
10 ; X32-NEXT:    imull $63551, %eax, %eax # imm = 0xF83F
11 ; X32-NEXT:    shrl $21, %eax
12 ; X32-NEXT:    # kill: def $ax killed $ax killed $eax
13 ; X32-NEXT:    retl
15 ; X64-LABEL: test1:
16 ; X64:       # %bb.0: # %entry
17 ; X64-NEXT:    imull $63551, %edi, %eax # imm = 0xF83F
18 ; X64-NEXT:    shrl $21, %eax
19 ; X64-NEXT:    # kill: def $ax killed $ax killed $eax
20 ; X64-NEXT:    retq
21 entry:
22         %div = udiv i16 %x, 33
23         ret i16 %div
26 define zeroext i16 @test2(i8 signext %x, i16 zeroext %c) nounwind readnone ssp noredzone {
27 ; X32-LABEL: test2:
28 ; X32:       # %bb.0: # %entry
29 ; X32-NEXT:    movzwl {{[0-9]+}}(%esp), %eax
30 ; X32-NEXT:    imull $43691, %eax, %eax # imm = 0xAAAB
31 ; X32-NEXT:    shrl $17, %eax
32 ; X32-NEXT:    # kill: def $ax killed $ax killed $eax
33 ; X32-NEXT:    retl
35 ; X64-LABEL: test2:
36 ; X64:       # %bb.0: # %entry
37 ; X64-NEXT:    imull $43691, %esi, %eax # imm = 0xAAAB
38 ; X64-NEXT:    shrl $17, %eax
39 ; X64-NEXT:    # kill: def $ax killed $ax killed $eax
40 ; X64-NEXT:    retq
41 entry:
42   %div = udiv i16 %c, 3
43   ret i16 %div
47 define zeroext i8 @test3(i8 zeroext %x, i8 zeroext %c) nounwind readnone ssp noredzone {
48 ; X32-LABEL: test3:
49 ; X32:       # %bb.0: # %entry
50 ; X32-NEXT:    movzbl {{[0-9]+}}(%esp), %eax
51 ; X32-NEXT:    imull $171, %eax, %eax
52 ; X32-NEXT:    shrl $9, %eax
53 ; X32-NEXT:    # kill: def $al killed $al killed $eax
54 ; X32-NEXT:    retl
56 ; X64-LABEL: test3:
57 ; X64:       # %bb.0: # %entry
58 ; X64-NEXT:    imull $171, %esi, %eax
59 ; X64-NEXT:    shrl $9, %eax
60 ; X64-NEXT:    # kill: def $al killed $al killed $eax
61 ; X64-NEXT:    retq
62 entry:
63   %div = udiv i8 %c, 3
64   ret i8 %div
67 define signext i16 @test4(i16 signext %x) nounwind {
68 ; X32-LABEL: test4:
69 ; X32:       # %bb.0: # %entry
70 ; X32-NEXT:    movswl {{[0-9]+}}(%esp), %eax
71 ; X32-NEXT:    imull $1986, %eax, %eax # imm = 0x7C2
72 ; X32-NEXT:    movl %eax, %ecx
73 ; X32-NEXT:    shrl $31, %ecx
74 ; X32-NEXT:    shrl $16, %eax
75 ; X32-NEXT:    addl %ecx, %eax
76 ; X32-NEXT:    # kill: def $ax killed $ax killed $eax
77 ; X32-NEXT:    retl
79 ; X64-LABEL: test4:
80 ; X64:       # %bb.0: # %entry
81 ; X64-NEXT:    imull $1986, %edi, %eax # imm = 0x7C2
82 ; X64-NEXT:    movl %eax, %ecx
83 ; X64-NEXT:    shrl $31, %ecx
84 ; X64-NEXT:    shrl $16, %eax
85 ; X64-NEXT:    addl %ecx, %eax
86 ; X64-NEXT:    # kill: def $ax killed $ax killed $eax
87 ; X64-NEXT:    retq
88 entry:
89         %div = sdiv i16 %x, 33          ; <i32> [#uses=1]
90         ret i16 %div
93 define i32 @test5(i32 %A) nounwind {
94 ; X32-LABEL: test5:
95 ; X32:       # %bb.0:
96 ; X32-NEXT:    movl $365384439, %eax # imm = 0x15C752F7
97 ; X32-NEXT:    mull {{[0-9]+}}(%esp)
98 ; X32-NEXT:    movl %edx, %eax
99 ; X32-NEXT:    shrl $27, %eax
100 ; X32-NEXT:    retl
102 ; X64-LABEL: test5:
103 ; X64:       # %bb.0:
104 ; X64-NEXT:    movl %edi, %eax
105 ; X64-NEXT:    imulq $365384439, %rax, %rax # imm = 0x15C752F7
106 ; X64-NEXT:    shrq $59, %rax
107 ; X64-NEXT:    # kill: def $eax killed $eax killed $rax
108 ; X64-NEXT:    retq
109         %tmp1 = udiv i32 %A, 1577682821         ; <i32> [#uses=1]
110         ret i32 %tmp1
113 define signext i16 @test6(i16 signext %x) nounwind {
114 ; X32-LABEL: test6:
115 ; X32:       # %bb.0: # %entry
116 ; X32-NEXT:    movswl {{[0-9]+}}(%esp), %eax
117 ; X32-NEXT:    imull $26215, %eax, %eax # imm = 0x6667
118 ; X32-NEXT:    movl %eax, %ecx
119 ; X32-NEXT:    shrl $31, %ecx
120 ; X32-NEXT:    sarl $18, %eax
121 ; X32-NEXT:    addl %ecx, %eax
122 ; X32-NEXT:    # kill: def $ax killed $ax killed $eax
123 ; X32-NEXT:    retl
125 ; X64-LABEL: test6:
126 ; X64:       # %bb.0: # %entry
127 ; X64-NEXT:    imull $26215, %edi, %eax # imm = 0x6667
128 ; X64-NEXT:    movl %eax, %ecx
129 ; X64-NEXT:    shrl $31, %ecx
130 ; X64-NEXT:    sarl $18, %eax
131 ; X64-NEXT:    addl %ecx, %eax
132 ; X64-NEXT:    # kill: def $ax killed $ax killed $eax
133 ; X64-NEXT:    retq
134 entry:
135   %div = sdiv i16 %x, 10
136   ret i16 %div
139 define i32 @test7(i32 %x) nounwind {
140 ; X32-LABEL: test7:
141 ; X32:       # %bb.0:
142 ; X32-NEXT:    movl {{[0-9]+}}(%esp), %eax
143 ; X32-NEXT:    shrl $2, %eax
144 ; X32-NEXT:    movl $613566757, %ecx # imm = 0x24924925
145 ; X32-NEXT:    mull %ecx
146 ; X32-NEXT:    movl %edx, %eax
147 ; X32-NEXT:    retl
149 ; X64-LABEL: test7:
150 ; X64:       # %bb.0:
151 ; X64-NEXT:    # kill: def $edi killed $edi def $rdi
152 ; X64-NEXT:    shrl $2, %edi
153 ; X64-NEXT:    imulq $613566757, %rdi, %rax # imm = 0x24924925
154 ; X64-NEXT:    shrq $32, %rax
155 ; X64-NEXT:    # kill: def $eax killed $eax killed $rax
156 ; X64-NEXT:    retq
157   %div = udiv i32 %x, 28
158   ret i32 %div
161 ; PR13326
162 define i8 @test8(i8 %x) nounwind {
163 ; X32-LABEL: test8:
164 ; X32:       # %bb.0:
165 ; X32-NEXT:    movzbl {{[0-9]+}}(%esp), %eax
166 ; X32-NEXT:    shrb %al
167 ; X32-NEXT:    movzbl %al, %eax
168 ; X32-NEXT:    imull $211, %eax, %eax
169 ; X32-NEXT:    shrl $13, %eax
170 ; X32-NEXT:    # kill: def $al killed $al killed $eax
171 ; X32-NEXT:    retl
173 ; X64-LABEL: test8:
174 ; X64:       # %bb.0:
175 ; X64-NEXT:    shrb %dil
176 ; X64-NEXT:    movzbl %dil, %eax
177 ; X64-NEXT:    imull $211, %eax, %eax
178 ; X64-NEXT:    shrl $13, %eax
179 ; X64-NEXT:    # kill: def $al killed $al killed $eax
180 ; X64-NEXT:    retq
181   %div = udiv i8 %x, 78
182   ret i8 %div
185 define i8 @test9(i8 %x) nounwind {
186 ; X32-LABEL: test9:
187 ; X32:       # %bb.0:
188 ; X32-NEXT:    movzbl {{[0-9]+}}(%esp), %eax
189 ; X32-NEXT:    shrb $2, %al
190 ; X32-NEXT:    movzbl %al, %eax
191 ; X32-NEXT:    imull $71, %eax, %eax
192 ; X32-NEXT:    shrl $11, %eax
193 ; X32-NEXT:    # kill: def $al killed $al killed $eax
194 ; X32-NEXT:    retl
196 ; X64-LABEL: test9:
197 ; X64:       # %bb.0:
198 ; X64-NEXT:    shrb $2, %dil
199 ; X64-NEXT:    movzbl %dil, %eax
200 ; X64-NEXT:    imull $71, %eax, %eax
201 ; X64-NEXT:    shrl $11, %eax
202 ; X64-NEXT:    # kill: def $al killed $al killed $eax
203 ; X64-NEXT:    retq
204   %div = udiv i8 %x, 116
205   ret i8 %div
208 define i32 @testsize1(i32 %x) minsize nounwind {
209 ; X32-LABEL: testsize1:
210 ; X32:       # %bb.0: # %entry
211 ; X32-NEXT:    movl {{[0-9]+}}(%esp), %eax
212 ; X32-NEXT:    pushl $32
213 ; X32-NEXT:    popl %ecx
214 ; X32-NEXT:    cltd
215 ; X32-NEXT:    idivl %ecx
216 ; X32-NEXT:    retl
218 ; X64-LABEL: testsize1:
219 ; X64:       # %bb.0: # %entry
220 ; X64-NEXT:    movl %edi, %eax
221 ; X64-NEXT:    pushq $32
222 ; X64-NEXT:    popq %rcx
223 ; X64-NEXT:    cltd
224 ; X64-NEXT:    idivl %ecx
225 ; X64-NEXT:    retq
226 entry:
227         %div = sdiv i32 %x, 32
228         ret i32 %div
231 define i32 @testsize2(i32 %x) minsize nounwind {
232 ; X32-LABEL: testsize2:
233 ; X32:       # %bb.0: # %entry
234 ; X32-NEXT:    movl {{[0-9]+}}(%esp), %eax
235 ; X32-NEXT:    pushl $33
236 ; X32-NEXT:    popl %ecx
237 ; X32-NEXT:    cltd
238 ; X32-NEXT:    idivl %ecx
239 ; X32-NEXT:    retl
241 ; X64-LABEL: testsize2:
242 ; X64:       # %bb.0: # %entry
243 ; X64-NEXT:    movl %edi, %eax
244 ; X64-NEXT:    pushq $33
245 ; X64-NEXT:    popq %rcx
246 ; X64-NEXT:    cltd
247 ; X64-NEXT:    idivl %ecx
248 ; X64-NEXT:    retq
249 entry:
250         %div = sdiv i32 %x, 33
251         ret i32 %div
254 define i32 @testsize3(i32 %x) minsize nounwind {
255 ; X32-LABEL: testsize3:
256 ; X32:       # %bb.0: # %entry
257 ; X32-NEXT:    movl {{[0-9]+}}(%esp), %eax
258 ; X32-NEXT:    shrl $5, %eax
259 ; X32-NEXT:    retl
261 ; X64-LABEL: testsize3:
262 ; X64:       # %bb.0: # %entry
263 ; X64-NEXT:    movl %edi, %eax
264 ; X64-NEXT:    shrl $5, %eax
265 ; X64-NEXT:    retq
266 entry:
267         %div = udiv i32 %x, 32
268         ret i32 %div
271 define i32 @testsize4(i32 %x) minsize nounwind {
272 ; X32-LABEL: testsize4:
273 ; X32:       # %bb.0: # %entry
274 ; X32-NEXT:    movl {{[0-9]+}}(%esp), %eax
275 ; X32-NEXT:    pushl $33
276 ; X32-NEXT:    popl %ecx
277 ; X32-NEXT:    xorl %edx, %edx
278 ; X32-NEXT:    divl %ecx
279 ; X32-NEXT:    retl
281 ; X64-LABEL: testsize4:
282 ; X64:       # %bb.0: # %entry
283 ; X64-NEXT:    movl %edi, %eax
284 ; X64-NEXT:    pushq $33
285 ; X64-NEXT:    popq %rcx
286 ; X64-NEXT:    xorl %edx, %edx
287 ; X64-NEXT:    divl %ecx
288 ; X64-NEXT:    retq
289 entry:
290         %div = udiv i32 %x, 33
291         ret i32 %div
294 define i64 @PR23590(i64 %x) nounwind {
295 ; X32-LABEL: PR23590:
296 ; X32:       # %bb.0: # %entry
297 ; X32-NEXT:    subl $12, %esp
298 ; X32-NEXT:    pushl $0
299 ; X32-NEXT:    pushl $12345 # imm = 0x3039
300 ; X32-NEXT:    pushl {{[0-9]+}}(%esp)
301 ; X32-NEXT:    pushl {{[0-9]+}}(%esp)
302 ; X32-NEXT:    calll __umoddi3
303 ; X32-NEXT:    addl $16, %esp
304 ; X32-NEXT:    pushl $0
305 ; X32-NEXT:    pushl $7
306 ; X32-NEXT:    pushl %edx
307 ; X32-NEXT:    pushl %eax
308 ; X32-NEXT:    calll __udivdi3
309 ; X32-NEXT:    addl $28, %esp
310 ; X32-NEXT:    retl
312 ; X64-FAST-LABEL: PR23590:
313 ; X64-FAST:       # %bb.0: # %entry
314 ; X64-FAST-NEXT:    movabsq $6120523590596543007, %rcx # imm = 0x54F077C718E7C21F
315 ; X64-FAST-NEXT:    movq %rdi, %rax
316 ; X64-FAST-NEXT:    mulq %rcx
317 ; X64-FAST-NEXT:    shrq $12, %rdx
318 ; X64-FAST-NEXT:    imulq $12345, %rdx, %rax # imm = 0x3039
319 ; X64-FAST-NEXT:    subq %rax, %rdi
320 ; X64-FAST-NEXT:    movabsq $2635249153387078803, %rcx # imm = 0x2492492492492493
321 ; X64-FAST-NEXT:    movq %rdi, %rax
322 ; X64-FAST-NEXT:    mulq %rcx
323 ; X64-FAST-NEXT:    movq %rdx, %rax
324 ; X64-FAST-NEXT:    retq
326 ; X64-SLOW-LABEL: PR23590:
327 ; X64-SLOW:       # %bb.0: # %entry
328 ; X64-SLOW-NEXT:    movabsq $6120523590596543007, %rcx # imm = 0x54F077C718E7C21F
329 ; X64-SLOW-NEXT:    movq %rdi, %rax
330 ; X64-SLOW-NEXT:    mulq %rcx
331 ; X64-SLOW-NEXT:    shrq $12, %rdx
332 ; X64-SLOW-NEXT:    imulq $12345, %rdx, %rax # imm = 0x3039
333 ; X64-SLOW-NEXT:    subq %rax, %rdi
334 ; X64-SLOW-NEXT:    imulq $613566757, %rdi, %rax # imm = 0x24924925
335 ; X64-SLOW-NEXT:    shrq $32, %rax
336 ; X64-SLOW-NEXT:    retq
337 entry:
338         %rem = urem i64 %x, 12345
339         %div = udiv i64 %rem, 7
340         ret i64 %div
343 define { i64, i32 } @PR38622(i64) nounwind {
344 ; X32-LABEL: PR38622:
345 ; X32:       # %bb.0:
346 ; X32-NEXT:    pushl %ebp
347 ; X32-NEXT:    pushl %ebx
348 ; X32-NEXT:    pushl %edi
349 ; X32-NEXT:    pushl %esi
350 ; X32-NEXT:    subl $12, %esp
351 ; X32-NEXT:    movl {{[0-9]+}}(%esp), %ebx
352 ; X32-NEXT:    movl {{[0-9]+}}(%esp), %ebp
353 ; X32-NEXT:    pushl $0
354 ; X32-NEXT:    pushl $-294967296 # imm = 0xEE6B2800
355 ; X32-NEXT:    pushl %ebp
356 ; X32-NEXT:    pushl %ebx
357 ; X32-NEXT:    calll __udivdi3
358 ; X32-NEXT:    addl $16, %esp
359 ; X32-NEXT:    movl %eax, %esi
360 ; X32-NEXT:    movl %edx, %edi
361 ; X32-NEXT:    pushl $0
362 ; X32-NEXT:    pushl $-294967296 # imm = 0xEE6B2800
363 ; X32-NEXT:    pushl %ebp
364 ; X32-NEXT:    pushl %ebx
365 ; X32-NEXT:    calll __umoddi3
366 ; X32-NEXT:    addl $16, %esp
367 ; X32-NEXT:    movl %eax, %ecx
368 ; X32-NEXT:    movl %esi, %eax
369 ; X32-NEXT:    movl %edi, %edx
370 ; X32-NEXT:    addl $12, %esp
371 ; X32-NEXT:    popl %esi
372 ; X32-NEXT:    popl %edi
373 ; X32-NEXT:    popl %ebx
374 ; X32-NEXT:    popl %ebp
375 ; X32-NEXT:    retl
377 ; X64-LABEL: PR38622:
378 ; X64:       # %bb.0:
379 ; X64-NEXT:    movq %rdi, %rax
380 ; X64-NEXT:    shrq $11, %rax
381 ; X64-NEXT:    movabsq $4835703278458517, %rcx # imm = 0x112E0BE826D695
382 ; X64-NEXT:    mulq %rcx
383 ; X64-NEXT:    movq %rdx, %rax
384 ; X64-NEXT:    shrq $9, %rax
385 ; X64-NEXT:    imull $-294967296, %eax, %ecx # imm = 0xEE6B2800
386 ; X64-NEXT:    subl %ecx, %edi
387 ; X64-NEXT:    movl %edi, %edx
388 ; X64-NEXT:    retq
389   %2 = udiv i64 %0, 4000000000
390   %3 = urem i64 %0, 4000000000
391   %4 = trunc i64 %3 to i32
392   %5 = insertvalue { i64, i32 } undef, i64 %2, 0
393   %6 = insertvalue { i64, i32 } %5, i32 %4, 1
394   ret { i64, i32 } %6
397 define { i64, i32 } @PR38622_signed(i64) nounwind {
398 ; X32-LABEL: PR38622_signed:
399 ; X32:       # %bb.0:
400 ; X32-NEXT:    pushl %ebp
401 ; X32-NEXT:    pushl %ebx
402 ; X32-NEXT:    pushl %edi
403 ; X32-NEXT:    pushl %esi
404 ; X32-NEXT:    subl $12, %esp
405 ; X32-NEXT:    movl {{[0-9]+}}(%esp), %ebx
406 ; X32-NEXT:    movl {{[0-9]+}}(%esp), %ebp
407 ; X32-NEXT:    pushl $0
408 ; X32-NEXT:    pushl $-294967296 # imm = 0xEE6B2800
409 ; X32-NEXT:    pushl %ebp
410 ; X32-NEXT:    pushl %ebx
411 ; X32-NEXT:    calll __divdi3
412 ; X32-NEXT:    addl $16, %esp
413 ; X32-NEXT:    movl %eax, %esi
414 ; X32-NEXT:    movl %edx, %edi
415 ; X32-NEXT:    pushl $0
416 ; X32-NEXT:    pushl $-294967296 # imm = 0xEE6B2800
417 ; X32-NEXT:    pushl %ebp
418 ; X32-NEXT:    pushl %ebx
419 ; X32-NEXT:    calll __moddi3
420 ; X32-NEXT:    addl $16, %esp
421 ; X32-NEXT:    movl %eax, %ecx
422 ; X32-NEXT:    movl %esi, %eax
423 ; X32-NEXT:    movl %edi, %edx
424 ; X32-NEXT:    addl $12, %esp
425 ; X32-NEXT:    popl %esi
426 ; X32-NEXT:    popl %edi
427 ; X32-NEXT:    popl %ebx
428 ; X32-NEXT:    popl %ebp
429 ; X32-NEXT:    retl
431 ; X64-LABEL: PR38622_signed:
432 ; X64:       # %bb.0:
433 ; X64-NEXT:    movabsq $1237940039285380275, %rcx # imm = 0x112E0BE826D694B3
434 ; X64-NEXT:    movq %rdi, %rax
435 ; X64-NEXT:    imulq %rcx
436 ; X64-NEXT:    movq %rdx, %rax
437 ; X64-NEXT:    shrq $63, %rax
438 ; X64-NEXT:    sarq $28, %rdx
439 ; X64-NEXT:    addq %rdx, %rax
440 ; X64-NEXT:    imull $-294967296, %eax, %ecx # imm = 0xEE6B2800
441 ; X64-NEXT:    subl %ecx, %edi
442 ; X64-NEXT:    movl %edi, %edx
443 ; X64-NEXT:    retq
444   %2 = sdiv i64 %0, 4000000000
445   %3 = srem i64 %0, 4000000000
446   %4 = trunc i64 %3 to i32
447   %5 = insertvalue { i64, i32 } undef, i64 %2, 0
448   %6 = insertvalue { i64, i32 } %5, i32 %4, 1
449   ret { i64, i32 } %6
452 define i64 @urem_i64_3(i64 %x) nounwind {
453 ; X32-LABEL: urem_i64_3:
454 ; X32:       # %bb.0: # %entry
455 ; X32-NEXT:    movl {{[0-9]+}}(%esp), %ecx
456 ; X32-NEXT:    addl {{[0-9]+}}(%esp), %ecx
457 ; X32-NEXT:    adcl $0, %ecx
458 ; X32-NEXT:    movl $-1431655765, %edx # imm = 0xAAAAAAAB
459 ; X32-NEXT:    movl %ecx, %eax
460 ; X32-NEXT:    mull %edx
461 ; X32-NEXT:    shrl %edx
462 ; X32-NEXT:    leal (%edx,%edx,2), %eax
463 ; X32-NEXT:    subl %eax, %ecx
464 ; X32-NEXT:    movl %ecx, %eax
465 ; X32-NEXT:    xorl %edx, %edx
466 ; X32-NEXT:    retl
468 ; X64-LABEL: urem_i64_3:
469 ; X64:       # %bb.0: # %entry
470 ; X64-NEXT:    movabsq $-6148914691236517205, %rcx # imm = 0xAAAAAAAAAAAAAAAB
471 ; X64-NEXT:    movq %rdi, %rax
472 ; X64-NEXT:    mulq %rcx
473 ; X64-NEXT:    shrq %rdx
474 ; X64-NEXT:    leaq (%rdx,%rdx,2), %rax
475 ; X64-NEXT:    subq %rax, %rdi
476 ; X64-NEXT:    movq %rdi, %rax
477 ; X64-NEXT:    retq
478 entry:
479   %rem = urem i64 %x, 3
480   ret i64 %rem
483 define i64 @urem_i64_5(i64 %x) nounwind {
484 ; X32-LABEL: urem_i64_5:
485 ; X32:       # %bb.0: # %entry
486 ; X32-NEXT:    movl {{[0-9]+}}(%esp), %ecx
487 ; X32-NEXT:    addl {{[0-9]+}}(%esp), %ecx
488 ; X32-NEXT:    adcl $0, %ecx
489 ; X32-NEXT:    movl $-858993459, %edx # imm = 0xCCCCCCCD
490 ; X32-NEXT:    movl %ecx, %eax
491 ; X32-NEXT:    mull %edx
492 ; X32-NEXT:    shrl $2, %edx
493 ; X32-NEXT:    leal (%edx,%edx,4), %eax
494 ; X32-NEXT:    subl %eax, %ecx
495 ; X32-NEXT:    movl %ecx, %eax
496 ; X32-NEXT:    xorl %edx, %edx
497 ; X32-NEXT:    retl
499 ; X64-LABEL: urem_i64_5:
500 ; X64:       # %bb.0: # %entry
501 ; X64-NEXT:    movabsq $-3689348814741910323, %rcx # imm = 0xCCCCCCCCCCCCCCCD
502 ; X64-NEXT:    movq %rdi, %rax
503 ; X64-NEXT:    mulq %rcx
504 ; X64-NEXT:    shrq $2, %rdx
505 ; X64-NEXT:    leaq (%rdx,%rdx,4), %rax
506 ; X64-NEXT:    subq %rax, %rdi
507 ; X64-NEXT:    movq %rdi, %rax
508 ; X64-NEXT:    retq
509 entry:
510   %rem = urem i64 %x, 5
511   ret i64 %rem
514 define i64 @urem_i64_15(i64 %x) nounwind {
515 ; X32-LABEL: urem_i64_15:
516 ; X32:       # %bb.0: # %entry
517 ; X32-NEXT:    movl {{[0-9]+}}(%esp), %ecx
518 ; X32-NEXT:    addl {{[0-9]+}}(%esp), %ecx
519 ; X32-NEXT:    adcl $0, %ecx
520 ; X32-NEXT:    movl $-2004318071, %edx # imm = 0x88888889
521 ; X32-NEXT:    movl %ecx, %eax
522 ; X32-NEXT:    mull %edx
523 ; X32-NEXT:    shrl $3, %edx
524 ; X32-NEXT:    leal (%edx,%edx,4), %eax
525 ; X32-NEXT:    leal (%eax,%eax,2), %eax
526 ; X32-NEXT:    subl %eax, %ecx
527 ; X32-NEXT:    movl %ecx, %eax
528 ; X32-NEXT:    xorl %edx, %edx
529 ; X32-NEXT:    retl
531 ; X64-LABEL: urem_i64_15:
532 ; X64:       # %bb.0: # %entry
533 ; X64-NEXT:    movabsq $-8608480567731124087, %rcx # imm = 0x8888888888888889
534 ; X64-NEXT:    movq %rdi, %rax
535 ; X64-NEXT:    mulq %rcx
536 ; X64-NEXT:    shrq $3, %rdx
537 ; X64-NEXT:    leaq (%rdx,%rdx,4), %rax
538 ; X64-NEXT:    leaq (%rax,%rax,2), %rax
539 ; X64-NEXT:    subq %rax, %rdi
540 ; X64-NEXT:    movq %rdi, %rax
541 ; X64-NEXT:    retq
542 entry:
543   %rem = urem i64 %x, 15
544   ret i64 %rem
547 define i64 @urem_i64_17(i64 %x) nounwind {
548 ; X32-LABEL: urem_i64_17:
549 ; X32:       # %bb.0: # %entry
550 ; X32-NEXT:    movl {{[0-9]+}}(%esp), %ecx
551 ; X32-NEXT:    addl {{[0-9]+}}(%esp), %ecx
552 ; X32-NEXT:    adcl $0, %ecx
553 ; X32-NEXT:    movl $-252645135, %edx # imm = 0xF0F0F0F1
554 ; X32-NEXT:    movl %ecx, %eax
555 ; X32-NEXT:    mull %edx
556 ; X32-NEXT:    movl %edx, %eax
557 ; X32-NEXT:    andl $-16, %eax
558 ; X32-NEXT:    shrl $4, %edx
559 ; X32-NEXT:    addl %eax, %edx
560 ; X32-NEXT:    subl %edx, %ecx
561 ; X32-NEXT:    movl %ecx, %eax
562 ; X32-NEXT:    xorl %edx, %edx
563 ; X32-NEXT:    retl
565 ; X64-LABEL: urem_i64_17:
566 ; X64:       # %bb.0: # %entry
567 ; X64-NEXT:    movabsq $-1085102592571150095, %rcx # imm = 0xF0F0F0F0F0F0F0F1
568 ; X64-NEXT:    movq %rdi, %rax
569 ; X64-NEXT:    mulq %rcx
570 ; X64-NEXT:    movq %rdx, %rax
571 ; X64-NEXT:    andq $-16, %rax
572 ; X64-NEXT:    shrq $4, %rdx
573 ; X64-NEXT:    addq %rax, %rdx
574 ; X64-NEXT:    subq %rdx, %rdi
575 ; X64-NEXT:    movq %rdi, %rax
576 ; X64-NEXT:    retq
577 entry:
578   %rem = urem i64 %x, 17
579   ret i64 %rem
582 define i64 @urem_i64_255(i64 %x) nounwind {
583 ; X32-LABEL: urem_i64_255:
584 ; X32:       # %bb.0: # %entry
585 ; X32-NEXT:    pushl %esi
586 ; X32-NEXT:    movl {{[0-9]+}}(%esp), %ecx
587 ; X32-NEXT:    movl {{[0-9]+}}(%esp), %esi
588 ; X32-NEXT:    movl %ecx, %eax
589 ; X32-NEXT:    addl %esi, %eax
590 ; X32-NEXT:    adcl $0, %eax
591 ; X32-NEXT:    movl $-2139062143, %edx # imm = 0x80808081
592 ; X32-NEXT:    mull %edx
593 ; X32-NEXT:    shrl $7, %edx
594 ; X32-NEXT:    movl %edx, %eax
595 ; X32-NEXT:    shll $8, %eax
596 ; X32-NEXT:    subl %eax, %edx
597 ; X32-NEXT:    addl %esi, %ecx
598 ; X32-NEXT:    adcl %edx, %ecx
599 ; X32-NEXT:    movl %ecx, %eax
600 ; X32-NEXT:    xorl %edx, %edx
601 ; X32-NEXT:    popl %esi
602 ; X32-NEXT:    retl
604 ; X64-LABEL: urem_i64_255:
605 ; X64:       # %bb.0: # %entry
606 ; X64-NEXT:    movabsq $-9187201950435737471, %rcx # imm = 0x8080808080808081
607 ; X64-NEXT:    movq %rdi, %rax
608 ; X64-NEXT:    mulq %rcx
609 ; X64-NEXT:    shrq $7, %rdx
610 ; X64-NEXT:    movq %rdx, %rax
611 ; X64-NEXT:    shlq $8, %rax
612 ; X64-NEXT:    subq %rax, %rdx
613 ; X64-NEXT:    leaq (%rdx,%rdi), %rax
614 ; X64-NEXT:    retq
615 entry:
616   %rem = urem i64 %x, 255
617   ret i64 %rem
620 define i64 @urem_i64_257(i64 %x) nounwind {
621 ; X32-LABEL: urem_i64_257:
622 ; X32:       # %bb.0: # %entry
623 ; X32-NEXT:    movl {{[0-9]+}}(%esp), %ecx
624 ; X32-NEXT:    addl {{[0-9]+}}(%esp), %ecx
625 ; X32-NEXT:    adcl $0, %ecx
626 ; X32-NEXT:    movl $-16711935, %edx # imm = 0xFF00FF01
627 ; X32-NEXT:    movl %ecx, %eax
628 ; X32-NEXT:    mull %edx
629 ; X32-NEXT:    movl %edx, %eax
630 ; X32-NEXT:    andl $-256, %eax
631 ; X32-NEXT:    shrl $8, %edx
632 ; X32-NEXT:    addl %eax, %edx
633 ; X32-NEXT:    subl %edx, %ecx
634 ; X32-NEXT:    movl %ecx, %eax
635 ; X32-NEXT:    xorl %edx, %edx
636 ; X32-NEXT:    retl
638 ; X64-LABEL: urem_i64_257:
639 ; X64:       # %bb.0: # %entry
640 ; X64-NEXT:    movabsq $-71777214294589695, %rcx # imm = 0xFF00FF00FF00FF01
641 ; X64-NEXT:    movq %rdi, %rax
642 ; X64-NEXT:    mulq %rcx
643 ; X64-NEXT:    movq %rdx, %rax
644 ; X64-NEXT:    andq $-256, %rax
645 ; X64-NEXT:    shrq $8, %rdx
646 ; X64-NEXT:    addq %rax, %rdx
647 ; X64-NEXT:    subq %rdx, %rdi
648 ; X64-NEXT:    movq %rdi, %rax
649 ; X64-NEXT:    retq
650 entry:
651   %rem = urem i64 %x, 257
652   ret i64 %rem
655 define i64 @urem_i64_65535(i64 %x) nounwind {
656 ; X32-LABEL: urem_i64_65535:
657 ; X32:       # %bb.0: # %entry
658 ; X32-NEXT:    pushl %esi
659 ; X32-NEXT:    movl {{[0-9]+}}(%esp), %ecx
660 ; X32-NEXT:    movl {{[0-9]+}}(%esp), %esi
661 ; X32-NEXT:    movl %ecx, %eax
662 ; X32-NEXT:    addl %esi, %eax
663 ; X32-NEXT:    adcl $0, %eax
664 ; X32-NEXT:    movl $-2147450879, %edx # imm = 0x80008001
665 ; X32-NEXT:    mull %edx
666 ; X32-NEXT:    shrl $15, %edx
667 ; X32-NEXT:    movl %edx, %eax
668 ; X32-NEXT:    shll $16, %eax
669 ; X32-NEXT:    subl %eax, %edx
670 ; X32-NEXT:    addl %esi, %ecx
671 ; X32-NEXT:    adcl %edx, %ecx
672 ; X32-NEXT:    movl %ecx, %eax
673 ; X32-NEXT:    xorl %edx, %edx
674 ; X32-NEXT:    popl %esi
675 ; X32-NEXT:    retl
677 ; X64-LABEL: urem_i64_65535:
678 ; X64:       # %bb.0: # %entry
679 ; X64-NEXT:    movabsq $-9223231297218904063, %rcx # imm = 0x8000800080008001
680 ; X64-NEXT:    movq %rdi, %rax
681 ; X64-NEXT:    mulq %rcx
682 ; X64-NEXT:    shrq $15, %rdx
683 ; X64-NEXT:    movq %rdx, %rax
684 ; X64-NEXT:    shlq $16, %rax
685 ; X64-NEXT:    subq %rax, %rdx
686 ; X64-NEXT:    leaq (%rdx,%rdi), %rax
687 ; X64-NEXT:    retq
688 entry:
689   %rem = urem i64 %x, 65535
690   ret i64 %rem
693 define i64 @urem_i64_65537(i64 %x) nounwind {
694 ; X32-LABEL: urem_i64_65537:
695 ; X32:       # %bb.0: # %entry
696 ; X32-NEXT:    movl {{[0-9]+}}(%esp), %ecx
697 ; X32-NEXT:    addl {{[0-9]+}}(%esp), %ecx
698 ; X32-NEXT:    adcl $0, %ecx
699 ; X32-NEXT:    movl $-65535, %edx # imm = 0xFFFF0001
700 ; X32-NEXT:    movl %ecx, %eax
701 ; X32-NEXT:    mull %edx
702 ; X32-NEXT:    movl %edx, %eax
703 ; X32-NEXT:    shrl $16, %eax
704 ; X32-NEXT:    shldl $16, %edx, %eax
705 ; X32-NEXT:    subl %eax, %ecx
706 ; X32-NEXT:    movl %ecx, %eax
707 ; X32-NEXT:    xorl %edx, %edx
708 ; X32-NEXT:    retl
710 ; X64-LABEL: urem_i64_65537:
711 ; X64:       # %bb.0: # %entry
712 ; X64-NEXT:    movabsq $-281470681808895, %rcx # imm = 0xFFFF0000FFFF0001
713 ; X64-NEXT:    movq %rdi, %rax
714 ; X64-NEXT:    mulq %rcx
715 ; X64-NEXT:    movq %rdx, %rax
716 ; X64-NEXT:    andq $-65536, %rax # imm = 0xFFFF0000
717 ; X64-NEXT:    shrq $16, %rdx
718 ; X64-NEXT:    addq %rax, %rdx
719 ; X64-NEXT:    subq %rdx, %rdi
720 ; X64-NEXT:    movq %rdi, %rax
721 ; X64-NEXT:    retq
722 entry:
723   %rem = urem i64 %x, 65537
724   ret i64 %rem
727 define i64 @urem_i64_12(i64 %x) nounwind {
728 ; X32-LABEL: urem_i64_12:
729 ; X32:       # %bb.0: # %entry
730 ; X32-NEXT:    pushl %esi
731 ; X32-NEXT:    movl {{[0-9]+}}(%esp), %esi
732 ; X32-NEXT:    movl {{[0-9]+}}(%esp), %ecx
733 ; X32-NEXT:    movl %ecx, %eax
734 ; X32-NEXT:    shrl $2, %eax
735 ; X32-NEXT:    shldl $30, %esi, %ecx
736 ; X32-NEXT:    addl %eax, %ecx
737 ; X32-NEXT:    adcl $0, %ecx
738 ; X32-NEXT:    movl $-1431655765, %edx # imm = 0xAAAAAAAB
739 ; X32-NEXT:    movl %ecx, %eax
740 ; X32-NEXT:    mull %edx
741 ; X32-NEXT:    shrl %edx
742 ; X32-NEXT:    leal (%edx,%edx,2), %eax
743 ; X32-NEXT:    subl %eax, %ecx
744 ; X32-NEXT:    andl $3, %esi
745 ; X32-NEXT:    leal (%esi,%ecx,4), %eax
746 ; X32-NEXT:    xorl %edx, %edx
747 ; X32-NEXT:    popl %esi
748 ; X32-NEXT:    retl
750 ; X64-LABEL: urem_i64_12:
751 ; X64:       # %bb.0: # %entry
752 ; X64-NEXT:    movabsq $-6148914691236517205, %rcx # imm = 0xAAAAAAAAAAAAAAAB
753 ; X64-NEXT:    movq %rdi, %rax
754 ; X64-NEXT:    mulq %rcx
755 ; X64-NEXT:    shrq %rdx
756 ; X64-NEXT:    andq $-4, %rdx
757 ; X64-NEXT:    leaq (%rdx,%rdx,2), %rax
758 ; X64-NEXT:    subq %rax, %rdi
759 ; X64-NEXT:    movq %rdi, %rax
760 ; X64-NEXT:    retq
761 entry:
762   %rem = urem i64 %x, 12
763   ret i64 %rem
766 define i64 @udiv_i64_3(i64 %x) nounwind {
767 ; X32-LABEL: udiv_i64_3:
768 ; X32:       # %bb.0: # %entry
769 ; X32-NEXT:    pushl %ebx
770 ; X32-NEXT:    pushl %edi
771 ; X32-NEXT:    pushl %esi
772 ; X32-NEXT:    movl {{[0-9]+}}(%esp), %ecx
773 ; X32-NEXT:    movl {{[0-9]+}}(%esp), %edi
774 ; X32-NEXT:    movl %ecx, %esi
775 ; X32-NEXT:    addl %edi, %esi
776 ; X32-NEXT:    adcl $0, %esi
777 ; X32-NEXT:    movl $-1431655765, %ebx # imm = 0xAAAAAAAB
778 ; X32-NEXT:    movl %esi, %eax
779 ; X32-NEXT:    mull %ebx
780 ; X32-NEXT:    shrl %edx
781 ; X32-NEXT:    leal (%edx,%edx,2), %eax
782 ; X32-NEXT:    subl %eax, %esi
783 ; X32-NEXT:    subl %esi, %ecx
784 ; X32-NEXT:    sbbl $0, %edi
785 ; X32-NEXT:    movl %ecx, %eax
786 ; X32-NEXT:    mull %ebx
787 ; X32-NEXT:    imull $-1431655766, %ecx, %ecx # imm = 0xAAAAAAAA
788 ; X32-NEXT:    addl %ecx, %edx
789 ; X32-NEXT:    imull $-1431655765, %edi, %ecx # imm = 0xAAAAAAAB
790 ; X32-NEXT:    addl %ecx, %edx
791 ; X32-NEXT:    popl %esi
792 ; X32-NEXT:    popl %edi
793 ; X32-NEXT:    popl %ebx
794 ; X32-NEXT:    retl
796 ; X64-LABEL: udiv_i64_3:
797 ; X64:       # %bb.0: # %entry
798 ; X64-NEXT:    movq %rdi, %rax
799 ; X64-NEXT:    movabsq $-6148914691236517205, %rcx # imm = 0xAAAAAAAAAAAAAAAB
800 ; X64-NEXT:    mulq %rcx
801 ; X64-NEXT:    movq %rdx, %rax
802 ; X64-NEXT:    shrq %rax
803 ; X64-NEXT:    retq
804 entry:
805   %rem = udiv i64 %x, 3
806   ret i64 %rem
809 define i64 @udiv_i64_5(i64 %x) nounwind {
810 ; X32-LABEL: udiv_i64_5:
811 ; X32:       # %bb.0: # %entry
812 ; X32-NEXT:    pushl %ebx
813 ; X32-NEXT:    pushl %edi
814 ; X32-NEXT:    pushl %esi
815 ; X32-NEXT:    movl {{[0-9]+}}(%esp), %ecx
816 ; X32-NEXT:    movl {{[0-9]+}}(%esp), %edi
817 ; X32-NEXT:    movl %ecx, %esi
818 ; X32-NEXT:    addl %edi, %esi
819 ; X32-NEXT:    adcl $0, %esi
820 ; X32-NEXT:    movl $-858993459, %ebx # imm = 0xCCCCCCCD
821 ; X32-NEXT:    movl %esi, %eax
822 ; X32-NEXT:    mull %ebx
823 ; X32-NEXT:    shrl $2, %edx
824 ; X32-NEXT:    leal (%edx,%edx,4), %eax
825 ; X32-NEXT:    subl %eax, %esi
826 ; X32-NEXT:    subl %esi, %ecx
827 ; X32-NEXT:    sbbl $0, %edi
828 ; X32-NEXT:    movl %ecx, %eax
829 ; X32-NEXT:    mull %ebx
830 ; X32-NEXT:    imull $-858993460, %ecx, %ecx # imm = 0xCCCCCCCC
831 ; X32-NEXT:    addl %ecx, %edx
832 ; X32-NEXT:    imull $-858993459, %edi, %ecx # imm = 0xCCCCCCCD
833 ; X32-NEXT:    addl %ecx, %edx
834 ; X32-NEXT:    popl %esi
835 ; X32-NEXT:    popl %edi
836 ; X32-NEXT:    popl %ebx
837 ; X32-NEXT:    retl
839 ; X64-LABEL: udiv_i64_5:
840 ; X64:       # %bb.0: # %entry
841 ; X64-NEXT:    movq %rdi, %rax
842 ; X64-NEXT:    movabsq $-3689348814741910323, %rcx # imm = 0xCCCCCCCCCCCCCCCD
843 ; X64-NEXT:    mulq %rcx
844 ; X64-NEXT:    movq %rdx, %rax
845 ; X64-NEXT:    shrq $2, %rax
846 ; X64-NEXT:    retq
847 entry:
848   %rem = udiv i64 %x, 5
849   ret i64 %rem
852 define i64 @udiv_i64_15(i64 %x) nounwind {
853 ; X32-LABEL: udiv_i64_15:
854 ; X32:       # %bb.0: # %entry
855 ; X32-NEXT:    pushl %edi
856 ; X32-NEXT:    pushl %esi
857 ; X32-NEXT:    movl {{[0-9]+}}(%esp), %ecx
858 ; X32-NEXT:    movl {{[0-9]+}}(%esp), %edi
859 ; X32-NEXT:    movl %ecx, %esi
860 ; X32-NEXT:    addl %edi, %esi
861 ; X32-NEXT:    adcl $0, %esi
862 ; X32-NEXT:    movl $-2004318071, %edx # imm = 0x88888889
863 ; X32-NEXT:    movl %esi, %eax
864 ; X32-NEXT:    mull %edx
865 ; X32-NEXT:    shrl $3, %edx
866 ; X32-NEXT:    leal (%edx,%edx,4), %eax
867 ; X32-NEXT:    leal (%eax,%eax,2), %eax
868 ; X32-NEXT:    subl %eax, %esi
869 ; X32-NEXT:    subl %esi, %ecx
870 ; X32-NEXT:    sbbl $0, %edi
871 ; X32-NEXT:    movl $-286331153, %edx # imm = 0xEEEEEEEF
872 ; X32-NEXT:    movl %ecx, %eax
873 ; X32-NEXT:    mull %edx
874 ; X32-NEXT:    imull $-286331154, %ecx, %ecx # imm = 0xEEEEEEEE
875 ; X32-NEXT:    addl %ecx, %edx
876 ; X32-NEXT:    imull $-286331153, %edi, %ecx # imm = 0xEEEEEEEF
877 ; X32-NEXT:    addl %ecx, %edx
878 ; X32-NEXT:    popl %esi
879 ; X32-NEXT:    popl %edi
880 ; X32-NEXT:    retl
882 ; X64-LABEL: udiv_i64_15:
883 ; X64:       # %bb.0: # %entry
884 ; X64-NEXT:    movq %rdi, %rax
885 ; X64-NEXT:    movabsq $-8608480567731124087, %rcx # imm = 0x8888888888888889
886 ; X64-NEXT:    mulq %rcx
887 ; X64-NEXT:    movq %rdx, %rax
888 ; X64-NEXT:    shrq $3, %rax
889 ; X64-NEXT:    retq
890 entry:
891   %rem = udiv i64 %x, 15
892   ret i64 %rem
895 define i64 @udiv_i64_17(i64 %x) nounwind {
896 ; X32-LABEL: udiv_i64_17:
897 ; X32:       # %bb.0: # %entry
898 ; X32-NEXT:    pushl %ebx
899 ; X32-NEXT:    pushl %edi
900 ; X32-NEXT:    pushl %esi
901 ; X32-NEXT:    movl {{[0-9]+}}(%esp), %ecx
902 ; X32-NEXT:    movl {{[0-9]+}}(%esp), %edi
903 ; X32-NEXT:    movl %ecx, %esi
904 ; X32-NEXT:    addl %edi, %esi
905 ; X32-NEXT:    adcl $0, %esi
906 ; X32-NEXT:    movl $-252645135, %ebx # imm = 0xF0F0F0F1
907 ; X32-NEXT:    movl %esi, %eax
908 ; X32-NEXT:    mull %ebx
909 ; X32-NEXT:    movl %edx, %eax
910 ; X32-NEXT:    andl $-16, %eax
911 ; X32-NEXT:    shrl $4, %edx
912 ; X32-NEXT:    addl %eax, %edx
913 ; X32-NEXT:    subl %edx, %esi
914 ; X32-NEXT:    subl %esi, %ecx
915 ; X32-NEXT:    sbbl $0, %edi
916 ; X32-NEXT:    movl %ecx, %eax
917 ; X32-NEXT:    mull %ebx
918 ; X32-NEXT:    imull $-252645136, %ecx, %ecx # imm = 0xF0F0F0F0
919 ; X32-NEXT:    addl %ecx, %edx
920 ; X32-NEXT:    imull $-252645135, %edi, %ecx # imm = 0xF0F0F0F1
921 ; X32-NEXT:    addl %ecx, %edx
922 ; X32-NEXT:    popl %esi
923 ; X32-NEXT:    popl %edi
924 ; X32-NEXT:    popl %ebx
925 ; X32-NEXT:    retl
927 ; X64-LABEL: udiv_i64_17:
928 ; X64:       # %bb.0: # %entry
929 ; X64-NEXT:    movq %rdi, %rax
930 ; X64-NEXT:    movabsq $-1085102592571150095, %rcx # imm = 0xF0F0F0F0F0F0F0F1
931 ; X64-NEXT:    mulq %rcx
932 ; X64-NEXT:    movq %rdx, %rax
933 ; X64-NEXT:    shrq $4, %rax
934 ; X64-NEXT:    retq
935 entry:
936   %rem = udiv i64 %x, 17
937   ret i64 %rem
940 define i64 @udiv_i64_255(i64 %x) nounwind {
941 ; X32-LABEL: udiv_i64_255:
942 ; X32:       # %bb.0: # %entry
943 ; X32-NEXT:    pushl %esi
944 ; X32-NEXT:    movl {{[0-9]+}}(%esp), %ecx
945 ; X32-NEXT:    movl {{[0-9]+}}(%esp), %esi
946 ; X32-NEXT:    movl %ecx, %eax
947 ; X32-NEXT:    addl %esi, %eax
948 ; X32-NEXT:    adcl $0, %eax
949 ; X32-NEXT:    movl $-2139062143, %edx # imm = 0x80808081
950 ; X32-NEXT:    mull %edx
951 ; X32-NEXT:    shrl $7, %edx
952 ; X32-NEXT:    movl %edx, %eax
953 ; X32-NEXT:    shll $8, %eax
954 ; X32-NEXT:    subl %eax, %edx
955 ; X32-NEXT:    movl %ecx, %eax
956 ; X32-NEXT:    addl %esi, %eax
957 ; X32-NEXT:    adcl %edx, %eax
958 ; X32-NEXT:    subl %eax, %ecx
959 ; X32-NEXT:    sbbl $0, %esi
960 ; X32-NEXT:    movl $-16843009, %edx # imm = 0xFEFEFEFF
961 ; X32-NEXT:    movl %ecx, %eax
962 ; X32-NEXT:    mull %edx
963 ; X32-NEXT:    imull $-16843010, %ecx, %ecx # imm = 0xFEFEFEFE
964 ; X32-NEXT:    addl %ecx, %edx
965 ; X32-NEXT:    imull $-16843009, %esi, %ecx # imm = 0xFEFEFEFF
966 ; X32-NEXT:    addl %ecx, %edx
967 ; X32-NEXT:    popl %esi
968 ; X32-NEXT:    retl
970 ; X64-LABEL: udiv_i64_255:
971 ; X64:       # %bb.0: # %entry
972 ; X64-NEXT:    movq %rdi, %rax
973 ; X64-NEXT:    movabsq $-9187201950435737471, %rcx # imm = 0x8080808080808081
974 ; X64-NEXT:    mulq %rcx
975 ; X64-NEXT:    movq %rdx, %rax
976 ; X64-NEXT:    shrq $7, %rax
977 ; X64-NEXT:    retq
978 entry:
979   %rem = udiv i64 %x, 255
980   ret i64 %rem
983 define i64 @udiv_i64_257(i64 %x) nounwind {
984 ; X32-LABEL: udiv_i64_257:
985 ; X32:       # %bb.0: # %entry
986 ; X32-NEXT:    pushl %ebx
987 ; X32-NEXT:    pushl %edi
988 ; X32-NEXT:    pushl %esi
989 ; X32-NEXT:    movl {{[0-9]+}}(%esp), %ecx
990 ; X32-NEXT:    movl {{[0-9]+}}(%esp), %edi
991 ; X32-NEXT:    movl %ecx, %esi
992 ; X32-NEXT:    addl %edi, %esi
993 ; X32-NEXT:    adcl $0, %esi
994 ; X32-NEXT:    movl $-16711935, %ebx # imm = 0xFF00FF01
995 ; X32-NEXT:    movl %esi, %eax
996 ; X32-NEXT:    mull %ebx
997 ; X32-NEXT:    movl %edx, %eax
998 ; X32-NEXT:    andl $-256, %eax
999 ; X32-NEXT:    shrl $8, %edx
1000 ; X32-NEXT:    addl %eax, %edx
1001 ; X32-NEXT:    subl %edx, %esi
1002 ; X32-NEXT:    subl %esi, %ecx
1003 ; X32-NEXT:    sbbl $0, %edi
1004 ; X32-NEXT:    movl %ecx, %eax
1005 ; X32-NEXT:    mull %ebx
1006 ; X32-NEXT:    imull $-16711936, %ecx, %ecx # imm = 0xFF00FF00
1007 ; X32-NEXT:    addl %ecx, %edx
1008 ; X32-NEXT:    imull $-16711935, %edi, %ecx # imm = 0xFF00FF01
1009 ; X32-NEXT:    addl %ecx, %edx
1010 ; X32-NEXT:    popl %esi
1011 ; X32-NEXT:    popl %edi
1012 ; X32-NEXT:    popl %ebx
1013 ; X32-NEXT:    retl
1015 ; X64-LABEL: udiv_i64_257:
1016 ; X64:       # %bb.0: # %entry
1017 ; X64-NEXT:    movq %rdi, %rax
1018 ; X64-NEXT:    movabsq $-71777214294589695, %rcx # imm = 0xFF00FF00FF00FF01
1019 ; X64-NEXT:    mulq %rcx
1020 ; X64-NEXT:    movq %rdx, %rax
1021 ; X64-NEXT:    shrq $8, %rax
1022 ; X64-NEXT:    retq
1023 entry:
1024   %rem = udiv i64 %x, 257
1025   ret i64 %rem
1028 define i64 @udiv_i64_65535(i64 %x) nounwind {
1029 ; X32-LABEL: udiv_i64_65535:
1030 ; X32:       # %bb.0: # %entry
1031 ; X32-NEXT:    pushl %esi
1032 ; X32-NEXT:    movl {{[0-9]+}}(%esp), %ecx
1033 ; X32-NEXT:    movl {{[0-9]+}}(%esp), %esi
1034 ; X32-NEXT:    movl %ecx, %eax
1035 ; X32-NEXT:    addl %esi, %eax
1036 ; X32-NEXT:    adcl $0, %eax
1037 ; X32-NEXT:    movl $-2147450879, %edx # imm = 0x80008001
1038 ; X32-NEXT:    mull %edx
1039 ; X32-NEXT:    shrl $15, %edx
1040 ; X32-NEXT:    movl %edx, %eax
1041 ; X32-NEXT:    shll $16, %eax
1042 ; X32-NEXT:    subl %eax, %edx
1043 ; X32-NEXT:    movl %ecx, %eax
1044 ; X32-NEXT:    addl %esi, %eax
1045 ; X32-NEXT:    adcl %edx, %eax
1046 ; X32-NEXT:    subl %eax, %ecx
1047 ; X32-NEXT:    sbbl $0, %esi
1048 ; X32-NEXT:    movl $-65537, %edx # imm = 0xFFFEFFFF
1049 ; X32-NEXT:    movl %ecx, %eax
1050 ; X32-NEXT:    mull %edx
1051 ; X32-NEXT:    imull $-65538, %ecx, %ecx # imm = 0xFFFEFFFE
1052 ; X32-NEXT:    addl %ecx, %edx
1053 ; X32-NEXT:    movl %esi, %ecx
1054 ; X32-NEXT:    shll $16, %ecx
1055 ; X32-NEXT:    addl %esi, %ecx
1056 ; X32-NEXT:    subl %ecx, %edx
1057 ; X32-NEXT:    popl %esi
1058 ; X32-NEXT:    retl
1060 ; X64-LABEL: udiv_i64_65535:
1061 ; X64:       # %bb.0: # %entry
1062 ; X64-NEXT:    movq %rdi, %rax
1063 ; X64-NEXT:    movabsq $-9223231297218904063, %rcx # imm = 0x8000800080008001
1064 ; X64-NEXT:    mulq %rcx
1065 ; X64-NEXT:    movq %rdx, %rax
1066 ; X64-NEXT:    shrq $15, %rax
1067 ; X64-NEXT:    retq
1068 entry:
1069   %rem = udiv i64 %x, 65535
1070   ret i64 %rem
1073 define i64 @udiv_i64_65537(i64 %x) nounwind {
1074 ; X32-LABEL: udiv_i64_65537:
1075 ; X32:       # %bb.0: # %entry
1076 ; X32-NEXT:    pushl %ebx
1077 ; X32-NEXT:    pushl %edi
1078 ; X32-NEXT:    pushl %esi
1079 ; X32-NEXT:    movl {{[0-9]+}}(%esp), %ecx
1080 ; X32-NEXT:    movl {{[0-9]+}}(%esp), %edi
1081 ; X32-NEXT:    movl %ecx, %esi
1082 ; X32-NEXT:    addl %edi, %esi
1083 ; X32-NEXT:    adcl $0, %esi
1084 ; X32-NEXT:    movl $-65535, %ebx # imm = 0xFFFF0001
1085 ; X32-NEXT:    movl %esi, %eax
1086 ; X32-NEXT:    mull %ebx
1087 ; X32-NEXT:    movl %edx, %eax
1088 ; X32-NEXT:    shrl $16, %eax
1089 ; X32-NEXT:    shldl $16, %edx, %eax
1090 ; X32-NEXT:    subl %eax, %esi
1091 ; X32-NEXT:    subl %esi, %ecx
1092 ; X32-NEXT:    sbbl $0, %edi
1093 ; X32-NEXT:    movl %ecx, %eax
1094 ; X32-NEXT:    mull %ebx
1095 ; X32-NEXT:    shll $16, %ecx
1096 ; X32-NEXT:    subl %ecx, %edx
1097 ; X32-NEXT:    movl %edi, %ecx
1098 ; X32-NEXT:    shll $16, %ecx
1099 ; X32-NEXT:    subl %ecx, %edi
1100 ; X32-NEXT:    addl %edi, %edx
1101 ; X32-NEXT:    popl %esi
1102 ; X32-NEXT:    popl %edi
1103 ; X32-NEXT:    popl %ebx
1104 ; X32-NEXT:    retl
1106 ; X64-LABEL: udiv_i64_65537:
1107 ; X64:       # %bb.0: # %entry
1108 ; X64-NEXT:    movq %rdi, %rax
1109 ; X64-NEXT:    movabsq $-281470681808895, %rcx # imm = 0xFFFF0000FFFF0001
1110 ; X64-NEXT:    mulq %rcx
1111 ; X64-NEXT:    movq %rdx, %rax
1112 ; X64-NEXT:    shrq $16, %rax
1113 ; X64-NEXT:    retq
1114 entry:
1115   %rem = udiv i64 %x, 65537
1116   ret i64 %rem
1119 define i64 @udiv_i64_12(i64 %x) nounwind {
1120 ; X32-LABEL: udiv_i64_12:
1121 ; X32:       # %bb.0: # %entry
1122 ; X32-NEXT:    pushl %ebx
1123 ; X32-NEXT:    pushl %edi
1124 ; X32-NEXT:    pushl %esi
1125 ; X32-NEXT:    movl {{[0-9]+}}(%esp), %ecx
1126 ; X32-NEXT:    movl {{[0-9]+}}(%esp), %edi
1127 ; X32-NEXT:    shrdl $2, %edi, %ecx
1128 ; X32-NEXT:    shrl $2, %edi
1129 ; X32-NEXT:    movl %ecx, %esi
1130 ; X32-NEXT:    addl %edi, %esi
1131 ; X32-NEXT:    adcl $0, %esi
1132 ; X32-NEXT:    movl $-1431655765, %ebx # imm = 0xAAAAAAAB
1133 ; X32-NEXT:    movl %esi, %eax
1134 ; X32-NEXT:    mull %ebx
1135 ; X32-NEXT:    shrl %edx
1136 ; X32-NEXT:    leal (%edx,%edx,2), %eax
1137 ; X32-NEXT:    subl %eax, %esi
1138 ; X32-NEXT:    subl %esi, %ecx
1139 ; X32-NEXT:    sbbl $0, %edi
1140 ; X32-NEXT:    movl %ecx, %eax
1141 ; X32-NEXT:    mull %ebx
1142 ; X32-NEXT:    imull $-1431655766, %ecx, %ecx # imm = 0xAAAAAAAA
1143 ; X32-NEXT:    addl %ecx, %edx
1144 ; X32-NEXT:    imull $-1431655765, %edi, %ecx # imm = 0xAAAAAAAB
1145 ; X32-NEXT:    addl %ecx, %edx
1146 ; X32-NEXT:    popl %esi
1147 ; X32-NEXT:    popl %edi
1148 ; X32-NEXT:    popl %ebx
1149 ; X32-NEXT:    retl
1151 ; X64-LABEL: udiv_i64_12:
1152 ; X64:       # %bb.0: # %entry
1153 ; X64-NEXT:    movq %rdi, %rax
1154 ; X64-NEXT:    movabsq $-6148914691236517205, %rcx # imm = 0xAAAAAAAAAAAAAAAB
1155 ; X64-NEXT:    mulq %rcx
1156 ; X64-NEXT:    movq %rdx, %rax
1157 ; X64-NEXT:    shrq $3, %rax
1158 ; X64-NEXT:    retq
1159 entry:
1160   %rem = udiv i64 %x, 12
1161   ret i64 %rem
1164 ; Make sure we don't inline expand for optsize.
1165 define i64 @urem_i64_3_optsize(i64 %x) nounwind optsize {
1166 ; X32-LABEL: urem_i64_3_optsize:
1167 ; X32:       # %bb.0: # %entry
1168 ; X32-NEXT:    subl $12, %esp
1169 ; X32-NEXT:    pushl $0
1170 ; X32-NEXT:    pushl $3
1171 ; X32-NEXT:    pushl {{[0-9]+}}(%esp)
1172 ; X32-NEXT:    pushl {{[0-9]+}}(%esp)
1173 ; X32-NEXT:    calll __umoddi3
1174 ; X32-NEXT:    addl $28, %esp
1175 ; X32-NEXT:    retl
1177 ; X64-LABEL: urem_i64_3_optsize:
1178 ; X64:       # %bb.0: # %entry
1179 ; X64-NEXT:    movabsq $-6148914691236517205, %rcx # imm = 0xAAAAAAAAAAAAAAAB
1180 ; X64-NEXT:    movq %rdi, %rax
1181 ; X64-NEXT:    mulq %rcx
1182 ; X64-NEXT:    shrq %rdx
1183 ; X64-NEXT:    leaq (%rdx,%rdx,2), %rax
1184 ; X64-NEXT:    subq %rax, %rdi
1185 ; X64-NEXT:    movq %rdi, %rax
1186 ; X64-NEXT:    retq
1187 entry:
1188   %rem = urem i64 %x, 3
1189   ret i64 %rem