[ORC] Add std::tuple support to SimplePackedSerialization.
[llvm-project.git] / llvm / test / CodeGen / X86 / udiv_fix_sat.ll
blob91fa594f65543633dc9654efd531a199d2d3d6e1
1 ; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
2 ; RUN: llc < %s -mtriple=x86_64-linux | FileCheck %s --check-prefix=X64
3 ; RUN: llc < %s -mtriple=i686 -mattr=cmov | FileCheck %s --check-prefix=X86
5 declare  i4  @llvm.udiv.fix.sat.i4   (i4,  i4,  i32)
6 declare  i15 @llvm.udiv.fix.sat.i15  (i15, i15, i32)
7 declare  i16 @llvm.udiv.fix.sat.i16  (i16, i16, i32)
8 declare  i18 @llvm.udiv.fix.sat.i18  (i18, i18, i32)
9 declare  i64 @llvm.udiv.fix.sat.i64  (i64, i64, i32)
10 declare  <4 x i32> @llvm.udiv.fix.sat.v4i32(<4 x i32>, <4 x i32>, i32)
12 define i16 @func(i16 %x, i16 %y) nounwind {
13 ; X64-LABEL: func:
14 ; X64:       # %bb.0:
15 ; X64-NEXT:    movzwl %si, %ecx
16 ; X64-NEXT:    movzwl %di, %eax
17 ; X64-NEXT:    shll $8, %eax
18 ; X64-NEXT:    xorl %edx, %edx
19 ; X64-NEXT:    divl %ecx
20 ; X64-NEXT:    cmpl $131071, %eax # imm = 0x1FFFF
21 ; X64-NEXT:    movl $131071, %ecx # imm = 0x1FFFF
22 ; X64-NEXT:    cmovael %ecx, %eax
23 ; X64-NEXT:    shrl %eax
24 ; X64-NEXT:    # kill: def $ax killed $ax killed $eax
25 ; X64-NEXT:    retq
27 ; X86-LABEL: func:
28 ; X86:       # %bb.0:
29 ; X86-NEXT:    movzwl {{[0-9]+}}(%esp), %ecx
30 ; X86-NEXT:    movl {{[0-9]+}}(%esp), %eax
31 ; X86-NEXT:    movzwl %ax, %eax
32 ; X86-NEXT:    shll $8, %eax
33 ; X86-NEXT:    xorl %edx, %edx
34 ; X86-NEXT:    divl %ecx
35 ; X86-NEXT:    cmpl $131071, %eax # imm = 0x1FFFF
36 ; X86-NEXT:    movl $131071, %ecx # imm = 0x1FFFF
37 ; X86-NEXT:    cmovael %ecx, %eax
38 ; X86-NEXT:    shrl %eax
39 ; X86-NEXT:    # kill: def $ax killed $ax killed $eax
40 ; X86-NEXT:    retl
41   %tmp = call i16 @llvm.udiv.fix.sat.i16(i16 %x, i16 %y, i32 7)
42   ret i16 %tmp
45 define i16 @func2(i8 %x, i8 %y) nounwind {
46 ; X64-LABEL: func2:
47 ; X64:       # %bb.0:
48 ; X64-NEXT:    movsbl %dil, %eax
49 ; X64-NEXT:    andl $32767, %eax # imm = 0x7FFF
50 ; X64-NEXT:    movsbl %sil, %ecx
51 ; X64-NEXT:    andl $32767, %ecx # imm = 0x7FFF
52 ; X64-NEXT:    shll $14, %eax
53 ; X64-NEXT:    xorl %edx, %edx
54 ; X64-NEXT:    divl %ecx
55 ; X64-NEXT:    cmpl $32767, %eax # imm = 0x7FFF
56 ; X64-NEXT:    movl $32767, %ecx # imm = 0x7FFF
57 ; X64-NEXT:    cmovbl %eax, %ecx
58 ; X64-NEXT:    addl %ecx, %ecx
59 ; X64-NEXT:    movswl %cx, %eax
60 ; X64-NEXT:    shrl %eax
61 ; X64-NEXT:    # kill: def $ax killed $ax killed $eax
62 ; X64-NEXT:    retq
64 ; X86-LABEL: func2:
65 ; X86:       # %bb.0:
66 ; X86-NEXT:    movsbl {{[0-9]+}}(%esp), %ecx
67 ; X86-NEXT:    andl $32767, %ecx # imm = 0x7FFF
68 ; X86-NEXT:    movsbl {{[0-9]+}}(%esp), %eax
69 ; X86-NEXT:    andl $32767, %eax # imm = 0x7FFF
70 ; X86-NEXT:    shll $14, %eax
71 ; X86-NEXT:    xorl %edx, %edx
72 ; X86-NEXT:    divl %ecx
73 ; X86-NEXT:    cmpl $32767, %eax # imm = 0x7FFF
74 ; X86-NEXT:    movl $32767, %ecx # imm = 0x7FFF
75 ; X86-NEXT:    cmovbl %eax, %ecx
76 ; X86-NEXT:    addl %ecx, %ecx
77 ; X86-NEXT:    movswl %cx, %eax
78 ; X86-NEXT:    shrl %eax
79 ; X86-NEXT:    # kill: def $ax killed $ax killed $eax
80 ; X86-NEXT:    retl
81   %x2 = sext i8 %x to i15
82   %y2 = sext i8 %y to i15
83   %tmp = call i15 @llvm.udiv.fix.sat.i15(i15 %x2, i15 %y2, i32 14)
84   %tmp2 = sext i15 %tmp to i16
85   ret i16 %tmp2
88 define i16 @func3(i15 %x, i8 %y) nounwind {
89 ; X64-LABEL: func3:
90 ; X64:       # %bb.0:
91 ; X64-NEXT:    # kill: def $edi killed $edi def $rdi
92 ; X64-NEXT:    leal (%rdi,%rdi), %eax
93 ; X64-NEXT:    movzbl %sil, %ecx
94 ; X64-NEXT:    shll $4, %ecx
95 ; X64-NEXT:    # kill: def $ax killed $ax killed $eax
96 ; X64-NEXT:    xorl %edx, %edx
97 ; X64-NEXT:    divw %cx
98 ; X64-NEXT:    # kill: def $ax killed $ax def $eax
99 ; X64-NEXT:    movzwl %ax, %ecx
100 ; X64-NEXT:    cmpl $32767, %ecx # imm = 0x7FFF
101 ; X64-NEXT:    movl $32767, %ecx # imm = 0x7FFF
102 ; X64-NEXT:    cmovbl %eax, %ecx
103 ; X64-NEXT:    addl %ecx, %ecx
104 ; X64-NEXT:    movswl %cx, %eax
105 ; X64-NEXT:    shrl %eax
106 ; X64-NEXT:    # kill: def $ax killed $ax killed $eax
107 ; X64-NEXT:    retq
109 ; X86-LABEL: func3:
110 ; X86:       # %bb.0:
111 ; X86-NEXT:    movl {{[0-9]+}}(%esp), %eax
112 ; X86-NEXT:    movl {{[0-9]+}}(%esp), %ecx
113 ; X86-NEXT:    addl %eax, %eax
114 ; X86-NEXT:    movzbl %cl, %ecx
115 ; X86-NEXT:    shll $4, %ecx
116 ; X86-NEXT:    # kill: def $ax killed $ax killed $eax
117 ; X86-NEXT:    xorl %edx, %edx
118 ; X86-NEXT:    divw %cx
119 ; X86-NEXT:    # kill: def $ax killed $ax def $eax
120 ; X86-NEXT:    movzwl %ax, %ecx
121 ; X86-NEXT:    cmpl $32767, %ecx # imm = 0x7FFF
122 ; X86-NEXT:    movl $32767, %ecx # imm = 0x7FFF
123 ; X86-NEXT:    cmovbl %eax, %ecx
124 ; X86-NEXT:    addl %ecx, %ecx
125 ; X86-NEXT:    movswl %cx, %eax
126 ; X86-NEXT:    shrl %eax
127 ; X86-NEXT:    # kill: def $ax killed $ax killed $eax
128 ; X86-NEXT:    retl
129   %y2 = sext i8 %y to i15
130   %y3 = shl i15 %y2, 7
131   %tmp = call i15 @llvm.udiv.fix.sat.i15(i15 %x, i15 %y3, i32 4)
132   %tmp2 = sext i15 %tmp to i16
133   ret i16 %tmp2
136 define i4 @func4(i4 %x, i4 %y) nounwind {
137 ; X64-LABEL: func4:
138 ; X64:       # %bb.0:
139 ; X64-NEXT:    andb $15, %sil
140 ; X64-NEXT:    andb $15, %dil
141 ; X64-NEXT:    shlb $2, %dil
142 ; X64-NEXT:    movzbl %dil, %eax
143 ; X64-NEXT:    divb %sil
144 ; X64-NEXT:    movzbl %al, %ecx
145 ; X64-NEXT:    cmpb $15, %cl
146 ; X64-NEXT:    movl $15, %eax
147 ; X64-NEXT:    cmovbl %ecx, %eax
148 ; X64-NEXT:    # kill: def $al killed $al killed $eax
149 ; X64-NEXT:    retq
151 ; X86-LABEL: func4:
152 ; X86:       # %bb.0:
153 ; X86-NEXT:    movb {{[0-9]+}}(%esp), %cl
154 ; X86-NEXT:    andb $15, %cl
155 ; X86-NEXT:    movb {{[0-9]+}}(%esp), %al
156 ; X86-NEXT:    andb $15, %al
157 ; X86-NEXT:    shlb $2, %al
158 ; X86-NEXT:    movzbl %al, %eax
159 ; X86-NEXT:    divb %cl
160 ; X86-NEXT:    movzbl %al, %ecx
161 ; X86-NEXT:    cmpb $15, %al
162 ; X86-NEXT:    movl $15, %eax
163 ; X86-NEXT:    cmovbl %ecx, %eax
164 ; X86-NEXT:    # kill: def $al killed $al killed $eax
165 ; X86-NEXT:    retl
166   %tmp = call i4 @llvm.udiv.fix.sat.i4(i4 %x, i4 %y, i32 2)
167   ret i4 %tmp
170 define i64 @func5(i64 %x, i64 %y) nounwind {
171 ; X64-LABEL: func5:
172 ; X64:       # %bb.0:
173 ; X64-NEXT:    pushq %rax
174 ; X64-NEXT:    movq %rsi, %rdx
175 ; X64-NEXT:    leaq (%rdi,%rdi), %rsi
176 ; X64-NEXT:    movq %rdi, %rax
177 ; X64-NEXT:    shrq $63, %rax
178 ; X64-NEXT:    shrdq $33, %rax, %rsi
179 ; X64-NEXT:    shlq $32, %rdi
180 ; X64-NEXT:    xorl %ecx, %ecx
181 ; X64-NEXT:    callq __udivti3@PLT
182 ; X64-NEXT:    cmpq $2, %rdx
183 ; X64-NEXT:    movq $-1, %rcx
184 ; X64-NEXT:    cmovbq %rax, %rcx
185 ; X64-NEXT:    cmpq $1, %rdx
186 ; X64-NEXT:    movl $1, %eax
187 ; X64-NEXT:    cmovbq %rdx, %rax
188 ; X64-NEXT:    shldq $63, %rcx, %rax
189 ; X64-NEXT:    popq %rcx
190 ; X64-NEXT:    retq
192 ; X86-LABEL: func5:
193 ; X86:       # %bb.0:
194 ; X86-NEXT:    pushl %ebp
195 ; X86-NEXT:    movl %esp, %ebp
196 ; X86-NEXT:    pushl %esi
197 ; X86-NEXT:    andl $-8, %esp
198 ; X86-NEXT:    subl $24, %esp
199 ; X86-NEXT:    movl 8(%ebp), %eax
200 ; X86-NEXT:    movl 12(%ebp), %ecx
201 ; X86-NEXT:    movl %ecx, %edx
202 ; X86-NEXT:    shrl %edx
203 ; X86-NEXT:    shldl $31, %eax, %ecx
204 ; X86-NEXT:    shll $31, %eax
205 ; X86-NEXT:    movl %esp, %esi
206 ; X86-NEXT:    pushl $0
207 ; X86-NEXT:    pushl $0
208 ; X86-NEXT:    pushl 20(%ebp)
209 ; X86-NEXT:    pushl 16(%ebp)
210 ; X86-NEXT:    pushl $0
211 ; X86-NEXT:    pushl %edx
212 ; X86-NEXT:    pushl %ecx
213 ; X86-NEXT:    pushl %eax
214 ; X86-NEXT:    pushl %esi
215 ; X86-NEXT:    calll __udivti3
216 ; X86-NEXT:    addl $32, %esp
217 ; X86-NEXT:    movl {{[0-9]+}}(%esp), %eax
218 ; X86-NEXT:    orl {{[0-9]+}}(%esp), %eax
219 ; X86-NEXT:    movl $-1, %eax
220 ; X86-NEXT:    movl $-1, %edx
221 ; X86-NEXT:    jne .LBB4_2
222 ; X86-NEXT:  # %bb.1:
223 ; X86-NEXT:    movl (%esp), %eax
224 ; X86-NEXT:    movl {{[0-9]+}}(%esp), %edx
225 ; X86-NEXT:  .LBB4_2:
226 ; X86-NEXT:    leal -4(%ebp), %esp
227 ; X86-NEXT:    popl %esi
228 ; X86-NEXT:    popl %ebp
229 ; X86-NEXT:    retl
230   %tmp = call i64 @llvm.udiv.fix.sat.i64(i64 %x, i64 %y, i32 31)
231   ret i64 %tmp
234 define i18 @func6(i16 %x, i16 %y) nounwind {
235 ; X64-LABEL: func6:
236 ; X64:       # %bb.0:
237 ; X64-NEXT:    movswl %di, %eax
238 ; X64-NEXT:    andl $262143, %eax # imm = 0x3FFFF
239 ; X64-NEXT:    movswl %si, %ecx
240 ; X64-NEXT:    andl $262143, %ecx # imm = 0x3FFFF
241 ; X64-NEXT:    shll $7, %eax
242 ; X64-NEXT:    xorl %edx, %edx
243 ; X64-NEXT:    divl %ecx
244 ; X64-NEXT:    cmpl $262143, %eax # imm = 0x3FFFF
245 ; X64-NEXT:    movl $262143, %ecx # imm = 0x3FFFF
246 ; X64-NEXT:    cmovael %ecx, %eax
247 ; X64-NEXT:    retq
249 ; X86-LABEL: func6:
250 ; X86:       # %bb.0:
251 ; X86-NEXT:    movswl {{[0-9]+}}(%esp), %ecx
252 ; X86-NEXT:    andl $262143, %ecx # imm = 0x3FFFF
253 ; X86-NEXT:    movswl {{[0-9]+}}(%esp), %eax
254 ; X86-NEXT:    andl $262143, %eax # imm = 0x3FFFF
255 ; X86-NEXT:    shll $7, %eax
256 ; X86-NEXT:    xorl %edx, %edx
257 ; X86-NEXT:    divl %ecx
258 ; X86-NEXT:    cmpl $262143, %eax # imm = 0x3FFFF
259 ; X86-NEXT:    movl $262143, %ecx # imm = 0x3FFFF
260 ; X86-NEXT:    cmovael %ecx, %eax
261 ; X86-NEXT:    retl
262   %x2 = sext i16 %x to i18
263   %y2 = sext i16 %y to i18
264   %tmp = call i18 @llvm.udiv.fix.sat.i18(i18 %x2, i18 %y2, i32 7)
265   ret i18 %tmp
268 define i16 @func7(i16 %x, i16 %y) nounwind {
269 ; X64-LABEL: func7:
270 ; X64:       # %bb.0:
271 ; X64-NEXT:    movzwl %si, %ecx
272 ; X64-NEXT:    movzwl %di, %eax
273 ; X64-NEXT:    addl %eax, %eax
274 ; X64-NEXT:    shlq $16, %rax
275 ; X64-NEXT:    xorl %edx, %edx
276 ; X64-NEXT:    divq %rcx
277 ; X64-NEXT:    cmpq $131071, %rax # imm = 0x1FFFF
278 ; X64-NEXT:    movl $131071, %ecx # imm = 0x1FFFF
279 ; X64-NEXT:    cmovaeq %rcx, %rax
280 ; X64-NEXT:    shrl %eax
281 ; X64-NEXT:    # kill: def $ax killed $ax killed $rax
282 ; X64-NEXT:    retq
284 ; X86-LABEL: func7:
285 ; X86:       # %bb.0:
286 ; X86-NEXT:    movzwl {{[0-9]+}}(%esp), %eax
287 ; X86-NEXT:    movl {{[0-9]+}}(%esp), %ecx
288 ; X86-NEXT:    movzwl %cx, %ecx
289 ; X86-NEXT:    addl %ecx, %ecx
290 ; X86-NEXT:    movl %ecx, %edx
291 ; X86-NEXT:    shrl $16, %edx
292 ; X86-NEXT:    shll $16, %ecx
293 ; X86-NEXT:    pushl $0
294 ; X86-NEXT:    pushl %eax
295 ; X86-NEXT:    pushl %edx
296 ; X86-NEXT:    pushl %ecx
297 ; X86-NEXT:    calll __udivdi3
298 ; X86-NEXT:    addl $16, %esp
299 ; X86-NEXT:    cmpl $131071, %eax # imm = 0x1FFFF
300 ; X86-NEXT:    movl $131071, %ecx # imm = 0x1FFFF
301 ; X86-NEXT:    cmovael %ecx, %eax
302 ; X86-NEXT:    testl %edx, %edx
303 ; X86-NEXT:    cmovnel %ecx, %eax
304 ; X86-NEXT:    shrl %eax
305 ; X86-NEXT:    # kill: def $ax killed $ax killed $eax
306 ; X86-NEXT:    retl
307   %tmp = call i16 @llvm.udiv.fix.sat.i16(i16 %x, i16 %y, i32 16)
308   ret i16 %tmp
311 define <4 x i32> @vec(<4 x i32> %x, <4 x i32> %y) nounwind {
312 ; X64-LABEL: vec:
313 ; X64:       # %bb.0:
314 ; X64-NEXT:    pxor %xmm8, %xmm8
315 ; X64-NEXT:    movdqa %xmm1, %xmm2
316 ; X64-NEXT:    punpckhdq {{.*#+}} xmm2 = xmm2[2],xmm8[2],xmm2[3],xmm8[3]
317 ; X64-NEXT:    movq %xmm2, %rcx
318 ; X64-NEXT:    movdqa %xmm0, %xmm2
319 ; X64-NEXT:    punpckhdq {{.*#+}} xmm2 = xmm2[2],xmm8[2],xmm2[3],xmm8[3]
320 ; X64-NEXT:    paddq %xmm2, %xmm2
321 ; X64-NEXT:    psllq $31, %xmm2
322 ; X64-NEXT:    movq %xmm2, %rax
323 ; X64-NEXT:    xorl %edx, %edx
324 ; X64-NEXT:    divq %rcx
325 ; X64-NEXT:    movq %rax, %xmm7
326 ; X64-NEXT:    pshufd {{.*#+}} xmm2 = xmm2[2,3,2,3]
327 ; X64-NEXT:    movq %xmm2, %rax
328 ; X64-NEXT:    movdqa %xmm1, %xmm2
329 ; X64-NEXT:    psrldq {{.*#+}} xmm2 = xmm2[12,13,14,15],zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero,zero
330 ; X64-NEXT:    movq %xmm2, %rcx
331 ; X64-NEXT:    xorl %edx, %edx
332 ; X64-NEXT:    divq %rcx
333 ; X64-NEXT:    movq %rax, %xmm2
334 ; X64-NEXT:    punpcklqdq {{.*#+}} xmm7 = xmm7[0],xmm2[0]
335 ; X64-NEXT:    movdqa {{.*#+}} xmm3 = [9223372039002259456,9223372039002259456]
336 ; X64-NEXT:    movdqa %xmm7, %xmm2
337 ; X64-NEXT:    pxor %xmm3, %xmm2
338 ; X64-NEXT:    movdqa {{.*#+}} xmm9 = [9223372043297226751,9223372043297226751]
339 ; X64-NEXT:    movdqa %xmm9, %xmm6
340 ; X64-NEXT:    pcmpgtd %xmm2, %xmm6
341 ; X64-NEXT:    pshufd {{.*#+}} xmm4 = xmm6[0,0,2,2]
342 ; X64-NEXT:    pcmpeqd %xmm9, %xmm2
343 ; X64-NEXT:    pshufd {{.*#+}} xmm5 = xmm2[1,1,3,3]
344 ; X64-NEXT:    pand %xmm4, %xmm5
345 ; X64-NEXT:    pshufd {{.*#+}} xmm2 = xmm6[1,1,3,3]
346 ; X64-NEXT:    por %xmm5, %xmm2
347 ; X64-NEXT:    movdqa {{.*#+}} xmm6 = [8589934591,8589934591]
348 ; X64-NEXT:    pand %xmm2, %xmm7
349 ; X64-NEXT:    pandn %xmm6, %xmm2
350 ; X64-NEXT:    por %xmm7, %xmm2
351 ; X64-NEXT:    psrlq $1, %xmm2
352 ; X64-NEXT:    punpckldq {{.*#+}} xmm0 = xmm0[0],xmm8[0],xmm0[1],xmm8[1]
353 ; X64-NEXT:    paddq %xmm0, %xmm0
354 ; X64-NEXT:    psllq $31, %xmm0
355 ; X64-NEXT:    movq %xmm0, %rax
356 ; X64-NEXT:    movd %xmm1, %ecx
357 ; X64-NEXT:    xorl %edx, %edx
358 ; X64-NEXT:    divq %rcx
359 ; X64-NEXT:    movq %rax, %xmm4
360 ; X64-NEXT:    pshufd {{.*#+}} xmm0 = xmm0[2,3,2,3]
361 ; X64-NEXT:    movq %xmm0, %rax
362 ; X64-NEXT:    psrlq $32, %xmm1
363 ; X64-NEXT:    movq %xmm1, %rcx
364 ; X64-NEXT:    xorl %edx, %edx
365 ; X64-NEXT:    divq %rcx
366 ; X64-NEXT:    movq %rax, %xmm0
367 ; X64-NEXT:    punpcklqdq {{.*#+}} xmm4 = xmm4[0],xmm0[0]
368 ; X64-NEXT:    pxor %xmm4, %xmm3
369 ; X64-NEXT:    movdqa %xmm9, %xmm0
370 ; X64-NEXT:    pcmpgtd %xmm3, %xmm0
371 ; X64-NEXT:    pshufd {{.*#+}} xmm1 = xmm0[0,0,2,2]
372 ; X64-NEXT:    pcmpeqd %xmm9, %xmm3
373 ; X64-NEXT:    pshufd {{.*#+}} xmm3 = xmm3[1,1,3,3]
374 ; X64-NEXT:    pand %xmm1, %xmm3
375 ; X64-NEXT:    pshufd {{.*#+}} xmm0 = xmm0[1,1,3,3]
376 ; X64-NEXT:    por %xmm3, %xmm0
377 ; X64-NEXT:    pand %xmm0, %xmm4
378 ; X64-NEXT:    pandn %xmm6, %xmm0
379 ; X64-NEXT:    por %xmm4, %xmm0
380 ; X64-NEXT:    psrlq $1, %xmm0
381 ; X64-NEXT:    shufps {{.*#+}} xmm0 = xmm0[0,2],xmm2[0,2]
382 ; X64-NEXT:    retq
384 ; X86-LABEL: vec:
385 ; X86:       # %bb.0:
386 ; X86-NEXT:    pushl %ebp
387 ; X86-NEXT:    pushl %ebx
388 ; X86-NEXT:    pushl %edi
389 ; X86-NEXT:    pushl %esi
390 ; X86-NEXT:    subl $12, %esp
391 ; X86-NEXT:    movl {{[0-9]+}}(%esp), %esi
392 ; X86-NEXT:    movl {{[0-9]+}}(%esp), %edi
393 ; X86-NEXT:    movl {{[0-9]+}}(%esp), %ebp
394 ; X86-NEXT:    movl {{[0-9]+}}(%esp), %ebx
395 ; X86-NEXT:    movl {{[0-9]+}}(%esp), %ecx
396 ; X86-NEXT:    xorl %eax, %eax
397 ; X86-NEXT:    addl %ecx, %ecx
398 ; X86-NEXT:    setb %al
399 ; X86-NEXT:    shldl $31, %ecx, %eax
400 ; X86-NEXT:    shll $31, %ecx
401 ; X86-NEXT:    pushl $0
402 ; X86-NEXT:    pushl {{[0-9]+}}(%esp)
403 ; X86-NEXT:    pushl %eax
404 ; X86-NEXT:    pushl %ecx
405 ; X86-NEXT:    calll __udivdi3
406 ; X86-NEXT:    addl $16, %esp
407 ; X86-NEXT:    movl %eax, {{[-0-9]+}}(%e{{[sb]}}p) # 4-byte Spill
408 ; X86-NEXT:    movl %edx, {{[-0-9]+}}(%e{{[sb]}}p) # 4-byte Spill
409 ; X86-NEXT:    xorl %eax, %eax
410 ; X86-NEXT:    addl %ebp, %ebp
411 ; X86-NEXT:    setb %al
412 ; X86-NEXT:    shldl $31, %ebp, %eax
413 ; X86-NEXT:    shll $31, %ebp
414 ; X86-NEXT:    pushl $0
415 ; X86-NEXT:    pushl %ebx
416 ; X86-NEXT:    pushl %eax
417 ; X86-NEXT:    pushl %ebp
418 ; X86-NEXT:    calll __udivdi3
419 ; X86-NEXT:    addl $16, %esp
420 ; X86-NEXT:    movl %eax, (%esp) # 4-byte Spill
421 ; X86-NEXT:    movl %edx, %ebp
422 ; X86-NEXT:    xorl %eax, %eax
423 ; X86-NEXT:    addl %edi, %edi
424 ; X86-NEXT:    setb %al
425 ; X86-NEXT:    shldl $31, %edi, %eax
426 ; X86-NEXT:    shll $31, %edi
427 ; X86-NEXT:    pushl $0
428 ; X86-NEXT:    pushl {{[0-9]+}}(%esp)
429 ; X86-NEXT:    pushl %eax
430 ; X86-NEXT:    pushl %edi
431 ; X86-NEXT:    calll __udivdi3
432 ; X86-NEXT:    addl $16, %esp
433 ; X86-NEXT:    movl %eax, %ebx
434 ; X86-NEXT:    movl %edx, %edi
435 ; X86-NEXT:    xorl %eax, %eax
436 ; X86-NEXT:    addl %esi, %esi
437 ; X86-NEXT:    setb %al
438 ; X86-NEXT:    shldl $31, %esi, %eax
439 ; X86-NEXT:    shll $31, %esi
440 ; X86-NEXT:    pushl $0
441 ; X86-NEXT:    pushl {{[0-9]+}}(%esp)
442 ; X86-NEXT:    pushl %eax
443 ; X86-NEXT:    pushl %esi
444 ; X86-NEXT:    calll __udivdi3
445 ; X86-NEXT:    addl $16, %esp
446 ; X86-NEXT:    cmpl $2, %edx
447 ; X86-NEXT:    movl $-1, %ecx
448 ; X86-NEXT:    cmovael %ecx, %eax
449 ; X86-NEXT:    cmpl $1, %edx
450 ; X86-NEXT:    movl $1, %esi
451 ; X86-NEXT:    cmovael %esi, %edx
452 ; X86-NEXT:    shldl $31, %eax, %edx
453 ; X86-NEXT:    cmpl $2, %edi
454 ; X86-NEXT:    cmovael %ecx, %ebx
455 ; X86-NEXT:    cmpl $1, %edi
456 ; X86-NEXT:    cmovael %esi, %edi
457 ; X86-NEXT:    shldl $31, %ebx, %edi
458 ; X86-NEXT:    cmpl $2, %ebp
459 ; X86-NEXT:    movl (%esp), %eax # 4-byte Reload
460 ; X86-NEXT:    cmovael %ecx, %eax
461 ; X86-NEXT:    cmpl $1, %ebp
462 ; X86-NEXT:    cmovael %esi, %ebp
463 ; X86-NEXT:    shldl $31, %eax, %ebp
464 ; X86-NEXT:    movl {{[-0-9]+}}(%e{{[sb]}}p), %ebx # 4-byte Reload
465 ; X86-NEXT:    cmpl $2, %ebx
466 ; X86-NEXT:    movl {{[-0-9]+}}(%e{{[sb]}}p), %eax # 4-byte Reload
467 ; X86-NEXT:    cmovael %ecx, %eax
468 ; X86-NEXT:    cmpl $1, %ebx
469 ; X86-NEXT:    cmovbl %ebx, %esi
470 ; X86-NEXT:    shldl $31, %eax, %esi
471 ; X86-NEXT:    movl {{[0-9]+}}(%esp), %eax
472 ; X86-NEXT:    movl %esi, 12(%eax)
473 ; X86-NEXT:    movl %ebp, 8(%eax)
474 ; X86-NEXT:    movl %edi, 4(%eax)
475 ; X86-NEXT:    movl %edx, (%eax)
476 ; X86-NEXT:    addl $12, %esp
477 ; X86-NEXT:    popl %esi
478 ; X86-NEXT:    popl %edi
479 ; X86-NEXT:    popl %ebx
480 ; X86-NEXT:    popl %ebp
481 ; X86-NEXT:    retl $4
482   %tmp = call <4 x i32> @llvm.udiv.fix.sat.v4i32(<4 x i32> %x, <4 x i32> %y, i32 31)
483   ret <4 x i32> %tmp