[ORC] Add std::tuple support to SimplePackedSerialization.
[llvm-project.git] / llvm / test / CodeGen / X86 / 64-bit-shift-by-32-minus-y.ll
bloba8e433eac1320b637bd18084e7353582d3272416
1 ; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
2 ; RUN: llc < %s -mtriple=x86_64-unknown-unknown              | FileCheck %s --check-prefixes=X64-NOBMI2
3 ; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+bmi2 | FileCheck %s --check-prefixes=X64-BMI2
4 ; RUN: llc < %s -mtriple=i686-unknown-unknown                | FileCheck %s --check-prefixes=X32-NOBMI2
5 ; RUN: llc < %s -mtriple=i686-unknown-unknown   -mattr=+bmi2 | FileCheck %s --check-prefixes=X32-BMI2
7 define i64 @t0(i64 %val, i64 %shamt) nounwind {
8 ; X64-NOBMI2-LABEL: t0:
9 ; X64-NOBMI2:       # %bb.0:
10 ; X64-NOBMI2-NEXT:    movq %rdi, %rax
11 ; X64-NOBMI2-NEXT:    leaq 32(%rsi), %rcx
12 ; X64-NOBMI2-NEXT:    negq %rcx
13 ; X64-NOBMI2-NEXT:    # kill: def $cl killed $cl killed $rcx
14 ; X64-NOBMI2-NEXT:    shlq %cl, %rax
15 ; X64-NOBMI2-NEXT:    retq
17 ; X64-BMI2-LABEL: t0:
18 ; X64-BMI2:       # %bb.0:
19 ; X64-BMI2-NEXT:    addq $32, %rsi
20 ; X64-BMI2-NEXT:    negq %rsi
21 ; X64-BMI2-NEXT:    shlxq %rsi, %rdi, %rax
22 ; X64-BMI2-NEXT:    retq
24 ; X32-NOBMI2-LABEL: t0:
25 ; X32-NOBMI2:       # %bb.0:
26 ; X32-NOBMI2-NEXT:    pushl %esi
27 ; X32-NOBMI2-NEXT:    movl {{[0-9]+}}(%esp), %esi
28 ; X32-NOBMI2-NEXT:    movl {{[0-9]+}}(%esp), %edx
29 ; X32-NOBMI2-NEXT:    movb $32, %cl
30 ; X32-NOBMI2-NEXT:    subb {{[0-9]+}}(%esp), %cl
31 ; X32-NOBMI2-NEXT:    movl %esi, %eax
32 ; X32-NOBMI2-NEXT:    shll %cl, %eax
33 ; X32-NOBMI2-NEXT:    shldl %cl, %esi, %edx
34 ; X32-NOBMI2-NEXT:    testb $32, %cl
35 ; X32-NOBMI2-NEXT:    je .LBB0_2
36 ; X32-NOBMI2-NEXT:  # %bb.1:
37 ; X32-NOBMI2-NEXT:    movl %eax, %edx
38 ; X32-NOBMI2-NEXT:    xorl %eax, %eax
39 ; X32-NOBMI2-NEXT:  .LBB0_2:
40 ; X32-NOBMI2-NEXT:    popl %esi
41 ; X32-NOBMI2-NEXT:    retl
43 ; X32-BMI2-LABEL: t0:
44 ; X32-BMI2:       # %bb.0:
45 ; X32-BMI2-NEXT:    movl {{[0-9]+}}(%esp), %eax
46 ; X32-BMI2-NEXT:    movl {{[0-9]+}}(%esp), %edx
47 ; X32-BMI2-NEXT:    movb $32, %cl
48 ; X32-BMI2-NEXT:    subb {{[0-9]+}}(%esp), %cl
49 ; X32-BMI2-NEXT:    shldl %cl, %eax, %edx
50 ; X32-BMI2-NEXT:    shlxl %ecx, %eax, %eax
51 ; X32-BMI2-NEXT:    testb $32, %cl
52 ; X32-BMI2-NEXT:    je .LBB0_2
53 ; X32-BMI2-NEXT:  # %bb.1:
54 ; X32-BMI2-NEXT:    movl %eax, %edx
55 ; X32-BMI2-NEXT:    xorl %eax, %eax
56 ; X32-BMI2-NEXT:  .LBB0_2:
57 ; X32-BMI2-NEXT:    retl
58   %negshamt = sub i64 32, %shamt
59   %shifted = shl i64 %val, %negshamt
60   ret i64 %shifted
63 ; The constant we are subtracting from should be a multiple of 32.
64 define i64 @n1(i64 %val, i64 %shamt) nounwind {
65 ; X64-NOBMI2-LABEL: n1:
66 ; X64-NOBMI2:       # %bb.0:
67 ; X64-NOBMI2-NEXT:    movq %rdi, %rax
68 ; X64-NOBMI2-NEXT:    movb $33, %cl
69 ; X64-NOBMI2-NEXT:    subb %sil, %cl
70 ; X64-NOBMI2-NEXT:    shlq %cl, %rax
71 ; X64-NOBMI2-NEXT:    retq
73 ; X64-BMI2-LABEL: n1:
74 ; X64-BMI2:       # %bb.0:
75 ; X64-BMI2-NEXT:    movb $33, %al
76 ; X64-BMI2-NEXT:    subb %sil, %al
77 ; X64-BMI2-NEXT:    shlxq %rax, %rdi, %rax
78 ; X64-BMI2-NEXT:    retq
80 ; X32-NOBMI2-LABEL: n1:
81 ; X32-NOBMI2:       # %bb.0:
82 ; X32-NOBMI2-NEXT:    pushl %esi
83 ; X32-NOBMI2-NEXT:    movl {{[0-9]+}}(%esp), %esi
84 ; X32-NOBMI2-NEXT:    movl {{[0-9]+}}(%esp), %edx
85 ; X32-NOBMI2-NEXT:    movb $33, %cl
86 ; X32-NOBMI2-NEXT:    subb {{[0-9]+}}(%esp), %cl
87 ; X32-NOBMI2-NEXT:    movl %esi, %eax
88 ; X32-NOBMI2-NEXT:    shll %cl, %eax
89 ; X32-NOBMI2-NEXT:    shldl %cl, %esi, %edx
90 ; X32-NOBMI2-NEXT:    testb $32, %cl
91 ; X32-NOBMI2-NEXT:    je .LBB1_2
92 ; X32-NOBMI2-NEXT:  # %bb.1:
93 ; X32-NOBMI2-NEXT:    movl %eax, %edx
94 ; X32-NOBMI2-NEXT:    xorl %eax, %eax
95 ; X32-NOBMI2-NEXT:  .LBB1_2:
96 ; X32-NOBMI2-NEXT:    popl %esi
97 ; X32-NOBMI2-NEXT:    retl
99 ; X32-BMI2-LABEL: n1:
100 ; X32-BMI2:       # %bb.0:
101 ; X32-BMI2-NEXT:    movl {{[0-9]+}}(%esp), %eax
102 ; X32-BMI2-NEXT:    movl {{[0-9]+}}(%esp), %edx
103 ; X32-BMI2-NEXT:    movb $33, %cl
104 ; X32-BMI2-NEXT:    subb {{[0-9]+}}(%esp), %cl
105 ; X32-BMI2-NEXT:    shldl %cl, %eax, %edx
106 ; X32-BMI2-NEXT:    shlxl %ecx, %eax, %eax
107 ; X32-BMI2-NEXT:    testb $32, %cl
108 ; X32-BMI2-NEXT:    je .LBB1_2
109 ; X32-BMI2-NEXT:  # %bb.1:
110 ; X32-BMI2-NEXT:    movl %eax, %edx
111 ; X32-BMI2-NEXT:    xorl %eax, %eax
112 ; X32-BMI2-NEXT:  .LBB1_2:
113 ; X32-BMI2-NEXT:    retl
114   %negshamt = sub i64 33, %shamt
115   %shifted = shl i64 %val, %negshamt
116   ret i64 %shifted
118 define i64 @n2(i64 %val, i64 %shamt) nounwind {
119 ; X64-NOBMI2-LABEL: n2:
120 ; X64-NOBMI2:       # %bb.0:
121 ; X64-NOBMI2-NEXT:    movq %rdi, %rax
122 ; X64-NOBMI2-NEXT:    movb $31, %cl
123 ; X64-NOBMI2-NEXT:    subb %sil, %cl
124 ; X64-NOBMI2-NEXT:    shlq %cl, %rax
125 ; X64-NOBMI2-NEXT:    retq
127 ; X64-BMI2-LABEL: n2:
128 ; X64-BMI2:       # %bb.0:
129 ; X64-BMI2-NEXT:    movb $31, %al
130 ; X64-BMI2-NEXT:    subb %sil, %al
131 ; X64-BMI2-NEXT:    shlxq %rax, %rdi, %rax
132 ; X64-BMI2-NEXT:    retq
134 ; X32-NOBMI2-LABEL: n2:
135 ; X32-NOBMI2:       # %bb.0:
136 ; X32-NOBMI2-NEXT:    pushl %esi
137 ; X32-NOBMI2-NEXT:    movl {{[0-9]+}}(%esp), %esi
138 ; X32-NOBMI2-NEXT:    movl {{[0-9]+}}(%esp), %edx
139 ; X32-NOBMI2-NEXT:    movb $31, %cl
140 ; X32-NOBMI2-NEXT:    subb {{[0-9]+}}(%esp), %cl
141 ; X32-NOBMI2-NEXT:    movl %esi, %eax
142 ; X32-NOBMI2-NEXT:    shll %cl, %eax
143 ; X32-NOBMI2-NEXT:    shldl %cl, %esi, %edx
144 ; X32-NOBMI2-NEXT:    testb $32, %cl
145 ; X32-NOBMI2-NEXT:    je .LBB2_2
146 ; X32-NOBMI2-NEXT:  # %bb.1:
147 ; X32-NOBMI2-NEXT:    movl %eax, %edx
148 ; X32-NOBMI2-NEXT:    xorl %eax, %eax
149 ; X32-NOBMI2-NEXT:  .LBB2_2:
150 ; X32-NOBMI2-NEXT:    popl %esi
151 ; X32-NOBMI2-NEXT:    retl
153 ; X32-BMI2-LABEL: n2:
154 ; X32-BMI2:       # %bb.0:
155 ; X32-BMI2-NEXT:    movl {{[0-9]+}}(%esp), %eax
156 ; X32-BMI2-NEXT:    movl {{[0-9]+}}(%esp), %edx
157 ; X32-BMI2-NEXT:    movb $31, %cl
158 ; X32-BMI2-NEXT:    subb {{[0-9]+}}(%esp), %cl
159 ; X32-BMI2-NEXT:    shldl %cl, %eax, %edx
160 ; X32-BMI2-NEXT:    shlxl %ecx, %eax, %eax
161 ; X32-BMI2-NEXT:    testb $32, %cl
162 ; X32-BMI2-NEXT:    je .LBB2_2
163 ; X32-BMI2-NEXT:  # %bb.1:
164 ; X32-BMI2-NEXT:    movl %eax, %edx
165 ; X32-BMI2-NEXT:    xorl %eax, %eax
166 ; X32-BMI2-NEXT:  .LBB2_2:
167 ; X32-BMI2-NEXT:    retl
168   %negshamt = sub i64 31, %shamt
169   %shifted = shl i64 %val, %negshamt
170   ret i64 %shifted
173 define i64 @t3(i64 %val, i64 %shamt) nounwind {
174 ; X64-NOBMI2-LABEL: t3:
175 ; X64-NOBMI2:       # %bb.0:
176 ; X64-NOBMI2-NEXT:    movq %rsi, %rcx
177 ; X64-NOBMI2-NEXT:    movq %rdi, %rax
178 ; X64-NOBMI2-NEXT:    negb %cl
179 ; X64-NOBMI2-NEXT:    # kill: def $cl killed $cl killed $rcx
180 ; X64-NOBMI2-NEXT:    shlq %cl, %rax
181 ; X64-NOBMI2-NEXT:    retq
183 ; X64-BMI2-LABEL: t3:
184 ; X64-BMI2:       # %bb.0:
185 ; X64-BMI2-NEXT:    negb %sil
186 ; X64-BMI2-NEXT:    shlxq %rsi, %rdi, %rax
187 ; X64-BMI2-NEXT:    retq
189 ; X32-NOBMI2-LABEL: t3:
190 ; X32-NOBMI2:       # %bb.0:
191 ; X32-NOBMI2-NEXT:    pushl %esi
192 ; X32-NOBMI2-NEXT:    movl {{[0-9]+}}(%esp), %esi
193 ; X32-NOBMI2-NEXT:    movl {{[0-9]+}}(%esp), %edx
194 ; X32-NOBMI2-NEXT:    movb $64, %cl
195 ; X32-NOBMI2-NEXT:    subb {{[0-9]+}}(%esp), %cl
196 ; X32-NOBMI2-NEXT:    movl %esi, %eax
197 ; X32-NOBMI2-NEXT:    shll %cl, %eax
198 ; X32-NOBMI2-NEXT:    shldl %cl, %esi, %edx
199 ; X32-NOBMI2-NEXT:    testb $32, %cl
200 ; X32-NOBMI2-NEXT:    je .LBB3_2
201 ; X32-NOBMI2-NEXT:  # %bb.1:
202 ; X32-NOBMI2-NEXT:    movl %eax, %edx
203 ; X32-NOBMI2-NEXT:    xorl %eax, %eax
204 ; X32-NOBMI2-NEXT:  .LBB3_2:
205 ; X32-NOBMI2-NEXT:    popl %esi
206 ; X32-NOBMI2-NEXT:    retl
208 ; X32-BMI2-LABEL: t3:
209 ; X32-BMI2:       # %bb.0:
210 ; X32-BMI2-NEXT:    movl {{[0-9]+}}(%esp), %eax
211 ; X32-BMI2-NEXT:    movl {{[0-9]+}}(%esp), %edx
212 ; X32-BMI2-NEXT:    movb $64, %cl
213 ; X32-BMI2-NEXT:    subb {{[0-9]+}}(%esp), %cl
214 ; X32-BMI2-NEXT:    shldl %cl, %eax, %edx
215 ; X32-BMI2-NEXT:    shlxl %ecx, %eax, %eax
216 ; X32-BMI2-NEXT:    testb $32, %cl
217 ; X32-BMI2-NEXT:    je .LBB3_2
218 ; X32-BMI2-NEXT:  # %bb.1:
219 ; X32-BMI2-NEXT:    movl %eax, %edx
220 ; X32-BMI2-NEXT:    xorl %eax, %eax
221 ; X32-BMI2-NEXT:  .LBB3_2:
222 ; X32-BMI2-NEXT:    retl
223   %negshamt = sub i64 64, %shamt
224   %shifted = shl i64 %val, %negshamt
225   ret i64 %shifted
228 define i64 @t4(i64 %val, i64 %shamt) nounwind {
229 ; X64-NOBMI2-LABEL: t4:
230 ; X64-NOBMI2:       # %bb.0:
231 ; X64-NOBMI2-NEXT:    movq %rdi, %rax
232 ; X64-NOBMI2-NEXT:    leaq 96(%rsi), %rcx
233 ; X64-NOBMI2-NEXT:    negq %rcx
234 ; X64-NOBMI2-NEXT:    # kill: def $cl killed $cl killed $rcx
235 ; X64-NOBMI2-NEXT:    shlq %cl, %rax
236 ; X64-NOBMI2-NEXT:    retq
238 ; X64-BMI2-LABEL: t4:
239 ; X64-BMI2:       # %bb.0:
240 ; X64-BMI2-NEXT:    addq $96, %rsi
241 ; X64-BMI2-NEXT:    negq %rsi
242 ; X64-BMI2-NEXT:    shlxq %rsi, %rdi, %rax
243 ; X64-BMI2-NEXT:    retq
245 ; X32-NOBMI2-LABEL: t4:
246 ; X32-NOBMI2:       # %bb.0:
247 ; X32-NOBMI2-NEXT:    pushl %esi
248 ; X32-NOBMI2-NEXT:    movl {{[0-9]+}}(%esp), %esi
249 ; X32-NOBMI2-NEXT:    movl {{[0-9]+}}(%esp), %edx
250 ; X32-NOBMI2-NEXT:    movb $96, %cl
251 ; X32-NOBMI2-NEXT:    subb {{[0-9]+}}(%esp), %cl
252 ; X32-NOBMI2-NEXT:    movl %esi, %eax
253 ; X32-NOBMI2-NEXT:    shll %cl, %eax
254 ; X32-NOBMI2-NEXT:    shldl %cl, %esi, %edx
255 ; X32-NOBMI2-NEXT:    testb $32, %cl
256 ; X32-NOBMI2-NEXT:    je .LBB4_2
257 ; X32-NOBMI2-NEXT:  # %bb.1:
258 ; X32-NOBMI2-NEXT:    movl %eax, %edx
259 ; X32-NOBMI2-NEXT:    xorl %eax, %eax
260 ; X32-NOBMI2-NEXT:  .LBB4_2:
261 ; X32-NOBMI2-NEXT:    popl %esi
262 ; X32-NOBMI2-NEXT:    retl
264 ; X32-BMI2-LABEL: t4:
265 ; X32-BMI2:       # %bb.0:
266 ; X32-BMI2-NEXT:    movl {{[0-9]+}}(%esp), %eax
267 ; X32-BMI2-NEXT:    movl {{[0-9]+}}(%esp), %edx
268 ; X32-BMI2-NEXT:    movb $96, %cl
269 ; X32-BMI2-NEXT:    subb {{[0-9]+}}(%esp), %cl
270 ; X32-BMI2-NEXT:    shldl %cl, %eax, %edx
271 ; X32-BMI2-NEXT:    shlxl %ecx, %eax, %eax
272 ; X32-BMI2-NEXT:    testb $32, %cl
273 ; X32-BMI2-NEXT:    je .LBB4_2
274 ; X32-BMI2-NEXT:  # %bb.1:
275 ; X32-BMI2-NEXT:    movl %eax, %edx
276 ; X32-BMI2-NEXT:    xorl %eax, %eax
277 ; X32-BMI2-NEXT:  .LBB4_2:
278 ; X32-BMI2-NEXT:    retl
279   %negshamt = sub i64 96, %shamt
280   %shifted = shl i64 %val, %negshamt
281   ret i64 %shifted
284 define i64 @t5_cse(i64 %val, i64 %shamt, i64*%dst) nounwind {
285 ; X64-NOBMI2-LABEL: t5_cse:
286 ; X64-NOBMI2:       # %bb.0:
287 ; X64-NOBMI2-NEXT:    movq %rsi, %rcx
288 ; X64-NOBMI2-NEXT:    movq %rdi, %rax
289 ; X64-NOBMI2-NEXT:    addq $32, %rcx
290 ; X64-NOBMI2-NEXT:    movq %rcx, (%rdx)
291 ; X64-NOBMI2-NEXT:    negq %rcx
292 ; X64-NOBMI2-NEXT:    # kill: def $cl killed $cl killed $rcx
293 ; X64-NOBMI2-NEXT:    shlq %cl, %rax
294 ; X64-NOBMI2-NEXT:    retq
296 ; X64-BMI2-LABEL: t5_cse:
297 ; X64-BMI2:       # %bb.0:
298 ; X64-BMI2-NEXT:    addq $32, %rsi
299 ; X64-BMI2-NEXT:    movq %rsi, (%rdx)
300 ; X64-BMI2-NEXT:    negq %rsi
301 ; X64-BMI2-NEXT:    shlxq %rsi, %rdi, %rax
302 ; X64-BMI2-NEXT:    retq
304 ; X32-NOBMI2-LABEL: t5_cse:
305 ; X32-NOBMI2:       # %bb.0:
306 ; X32-NOBMI2-NEXT:    pushl %ebx
307 ; X32-NOBMI2-NEXT:    pushl %edi
308 ; X32-NOBMI2-NEXT:    pushl %esi
309 ; X32-NOBMI2-NEXT:    movl {{[0-9]+}}(%esp), %esi
310 ; X32-NOBMI2-NEXT:    movl {{[0-9]+}}(%esp), %edx
311 ; X32-NOBMI2-NEXT:    movl {{[0-9]+}}(%esp), %ecx
312 ; X32-NOBMI2-NEXT:    movl {{[0-9]+}}(%esp), %eax
313 ; X32-NOBMI2-NEXT:    movl {{[0-9]+}}(%esp), %edi
314 ; X32-NOBMI2-NEXT:    movl %eax, %ebx
315 ; X32-NOBMI2-NEXT:    addl $32, %ebx
316 ; X32-NOBMI2-NEXT:    adcl $0, %edi
317 ; X32-NOBMI2-NEXT:    movl %ebx, (%ecx)
318 ; X32-NOBMI2-NEXT:    movl %edi, 4(%ecx)
319 ; X32-NOBMI2-NEXT:    movb $32, %cl
320 ; X32-NOBMI2-NEXT:    subb %al, %cl
321 ; X32-NOBMI2-NEXT:    movl %esi, %eax
322 ; X32-NOBMI2-NEXT:    shll %cl, %eax
323 ; X32-NOBMI2-NEXT:    shldl %cl, %esi, %edx
324 ; X32-NOBMI2-NEXT:    testb $32, %cl
325 ; X32-NOBMI2-NEXT:    je .LBB5_2
326 ; X32-NOBMI2-NEXT:  # %bb.1:
327 ; X32-NOBMI2-NEXT:    movl %eax, %edx
328 ; X32-NOBMI2-NEXT:    xorl %eax, %eax
329 ; X32-NOBMI2-NEXT:  .LBB5_2:
330 ; X32-NOBMI2-NEXT:    popl %esi
331 ; X32-NOBMI2-NEXT:    popl %edi
332 ; X32-NOBMI2-NEXT:    popl %ebx
333 ; X32-NOBMI2-NEXT:    retl
335 ; X32-BMI2-LABEL: t5_cse:
336 ; X32-BMI2:       # %bb.0:
337 ; X32-BMI2-NEXT:    pushl %ebx
338 ; X32-BMI2-NEXT:    pushl %edi
339 ; X32-BMI2-NEXT:    pushl %esi
340 ; X32-BMI2-NEXT:    movl {{[0-9]+}}(%esp), %esi
341 ; X32-BMI2-NEXT:    movl {{[0-9]+}}(%esp), %edx
342 ; X32-BMI2-NEXT:    movl {{[0-9]+}}(%esp), %ecx
343 ; X32-BMI2-NEXT:    movl {{[0-9]+}}(%esp), %eax
344 ; X32-BMI2-NEXT:    movl {{[0-9]+}}(%esp), %edi
345 ; X32-BMI2-NEXT:    movl %eax, %ebx
346 ; X32-BMI2-NEXT:    addl $32, %ebx
347 ; X32-BMI2-NEXT:    adcl $0, %edi
348 ; X32-BMI2-NEXT:    movl %ebx, (%ecx)
349 ; X32-BMI2-NEXT:    movl %edi, 4(%ecx)
350 ; X32-BMI2-NEXT:    movb $32, %cl
351 ; X32-BMI2-NEXT:    subb %al, %cl
352 ; X32-BMI2-NEXT:    shldl %cl, %esi, %edx
353 ; X32-BMI2-NEXT:    shlxl %ecx, %esi, %eax
354 ; X32-BMI2-NEXT:    testb $32, %cl
355 ; X32-BMI2-NEXT:    je .LBB5_2
356 ; X32-BMI2-NEXT:  # %bb.1:
357 ; X32-BMI2-NEXT:    movl %eax, %edx
358 ; X32-BMI2-NEXT:    xorl %eax, %eax
359 ; X32-BMI2-NEXT:  .LBB5_2:
360 ; X32-BMI2-NEXT:    popl %esi
361 ; X32-BMI2-NEXT:    popl %edi
362 ; X32-BMI2-NEXT:    popl %ebx
363 ; X32-BMI2-NEXT:    retl
364   %incshamt = add i64 %shamt, 32
365   store i64 %incshamt, i64* %dst
366   %negshamt = sub i64 32, %shamt
367   %shifted = shl i64 %val, %negshamt
368   ret i64 %shifted
371 define i64 @t6_cse2(i64 %val, i64 %shamt, i64*%dst) nounwind {
372 ; X64-NOBMI2-LABEL: t6_cse2:
373 ; X64-NOBMI2:       # %bb.0:
374 ; X64-NOBMI2-NEXT:    movq %rdi, %rax
375 ; X64-NOBMI2-NEXT:    movl $32, %ecx
376 ; X64-NOBMI2-NEXT:    subq %rsi, %rcx
377 ; X64-NOBMI2-NEXT:    movq %rcx, (%rdx)
378 ; X64-NOBMI2-NEXT:    # kill: def $cl killed $cl killed $rcx
379 ; X64-NOBMI2-NEXT:    shlq %cl, %rax
380 ; X64-NOBMI2-NEXT:    retq
382 ; X64-BMI2-LABEL: t6_cse2:
383 ; X64-BMI2:       # %bb.0:
384 ; X64-BMI2-NEXT:    movl $32, %eax
385 ; X64-BMI2-NEXT:    subq %rsi, %rax
386 ; X64-BMI2-NEXT:    movq %rax, (%rdx)
387 ; X64-BMI2-NEXT:    shlxq %rax, %rdi, %rax
388 ; X64-BMI2-NEXT:    retq
390 ; X32-NOBMI2-LABEL: t6_cse2:
391 ; X32-NOBMI2:       # %bb.0:
392 ; X32-NOBMI2-NEXT:    pushl %edi
393 ; X32-NOBMI2-NEXT:    pushl %esi
394 ; X32-NOBMI2-NEXT:    movl {{[0-9]+}}(%esp), %esi
395 ; X32-NOBMI2-NEXT:    movl {{[0-9]+}}(%esp), %edx
396 ; X32-NOBMI2-NEXT:    movl {{[0-9]+}}(%esp), %eax
397 ; X32-NOBMI2-NEXT:    xorl %edi, %edi
398 ; X32-NOBMI2-NEXT:    movl $32, %ecx
399 ; X32-NOBMI2-NEXT:    subl {{[0-9]+}}(%esp), %ecx
400 ; X32-NOBMI2-NEXT:    sbbl {{[0-9]+}}(%esp), %edi
401 ; X32-NOBMI2-NEXT:    movl %ecx, (%eax)
402 ; X32-NOBMI2-NEXT:    movl %edi, 4(%eax)
403 ; X32-NOBMI2-NEXT:    movl %esi, %eax
404 ; X32-NOBMI2-NEXT:    shll %cl, %eax
405 ; X32-NOBMI2-NEXT:    shldl %cl, %esi, %edx
406 ; X32-NOBMI2-NEXT:    testb $32, %cl
407 ; X32-NOBMI2-NEXT:    je .LBB6_2
408 ; X32-NOBMI2-NEXT:  # %bb.1:
409 ; X32-NOBMI2-NEXT:    movl %eax, %edx
410 ; X32-NOBMI2-NEXT:    xorl %eax, %eax
411 ; X32-NOBMI2-NEXT:  .LBB6_2:
412 ; X32-NOBMI2-NEXT:    popl %esi
413 ; X32-NOBMI2-NEXT:    popl %edi
414 ; X32-NOBMI2-NEXT:    retl
416 ; X32-BMI2-LABEL: t6_cse2:
417 ; X32-BMI2:       # %bb.0:
418 ; X32-BMI2-NEXT:    pushl %edi
419 ; X32-BMI2-NEXT:    pushl %esi
420 ; X32-BMI2-NEXT:    movl {{[0-9]+}}(%esp), %eax
421 ; X32-BMI2-NEXT:    movl {{[0-9]+}}(%esp), %edx
422 ; X32-BMI2-NEXT:    movl {{[0-9]+}}(%esp), %esi
423 ; X32-BMI2-NEXT:    xorl %edi, %edi
424 ; X32-BMI2-NEXT:    movl $32, %ecx
425 ; X32-BMI2-NEXT:    subl {{[0-9]+}}(%esp), %ecx
426 ; X32-BMI2-NEXT:    sbbl {{[0-9]+}}(%esp), %edi
427 ; X32-BMI2-NEXT:    movl %ecx, (%esi)
428 ; X32-BMI2-NEXT:    movl %edi, 4(%esi)
429 ; X32-BMI2-NEXT:    shldl %cl, %eax, %edx
430 ; X32-BMI2-NEXT:    shlxl %ecx, %eax, %eax
431 ; X32-BMI2-NEXT:    testb $32, %cl
432 ; X32-BMI2-NEXT:    je .LBB6_2
433 ; X32-BMI2-NEXT:  # %bb.1:
434 ; X32-BMI2-NEXT:    movl %eax, %edx
435 ; X32-BMI2-NEXT:    xorl %eax, %eax
436 ; X32-BMI2-NEXT:  .LBB6_2:
437 ; X32-BMI2-NEXT:    popl %esi
438 ; X32-BMI2-NEXT:    popl %edi
439 ; X32-BMI2-NEXT:    retl
440   %negshamt = sub i64 32, %shamt
441   store i64 %negshamt, i64* %dst
442   %shifted = shl i64 %val, %negshamt
443   ret i64 %shifted