Run DCE after a LoopFlatten test to reduce spurious output [nfc]
[llvm-project.git] / llvm / test / CodeGen / X86 / clear_upper_vector_element_bits.ll
blobef21006ab64d3815ba177500d6c6772a67062cbe
1 ; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
2 ; RUN: llc < %s -mtriple=x86_64-unknown-unknown | FileCheck %s --check-prefix=SSE --check-prefix=SSE2
3 ; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+sse4.2 | FileCheck %s --check-prefix=SSE --check-prefix=SSE42
4 ; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+avx | FileCheck %s --check-prefix=AVX --check-prefix=AVX1
5 ; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+avx2 | FileCheck %s --check-prefix=AVX --check-prefix=AVX2
8 ; PR6455 'Clear Upper Bits' Patterns
11 define <2 x i64> @_clearupper2xi64a(<2 x i64>) nounwind {
12 ; SSE2-LABEL: _clearupper2xi64a:
13 ; SSE2:       # %bb.0:
14 ; SSE2-NEXT:    andps {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0
15 ; SSE2-NEXT:    retq
17 ; SSE42-LABEL: _clearupper2xi64a:
18 ; SSE42:       # %bb.0:
19 ; SSE42-NEXT:    xorps %xmm1, %xmm1
20 ; SSE42-NEXT:    blendps {{.*#+}} xmm0 = xmm0[0],xmm1[1],xmm0[2],xmm1[3]
21 ; SSE42-NEXT:    retq
23 ; AVX-LABEL: _clearupper2xi64a:
24 ; AVX:       # %bb.0:
25 ; AVX-NEXT:    vxorps %xmm1, %xmm1, %xmm1
26 ; AVX-NEXT:    vblendps {{.*#+}} xmm0 = xmm0[0],xmm1[1],xmm0[2],xmm1[3]
27 ; AVX-NEXT:    retq
28   %x0 = extractelement <2 x i64> %0, i32 0
29   %x1 = extractelement <2 x i64> %0, i32 1
30   %trunc0 = trunc i64 %x0 to i32
31   %trunc1 = trunc i64 %x1 to i32
32   %ext0 = zext i32 %trunc0 to i64
33   %ext1 = zext i32 %trunc1 to i64
34   %v0 = insertelement <2 x i64> undef, i64 %ext0, i32 0
35   %v1 = insertelement <2 x i64> %v0,   i64 %ext1, i32 1
36   ret <2 x i64> %v1
39 define <4 x i64> @_clearupper4xi64a(<4 x i64>) nounwind {
40 ; SSE2-LABEL: _clearupper4xi64a:
41 ; SSE2:       # %bb.0:
42 ; SSE2-NEXT:    movaps {{.*#+}} xmm2 = [4294967295,4294967295]
43 ; SSE2-NEXT:    andps %xmm2, %xmm0
44 ; SSE2-NEXT:    andps %xmm2, %xmm1
45 ; SSE2-NEXT:    retq
47 ; SSE42-LABEL: _clearupper4xi64a:
48 ; SSE42:       # %bb.0:
49 ; SSE42-NEXT:    xorps %xmm2, %xmm2
50 ; SSE42-NEXT:    blendps {{.*#+}} xmm0 = xmm0[0],xmm2[1],xmm0[2],xmm2[3]
51 ; SSE42-NEXT:    blendps {{.*#+}} xmm1 = xmm1[0],xmm2[1],xmm1[2],xmm2[3]
52 ; SSE42-NEXT:    retq
54 ; AVX-LABEL: _clearupper4xi64a:
55 ; AVX:       # %bb.0:
56 ; AVX-NEXT:    vxorps %xmm1, %xmm1, %xmm1
57 ; AVX-NEXT:    vblendps {{.*#+}} ymm0 = ymm0[0],ymm1[1],ymm0[2],ymm1[3],ymm0[4],ymm1[5],ymm0[6],ymm1[7]
58 ; AVX-NEXT:    retq
59   %x0 = extractelement <4 x i64> %0, i32 0
60   %x1 = extractelement <4 x i64> %0, i32 1
61   %x2 = extractelement <4 x i64> %0, i32 2
62   %x3 = extractelement <4 x i64> %0, i32 3
63   %trunc0 = trunc i64 %x0 to i32
64   %trunc1 = trunc i64 %x1 to i32
65   %trunc2 = trunc i64 %x2 to i32
66   %trunc3 = trunc i64 %x3 to i32
67   %ext0 = zext i32 %trunc0 to i64
68   %ext1 = zext i32 %trunc1 to i64
69   %ext2 = zext i32 %trunc2 to i64
70   %ext3 = zext i32 %trunc3 to i64
71   %v0 = insertelement <4 x i64> undef, i64 %ext0, i32 0
72   %v1 = insertelement <4 x i64> %v0,   i64 %ext1, i32 1
73   %v2 = insertelement <4 x i64> %v1,   i64 %ext2, i32 2
74   %v3 = insertelement <4 x i64> %v2,   i64 %ext3, i32 3
75   ret <4 x i64> %v3
78 define <4 x i32> @_clearupper4xi32a(<4 x i32>) nounwind {
79 ; SSE2-LABEL: _clearupper4xi32a:
80 ; SSE2:       # %bb.0:
81 ; SSE2-NEXT:    andps {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0
82 ; SSE2-NEXT:    retq
84 ; SSE42-LABEL: _clearupper4xi32a:
85 ; SSE42:       # %bb.0:
86 ; SSE42-NEXT:    pxor %xmm1, %xmm1
87 ; SSE42-NEXT:    pblendw {{.*#+}} xmm0 = xmm0[0],xmm1[1],xmm0[2],xmm1[3],xmm0[4],xmm1[5],xmm0[6],xmm1[7]
88 ; SSE42-NEXT:    retq
90 ; AVX-LABEL: _clearupper4xi32a:
91 ; AVX:       # %bb.0:
92 ; AVX-NEXT:    vpxor %xmm1, %xmm1, %xmm1
93 ; AVX-NEXT:    vpblendw {{.*#+}} xmm0 = xmm0[0],xmm1[1],xmm0[2],xmm1[3],xmm0[4],xmm1[5],xmm0[6],xmm1[7]
94 ; AVX-NEXT:    retq
95   %x0 = extractelement <4 x i32> %0, i32 0
96   %x1 = extractelement <4 x i32> %0, i32 1
97   %x2 = extractelement <4 x i32> %0, i32 2
98   %x3 = extractelement <4 x i32> %0, i32 3
99   %trunc0 = trunc i32 %x0 to i16
100   %trunc1 = trunc i32 %x1 to i16
101   %trunc2 = trunc i32 %x2 to i16
102   %trunc3 = trunc i32 %x3 to i16
103   %ext0 = zext i16 %trunc0 to i32
104   %ext1 = zext i16 %trunc1 to i32
105   %ext2 = zext i16 %trunc2 to i32
106   %ext3 = zext i16 %trunc3 to i32
107   %v0 = insertelement <4 x i32> undef, i32 %ext0, i32 0
108   %v1 = insertelement <4 x i32> %v0,   i32 %ext1, i32 1
109   %v2 = insertelement <4 x i32> %v1,   i32 %ext2, i32 2
110   %v3 = insertelement <4 x i32> %v2,   i32 %ext3, i32 3
111   ret <4 x i32> %v3
114 define <8 x i32> @_clearupper8xi32a(<8 x i32>) nounwind {
115 ; SSE2-LABEL: _clearupper8xi32a:
116 ; SSE2:       # %bb.0:
117 ; SSE2-NEXT:    movaps {{.*#+}} xmm2 = [65535,65535,65535,65535]
118 ; SSE2-NEXT:    andps %xmm2, %xmm0
119 ; SSE2-NEXT:    andps %xmm2, %xmm1
120 ; SSE2-NEXT:    retq
122 ; SSE42-LABEL: _clearupper8xi32a:
123 ; SSE42:       # %bb.0:
124 ; SSE42-NEXT:    pxor %xmm2, %xmm2
125 ; SSE42-NEXT:    pblendw {{.*#+}} xmm0 = xmm0[0],xmm2[1],xmm0[2],xmm2[3],xmm0[4],xmm2[5],xmm0[6],xmm2[7]
126 ; SSE42-NEXT:    pblendw {{.*#+}} xmm1 = xmm1[0],xmm2[1],xmm1[2],xmm2[3],xmm1[4],xmm2[5],xmm1[6],xmm2[7]
127 ; SSE42-NEXT:    retq
129 ; AVX1-LABEL: _clearupper8xi32a:
130 ; AVX1:       # %bb.0:
131 ; AVX1-NEXT:    vandps {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %ymm0, %ymm0
132 ; AVX1-NEXT:    retq
134 ; AVX2-LABEL: _clearupper8xi32a:
135 ; AVX2:       # %bb.0:
136 ; AVX2-NEXT:    vpxor %xmm1, %xmm1, %xmm1
137 ; AVX2-NEXT:    vpblendw {{.*#+}} ymm0 = ymm0[0],ymm1[1],ymm0[2],ymm1[3],ymm0[4],ymm1[5],ymm0[6],ymm1[7],ymm0[8],ymm1[9],ymm0[10],ymm1[11],ymm0[12],ymm1[13],ymm0[14],ymm1[15]
138 ; AVX2-NEXT:    retq
139   %x0 = extractelement <8 x i32> %0, i32 0
140   %x1 = extractelement <8 x i32> %0, i32 1
141   %x2 = extractelement <8 x i32> %0, i32 2
142   %x3 = extractelement <8 x i32> %0, i32 3
143   %x4 = extractelement <8 x i32> %0, i32 4
144   %x5 = extractelement <8 x i32> %0, i32 5
145   %x6 = extractelement <8 x i32> %0, i32 6
146   %x7 = extractelement <8 x i32> %0, i32 7
147   %trunc0 = trunc i32 %x0 to i16
148   %trunc1 = trunc i32 %x1 to i16
149   %trunc2 = trunc i32 %x2 to i16
150   %trunc3 = trunc i32 %x3 to i16
151   %trunc4 = trunc i32 %x4 to i16
152   %trunc5 = trunc i32 %x5 to i16
153   %trunc6 = trunc i32 %x6 to i16
154   %trunc7 = trunc i32 %x7 to i16
155   %ext0 = zext i16 %trunc0 to i32
156   %ext1 = zext i16 %trunc1 to i32
157   %ext2 = zext i16 %trunc2 to i32
158   %ext3 = zext i16 %trunc3 to i32
159   %ext4 = zext i16 %trunc4 to i32
160   %ext5 = zext i16 %trunc5 to i32
161   %ext6 = zext i16 %trunc6 to i32
162   %ext7 = zext i16 %trunc7 to i32
163   %v0 = insertelement <8 x i32> undef, i32 %ext0, i32 0
164   %v1 = insertelement <8 x i32> %v0,   i32 %ext1, i32 1
165   %v2 = insertelement <8 x i32> %v1,   i32 %ext2, i32 2
166   %v3 = insertelement <8 x i32> %v2,   i32 %ext3, i32 3
167   %v4 = insertelement <8 x i32> %v3,   i32 %ext4, i32 4
168   %v5 = insertelement <8 x i32> %v4,   i32 %ext5, i32 5
169   %v6 = insertelement <8 x i32> %v5,   i32 %ext6, i32 6
170   %v7 = insertelement <8 x i32> %v6,   i32 %ext7, i32 7
171   ret <8 x i32> %v7
174 define <8 x i16> @_clearupper8xi16a(<8 x i16>) nounwind {
175 ; SSE-LABEL: _clearupper8xi16a:
176 ; SSE:       # %bb.0:
177 ; SSE-NEXT:    andps {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0
178 ; SSE-NEXT:    retq
180 ; AVX-LABEL: _clearupper8xi16a:
181 ; AVX:       # %bb.0:
182 ; AVX-NEXT:    vandps {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0
183 ; AVX-NEXT:    retq
184   %x0 = extractelement <8 x i16> %0, i32 0
185   %x1 = extractelement <8 x i16> %0, i32 1
186   %x2 = extractelement <8 x i16> %0, i32 2
187   %x3 = extractelement <8 x i16> %0, i32 3
188   %x4 = extractelement <8 x i16> %0, i32 4
189   %x5 = extractelement <8 x i16> %0, i32 5
190   %x6 = extractelement <8 x i16> %0, i32 6
191   %x7 = extractelement <8 x i16> %0, i32 7
192   %trunc0 = trunc i16 %x0 to i8
193   %trunc1 = trunc i16 %x1 to i8
194   %trunc2 = trunc i16 %x2 to i8
195   %trunc3 = trunc i16 %x3 to i8
196   %trunc4 = trunc i16 %x4 to i8
197   %trunc5 = trunc i16 %x5 to i8
198   %trunc6 = trunc i16 %x6 to i8
199   %trunc7 = trunc i16 %x7 to i8
200   %ext0 = zext i8 %trunc0 to i16
201   %ext1 = zext i8 %trunc1 to i16
202   %ext2 = zext i8 %trunc2 to i16
203   %ext3 = zext i8 %trunc3 to i16
204   %ext4 = zext i8 %trunc4 to i16
205   %ext5 = zext i8 %trunc5 to i16
206   %ext6 = zext i8 %trunc6 to i16
207   %ext7 = zext i8 %trunc7 to i16
208   %v0 = insertelement <8 x i16> undef, i16 %ext0, i32 0
209   %v1 = insertelement <8 x i16> %v0,   i16 %ext1, i32 1
210   %v2 = insertelement <8 x i16> %v1,   i16 %ext2, i32 2
211   %v3 = insertelement <8 x i16> %v2,   i16 %ext3, i32 3
212   %v4 = insertelement <8 x i16> %v3,   i16 %ext4, i32 4
213   %v5 = insertelement <8 x i16> %v4,   i16 %ext5, i32 5
214   %v6 = insertelement <8 x i16> %v5,   i16 %ext6, i32 6
215   %v7 = insertelement <8 x i16> %v6,   i16 %ext7, i32 7
216   ret <8 x i16> %v7
219 define <16 x i16> @_clearupper16xi16a(<16 x i16>) nounwind {
220 ; SSE-LABEL: _clearupper16xi16a:
221 ; SSE:       # %bb.0:
222 ; SSE-NEXT:    movaps {{.*#+}} xmm2 = [255,255,255,255,255,255,255,255]
223 ; SSE-NEXT:    andps %xmm2, %xmm0
224 ; SSE-NEXT:    andps %xmm2, %xmm1
225 ; SSE-NEXT:    retq
227 ; AVX-LABEL: _clearupper16xi16a:
228 ; AVX:       # %bb.0:
229 ; AVX-NEXT:    vandps {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %ymm0, %ymm0
230 ; AVX-NEXT:    retq
231   %x0  = extractelement <16 x i16> %0, i32 0
232   %x1  = extractelement <16 x i16> %0, i32 1
233   %x2  = extractelement <16 x i16> %0, i32 2
234   %x3  = extractelement <16 x i16> %0, i32 3
235   %x4  = extractelement <16 x i16> %0, i32 4
236   %x5  = extractelement <16 x i16> %0, i32 5
237   %x6  = extractelement <16 x i16> %0, i32 6
238   %x7  = extractelement <16 x i16> %0, i32 7
239   %x8  = extractelement <16 x i16> %0, i32 8
240   %x9  = extractelement <16 x i16> %0, i32 9
241   %x10 = extractelement <16 x i16> %0, i32 10
242   %x11 = extractelement <16 x i16> %0, i32 11
243   %x12 = extractelement <16 x i16> %0, i32 12
244   %x13 = extractelement <16 x i16> %0, i32 13
245   %x14 = extractelement <16 x i16> %0, i32 14
246   %x15 = extractelement <16 x i16> %0, i32 15
247   %trunc0  = trunc i16 %x0  to i8
248   %trunc1  = trunc i16 %x1  to i8
249   %trunc2  = trunc i16 %x2  to i8
250   %trunc3  = trunc i16 %x3  to i8
251   %trunc4  = trunc i16 %x4  to i8
252   %trunc5  = trunc i16 %x5  to i8
253   %trunc6  = trunc i16 %x6  to i8
254   %trunc7  = trunc i16 %x7  to i8
255   %trunc8  = trunc i16 %x8  to i8
256   %trunc9  = trunc i16 %x9  to i8
257   %trunc10 = trunc i16 %x10 to i8
258   %trunc11 = trunc i16 %x11 to i8
259   %trunc12 = trunc i16 %x12 to i8
260   %trunc13 = trunc i16 %x13 to i8
261   %trunc14 = trunc i16 %x14 to i8
262   %trunc15 = trunc i16 %x15 to i8
263   %ext0  = zext i8 %trunc0  to i16
264   %ext1  = zext i8 %trunc1  to i16
265   %ext2  = zext i8 %trunc2  to i16
266   %ext3  = zext i8 %trunc3  to i16
267   %ext4  = zext i8 %trunc4  to i16
268   %ext5  = zext i8 %trunc5  to i16
269   %ext6  = zext i8 %trunc6  to i16
270   %ext7  = zext i8 %trunc7  to i16
271   %ext8  = zext i8 %trunc8  to i16
272   %ext9  = zext i8 %trunc9  to i16
273   %ext10 = zext i8 %trunc10 to i16
274   %ext11 = zext i8 %trunc11 to i16
275   %ext12 = zext i8 %trunc12 to i16
276   %ext13 = zext i8 %trunc13 to i16
277   %ext14 = zext i8 %trunc14 to i16
278   %ext15 = zext i8 %trunc15 to i16
279   %v0  = insertelement <16 x i16> undef, i16 %ext0,  i32 0
280   %v1  = insertelement <16 x i16> %v0,   i16 %ext1,  i32 1
281   %v2  = insertelement <16 x i16> %v1,   i16 %ext2,  i32 2
282   %v3  = insertelement <16 x i16> %v2,   i16 %ext3,  i32 3
283   %v4  = insertelement <16 x i16> %v3,   i16 %ext4,  i32 4
284   %v5  = insertelement <16 x i16> %v4,   i16 %ext5,  i32 5
285   %v6  = insertelement <16 x i16> %v5,   i16 %ext6,  i32 6
286   %v7  = insertelement <16 x i16> %v6,   i16 %ext7,  i32 7
287   %v8  = insertelement <16 x i16> %v7,   i16 %ext8,  i32 8
288   %v9  = insertelement <16 x i16> %v8,   i16 %ext9,  i32 9
289   %v10 = insertelement <16 x i16> %v9,   i16 %ext10, i32 10
290   %v11 = insertelement <16 x i16> %v10,  i16 %ext11, i32 11
291   %v12 = insertelement <16 x i16> %v11,  i16 %ext12, i32 12
292   %v13 = insertelement <16 x i16> %v12,  i16 %ext13, i32 13
293   %v14 = insertelement <16 x i16> %v13,  i16 %ext14, i32 14
294   %v15 = insertelement <16 x i16> %v14,  i16 %ext15, i32 15
295   ret <16 x i16> %v15
298 define <16 x i8> @_clearupper16xi8a(<16 x i8>) nounwind {
299 ; SSE-LABEL: _clearupper16xi8a:
300 ; SSE:       # %bb.0:
301 ; SSE-NEXT:    andps {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0
302 ; SSE-NEXT:    retq
304 ; AVX-LABEL: _clearupper16xi8a:
305 ; AVX:       # %bb.0:
306 ; AVX-NEXT:    vandps {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0
307 ; AVX-NEXT:    retq
308   %x0  = extractelement <16 x i8> %0, i32 0
309   %x1  = extractelement <16 x i8> %0, i32 1
310   %x2  = extractelement <16 x i8> %0, i32 2
311   %x3  = extractelement <16 x i8> %0, i32 3
312   %x4  = extractelement <16 x i8> %0, i32 4
313   %x5  = extractelement <16 x i8> %0, i32 5
314   %x6  = extractelement <16 x i8> %0, i32 6
315   %x7  = extractelement <16 x i8> %0, i32 7
316   %x8  = extractelement <16 x i8> %0, i32 8
317   %x9  = extractelement <16 x i8> %0, i32 9
318   %x10 = extractelement <16 x i8> %0, i32 10
319   %x11 = extractelement <16 x i8> %0, i32 11
320   %x12 = extractelement <16 x i8> %0, i32 12
321   %x13 = extractelement <16 x i8> %0, i32 13
322   %x14 = extractelement <16 x i8> %0, i32 14
323   %x15 = extractelement <16 x i8> %0, i32 15
324   %trunc0  = trunc i8 %x0  to i4
325   %trunc1  = trunc i8 %x1  to i4
326   %trunc2  = trunc i8 %x2  to i4
327   %trunc3  = trunc i8 %x3  to i4
328   %trunc4  = trunc i8 %x4  to i4
329   %trunc5  = trunc i8 %x5  to i4
330   %trunc6  = trunc i8 %x6  to i4
331   %trunc7  = trunc i8 %x7  to i4
332   %trunc8  = trunc i8 %x8  to i4
333   %trunc9  = trunc i8 %x9  to i4
334   %trunc10 = trunc i8 %x10 to i4
335   %trunc11 = trunc i8 %x11 to i4
336   %trunc12 = trunc i8 %x12 to i4
337   %trunc13 = trunc i8 %x13 to i4
338   %trunc14 = trunc i8 %x14 to i4
339   %trunc15 = trunc i8 %x15 to i4
340   %ext0  = zext i4 %trunc0  to i8
341   %ext1  = zext i4 %trunc1  to i8
342   %ext2  = zext i4 %trunc2  to i8
343   %ext3  = zext i4 %trunc3  to i8
344   %ext4  = zext i4 %trunc4  to i8
345   %ext5  = zext i4 %trunc5  to i8
346   %ext6  = zext i4 %trunc6  to i8
347   %ext7  = zext i4 %trunc7  to i8
348   %ext8  = zext i4 %trunc8  to i8
349   %ext9  = zext i4 %trunc9  to i8
350   %ext10 = zext i4 %trunc10 to i8
351   %ext11 = zext i4 %trunc11 to i8
352   %ext12 = zext i4 %trunc12 to i8
353   %ext13 = zext i4 %trunc13 to i8
354   %ext14 = zext i4 %trunc14 to i8
355   %ext15 = zext i4 %trunc15 to i8
356   %v0  = insertelement <16 x i8> undef, i8 %ext0,  i32 0
357   %v1  = insertelement <16 x i8> %v0,   i8 %ext1,  i32 1
358   %v2  = insertelement <16 x i8> %v1,   i8 %ext2,  i32 2
359   %v3  = insertelement <16 x i8> %v2,   i8 %ext3,  i32 3
360   %v4  = insertelement <16 x i8> %v3,   i8 %ext4,  i32 4
361   %v5  = insertelement <16 x i8> %v4,   i8 %ext5,  i32 5
362   %v6  = insertelement <16 x i8> %v5,   i8 %ext6,  i32 6
363   %v7  = insertelement <16 x i8> %v6,   i8 %ext7,  i32 7
364   %v8  = insertelement <16 x i8> %v7,   i8 %ext8,  i32 8
365   %v9  = insertelement <16 x i8> %v8,   i8 %ext9,  i32 9
366   %v10 = insertelement <16 x i8> %v9,   i8 %ext10, i32 10
367   %v11 = insertelement <16 x i8> %v10,  i8 %ext11, i32 11
368   %v12 = insertelement <16 x i8> %v11,  i8 %ext12, i32 12
369   %v13 = insertelement <16 x i8> %v12,  i8 %ext13, i32 13
370   %v14 = insertelement <16 x i8> %v13,  i8 %ext14, i32 14
371   %v15 = insertelement <16 x i8> %v14,  i8 %ext15, i32 15
372   ret <16 x i8> %v15
375 define <32 x i8> @_clearupper32xi8a(<32 x i8>) nounwind {
376 ; SSE-LABEL: _clearupper32xi8a:
377 ; SSE:       # %bb.0:
378 ; SSE-NEXT:    movaps {{.*#+}} xmm2 = [15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15]
379 ; SSE-NEXT:    andps %xmm2, %xmm0
380 ; SSE-NEXT:    andps %xmm2, %xmm1
381 ; SSE-NEXT:    retq
383 ; AVX-LABEL: _clearupper32xi8a:
384 ; AVX:       # %bb.0:
385 ; AVX-NEXT:    vandps {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %ymm0, %ymm0
386 ; AVX-NEXT:    retq
387   %x0  = extractelement <32 x i8> %0, i32 0
388   %x1  = extractelement <32 x i8> %0, i32 1
389   %x2  = extractelement <32 x i8> %0, i32 2
390   %x3  = extractelement <32 x i8> %0, i32 3
391   %x4  = extractelement <32 x i8> %0, i32 4
392   %x5  = extractelement <32 x i8> %0, i32 5
393   %x6  = extractelement <32 x i8> %0, i32 6
394   %x7  = extractelement <32 x i8> %0, i32 7
395   %x8  = extractelement <32 x i8> %0, i32 8
396   %x9  = extractelement <32 x i8> %0, i32 9
397   %x10 = extractelement <32 x i8> %0, i32 10
398   %x11 = extractelement <32 x i8> %0, i32 11
399   %x12 = extractelement <32 x i8> %0, i32 12
400   %x13 = extractelement <32 x i8> %0, i32 13
401   %x14 = extractelement <32 x i8> %0, i32 14
402   %x15 = extractelement <32 x i8> %0, i32 15
403   %x16 = extractelement <32 x i8> %0, i32 16
404   %x17 = extractelement <32 x i8> %0, i32 17
405   %x18 = extractelement <32 x i8> %0, i32 18
406   %x19 = extractelement <32 x i8> %0, i32 19
407   %x20 = extractelement <32 x i8> %0, i32 20
408   %x21 = extractelement <32 x i8> %0, i32 21
409   %x22 = extractelement <32 x i8> %0, i32 22
410   %x23 = extractelement <32 x i8> %0, i32 23
411   %x24 = extractelement <32 x i8> %0, i32 24
412   %x25 = extractelement <32 x i8> %0, i32 25
413   %x26 = extractelement <32 x i8> %0, i32 26
414   %x27 = extractelement <32 x i8> %0, i32 27
415   %x28 = extractelement <32 x i8> %0, i32 28
416   %x29 = extractelement <32 x i8> %0, i32 29
417   %x30 = extractelement <32 x i8> %0, i32 30
418   %x31 = extractelement <32 x i8> %0, i32 31
419   %trunc0  = trunc i8 %x0  to i4
420   %trunc1  = trunc i8 %x1  to i4
421   %trunc2  = trunc i8 %x2  to i4
422   %trunc3  = trunc i8 %x3  to i4
423   %trunc4  = trunc i8 %x4  to i4
424   %trunc5  = trunc i8 %x5  to i4
425   %trunc6  = trunc i8 %x6  to i4
426   %trunc7  = trunc i8 %x7  to i4
427   %trunc8  = trunc i8 %x8  to i4
428   %trunc9  = trunc i8 %x9  to i4
429   %trunc10 = trunc i8 %x10 to i4
430   %trunc11 = trunc i8 %x11 to i4
431   %trunc12 = trunc i8 %x12 to i4
432   %trunc13 = trunc i8 %x13 to i4
433   %trunc14 = trunc i8 %x14 to i4
434   %trunc15 = trunc i8 %x15 to i4
435   %trunc16 = trunc i8 %x16 to i4
436   %trunc17 = trunc i8 %x17 to i4
437   %trunc18 = trunc i8 %x18 to i4
438   %trunc19 = trunc i8 %x19 to i4
439   %trunc20 = trunc i8 %x20 to i4
440   %trunc21 = trunc i8 %x21 to i4
441   %trunc22 = trunc i8 %x22 to i4
442   %trunc23 = trunc i8 %x23 to i4
443   %trunc24 = trunc i8 %x24 to i4
444   %trunc25 = trunc i8 %x25 to i4
445   %trunc26 = trunc i8 %x26 to i4
446   %trunc27 = trunc i8 %x27 to i4
447   %trunc28 = trunc i8 %x28 to i4
448   %trunc29 = trunc i8 %x29 to i4
449   %trunc30 = trunc i8 %x30 to i4
450   %trunc31 = trunc i8 %x31 to i4
451   %ext0  = zext i4 %trunc0  to i8
452   %ext1  = zext i4 %trunc1  to i8
453   %ext2  = zext i4 %trunc2  to i8
454   %ext3  = zext i4 %trunc3  to i8
455   %ext4  = zext i4 %trunc4  to i8
456   %ext5  = zext i4 %trunc5  to i8
457   %ext6  = zext i4 %trunc6  to i8
458   %ext7  = zext i4 %trunc7  to i8
459   %ext8  = zext i4 %trunc8  to i8
460   %ext9  = zext i4 %trunc9  to i8
461   %ext10 = zext i4 %trunc10 to i8
462   %ext11 = zext i4 %trunc11 to i8
463   %ext12 = zext i4 %trunc12 to i8
464   %ext13 = zext i4 %trunc13 to i8
465   %ext14 = zext i4 %trunc14 to i8
466   %ext15 = zext i4 %trunc15 to i8
467   %ext16 = zext i4 %trunc16 to i8
468   %ext17 = zext i4 %trunc17 to i8
469   %ext18 = zext i4 %trunc18 to i8
470   %ext19 = zext i4 %trunc19 to i8
471   %ext20 = zext i4 %trunc20 to i8
472   %ext21 = zext i4 %trunc21 to i8
473   %ext22 = zext i4 %trunc22 to i8
474   %ext23 = zext i4 %trunc23 to i8
475   %ext24 = zext i4 %trunc24 to i8
476   %ext25 = zext i4 %trunc25 to i8
477   %ext26 = zext i4 %trunc26 to i8
478   %ext27 = zext i4 %trunc27 to i8
479   %ext28 = zext i4 %trunc28 to i8
480   %ext29 = zext i4 %trunc29 to i8
481   %ext30 = zext i4 %trunc30 to i8
482   %ext31 = zext i4 %trunc31 to i8
483   %v0  = insertelement <32 x i8> undef, i8 %ext0,  i32 0
484   %v1  = insertelement <32 x i8> %v0,   i8 %ext1,  i32 1
485   %v2  = insertelement <32 x i8> %v1,   i8 %ext2,  i32 2
486   %v3  = insertelement <32 x i8> %v2,   i8 %ext3,  i32 3
487   %v4  = insertelement <32 x i8> %v3,   i8 %ext4,  i32 4
488   %v5  = insertelement <32 x i8> %v4,   i8 %ext5,  i32 5
489   %v6  = insertelement <32 x i8> %v5,   i8 %ext6,  i32 6
490   %v7  = insertelement <32 x i8> %v6,   i8 %ext7,  i32 7
491   %v8  = insertelement <32 x i8> %v7,   i8 %ext8,  i32 8
492   %v9  = insertelement <32 x i8> %v8,   i8 %ext9,  i32 9
493   %v10 = insertelement <32 x i8> %v9,   i8 %ext10, i32 10
494   %v11 = insertelement <32 x i8> %v10,  i8 %ext11, i32 11
495   %v12 = insertelement <32 x i8> %v11,  i8 %ext12, i32 12
496   %v13 = insertelement <32 x i8> %v12,  i8 %ext13, i32 13
497   %v14 = insertelement <32 x i8> %v13,  i8 %ext14, i32 14
498   %v15 = insertelement <32 x i8> %v14,  i8 %ext15, i32 15
499   %v16 = insertelement <32 x i8> %v15,  i8 %ext16, i32 16
500   %v17 = insertelement <32 x i8> %v16,  i8 %ext17, i32 17
501   %v18 = insertelement <32 x i8> %v17,  i8 %ext18, i32 18
502   %v19 = insertelement <32 x i8> %v18,  i8 %ext19, i32 19
503   %v20 = insertelement <32 x i8> %v19,  i8 %ext20, i32 20
504   %v21 = insertelement <32 x i8> %v20,  i8 %ext21, i32 21
505   %v22 = insertelement <32 x i8> %v21,  i8 %ext22, i32 22
506   %v23 = insertelement <32 x i8> %v22,  i8 %ext23, i32 23
507   %v24 = insertelement <32 x i8> %v23,  i8 %ext24, i32 24
508   %v25 = insertelement <32 x i8> %v24,  i8 %ext25, i32 25
509   %v26 = insertelement <32 x i8> %v25,  i8 %ext26, i32 26
510   %v27 = insertelement <32 x i8> %v26,  i8 %ext27, i32 27
511   %v28 = insertelement <32 x i8> %v27,  i8 %ext28, i32 28
512   %v29 = insertelement <32 x i8> %v28,  i8 %ext29, i32 29
513   %v30 = insertelement <32 x i8> %v29,  i8 %ext30, i32 30
514   %v31 = insertelement <32 x i8> %v30,  i8 %ext31, i32 31
515   ret <32 x i8> %v31
518 define <2 x i64> @_clearupper2xi64b(<2 x i64>) nounwind {
519 ; SSE2-LABEL: _clearupper2xi64b:
520 ; SSE2:       # %bb.0:
521 ; SSE2-NEXT:    andps {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0
522 ; SSE2-NEXT:    retq
524 ; SSE42-LABEL: _clearupper2xi64b:
525 ; SSE42:       # %bb.0:
526 ; SSE42-NEXT:    xorps %xmm1, %xmm1
527 ; SSE42-NEXT:    blendps {{.*#+}} xmm0 = xmm0[0],xmm1[1],xmm0[2],xmm1[3]
528 ; SSE42-NEXT:    retq
530 ; AVX-LABEL: _clearupper2xi64b:
531 ; AVX:       # %bb.0:
532 ; AVX-NEXT:    vxorps %xmm1, %xmm1, %xmm1
533 ; AVX-NEXT:    vblendps {{.*#+}} xmm0 = xmm0[0],xmm1[1],xmm0[2],xmm1[3]
534 ; AVX-NEXT:    retq
535   %x32 = bitcast <2 x i64> %0 to <4 x i32>
536   %r0 = insertelement <4 x i32> %x32, i32 zeroinitializer, i32 1
537   %r1 = insertelement <4 x i32> %r0,  i32 zeroinitializer, i32 3
538   %r = bitcast <4 x i32> %r1 to <2 x i64>
539   ret <2 x i64> %r
542 define <4 x i64> @_clearupper4xi64b(<4 x i64>) nounwind {
543 ; SSE2-LABEL: _clearupper4xi64b:
544 ; SSE2:       # %bb.0:
545 ; SSE2-NEXT:    movaps {{.*#+}} xmm2 = [4294967295,0,4294967295,0]
546 ; SSE2-NEXT:    andps %xmm2, %xmm0
547 ; SSE2-NEXT:    andps %xmm2, %xmm1
548 ; SSE2-NEXT:    retq
550 ; SSE42-LABEL: _clearupper4xi64b:
551 ; SSE42:       # %bb.0:
552 ; SSE42-NEXT:    xorps %xmm2, %xmm2
553 ; SSE42-NEXT:    blendps {{.*#+}} xmm0 = xmm0[0],xmm2[1],xmm0[2],xmm2[3]
554 ; SSE42-NEXT:    blendps {{.*#+}} xmm1 = xmm1[0],xmm2[1],xmm1[2],xmm2[3]
555 ; SSE42-NEXT:    retq
557 ; AVX-LABEL: _clearupper4xi64b:
558 ; AVX:       # %bb.0:
559 ; AVX-NEXT:    vxorps %xmm1, %xmm1, %xmm1
560 ; AVX-NEXT:    vblendps {{.*#+}} ymm0 = ymm0[0],ymm1[1],ymm0[2],ymm1[3],ymm0[4],ymm1[5],ymm0[6],ymm1[7]
561 ; AVX-NEXT:    retq
562   %x32 = bitcast <4 x i64> %0 to <8 x i32>
563   %r0 = insertelement <8 x i32> %x32, i32 zeroinitializer, i32 1
564   %r1 = insertelement <8 x i32> %r0,  i32 zeroinitializer, i32 3
565   %r2 = insertelement <8 x i32> %r1,  i32 zeroinitializer, i32 5
566   %r3 = insertelement <8 x i32> %r2,  i32 zeroinitializer, i32 7
567   %r = bitcast <8 x i32> %r3 to <4 x i64>
568   ret <4 x i64> %r
571 define <4 x i32> @_clearupper4xi32b(<4 x i32>) nounwind {
572 ; SSE2-LABEL: _clearupper4xi32b:
573 ; SSE2:       # %bb.0:
574 ; SSE2-NEXT:    andps {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0
575 ; SSE2-NEXT:    retq
577 ; SSE42-LABEL: _clearupper4xi32b:
578 ; SSE42:       # %bb.0:
579 ; SSE42-NEXT:    pxor %xmm1, %xmm1
580 ; SSE42-NEXT:    pblendw {{.*#+}} xmm0 = xmm0[0],xmm1[1],xmm0[2],xmm1[3],xmm0[4],xmm1[5],xmm0[6],xmm1[7]
581 ; SSE42-NEXT:    retq
583 ; AVX-LABEL: _clearupper4xi32b:
584 ; AVX:       # %bb.0:
585 ; AVX-NEXT:    vpxor %xmm1, %xmm1, %xmm1
586 ; AVX-NEXT:    vpblendw {{.*#+}} xmm0 = xmm0[0],xmm1[1],xmm0[2],xmm1[3],xmm0[4],xmm1[5],xmm0[6],xmm1[7]
587 ; AVX-NEXT:    retq
588   %x16 = bitcast <4 x i32> %0 to <8 x i16>
589   %r0 = insertelement <8 x i16> %x16, i16 zeroinitializer, i32 1
590   %r1 = insertelement <8 x i16> %r0,  i16 zeroinitializer, i32 3
591   %r2 = insertelement <8 x i16> %r1,  i16 zeroinitializer, i32 5
592   %r3 = insertelement <8 x i16> %r2,  i16 zeroinitializer, i32 7
593   %r = bitcast <8 x i16> %r3 to <4 x i32>
594   ret <4 x i32> %r
597 define <8 x i32> @_clearupper8xi32b(<8 x i32>) nounwind {
598 ; SSE2-LABEL: _clearupper8xi32b:
599 ; SSE2:       # %bb.0:
600 ; SSE2-NEXT:    movaps {{.*#+}} xmm2 = [65535,0,65535,0,65535,0,65535,0]
601 ; SSE2-NEXT:    andps %xmm2, %xmm0
602 ; SSE2-NEXT:    andps %xmm2, %xmm1
603 ; SSE2-NEXT:    retq
605 ; SSE42-LABEL: _clearupper8xi32b:
606 ; SSE42:       # %bb.0:
607 ; SSE42-NEXT:    pxor %xmm2, %xmm2
608 ; SSE42-NEXT:    pblendw {{.*#+}} xmm0 = xmm0[0],xmm2[1],xmm0[2],xmm2[3],xmm0[4],xmm2[5],xmm0[6],xmm2[7]
609 ; SSE42-NEXT:    pblendw {{.*#+}} xmm1 = xmm1[0],xmm2[1],xmm1[2],xmm2[3],xmm1[4],xmm2[5],xmm1[6],xmm2[7]
610 ; SSE42-NEXT:    retq
612 ; AVX1-LABEL: _clearupper8xi32b:
613 ; AVX1:       # %bb.0:
614 ; AVX1-NEXT:    vandps {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %ymm0, %ymm0
615 ; AVX1-NEXT:    retq
617 ; AVX2-LABEL: _clearupper8xi32b:
618 ; AVX2:       # %bb.0:
619 ; AVX2-NEXT:    vpxor %xmm1, %xmm1, %xmm1
620 ; AVX2-NEXT:    vpblendw {{.*#+}} ymm0 = ymm0[0],ymm1[1],ymm0[2],ymm1[3],ymm0[4],ymm1[5],ymm0[6],ymm1[7],ymm0[8],ymm1[9],ymm0[10],ymm1[11],ymm0[12],ymm1[13],ymm0[14],ymm1[15]
621 ; AVX2-NEXT:    retq
622   %x16 = bitcast <8 x i32> %0 to <16 x i16>
623   %r0 = insertelement <16 x i16> %x16, i16 zeroinitializer, i32 1
624   %r1 = insertelement <16 x i16> %r0,  i16 zeroinitializer, i32 3
625   %r2 = insertelement <16 x i16> %r1,  i16 zeroinitializer, i32 5
626   %r3 = insertelement <16 x i16> %r2,  i16 zeroinitializer, i32 7
627   %r4 = insertelement <16 x i16> %r3,  i16 zeroinitializer, i32 9
628   %r5 = insertelement <16 x i16> %r4,  i16 zeroinitializer, i32 11
629   %r6 = insertelement <16 x i16> %r5,  i16 zeroinitializer, i32 13
630   %r7 = insertelement <16 x i16> %r6,  i16 zeroinitializer, i32 15
631   %r = bitcast <16 x i16> %r7 to <8 x i32>
632   ret <8 x i32> %r
635 define <8 x i16> @_clearupper8xi16b(<8 x i16>) nounwind {
636 ; SSE-LABEL: _clearupper8xi16b:
637 ; SSE:       # %bb.0:
638 ; SSE-NEXT:    andps {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0
639 ; SSE-NEXT:    retq
641 ; AVX-LABEL: _clearupper8xi16b:
642 ; AVX:       # %bb.0:
643 ; AVX-NEXT:    vandps {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0
644 ; AVX-NEXT:    retq
645   %x8 = bitcast <8 x i16> %0 to <16 x i8>
646   %r0 = insertelement <16 x i8> %x8, i8 zeroinitializer, i32 1
647   %r1 = insertelement <16 x i8> %r0, i8 zeroinitializer, i32 3
648   %r2 = insertelement <16 x i8> %r1, i8 zeroinitializer, i32 5
649   %r3 = insertelement <16 x i8> %r2, i8 zeroinitializer, i32 7
650   %r4 = insertelement <16 x i8> %r3, i8 zeroinitializer, i32 9
651   %r5 = insertelement <16 x i8> %r4, i8 zeroinitializer, i32 11
652   %r6 = insertelement <16 x i8> %r5, i8 zeroinitializer, i32 13
653   %r7 = insertelement <16 x i8> %r6, i8 zeroinitializer, i32 15
654   %r = bitcast <16 x i8> %r7 to <8 x i16>
655   ret <8 x i16> %r
658 define <16 x i16> @_clearupper16xi16b(<16 x i16>) nounwind {
659 ; SSE-LABEL: _clearupper16xi16b:
660 ; SSE:       # %bb.0:
661 ; SSE-NEXT:    movaps {{.*#+}} xmm2 = [255,0,255,0,255,0,255,0,255,0,255,0,255,0,255,0]
662 ; SSE-NEXT:    andps %xmm2, %xmm0
663 ; SSE-NEXT:    andps %xmm2, %xmm1
664 ; SSE-NEXT:    retq
666 ; AVX-LABEL: _clearupper16xi16b:
667 ; AVX:       # %bb.0:
668 ; AVX-NEXT:    vandps {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %ymm0, %ymm0
669 ; AVX-NEXT:    retq
670   %x8 = bitcast <16 x i16> %0 to <32 x i8>
671   %r0  = insertelement <32 x i8> %x8,  i8 zeroinitializer, i32 1
672   %r1  = insertelement <32 x i8> %r0,  i8 zeroinitializer, i32 3
673   %r2  = insertelement <32 x i8> %r1,  i8 zeroinitializer, i32 5
674   %r3  = insertelement <32 x i8> %r2,  i8 zeroinitializer, i32 7
675   %r4  = insertelement <32 x i8> %r3,  i8 zeroinitializer, i32 9
676   %r5  = insertelement <32 x i8> %r4,  i8 zeroinitializer, i32 11
677   %r6  = insertelement <32 x i8> %r5,  i8 zeroinitializer, i32 13
678   %r7  = insertelement <32 x i8> %r6,  i8 zeroinitializer, i32 15
679   %r8  = insertelement <32 x i8> %r7,  i8 zeroinitializer, i32 17
680   %r9  = insertelement <32 x i8> %r8,  i8 zeroinitializer, i32 19
681   %r10 = insertelement <32 x i8> %r9,  i8 zeroinitializer, i32 21
682   %r11 = insertelement <32 x i8> %r10, i8 zeroinitializer, i32 23
683   %r12 = insertelement <32 x i8> %r11, i8 zeroinitializer, i32 25
684   %r13 = insertelement <32 x i8> %r12, i8 zeroinitializer, i32 27
685   %r14 = insertelement <32 x i8> %r13, i8 zeroinitializer, i32 29
686   %r15 = insertelement <32 x i8> %r14, i8 zeroinitializer, i32 31
687   %r = bitcast <32 x i8> %r15 to <16 x i16>
688   ret <16 x i16> %r
691 define <16 x i8> @_clearupper16xi8b(<16 x i8>) nounwind {
692 ; SSE-LABEL: _clearupper16xi8b:
693 ; SSE:       # %bb.0:
694 ; SSE-NEXT:    andps {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0
695 ; SSE-NEXT:    retq
697 ; AVX-LABEL: _clearupper16xi8b:
698 ; AVX:       # %bb.0:
699 ; AVX-NEXT:    vandps {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0
700 ; AVX-NEXT:    retq
701   %x4  = bitcast <16 x i8> %0 to <32 x i4>
702   %r0  = insertelement <32 x i4> %x4,  i4 zeroinitializer, i32 1
703   %r1  = insertelement <32 x i4> %r0,  i4 zeroinitializer, i32 3
704   %r2  = insertelement <32 x i4> %r1,  i4 zeroinitializer, i32 5
705   %r3  = insertelement <32 x i4> %r2,  i4 zeroinitializer, i32 7
706   %r4  = insertelement <32 x i4> %r3,  i4 zeroinitializer, i32 9
707   %r5  = insertelement <32 x i4> %r4,  i4 zeroinitializer, i32 11
708   %r6  = insertelement <32 x i4> %r5,  i4 zeroinitializer, i32 13
709   %r7  = insertelement <32 x i4> %r6,  i4 zeroinitializer, i32 15
710   %r8  = insertelement <32 x i4> %r7,  i4 zeroinitializer, i32 17
711   %r9  = insertelement <32 x i4> %r8,  i4 zeroinitializer, i32 19
712   %r10 = insertelement <32 x i4> %r9,  i4 zeroinitializer, i32 21
713   %r11 = insertelement <32 x i4> %r10, i4 zeroinitializer, i32 23
714   %r12 = insertelement <32 x i4> %r11, i4 zeroinitializer, i32 25
715   %r13 = insertelement <32 x i4> %r12, i4 zeroinitializer, i32 27
716   %r14 = insertelement <32 x i4> %r13, i4 zeroinitializer, i32 29
717   %r15 = insertelement <32 x i4> %r14, i4 zeroinitializer, i32 31
718   %r = bitcast <32 x i4> %r15 to <16 x i8>
719   ret <16 x i8> %r
722 define <32 x i8> @_clearupper32xi8b(<32 x i8>) nounwind {
723 ; SSE-LABEL: _clearupper32xi8b:
724 ; SSE:       # %bb.0:
725 ; SSE-NEXT:    andps {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0
726 ; SSE-NEXT:    retq
728 ; AVX-LABEL: _clearupper32xi8b:
729 ; AVX:       # %bb.0:
730 ; AVX-NEXT:    vandps {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %ymm0, %ymm0
731 ; AVX-NEXT:    retq
732   %x4  = bitcast <32 x i8> %0 to <64 x i4>
733   %r0  = insertelement <64 x i4> %x4,  i4 zeroinitializer, i32 1
734   %r1  = insertelement <64 x i4> %r0,  i4 zeroinitializer, i32 3
735   %r2  = insertelement <64 x i4> %r1,  i4 zeroinitializer, i32 5
736   %r3  = insertelement <64 x i4> %r2,  i4 zeroinitializer, i32 7
737   %r4  = insertelement <64 x i4> %r3,  i4 zeroinitializer, i32 9
738   %r5  = insertelement <64 x i4> %r4,  i4 zeroinitializer, i32 11
739   %r6  = insertelement <64 x i4> %r5,  i4 zeroinitializer, i32 13
740   %r7  = insertelement <64 x i4> %r6,  i4 zeroinitializer, i32 15
741   %r8  = insertelement <64 x i4> %r7,  i4 zeroinitializer, i32 17
742   %r9  = insertelement <64 x i4> %r8,  i4 zeroinitializer, i32 19
743   %r10 = insertelement <64 x i4> %r9,  i4 zeroinitializer, i32 21
744   %r11 = insertelement <64 x i4> %r10, i4 zeroinitializer, i32 23
745   %r12 = insertelement <64 x i4> %r11, i4 zeroinitializer, i32 25
746   %r13 = insertelement <64 x i4> %r12, i4 zeroinitializer, i32 27
747   %r14 = insertelement <64 x i4> %r13, i4 zeroinitializer, i32 29
748   %r15 = insertelement <64 x i4> %r14, i4 zeroinitializer, i32 31
749   %r16 = insertelement <64 x i4> %r15, i4 zeroinitializer, i32 33
750   %r17 = insertelement <64 x i4> %r16, i4 zeroinitializer, i32 35
751   %r18 = insertelement <64 x i4> %r17, i4 zeroinitializer, i32 37
752   %r19 = insertelement <64 x i4> %r18, i4 zeroinitializer, i32 39
753   %r20 = insertelement <64 x i4> %r19, i4 zeroinitializer, i32 41
754   %r21 = insertelement <64 x i4> %r20, i4 zeroinitializer, i32 43
755   %r22 = insertelement <64 x i4> %r21, i4 zeroinitializer, i32 45
756   %r23 = insertelement <64 x i4> %r22, i4 zeroinitializer, i32 47
757   %r24 = insertelement <64 x i4> %r23, i4 zeroinitializer, i32 49
758   %r25 = insertelement <64 x i4> %r24, i4 zeroinitializer, i32 51
759   %r26 = insertelement <64 x i4> %r25, i4 zeroinitializer, i32 53
760   %r27 = insertelement <64 x i4> %r26, i4 zeroinitializer, i32 55
761   %r28 = insertelement <64 x i4> %r27, i4 zeroinitializer, i32 57
762   %r29 = insertelement <64 x i4> %r28, i4 zeroinitializer, i32 59
763   %r30 = insertelement <64 x i4> %r29, i4 zeroinitializer, i32 61
764   %r31 = insertelement <64 x i4> %r30, i4 zeroinitializer, i32 63
765   %r = bitcast <64 x i4> %r15 to <32 x i8>
766   ret <32 x i8> %r
769 define <2 x i64> @_clearupper2xi64c(<2 x i64>) nounwind {
770 ; SSE2-LABEL: _clearupper2xi64c:
771 ; SSE2:       # %bb.0:
772 ; SSE2-NEXT:    andps {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0
773 ; SSE2-NEXT:    retq
775 ; SSE42-LABEL: _clearupper2xi64c:
776 ; SSE42:       # %bb.0:
777 ; SSE42-NEXT:    xorps %xmm1, %xmm1
778 ; SSE42-NEXT:    blendps {{.*#+}} xmm0 = xmm0[0],xmm1[1],xmm0[2],xmm1[3]
779 ; SSE42-NEXT:    retq
781 ; AVX-LABEL: _clearupper2xi64c:
782 ; AVX:       # %bb.0:
783 ; AVX-NEXT:    vxorps %xmm1, %xmm1, %xmm1
784 ; AVX-NEXT:    vblendps {{.*#+}} xmm0 = xmm0[0],xmm1[1],xmm0[2],xmm1[3]
785 ; AVX-NEXT:    retq
786   %r = and <2 x i64> <i64 4294967295, i64 4294967295>, %0
787   ret <2 x i64> %r
790 define <4 x i64> @_clearupper4xi64c(<4 x i64>) nounwind {
791 ; SSE2-LABEL: _clearupper4xi64c:
792 ; SSE2:       # %bb.0:
793 ; SSE2-NEXT:    movaps {{.*#+}} xmm2 = [4294967295,0,4294967295,0]
794 ; SSE2-NEXT:    andps %xmm2, %xmm0
795 ; SSE2-NEXT:    andps %xmm2, %xmm1
796 ; SSE2-NEXT:    retq
798 ; SSE42-LABEL: _clearupper4xi64c:
799 ; SSE42:       # %bb.0:
800 ; SSE42-NEXT:    xorps %xmm2, %xmm2
801 ; SSE42-NEXT:    blendps {{.*#+}} xmm0 = xmm0[0],xmm2[1],xmm0[2],xmm2[3]
802 ; SSE42-NEXT:    blendps {{.*#+}} xmm1 = xmm1[0],xmm2[1],xmm1[2],xmm2[3]
803 ; SSE42-NEXT:    retq
805 ; AVX-LABEL: _clearupper4xi64c:
806 ; AVX:       # %bb.0:
807 ; AVX-NEXT:    vxorps %xmm1, %xmm1, %xmm1
808 ; AVX-NEXT:    vblendps {{.*#+}} ymm0 = ymm0[0],ymm1[1],ymm0[2],ymm1[3],ymm0[4],ymm1[5],ymm0[6],ymm1[7]
809 ; AVX-NEXT:    retq
810   %r = and <4 x i64> <i64 4294967295, i64 4294967295, i64 4294967295, i64 4294967295>, %0
811   ret <4 x i64> %r
814 define <4 x i32> @_clearupper4xi32c(<4 x i32>) nounwind {
815 ; SSE2-LABEL: _clearupper4xi32c:
816 ; SSE2:       # %bb.0:
817 ; SSE2-NEXT:    andps {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0
818 ; SSE2-NEXT:    retq
820 ; SSE42-LABEL: _clearupper4xi32c:
821 ; SSE42:       # %bb.0:
822 ; SSE42-NEXT:    pxor %xmm1, %xmm1
823 ; SSE42-NEXT:    pblendw {{.*#+}} xmm0 = xmm0[0],xmm1[1],xmm0[2],xmm1[3],xmm0[4],xmm1[5],xmm0[6],xmm1[7]
824 ; SSE42-NEXT:    retq
826 ; AVX-LABEL: _clearupper4xi32c:
827 ; AVX:       # %bb.0:
828 ; AVX-NEXT:    vpxor %xmm1, %xmm1, %xmm1
829 ; AVX-NEXT:    vpblendw {{.*#+}} xmm0 = xmm0[0],xmm1[1],xmm0[2],xmm1[3],xmm0[4],xmm1[5],xmm0[6],xmm1[7]
830 ; AVX-NEXT:    retq
831   %r = and <4 x i32> <i32 65535, i32 65535, i32 65535, i32 65535>, %0
832   ret <4 x i32> %r
835 define <8 x i32> @_clearupper8xi32c(<8 x i32>) nounwind {
836 ; SSE2-LABEL: _clearupper8xi32c:
837 ; SSE2:       # %bb.0:
838 ; SSE2-NEXT:    movaps {{.*#+}} xmm2 = [65535,0,65535,0,65535,0,65535,0]
839 ; SSE2-NEXT:    andps %xmm2, %xmm0
840 ; SSE2-NEXT:    andps %xmm2, %xmm1
841 ; SSE2-NEXT:    retq
843 ; SSE42-LABEL: _clearupper8xi32c:
844 ; SSE42:       # %bb.0:
845 ; SSE42-NEXT:    pxor %xmm2, %xmm2
846 ; SSE42-NEXT:    pblendw {{.*#+}} xmm0 = xmm0[0],xmm2[1],xmm0[2],xmm2[3],xmm0[4],xmm2[5],xmm0[6],xmm2[7]
847 ; SSE42-NEXT:    pblendw {{.*#+}} xmm1 = xmm1[0],xmm2[1],xmm1[2],xmm2[3],xmm1[4],xmm2[5],xmm1[6],xmm2[7]
848 ; SSE42-NEXT:    retq
850 ; AVX1-LABEL: _clearupper8xi32c:
851 ; AVX1:       # %bb.0:
852 ; AVX1-NEXT:    vandps {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %ymm0, %ymm0
853 ; AVX1-NEXT:    retq
855 ; AVX2-LABEL: _clearupper8xi32c:
856 ; AVX2:       # %bb.0:
857 ; AVX2-NEXT:    vpxor %xmm1, %xmm1, %xmm1
858 ; AVX2-NEXT:    vpblendw {{.*#+}} ymm0 = ymm0[0],ymm1[1],ymm0[2],ymm1[3],ymm0[4],ymm1[5],ymm0[6],ymm1[7],ymm0[8],ymm1[9],ymm0[10],ymm1[11],ymm0[12],ymm1[13],ymm0[14],ymm1[15]
859 ; AVX2-NEXT:    retq
860   %r = and <8 x i32> <i32 65535, i32 65535, i32 65535, i32 65535, i32 65535, i32 65535, i32 65535, i32 65535>, %0
861   ret <8 x i32> %r
864 define <8 x i16> @_clearupper8xi16c(<8 x i16>) nounwind {
865 ; SSE-LABEL: _clearupper8xi16c:
866 ; SSE:       # %bb.0:
867 ; SSE-NEXT:    andps {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0
868 ; SSE-NEXT:    retq
870 ; AVX-LABEL: _clearupper8xi16c:
871 ; AVX:       # %bb.0:
872 ; AVX-NEXT:    vandps {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0
873 ; AVX-NEXT:    retq
874   %r = and <8 x i16> <i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255>, %0
875   ret <8 x i16> %r
878 define <16 x i16> @_clearupper16xi16c(<16 x i16>) nounwind {
879 ; SSE-LABEL: _clearupper16xi16c:
880 ; SSE:       # %bb.0:
881 ; SSE-NEXT:    movaps {{.*#+}} xmm2 = [255,0,255,0,255,0,255,0,255,0,255,0,255,0,255,0]
882 ; SSE-NEXT:    andps %xmm2, %xmm0
883 ; SSE-NEXT:    andps %xmm2, %xmm1
884 ; SSE-NEXT:    retq
886 ; AVX-LABEL: _clearupper16xi16c:
887 ; AVX:       # %bb.0:
888 ; AVX-NEXT:    vandps {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %ymm0, %ymm0
889 ; AVX-NEXT:    retq
890   %r = and <16 x i16> <i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255, i16 255>, %0
891   ret <16 x i16> %r
894 define <16 x i8> @_clearupper16xi8c(<16 x i8>) nounwind {
895 ; SSE-LABEL: _clearupper16xi8c:
896 ; SSE:       # %bb.0:
897 ; SSE-NEXT:    andps {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0
898 ; SSE-NEXT:    retq
900 ; AVX-LABEL: _clearupper16xi8c:
901 ; AVX:       # %bb.0:
902 ; AVX-NEXT:    vandps {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0
903 ; AVX-NEXT:    retq
904   %r = and <16 x i8> <i8 15, i8 15, i8 15, i8 15, i8 15, i8 15, i8 15, i8 15, i8 15, i8 15, i8 15, i8 15, i8 15, i8 15, i8 15, i8 15>, %0
905   ret <16 x i8> %r
908 define <32 x i8> @_clearupper32xi8c(<32 x i8>) nounwind {
909 ; SSE-LABEL: _clearupper32xi8c:
910 ; SSE:       # %bb.0:
911 ; SSE-NEXT:    movaps {{.*#+}} xmm2 = [15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15]
912 ; SSE-NEXT:    andps %xmm2, %xmm0
913 ; SSE-NEXT:    andps %xmm2, %xmm1
914 ; SSE-NEXT:    retq
916 ; AVX-LABEL: _clearupper32xi8c:
917 ; AVX:       # %bb.0:
918 ; AVX-NEXT:    vandps {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %ymm0, %ymm0
919 ; AVX-NEXT:    retq
920   %r = and <32 x i8> <i8 15, i8 15, i8 15, i8 15, i8 15, i8 15, i8 15, i8 15, i8 15, i8 15, i8 15, i8 15, i8 15, i8 15, i8 15, i8 15, i8 15, i8 15, i8 15, i8 15, i8 15, i8 15, i8 15, i8 15, i8 15, i8 15, i8 15, i8 15, i8 15, i8 15, i8 15, i8 15>, %0
921   ret <32 x i8> %r