Run DCE after a LoopFlatten test to reduce spurious output [nfc]
[llvm-project.git] / llvm / test / CodeGen / X86 / widen_bitops-0.ll
blob7d91502694ce4bf1386ce56a34271c39d9ea70c8
1 ; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
2 ; RUN: llc < %s -mtriple=i686-unknown -mattr=+sse4.2 | FileCheck %s --check-prefix=X86
3 ; RUN: llc < %s -mtriple=x86_64-unknown -mattr=+sse4.2 | FileCheck %s --check-prefix=X64
6 ; AND/XOR/OR i24 as v3i8
9 define i24 @and_i24_as_v3i8(i24 %a, i24 %b) nounwind {
10 ; X86-LABEL: and_i24_as_v3i8:
11 ; X86:       # %bb.0:
12 ; X86-NEXT:    movl {{[0-9]+}}(%esp), %eax
13 ; X86-NEXT:    andl {{[0-9]+}}(%esp), %eax
14 ; X86-NEXT:    retl
16 ; X64-LABEL: and_i24_as_v3i8:
17 ; X64:       # %bb.0:
18 ; X64-NEXT:    movl %edi, %eax
19 ; X64-NEXT:    andl %esi, %eax
20 ; X64-NEXT:    retq
21   %1 = bitcast i24 %a to <3 x i8>
22   %2 = bitcast i24 %b to <3 x i8>
23   %3 = and <3 x i8> %1, %2
24   %4 = bitcast <3 x i8> %3 to i24
25   ret i24 %4
28 define i24 @xor_i24_as_v3i8(i24 %a, i24 %b) nounwind {
29 ; X86-LABEL: xor_i24_as_v3i8:
30 ; X86:       # %bb.0:
31 ; X86-NEXT:    movl {{[0-9]+}}(%esp), %eax
32 ; X86-NEXT:    xorl {{[0-9]+}}(%esp), %eax
33 ; X86-NEXT:    retl
35 ; X64-LABEL: xor_i24_as_v3i8:
36 ; X64:       # %bb.0:
37 ; X64-NEXT:    movl %edi, %eax
38 ; X64-NEXT:    xorl %esi, %eax
39 ; X64-NEXT:    retq
40   %1 = bitcast i24 %a to <3 x i8>
41   %2 = bitcast i24 %b to <3 x i8>
42   %3 = xor <3 x i8> %1, %2
43   %4 = bitcast <3 x i8> %3 to i24
44   ret i24 %4
47 define i24 @or_i24_as_v3i8(i24 %a, i24 %b) nounwind {
48 ; X86-LABEL: or_i24_as_v3i8:
49 ; X86:       # %bb.0:
50 ; X86-NEXT:    movl {{[0-9]+}}(%esp), %eax
51 ; X86-NEXT:    orl {{[0-9]+}}(%esp), %eax
52 ; X86-NEXT:    retl
54 ; X64-LABEL: or_i24_as_v3i8:
55 ; X64:       # %bb.0:
56 ; X64-NEXT:    movl %edi, %eax
57 ; X64-NEXT:    orl %esi, %eax
58 ; X64-NEXT:    retq
59   %1 = bitcast i24 %a to <3 x i8>
60   %2 = bitcast i24 %b to <3 x i8>
61   %3 = or <3 x i8> %1, %2
62   %4 = bitcast <3 x i8> %3 to i24
63   ret i24 %4
67 ; AND/XOR/OR i24 as v8i3
70 define i24 @and_i24_as_v8i3(i24 %a, i24 %b) nounwind {
71 ; X86-LABEL: and_i24_as_v8i3:
72 ; X86:       # %bb.0:
73 ; X86-NEXT:    movl {{[0-9]+}}(%esp), %eax
74 ; X86-NEXT:    andl {{[0-9]+}}(%esp), %eax
75 ; X86-NEXT:    retl
77 ; X64-LABEL: and_i24_as_v8i3:
78 ; X64:       # %bb.0:
79 ; X64-NEXT:    movl %edi, %eax
80 ; X64-NEXT:    andl %esi, %eax
81 ; X64-NEXT:    retq
82   %1 = bitcast i24 %a to <8 x i3>
83   %2 = bitcast i24 %b to <8 x i3>
84   %3 = and <8 x i3> %1, %2
85   %4 = bitcast <8 x i3> %3 to i24
86   ret i24 %4
89 define i24 @xor_i24_as_v8i3(i24 %a, i24 %b) nounwind {
90 ; X86-LABEL: xor_i24_as_v8i3:
91 ; X86:       # %bb.0:
92 ; X86-NEXT:    movl {{[0-9]+}}(%esp), %eax
93 ; X86-NEXT:    xorl {{[0-9]+}}(%esp), %eax
94 ; X86-NEXT:    retl
96 ; X64-LABEL: xor_i24_as_v8i3:
97 ; X64:       # %bb.0:
98 ; X64-NEXT:    movl %edi, %eax
99 ; X64-NEXT:    xorl %esi, %eax
100 ; X64-NEXT:    retq
101   %1 = bitcast i24 %a to <8 x i3>
102   %2 = bitcast i24 %b to <8 x i3>
103   %3 = xor <8 x i3> %1, %2
104   %4 = bitcast <8 x i3> %3 to i24
105   ret i24 %4
108 define i24 @or_i24_as_v8i3(i24 %a, i24 %b) nounwind {
109 ; X86-LABEL: or_i24_as_v8i3:
110 ; X86:       # %bb.0:
111 ; X86-NEXT:    movl {{[0-9]+}}(%esp), %eax
112 ; X86-NEXT:    orl {{[0-9]+}}(%esp), %eax
113 ; X86-NEXT:    retl
115 ; X64-LABEL: or_i24_as_v8i3:
116 ; X64:       # %bb.0:
117 ; X64-NEXT:    movl %edi, %eax
118 ; X64-NEXT:    orl %esi, %eax
119 ; X64-NEXT:    retq
120   %1 = bitcast i24 %a to <8 x i3>
121   %2 = bitcast i24 %b to <8 x i3>
122   %3 = or <8 x i3> %1, %2
123   %4 = bitcast <8 x i3> %3 to i24
124   ret i24 %4
128 ; AND/XOR/OR v3i8 as i24
131 define <3 x i8> @and_v3i8_as_i24(<3 x i8> %a, <3 x i8> %b) nounwind {
132 ; X86-LABEL: and_v3i8_as_i24:
133 ; X86:       # %bb.0:
134 ; X86-NEXT:    movd {{.*#+}} xmm0 = mem[0],zero,zero,zero
135 ; X86-NEXT:    pinsrb $1, {{[0-9]+}}(%esp), %xmm0
136 ; X86-NEXT:    pinsrb $2, {{[0-9]+}}(%esp), %xmm0
137 ; X86-NEXT:    movd {{.*#+}} xmm1 = mem[0],zero,zero,zero
138 ; X86-NEXT:    pinsrb $1, {{[0-9]+}}(%esp), %xmm1
139 ; X86-NEXT:    pinsrb $2, {{[0-9]+}}(%esp), %xmm1
140 ; X86-NEXT:    pand %xmm0, %xmm1
141 ; X86-NEXT:    movd %xmm1, %eax
142 ; X86-NEXT:    pextrb $1, %xmm1, %edx
143 ; X86-NEXT:    pextrb $2, %xmm1, %ecx
144 ; X86-NEXT:    # kill: def $al killed $al killed $eax
145 ; X86-NEXT:    # kill: def $dl killed $dl killed $edx
146 ; X86-NEXT:    # kill: def $cl killed $cl killed $ecx
147 ; X86-NEXT:    retl
149 ; X64-LABEL: and_v3i8_as_i24:
150 ; X64:       # %bb.0:
151 ; X64-NEXT:    movd %ecx, %xmm0
152 ; X64-NEXT:    pinsrb $1, %r8d, %xmm0
153 ; X64-NEXT:    pinsrb $2, %r9d, %xmm0
154 ; X64-NEXT:    movd %edi, %xmm1
155 ; X64-NEXT:    pinsrb $1, %esi, %xmm1
156 ; X64-NEXT:    pinsrb $2, %edx, %xmm1
157 ; X64-NEXT:    pand %xmm0, %xmm1
158 ; X64-NEXT:    movd %xmm1, %eax
159 ; X64-NEXT:    pextrb $1, %xmm1, %edx
160 ; X64-NEXT:    pextrb $2, %xmm1, %ecx
161 ; X64-NEXT:    # kill: def $al killed $al killed $eax
162 ; X64-NEXT:    # kill: def $dl killed $dl killed $edx
163 ; X64-NEXT:    # kill: def $cl killed $cl killed $ecx
164 ; X64-NEXT:    retq
165   %1 = bitcast <3 x i8> %a to i24
166   %2 = bitcast <3 x i8> %b to i24
167   %3 = and i24 %1, %2
168   %4 = bitcast i24 %3 to <3 x i8>
169   ret <3 x i8>  %4
172 define <3 x i8> @xor_v3i8_as_i24(<3 x i8> %a, <3 x i8> %b) nounwind {
173 ; X86-LABEL: xor_v3i8_as_i24:
174 ; X86:       # %bb.0:
175 ; X86-NEXT:    movd {{.*#+}} xmm0 = mem[0],zero,zero,zero
176 ; X86-NEXT:    pinsrb $1, {{[0-9]+}}(%esp), %xmm0
177 ; X86-NEXT:    pinsrb $2, {{[0-9]+}}(%esp), %xmm0
178 ; X86-NEXT:    movd {{.*#+}} xmm1 = mem[0],zero,zero,zero
179 ; X86-NEXT:    pinsrb $1, {{[0-9]+}}(%esp), %xmm1
180 ; X86-NEXT:    pinsrb $2, {{[0-9]+}}(%esp), %xmm1
181 ; X86-NEXT:    pxor %xmm0, %xmm1
182 ; X86-NEXT:    movd %xmm1, %eax
183 ; X86-NEXT:    pextrb $1, %xmm1, %edx
184 ; X86-NEXT:    pextrb $2, %xmm1, %ecx
185 ; X86-NEXT:    # kill: def $al killed $al killed $eax
186 ; X86-NEXT:    # kill: def $dl killed $dl killed $edx
187 ; X86-NEXT:    # kill: def $cl killed $cl killed $ecx
188 ; X86-NEXT:    retl
190 ; X64-LABEL: xor_v3i8_as_i24:
191 ; X64:       # %bb.0:
192 ; X64-NEXT:    movd %ecx, %xmm0
193 ; X64-NEXT:    pinsrb $1, %r8d, %xmm0
194 ; X64-NEXT:    pinsrb $2, %r9d, %xmm0
195 ; X64-NEXT:    movd %edi, %xmm1
196 ; X64-NEXT:    pinsrb $1, %esi, %xmm1
197 ; X64-NEXT:    pinsrb $2, %edx, %xmm1
198 ; X64-NEXT:    pxor %xmm0, %xmm1
199 ; X64-NEXT:    movd %xmm1, %eax
200 ; X64-NEXT:    pextrb $1, %xmm1, %edx
201 ; X64-NEXT:    pextrb $2, %xmm1, %ecx
202 ; X64-NEXT:    # kill: def $al killed $al killed $eax
203 ; X64-NEXT:    # kill: def $dl killed $dl killed $edx
204 ; X64-NEXT:    # kill: def $cl killed $cl killed $ecx
205 ; X64-NEXT:    retq
206   %1 = bitcast <3 x i8> %a to i24
207   %2 = bitcast <3 x i8> %b to i24
208   %3 = xor i24 %1, %2
209   %4 = bitcast i24 %3 to <3 x i8>
210   ret <3 x i8>  %4
213 define <3 x i8> @or_v3i8_as_i24(<3 x i8> %a, <3 x i8> %b) nounwind {
214 ; X86-LABEL: or_v3i8_as_i24:
215 ; X86:       # %bb.0:
216 ; X86-NEXT:    movd {{.*#+}} xmm0 = mem[0],zero,zero,zero
217 ; X86-NEXT:    pinsrb $1, {{[0-9]+}}(%esp), %xmm0
218 ; X86-NEXT:    pinsrb $2, {{[0-9]+}}(%esp), %xmm0
219 ; X86-NEXT:    movd {{.*#+}} xmm1 = mem[0],zero,zero,zero
220 ; X86-NEXT:    pinsrb $1, {{[0-9]+}}(%esp), %xmm1
221 ; X86-NEXT:    pinsrb $2, {{[0-9]+}}(%esp), %xmm1
222 ; X86-NEXT:    por %xmm0, %xmm1
223 ; X86-NEXT:    movd %xmm1, %eax
224 ; X86-NEXT:    pextrb $1, %xmm1, %edx
225 ; X86-NEXT:    pextrb $2, %xmm1, %ecx
226 ; X86-NEXT:    # kill: def $al killed $al killed $eax
227 ; X86-NEXT:    # kill: def $dl killed $dl killed $edx
228 ; X86-NEXT:    # kill: def $cl killed $cl killed $ecx
229 ; X86-NEXT:    retl
231 ; X64-LABEL: or_v3i8_as_i24:
232 ; X64:       # %bb.0:
233 ; X64-NEXT:    movd %ecx, %xmm0
234 ; X64-NEXT:    pinsrb $1, %r8d, %xmm0
235 ; X64-NEXT:    pinsrb $2, %r9d, %xmm0
236 ; X64-NEXT:    movd %edi, %xmm1
237 ; X64-NEXT:    pinsrb $1, %esi, %xmm1
238 ; X64-NEXT:    pinsrb $2, %edx, %xmm1
239 ; X64-NEXT:    por %xmm0, %xmm1
240 ; X64-NEXT:    movd %xmm1, %eax
241 ; X64-NEXT:    pextrb $1, %xmm1, %edx
242 ; X64-NEXT:    pextrb $2, %xmm1, %ecx
243 ; X64-NEXT:    # kill: def $al killed $al killed $eax
244 ; X64-NEXT:    # kill: def $dl killed $dl killed $edx
245 ; X64-NEXT:    # kill: def $cl killed $cl killed $ecx
246 ; X64-NEXT:    retq
247   %1 = bitcast <3 x i8> %a to i24
248   %2 = bitcast <3 x i8> %b to i24
249   %3 = or i24 %1, %2
250   %4 = bitcast i24 %3 to <3 x i8>
251   ret <3 x i8>  %4
255 ; AND/XOR/OR v8i3 as i24
258 define <8 x i3> @and_v8i3_as_i24(<8 x i3> %a, <8 x i3> %b) nounwind {
259 ; X86-LABEL: and_v8i3_as_i24:
260 ; X86:       # %bb.0:
261 ; X86-NEXT:    andps %xmm1, %xmm0
262 ; X86-NEXT:    retl
264 ; X64-LABEL: and_v8i3_as_i24:
265 ; X64:       # %bb.0:
266 ; X64-NEXT:    andps %xmm1, %xmm0
267 ; X64-NEXT:    retq
268   %1 = bitcast <8 x i3> %a to i24
269   %2 = bitcast <8 x i3> %b to i24
270   %3 = and i24 %1, %2
271   %4 = bitcast i24 %3 to <8 x i3>
272   ret <8 x i3>  %4
275 define <8 x i3> @xor_v8i3_as_i24(<8 x i3> %a, <8 x i3> %b) nounwind {
276 ; X86-LABEL: xor_v8i3_as_i24:
277 ; X86:       # %bb.0:
278 ; X86-NEXT:    xorps %xmm1, %xmm0
279 ; X86-NEXT:    retl
281 ; X64-LABEL: xor_v8i3_as_i24:
282 ; X64:       # %bb.0:
283 ; X64-NEXT:    xorps %xmm1, %xmm0
284 ; X64-NEXT:    retq
285   %1 = bitcast <8 x i3> %a to i24
286   %2 = bitcast <8 x i3> %b to i24
287   %3 = xor i24 %1, %2
288   %4 = bitcast i24 %3 to <8 x i3>
289   ret <8 x i3>  %4
292 define <8 x i3> @or_v8i3_as_i24(<8 x i3> %a, <8 x i3> %b) nounwind {
293 ; X86-LABEL: or_v8i3_as_i24:
294 ; X86:       # %bb.0:
295 ; X86-NEXT:    orps %xmm1, %xmm0
296 ; X86-NEXT:    retl
298 ; X64-LABEL: or_v8i3_as_i24:
299 ; X64:       # %bb.0:
300 ; X64-NEXT:    orps %xmm1, %xmm0
301 ; X64-NEXT:    retq
302   %1 = bitcast <8 x i3> %a to i24
303   %2 = bitcast <8 x i3> %b to i24
304   %3 = or i24 %1, %2
305   %4 = bitcast i24 %3 to <8 x i3>
306   ret <8 x i3>  %4