[ORC] Add std::tuple support to SimplePackedSerialization.
[llvm-project.git] / llvm / test / CodeGen / AArch64 / sve-int-reduce.ll
blob0d3f605d6d8ce193a3694bfdb886ea587585729e
1 ; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
2 ; RUN: llc -mtriple=aarch64-linux-gnu -mattr=+sve < %s | FileCheck %s
4 ; ANDV
6 define i8 @andv_nxv16i8(<vscale x 16 x i8> %a) {
7 ; CHECK-LABEL: andv_nxv16i8:
8 ; CHECK:       // %bb.0:
9 ; CHECK-NEXT:    ptrue p0.b
10 ; CHECK-NEXT:    andv b0, p0, z0.b
11 ; CHECK-NEXT:    fmov w0, s0
12 ; CHECK-NEXT:    ret
13   %res = call i8 @llvm.vector.reduce.and.nxv16i8(<vscale x 16 x i8> %a)
14   ret i8 %res
17 define i16 @andv_nxv8i16(<vscale x 8 x i16> %a) {
18 ; CHECK-LABEL: andv_nxv8i16:
19 ; CHECK:       // %bb.0:
20 ; CHECK-NEXT:    ptrue p0.h
21 ; CHECK-NEXT:    andv h0, p0, z0.h
22 ; CHECK-NEXT:    fmov w0, s0
23 ; CHECK-NEXT:    ret
24   %res = call i16 @llvm.vector.reduce.and.nxv8i16(<vscale x 8 x i16> %a)
25   ret i16 %res
28 define i32 @andv_nxv4i32(<vscale x 4 x i32> %a) {
29 ; CHECK-LABEL: andv_nxv4i32:
30 ; CHECK:       // %bb.0:
31 ; CHECK-NEXT:    ptrue p0.s
32 ; CHECK-NEXT:    andv s0, p0, z0.s
33 ; CHECK-NEXT:    fmov w0, s0
34 ; CHECK-NEXT:    ret
35   %res = call i32 @llvm.vector.reduce.and.nxv4i32(<vscale x 4 x i32> %a)
36   ret i32 %res
39 define i64 @andv_nxv2i64(<vscale x 2 x i64> %a) {
40 ; CHECK-LABEL: andv_nxv2i64:
41 ; CHECK:       // %bb.0:
42 ; CHECK-NEXT:    ptrue p0.d
43 ; CHECK-NEXT:    andv d0, p0, z0.d
44 ; CHECK-NEXT:    fmov x0, d0
45 ; CHECK-NEXT:    ret
46   %res = call i64 @llvm.vector.reduce.and.nxv2i64(<vscale x 2 x i64> %a)
47   ret i64 %res
50 ; ORV
52 define i8 @orv_nxv16i8(<vscale x 16 x i8> %a) {
53 ; CHECK-LABEL: orv_nxv16i8:
54 ; CHECK:       // %bb.0:
55 ; CHECK-NEXT:    ptrue p0.b
56 ; CHECK-NEXT:    orv b0, p0, z0.b
57 ; CHECK-NEXT:    fmov w0, s0
58 ; CHECK-NEXT:    ret
59   %res = call i8 @llvm.vector.reduce.or.nxv16i8(<vscale x 16 x i8> %a)
60   ret i8 %res
63 define i16 @orv_nxv8i16(<vscale x 8 x i16> %a) {
64 ; CHECK-LABEL: orv_nxv8i16:
65 ; CHECK:       // %bb.0:
66 ; CHECK-NEXT:    ptrue p0.h
67 ; CHECK-NEXT:    orv h0, p0, z0.h
68 ; CHECK-NEXT:    fmov w0, s0
69 ; CHECK-NEXT:    ret
70   %res = call i16 @llvm.vector.reduce.or.nxv8i16(<vscale x 8 x i16> %a)
71   ret i16 %res
74 define i32 @orv_nxv4i32(<vscale x 4 x i32> %a) {
75 ; CHECK-LABEL: orv_nxv4i32:
76 ; CHECK:       // %bb.0:
77 ; CHECK-NEXT:    ptrue p0.s
78 ; CHECK-NEXT:    orv s0, p0, z0.s
79 ; CHECK-NEXT:    fmov w0, s0
80 ; CHECK-NEXT:    ret
81   %res = call i32 @llvm.vector.reduce.or.nxv4i32(<vscale x 4 x i32> %a)
82   ret i32 %res
85 define i64 @orv_nxv2i64(<vscale x 2 x i64> %a) {
86 ; CHECK-LABEL: orv_nxv2i64:
87 ; CHECK:       // %bb.0:
88 ; CHECK-NEXT:    ptrue p0.d
89 ; CHECK-NEXT:    orv d0, p0, z0.d
90 ; CHECK-NEXT:    fmov x0, d0
91 ; CHECK-NEXT:    ret
92   %res = call i64 @llvm.vector.reduce.or.nxv2i64(<vscale x 2 x i64> %a)
93   ret i64 %res
96 ; XORV
98 define i8 @xorv_nxv16i8(<vscale x 16 x i8> %a) {
99 ; CHECK-LABEL: xorv_nxv16i8:
100 ; CHECK:       // %bb.0:
101 ; CHECK-NEXT:    ptrue p0.b
102 ; CHECK-NEXT:    eorv b0, p0, z0.b
103 ; CHECK-NEXT:    fmov w0, s0
104 ; CHECK-NEXT:    ret
105   %res = call i8 @llvm.vector.reduce.xor.nxv16i8(<vscale x 16 x i8> %a)
106   ret i8 %res
109 define i16 @xorv_nxv8i16(<vscale x 8 x i16> %a) {
110 ; CHECK-LABEL: xorv_nxv8i16:
111 ; CHECK:       // %bb.0:
112 ; CHECK-NEXT:    ptrue p0.h
113 ; CHECK-NEXT:    eorv h0, p0, z0.h
114 ; CHECK-NEXT:    fmov w0, s0
115 ; CHECK-NEXT:    ret
116   %res = call i16 @llvm.vector.reduce.xor.nxv8i16(<vscale x 8 x i16> %a)
117   ret i16 %res
120 define i32 @xorv_nxv4i32(<vscale x 4 x i32> %a) {
121 ; CHECK-LABEL: xorv_nxv4i32:
122 ; CHECK:       // %bb.0:
123 ; CHECK-NEXT:    ptrue p0.s
124 ; CHECK-NEXT:    eorv s0, p0, z0.s
125 ; CHECK-NEXT:    fmov w0, s0
126 ; CHECK-NEXT:    ret
127   %res = call i32 @llvm.vector.reduce.xor.nxv4i32(<vscale x 4 x i32> %a)
128   ret i32 %res
131 define i64 @xorv_nxv2i64(<vscale x 2 x i64> %a) {
132 ; CHECK-LABEL: xorv_nxv2i64:
133 ; CHECK:       // %bb.0:
134 ; CHECK-NEXT:    ptrue p0.d
135 ; CHECK-NEXT:    eorv d0, p0, z0.d
136 ; CHECK-NEXT:    fmov x0, d0
137 ; CHECK-NEXT:    ret
138   %res = call i64 @llvm.vector.reduce.xor.nxv2i64(<vscale x 2 x i64> %a)
139   ret i64 %res
142 ; UADDV
144 define i8 @uaddv_nxv16i8(<vscale x 16 x i8> %a) {
145 ; CHECK-LABEL: uaddv_nxv16i8:
146 ; CHECK:       // %bb.0:
147 ; CHECK-NEXT:    ptrue p0.b
148 ; CHECK-NEXT:    uaddv d0, p0, z0.b
149 ; CHECK-NEXT:    fmov x0, d0
150 ; CHECK-NEXT:    // kill: def $w0 killed $w0 killed $x0
151 ; CHECK-NEXT:    ret
152   %res = call i8 @llvm.vector.reduce.add.nxv16i8(<vscale x 16 x i8> %a)
153   ret i8 %res
156 define i16 @uaddv_nxv8i16(<vscale x 8 x i16> %a) {
157 ; CHECK-LABEL: uaddv_nxv8i16:
158 ; CHECK:       // %bb.0:
159 ; CHECK-NEXT:    ptrue p0.h
160 ; CHECK-NEXT:    uaddv d0, p0, z0.h
161 ; CHECK-NEXT:    fmov x0, d0
162 ; CHECK-NEXT:    // kill: def $w0 killed $w0 killed $x0
163 ; CHECK-NEXT:    ret
164   %res = call i16 @llvm.vector.reduce.add.nxv8i16(<vscale x 8 x i16> %a)
165   ret i16 %res
168 define i32 @uaddv_nxv4i32(<vscale x 4 x i32> %a) {
169 ; CHECK-LABEL: uaddv_nxv4i32:
170 ; CHECK:       // %bb.0:
171 ; CHECK-NEXT:    ptrue p0.s
172 ; CHECK-NEXT:    uaddv d0, p0, z0.s
173 ; CHECK-NEXT:    fmov x0, d0
174 ; CHECK-NEXT:    // kill: def $w0 killed $w0 killed $x0
175 ; CHECK-NEXT:    ret
176   %res = call i32 @llvm.vector.reduce.add.nxv4i32(<vscale x 4 x i32> %a)
177   ret i32 %res
180 define i64 @uaddv_nxv2i64(<vscale x 2 x i64> %a) {
181 ; CHECK-LABEL: uaddv_nxv2i64:
182 ; CHECK:       // %bb.0:
183 ; CHECK-NEXT:    ptrue p0.d
184 ; CHECK-NEXT:    uaddv d0, p0, z0.d
185 ; CHECK-NEXT:    fmov x0, d0
186 ; CHECK-NEXT:    ret
187   %res = call i64 @llvm.vector.reduce.add.nxv2i64(<vscale x 2 x i64> %a)
188   ret i64 %res
191 ; UMINV
193 define i8 @umin_nxv16i8(<vscale x 16 x i8> %a) {
194 ; CHECK-LABEL: umin_nxv16i8:
195 ; CHECK:       // %bb.0:
196 ; CHECK-NEXT:    ptrue p0.b
197 ; CHECK-NEXT:    uminv b0, p0, z0.b
198 ; CHECK-NEXT:    fmov w0, s0
199 ; CHECK-NEXT:    ret
200   %res = call i8 @llvm.vector.reduce.umin.nxv16i8(<vscale x 16 x i8> %a)
201   ret i8 %res
204 define i16 @umin_nxv8i16(<vscale x 8 x i16> %a) {
205 ; CHECK-LABEL: umin_nxv8i16:
206 ; CHECK:       // %bb.0:
207 ; CHECK-NEXT:    ptrue p0.h
208 ; CHECK-NEXT:    uminv h0, p0, z0.h
209 ; CHECK-NEXT:    fmov w0, s0
210 ; CHECK-NEXT:    ret
211   %res = call i16 @llvm.vector.reduce.umin.nxv8i16(<vscale x 8 x i16> %a)
212   ret i16 %res
215 define i32 @umin_nxv4i32(<vscale x 4 x i32> %a) {
216 ; CHECK-LABEL: umin_nxv4i32:
217 ; CHECK:       // %bb.0:
218 ; CHECK-NEXT:    ptrue p0.s
219 ; CHECK-NEXT:    uminv s0, p0, z0.s
220 ; CHECK-NEXT:    fmov w0, s0
221 ; CHECK-NEXT:    ret
222   %res = call i32 @llvm.vector.reduce.umin.nxv4i32(<vscale x 4 x i32> %a)
223   ret i32 %res
226 define i64 @umin_nxv2i64(<vscale x 2 x i64> %a) {
227 ; CHECK-LABEL: umin_nxv2i64:
228 ; CHECK:       // %bb.0:
229 ; CHECK-NEXT:    ptrue p0.d
230 ; CHECK-NEXT:    uminv d0, p0, z0.d
231 ; CHECK-NEXT:    fmov x0, d0
232 ; CHECK-NEXT:    ret
233   %res = call i64 @llvm.vector.reduce.umin.nxv2i64(<vscale x 2 x i64> %a)
234   ret i64 %res
237 ; SMINV
239 define i8 @smin_nxv16i8(<vscale x 16 x i8> %a) {
240 ; CHECK-LABEL: smin_nxv16i8:
241 ; CHECK:       // %bb.0:
242 ; CHECK-NEXT:    ptrue p0.b
243 ; CHECK-NEXT:    sminv b0, p0, z0.b
244 ; CHECK-NEXT:    fmov w0, s0
245 ; CHECK-NEXT:    ret
246   %res = call i8 @llvm.vector.reduce.smin.nxv16i8(<vscale x 16 x i8> %a)
247   ret i8 %res
250 define i16 @smin_nxv8i16(<vscale x 8 x i16> %a) {
251 ; CHECK-LABEL: smin_nxv8i16:
252 ; CHECK:       // %bb.0:
253 ; CHECK-NEXT:    ptrue p0.h
254 ; CHECK-NEXT:    sminv h0, p0, z0.h
255 ; CHECK-NEXT:    fmov w0, s0
256 ; CHECK-NEXT:    ret
257   %res = call i16 @llvm.vector.reduce.smin.nxv8i16(<vscale x 8 x i16> %a)
258   ret i16 %res
261 define i32 @smin_nxv4i32(<vscale x 4 x i32> %a) {
262 ; CHECK-LABEL: smin_nxv4i32:
263 ; CHECK:       // %bb.0:
264 ; CHECK-NEXT:    ptrue p0.s
265 ; CHECK-NEXT:    sminv s0, p0, z0.s
266 ; CHECK-NEXT:    fmov w0, s0
267 ; CHECK-NEXT:    ret
268   %res = call i32 @llvm.vector.reduce.smin.nxv4i32(<vscale x 4 x i32> %a)
269   ret i32 %res
272 define i64 @smin_nxv2i64(<vscale x 2 x i64> %a) {
273 ; CHECK-LABEL: smin_nxv2i64:
274 ; CHECK:       // %bb.0:
275 ; CHECK-NEXT:    ptrue p0.d
276 ; CHECK-NEXT:    sminv d0, p0, z0.d
277 ; CHECK-NEXT:    fmov x0, d0
278 ; CHECK-NEXT:    ret
279   %res = call i64 @llvm.vector.reduce.smin.nxv2i64(<vscale x 2 x i64> %a)
280   ret i64 %res
283 ; UMAXV
285 define i8 @umax_nxv16i8(<vscale x 16 x i8> %a) {
286 ; CHECK-LABEL: umax_nxv16i8:
287 ; CHECK:       // %bb.0:
288 ; CHECK-NEXT:    ptrue p0.b
289 ; CHECK-NEXT:    umaxv b0, p0, z0.b
290 ; CHECK-NEXT:    fmov w0, s0
291 ; CHECK-NEXT:    ret
292   %res = call i8 @llvm.vector.reduce.umax.nxv16i8(<vscale x 16 x i8> %a)
293   ret i8 %res
296 define i16 @umax_nxv8i16(<vscale x 8 x i16> %a) {
297 ; CHECK-LABEL: umax_nxv8i16:
298 ; CHECK:       // %bb.0:
299 ; CHECK-NEXT:    ptrue p0.h
300 ; CHECK-NEXT:    umaxv h0, p0, z0.h
301 ; CHECK-NEXT:    fmov w0, s0
302 ; CHECK-NEXT:    ret
303   %res = call i16 @llvm.vector.reduce.umax.nxv8i16(<vscale x 8 x i16> %a)
304   ret i16 %res
307 define i32 @umax_nxv4i32(<vscale x 4 x i32> %a) {
308 ; CHECK-LABEL: umax_nxv4i32:
309 ; CHECK:       // %bb.0:
310 ; CHECK-NEXT:    ptrue p0.s
311 ; CHECK-NEXT:    umaxv s0, p0, z0.s
312 ; CHECK-NEXT:    fmov w0, s0
313 ; CHECK-NEXT:    ret
314   %res = call i32 @llvm.vector.reduce.umax.nxv4i32(<vscale x 4 x i32> %a)
315   ret i32 %res
318 define i64 @umax_nxv2i64(<vscale x 2 x i64> %a) {
319 ; CHECK-LABEL: umax_nxv2i64:
320 ; CHECK:       // %bb.0:
321 ; CHECK-NEXT:    ptrue p0.d
322 ; CHECK-NEXT:    umaxv d0, p0, z0.d
323 ; CHECK-NEXT:    fmov x0, d0
324 ; CHECK-NEXT:    ret
325   %res = call i64 @llvm.vector.reduce.umax.nxv2i64(<vscale x 2 x i64> %a)
326   ret i64 %res
329 ; SMAXV
331 define i8 @smax_nxv16i8(<vscale x 16 x i8> %a) {
332 ; CHECK-LABEL: smax_nxv16i8:
333 ; CHECK:       // %bb.0:
334 ; CHECK-NEXT:    ptrue p0.b
335 ; CHECK-NEXT:    smaxv b0, p0, z0.b
336 ; CHECK-NEXT:    fmov w0, s0
337 ; CHECK-NEXT:    ret
338   %res = call i8 @llvm.vector.reduce.smax.nxv16i8(<vscale x 16 x i8> %a)
339   ret i8 %res
342 define i16 @smax_nxv8i16(<vscale x 8 x i16> %a) {
343 ; CHECK-LABEL: smax_nxv8i16:
344 ; CHECK:       // %bb.0:
345 ; CHECK-NEXT:    ptrue p0.h
346 ; CHECK-NEXT:    smaxv h0, p0, z0.h
347 ; CHECK-NEXT:    fmov w0, s0
348 ; CHECK-NEXT:    ret
349   %res = call i16 @llvm.vector.reduce.smax.nxv8i16(<vscale x 8 x i16> %a)
350   ret i16 %res
353 define i32 @smax_nxv4i32(<vscale x 4 x i32> %a) {
354 ; CHECK-LABEL: smax_nxv4i32:
355 ; CHECK:       // %bb.0:
356 ; CHECK-NEXT:    ptrue p0.s
357 ; CHECK-NEXT:    smaxv s0, p0, z0.s
358 ; CHECK-NEXT:    fmov w0, s0
359 ; CHECK-NEXT:    ret
360   %res = call i32 @llvm.vector.reduce.smax.nxv4i32(<vscale x 4 x i32> %a)
361   ret i32 %res
364 define i64 @smax_nxv2i64(<vscale x 2 x i64> %a) {
365 ; CHECK-LABEL: smax_nxv2i64:
366 ; CHECK:       // %bb.0:
367 ; CHECK-NEXT:    ptrue p0.d
368 ; CHECK-NEXT:    smaxv d0, p0, z0.d
369 ; CHECK-NEXT:    fmov x0, d0
370 ; CHECK-NEXT:    ret
371   %res = call i64 @llvm.vector.reduce.smax.nxv2i64(<vscale x 2 x i64> %a)
372   ret i64 %res
375 declare i8 @llvm.vector.reduce.and.nxv16i8(<vscale x 16 x i8>)
376 declare i16 @llvm.vector.reduce.and.nxv8i16(<vscale x 8 x i16>)
377 declare i32 @llvm.vector.reduce.and.nxv4i32(<vscale x 4 x i32>)
378 declare i64 @llvm.vector.reduce.and.nxv2i64(<vscale x 2 x i64>)
380 declare i8 @llvm.vector.reduce.or.nxv16i8(<vscale x 16 x i8>)
381 declare i16 @llvm.vector.reduce.or.nxv8i16(<vscale x 8 x i16>)
382 declare i32 @llvm.vector.reduce.or.nxv4i32(<vscale x 4 x i32>)
383 declare i64 @llvm.vector.reduce.or.nxv2i64(<vscale x 2 x i64>)
385 declare i8 @llvm.vector.reduce.xor.nxv16i8(<vscale x 16 x i8>)
386 declare i16 @llvm.vector.reduce.xor.nxv8i16(<vscale x 8 x i16>)
387 declare i32 @llvm.vector.reduce.xor.nxv4i32(<vscale x 4 x i32>)
388 declare i64 @llvm.vector.reduce.xor.nxv2i64(<vscale x 2 x i64>)
390 declare i8 @llvm.vector.reduce.add.nxv16i8(<vscale x 16 x i8>)
391 declare i16 @llvm.vector.reduce.add.nxv8i16(<vscale x 8 x i16>)
392 declare i32 @llvm.vector.reduce.add.nxv4i32(<vscale x 4 x i32>)
393 declare i64 @llvm.vector.reduce.add.nxv2i64(<vscale x 2 x i64>)
395 declare i8 @llvm.vector.reduce.umin.nxv16i8(<vscale x 16 x i8>)
396 declare i16 @llvm.vector.reduce.umin.nxv8i16(<vscale x 8 x i16>)
397 declare i32 @llvm.vector.reduce.umin.nxv4i32(<vscale x 4 x i32>)
398 declare i64 @llvm.vector.reduce.umin.nxv2i64(<vscale x 2 x i64>)
400 declare i8 @llvm.vector.reduce.smin.nxv16i8(<vscale x 16 x i8>)
401 declare i16 @llvm.vector.reduce.smin.nxv8i16(<vscale x 8 x i16>)
402 declare i32 @llvm.vector.reduce.smin.nxv4i32(<vscale x 4 x i32>)
403 declare i64 @llvm.vector.reduce.smin.nxv2i64(<vscale x 2 x i64>)
405 declare i8 @llvm.vector.reduce.umax.nxv16i8(<vscale x 16 x i8>)
406 declare i16 @llvm.vector.reduce.umax.nxv8i16(<vscale x 8 x i16>)
407 declare i32 @llvm.vector.reduce.umax.nxv4i32(<vscale x 4 x i32>)
408 declare i64 @llvm.vector.reduce.umax.nxv2i64(<vscale x 2 x i64>)
410 declare i8 @llvm.vector.reduce.smax.nxv16i8(<vscale x 16 x i8>)
411 declare i16 @llvm.vector.reduce.smax.nxv8i16(<vscale x 8 x i16>)
412 declare i32 @llvm.vector.reduce.smax.nxv4i32(<vscale x 4 x i32>)
413 declare i64 @llvm.vector.reduce.smax.nxv2i64(<vscale x 2 x i64>)