[ORC] Add std::tuple support to SimplePackedSerialization.
[llvm-project.git] / llvm / test / CodeGen / AArch64 / sve-fp-reduce.ll
blobb0a902f197c0065bc7ac6c95f3206d85c693cd44
1 ; RUN: llc -mtriple=aarch64-linux-gnu -mattr=+sve -asm-verbose=0 < %s | FileCheck %s
3 ; FADD
5 define half @fadda_nxv2f16(half %init, <vscale x 2 x half> %a) {
6 ; CHECK-LABEL: fadda_nxv2f16:
7 ; CHECK:      ptrue p0.d
8 ; CHECK-NEXT: fadda h0, p0, h0, z1.h
9 ; CHECK-NEXT: ret
10   %res = call half @llvm.vector.reduce.fadd.nxv2f16(half %init, <vscale x 2 x half> %a)
11   ret half %res
14 define half @fadda_nxv4f16(half %init, <vscale x 4 x half> %a) {
15 ; CHECK-LABEL: fadda_nxv4f16:
16 ; CHECK:      ptrue p0.s
17 ; CHECK-NEXT: fadda h0, p0, h0, z1.h
18 ; CHECK-NEXT: ret
19   %res = call half @llvm.vector.reduce.fadd.nxv4f16(half %init, <vscale x 4 x half> %a)
20   ret half %res
23 define half @fadda_nxv8f16(half %init, <vscale x 8 x half> %a) {
24 ; CHECK-LABEL: fadda_nxv8f16:
25 ; CHECK:      ptrue p0.h
26 ; CHECK-NEXT: fadda h0, p0, h0, z1.h
27 ; CHECK-NEXT: ret
28   %res = call half @llvm.vector.reduce.fadd.nxv8f16(half %init, <vscale x 8 x half> %a)
29   ret half %res
32 define float @fadda_nxv2f32(float %init, <vscale x 2 x float> %a) {
33 ; CHECK-LABEL: fadda_nxv2f32:
34 ; CHECK:      ptrue p0.d
35 ; CHECK-NEXT: fadda s0, p0, s0, z1.s
36 ; CHECK-NEXT: ret
37   %res = call float @llvm.vector.reduce.fadd.nxv2f32(float %init, <vscale x 2 x float> %a)
38   ret float %res
41 define float @fadda_nxv4f32(float %init, <vscale x 4 x float> %a) {
42 ; CHECK-LABEL: fadda_nxv4f32:
43 ; CHECK:      ptrue p0.s
44 ; CHECK-NEXT: fadda s0, p0, s0, z1.s
45 ; CHECK-NEXT: ret
46   %res = call float @llvm.vector.reduce.fadd.nxv4f32(float %init, <vscale x 4 x float> %a)
47   ret float %res
50 define double @fadda_nxv2f64(double %init, <vscale x 2 x double> %a) {
51 ; CHECK-LABEL: fadda_nxv2f64:
52 ; CHECK:      ptrue p0.d
53 ; CHECK-NEXT: fadda d0, p0, d0, z1.d
54 ; CHECK-NEXT: ret
55   %res = call double @llvm.vector.reduce.fadd.nxv2f64(double %init, <vscale x 2 x double> %a)
56   ret double %res
59 ; FADDV
61 define half @faddv_nxv2f16(half %init, <vscale x 2 x half> %a) {
62 ; CHECK-LABEL: faddv_nxv2f16:
63 ; CHECK:      ptrue p0.d
64 ; CHECK-NEXT: faddv h1, p0, z1.h
65 ; CHECK-NEXT: fadd h0, h0, h1
66 ; CHECK-NEXT: ret
67   %res = call fast half @llvm.vector.reduce.fadd.nxv2f16(half %init, <vscale x 2 x half> %a)
68   ret half %res
71 define half @faddv_nxv4f16(half %init, <vscale x 4 x half> %a) {
72 ; CHECK-LABEL: faddv_nxv4f16:
73 ; CHECK:      ptrue p0.s
74 ; CHECK-NEXT: faddv h1, p0, z1.h
75 ; CHECK-NEXT: fadd h0, h0, h1
76 ; CHECK-NEXT: ret
77   %res = call fast half @llvm.vector.reduce.fadd.nxv4f16(half %init, <vscale x 4 x half> %a)
78   ret half %res
81 define half @faddv_nxv8f16(half %init, <vscale x 8 x half> %a) {
82 ; CHECK-LABEL: faddv_nxv8f16:
83 ; CHECK:      ptrue p0.h
84 ; CHECK-NEXT: faddv h1, p0, z1.h
85 ; CHECK-NEXT: fadd h0, h0, h1
86 ; CHECK-NEXT: ret
87   %res = call fast half @llvm.vector.reduce.fadd.nxv8f16(half %init, <vscale x 8 x half> %a)
88   ret half %res
91 define float @faddv_nxv2f32(float %init, <vscale x 2 x float> %a) {
92 ; CHECK-LABEL: faddv_nxv2f32:
93 ; CHECK:      ptrue p0.d
94 ; CHECK-NEXT: faddv s1, p0, z1.s
95 ; CHECK-NEXT: fadd s0, s0, s1
96 ; CHECK-NEXT: ret
97   %res = call fast float @llvm.vector.reduce.fadd.nxv2f32(float %init, <vscale x 2 x float> %a)
98   ret float %res
101 define float @faddv_nxv4f32(float %init, <vscale x 4 x float> %a) {
102 ; CHECK-LABEL: faddv_nxv4f32:
103 ; CHECK:      ptrue p0.s
104 ; CHECK-NEXT: faddv s1, p0, z1.s
105 ; CHECK-NEXT: fadd s0, s0, s1
106 ; CHECK-NEXT: ret
107   %res = call fast float @llvm.vector.reduce.fadd.nxv4f32(float %init, <vscale x 4 x float> %a)
108   ret float %res
111 define double @faddv_nxv2f64(double %init, <vscale x 2 x double> %a) {
112 ; CHECK-LABEL: faddv_nxv2f64:
113 ; CHECK:      ptrue p0.d
114 ; CHECK-NEXT: faddv d1, p0, z1.d
115 ; CHECK-NEXT: fadd d0, d0, d1
116 ; CHECK-NEXT: ret
117   %res = call fast double @llvm.vector.reduce.fadd.nxv2f64(double %init, <vscale x 2 x double> %a)
118   ret double %res
121 ; FMAXV
123 define half @fmaxv_nxv2f16(<vscale x 2 x half> %a) {
124 ; CHECK-LABEL: fmaxv_nxv2f16:
125 ; CHECK:      ptrue p0.d
126 ; CHECK-NEXT: fmaxnmv h0, p0, z0.h
127 ; CHECK-NEXT: ret
128   %res = call half @llvm.vector.reduce.fmax.nxv2f16(<vscale x 2 x half> %a)
129   ret half %res
132 define half @fmaxv_nxv4f16(<vscale x 4 x half> %a) {
133 ; CHECK-LABEL: fmaxv_nxv4f16:
134 ; CHECK:      ptrue p0.s
135 ; CHECK-NEXT: fmaxnmv h0, p0, z0.h
136 ; CHECK-NEXT: ret
137   %res = call half @llvm.vector.reduce.fmax.nxv4f16(<vscale x 4 x half> %a)
138   ret half %res
141 define half @fmaxv_nxv8f16(<vscale x 8 x half> %a) {
142 ; CHECK-LABEL: fmaxv_nxv8f16:
143 ; CHECK:      ptrue p0.h
144 ; CHECK-NEXT: fmaxnmv h0, p0, z0.h
145 ; CHECK-NEXT: ret
146   %res = call half @llvm.vector.reduce.fmax.nxv8f16(<vscale x 8 x half> %a)
147   ret half %res
150 define float @fmaxv_nxv2f32(<vscale x 2 x float> %a) {
151 ; CHECK-LABEL: fmaxv_nxv2f32:
152 ; CHECK:      ptrue p0.d
153 ; CHECK-NEXT: fmaxnmv s0, p0, z0.s
154 ; CHECK-NEXT: ret
155   %res = call float @llvm.vector.reduce.fmax.nxv2f32(<vscale x 2 x float> %a)
156   ret float %res
159 define float @fmaxv_nxv4f32(<vscale x 4 x float> %a) {
160 ; CHECK-LABEL: fmaxv_nxv4f32:
161 ; CHECK:      ptrue p0.s
162 ; CHECK-NEXT: fmaxnmv s0, p0, z0.s
163 ; CHECK-NEXT: ret
164   %res = call float @llvm.vector.reduce.fmax.nxv4f32(<vscale x 4 x float> %a)
165   ret float %res
168 define double @fmaxv_nxv2f64(<vscale x 2 x double> %a) {
169 ; CHECK-LABEL: fmaxv_nxv2f64:
170 ; CHECK:      ptrue p0.d
171 ; CHECK-NEXT: fmaxnmv d0, p0, z0.d
172 ; CHECK-NEXT: ret
173   %res = call double @llvm.vector.reduce.fmax.nxv2f64(<vscale x 2 x double> %a)
174   ret double %res
177 ; FMINV
179 define half @fminv_nxv2f16(<vscale x 2 x half> %a) {
180 ; CHECK-LABEL: fminv_nxv2f16:
181 ; CHECK:      ptrue p0.d
182 ; CHECK-NEXT: fminnmv h0, p0, z0.h
183 ; CHECK-NEXT: ret
184   %res = call half @llvm.vector.reduce.fmin.nxv2f16(<vscale x 2 x half> %a)
185   ret half %res
188 define half @fminv_nxv4f16(<vscale x 4 x half> %a) {
189 ; CHECK-LABEL: fminv_nxv4f16:
190 ; CHECK:      ptrue p0.s
191 ; CHECK-NEXT: fminnmv h0, p0, z0.h
192 ; CHECK-NEXT: ret
193   %res = call half @llvm.vector.reduce.fmin.nxv4f16(<vscale x 4 x half> %a)
194   ret half %res
197 define half @fminv_nxv8f16(<vscale x 8 x half> %a) {
198 ; CHECK-LABEL: fminv_nxv8f16:
199 ; CHECK:      ptrue p0.h
200 ; CHECK-NEXT: fminnmv h0, p0, z0.h
201 ; CHECK-NEXT: ret
202   %res = call half @llvm.vector.reduce.fmin.nxv8f16(<vscale x 8 x half> %a)
203   ret half %res
206 define float @fminv_nxv2f32(<vscale x 2 x float> %a) {
207 ; CHECK-LABEL: fminv_nxv2f32:
208 ; CHECK:      ptrue p0.d
209 ; CHECK-NEXT: fminnmv s0, p0, z0.s
210 ; CHECK-NEXT: ret
211   %res = call float @llvm.vector.reduce.fmin.nxv2f32(<vscale x 2 x float> %a)
212   ret float %res
215 define float @fminv_nxv4f32(<vscale x 4 x float> %a) {
216 ; CHECK-LABEL: fminv_nxv4f32:
217 ; CHECK:      ptrue p0.s
218 ; CHECK-NEXT: fminnmv s0, p0, z0.s
219 ; CHECK-NEXT: ret
220   %res = call float @llvm.vector.reduce.fmin.nxv4f32(<vscale x 4 x float> %a)
221   ret float %res
224 define double @fminv_nxv2f64(<vscale x 2 x double> %a) {
225 ; CHECK-LABEL: fminv_nxv2f64:
226 ; CHECK:      ptrue p0.d
227 ; CHECK-NEXT: fminnmv d0, p0, z0.d
228 ; CHECK-NEXT: ret
229   %res = call double @llvm.vector.reduce.fmin.nxv2f64(<vscale x 2 x double> %a)
230   ret double %res
233 declare half @llvm.vector.reduce.fadd.nxv2f16(half, <vscale x 2 x half>)
234 declare half @llvm.vector.reduce.fadd.nxv4f16(half, <vscale x 4 x half>)
235 declare half @llvm.vector.reduce.fadd.nxv8f16(half, <vscale x 8 x half>)
236 declare float @llvm.vector.reduce.fadd.nxv2f32(float, <vscale x 2 x float>)
237 declare float @llvm.vector.reduce.fadd.nxv4f32(float, <vscale x 4 x float>)
238 declare double @llvm.vector.reduce.fadd.nxv2f64(double, <vscale x 2 x double>)
240 declare half @llvm.vector.reduce.fmax.nxv2f16(<vscale x 2 x half>)
241 declare half @llvm.vector.reduce.fmax.nxv4f16(<vscale x 4 x half>)
242 declare half @llvm.vector.reduce.fmax.nxv8f16(<vscale x 8 x half>)
243 declare float @llvm.vector.reduce.fmax.nxv2f32(<vscale x 2 x float>)
244 declare float @llvm.vector.reduce.fmax.nxv4f32(<vscale x 4 x float>)
245 declare double @llvm.vector.reduce.fmax.nxv2f64(<vscale x 2 x double>)
247 declare half @llvm.vector.reduce.fmin.nxv2f16(<vscale x 2 x half>)
248 declare half @llvm.vector.reduce.fmin.nxv4f16(<vscale x 4 x half>)
249 declare half @llvm.vector.reduce.fmin.nxv8f16(<vscale x 8 x half>)
250 declare float @llvm.vector.reduce.fmin.nxv2f32(<vscale x 2 x float>)
251 declare float @llvm.vector.reduce.fmin.nxv4f32(<vscale x 4 x float>)
252 declare double @llvm.vector.reduce.fmin.nxv2f64(<vscale x 2 x double>)