[NFC][RemoveDIs] Prefer iterators over inst-pointers in InstCombine
[llvm-project.git] / llvm / test / CodeGen / AArch64 / vecreduce-fmax-legalization-nan.ll
blob4354fcd465dac8b48e8a669e6e67fb5ee2d2db18
1 ; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
2 ; RUN: llc < %s -mtriple=aarch64-none-linux-gnu -mattr=+neon | FileCheck %s --check-prefix=CHECK --check-prefix=CHECK-NOFP --check-prefix=CHECK-NOFP-SD
3 ; RUN: llc < %s -mtriple=aarch64-none-linux-gnu -mattr=+neon,+fullfp16 | FileCheck %s --check-prefix=CHECK --check-prefix=CHECK-FP --check-prefix=CHECK-FP-SD
4 ; RUN: llc < %s -mtriple=aarch64-none-linux-gnu -mattr=+neon -global-isel -global-isel-abort=2 2>&1 | FileCheck %s --check-prefix=CHECK --check-prefix=CHECK-NOFP --check-prefix=CHECK-NOFP-GI
5 ; RUN: llc < %s -mtriple=aarch64-none-linux-gnu -mattr=+neon,+fullfp16 -global-isel -global-isel-abort=2 2>&1 | FileCheck %s --check-prefix=CHECK --check-prefix=CHECK-FP --check-prefix=CHECK-FP-GI
7 ; CHECK-NOFP-GI:       warning: Instruction selection used fallback path for test_v11f16
8 ; CHECK-NOFP-GI-NEXT:  warning: Instruction selection used fallback path for test_v11f16_ninf
9 ; CHECK-NOFP-GI-NEXT:  warning: Instruction selection used fallback path for test_v3f32
10 ; CHECK-NOFP-GI-NEXT:  warning: Instruction selection used fallback path for test_v3f32_ninf
11 ; CHECK-NOFP-GI-NEXT:  warning: Instruction selection used fallback path for test_v2f128
13 ; CHECK-FP-GI:       warning: Instruction selection used fallback path for test_v11f16
14 ; CHECK-FP-GI-NEXT:  warning: Instruction selection used fallback path for test_v11f16_ninf
15 ; CHECK-FP-GI-NEXT:  warning: Instruction selection used fallback path for test_v3f32
16 ; CHECK-FP-GI-NEXT:  warning: Instruction selection used fallback path for test_v3f32_ninf
17 ; CHECK-FP-GI-NEXT:  warning: Instruction selection used fallback path for test_v2f128
19 declare half @llvm.vector.reduce.fmax.v1f16(<1 x half> %a)
20 declare float @llvm.vector.reduce.fmax.v1f32(<1 x float> %a)
21 declare double @llvm.vector.reduce.fmax.v1f64(<1 x double> %a)
22 declare fp128 @llvm.vector.reduce.fmax.v1f128(<1 x fp128> %a)
24 declare half @llvm.vector.reduce.fmax.v4f16(<4 x half> %a)
25 declare half @llvm.vector.reduce.fmax.v8f16(<8 x half> %a)
26 declare half @llvm.vector.reduce.fmax.v16f16(<16 x half> %a)
27 declare float @llvm.vector.reduce.fmax.v2f32(<2 x float> %a)
28 declare float @llvm.vector.reduce.fmax.v4f32(<4 x float> %a)
29 declare float @llvm.vector.reduce.fmax.v8f32(<8 x float> %a)
30 declare float @llvm.vector.reduce.fmax.v16f32(<16 x float> %a)
31 declare double @llvm.vector.reduce.fmax.v2f64(<2 x double> %a)
32 declare double @llvm.vector.reduce.fmax.v4f64(<4 x double> %a)
34 declare half @llvm.vector.reduce.fmax.v11f16(<11 x half> %a)
35 declare float @llvm.vector.reduce.fmax.v3f32(<3 x float> %a)
36 declare fp128 @llvm.vector.reduce.fmax.v2f128(<2 x fp128> %a)
38 define half @test_v1f16(<1 x half> %a) nounwind {
39 ; CHECK-LABEL: test_v1f16:
40 ; CHECK:       // %bb.0:
41 ; CHECK-NEXT:    ret
42   %b = call half @llvm.vector.reduce.fmax.v1f16(<1 x half> %a)
43   ret half %b
46 define float @test_v1f32(<1 x float> %a) nounwind {
47 ; CHECK-NOFP-SD-LABEL: test_v1f32:
48 ; CHECK-NOFP-SD:       // %bb.0:
49 ; CHECK-NOFP-SD-NEXT:    // kill: def $d0 killed $d0 def $q0
50 ; CHECK-NOFP-SD-NEXT:    // kill: def $s0 killed $s0 killed $q0
51 ; CHECK-NOFP-SD-NEXT:    ret
53 ; CHECK-FP-SD-LABEL: test_v1f32:
54 ; CHECK-FP-SD:       // %bb.0:
55 ; CHECK-FP-SD-NEXT:    // kill: def $d0 killed $d0 def $q0
56 ; CHECK-FP-SD-NEXT:    // kill: def $s0 killed $s0 killed $q0
57 ; CHECK-FP-SD-NEXT:    ret
59 ; CHECK-NOFP-GI-LABEL: test_v1f32:
60 ; CHECK-NOFP-GI:       // %bb.0:
61 ; CHECK-NOFP-GI-NEXT:    fmov x8, d0
62 ; CHECK-NOFP-GI-NEXT:    fmov s0, w8
63 ; CHECK-NOFP-GI-NEXT:    ret
65 ; CHECK-FP-GI-LABEL: test_v1f32:
66 ; CHECK-FP-GI:       // %bb.0:
67 ; CHECK-FP-GI-NEXT:    fmov x8, d0
68 ; CHECK-FP-GI-NEXT:    fmov s0, w8
69 ; CHECK-FP-GI-NEXT:    ret
70   %b = call float @llvm.vector.reduce.fmax.v1f32(<1 x float> %a)
71   ret float %b
74 define double @test_v1f64(<1 x double> %a) nounwind {
75 ; CHECK-LABEL: test_v1f64:
76 ; CHECK:       // %bb.0:
77 ; CHECK-NEXT:    ret
78   %b = call double @llvm.vector.reduce.fmax.v1f64(<1 x double> %a)
79   ret double %b
82 define fp128 @test_v1f128(<1 x fp128> %a) nounwind {
83 ; CHECK-LABEL: test_v1f128:
84 ; CHECK:       // %bb.0:
85 ; CHECK-NEXT:    ret
86   %b = call fp128 @llvm.vector.reduce.fmax.v1f128(<1 x fp128> %a)
87   ret fp128 %b
90 define half @test_v4f16(<4 x half> %a) nounwind {
91 ; CHECK-NOFP-SD-LABEL: test_v4f16:
92 ; CHECK-NOFP-SD:       // %bb.0:
93 ; CHECK-NOFP-SD-NEXT:    // kill: def $d0 killed $d0 def $q0
94 ; CHECK-NOFP-SD-NEXT:    mov h1, v0.h[1]
95 ; CHECK-NOFP-SD-NEXT:    fcvt s2, h0
96 ; CHECK-NOFP-SD-NEXT:    fcvt s1, h1
97 ; CHECK-NOFP-SD-NEXT:    fmaxnm s1, s2, s1
98 ; CHECK-NOFP-SD-NEXT:    mov h2, v0.h[2]
99 ; CHECK-NOFP-SD-NEXT:    mov h0, v0.h[3]
100 ; CHECK-NOFP-SD-NEXT:    fcvt h1, s1
101 ; CHECK-NOFP-SD-NEXT:    fcvt s2, h2
102 ; CHECK-NOFP-SD-NEXT:    fcvt s0, h0
103 ; CHECK-NOFP-SD-NEXT:    fcvt s1, h1
104 ; CHECK-NOFP-SD-NEXT:    fmaxnm s1, s1, s2
105 ; CHECK-NOFP-SD-NEXT:    fcvt h1, s1
106 ; CHECK-NOFP-SD-NEXT:    fcvt s1, h1
107 ; CHECK-NOFP-SD-NEXT:    fmaxnm s0, s1, s0
108 ; CHECK-NOFP-SD-NEXT:    fcvt h0, s0
109 ; CHECK-NOFP-SD-NEXT:    ret
111 ; CHECK-FP-LABEL: test_v4f16:
112 ; CHECK-FP:       // %bb.0:
113 ; CHECK-FP-NEXT:    fmaxnmv h0, v0.4h
114 ; CHECK-FP-NEXT:    ret
116 ; CHECK-NOFP-GI-LABEL: test_v4f16:
117 ; CHECK-NOFP-GI:       // %bb.0:
118 ; CHECK-NOFP-GI-NEXT:    fcvtl v0.4s, v0.4h
119 ; CHECK-NOFP-GI-NEXT:    fmaxnmv s0, v0.4s
120 ; CHECK-NOFP-GI-NEXT:    fcvt h0, s0
121 ; CHECK-NOFP-GI-NEXT:    ret
122   %b = call half @llvm.vector.reduce.fmax.v4f16(<4 x half> %a)
123   ret half %b
126 define half @test_v4f16_ninf(<4 x half> %a) nounwind {
127 ; CHECK-NOFP-SD-LABEL: test_v4f16_ninf:
128 ; CHECK-NOFP-SD:       // %bb.0:
129 ; CHECK-NOFP-SD-NEXT:    // kill: def $d0 killed $d0 def $q0
130 ; CHECK-NOFP-SD-NEXT:    mov h1, v0.h[1]
131 ; CHECK-NOFP-SD-NEXT:    fcvt s2, h0
132 ; CHECK-NOFP-SD-NEXT:    fcvt s1, h1
133 ; CHECK-NOFP-SD-NEXT:    fmaxnm s1, s2, s1
134 ; CHECK-NOFP-SD-NEXT:    mov h2, v0.h[2]
135 ; CHECK-NOFP-SD-NEXT:    mov h0, v0.h[3]
136 ; CHECK-NOFP-SD-NEXT:    fcvt h1, s1
137 ; CHECK-NOFP-SD-NEXT:    fcvt s2, h2
138 ; CHECK-NOFP-SD-NEXT:    fcvt s0, h0
139 ; CHECK-NOFP-SD-NEXT:    fcvt s1, h1
140 ; CHECK-NOFP-SD-NEXT:    fmaxnm s1, s1, s2
141 ; CHECK-NOFP-SD-NEXT:    fcvt h1, s1
142 ; CHECK-NOFP-SD-NEXT:    fcvt s1, h1
143 ; CHECK-NOFP-SD-NEXT:    fmaxnm s0, s1, s0
144 ; CHECK-NOFP-SD-NEXT:    fcvt h0, s0
145 ; CHECK-NOFP-SD-NEXT:    ret
147 ; CHECK-FP-LABEL: test_v4f16_ninf:
148 ; CHECK-FP:       // %bb.0:
149 ; CHECK-FP-NEXT:    fmaxnmv h0, v0.4h
150 ; CHECK-FP-NEXT:    ret
152 ; CHECK-NOFP-GI-LABEL: test_v4f16_ninf:
153 ; CHECK-NOFP-GI:       // %bb.0:
154 ; CHECK-NOFP-GI-NEXT:    fcvtl v0.4s, v0.4h
155 ; CHECK-NOFP-GI-NEXT:    fmaxnmv s0, v0.4s
156 ; CHECK-NOFP-GI-NEXT:    fcvt h0, s0
157 ; CHECK-NOFP-GI-NEXT:    ret
158   %b = call ninf half @llvm.vector.reduce.fmax.v4f16(<4 x half> %a)
159   ret half %b
162 define half @test_v8f16(<8 x half> %a) nounwind {
163 ; CHECK-NOFP-SD-LABEL: test_v8f16:
164 ; CHECK-NOFP-SD:       // %bb.0:
165 ; CHECK-NOFP-SD-NEXT:    mov h1, v0.h[1]
166 ; CHECK-NOFP-SD-NEXT:    fcvt s2, h0
167 ; CHECK-NOFP-SD-NEXT:    fcvt s1, h1
168 ; CHECK-NOFP-SD-NEXT:    fmaxnm s1, s2, s1
169 ; CHECK-NOFP-SD-NEXT:    mov h2, v0.h[2]
170 ; CHECK-NOFP-SD-NEXT:    fcvt h1, s1
171 ; CHECK-NOFP-SD-NEXT:    fcvt s2, h2
172 ; CHECK-NOFP-SD-NEXT:    fcvt s1, h1
173 ; CHECK-NOFP-SD-NEXT:    fmaxnm s1, s1, s2
174 ; CHECK-NOFP-SD-NEXT:    mov h2, v0.h[3]
175 ; CHECK-NOFP-SD-NEXT:    fcvt h1, s1
176 ; CHECK-NOFP-SD-NEXT:    fcvt s2, h2
177 ; CHECK-NOFP-SD-NEXT:    fcvt s1, h1
178 ; CHECK-NOFP-SD-NEXT:    fmaxnm s1, s1, s2
179 ; CHECK-NOFP-SD-NEXT:    mov h2, v0.h[4]
180 ; CHECK-NOFP-SD-NEXT:    fcvt h1, s1
181 ; CHECK-NOFP-SD-NEXT:    fcvt s2, h2
182 ; CHECK-NOFP-SD-NEXT:    fcvt s1, h1
183 ; CHECK-NOFP-SD-NEXT:    fmaxnm s1, s1, s2
184 ; CHECK-NOFP-SD-NEXT:    mov h2, v0.h[5]
185 ; CHECK-NOFP-SD-NEXT:    fcvt h1, s1
186 ; CHECK-NOFP-SD-NEXT:    fcvt s2, h2
187 ; CHECK-NOFP-SD-NEXT:    fcvt s1, h1
188 ; CHECK-NOFP-SD-NEXT:    fmaxnm s1, s1, s2
189 ; CHECK-NOFP-SD-NEXT:    mov h2, v0.h[6]
190 ; CHECK-NOFP-SD-NEXT:    mov h0, v0.h[7]
191 ; CHECK-NOFP-SD-NEXT:    fcvt h1, s1
192 ; CHECK-NOFP-SD-NEXT:    fcvt s2, h2
193 ; CHECK-NOFP-SD-NEXT:    fcvt s0, h0
194 ; CHECK-NOFP-SD-NEXT:    fcvt s1, h1
195 ; CHECK-NOFP-SD-NEXT:    fmaxnm s1, s1, s2
196 ; CHECK-NOFP-SD-NEXT:    fcvt h1, s1
197 ; CHECK-NOFP-SD-NEXT:    fcvt s1, h1
198 ; CHECK-NOFP-SD-NEXT:    fmaxnm s0, s1, s0
199 ; CHECK-NOFP-SD-NEXT:    fcvt h0, s0
200 ; CHECK-NOFP-SD-NEXT:    ret
202 ; CHECK-FP-LABEL: test_v8f16:
203 ; CHECK-FP:       // %bb.0:
204 ; CHECK-FP-NEXT:    fmaxnmv h0, v0.8h
205 ; CHECK-FP-NEXT:    ret
207 ; CHECK-NOFP-GI-LABEL: test_v8f16:
208 ; CHECK-NOFP-GI:       // %bb.0:
209 ; CHECK-NOFP-GI-NEXT:    fcvtl v1.4s, v0.4h
210 ; CHECK-NOFP-GI-NEXT:    fcvtl2 v0.4s, v0.8h
211 ; CHECK-NOFP-GI-NEXT:    fmaxnm v0.4s, v1.4s, v0.4s
212 ; CHECK-NOFP-GI-NEXT:    fmaxnmv s0, v0.4s
213 ; CHECK-NOFP-GI-NEXT:    fcvt h0, s0
214 ; CHECK-NOFP-GI-NEXT:    ret
215   %b = call half @llvm.vector.reduce.fmax.v8f16(<8 x half> %a)
216   ret half %b
219 define half @test_v16f16(<16 x half> %a) nounwind {
220 ; CHECK-NOFP-SD-LABEL: test_v16f16:
221 ; CHECK-NOFP-SD:       // %bb.0:
222 ; CHECK-NOFP-SD-NEXT:    mov h2, v1.h[1]
223 ; CHECK-NOFP-SD-NEXT:    mov h3, v0.h[1]
224 ; CHECK-NOFP-SD-NEXT:    fcvt s4, h1
225 ; CHECK-NOFP-SD-NEXT:    fcvt s5, h0
226 ; CHECK-NOFP-SD-NEXT:    fcvt s2, h2
227 ; CHECK-NOFP-SD-NEXT:    fcvt s3, h3
228 ; CHECK-NOFP-SD-NEXT:    fmaxnm s4, s5, s4
229 ; CHECK-NOFP-SD-NEXT:    mov h5, v0.h[2]
230 ; CHECK-NOFP-SD-NEXT:    fmaxnm s2, s3, s2
231 ; CHECK-NOFP-SD-NEXT:    mov h3, v1.h[2]
232 ; CHECK-NOFP-SD-NEXT:    fcvt h4, s4
233 ; CHECK-NOFP-SD-NEXT:    fcvt s5, h5
234 ; CHECK-NOFP-SD-NEXT:    fcvt h2, s2
235 ; CHECK-NOFP-SD-NEXT:    fcvt s3, h3
236 ; CHECK-NOFP-SD-NEXT:    fcvt s4, h4
237 ; CHECK-NOFP-SD-NEXT:    fcvt s2, h2
238 ; CHECK-NOFP-SD-NEXT:    fmaxnm s3, s5, s3
239 ; CHECK-NOFP-SD-NEXT:    mov h5, v0.h[3]
240 ; CHECK-NOFP-SD-NEXT:    fmaxnm s2, s4, s2
241 ; CHECK-NOFP-SD-NEXT:    mov h4, v1.h[3]
242 ; CHECK-NOFP-SD-NEXT:    fcvt h3, s3
243 ; CHECK-NOFP-SD-NEXT:    fcvt s5, h5
244 ; CHECK-NOFP-SD-NEXT:    fcvt h2, s2
245 ; CHECK-NOFP-SD-NEXT:    fcvt s4, h4
246 ; CHECK-NOFP-SD-NEXT:    fcvt s3, h3
247 ; CHECK-NOFP-SD-NEXT:    fcvt s2, h2
248 ; CHECK-NOFP-SD-NEXT:    fmaxnm s4, s5, s4
249 ; CHECK-NOFP-SD-NEXT:    mov h5, v0.h[4]
250 ; CHECK-NOFP-SD-NEXT:    fmaxnm s2, s2, s3
251 ; CHECK-NOFP-SD-NEXT:    mov h3, v1.h[4]
252 ; CHECK-NOFP-SD-NEXT:    fcvt h4, s4
253 ; CHECK-NOFP-SD-NEXT:    fcvt s5, h5
254 ; CHECK-NOFP-SD-NEXT:    fcvt h2, s2
255 ; CHECK-NOFP-SD-NEXT:    fcvt s3, h3
256 ; CHECK-NOFP-SD-NEXT:    fcvt s4, h4
257 ; CHECK-NOFP-SD-NEXT:    fcvt s2, h2
258 ; CHECK-NOFP-SD-NEXT:    fmaxnm s3, s5, s3
259 ; CHECK-NOFP-SD-NEXT:    mov h5, v0.h[5]
260 ; CHECK-NOFP-SD-NEXT:    fmaxnm s2, s2, s4
261 ; CHECK-NOFP-SD-NEXT:    mov h4, v1.h[5]
262 ; CHECK-NOFP-SD-NEXT:    fcvt h3, s3
263 ; CHECK-NOFP-SD-NEXT:    fcvt s5, h5
264 ; CHECK-NOFP-SD-NEXT:    fcvt h2, s2
265 ; CHECK-NOFP-SD-NEXT:    fcvt s4, h4
266 ; CHECK-NOFP-SD-NEXT:    fcvt s3, h3
267 ; CHECK-NOFP-SD-NEXT:    fcvt s2, h2
268 ; CHECK-NOFP-SD-NEXT:    fmaxnm s4, s5, s4
269 ; CHECK-NOFP-SD-NEXT:    mov h5, v0.h[6]
270 ; CHECK-NOFP-SD-NEXT:    mov h0, v0.h[7]
271 ; CHECK-NOFP-SD-NEXT:    fmaxnm s2, s2, s3
272 ; CHECK-NOFP-SD-NEXT:    fcvt h3, s4
273 ; CHECK-NOFP-SD-NEXT:    mov h4, v1.h[6]
274 ; CHECK-NOFP-SD-NEXT:    fcvt s5, h5
275 ; CHECK-NOFP-SD-NEXT:    mov h1, v1.h[7]
276 ; CHECK-NOFP-SD-NEXT:    fcvt s0, h0
277 ; CHECK-NOFP-SD-NEXT:    fcvt h2, s2
278 ; CHECK-NOFP-SD-NEXT:    fcvt s3, h3
279 ; CHECK-NOFP-SD-NEXT:    fcvt s4, h4
280 ; CHECK-NOFP-SD-NEXT:    fcvt s1, h1
281 ; CHECK-NOFP-SD-NEXT:    fcvt s2, h2
282 ; CHECK-NOFP-SD-NEXT:    fmaxnm s0, s0, s1
283 ; CHECK-NOFP-SD-NEXT:    fmaxnm s2, s2, s3
284 ; CHECK-NOFP-SD-NEXT:    fmaxnm s3, s5, s4
285 ; CHECK-NOFP-SD-NEXT:    fcvt h0, s0
286 ; CHECK-NOFP-SD-NEXT:    fcvt h2, s2
287 ; CHECK-NOFP-SD-NEXT:    fcvt h3, s3
288 ; CHECK-NOFP-SD-NEXT:    fcvt s0, h0
289 ; CHECK-NOFP-SD-NEXT:    fcvt s2, h2
290 ; CHECK-NOFP-SD-NEXT:    fcvt s3, h3
291 ; CHECK-NOFP-SD-NEXT:    fmaxnm s2, s2, s3
292 ; CHECK-NOFP-SD-NEXT:    fcvt h1, s2
293 ; CHECK-NOFP-SD-NEXT:    fcvt s1, h1
294 ; CHECK-NOFP-SD-NEXT:    fmaxnm s0, s1, s0
295 ; CHECK-NOFP-SD-NEXT:    fcvt h0, s0
296 ; CHECK-NOFP-SD-NEXT:    ret
298 ; CHECK-FP-LABEL: test_v16f16:
299 ; CHECK-FP:       // %bb.0:
300 ; CHECK-FP-NEXT:    fmaxnm v0.8h, v0.8h, v1.8h
301 ; CHECK-FP-NEXT:    fmaxnmv h0, v0.8h
302 ; CHECK-FP-NEXT:    ret
304 ; CHECK-NOFP-GI-LABEL: test_v16f16:
305 ; CHECK-NOFP-GI:       // %bb.0:
306 ; CHECK-NOFP-GI-NEXT:    fcvtl v2.4s, v0.4h
307 ; CHECK-NOFP-GI-NEXT:    fcvtl2 v0.4s, v0.8h
308 ; CHECK-NOFP-GI-NEXT:    fcvtl v3.4s, v1.4h
309 ; CHECK-NOFP-GI-NEXT:    fcvtl2 v1.4s, v1.8h
310 ; CHECK-NOFP-GI-NEXT:    fmaxnm v0.4s, v2.4s, v0.4s
311 ; CHECK-NOFP-GI-NEXT:    fmaxnm v1.4s, v3.4s, v1.4s
312 ; CHECK-NOFP-GI-NEXT:    fmaxnm v0.4s, v0.4s, v1.4s
313 ; CHECK-NOFP-GI-NEXT:    fmaxnmv s0, v0.4s
314 ; CHECK-NOFP-GI-NEXT:    fcvt h0, s0
315 ; CHECK-NOFP-GI-NEXT:    ret
316   %b = call half @llvm.vector.reduce.fmax.v16f16(<16 x half> %a)
317   ret half %b
320 define float @test_v2f32(<2 x float> %a) nounwind {
321 ; CHECK-LABEL: test_v2f32:
322 ; CHECK:       // %bb.0:
323 ; CHECK-NEXT:    fmaxnmp s0, v0.2s
324 ; CHECK-NEXT:    ret
325   %b = call float @llvm.vector.reduce.fmax.v2f32(<2 x float> %a)
326   ret float %b
329 define float @test_v4f32(<4 x float> %a) nounwind {
330 ; CHECK-LABEL: test_v4f32:
331 ; CHECK:       // %bb.0:
332 ; CHECK-NEXT:    fmaxnmv s0, v0.4s
333 ; CHECK-NEXT:    ret
334   %b = call float @llvm.vector.reduce.fmax.v4f32(<4 x float> %a)
335   ret float %b
338 define float @test_v8f32(<8 x float> %a) nounwind {
339 ; CHECK-LABEL: test_v8f32:
340 ; CHECK:       // %bb.0:
341 ; CHECK-NEXT:    fmaxnm v0.4s, v0.4s, v1.4s
342 ; CHECK-NEXT:    fmaxnmv s0, v0.4s
343 ; CHECK-NEXT:    ret
344   %b = call float @llvm.vector.reduce.fmax.v8f32(<8 x float> %a)
345   ret float %b
348 define float @test_v16f32(<16 x float> %a) nounwind {
349 ; CHECK-NOFP-SD-LABEL: test_v16f32:
350 ; CHECK-NOFP-SD:       // %bb.0:
351 ; CHECK-NOFP-SD-NEXT:    fmaxnm v1.4s, v1.4s, v3.4s
352 ; CHECK-NOFP-SD-NEXT:    fmaxnm v0.4s, v0.4s, v2.4s
353 ; CHECK-NOFP-SD-NEXT:    fmaxnm v0.4s, v0.4s, v1.4s
354 ; CHECK-NOFP-SD-NEXT:    fmaxnmv s0, v0.4s
355 ; CHECK-NOFP-SD-NEXT:    ret
357 ; CHECK-FP-SD-LABEL: test_v16f32:
358 ; CHECK-FP-SD:       // %bb.0:
359 ; CHECK-FP-SD-NEXT:    fmaxnm v1.4s, v1.4s, v3.4s
360 ; CHECK-FP-SD-NEXT:    fmaxnm v0.4s, v0.4s, v2.4s
361 ; CHECK-FP-SD-NEXT:    fmaxnm v0.4s, v0.4s, v1.4s
362 ; CHECK-FP-SD-NEXT:    fmaxnmv s0, v0.4s
363 ; CHECK-FP-SD-NEXT:    ret
365 ; CHECK-NOFP-GI-LABEL: test_v16f32:
366 ; CHECK-NOFP-GI:       // %bb.0:
367 ; CHECK-NOFP-GI-NEXT:    fmaxnm v0.4s, v0.4s, v1.4s
368 ; CHECK-NOFP-GI-NEXT:    fmaxnm v1.4s, v2.4s, v3.4s
369 ; CHECK-NOFP-GI-NEXT:    fmaxnm v0.4s, v0.4s, v1.4s
370 ; CHECK-NOFP-GI-NEXT:    fmaxnmv s0, v0.4s
371 ; CHECK-NOFP-GI-NEXT:    ret
373 ; CHECK-FP-GI-LABEL: test_v16f32:
374 ; CHECK-FP-GI:       // %bb.0:
375 ; CHECK-FP-GI-NEXT:    fmaxnm v0.4s, v0.4s, v1.4s
376 ; CHECK-FP-GI-NEXT:    fmaxnm v1.4s, v2.4s, v3.4s
377 ; CHECK-FP-GI-NEXT:    fmaxnm v0.4s, v0.4s, v1.4s
378 ; CHECK-FP-GI-NEXT:    fmaxnmv s0, v0.4s
379 ; CHECK-FP-GI-NEXT:    ret
380   %b = call float @llvm.vector.reduce.fmax.v16f32(<16 x float> %a)
381   ret float %b
384 define double @test_v2f64(<2 x double> %a) nounwind {
385 ; CHECK-LABEL: test_v2f64:
386 ; CHECK:       // %bb.0:
387 ; CHECK-NEXT:    fmaxnmp d0, v0.2d
388 ; CHECK-NEXT:    ret
389   %b = call double @llvm.vector.reduce.fmax.v2f64(<2 x double> %a)
390   ret double %b
393 define double @test_v4f64(<4 x double> %a) nounwind {
394 ; CHECK-LABEL: test_v4f64:
395 ; CHECK:       // %bb.0:
396 ; CHECK-NEXT:    fmaxnm v0.2d, v0.2d, v1.2d
397 ; CHECK-NEXT:    fmaxnmp d0, v0.2d
398 ; CHECK-NEXT:    ret
399   %b = call double @llvm.vector.reduce.fmax.v4f64(<4 x double> %a)
400   ret double %b
403 define half @test_v11f16(<11 x half> %a) nounwind {
404 ; CHECK-NOFP-LABEL: test_v11f16:
405 ; CHECK-NOFP:       // %bb.0:
406 ; CHECK-NOFP-NEXT:    ldr h16, [sp, #8]
407 ; CHECK-NOFP-NEXT:    ldr h17, [sp]
408 ; CHECK-NOFP-NEXT:    fcvt s1, h1
409 ; CHECK-NOFP-NEXT:    fcvt s0, h0
410 ; CHECK-NOFP-NEXT:    fcvt s2, h2
411 ; CHECK-NOFP-NEXT:    fcvt s16, h16
412 ; CHECK-NOFP-NEXT:    fcvt s17, h17
413 ; CHECK-NOFP-NEXT:    fmaxnm s1, s1, s16
414 ; CHECK-NOFP-NEXT:    fmaxnm s0, s0, s17
415 ; CHECK-NOFP-NEXT:    ldr h16, [sp, #16]
416 ; CHECK-NOFP-NEXT:    fcvt s16, h16
417 ; CHECK-NOFP-NEXT:    fcvt h1, s1
418 ; CHECK-NOFP-NEXT:    fcvt h0, s0
419 ; CHECK-NOFP-NEXT:    fcvt s1, h1
420 ; CHECK-NOFP-NEXT:    fcvt s0, h0
421 ; CHECK-NOFP-NEXT:    fmaxnm s0, s0, s1
422 ; CHECK-NOFP-NEXT:    fmaxnm s1, s2, s16
423 ; CHECK-NOFP-NEXT:    fcvt h0, s0
424 ; CHECK-NOFP-NEXT:    fcvt h1, s1
425 ; CHECK-NOFP-NEXT:    fcvt s0, h0
426 ; CHECK-NOFP-NEXT:    fcvt s1, h1
427 ; CHECK-NOFP-NEXT:    fmaxnm s0, s0, s1
428 ; CHECK-NOFP-NEXT:    fcvt s1, h3
429 ; CHECK-NOFP-NEXT:    fcvt h0, s0
430 ; CHECK-NOFP-NEXT:    fcvt s0, h0
431 ; CHECK-NOFP-NEXT:    fmaxnm s0, s0, s1
432 ; CHECK-NOFP-NEXT:    fcvt s1, h4
433 ; CHECK-NOFP-NEXT:    fcvt h0, s0
434 ; CHECK-NOFP-NEXT:    fcvt s0, h0
435 ; CHECK-NOFP-NEXT:    fmaxnm s0, s0, s1
436 ; CHECK-NOFP-NEXT:    fcvt s1, h5
437 ; CHECK-NOFP-NEXT:    fcvt h0, s0
438 ; CHECK-NOFP-NEXT:    fcvt s0, h0
439 ; CHECK-NOFP-NEXT:    fmaxnm s0, s0, s1
440 ; CHECK-NOFP-NEXT:    fcvt s1, h6
441 ; CHECK-NOFP-NEXT:    fcvt h0, s0
442 ; CHECK-NOFP-NEXT:    fcvt s0, h0
443 ; CHECK-NOFP-NEXT:    fmaxnm s0, s0, s1
444 ; CHECK-NOFP-NEXT:    fcvt s1, h7
445 ; CHECK-NOFP-NEXT:    fcvt h0, s0
446 ; CHECK-NOFP-NEXT:    fcvt s0, h0
447 ; CHECK-NOFP-NEXT:    fmaxnm s0, s0, s1
448 ; CHECK-NOFP-NEXT:    fcvt h0, s0
449 ; CHECK-NOFP-NEXT:    ret
451 ; CHECK-FP-LABEL: test_v11f16:
452 ; CHECK-FP:       // %bb.0:
453 ; CHECK-FP-NEXT:    // kill: def $h0 killed $h0 def $q0
454 ; CHECK-FP-NEXT:    // kill: def $h1 killed $h1 def $q1
455 ; CHECK-FP-NEXT:    // kill: def $h2 killed $h2 def $q2
456 ; CHECK-FP-NEXT:    // kill: def $h3 killed $h3 def $q3
457 ; CHECK-FP-NEXT:    // kill: def $h4 killed $h4 def $q4
458 ; CHECK-FP-NEXT:    // kill: def $h5 killed $h5 def $q5
459 ; CHECK-FP-NEXT:    mov x8, sp
460 ; CHECK-FP-NEXT:    // kill: def $h6 killed $h6 def $q6
461 ; CHECK-FP-NEXT:    // kill: def $h7 killed $h7 def $q7
462 ; CHECK-FP-NEXT:    mov v0.h[1], v1.h[0]
463 ; CHECK-FP-NEXT:    movi v1.8h, #254, lsl #8
464 ; CHECK-FP-NEXT:    mov v0.h[2], v2.h[0]
465 ; CHECK-FP-NEXT:    ld1 { v1.h }[0], [x8]
466 ; CHECK-FP-NEXT:    add x8, sp, #8
467 ; CHECK-FP-NEXT:    ld1 { v1.h }[1], [x8]
468 ; CHECK-FP-NEXT:    add x8, sp, #16
469 ; CHECK-FP-NEXT:    mov v0.h[3], v3.h[0]
470 ; CHECK-FP-NEXT:    ld1 { v1.h }[2], [x8]
471 ; CHECK-FP-NEXT:    mov v0.h[4], v4.h[0]
472 ; CHECK-FP-NEXT:    mov v0.h[5], v5.h[0]
473 ; CHECK-FP-NEXT:    mov v0.h[6], v6.h[0]
474 ; CHECK-FP-NEXT:    mov v0.h[7], v7.h[0]
475 ; CHECK-FP-NEXT:    fmaxnm v0.8h, v0.8h, v1.8h
476 ; CHECK-FP-NEXT:    fmaxnmv h0, v0.8h
477 ; CHECK-FP-NEXT:    ret
478   %b = call half @llvm.vector.reduce.fmax.v11f16(<11 x half> %a)
479   ret half %b
482 define half @test_v11f16_ninf(<11 x half> %a) nounwind {
483 ; CHECK-NOFP-LABEL: test_v11f16_ninf:
484 ; CHECK-NOFP:       // %bb.0:
485 ; CHECK-NOFP-NEXT:    ldr h16, [sp, #8]
486 ; CHECK-NOFP-NEXT:    ldr h17, [sp]
487 ; CHECK-NOFP-NEXT:    fcvt s1, h1
488 ; CHECK-NOFP-NEXT:    fcvt s0, h0
489 ; CHECK-NOFP-NEXT:    fcvt s2, h2
490 ; CHECK-NOFP-NEXT:    fcvt s16, h16
491 ; CHECK-NOFP-NEXT:    fcvt s17, h17
492 ; CHECK-NOFP-NEXT:    fmaxnm s1, s1, s16
493 ; CHECK-NOFP-NEXT:    fmaxnm s0, s0, s17
494 ; CHECK-NOFP-NEXT:    ldr h16, [sp, #16]
495 ; CHECK-NOFP-NEXT:    fcvt s16, h16
496 ; CHECK-NOFP-NEXT:    fcvt h1, s1
497 ; CHECK-NOFP-NEXT:    fcvt h0, s0
498 ; CHECK-NOFP-NEXT:    fcvt s1, h1
499 ; CHECK-NOFP-NEXT:    fcvt s0, h0
500 ; CHECK-NOFP-NEXT:    fmaxnm s0, s0, s1
501 ; CHECK-NOFP-NEXT:    fmaxnm s1, s2, s16
502 ; CHECK-NOFP-NEXT:    fcvt h0, s0
503 ; CHECK-NOFP-NEXT:    fcvt h1, s1
504 ; CHECK-NOFP-NEXT:    fcvt s0, h0
505 ; CHECK-NOFP-NEXT:    fcvt s1, h1
506 ; CHECK-NOFP-NEXT:    fmaxnm s0, s0, s1
507 ; CHECK-NOFP-NEXT:    fcvt s1, h3
508 ; CHECK-NOFP-NEXT:    fcvt h0, s0
509 ; CHECK-NOFP-NEXT:    fcvt s0, h0
510 ; CHECK-NOFP-NEXT:    fmaxnm s0, s0, s1
511 ; CHECK-NOFP-NEXT:    fcvt s1, h4
512 ; CHECK-NOFP-NEXT:    fcvt h0, s0
513 ; CHECK-NOFP-NEXT:    fcvt s0, h0
514 ; CHECK-NOFP-NEXT:    fmaxnm s0, s0, s1
515 ; CHECK-NOFP-NEXT:    fcvt s1, h5
516 ; CHECK-NOFP-NEXT:    fcvt h0, s0
517 ; CHECK-NOFP-NEXT:    fcvt s0, h0
518 ; CHECK-NOFP-NEXT:    fmaxnm s0, s0, s1
519 ; CHECK-NOFP-NEXT:    fcvt s1, h6
520 ; CHECK-NOFP-NEXT:    fcvt h0, s0
521 ; CHECK-NOFP-NEXT:    fcvt s0, h0
522 ; CHECK-NOFP-NEXT:    fmaxnm s0, s0, s1
523 ; CHECK-NOFP-NEXT:    fcvt s1, h7
524 ; CHECK-NOFP-NEXT:    fcvt h0, s0
525 ; CHECK-NOFP-NEXT:    fcvt s0, h0
526 ; CHECK-NOFP-NEXT:    fmaxnm s0, s0, s1
527 ; CHECK-NOFP-NEXT:    fcvt h0, s0
528 ; CHECK-NOFP-NEXT:    ret
530 ; CHECK-FP-LABEL: test_v11f16_ninf:
531 ; CHECK-FP:       // %bb.0:
532 ; CHECK-FP-NEXT:    // kill: def $h0 killed $h0 def $q0
533 ; CHECK-FP-NEXT:    // kill: def $h1 killed $h1 def $q1
534 ; CHECK-FP-NEXT:    // kill: def $h2 killed $h2 def $q2
535 ; CHECK-FP-NEXT:    // kill: def $h3 killed $h3 def $q3
536 ; CHECK-FP-NEXT:    // kill: def $h4 killed $h4 def $q4
537 ; CHECK-FP-NEXT:    // kill: def $h5 killed $h5 def $q5
538 ; CHECK-FP-NEXT:    mov x8, sp
539 ; CHECK-FP-NEXT:    // kill: def $h6 killed $h6 def $q6
540 ; CHECK-FP-NEXT:    // kill: def $h7 killed $h7 def $q7
541 ; CHECK-FP-NEXT:    mov v0.h[1], v1.h[0]
542 ; CHECK-FP-NEXT:    movi v1.8h, #254, lsl #8
543 ; CHECK-FP-NEXT:    mov v0.h[2], v2.h[0]
544 ; CHECK-FP-NEXT:    ld1 { v1.h }[0], [x8]
545 ; CHECK-FP-NEXT:    add x8, sp, #8
546 ; CHECK-FP-NEXT:    ld1 { v1.h }[1], [x8]
547 ; CHECK-FP-NEXT:    add x8, sp, #16
548 ; CHECK-FP-NEXT:    mov v0.h[3], v3.h[0]
549 ; CHECK-FP-NEXT:    ld1 { v1.h }[2], [x8]
550 ; CHECK-FP-NEXT:    mov v0.h[4], v4.h[0]
551 ; CHECK-FP-NEXT:    mov v0.h[5], v5.h[0]
552 ; CHECK-FP-NEXT:    mov v0.h[6], v6.h[0]
553 ; CHECK-FP-NEXT:    mov v0.h[7], v7.h[0]
554 ; CHECK-FP-NEXT:    fmaxnm v0.8h, v0.8h, v1.8h
555 ; CHECK-FP-NEXT:    fmaxnmv h0, v0.8h
556 ; CHECK-FP-NEXT:    ret
557   %b = call ninf half @llvm.vector.reduce.fmax.v11f16(<11 x half> %a)
558   ret half %b
561 define float @test_v3f32(<3 x float> %a) nounwind {
562 ; CHECK-LABEL: test_v3f32:
563 ; CHECK:       // %bb.0:
564 ; CHECK-NEXT:    mov w8, #-4194304 // =0xffc00000
565 ; CHECK-NEXT:    fmov s1, w8
566 ; CHECK-NEXT:    mov v0.s[3], v1.s[0]
567 ; CHECK-NEXT:    fmaxnmv s0, v0.4s
568 ; CHECK-NEXT:    ret
569   %b = call float @llvm.vector.reduce.fmax.v3f32(<3 x float> %a)
570   ret float %b
573 define float @test_v3f32_ninf(<3 x float> %a) nounwind {
574 ; CHECK-LABEL: test_v3f32_ninf:
575 ; CHECK:       // %bb.0:
576 ; CHECK-NEXT:    mov w8, #-4194304 // =0xffc00000
577 ; CHECK-NEXT:    fmov s1, w8
578 ; CHECK-NEXT:    mov v0.s[3], v1.s[0]
579 ; CHECK-NEXT:    fmaxnmv s0, v0.4s
580 ; CHECK-NEXT:    ret
581   %b = call ninf float @llvm.vector.reduce.fmax.v3f32(<3 x float> %a)
582   ret float %b
585 define fp128 @test_v2f128(<2 x fp128> %a) nounwind {
586 ; CHECK-LABEL: test_v2f128:
587 ; CHECK:       // %bb.0:
588 ; CHECK-NEXT:    b fmaxl
589   %b = call fp128 @llvm.vector.reduce.fmax.v2f128(<2 x fp128> %a)
590   ret fp128 %b