Run DCE after a LoopFlatten test to reduce spurious output [nfc]
[llvm-project.git] / llvm / test / CodeGen / RISCV / rvv / fixed-vectors-vfwsub.ll
blobd22781d6a97ac21a186563c9b55b069ed6646d49
1 ; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
2 ; RUN: llc -mtriple=riscv32 -mattr=+v,+zfh,+zvfh,+f,+d -target-abi=ilp32d \
3 ; RUN:   -verify-machineinstrs < %s | FileCheck %s
4 ; RUN: llc -mtriple=riscv64 -mattr=+v,+zfh,+zvfh,+f,+d -target-abi=lp64d \
5 ; RUN:   -verify-machineinstrs < %s | FileCheck %s
7 define <2 x float> @vfwsub_v2f16(ptr %x, ptr %y) {
8 ; CHECK-LABEL: vfwsub_v2f16:
9 ; CHECK:       # %bb.0:
10 ; CHECK-NEXT:    vsetivli zero, 2, e16, mf4, ta, ma
11 ; CHECK-NEXT:    vle16.v v9, (a0)
12 ; CHECK-NEXT:    vle16.v v10, (a1)
13 ; CHECK-NEXT:    vfwsub.vv v8, v9, v10
14 ; CHECK-NEXT:    ret
15   %a = load <2 x half>, ptr %x
16   %b = load <2 x half>, ptr %y
17   %c = fpext <2 x half> %a to <2 x float>
18   %d = fpext <2 x half> %b to <2 x float>
19   %e = fsub <2 x float> %c, %d
20   ret <2 x float> %e
23 define <4 x float> @vfwsub_v4f16(ptr %x, ptr %y) {
24 ; CHECK-LABEL: vfwsub_v4f16:
25 ; CHECK:       # %bb.0:
26 ; CHECK-NEXT:    vsetivli zero, 4, e16, mf2, ta, ma
27 ; CHECK-NEXT:    vle16.v v9, (a0)
28 ; CHECK-NEXT:    vle16.v v10, (a1)
29 ; CHECK-NEXT:    vfwsub.vv v8, v9, v10
30 ; CHECK-NEXT:    ret
31   %a = load <4 x half>, ptr %x
32   %b = load <4 x half>, ptr %y
33   %c = fpext <4 x half> %a to <4 x float>
34   %d = fpext <4 x half> %b to <4 x float>
35   %e = fsub <4 x float> %c, %d
36   ret <4 x float> %e
39 define <8 x float> @vfwsub_v8f16(ptr %x, ptr %y) {
40 ; CHECK-LABEL: vfwsub_v8f16:
41 ; CHECK:       # %bb.0:
42 ; CHECK-NEXT:    vsetivli zero, 8, e16, m1, ta, ma
43 ; CHECK-NEXT:    vle16.v v10, (a0)
44 ; CHECK-NEXT:    vle16.v v11, (a1)
45 ; CHECK-NEXT:    vfwsub.vv v8, v10, v11
46 ; CHECK-NEXT:    ret
47   %a = load <8 x half>, ptr %x
48   %b = load <8 x half>, ptr %y
49   %c = fpext <8 x half> %a to <8 x float>
50   %d = fpext <8 x half> %b to <8 x float>
51   %e = fsub <8 x float> %c, %d
52   ret <8 x float> %e
55 define <16 x float> @vfwsub_v16f16(ptr %x, ptr %y) {
56 ; CHECK-LABEL: vfwsub_v16f16:
57 ; CHECK:       # %bb.0:
58 ; CHECK-NEXT:    vsetivli zero, 16, e16, m2, ta, ma
59 ; CHECK-NEXT:    vle16.v v12, (a0)
60 ; CHECK-NEXT:    vle16.v v14, (a1)
61 ; CHECK-NEXT:    vfwsub.vv v8, v12, v14
62 ; CHECK-NEXT:    ret
63   %a = load <16 x half>, ptr %x
64   %b = load <16 x half>, ptr %y
65   %c = fpext <16 x half> %a to <16 x float>
66   %d = fpext <16 x half> %b to <16 x float>
67   %e = fsub <16 x float> %c, %d
68   ret <16 x float> %e
71 define <32 x float> @vfwsub_v32f16(ptr %x, ptr %y) {
72 ; CHECK-LABEL: vfwsub_v32f16:
73 ; CHECK:       # %bb.0:
74 ; CHECK-NEXT:    li a2, 32
75 ; CHECK-NEXT:    vsetvli zero, a2, e16, m4, ta, ma
76 ; CHECK-NEXT:    vle16.v v16, (a0)
77 ; CHECK-NEXT:    vle16.v v20, (a1)
78 ; CHECK-NEXT:    vfwsub.vv v8, v16, v20
79 ; CHECK-NEXT:    ret
80   %a = load <32 x half>, ptr %x
81   %b = load <32 x half>, ptr %y
82   %c = fpext <32 x half> %a to <32 x float>
83   %d = fpext <32 x half> %b to <32 x float>
84   %e = fsub <32 x float> %c, %d
85   ret <32 x float> %e
88 define <64 x float> @vfwsub_v64f16(ptr %x, ptr %y) {
89 ; CHECK-LABEL: vfwsub_v64f16:
90 ; CHECK:       # %bb.0:
91 ; CHECK-NEXT:    addi sp, sp, -16
92 ; CHECK-NEXT:    .cfi_def_cfa_offset 16
93 ; CHECK-NEXT:    csrr a2, vlenb
94 ; CHECK-NEXT:    slli a2, a2, 4
95 ; CHECK-NEXT:    sub sp, sp, a2
96 ; CHECK-NEXT:    .cfi_escape 0x0f, 0x0d, 0x72, 0x00, 0x11, 0x10, 0x22, 0x11, 0x10, 0x92, 0xa2, 0x38, 0x00, 0x1e, 0x22 # sp + 16 + 16 * vlenb
97 ; CHECK-NEXT:    li a2, 64
98 ; CHECK-NEXT:    vsetvli zero, a2, e16, m8, ta, ma
99 ; CHECK-NEXT:    vle16.v v8, (a0)
100 ; CHECK-NEXT:    addi a0, sp, 16
101 ; CHECK-NEXT:    vs8r.v v8, (a0) # Unknown-size Folded Spill
102 ; CHECK-NEXT:    vle16.v v0, (a1)
103 ; CHECK-NEXT:    li a0, 32
104 ; CHECK-NEXT:    vsetvli zero, a0, e16, m8, ta, ma
105 ; CHECK-NEXT:    vslidedown.vx v16, v8, a0
106 ; CHECK-NEXT:    vslidedown.vx v8, v0, a0
107 ; CHECK-NEXT:    vsetvli zero, a0, e16, m4, ta, ma
108 ; CHECK-NEXT:    vmv4r.v v24, v8
109 ; CHECK-NEXT:    vfwsub.vv v8, v16, v24
110 ; CHECK-NEXT:    csrr a0, vlenb
111 ; CHECK-NEXT:    slli a0, a0, 3
112 ; CHECK-NEXT:    add a0, sp, a0
113 ; CHECK-NEXT:    addi a0, a0, 16
114 ; CHECK-NEXT:    vs8r.v v8, (a0) # Unknown-size Folded Spill
115 ; CHECK-NEXT:    addi a0, sp, 16
116 ; CHECK-NEXT:    vl8r.v v16, (a0) # Unknown-size Folded Reload
117 ; CHECK-NEXT:    vfwsub.vv v8, v16, v0
118 ; CHECK-NEXT:    csrr a0, vlenb
119 ; CHECK-NEXT:    slli a0, a0, 3
120 ; CHECK-NEXT:    add a0, sp, a0
121 ; CHECK-NEXT:    addi a0, a0, 16
122 ; CHECK-NEXT:    vl8r.v v16, (a0) # Unknown-size Folded Reload
123 ; CHECK-NEXT:    csrr a0, vlenb
124 ; CHECK-NEXT:    slli a0, a0, 4
125 ; CHECK-NEXT:    add sp, sp, a0
126 ; CHECK-NEXT:    addi sp, sp, 16
127 ; CHECK-NEXT:    ret
128   %a = load <64 x half>, ptr %x
129   %b = load <64 x half>, ptr %y
130   %c = fpext <64 x half> %a to <64 x float>
131   %d = fpext <64 x half> %b to <64 x float>
132   %e = fsub <64 x float> %c, %d
133   ret <64 x float> %e
136 define <2 x double> @vfwsub_v2f32(ptr %x, ptr %y) {
137 ; CHECK-LABEL: vfwsub_v2f32:
138 ; CHECK:       # %bb.0:
139 ; CHECK-NEXT:    vsetivli zero, 2, e32, mf2, ta, ma
140 ; CHECK-NEXT:    vle32.v v9, (a0)
141 ; CHECK-NEXT:    vle32.v v10, (a1)
142 ; CHECK-NEXT:    vfwsub.vv v8, v9, v10
143 ; CHECK-NEXT:    ret
144   %a = load <2 x float>, ptr %x
145   %b = load <2 x float>, ptr %y
146   %c = fpext <2 x float> %a to <2 x double>
147   %d = fpext <2 x float> %b to <2 x double>
148   %e = fsub <2 x double> %c, %d
149   ret <2 x double> %e
152 define <4 x double> @vfwsub_v4f32(ptr %x, ptr %y) {
153 ; CHECK-LABEL: vfwsub_v4f32:
154 ; CHECK:       # %bb.0:
155 ; CHECK-NEXT:    vsetivli zero, 4, e32, m1, ta, ma
156 ; CHECK-NEXT:    vle32.v v10, (a0)
157 ; CHECK-NEXT:    vle32.v v11, (a1)
158 ; CHECK-NEXT:    vfwsub.vv v8, v10, v11
159 ; CHECK-NEXT:    ret
160   %a = load <4 x float>, ptr %x
161   %b = load <4 x float>, ptr %y
162   %c = fpext <4 x float> %a to <4 x double>
163   %d = fpext <4 x float> %b to <4 x double>
164   %e = fsub <4 x double> %c, %d
165   ret <4 x double> %e
168 define <8 x double> @vfwsub_v8f32(ptr %x, ptr %y) {
169 ; CHECK-LABEL: vfwsub_v8f32:
170 ; CHECK:       # %bb.0:
171 ; CHECK-NEXT:    vsetivli zero, 8, e32, m2, ta, ma
172 ; CHECK-NEXT:    vle32.v v12, (a0)
173 ; CHECK-NEXT:    vle32.v v14, (a1)
174 ; CHECK-NEXT:    vfwsub.vv v8, v12, v14
175 ; CHECK-NEXT:    ret
176   %a = load <8 x float>, ptr %x
177   %b = load <8 x float>, ptr %y
178   %c = fpext <8 x float> %a to <8 x double>
179   %d = fpext <8 x float> %b to <8 x double>
180   %e = fsub <8 x double> %c, %d
181   ret <8 x double> %e
184 define <16 x double> @vfwsub_v16f32(ptr %x, ptr %y) {
185 ; CHECK-LABEL: vfwsub_v16f32:
186 ; CHECK:       # %bb.0:
187 ; CHECK-NEXT:    vsetivli zero, 16, e32, m4, ta, ma
188 ; CHECK-NEXT:    vle32.v v16, (a0)
189 ; CHECK-NEXT:    vle32.v v20, (a1)
190 ; CHECK-NEXT:    vfwsub.vv v8, v16, v20
191 ; CHECK-NEXT:    ret
192   %a = load <16 x float>, ptr %x
193   %b = load <16 x float>, ptr %y
194   %c = fpext <16 x float> %a to <16 x double>
195   %d = fpext <16 x float> %b to <16 x double>
196   %e = fsub <16 x double> %c, %d
197   ret <16 x double> %e
200 define <32 x double> @vfwsub_v32f32(ptr %x, ptr %y) {
201 ; CHECK-LABEL: vfwsub_v32f32:
202 ; CHECK:       # %bb.0:
203 ; CHECK-NEXT:    addi sp, sp, -16
204 ; CHECK-NEXT:    .cfi_def_cfa_offset 16
205 ; CHECK-NEXT:    csrr a2, vlenb
206 ; CHECK-NEXT:    slli a2, a2, 4
207 ; CHECK-NEXT:    sub sp, sp, a2
208 ; CHECK-NEXT:    .cfi_escape 0x0f, 0x0d, 0x72, 0x00, 0x11, 0x10, 0x22, 0x11, 0x10, 0x92, 0xa2, 0x38, 0x00, 0x1e, 0x22 # sp + 16 + 16 * vlenb
209 ; CHECK-NEXT:    li a2, 32
210 ; CHECK-NEXT:    vsetvli zero, a2, e32, m8, ta, ma
211 ; CHECK-NEXT:    vle32.v v8, (a0)
212 ; CHECK-NEXT:    addi a0, sp, 16
213 ; CHECK-NEXT:    vs8r.v v8, (a0) # Unknown-size Folded Spill
214 ; CHECK-NEXT:    vle32.v v0, (a1)
215 ; CHECK-NEXT:    vsetivli zero, 16, e32, m8, ta, ma
216 ; CHECK-NEXT:    vslidedown.vi v16, v8, 16
217 ; CHECK-NEXT:    vslidedown.vi v8, v0, 16
218 ; CHECK-NEXT:    vsetivli zero, 16, e32, m4, ta, ma
219 ; CHECK-NEXT:    vmv4r.v v24, v8
220 ; CHECK-NEXT:    vfwsub.vv v8, v16, v24
221 ; CHECK-NEXT:    csrr a0, vlenb
222 ; CHECK-NEXT:    slli a0, a0, 3
223 ; CHECK-NEXT:    add a0, sp, a0
224 ; CHECK-NEXT:    addi a0, a0, 16
225 ; CHECK-NEXT:    vs8r.v v8, (a0) # Unknown-size Folded Spill
226 ; CHECK-NEXT:    addi a0, sp, 16
227 ; CHECK-NEXT:    vl8r.v v16, (a0) # Unknown-size Folded Reload
228 ; CHECK-NEXT:    vfwsub.vv v8, v16, v0
229 ; CHECK-NEXT:    csrr a0, vlenb
230 ; CHECK-NEXT:    slli a0, a0, 3
231 ; CHECK-NEXT:    add a0, sp, a0
232 ; CHECK-NEXT:    addi a0, a0, 16
233 ; CHECK-NEXT:    vl8r.v v16, (a0) # Unknown-size Folded Reload
234 ; CHECK-NEXT:    csrr a0, vlenb
235 ; CHECK-NEXT:    slli a0, a0, 4
236 ; CHECK-NEXT:    add sp, sp, a0
237 ; CHECK-NEXT:    addi sp, sp, 16
238 ; CHECK-NEXT:    ret
239   %a = load <32 x float>, ptr %x
240   %b = load <32 x float>, ptr %y
241   %c = fpext <32 x float> %a to <32 x double>
242   %d = fpext <32 x float> %b to <32 x double>
243   %e = fsub <32 x double> %c, %d
244   ret <32 x double> %e
247 define <2 x float> @vfwsub_vf_v2f16(ptr %x, half %y) {
248 ; CHECK-LABEL: vfwsub_vf_v2f16:
249 ; CHECK:       # %bb.0:
250 ; CHECK-NEXT:    vsetivli zero, 2, e16, mf4, ta, ma
251 ; CHECK-NEXT:    vle16.v v9, (a0)
252 ; CHECK-NEXT:    vfwsub.vf v8, v9, fa0
253 ; CHECK-NEXT:    ret
254   %a = load <2 x half>, ptr %x
255   %b = insertelement <2 x half> poison, half %y, i32 0
256   %c = shufflevector <2 x half> %b, <2 x half> poison, <2 x i32> zeroinitializer
257   %d = fpext <2 x half> %a to <2 x float>
258   %e = fpext <2 x half> %c to <2 x float>
259   %f = fsub <2 x float> %d, %e
260   ret <2 x float> %f
263 define <4 x float> @vfwsub_vf_v4f16(ptr %x, half %y) {
264 ; CHECK-LABEL: vfwsub_vf_v4f16:
265 ; CHECK:       # %bb.0:
266 ; CHECK-NEXT:    vsetivli zero, 4, e16, mf2, ta, ma
267 ; CHECK-NEXT:    vle16.v v9, (a0)
268 ; CHECK-NEXT:    vfwsub.vf v8, v9, fa0
269 ; CHECK-NEXT:    ret
270   %a = load <4 x half>, ptr %x
271   %b = insertelement <4 x half> poison, half %y, i32 0
272   %c = shufflevector <4 x half> %b, <4 x half> poison, <4 x i32> zeroinitializer
273   %d = fpext <4 x half> %a to <4 x float>
274   %e = fpext <4 x half> %c to <4 x float>
275   %f = fsub <4 x float> %d, %e
276   ret <4 x float> %f
279 define <8 x float> @vfwsub_vf_v8f16(ptr %x, half %y) {
280 ; CHECK-LABEL: vfwsub_vf_v8f16:
281 ; CHECK:       # %bb.0:
282 ; CHECK-NEXT:    vsetivli zero, 8, e16, m1, ta, ma
283 ; CHECK-NEXT:    vle16.v v10, (a0)
284 ; CHECK-NEXT:    vfwsub.vf v8, v10, fa0
285 ; CHECK-NEXT:    ret
286   %a = load <8 x half>, ptr %x
287   %b = insertelement <8 x half> poison, half %y, i32 0
288   %c = shufflevector <8 x half> %b, <8 x half> poison, <8 x i32> zeroinitializer
289   %d = fpext <8 x half> %a to <8 x float>
290   %e = fpext <8 x half> %c to <8 x float>
291   %f = fsub <8 x float> %d, %e
292   ret <8 x float> %f
295 define <16 x float> @vfwsub_vf_v16f16(ptr %x, half %y) {
296 ; CHECK-LABEL: vfwsub_vf_v16f16:
297 ; CHECK:       # %bb.0:
298 ; CHECK-NEXT:    vsetivli zero, 16, e16, m2, ta, ma
299 ; CHECK-NEXT:    vle16.v v12, (a0)
300 ; CHECK-NEXT:    vfwsub.vf v8, v12, fa0
301 ; CHECK-NEXT:    ret
302   %a = load <16 x half>, ptr %x
303   %b = insertelement <16 x half> poison, half %y, i32 0
304   %c = shufflevector <16 x half> %b, <16 x half> poison, <16 x i32> zeroinitializer
305   %d = fpext <16 x half> %a to <16 x float>
306   %e = fpext <16 x half> %c to <16 x float>
307   %f = fsub <16 x float> %d, %e
308   ret <16 x float> %f
311 define <32 x float> @vfwsub_vf_v32f16(ptr %x, half %y) {
312 ; CHECK-LABEL: vfwsub_vf_v32f16:
313 ; CHECK:       # %bb.0:
314 ; CHECK-NEXT:    li a1, 32
315 ; CHECK-NEXT:    vsetvli zero, a1, e16, m4, ta, ma
316 ; CHECK-NEXT:    vle16.v v16, (a0)
317 ; CHECK-NEXT:    vfwsub.vf v8, v16, fa0
318 ; CHECK-NEXT:    ret
319   %a = load <32 x half>, ptr %x
320   %b = insertelement <32 x half> poison, half %y, i32 0
321   %c = shufflevector <32 x half> %b, <32 x half> poison, <32 x i32> zeroinitializer
322   %d = fpext <32 x half> %a to <32 x float>
323   %e = fpext <32 x half> %c to <32 x float>
324   %f = fsub <32 x float> %d, %e
325   ret <32 x float> %f
328 define <2 x double> @vfwsub_vf_v2f32(ptr %x, float %y) {
329 ; CHECK-LABEL: vfwsub_vf_v2f32:
330 ; CHECK:       # %bb.0:
331 ; CHECK-NEXT:    vsetivli zero, 2, e32, mf2, ta, ma
332 ; CHECK-NEXT:    vle32.v v9, (a0)
333 ; CHECK-NEXT:    vfwsub.vf v8, v9, fa0
334 ; CHECK-NEXT:    ret
335   %a = load <2 x float>, ptr %x
336   %b = insertelement <2 x float> poison, float %y, i32 0
337   %c = shufflevector <2 x float> %b, <2 x float> poison, <2 x i32> zeroinitializer
338   %d = fpext <2 x float> %a to <2 x double>
339   %e = fpext <2 x float> %c to <2 x double>
340   %f = fsub <2 x double> %d, %e
341   ret <2 x double> %f
344 define <4 x double> @vfwsub_vf_v4f32(ptr %x, float %y) {
345 ; CHECK-LABEL: vfwsub_vf_v4f32:
346 ; CHECK:       # %bb.0:
347 ; CHECK-NEXT:    vsetivli zero, 4, e32, m1, ta, ma
348 ; CHECK-NEXT:    vle32.v v10, (a0)
349 ; CHECK-NEXT:    vfwsub.vf v8, v10, fa0
350 ; CHECK-NEXT:    ret
351   %a = load <4 x float>, ptr %x
352   %b = insertelement <4 x float> poison, float %y, i32 0
353   %c = shufflevector <4 x float> %b, <4 x float> poison, <4 x i32> zeroinitializer
354   %d = fpext <4 x float> %a to <4 x double>
355   %e = fpext <4 x float> %c to <4 x double>
356   %f = fsub <4 x double> %d, %e
357   ret <4 x double> %f
360 define <8 x double> @vfwsub_vf_v8f32(ptr %x, float %y) {
361 ; CHECK-LABEL: vfwsub_vf_v8f32:
362 ; CHECK:       # %bb.0:
363 ; CHECK-NEXT:    vsetivli zero, 8, e32, m2, ta, ma
364 ; CHECK-NEXT:    vle32.v v12, (a0)
365 ; CHECK-NEXT:    vfwsub.vf v8, v12, fa0
366 ; CHECK-NEXT:    ret
367   %a = load <8 x float>, ptr %x
368   %b = insertelement <8 x float> poison, float %y, i32 0
369   %c = shufflevector <8 x float> %b, <8 x float> poison, <8 x i32> zeroinitializer
370   %d = fpext <8 x float> %a to <8 x double>
371   %e = fpext <8 x float> %c to <8 x double>
372   %f = fsub <8 x double> %d, %e
373   ret <8 x double> %f
376 define <16 x double> @vfwsub_vf_v16f32(ptr %x, float %y) {
377 ; CHECK-LABEL: vfwsub_vf_v16f32:
378 ; CHECK:       # %bb.0:
379 ; CHECK-NEXT:    vsetivli zero, 16, e32, m4, ta, ma
380 ; CHECK-NEXT:    vle32.v v16, (a0)
381 ; CHECK-NEXT:    vfwsub.vf v8, v16, fa0
382 ; CHECK-NEXT:    ret
383   %a = load <16 x float>, ptr %x
384   %b = insertelement <16 x float> poison, float %y, i32 0
385   %c = shufflevector <16 x float> %b, <16 x float> poison, <16 x i32> zeroinitializer
386   %d = fpext <16 x float> %a to <16 x double>
387   %e = fpext <16 x float> %c to <16 x double>
388   %f = fsub <16 x double> %d, %e
389   ret <16 x double> %f
392 define <32 x double> @vfwsub_vf_v32f32(ptr %x, float %y) {
393 ; CHECK-LABEL: vfwsub_vf_v32f32:
394 ; CHECK:       # %bb.0:
395 ; CHECK-NEXT:    li a1, 32
396 ; CHECK-NEXT:    vsetvli zero, a1, e32, m8, ta, ma
397 ; CHECK-NEXT:    vle32.v v16, (a0)
398 ; CHECK-NEXT:    vsetivli zero, 16, e32, m4, ta, ma
399 ; CHECK-NEXT:    vfwcvt.f.f.v v8, v16
400 ; CHECK-NEXT:    vsetivli zero, 16, e32, m8, ta, ma
401 ; CHECK-NEXT:    vslidedown.vi v16, v16, 16
402 ; CHECK-NEXT:    vsetivli zero, 16, e32, m4, ta, ma
403 ; CHECK-NEXT:    vfwcvt.f.f.v v24, v16
404 ; CHECK-NEXT:    vfmv.v.f v16, fa0
405 ; CHECK-NEXT:    vfwcvt.f.f.v v0, v16
406 ; CHECK-NEXT:    vsetvli zero, zero, e64, m8, ta, ma
407 ; CHECK-NEXT:    vfsub.vv v16, v24, v0
408 ; CHECK-NEXT:    vfsub.vv v8, v8, v0
409 ; CHECK-NEXT:    ret
410   %a = load <32 x float>, ptr %x
411   %b = insertelement <32 x float> poison, float %y, i32 0
412   %c = shufflevector <32 x float> %b, <32 x float> poison, <32 x i32> zeroinitializer
413   %d = fpext <32 x float> %a to <32 x double>
414   %e = fpext <32 x float> %c to <32 x double>
415   %f = fsub <32 x double> %d, %e
416   ret <32 x double> %f
419 define <2 x float> @vfwsub_wv_v2f16(ptr %x, ptr %y) {
420 ; CHECK-LABEL: vfwsub_wv_v2f16:
421 ; CHECK:       # %bb.0:
422 ; CHECK-NEXT:    vsetivli zero, 2, e16, mf4, ta, ma
423 ; CHECK-NEXT:    vle32.v v8, (a0)
424 ; CHECK-NEXT:    vle16.v v9, (a1)
425 ; CHECK-NEXT:    vfwsub.wv v8, v8, v9
426 ; CHECK-NEXT:    ret
427   %a = load <2 x float>, ptr %x
428   %b = load <2 x half>, ptr %y
429   %c = fpext <2 x half> %b to <2 x float>
430   %d = fsub <2 x float> %a, %c
431   ret <2 x float> %d
434 define <4 x float> @vfwsub_wv_v4f16(ptr %x, ptr %y) {
435 ; CHECK-LABEL: vfwsub_wv_v4f16:
436 ; CHECK:       # %bb.0:
437 ; CHECK-NEXT:    vsetivli zero, 4, e16, mf2, ta, ma
438 ; CHECK-NEXT:    vle32.v v8, (a0)
439 ; CHECK-NEXT:    vle16.v v9, (a1)
440 ; CHECK-NEXT:    vfwsub.wv v8, v8, v9
441 ; CHECK-NEXT:    ret
442   %a = load <4 x float>, ptr %x
443   %b = load <4 x half>, ptr %y
444   %c = fpext <4 x half> %b to <4 x float>
445   %d = fsub <4 x float> %a, %c
446   ret <4 x float> %d
449 define <8 x float> @vfwsub_wv_v8f16(ptr %x, ptr %y) {
450 ; CHECK-LABEL: vfwsub_wv_v8f16:
451 ; CHECK:       # %bb.0:
452 ; CHECK-NEXT:    vsetivli zero, 8, e16, m1, ta, ma
453 ; CHECK-NEXT:    vle32.v v8, (a0)
454 ; CHECK-NEXT:    vle16.v v10, (a1)
455 ; CHECK-NEXT:    vfwsub.wv v8, v8, v10
456 ; CHECK-NEXT:    ret
457   %a = load <8 x float>, ptr %x
458   %b = load <8 x half>, ptr %y
459   %c = fpext <8 x half> %b to <8 x float>
460   %d = fsub <8 x float> %a, %c
461   ret <8 x float> %d
464 define <16 x float> @vfwsub_wv_v16f16(ptr %x, ptr %y) {
465 ; CHECK-LABEL: vfwsub_wv_v16f16:
466 ; CHECK:       # %bb.0:
467 ; CHECK-NEXT:    vsetivli zero, 16, e16, m2, ta, ma
468 ; CHECK-NEXT:    vle32.v v8, (a0)
469 ; CHECK-NEXT:    vle16.v v12, (a1)
470 ; CHECK-NEXT:    vfwsub.wv v8, v8, v12
471 ; CHECK-NEXT:    ret
472   %a = load <16 x float>, ptr %x
473   %b = load <16 x half>, ptr %y
474   %c = fpext <16 x half> %b to <16 x float>
475   %d = fsub <16 x float> %a, %c
476   ret <16 x float> %d
479 define <32 x float> @vfwsub_wv_v32f16(ptr %x, ptr %y) {
480 ; CHECK-LABEL: vfwsub_wv_v32f16:
481 ; CHECK:       # %bb.0:
482 ; CHECK-NEXT:    li a2, 32
483 ; CHECK-NEXT:    vsetvli zero, a2, e16, m4, ta, ma
484 ; CHECK-NEXT:    vle32.v v8, (a0)
485 ; CHECK-NEXT:    vle16.v v16, (a1)
486 ; CHECK-NEXT:    vfwsub.wv v8, v8, v16
487 ; CHECK-NEXT:    ret
488   %a = load <32 x float>, ptr %x
489   %b = load <32 x half>, ptr %y
490   %c = fpext <32 x half> %b to <32 x float>
491   %d = fsub <32 x float> %a, %c
492   ret <32 x float> %d
495 define <2 x double> @vfwsub_wv_v2f32(ptr %x, ptr %y) {
496 ; CHECK-LABEL: vfwsub_wv_v2f32:
497 ; CHECK:       # %bb.0:
498 ; CHECK-NEXT:    vsetivli zero, 2, e32, mf2, ta, ma
499 ; CHECK-NEXT:    vle64.v v8, (a0)
500 ; CHECK-NEXT:    vle32.v v9, (a1)
501 ; CHECK-NEXT:    vfwsub.wv v8, v8, v9
502 ; CHECK-NEXT:    ret
503   %a = load <2 x double>, ptr %x
504   %b = load <2 x float>, ptr %y
505   %c = fpext <2 x float> %b to <2 x double>
506   %d = fsub <2 x double> %a, %c
507   ret <2 x double> %d
510 define <4 x double> @vfwsub_wv_v4f32(ptr %x, ptr %y) {
511 ; CHECK-LABEL: vfwsub_wv_v4f32:
512 ; CHECK:       # %bb.0:
513 ; CHECK-NEXT:    vsetivli zero, 4, e32, m1, ta, ma
514 ; CHECK-NEXT:    vle64.v v8, (a0)
515 ; CHECK-NEXT:    vle32.v v10, (a1)
516 ; CHECK-NEXT:    vfwsub.wv v8, v8, v10
517 ; CHECK-NEXT:    ret
518   %a = load <4 x double>, ptr %x
519   %b = load <4 x float>, ptr %y
520   %c = fpext <4 x float> %b to <4 x double>
521   %d = fsub <4 x double> %a, %c
522   ret <4 x double> %d
525 define <8 x double> @vfwsub_wv_v8f32(ptr %x, ptr %y) {
526 ; CHECK-LABEL: vfwsub_wv_v8f32:
527 ; CHECK:       # %bb.0:
528 ; CHECK-NEXT:    vsetivli zero, 8, e32, m2, ta, ma
529 ; CHECK-NEXT:    vle64.v v8, (a0)
530 ; CHECK-NEXT:    vle32.v v12, (a1)
531 ; CHECK-NEXT:    vfwsub.wv v8, v8, v12
532 ; CHECK-NEXT:    ret
533   %a = load <8 x double>, ptr %x
534   %b = load <8 x float>, ptr %y
535   %c = fpext <8 x float> %b to <8 x double>
536   %d = fsub <8 x double> %a, %c
537   ret <8 x double> %d
540 define <16 x double> @vfwsub_wv_v16f32(ptr %x, ptr %y) {
541 ; CHECK-LABEL: vfwsub_wv_v16f32:
542 ; CHECK:       # %bb.0:
543 ; CHECK-NEXT:    vsetivli zero, 16, e32, m4, ta, ma
544 ; CHECK-NEXT:    vle64.v v8, (a0)
545 ; CHECK-NEXT:    vle32.v v16, (a1)
546 ; CHECK-NEXT:    vfwsub.wv v8, v8, v16
547 ; CHECK-NEXT:    ret
548   %a = load <16 x double>, ptr %x
549   %b = load <16 x float>, ptr %y
550   %c = fpext <16 x float> %b to <16 x double>
551   %d = fsub <16 x double> %a, %c
552   ret <16 x double> %d
555 define <2 x float> @vfwsub_wf_v2f16(ptr %x, half %y) {
556 ; CHECK-LABEL: vfwsub_wf_v2f16:
557 ; CHECK:       # %bb.0:
558 ; CHECK-NEXT:    vsetivli zero, 2, e16, mf4, ta, ma
559 ; CHECK-NEXT:    vle32.v v8, (a0)
560 ; CHECK-NEXT:    vfwsub.wf v8, v8, fa0
561 ; CHECK-NEXT:    ret
562   %a = load <2 x float>, ptr %x
563   %b = insertelement <2 x half> poison, half %y, i32 0
564   %c = shufflevector <2 x half> %b, <2 x half> poison, <2 x i32> zeroinitializer
565   %d = fpext <2 x half> %c to <2 x float>
566   %e = fsub <2 x float> %a, %d
567   ret <2 x float> %e
570 define <4 x float> @vfwsub_wf_v4f16(ptr %x, half %y) {
571 ; CHECK-LABEL: vfwsub_wf_v4f16:
572 ; CHECK:       # %bb.0:
573 ; CHECK-NEXT:    vsetivli zero, 4, e16, mf2, ta, ma
574 ; CHECK-NEXT:    vle32.v v8, (a0)
575 ; CHECK-NEXT:    vfwsub.wf v8, v8, fa0
576 ; CHECK-NEXT:    ret
577   %a = load <4 x float>, ptr %x
578   %b = insertelement <4 x half> poison, half %y, i32 0
579   %c = shufflevector <4 x half> %b, <4 x half> poison, <4 x i32> zeroinitializer
580   %d = fpext <4 x half> %c to <4 x float>
581   %e = fsub <4 x float> %a, %d
582   ret <4 x float> %e
585 define <8 x float> @vfwsub_wf_v8f16(ptr %x, half %y) {
586 ; CHECK-LABEL: vfwsub_wf_v8f16:
587 ; CHECK:       # %bb.0:
588 ; CHECK-NEXT:    vsetivli zero, 8, e16, m1, ta, ma
589 ; CHECK-NEXT:    vle32.v v8, (a0)
590 ; CHECK-NEXT:    vfwsub.wf v8, v8, fa0
591 ; CHECK-NEXT:    ret
592   %a = load <8 x float>, ptr %x
593   %b = insertelement <8 x half> poison, half %y, i32 0
594   %c = shufflevector <8 x half> %b, <8 x half> poison, <8 x i32> zeroinitializer
595   %d = fpext <8 x half> %c to <8 x float>
596   %e = fsub <8 x float> %a, %d
597   ret <8 x float> %e
600 define <16 x float> @vfwsub_wf_v16f16(ptr %x, half %y) {
601 ; CHECK-LABEL: vfwsub_wf_v16f16:
602 ; CHECK:       # %bb.0:
603 ; CHECK-NEXT:    vsetivli zero, 16, e16, m2, ta, ma
604 ; CHECK-NEXT:    vle32.v v8, (a0)
605 ; CHECK-NEXT:    vfwsub.wf v8, v8, fa0
606 ; CHECK-NEXT:    ret
607   %a = load <16 x float>, ptr %x
608   %b = insertelement <16 x half> poison, half %y, i32 0
609   %c = shufflevector <16 x half> %b, <16 x half> poison, <16 x i32> zeroinitializer
610   %d = fpext <16 x half> %c to <16 x float>
611   %e = fsub <16 x float> %a, %d
612   ret <16 x float> %e
615 define <2 x double> @vfwsub_wf_v2f32(ptr %x, float %y) {
616 ; CHECK-LABEL: vfwsub_wf_v2f32:
617 ; CHECK:       # %bb.0:
618 ; CHECK-NEXT:    vsetivli zero, 2, e32, mf2, ta, ma
619 ; CHECK-NEXT:    vle64.v v8, (a0)
620 ; CHECK-NEXT:    vfwsub.wf v8, v8, fa0
621 ; CHECK-NEXT:    ret
622   %a = load <2 x double>, ptr %x
623   %b = insertelement <2 x float> poison, float %y, i32 0
624   %c = shufflevector <2 x float> %b, <2 x float> poison, <2 x i32> zeroinitializer
625   %d = fpext <2 x float> %c to <2 x double>
626   %e = fsub <2 x double> %a, %d
627   ret <2 x double> %e
630 define <4 x double> @vfwsub_wf_v4f32(ptr %x, float %y) {
631 ; CHECK-LABEL: vfwsub_wf_v4f32:
632 ; CHECK:       # %bb.0:
633 ; CHECK-NEXT:    vsetivli zero, 4, e32, m1, ta, ma
634 ; CHECK-NEXT:    vle64.v v8, (a0)
635 ; CHECK-NEXT:    vfwsub.wf v8, v8, fa0
636 ; CHECK-NEXT:    ret
637   %a = load <4 x double>, ptr %x
638   %b = insertelement <4 x float> poison, float %y, i32 0
639   %c = shufflevector <4 x float> %b, <4 x float> poison, <4 x i32> zeroinitializer
640   %d = fpext <4 x float> %c to <4 x double>
641   %e = fsub <4 x double> %a, %d
642   ret <4 x double> %e
645 define <8 x double> @vfwsub_wf_v8f32(ptr %x, float %y) {
646 ; CHECK-LABEL: vfwsub_wf_v8f32:
647 ; CHECK:       # %bb.0:
648 ; CHECK-NEXT:    vsetivli zero, 8, e32, m2, ta, ma
649 ; CHECK-NEXT:    vle64.v v8, (a0)
650 ; CHECK-NEXT:    vfwsub.wf v8, v8, fa0
651 ; CHECK-NEXT:    ret
652   %a = load <8 x double>, ptr %x
653   %b = insertelement <8 x float> poison, float %y, i32 0
654   %c = shufflevector <8 x float> %b, <8 x float> poison, <8 x i32> zeroinitializer
655   %d = fpext <8 x float> %c to <8 x double>
656   %e = fsub <8 x double> %a, %d
657   ret <8 x double> %e
660 define <16 x double> @vfwsub_wf_v16f32(ptr %x, float %y) {
661 ; CHECK-LABEL: vfwsub_wf_v16f32:
662 ; CHECK:       # %bb.0:
663 ; CHECK-NEXT:    vsetivli zero, 16, e32, m4, ta, ma
664 ; CHECK-NEXT:    vle64.v v8, (a0)
665 ; CHECK-NEXT:    vfwsub.wf v8, v8, fa0
666 ; CHECK-NEXT:    ret
667   %a = load <16 x double>, ptr %x
668   %b = insertelement <16 x float> poison, float %y, i32 0
669   %c = shufflevector <16 x float> %b, <16 x float> poison, <16 x i32> zeroinitializer
670   %d = fpext <16 x float> %c to <16 x double>
671   %e = fsub <16 x double> %a, %d
672   ret <16 x double> %e