[clang][modules] Don't prevent translation of FW_Private includes when explicitly...
[llvm-project.git] / llvm / test / CodeGen / RISCV / rvv / fixed-vectors-vfsub-vp.ll
blob76ca7d971eb49a8d7538e88e18bc47b05faddd46
1 ; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
2 ; RUN: llc -mtriple=riscv32 -mattr=+d,+zfh,+zvfh,+v -target-abi=ilp32d \
3 ; RUN:   -verify-machineinstrs < %s | FileCheck %s --check-prefixes=CHECK,ZVFH
4 ; RUN: llc -mtriple=riscv64 -mattr=+d,+zfh,+zvfh,+v -target-abi=lp64d \
5 ; RUN:   -verify-machineinstrs < %s | FileCheck %s --check-prefixes=CHECK,ZVFH
6 ; RUN: llc -mtriple=riscv32 -mattr=+d,+zfh,+zvfhmin,+v -target-abi=ilp32d \
7 ; RUN:   -verify-machineinstrs < %s | FileCheck %s --check-prefixes=CHECK,ZVFHMIN
8 ; RUN: llc -mtriple=riscv64 -mattr=+d,+zfh,+zvfhmin,+v -target-abi=lp64d \
9 ; RUN:   -verify-machineinstrs < %s | FileCheck %s --check-prefixes=CHECK,ZVFHMIN
11 declare <2 x half> @llvm.vp.fsub.v2f16(<2 x half>, <2 x half>, <2 x i1>, i32)
13 define <2 x half> @vfsub_vv_v2f16(<2 x half> %va, <2 x half> %b, <2 x i1> %m, i32 zeroext %evl) {
14 ; ZVFH-LABEL: vfsub_vv_v2f16:
15 ; ZVFH:       # %bb.0:
16 ; ZVFH-NEXT:    vsetvli zero, a0, e16, mf4, ta, ma
17 ; ZVFH-NEXT:    vfsub.vv v8, v8, v9, v0.t
18 ; ZVFH-NEXT:    ret
20 ; ZVFHMIN-LABEL: vfsub_vv_v2f16:
21 ; ZVFHMIN:       # %bb.0:
22 ; ZVFHMIN-NEXT:    vsetivli zero, 2, e16, mf4, ta, ma
23 ; ZVFHMIN-NEXT:    vfwcvt.f.f.v v10, v9
24 ; ZVFHMIN-NEXT:    vfwcvt.f.f.v v9, v8
25 ; ZVFHMIN-NEXT:    vsetvli zero, a0, e32, mf2, ta, ma
26 ; ZVFHMIN-NEXT:    vfsub.vv v9, v9, v10, v0.t
27 ; ZVFHMIN-NEXT:    vsetivli zero, 2, e16, mf4, ta, ma
28 ; ZVFHMIN-NEXT:    vfncvt.f.f.w v8, v9
29 ; ZVFHMIN-NEXT:    ret
30   %v = call <2 x half> @llvm.vp.fsub.v2f16(<2 x half> %va, <2 x half> %b, <2 x i1> %m, i32 %evl)
31   ret <2 x half> %v
34 define <2 x half> @vfsub_vv_v2f16_unmasked(<2 x half> %va, <2 x half> %b, i32 zeroext %evl) {
35 ; ZVFH-LABEL: vfsub_vv_v2f16_unmasked:
36 ; ZVFH:       # %bb.0:
37 ; ZVFH-NEXT:    vsetvli zero, a0, e16, mf4, ta, ma
38 ; ZVFH-NEXT:    vfsub.vv v8, v8, v9
39 ; ZVFH-NEXT:    ret
41 ; ZVFHMIN-LABEL: vfsub_vv_v2f16_unmasked:
42 ; ZVFHMIN:       # %bb.0:
43 ; ZVFHMIN-NEXT:    vsetivli zero, 2, e16, mf4, ta, ma
44 ; ZVFHMIN-NEXT:    vfwcvt.f.f.v v10, v9
45 ; ZVFHMIN-NEXT:    vfwcvt.f.f.v v9, v8
46 ; ZVFHMIN-NEXT:    vsetvli zero, a0, e32, mf2, ta, ma
47 ; ZVFHMIN-NEXT:    vfsub.vv v9, v9, v10
48 ; ZVFHMIN-NEXT:    vsetivli zero, 2, e16, mf4, ta, ma
49 ; ZVFHMIN-NEXT:    vfncvt.f.f.w v8, v9
50 ; ZVFHMIN-NEXT:    ret
51   %head = insertelement <2 x i1> poison, i1 true, i32 0
52   %m = shufflevector <2 x i1> %head, <2 x i1> poison, <2 x i32> zeroinitializer
53   %v = call <2 x half> @llvm.vp.fsub.v2f16(<2 x half> %va, <2 x half> %b, <2 x i1> %m, i32 %evl)
54   ret <2 x half> %v
57 define <2 x half> @vfsub_vf_v2f16(<2 x half> %va, half %b, <2 x i1> %m, i32 zeroext %evl) {
58 ; ZVFH-LABEL: vfsub_vf_v2f16:
59 ; ZVFH:       # %bb.0:
60 ; ZVFH-NEXT:    vsetvli zero, a0, e16, mf4, ta, ma
61 ; ZVFH-NEXT:    vfsub.vf v8, v8, fa0, v0.t
62 ; ZVFH-NEXT:    ret
64 ; ZVFHMIN-LABEL: vfsub_vf_v2f16:
65 ; ZVFHMIN:       # %bb.0:
66 ; ZVFHMIN-NEXT:    fcvt.s.h fa5, fa0
67 ; ZVFHMIN-NEXT:    vsetvli a1, zero, e32, mf2, ta, ma
68 ; ZVFHMIN-NEXT:    vfmv.v.f v9, fa5
69 ; ZVFHMIN-NEXT:    vsetvli zero, zero, e16, mf4, ta, ma
70 ; ZVFHMIN-NEXT:    vfncvt.f.f.w v10, v9
71 ; ZVFHMIN-NEXT:    vsetivli zero, 2, e16, mf4, ta, ma
72 ; ZVFHMIN-NEXT:    vfwcvt.f.f.v v9, v8
73 ; ZVFHMIN-NEXT:    vfwcvt.f.f.v v8, v10
74 ; ZVFHMIN-NEXT:    vsetvli zero, a0, e32, mf2, ta, ma
75 ; ZVFHMIN-NEXT:    vfsub.vv v9, v9, v8, v0.t
76 ; ZVFHMIN-NEXT:    vsetivli zero, 2, e16, mf4, ta, ma
77 ; ZVFHMIN-NEXT:    vfncvt.f.f.w v8, v9
78 ; ZVFHMIN-NEXT:    ret
79   %elt.head = insertelement <2 x half> poison, half %b, i32 0
80   %vb = shufflevector <2 x half> %elt.head, <2 x half> poison, <2 x i32> zeroinitializer
81   %v = call <2 x half> @llvm.vp.fsub.v2f16(<2 x half> %va, <2 x half> %vb, <2 x i1> %m, i32 %evl)
82   ret <2 x half> %v
85 define <2 x half> @vfsub_vf_v2f16_unmasked(<2 x half> %va, half %b, i32 zeroext %evl) {
86 ; ZVFH-LABEL: vfsub_vf_v2f16_unmasked:
87 ; ZVFH:       # %bb.0:
88 ; ZVFH-NEXT:    vsetvli zero, a0, e16, mf4, ta, ma
89 ; ZVFH-NEXT:    vfsub.vf v8, v8, fa0
90 ; ZVFH-NEXT:    ret
92 ; ZVFHMIN-LABEL: vfsub_vf_v2f16_unmasked:
93 ; ZVFHMIN:       # %bb.0:
94 ; ZVFHMIN-NEXT:    fcvt.s.h fa5, fa0
95 ; ZVFHMIN-NEXT:    vsetvli a1, zero, e32, mf2, ta, ma
96 ; ZVFHMIN-NEXT:    vfmv.v.f v9, fa5
97 ; ZVFHMIN-NEXT:    vsetvli zero, zero, e16, mf4, ta, ma
98 ; ZVFHMIN-NEXT:    vfncvt.f.f.w v10, v9
99 ; ZVFHMIN-NEXT:    vsetivli zero, 2, e16, mf4, ta, ma
100 ; ZVFHMIN-NEXT:    vfwcvt.f.f.v v9, v8
101 ; ZVFHMIN-NEXT:    vfwcvt.f.f.v v8, v10
102 ; ZVFHMIN-NEXT:    vsetvli zero, a0, e32, mf2, ta, ma
103 ; ZVFHMIN-NEXT:    vfsub.vv v9, v9, v8
104 ; ZVFHMIN-NEXT:    vsetivli zero, 2, e16, mf4, ta, ma
105 ; ZVFHMIN-NEXT:    vfncvt.f.f.w v8, v9
106 ; ZVFHMIN-NEXT:    ret
107   %elt.head = insertelement <2 x half> poison, half %b, i32 0
108   %vb = shufflevector <2 x half> %elt.head, <2 x half> poison, <2 x i32> zeroinitializer
109   %head = insertelement <2 x i1> poison, i1 true, i32 0
110   %m = shufflevector <2 x i1> %head, <2 x i1> poison, <2 x i32> zeroinitializer
111   %v = call <2 x half> @llvm.vp.fsub.v2f16(<2 x half> %va, <2 x half> %vb, <2 x i1> %m, i32 %evl)
112   ret <2 x half> %v
115 declare <3 x half> @llvm.vp.fsub.v3f16(<3 x half>, <3 x half>, <3 x i1>, i32)
117 define <3 x half> @vfsub_vv_v3f16(<3 x half> %va, <3 x half> %b, <3 x i1> %m, i32 zeroext %evl) {
118 ; ZVFH-LABEL: vfsub_vv_v3f16:
119 ; ZVFH:       # %bb.0:
120 ; ZVFH-NEXT:    vsetvli zero, a0, e16, mf2, ta, ma
121 ; ZVFH-NEXT:    vfsub.vv v8, v8, v9, v0.t
122 ; ZVFH-NEXT:    ret
124 ; ZVFHMIN-LABEL: vfsub_vv_v3f16:
125 ; ZVFHMIN:       # %bb.0:
126 ; ZVFHMIN-NEXT:    vsetivli zero, 4, e16, mf2, ta, ma
127 ; ZVFHMIN-NEXT:    vfwcvt.f.f.v v10, v9
128 ; ZVFHMIN-NEXT:    vfwcvt.f.f.v v9, v8
129 ; ZVFHMIN-NEXT:    vsetvli zero, a0, e32, m1, ta, ma
130 ; ZVFHMIN-NEXT:    vfsub.vv v9, v9, v10, v0.t
131 ; ZVFHMIN-NEXT:    vsetivli zero, 4, e16, mf2, ta, ma
132 ; ZVFHMIN-NEXT:    vfncvt.f.f.w v8, v9
133 ; ZVFHMIN-NEXT:    ret
134   %v = call <3 x half> @llvm.vp.fsub.v3f16(<3 x half> %va, <3 x half> %b, <3 x i1> %m, i32 %evl)
135   ret <3 x half> %v
138 declare <4 x half> @llvm.vp.fsub.v4f16(<4 x half>, <4 x half>, <4 x i1>, i32)
140 define <4 x half> @vfsub_vv_v4f16(<4 x half> %va, <4 x half> %b, <4 x i1> %m, i32 zeroext %evl) {
141 ; ZVFH-LABEL: vfsub_vv_v4f16:
142 ; ZVFH:       # %bb.0:
143 ; ZVFH-NEXT:    vsetvli zero, a0, e16, mf2, ta, ma
144 ; ZVFH-NEXT:    vfsub.vv v8, v8, v9, v0.t
145 ; ZVFH-NEXT:    ret
147 ; ZVFHMIN-LABEL: vfsub_vv_v4f16:
148 ; ZVFHMIN:       # %bb.0:
149 ; ZVFHMIN-NEXT:    vsetivli zero, 4, e16, mf2, ta, ma
150 ; ZVFHMIN-NEXT:    vfwcvt.f.f.v v10, v9
151 ; ZVFHMIN-NEXT:    vfwcvt.f.f.v v9, v8
152 ; ZVFHMIN-NEXT:    vsetvli zero, a0, e32, m1, ta, ma
153 ; ZVFHMIN-NEXT:    vfsub.vv v9, v9, v10, v0.t
154 ; ZVFHMIN-NEXT:    vsetivli zero, 4, e16, mf2, ta, ma
155 ; ZVFHMIN-NEXT:    vfncvt.f.f.w v8, v9
156 ; ZVFHMIN-NEXT:    ret
157   %v = call <4 x half> @llvm.vp.fsub.v4f16(<4 x half> %va, <4 x half> %b, <4 x i1> %m, i32 %evl)
158   ret <4 x half> %v
161 define <4 x half> @vfsub_vv_v4f16_unmasked(<4 x half> %va, <4 x half> %b, i32 zeroext %evl) {
162 ; ZVFH-LABEL: vfsub_vv_v4f16_unmasked:
163 ; ZVFH:       # %bb.0:
164 ; ZVFH-NEXT:    vsetvli zero, a0, e16, mf2, ta, ma
165 ; ZVFH-NEXT:    vfsub.vv v8, v8, v9
166 ; ZVFH-NEXT:    ret
168 ; ZVFHMIN-LABEL: vfsub_vv_v4f16_unmasked:
169 ; ZVFHMIN:       # %bb.0:
170 ; ZVFHMIN-NEXT:    vsetivli zero, 4, e16, mf2, ta, ma
171 ; ZVFHMIN-NEXT:    vfwcvt.f.f.v v10, v9
172 ; ZVFHMIN-NEXT:    vfwcvt.f.f.v v9, v8
173 ; ZVFHMIN-NEXT:    vsetvli zero, a0, e32, m1, ta, ma
174 ; ZVFHMIN-NEXT:    vfsub.vv v9, v9, v10
175 ; ZVFHMIN-NEXT:    vsetivli zero, 4, e16, mf2, ta, ma
176 ; ZVFHMIN-NEXT:    vfncvt.f.f.w v8, v9
177 ; ZVFHMIN-NEXT:    ret
178   %head = insertelement <4 x i1> poison, i1 true, i32 0
179   %m = shufflevector <4 x i1> %head, <4 x i1> poison, <4 x i32> zeroinitializer
180   %v = call <4 x half> @llvm.vp.fsub.v4f16(<4 x half> %va, <4 x half> %b, <4 x i1> %m, i32 %evl)
181   ret <4 x half> %v
184 define <4 x half> @vfsub_vf_v4f16(<4 x half> %va, half %b, <4 x i1> %m, i32 zeroext %evl) {
185 ; ZVFH-LABEL: vfsub_vf_v4f16:
186 ; ZVFH:       # %bb.0:
187 ; ZVFH-NEXT:    vsetvli zero, a0, e16, mf2, ta, ma
188 ; ZVFH-NEXT:    vfsub.vf v8, v8, fa0, v0.t
189 ; ZVFH-NEXT:    ret
191 ; ZVFHMIN-LABEL: vfsub_vf_v4f16:
192 ; ZVFHMIN:       # %bb.0:
193 ; ZVFHMIN-NEXT:    fcvt.s.h fa5, fa0
194 ; ZVFHMIN-NEXT:    vsetvli a1, zero, e32, m1, ta, ma
195 ; ZVFHMIN-NEXT:    vfmv.v.f v9, fa5
196 ; ZVFHMIN-NEXT:    vsetvli zero, zero, e16, mf2, ta, ma
197 ; ZVFHMIN-NEXT:    vfncvt.f.f.w v10, v9
198 ; ZVFHMIN-NEXT:    vsetivli zero, 4, e16, mf2, ta, ma
199 ; ZVFHMIN-NEXT:    vfwcvt.f.f.v v9, v8
200 ; ZVFHMIN-NEXT:    vfwcvt.f.f.v v8, v10
201 ; ZVFHMIN-NEXT:    vsetvli zero, a0, e32, m1, ta, ma
202 ; ZVFHMIN-NEXT:    vfsub.vv v9, v9, v8, v0.t
203 ; ZVFHMIN-NEXT:    vsetivli zero, 4, e16, mf2, ta, ma
204 ; ZVFHMIN-NEXT:    vfncvt.f.f.w v8, v9
205 ; ZVFHMIN-NEXT:    ret
206   %elt.head = insertelement <4 x half> poison, half %b, i32 0
207   %vb = shufflevector <4 x half> %elt.head, <4 x half> poison, <4 x i32> zeroinitializer
208   %v = call <4 x half> @llvm.vp.fsub.v4f16(<4 x half> %va, <4 x half> %vb, <4 x i1> %m, i32 %evl)
209   ret <4 x half> %v
212 define <4 x half> @vfsub_vf_v4f16_unmasked(<4 x half> %va, half %b, i32 zeroext %evl) {
213 ; ZVFH-LABEL: vfsub_vf_v4f16_unmasked:
214 ; ZVFH:       # %bb.0:
215 ; ZVFH-NEXT:    vsetvli zero, a0, e16, mf2, ta, ma
216 ; ZVFH-NEXT:    vfsub.vf v8, v8, fa0
217 ; ZVFH-NEXT:    ret
219 ; ZVFHMIN-LABEL: vfsub_vf_v4f16_unmasked:
220 ; ZVFHMIN:       # %bb.0:
221 ; ZVFHMIN-NEXT:    fcvt.s.h fa5, fa0
222 ; ZVFHMIN-NEXT:    vsetvli a1, zero, e32, m1, ta, ma
223 ; ZVFHMIN-NEXT:    vfmv.v.f v9, fa5
224 ; ZVFHMIN-NEXT:    vsetvli zero, zero, e16, mf2, ta, ma
225 ; ZVFHMIN-NEXT:    vfncvt.f.f.w v10, v9
226 ; ZVFHMIN-NEXT:    vsetivli zero, 4, e16, mf2, ta, ma
227 ; ZVFHMIN-NEXT:    vfwcvt.f.f.v v9, v8
228 ; ZVFHMIN-NEXT:    vfwcvt.f.f.v v8, v10
229 ; ZVFHMIN-NEXT:    vsetvli zero, a0, e32, m1, ta, ma
230 ; ZVFHMIN-NEXT:    vfsub.vv v9, v9, v8
231 ; ZVFHMIN-NEXT:    vsetivli zero, 4, e16, mf2, ta, ma
232 ; ZVFHMIN-NEXT:    vfncvt.f.f.w v8, v9
233 ; ZVFHMIN-NEXT:    ret
234   %elt.head = insertelement <4 x half> poison, half %b, i32 0
235   %vb = shufflevector <4 x half> %elt.head, <4 x half> poison, <4 x i32> zeroinitializer
236   %head = insertelement <4 x i1> poison, i1 true, i32 0
237   %m = shufflevector <4 x i1> %head, <4 x i1> poison, <4 x i32> zeroinitializer
238   %v = call <4 x half> @llvm.vp.fsub.v4f16(<4 x half> %va, <4 x half> %vb, <4 x i1> %m, i32 %evl)
239   ret <4 x half> %v
242 declare <8 x half> @llvm.vp.fsub.v8f16(<8 x half>, <8 x half>, <8 x i1>, i32)
244 define <8 x half> @vfsub_vv_v8f16(<8 x half> %va, <8 x half> %b, <8 x i1> %m, i32 zeroext %evl) {
245 ; ZVFH-LABEL: vfsub_vv_v8f16:
246 ; ZVFH:       # %bb.0:
247 ; ZVFH-NEXT:    vsetvli zero, a0, e16, m1, ta, ma
248 ; ZVFH-NEXT:    vfsub.vv v8, v8, v9, v0.t
249 ; ZVFH-NEXT:    ret
251 ; ZVFHMIN-LABEL: vfsub_vv_v8f16:
252 ; ZVFHMIN:       # %bb.0:
253 ; ZVFHMIN-NEXT:    vsetivli zero, 8, e16, m1, ta, ma
254 ; ZVFHMIN-NEXT:    vfwcvt.f.f.v v10, v9
255 ; ZVFHMIN-NEXT:    vfwcvt.f.f.v v12, v8
256 ; ZVFHMIN-NEXT:    vsetvli zero, a0, e32, m2, ta, ma
257 ; ZVFHMIN-NEXT:    vfsub.vv v10, v12, v10, v0.t
258 ; ZVFHMIN-NEXT:    vsetivli zero, 8, e16, m1, ta, ma
259 ; ZVFHMIN-NEXT:    vfncvt.f.f.w v8, v10
260 ; ZVFHMIN-NEXT:    ret
261   %v = call <8 x half> @llvm.vp.fsub.v8f16(<8 x half> %va, <8 x half> %b, <8 x i1> %m, i32 %evl)
262   ret <8 x half> %v
265 define <8 x half> @vfsub_vv_v8f16_unmasked(<8 x half> %va, <8 x half> %b, i32 zeroext %evl) {
266 ; ZVFH-LABEL: vfsub_vv_v8f16_unmasked:
267 ; ZVFH:       # %bb.0:
268 ; ZVFH-NEXT:    vsetvli zero, a0, e16, m1, ta, ma
269 ; ZVFH-NEXT:    vfsub.vv v8, v8, v9
270 ; ZVFH-NEXT:    ret
272 ; ZVFHMIN-LABEL: vfsub_vv_v8f16_unmasked:
273 ; ZVFHMIN:       # %bb.0:
274 ; ZVFHMIN-NEXT:    vsetivli zero, 8, e16, m1, ta, ma
275 ; ZVFHMIN-NEXT:    vfwcvt.f.f.v v10, v9
276 ; ZVFHMIN-NEXT:    vfwcvt.f.f.v v12, v8
277 ; ZVFHMIN-NEXT:    vsetvli zero, a0, e32, m2, ta, ma
278 ; ZVFHMIN-NEXT:    vfsub.vv v10, v12, v10
279 ; ZVFHMIN-NEXT:    vsetivli zero, 8, e16, m1, ta, ma
280 ; ZVFHMIN-NEXT:    vfncvt.f.f.w v8, v10
281 ; ZVFHMIN-NEXT:    ret
282   %head = insertelement <8 x i1> poison, i1 true, i32 0
283   %m = shufflevector <8 x i1> %head, <8 x i1> poison, <8 x i32> zeroinitializer
284   %v = call <8 x half> @llvm.vp.fsub.v8f16(<8 x half> %va, <8 x half> %b, <8 x i1> %m, i32 %evl)
285   ret <8 x half> %v
288 define <8 x half> @vfsub_vf_v8f16(<8 x half> %va, half %b, <8 x i1> %m, i32 zeroext %evl) {
289 ; ZVFH-LABEL: vfsub_vf_v8f16:
290 ; ZVFH:       # %bb.0:
291 ; ZVFH-NEXT:    vsetvli zero, a0, e16, m1, ta, ma
292 ; ZVFH-NEXT:    vfsub.vf v8, v8, fa0, v0.t
293 ; ZVFH-NEXT:    ret
295 ; ZVFHMIN-LABEL: vfsub_vf_v8f16:
296 ; ZVFHMIN:       # %bb.0:
297 ; ZVFHMIN-NEXT:    fcvt.s.h fa5, fa0
298 ; ZVFHMIN-NEXT:    vsetvli a1, zero, e32, m2, ta, ma
299 ; ZVFHMIN-NEXT:    vfmv.v.f v10, fa5
300 ; ZVFHMIN-NEXT:    vsetvli zero, zero, e16, m1, ta, ma
301 ; ZVFHMIN-NEXT:    vfncvt.f.f.w v9, v10
302 ; ZVFHMIN-NEXT:    vsetivli zero, 8, e16, m1, ta, ma
303 ; ZVFHMIN-NEXT:    vfwcvt.f.f.v v10, v8
304 ; ZVFHMIN-NEXT:    vfwcvt.f.f.v v12, v9
305 ; ZVFHMIN-NEXT:    vsetvli zero, a0, e32, m2, ta, ma
306 ; ZVFHMIN-NEXT:    vfsub.vv v10, v10, v12, v0.t
307 ; ZVFHMIN-NEXT:    vsetivli zero, 8, e16, m1, ta, ma
308 ; ZVFHMIN-NEXT:    vfncvt.f.f.w v8, v10
309 ; ZVFHMIN-NEXT:    ret
310   %elt.head = insertelement <8 x half> poison, half %b, i32 0
311   %vb = shufflevector <8 x half> %elt.head, <8 x half> poison, <8 x i32> zeroinitializer
312   %v = call <8 x half> @llvm.vp.fsub.v8f16(<8 x half> %va, <8 x half> %vb, <8 x i1> %m, i32 %evl)
313   ret <8 x half> %v
316 define <8 x half> @vfsub_vf_v8f16_unmasked(<8 x half> %va, half %b, i32 zeroext %evl) {
317 ; ZVFH-LABEL: vfsub_vf_v8f16_unmasked:
318 ; ZVFH:       # %bb.0:
319 ; ZVFH-NEXT:    vsetvli zero, a0, e16, m1, ta, ma
320 ; ZVFH-NEXT:    vfsub.vf v8, v8, fa0
321 ; ZVFH-NEXT:    ret
323 ; ZVFHMIN-LABEL: vfsub_vf_v8f16_unmasked:
324 ; ZVFHMIN:       # %bb.0:
325 ; ZVFHMIN-NEXT:    fcvt.s.h fa5, fa0
326 ; ZVFHMIN-NEXT:    vsetvli a1, zero, e32, m2, ta, ma
327 ; ZVFHMIN-NEXT:    vfmv.v.f v10, fa5
328 ; ZVFHMIN-NEXT:    vsetvli zero, zero, e16, m1, ta, ma
329 ; ZVFHMIN-NEXT:    vfncvt.f.f.w v9, v10
330 ; ZVFHMIN-NEXT:    vsetivli zero, 8, e16, m1, ta, ma
331 ; ZVFHMIN-NEXT:    vfwcvt.f.f.v v10, v8
332 ; ZVFHMIN-NEXT:    vfwcvt.f.f.v v12, v9
333 ; ZVFHMIN-NEXT:    vsetvli zero, a0, e32, m2, ta, ma
334 ; ZVFHMIN-NEXT:    vfsub.vv v10, v10, v12
335 ; ZVFHMIN-NEXT:    vsetivli zero, 8, e16, m1, ta, ma
336 ; ZVFHMIN-NEXT:    vfncvt.f.f.w v8, v10
337 ; ZVFHMIN-NEXT:    ret
338   %elt.head = insertelement <8 x half> poison, half %b, i32 0
339   %vb = shufflevector <8 x half> %elt.head, <8 x half> poison, <8 x i32> zeroinitializer
340   %head = insertelement <8 x i1> poison, i1 true, i32 0
341   %m = shufflevector <8 x i1> %head, <8 x i1> poison, <8 x i32> zeroinitializer
342   %v = call <8 x half> @llvm.vp.fsub.v8f16(<8 x half> %va, <8 x half> %vb, <8 x i1> %m, i32 %evl)
343   ret <8 x half> %v
346 declare <16 x half> @llvm.vp.fsub.v16f16(<16 x half>, <16 x half>, <16 x i1>, i32)
348 define <16 x half> @vfsub_vv_v16f16(<16 x half> %va, <16 x half> %b, <16 x i1> %m, i32 zeroext %evl) {
349 ; ZVFH-LABEL: vfsub_vv_v16f16:
350 ; ZVFH:       # %bb.0:
351 ; ZVFH-NEXT:    vsetvli zero, a0, e16, m2, ta, ma
352 ; ZVFH-NEXT:    vfsub.vv v8, v8, v10, v0.t
353 ; ZVFH-NEXT:    ret
355 ; ZVFHMIN-LABEL: vfsub_vv_v16f16:
356 ; ZVFHMIN:       # %bb.0:
357 ; ZVFHMIN-NEXT:    vsetivli zero, 16, e16, m2, ta, ma
358 ; ZVFHMIN-NEXT:    vfwcvt.f.f.v v12, v10
359 ; ZVFHMIN-NEXT:    vfwcvt.f.f.v v16, v8
360 ; ZVFHMIN-NEXT:    vsetvli zero, a0, e32, m4, ta, ma
361 ; ZVFHMIN-NEXT:    vfsub.vv v12, v16, v12, v0.t
362 ; ZVFHMIN-NEXT:    vsetivli zero, 16, e16, m2, ta, ma
363 ; ZVFHMIN-NEXT:    vfncvt.f.f.w v8, v12
364 ; ZVFHMIN-NEXT:    ret
365   %v = call <16 x half> @llvm.vp.fsub.v16f16(<16 x half> %va, <16 x half> %b, <16 x i1> %m, i32 %evl)
366   ret <16 x half> %v
369 define <16 x half> @vfsub_vv_v16f16_unmasked(<16 x half> %va, <16 x half> %b, i32 zeroext %evl) {
370 ; ZVFH-LABEL: vfsub_vv_v16f16_unmasked:
371 ; ZVFH:       # %bb.0:
372 ; ZVFH-NEXT:    vsetvli zero, a0, e16, m2, ta, ma
373 ; ZVFH-NEXT:    vfsub.vv v8, v8, v10
374 ; ZVFH-NEXT:    ret
376 ; ZVFHMIN-LABEL: vfsub_vv_v16f16_unmasked:
377 ; ZVFHMIN:       # %bb.0:
378 ; ZVFHMIN-NEXT:    vsetivli zero, 16, e16, m2, ta, ma
379 ; ZVFHMIN-NEXT:    vfwcvt.f.f.v v12, v10
380 ; ZVFHMIN-NEXT:    vfwcvt.f.f.v v16, v8
381 ; ZVFHMIN-NEXT:    vsetvli zero, a0, e32, m4, ta, ma
382 ; ZVFHMIN-NEXT:    vfsub.vv v12, v16, v12
383 ; ZVFHMIN-NEXT:    vsetivli zero, 16, e16, m2, ta, ma
384 ; ZVFHMIN-NEXT:    vfncvt.f.f.w v8, v12
385 ; ZVFHMIN-NEXT:    ret
386   %head = insertelement <16 x i1> poison, i1 true, i32 0
387   %m = shufflevector <16 x i1> %head, <16 x i1> poison, <16 x i32> zeroinitializer
388   %v = call <16 x half> @llvm.vp.fsub.v16f16(<16 x half> %va, <16 x half> %b, <16 x i1> %m, i32 %evl)
389   ret <16 x half> %v
392 define <16 x half> @vfsub_vf_v16f16(<16 x half> %va, half %b, <16 x i1> %m, i32 zeroext %evl) {
393 ; ZVFH-LABEL: vfsub_vf_v16f16:
394 ; ZVFH:       # %bb.0:
395 ; ZVFH-NEXT:    vsetvli zero, a0, e16, m2, ta, ma
396 ; ZVFH-NEXT:    vfsub.vf v8, v8, fa0, v0.t
397 ; ZVFH-NEXT:    ret
399 ; ZVFHMIN-LABEL: vfsub_vf_v16f16:
400 ; ZVFHMIN:       # %bb.0:
401 ; ZVFHMIN-NEXT:    fcvt.s.h fa5, fa0
402 ; ZVFHMIN-NEXT:    vsetvli a1, zero, e32, m4, ta, ma
403 ; ZVFHMIN-NEXT:    vfmv.v.f v12, fa5
404 ; ZVFHMIN-NEXT:    vsetvli zero, zero, e16, m2, ta, ma
405 ; ZVFHMIN-NEXT:    vfncvt.f.f.w v10, v12
406 ; ZVFHMIN-NEXT:    vsetivli zero, 16, e16, m2, ta, ma
407 ; ZVFHMIN-NEXT:    vfwcvt.f.f.v v12, v8
408 ; ZVFHMIN-NEXT:    vfwcvt.f.f.v v16, v10
409 ; ZVFHMIN-NEXT:    vsetvli zero, a0, e32, m4, ta, ma
410 ; ZVFHMIN-NEXT:    vfsub.vv v12, v12, v16, v0.t
411 ; ZVFHMIN-NEXT:    vsetivli zero, 16, e16, m2, ta, ma
412 ; ZVFHMIN-NEXT:    vfncvt.f.f.w v8, v12
413 ; ZVFHMIN-NEXT:    ret
414   %elt.head = insertelement <16 x half> poison, half %b, i32 0
415   %vb = shufflevector <16 x half> %elt.head, <16 x half> poison, <16 x i32> zeroinitializer
416   %v = call <16 x half> @llvm.vp.fsub.v16f16(<16 x half> %va, <16 x half> %vb, <16 x i1> %m, i32 %evl)
417   ret <16 x half> %v
420 define <16 x half> @vfsub_vf_v16f16_unmasked(<16 x half> %va, half %b, i32 zeroext %evl) {
421 ; ZVFH-LABEL: vfsub_vf_v16f16_unmasked:
422 ; ZVFH:       # %bb.0:
423 ; ZVFH-NEXT:    vsetvli zero, a0, e16, m2, ta, ma
424 ; ZVFH-NEXT:    vfsub.vf v8, v8, fa0
425 ; ZVFH-NEXT:    ret
427 ; ZVFHMIN-LABEL: vfsub_vf_v16f16_unmasked:
428 ; ZVFHMIN:       # %bb.0:
429 ; ZVFHMIN-NEXT:    fcvt.s.h fa5, fa0
430 ; ZVFHMIN-NEXT:    vsetvli a1, zero, e32, m4, ta, ma
431 ; ZVFHMIN-NEXT:    vfmv.v.f v12, fa5
432 ; ZVFHMIN-NEXT:    vsetvli zero, zero, e16, m2, ta, ma
433 ; ZVFHMIN-NEXT:    vfncvt.f.f.w v10, v12
434 ; ZVFHMIN-NEXT:    vsetivli zero, 16, e16, m2, ta, ma
435 ; ZVFHMIN-NEXT:    vfwcvt.f.f.v v12, v8
436 ; ZVFHMIN-NEXT:    vfwcvt.f.f.v v16, v10
437 ; ZVFHMIN-NEXT:    vsetvli zero, a0, e32, m4, ta, ma
438 ; ZVFHMIN-NEXT:    vfsub.vv v12, v12, v16
439 ; ZVFHMIN-NEXT:    vsetivli zero, 16, e16, m2, ta, ma
440 ; ZVFHMIN-NEXT:    vfncvt.f.f.w v8, v12
441 ; ZVFHMIN-NEXT:    ret
442   %elt.head = insertelement <16 x half> poison, half %b, i32 0
443   %vb = shufflevector <16 x half> %elt.head, <16 x half> poison, <16 x i32> zeroinitializer
444   %head = insertelement <16 x i1> poison, i1 true, i32 0
445   %m = shufflevector <16 x i1> %head, <16 x i1> poison, <16 x i32> zeroinitializer
446   %v = call <16 x half> @llvm.vp.fsub.v16f16(<16 x half> %va, <16 x half> %vb, <16 x i1> %m, i32 %evl)
447   ret <16 x half> %v
450 declare <2 x float> @llvm.vp.fsub.v2f32(<2 x float>, <2 x float>, <2 x i1>, i32)
452 define <2 x float> @vfsub_vv_v2f32(<2 x float> %va, <2 x float> %b, <2 x i1> %m, i32 zeroext %evl) {
453 ; CHECK-LABEL: vfsub_vv_v2f32:
454 ; CHECK:       # %bb.0:
455 ; CHECK-NEXT:    vsetvli zero, a0, e32, mf2, ta, ma
456 ; CHECK-NEXT:    vfsub.vv v8, v8, v9, v0.t
457 ; CHECK-NEXT:    ret
458   %v = call <2 x float> @llvm.vp.fsub.v2f32(<2 x float> %va, <2 x float> %b, <2 x i1> %m, i32 %evl)
459   ret <2 x float> %v
462 define <2 x float> @vfsub_vv_v2f32_unmasked(<2 x float> %va, <2 x float> %b, i32 zeroext %evl) {
463 ; CHECK-LABEL: vfsub_vv_v2f32_unmasked:
464 ; CHECK:       # %bb.0:
465 ; CHECK-NEXT:    vsetvli zero, a0, e32, mf2, ta, ma
466 ; CHECK-NEXT:    vfsub.vv v8, v8, v9
467 ; CHECK-NEXT:    ret
468   %head = insertelement <2 x i1> poison, i1 true, i32 0
469   %m = shufflevector <2 x i1> %head, <2 x i1> poison, <2 x i32> zeroinitializer
470   %v = call <2 x float> @llvm.vp.fsub.v2f32(<2 x float> %va, <2 x float> %b, <2 x i1> %m, i32 %evl)
471   ret <2 x float> %v
474 define <2 x float> @vfsub_vf_v2f32(<2 x float> %va, float %b, <2 x i1> %m, i32 zeroext %evl) {
475 ; CHECK-LABEL: vfsub_vf_v2f32:
476 ; CHECK:       # %bb.0:
477 ; CHECK-NEXT:    vsetvli zero, a0, e32, mf2, ta, ma
478 ; CHECK-NEXT:    vfsub.vf v8, v8, fa0, v0.t
479 ; CHECK-NEXT:    ret
480   %elt.head = insertelement <2 x float> poison, float %b, i32 0
481   %vb = shufflevector <2 x float> %elt.head, <2 x float> poison, <2 x i32> zeroinitializer
482   %v = call <2 x float> @llvm.vp.fsub.v2f32(<2 x float> %va, <2 x float> %vb, <2 x i1> %m, i32 %evl)
483   ret <2 x float> %v
486 define <2 x float> @vfsub_vf_v2f32_unmasked(<2 x float> %va, float %b, i32 zeroext %evl) {
487 ; CHECK-LABEL: vfsub_vf_v2f32_unmasked:
488 ; CHECK:       # %bb.0:
489 ; CHECK-NEXT:    vsetvli zero, a0, e32, mf2, ta, ma
490 ; CHECK-NEXT:    vfsub.vf v8, v8, fa0
491 ; CHECK-NEXT:    ret
492   %elt.head = insertelement <2 x float> poison, float %b, i32 0
493   %vb = shufflevector <2 x float> %elt.head, <2 x float> poison, <2 x i32> zeroinitializer
494   %head = insertelement <2 x i1> poison, i1 true, i32 0
495   %m = shufflevector <2 x i1> %head, <2 x i1> poison, <2 x i32> zeroinitializer
496   %v = call <2 x float> @llvm.vp.fsub.v2f32(<2 x float> %va, <2 x float> %vb, <2 x i1> %m, i32 %evl)
497   ret <2 x float> %v
500 declare <4 x float> @llvm.vp.fsub.v4f32(<4 x float>, <4 x float>, <4 x i1>, i32)
502 define <4 x float> @vfsub_vv_v4f32(<4 x float> %va, <4 x float> %b, <4 x i1> %m, i32 zeroext %evl) {
503 ; CHECK-LABEL: vfsub_vv_v4f32:
504 ; CHECK:       # %bb.0:
505 ; CHECK-NEXT:    vsetvli zero, a0, e32, m1, ta, ma
506 ; CHECK-NEXT:    vfsub.vv v8, v8, v9, v0.t
507 ; CHECK-NEXT:    ret
508   %v = call <4 x float> @llvm.vp.fsub.v4f32(<4 x float> %va, <4 x float> %b, <4 x i1> %m, i32 %evl)
509   ret <4 x float> %v
512 define <4 x float> @vfsub_vv_v4f32_unmasked(<4 x float> %va, <4 x float> %b, i32 zeroext %evl) {
513 ; CHECK-LABEL: vfsub_vv_v4f32_unmasked:
514 ; CHECK:       # %bb.0:
515 ; CHECK-NEXT:    vsetvli zero, a0, e32, m1, ta, ma
516 ; CHECK-NEXT:    vfsub.vv v8, v8, v9
517 ; CHECK-NEXT:    ret
518   %head = insertelement <4 x i1> poison, i1 true, i32 0
519   %m = shufflevector <4 x i1> %head, <4 x i1> poison, <4 x i32> zeroinitializer
520   %v = call <4 x float> @llvm.vp.fsub.v4f32(<4 x float> %va, <4 x float> %b, <4 x i1> %m, i32 %evl)
521   ret <4 x float> %v
524 define <4 x float> @vfsub_vf_v4f32(<4 x float> %va, float %b, <4 x i1> %m, i32 zeroext %evl) {
525 ; CHECK-LABEL: vfsub_vf_v4f32:
526 ; CHECK:       # %bb.0:
527 ; CHECK-NEXT:    vsetvli zero, a0, e32, m1, ta, ma
528 ; CHECK-NEXT:    vfsub.vf v8, v8, fa0, v0.t
529 ; CHECK-NEXT:    ret
530   %elt.head = insertelement <4 x float> poison, float %b, i32 0
531   %vb = shufflevector <4 x float> %elt.head, <4 x float> poison, <4 x i32> zeroinitializer
532   %v = call <4 x float> @llvm.vp.fsub.v4f32(<4 x float> %va, <4 x float> %vb, <4 x i1> %m, i32 %evl)
533   ret <4 x float> %v
536 define <4 x float> @vfsub_vf_v4f32_unmasked(<4 x float> %va, float %b, i32 zeroext %evl) {
537 ; CHECK-LABEL: vfsub_vf_v4f32_unmasked:
538 ; CHECK:       # %bb.0:
539 ; CHECK-NEXT:    vsetvli zero, a0, e32, m1, ta, ma
540 ; CHECK-NEXT:    vfsub.vf v8, v8, fa0
541 ; CHECK-NEXT:    ret
542   %elt.head = insertelement <4 x float> poison, float %b, i32 0
543   %vb = shufflevector <4 x float> %elt.head, <4 x float> poison, <4 x i32> zeroinitializer
544   %head = insertelement <4 x i1> poison, i1 true, i32 0
545   %m = shufflevector <4 x i1> %head, <4 x i1> poison, <4 x i32> zeroinitializer
546   %v = call <4 x float> @llvm.vp.fsub.v4f32(<4 x float> %va, <4 x float> %vb, <4 x i1> %m, i32 %evl)
547   ret <4 x float> %v
550 declare <8 x float> @llvm.vp.fsub.v8f32(<8 x float>, <8 x float>, <8 x i1>, i32)
552 define <8 x float> @vfsub_vv_v8f32(<8 x float> %va, <8 x float> %b, <8 x i1> %m, i32 zeroext %evl) {
553 ; CHECK-LABEL: vfsub_vv_v8f32:
554 ; CHECK:       # %bb.0:
555 ; CHECK-NEXT:    vsetvli zero, a0, e32, m2, ta, ma
556 ; CHECK-NEXT:    vfsub.vv v8, v8, v10, v0.t
557 ; CHECK-NEXT:    ret
558   %v = call <8 x float> @llvm.vp.fsub.v8f32(<8 x float> %va, <8 x float> %b, <8 x i1> %m, i32 %evl)
559   ret <8 x float> %v
562 define <8 x float> @vfsub_vv_v8f32_unmasked(<8 x float> %va, <8 x float> %b, i32 zeroext %evl) {
563 ; CHECK-LABEL: vfsub_vv_v8f32_unmasked:
564 ; CHECK:       # %bb.0:
565 ; CHECK-NEXT:    vsetvli zero, a0, e32, m2, ta, ma
566 ; CHECK-NEXT:    vfsub.vv v8, v8, v10
567 ; CHECK-NEXT:    ret
568   %head = insertelement <8 x i1> poison, i1 true, i32 0
569   %m = shufflevector <8 x i1> %head, <8 x i1> poison, <8 x i32> zeroinitializer
570   %v = call <8 x float> @llvm.vp.fsub.v8f32(<8 x float> %va, <8 x float> %b, <8 x i1> %m, i32 %evl)
571   ret <8 x float> %v
574 define <8 x float> @vfsub_vf_v8f32(<8 x float> %va, float %b, <8 x i1> %m, i32 zeroext %evl) {
575 ; CHECK-LABEL: vfsub_vf_v8f32:
576 ; CHECK:       # %bb.0:
577 ; CHECK-NEXT:    vsetvli zero, a0, e32, m2, ta, ma
578 ; CHECK-NEXT:    vfsub.vf v8, v8, fa0, v0.t
579 ; CHECK-NEXT:    ret
580   %elt.head = insertelement <8 x float> poison, float %b, i32 0
581   %vb = shufflevector <8 x float> %elt.head, <8 x float> poison, <8 x i32> zeroinitializer
582   %v = call <8 x float> @llvm.vp.fsub.v8f32(<8 x float> %va, <8 x float> %vb, <8 x i1> %m, i32 %evl)
583   ret <8 x float> %v
586 define <8 x float> @vfsub_vf_v8f32_unmasked(<8 x float> %va, float %b, i32 zeroext %evl) {
587 ; CHECK-LABEL: vfsub_vf_v8f32_unmasked:
588 ; CHECK:       # %bb.0:
589 ; CHECK-NEXT:    vsetvli zero, a0, e32, m2, ta, ma
590 ; CHECK-NEXT:    vfsub.vf v8, v8, fa0
591 ; CHECK-NEXT:    ret
592   %elt.head = insertelement <8 x float> poison, float %b, i32 0
593   %vb = shufflevector <8 x float> %elt.head, <8 x float> poison, <8 x i32> zeroinitializer
594   %head = insertelement <8 x i1> poison, i1 true, i32 0
595   %m = shufflevector <8 x i1> %head, <8 x i1> poison, <8 x i32> zeroinitializer
596   %v = call <8 x float> @llvm.vp.fsub.v8f32(<8 x float> %va, <8 x float> %vb, <8 x i1> %m, i32 %evl)
597   ret <8 x float> %v
600 declare <16 x float> @llvm.vp.fsub.v16f32(<16 x float>, <16 x float>, <16 x i1>, i32)
602 define <16 x float> @vfsub_vv_v16f32(<16 x float> %va, <16 x float> %b, <16 x i1> %m, i32 zeroext %evl) {
603 ; CHECK-LABEL: vfsub_vv_v16f32:
604 ; CHECK:       # %bb.0:
605 ; CHECK-NEXT:    vsetvli zero, a0, e32, m4, ta, ma
606 ; CHECK-NEXT:    vfsub.vv v8, v8, v12, v0.t
607 ; CHECK-NEXT:    ret
608   %v = call <16 x float> @llvm.vp.fsub.v16f32(<16 x float> %va, <16 x float> %b, <16 x i1> %m, i32 %evl)
609   ret <16 x float> %v
612 define <16 x float> @vfsub_vv_v16f32_unmasked(<16 x float> %va, <16 x float> %b, i32 zeroext %evl) {
613 ; CHECK-LABEL: vfsub_vv_v16f32_unmasked:
614 ; CHECK:       # %bb.0:
615 ; CHECK-NEXT:    vsetvli zero, a0, e32, m4, ta, ma
616 ; CHECK-NEXT:    vfsub.vv v8, v8, v12
617 ; CHECK-NEXT:    ret
618   %head = insertelement <16 x i1> poison, i1 true, i32 0
619   %m = shufflevector <16 x i1> %head, <16 x i1> poison, <16 x i32> zeroinitializer
620   %v = call <16 x float> @llvm.vp.fsub.v16f32(<16 x float> %va, <16 x float> %b, <16 x i1> %m, i32 %evl)
621   ret <16 x float> %v
624 define <16 x float> @vfsub_vf_v16f32(<16 x float> %va, float %b, <16 x i1> %m, i32 zeroext %evl) {
625 ; CHECK-LABEL: vfsub_vf_v16f32:
626 ; CHECK:       # %bb.0:
627 ; CHECK-NEXT:    vsetvli zero, a0, e32, m4, ta, ma
628 ; CHECK-NEXT:    vfsub.vf v8, v8, fa0, v0.t
629 ; CHECK-NEXT:    ret
630   %elt.head = insertelement <16 x float> poison, float %b, i32 0
631   %vb = shufflevector <16 x float> %elt.head, <16 x float> poison, <16 x i32> zeroinitializer
632   %v = call <16 x float> @llvm.vp.fsub.v16f32(<16 x float> %va, <16 x float> %vb, <16 x i1> %m, i32 %evl)
633   ret <16 x float> %v
636 define <16 x float> @vfsub_vf_v16f32_unmasked(<16 x float> %va, float %b, i32 zeroext %evl) {
637 ; CHECK-LABEL: vfsub_vf_v16f32_unmasked:
638 ; CHECK:       # %bb.0:
639 ; CHECK-NEXT:    vsetvli zero, a0, e32, m4, ta, ma
640 ; CHECK-NEXT:    vfsub.vf v8, v8, fa0
641 ; CHECK-NEXT:    ret
642   %elt.head = insertelement <16 x float> poison, float %b, i32 0
643   %vb = shufflevector <16 x float> %elt.head, <16 x float> poison, <16 x i32> zeroinitializer
644   %head = insertelement <16 x i1> poison, i1 true, i32 0
645   %m = shufflevector <16 x i1> %head, <16 x i1> poison, <16 x i32> zeroinitializer
646   %v = call <16 x float> @llvm.vp.fsub.v16f32(<16 x float> %va, <16 x float> %vb, <16 x i1> %m, i32 %evl)
647   ret <16 x float> %v
650 declare <2 x double> @llvm.vp.fsub.v2f64(<2 x double>, <2 x double>, <2 x i1>, i32)
652 define <2 x double> @vfsub_vv_v2f64(<2 x double> %va, <2 x double> %b, <2 x i1> %m, i32 zeroext %evl) {
653 ; CHECK-LABEL: vfsub_vv_v2f64:
654 ; CHECK:       # %bb.0:
655 ; CHECK-NEXT:    vsetvli zero, a0, e64, m1, ta, ma
656 ; CHECK-NEXT:    vfsub.vv v8, v8, v9, v0.t
657 ; CHECK-NEXT:    ret
658   %v = call <2 x double> @llvm.vp.fsub.v2f64(<2 x double> %va, <2 x double> %b, <2 x i1> %m, i32 %evl)
659   ret <2 x double> %v
662 define <2 x double> @vfsub_vv_v2f64_unmasked(<2 x double> %va, <2 x double> %b, i32 zeroext %evl) {
663 ; CHECK-LABEL: vfsub_vv_v2f64_unmasked:
664 ; CHECK:       # %bb.0:
665 ; CHECK-NEXT:    vsetvli zero, a0, e64, m1, ta, ma
666 ; CHECK-NEXT:    vfsub.vv v8, v8, v9
667 ; CHECK-NEXT:    ret
668   %head = insertelement <2 x i1> poison, i1 true, i32 0
669   %m = shufflevector <2 x i1> %head, <2 x i1> poison, <2 x i32> zeroinitializer
670   %v = call <2 x double> @llvm.vp.fsub.v2f64(<2 x double> %va, <2 x double> %b, <2 x i1> %m, i32 %evl)
671   ret <2 x double> %v
674 define <2 x double> @vfsub_vf_v2f64(<2 x double> %va, double %b, <2 x i1> %m, i32 zeroext %evl) {
675 ; CHECK-LABEL: vfsub_vf_v2f64:
676 ; CHECK:       # %bb.0:
677 ; CHECK-NEXT:    vsetvli zero, a0, e64, m1, ta, ma
678 ; CHECK-NEXT:    vfsub.vf v8, v8, fa0, v0.t
679 ; CHECK-NEXT:    ret
680   %elt.head = insertelement <2 x double> poison, double %b, i32 0
681   %vb = shufflevector <2 x double> %elt.head, <2 x double> poison, <2 x i32> zeroinitializer
682   %v = call <2 x double> @llvm.vp.fsub.v2f64(<2 x double> %va, <2 x double> %vb, <2 x i1> %m, i32 %evl)
683   ret <2 x double> %v
686 define <2 x double> @vfsub_vf_v2f64_unmasked(<2 x double> %va, double %b, i32 zeroext %evl) {
687 ; CHECK-LABEL: vfsub_vf_v2f64_unmasked:
688 ; CHECK:       # %bb.0:
689 ; CHECK-NEXT:    vsetvli zero, a0, e64, m1, ta, ma
690 ; CHECK-NEXT:    vfsub.vf v8, v8, fa0
691 ; CHECK-NEXT:    ret
692   %elt.head = insertelement <2 x double> poison, double %b, i32 0
693   %vb = shufflevector <2 x double> %elt.head, <2 x double> poison, <2 x i32> zeroinitializer
694   %head = insertelement <2 x i1> poison, i1 true, i32 0
695   %m = shufflevector <2 x i1> %head, <2 x i1> poison, <2 x i32> zeroinitializer
696   %v = call <2 x double> @llvm.vp.fsub.v2f64(<2 x double> %va, <2 x double> %vb, <2 x i1> %m, i32 %evl)
697   ret <2 x double> %v
700 declare <4 x double> @llvm.vp.fsub.v4f64(<4 x double>, <4 x double>, <4 x i1>, i32)
702 define <4 x double> @vfsub_vv_v4f64(<4 x double> %va, <4 x double> %b, <4 x i1> %m, i32 zeroext %evl) {
703 ; CHECK-LABEL: vfsub_vv_v4f64:
704 ; CHECK:       # %bb.0:
705 ; CHECK-NEXT:    vsetvli zero, a0, e64, m2, ta, ma
706 ; CHECK-NEXT:    vfsub.vv v8, v8, v10, v0.t
707 ; CHECK-NEXT:    ret
708   %v = call <4 x double> @llvm.vp.fsub.v4f64(<4 x double> %va, <4 x double> %b, <4 x i1> %m, i32 %evl)
709   ret <4 x double> %v
712 define <4 x double> @vfsub_vv_v4f64_unmasked(<4 x double> %va, <4 x double> %b, i32 zeroext %evl) {
713 ; CHECK-LABEL: vfsub_vv_v4f64_unmasked:
714 ; CHECK:       # %bb.0:
715 ; CHECK-NEXT:    vsetvli zero, a0, e64, m2, ta, ma
716 ; CHECK-NEXT:    vfsub.vv v8, v8, v10
717 ; CHECK-NEXT:    ret
718   %head = insertelement <4 x i1> poison, i1 true, i32 0
719   %m = shufflevector <4 x i1> %head, <4 x i1> poison, <4 x i32> zeroinitializer
720   %v = call <4 x double> @llvm.vp.fsub.v4f64(<4 x double> %va, <4 x double> %b, <4 x i1> %m, i32 %evl)
721   ret <4 x double> %v
724 define <4 x double> @vfsub_vf_v4f64(<4 x double> %va, double %b, <4 x i1> %m, i32 zeroext %evl) {
725 ; CHECK-LABEL: vfsub_vf_v4f64:
726 ; CHECK:       # %bb.0:
727 ; CHECK-NEXT:    vsetvli zero, a0, e64, m2, ta, ma
728 ; CHECK-NEXT:    vfsub.vf v8, v8, fa0, v0.t
729 ; CHECK-NEXT:    ret
730   %elt.head = insertelement <4 x double> poison, double %b, i32 0
731   %vb = shufflevector <4 x double> %elt.head, <4 x double> poison, <4 x i32> zeroinitializer
732   %v = call <4 x double> @llvm.vp.fsub.v4f64(<4 x double> %va, <4 x double> %vb, <4 x i1> %m, i32 %evl)
733   ret <4 x double> %v
736 define <4 x double> @vfsub_vf_v4f64_unmasked(<4 x double> %va, double %b, i32 zeroext %evl) {
737 ; CHECK-LABEL: vfsub_vf_v4f64_unmasked:
738 ; CHECK:       # %bb.0:
739 ; CHECK-NEXT:    vsetvli zero, a0, e64, m2, ta, ma
740 ; CHECK-NEXT:    vfsub.vf v8, v8, fa0
741 ; CHECK-NEXT:    ret
742   %elt.head = insertelement <4 x double> poison, double %b, i32 0
743   %vb = shufflevector <4 x double> %elt.head, <4 x double> poison, <4 x i32> zeroinitializer
744   %head = insertelement <4 x i1> poison, i1 true, i32 0
745   %m = shufflevector <4 x i1> %head, <4 x i1> poison, <4 x i32> zeroinitializer
746   %v = call <4 x double> @llvm.vp.fsub.v4f64(<4 x double> %va, <4 x double> %vb, <4 x i1> %m, i32 %evl)
747   ret <4 x double> %v
750 declare <8 x double> @llvm.vp.fsub.v8f64(<8 x double>, <8 x double>, <8 x i1>, i32)
752 define <8 x double> @vfsub_vv_v8f64(<8 x double> %va, <8 x double> %b, <8 x i1> %m, i32 zeroext %evl) {
753 ; CHECK-LABEL: vfsub_vv_v8f64:
754 ; CHECK:       # %bb.0:
755 ; CHECK-NEXT:    vsetvli zero, a0, e64, m4, ta, ma
756 ; CHECK-NEXT:    vfsub.vv v8, v8, v12, v0.t
757 ; CHECK-NEXT:    ret
758   %v = call <8 x double> @llvm.vp.fsub.v8f64(<8 x double> %va, <8 x double> %b, <8 x i1> %m, i32 %evl)
759   ret <8 x double> %v
762 define <8 x double> @vfsub_vv_v8f64_unmasked(<8 x double> %va, <8 x double> %b, i32 zeroext %evl) {
763 ; CHECK-LABEL: vfsub_vv_v8f64_unmasked:
764 ; CHECK:       # %bb.0:
765 ; CHECK-NEXT:    vsetvli zero, a0, e64, m4, ta, ma
766 ; CHECK-NEXT:    vfsub.vv v8, v8, v12
767 ; CHECK-NEXT:    ret
768   %head = insertelement <8 x i1> poison, i1 true, i32 0
769   %m = shufflevector <8 x i1> %head, <8 x i1> poison, <8 x i32> zeroinitializer
770   %v = call <8 x double> @llvm.vp.fsub.v8f64(<8 x double> %va, <8 x double> %b, <8 x i1> %m, i32 %evl)
771   ret <8 x double> %v
774 define <8 x double> @vfsub_vf_v8f64(<8 x double> %va, double %b, <8 x i1> %m, i32 zeroext %evl) {
775 ; CHECK-LABEL: vfsub_vf_v8f64:
776 ; CHECK:       # %bb.0:
777 ; CHECK-NEXT:    vsetvli zero, a0, e64, m4, ta, ma
778 ; CHECK-NEXT:    vfsub.vf v8, v8, fa0, v0.t
779 ; CHECK-NEXT:    ret
780   %elt.head = insertelement <8 x double> poison, double %b, i32 0
781   %vb = shufflevector <8 x double> %elt.head, <8 x double> poison, <8 x i32> zeroinitializer
782   %v = call <8 x double> @llvm.vp.fsub.v8f64(<8 x double> %va, <8 x double> %vb, <8 x i1> %m, i32 %evl)
783   ret <8 x double> %v
786 define <8 x double> @vfsub_vf_v8f64_unmasked(<8 x double> %va, double %b, i32 zeroext %evl) {
787 ; CHECK-LABEL: vfsub_vf_v8f64_unmasked:
788 ; CHECK:       # %bb.0:
789 ; CHECK-NEXT:    vsetvli zero, a0, e64, m4, ta, ma
790 ; CHECK-NEXT:    vfsub.vf v8, v8, fa0
791 ; CHECK-NEXT:    ret
792   %elt.head = insertelement <8 x double> poison, double %b, i32 0
793   %vb = shufflevector <8 x double> %elt.head, <8 x double> poison, <8 x i32> zeroinitializer
794   %head = insertelement <8 x i1> poison, i1 true, i32 0
795   %m = shufflevector <8 x i1> %head, <8 x i1> poison, <8 x i32> zeroinitializer
796   %v = call <8 x double> @llvm.vp.fsub.v8f64(<8 x double> %va, <8 x double> %vb, <8 x i1> %m, i32 %evl)
797   ret <8 x double> %v
800 declare <16 x double> @llvm.vp.fsub.v16f64(<16 x double>, <16 x double>, <16 x i1>, i32)
802 define <16 x double> @vfsub_vv_v16f64(<16 x double> %va, <16 x double> %b, <16 x i1> %m, i32 zeroext %evl) {
803 ; CHECK-LABEL: vfsub_vv_v16f64:
804 ; CHECK:       # %bb.0:
805 ; CHECK-NEXT:    vsetvli zero, a0, e64, m8, ta, ma
806 ; CHECK-NEXT:    vfsub.vv v8, v8, v16, v0.t
807 ; CHECK-NEXT:    ret
808   %v = call <16 x double> @llvm.vp.fsub.v16f64(<16 x double> %va, <16 x double> %b, <16 x i1> %m, i32 %evl)
809   ret <16 x double> %v
812 define <16 x double> @vfsub_vv_v16f64_unmasked(<16 x double> %va, <16 x double> %b, i32 zeroext %evl) {
813 ; CHECK-LABEL: vfsub_vv_v16f64_unmasked:
814 ; CHECK:       # %bb.0:
815 ; CHECK-NEXT:    vsetvli zero, a0, e64, m8, ta, ma
816 ; CHECK-NEXT:    vfsub.vv v8, v8, v16
817 ; CHECK-NEXT:    ret
818   %head = insertelement <16 x i1> poison, i1 true, i32 0
819   %m = shufflevector <16 x i1> %head, <16 x i1> poison, <16 x i32> zeroinitializer
820   %v = call <16 x double> @llvm.vp.fsub.v16f64(<16 x double> %va, <16 x double> %b, <16 x i1> %m, i32 %evl)
821   ret <16 x double> %v
824 define <16 x double> @vfsub_vf_v16f64(<16 x double> %va, double %b, <16 x i1> %m, i32 zeroext %evl) {
825 ; CHECK-LABEL: vfsub_vf_v16f64:
826 ; CHECK:       # %bb.0:
827 ; CHECK-NEXT:    vsetvli zero, a0, e64, m8, ta, ma
828 ; CHECK-NEXT:    vfsub.vf v8, v8, fa0, v0.t
829 ; CHECK-NEXT:    ret
830   %elt.head = insertelement <16 x double> poison, double %b, i32 0
831   %vb = shufflevector <16 x double> %elt.head, <16 x double> poison, <16 x i32> zeroinitializer
832   %v = call <16 x double> @llvm.vp.fsub.v16f64(<16 x double> %va, <16 x double> %vb, <16 x i1> %m, i32 %evl)
833   ret <16 x double> %v
836 define <16 x double> @vfsub_vf_v16f64_unmasked(<16 x double> %va, double %b, i32 zeroext %evl) {
837 ; CHECK-LABEL: vfsub_vf_v16f64_unmasked:
838 ; CHECK:       # %bb.0:
839 ; CHECK-NEXT:    vsetvli zero, a0, e64, m8, ta, ma
840 ; CHECK-NEXT:    vfsub.vf v8, v8, fa0
841 ; CHECK-NEXT:    ret
842   %elt.head = insertelement <16 x double> poison, double %b, i32 0
843   %vb = shufflevector <16 x double> %elt.head, <16 x double> poison, <16 x i32> zeroinitializer
844   %head = insertelement <16 x i1> poison, i1 true, i32 0
845   %m = shufflevector <16 x i1> %head, <16 x i1> poison, <16 x i32> zeroinitializer
846   %v = call <16 x double> @llvm.vp.fsub.v16f64(<16 x double> %va, <16 x double> %vb, <16 x i1> %m, i32 %evl)
847   ret <16 x double> %v