Run DCE after a LoopFlatten test to reduce spurious output [nfc]
[llvm-project.git] / llvm / test / CodeGen / RISCV / rvv / vfmacc-vp.ll
blob6f1b3986caafead0c413e4880848bd72b5a2c6f9
1 ; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
2 ; RUN: llc -mtriple=riscv32 -mattr=+d,+zfh,+zvfh,+v,+m -target-abi=ilp32d \
3 ; RUN:     -verify-machineinstrs < %s | FileCheck %s
4 ; RUN: llc -mtriple=riscv64 -mattr=+d,+zfh,+zvfh,+v,+m -target-abi=lp64d \
5 ; RUN:     -verify-machineinstrs < %s | FileCheck %s
7 declare <vscale x 1 x half> @llvm.vp.fma.nxv1f16(<vscale x 1 x half>, <vscale x 1 x half>, <vscale x 1 x half>, <vscale x 1 x i1>, i32)
8 declare <vscale x 1 x half> @llvm.vp.fneg.nxv1f16(<vscale x 1 x half>, <vscale x 1 x i1>, i32)
9 declare <vscale x 1 x half> @llvm.vp.merge.nxv1f16(<vscale x 1 x i1>, <vscale x 1 x half>, <vscale x 1 x half>, i32)
10 declare <vscale x 1 x half> @llvm.vp.select.nxv1f16(<vscale x 1 x i1>, <vscale x 1 x half>, <vscale x 1 x half>, i32)
12 define <vscale x 1 x half> @vfmacc_vv_nxv1f16(<vscale x 1 x half> %a, <vscale x 1 x half> %b, <vscale x 1 x half> %c, <vscale x 1 x i1> %m, i32 zeroext %evl) {
13 ; CHECK-LABEL: vfmacc_vv_nxv1f16:
14 ; CHECK:       # %bb.0:
15 ; CHECK-NEXT:    vsetvli zero, a0, e16, mf4, tu, mu
16 ; CHECK-NEXT:    vfmacc.vv v10, v8, v9, v0.t
17 ; CHECK-NEXT:    vmv1r.v v8, v10
18 ; CHECK-NEXT:    ret
19   %splat = insertelement <vscale x 1 x i1> poison, i1 -1, i32 0
20   %allones = shufflevector <vscale x 1 x i1> %splat, <vscale x 1 x i1> poison, <vscale x 1 x i32> zeroinitializer
21   %v = call <vscale x 1 x half> @llvm.vp.fma.nxv1f16(<vscale x 1 x half> %a, <vscale x 1 x half> %b, <vscale x 1 x half> %c, <vscale x 1 x i1> %allones, i32 %evl)
22   %u = call <vscale x 1 x half> @llvm.vp.merge.nxv1f16(<vscale x 1 x i1> %m, <vscale x 1 x half> %v, <vscale x 1 x half> %c, i32 %evl)
23   ret <vscale x 1 x half> %u
26 define <vscale x 1 x half> @vfmacc_vv_nxv1f16_unmasked(<vscale x 1 x half> %a, <vscale x 1 x half> %b, <vscale x 1 x half> %c, <vscale x 1 x i1> %m, i32 zeroext %evl) {
27 ; CHECK-LABEL: vfmacc_vv_nxv1f16_unmasked:
28 ; CHECK:       # %bb.0:
29 ; CHECK-NEXT:    vsetvli zero, a0, e16, mf4, tu, ma
30 ; CHECK-NEXT:    vfmacc.vv v10, v8, v9
31 ; CHECK-NEXT:    vmv1r.v v8, v10
32 ; CHECK-NEXT:    ret
33   %splat = insertelement <vscale x 1 x i1> poison, i1 -1, i32 0
34   %allones = shufflevector <vscale x 1 x i1> %splat, <vscale x 1 x i1> poison, <vscale x 1 x i32> zeroinitializer
35   %v = call <vscale x 1 x half> @llvm.vp.fma.nxv1f16(<vscale x 1 x half> %a, <vscale x 1 x half> %b, <vscale x 1 x half> %c, <vscale x 1 x i1> %allones, i32 %evl)
36   %u = call <vscale x 1 x half> @llvm.vp.merge.nxv1f16(<vscale x 1 x i1> %allones, <vscale x 1 x half> %v, <vscale x 1 x half> %c, i32 %evl)
37   ret <vscale x 1 x half> %u
40 define <vscale x 1 x half> @vfmacc_vf_nxv1f16(<vscale x 1 x half> %va, half %b, <vscale x 1 x half> %c, <vscale x 1 x i1> %m, i32 zeroext %evl) {
41 ; CHECK-LABEL: vfmacc_vf_nxv1f16:
42 ; CHECK:       # %bb.0:
43 ; CHECK-NEXT:    vsetvli zero, a0, e16, mf4, tu, mu
44 ; CHECK-NEXT:    vfmacc.vf v9, fa0, v8, v0.t
45 ; CHECK-NEXT:    vmv1r.v v8, v9
46 ; CHECK-NEXT:    ret
47   %elt.head = insertelement <vscale x 1 x half> poison, half %b, i32 0
48   %vb = shufflevector <vscale x 1 x half> %elt.head, <vscale x 1 x half> poison, <vscale x 1 x i32> zeroinitializer
49   %splat = insertelement <vscale x 1 x i1> poison, i1 -1, i32 0
50   %allones = shufflevector <vscale x 1 x i1> %splat, <vscale x 1 x i1> poison, <vscale x 1 x i32> zeroinitializer
51   %v = call <vscale x 1 x half> @llvm.vp.fma.nxv1f16(<vscale x 1 x half> %va, <vscale x 1 x half> %vb, <vscale x 1 x half> %c, <vscale x 1 x i1> %allones, i32 %evl)
52   %u = call <vscale x 1 x half> @llvm.vp.merge.nxv1f16(<vscale x 1 x i1> %m, <vscale x 1 x half> %v, <vscale x 1 x half> %c, i32 %evl)
53   ret <vscale x 1 x half> %u
56 define <vscale x 1 x half> @vfmacc_vf_nxv1f16_commute(<vscale x 1 x half> %va, half %b, <vscale x 1 x half> %c, <vscale x 1 x i1> %m, i32 zeroext %evl) {
57 ; CHECK-LABEL: vfmacc_vf_nxv1f16_commute:
58 ; CHECK:       # %bb.0:
59 ; CHECK-NEXT:    vsetvli zero, a0, e16, mf4, tu, mu
60 ; CHECK-NEXT:    vfmacc.vf v9, fa0, v8, v0.t
61 ; CHECK-NEXT:    vmv1r.v v8, v9
62 ; CHECK-NEXT:    ret
63   %elt.head = insertelement <vscale x 1 x half> poison, half %b, i32 0
64   %vb = shufflevector <vscale x 1 x half> %elt.head, <vscale x 1 x half> poison, <vscale x 1 x i32> zeroinitializer
65   %splat = insertelement <vscale x 1 x i1> poison, i1 -1, i32 0
66   %allones = shufflevector <vscale x 1 x i1> %splat, <vscale x 1 x i1> poison, <vscale x 1 x i32> zeroinitializer
67   %v = call <vscale x 1 x half> @llvm.vp.fma.nxv1f16(<vscale x 1 x half> %vb, <vscale x 1 x half> %va, <vscale x 1 x half> %c, <vscale x 1 x i1> %allones, i32 %evl)
68   %u = call <vscale x 1 x half> @llvm.vp.merge.nxv1f16(<vscale x 1 x i1> %m, <vscale x 1 x half> %v, <vscale x 1 x half> %c, i32 %evl)
69   ret <vscale x 1 x half> %u
72 define <vscale x 1 x half> @vfmacc_vf_nxv1f16_unmasked(<vscale x 1 x half> %va, half %b, <vscale x 1 x half> %c, i32 zeroext %evl) {
73 ; CHECK-LABEL: vfmacc_vf_nxv1f16_unmasked:
74 ; CHECK:       # %bb.0:
75 ; CHECK-NEXT:    vsetvli zero, a0, e16, mf4, tu, ma
76 ; CHECK-NEXT:    vfmacc.vf v9, fa0, v8
77 ; CHECK-NEXT:    vmv1r.v v8, v9
78 ; CHECK-NEXT:    ret
79   %elt.head = insertelement <vscale x 1 x half> poison, half %b, i32 0
80   %vb = shufflevector <vscale x 1 x half> %elt.head, <vscale x 1 x half> poison, <vscale x 1 x i32> zeroinitializer
81   %splat = insertelement <vscale x 1 x i1> poison, i1 -1, i32 0
82   %allones = shufflevector <vscale x 1 x i1> %splat, <vscale x 1 x i1> poison, <vscale x 1 x i32> zeroinitializer
83   %v = call <vscale x 1 x half> @llvm.vp.fma.nxv1f16(<vscale x 1 x half> %va, <vscale x 1 x half> %vb, <vscale x 1 x half> %c, <vscale x 1 x i1> %allones, i32 %evl)
84   %u = call <vscale x 1 x half> @llvm.vp.merge.nxv1f16(<vscale x 1 x i1> %allones, <vscale x 1 x half> %v, <vscale x 1 x half> %c, i32 %evl)
85   ret <vscale x 1 x half> %u
88 define <vscale x 1 x half> @vfmacc_vv_nxv1f16_ta(<vscale x 1 x half> %a, <vscale x 1 x half> %b, <vscale x 1 x half> %c, <vscale x 1 x i1> %m, i32 zeroext %evl) {
89 ; CHECK-LABEL: vfmacc_vv_nxv1f16_ta:
90 ; CHECK:       # %bb.0:
91 ; CHECK-NEXT:    vsetvli zero, a0, e16, mf4, ta, mu
92 ; CHECK-NEXT:    vfmacc.vv v10, v8, v9, v0.t
93 ; CHECK-NEXT:    vmv1r.v v8, v10
94 ; CHECK-NEXT:    ret
95   %splat = insertelement <vscale x 1 x i1> poison, i1 -1, i32 0
96   %allones = shufflevector <vscale x 1 x i1> %splat, <vscale x 1 x i1> poison, <vscale x 1 x i32> zeroinitializer
97   %v = call <vscale x 1 x half> @llvm.vp.fma.nxv1f16(<vscale x 1 x half> %a, <vscale x 1 x half> %b, <vscale x 1 x half> %c, <vscale x 1 x i1> %allones, i32 %evl)
98   %u = call <vscale x 1 x half> @llvm.vp.select.nxv1f16(<vscale x 1 x i1> %m, <vscale x 1 x half> %v, <vscale x 1 x half> %c, i32 %evl)
99   ret <vscale x 1 x half> %u
102 define <vscale x 1 x half> @vfmacc_vf_nxv1f16_ta(<vscale x 1 x half> %va, half %b, <vscale x 1 x half> %c, <vscale x 1 x i1> %m, i32 zeroext %evl) {
103 ; CHECK-LABEL: vfmacc_vf_nxv1f16_ta:
104 ; CHECK:       # %bb.0:
105 ; CHECK-NEXT:    vsetvli zero, a0, e16, mf4, ta, mu
106 ; CHECK-NEXT:    vfmacc.vf v9, fa0, v8, v0.t
107 ; CHECK-NEXT:    vmv1r.v v8, v9
108 ; CHECK-NEXT:    ret
109   %elt.head = insertelement <vscale x 1 x half> poison, half %b, i32 0
110   %vb = shufflevector <vscale x 1 x half> %elt.head, <vscale x 1 x half> poison, <vscale x 1 x i32> zeroinitializer
111   %splat = insertelement <vscale x 1 x i1> poison, i1 -1, i32 0
112   %allones = shufflevector <vscale x 1 x i1> %splat, <vscale x 1 x i1> poison, <vscale x 1 x i32> zeroinitializer
113   %v = call <vscale x 1 x half> @llvm.vp.fma.nxv1f16(<vscale x 1 x half> %va, <vscale x 1 x half> %vb, <vscale x 1 x half> %c, <vscale x 1 x i1> %allones, i32 %evl)
114   %u = call <vscale x 1 x half> @llvm.vp.select.nxv1f16(<vscale x 1 x i1> %m, <vscale x 1 x half> %v, <vscale x 1 x half> %c, i32 %evl)
115   ret <vscale x 1 x half> %u
118 define <vscale x 1 x half> @vfmacc_vf_nxv1f16_commute_ta(<vscale x 1 x half> %va, half %b, <vscale x 1 x half> %c, <vscale x 1 x i1> %m, i32 zeroext %evl) {
119 ; CHECK-LABEL: vfmacc_vf_nxv1f16_commute_ta:
120 ; CHECK:       # %bb.0:
121 ; CHECK-NEXT:    vsetvli zero, a0, e16, mf4, ta, mu
122 ; CHECK-NEXT:    vfmacc.vf v9, fa0, v8, v0.t
123 ; CHECK-NEXT:    vmv1r.v v8, v9
124 ; CHECK-NEXT:    ret
125   %elt.head = insertelement <vscale x 1 x half> poison, half %b, i32 0
126   %vb = shufflevector <vscale x 1 x half> %elt.head, <vscale x 1 x half> poison, <vscale x 1 x i32> zeroinitializer
127   %splat = insertelement <vscale x 1 x i1> poison, i1 -1, i32 0
128   %allones = shufflevector <vscale x 1 x i1> %splat, <vscale x 1 x i1> poison, <vscale x 1 x i32> zeroinitializer
129   %v = call <vscale x 1 x half> @llvm.vp.fma.nxv1f16(<vscale x 1 x half> %vb, <vscale x 1 x half> %va, <vscale x 1 x half> %c, <vscale x 1 x i1> %allones, i32 %evl)
130   %u = call <vscale x 1 x half> @llvm.vp.select.nxv1f16(<vscale x 1 x i1> %m, <vscale x 1 x half> %v, <vscale x 1 x half> %c, i32 %evl)
131   ret <vscale x 1 x half> %u
134 declare <vscale x 2 x half> @llvm.vp.fma.nxv2f16(<vscale x 2 x half>, <vscale x 2 x half>, <vscale x 2 x half>, <vscale x 2 x i1>, i32)
135 declare <vscale x 2 x half> @llvm.vp.fneg.nxv2f16(<vscale x 2 x half>, <vscale x 2 x i1>, i32)
136 declare <vscale x 2 x half> @llvm.vp.merge.nxv2f16(<vscale x 2 x i1>, <vscale x 2 x half>, <vscale x 2 x half>, i32)
137 declare <vscale x 2 x half> @llvm.vp.select.nxv2f16(<vscale x 2 x i1>, <vscale x 2 x half>, <vscale x 2 x half>, i32)
139 define <vscale x 2 x half> @vfmacc_vv_nxv2f16(<vscale x 2 x half> %a, <vscale x 2 x half> %b, <vscale x 2 x half> %c, <vscale x 2 x i1> %m, i32 zeroext %evl) {
140 ; CHECK-LABEL: vfmacc_vv_nxv2f16:
141 ; CHECK:       # %bb.0:
142 ; CHECK-NEXT:    vsetvli zero, a0, e16, mf2, tu, mu
143 ; CHECK-NEXT:    vfmacc.vv v10, v8, v9, v0.t
144 ; CHECK-NEXT:    vmv1r.v v8, v10
145 ; CHECK-NEXT:    ret
146   %splat = insertelement <vscale x 2 x i1> poison, i1 -1, i32 0
147   %allones = shufflevector <vscale x 2 x i1> %splat, <vscale x 2 x i1> poison, <vscale x 2 x i32> zeroinitializer
148   %v = call <vscale x 2 x half> @llvm.vp.fma.nxv2f16(<vscale x 2 x half> %a, <vscale x 2 x half> %b, <vscale x 2 x half> %c, <vscale x 2 x i1> %allones, i32 %evl)
149   %u = call <vscale x 2 x half> @llvm.vp.merge.nxv2f16(<vscale x 2 x i1> %m, <vscale x 2 x half> %v, <vscale x 2 x half> %c, i32 %evl)
150   ret <vscale x 2 x half> %u
153 define <vscale x 2 x half> @vfmacc_vv_nxv2f16_unmasked(<vscale x 2 x half> %a, <vscale x 2 x half> %b, <vscale x 2 x half> %c, <vscale x 2 x i1> %m, i32 zeroext %evl) {
154 ; CHECK-LABEL: vfmacc_vv_nxv2f16_unmasked:
155 ; CHECK:       # %bb.0:
156 ; CHECK-NEXT:    vsetvli zero, a0, e16, mf2, tu, ma
157 ; CHECK-NEXT:    vfmacc.vv v10, v8, v9
158 ; CHECK-NEXT:    vmv1r.v v8, v10
159 ; CHECK-NEXT:    ret
160   %splat = insertelement <vscale x 2 x i1> poison, i1 -1, i32 0
161   %allones = shufflevector <vscale x 2 x i1> %splat, <vscale x 2 x i1> poison, <vscale x 2 x i32> zeroinitializer
162   %v = call <vscale x 2 x half> @llvm.vp.fma.nxv2f16(<vscale x 2 x half> %a, <vscale x 2 x half> %b, <vscale x 2 x half> %c, <vscale x 2 x i1> %allones, i32 %evl)
163   %u = call <vscale x 2 x half> @llvm.vp.merge.nxv2f16(<vscale x 2 x i1> %allones, <vscale x 2 x half> %v, <vscale x 2 x half> %c, i32 %evl)
164   ret <vscale x 2 x half> %u
167 define <vscale x 2 x half> @vfmacc_vf_nxv2f16(<vscale x 2 x half> %va, half %b, <vscale x 2 x half> %c, <vscale x 2 x i1> %m, i32 zeroext %evl) {
168 ; CHECK-LABEL: vfmacc_vf_nxv2f16:
169 ; CHECK:       # %bb.0:
170 ; CHECK-NEXT:    vsetvli zero, a0, e16, mf2, tu, mu
171 ; CHECK-NEXT:    vfmacc.vf v9, fa0, v8, v0.t
172 ; CHECK-NEXT:    vmv1r.v v8, v9
173 ; CHECK-NEXT:    ret
174   %elt.head = insertelement <vscale x 2 x half> poison, half %b, i32 0
175   %vb = shufflevector <vscale x 2 x half> %elt.head, <vscale x 2 x half> poison, <vscale x 2 x i32> zeroinitializer
176   %splat = insertelement <vscale x 2 x i1> poison, i1 -1, i32 0
177   %allones = shufflevector <vscale x 2 x i1> %splat, <vscale x 2 x i1> poison, <vscale x 2 x i32> zeroinitializer
178   %v = call <vscale x 2 x half> @llvm.vp.fma.nxv2f16(<vscale x 2 x half> %va, <vscale x 2 x half> %vb, <vscale x 2 x half> %c, <vscale x 2 x i1> %allones, i32 %evl)
179   %u = call <vscale x 2 x half> @llvm.vp.merge.nxv2f16(<vscale x 2 x i1> %m, <vscale x 2 x half> %v, <vscale x 2 x half> %c, i32 %evl)
180   ret <vscale x 2 x half> %u
183 define <vscale x 2 x half> @vfmacc_vf_nxv2f16_commute(<vscale x 2 x half> %va, half %b, <vscale x 2 x half> %c, <vscale x 2 x i1> %m, i32 zeroext %evl) {
184 ; CHECK-LABEL: vfmacc_vf_nxv2f16_commute:
185 ; CHECK:       # %bb.0:
186 ; CHECK-NEXT:    vsetvli zero, a0, e16, mf2, tu, mu
187 ; CHECK-NEXT:    vfmacc.vf v9, fa0, v8, v0.t
188 ; CHECK-NEXT:    vmv1r.v v8, v9
189 ; CHECK-NEXT:    ret
190   %elt.head = insertelement <vscale x 2 x half> poison, half %b, i32 0
191   %vb = shufflevector <vscale x 2 x half> %elt.head, <vscale x 2 x half> poison, <vscale x 2 x i32> zeroinitializer
192   %splat = insertelement <vscale x 2 x i1> poison, i1 -1, i32 0
193   %allones = shufflevector <vscale x 2 x i1> %splat, <vscale x 2 x i1> poison, <vscale x 2 x i32> zeroinitializer
194   %v = call <vscale x 2 x half> @llvm.vp.fma.nxv2f16(<vscale x 2 x half> %vb, <vscale x 2 x half> %va, <vscale x 2 x half> %c, <vscale x 2 x i1> %allones, i32 %evl)
195   %u = call <vscale x 2 x half> @llvm.vp.merge.nxv2f16(<vscale x 2 x i1> %m, <vscale x 2 x half> %v, <vscale x 2 x half> %c, i32 %evl)
196   ret <vscale x 2 x half> %u
199 define <vscale x 2 x half> @vfmacc_vf_nxv2f16_unmasked(<vscale x 2 x half> %va, half %b, <vscale x 2 x half> %c, i32 zeroext %evl) {
200 ; CHECK-LABEL: vfmacc_vf_nxv2f16_unmasked:
201 ; CHECK:       # %bb.0:
202 ; CHECK-NEXT:    vsetvli zero, a0, e16, mf2, tu, ma
203 ; CHECK-NEXT:    vfmacc.vf v9, fa0, v8
204 ; CHECK-NEXT:    vmv1r.v v8, v9
205 ; CHECK-NEXT:    ret
206   %elt.head = insertelement <vscale x 2 x half> poison, half %b, i32 0
207   %vb = shufflevector <vscale x 2 x half> %elt.head, <vscale x 2 x half> poison, <vscale x 2 x i32> zeroinitializer
208   %splat = insertelement <vscale x 2 x i1> poison, i1 -1, i32 0
209   %allones = shufflevector <vscale x 2 x i1> %splat, <vscale x 2 x i1> poison, <vscale x 2 x i32> zeroinitializer
210   %v = call <vscale x 2 x half> @llvm.vp.fma.nxv2f16(<vscale x 2 x half> %va, <vscale x 2 x half> %vb, <vscale x 2 x half> %c, <vscale x 2 x i1> %allones, i32 %evl)
211   %u = call <vscale x 2 x half> @llvm.vp.merge.nxv2f16(<vscale x 2 x i1> %allones, <vscale x 2 x half> %v, <vscale x 2 x half> %c, i32 %evl)
212   ret <vscale x 2 x half> %u
215 define <vscale x 2 x half> @vfmacc_vv_nxv2f16_ta(<vscale x 2 x half> %a, <vscale x 2 x half> %b, <vscale x 2 x half> %c, <vscale x 2 x i1> %m, i32 zeroext %evl) {
216 ; CHECK-LABEL: vfmacc_vv_nxv2f16_ta:
217 ; CHECK:       # %bb.0:
218 ; CHECK-NEXT:    vsetvli zero, a0, e16, mf2, ta, mu
219 ; CHECK-NEXT:    vfmacc.vv v10, v8, v9, v0.t
220 ; CHECK-NEXT:    vmv1r.v v8, v10
221 ; CHECK-NEXT:    ret
222   %splat = insertelement <vscale x 2 x i1> poison, i1 -1, i32 0
223   %allones = shufflevector <vscale x 2 x i1> %splat, <vscale x 2 x i1> poison, <vscale x 2 x i32> zeroinitializer
224   %v = call <vscale x 2 x half> @llvm.vp.fma.nxv2f16(<vscale x 2 x half> %a, <vscale x 2 x half> %b, <vscale x 2 x half> %c, <vscale x 2 x i1> %allones, i32 %evl)
225   %u = call <vscale x 2 x half> @llvm.vp.select.nxv2f16(<vscale x 2 x i1> %m, <vscale x 2 x half> %v, <vscale x 2 x half> %c, i32 %evl)
226   ret <vscale x 2 x half> %u
229 define <vscale x 2 x half> @vfmacc_vf_nxv2f16_ta(<vscale x 2 x half> %va, half %b, <vscale x 2 x half> %c, <vscale x 2 x i1> %m, i32 zeroext %evl) {
230 ; CHECK-LABEL: vfmacc_vf_nxv2f16_ta:
231 ; CHECK:       # %bb.0:
232 ; CHECK-NEXT:    vsetvli zero, a0, e16, mf2, ta, mu
233 ; CHECK-NEXT:    vfmacc.vf v9, fa0, v8, v0.t
234 ; CHECK-NEXT:    vmv1r.v v8, v9
235 ; CHECK-NEXT:    ret
236   %elt.head = insertelement <vscale x 2 x half> poison, half %b, i32 0
237   %vb = shufflevector <vscale x 2 x half> %elt.head, <vscale x 2 x half> poison, <vscale x 2 x i32> zeroinitializer
238   %splat = insertelement <vscale x 2 x i1> poison, i1 -1, i32 0
239   %allones = shufflevector <vscale x 2 x i1> %splat, <vscale x 2 x i1> poison, <vscale x 2 x i32> zeroinitializer
240   %v = call <vscale x 2 x half> @llvm.vp.fma.nxv2f16(<vscale x 2 x half> %va, <vscale x 2 x half> %vb, <vscale x 2 x half> %c, <vscale x 2 x i1> %allones, i32 %evl)
241   %u = call <vscale x 2 x half> @llvm.vp.select.nxv2f16(<vscale x 2 x i1> %m, <vscale x 2 x half> %v, <vscale x 2 x half> %c, i32 %evl)
242   ret <vscale x 2 x half> %u
245 define <vscale x 2 x half> @vfmacc_vf_nxv2f16_commute_ta(<vscale x 2 x half> %va, half %b, <vscale x 2 x half> %c, <vscale x 2 x i1> %m, i32 zeroext %evl) {
246 ; CHECK-LABEL: vfmacc_vf_nxv2f16_commute_ta:
247 ; CHECK:       # %bb.0:
248 ; CHECK-NEXT:    vsetvli zero, a0, e16, mf2, ta, mu
249 ; CHECK-NEXT:    vfmacc.vf v9, fa0, v8, v0.t
250 ; CHECK-NEXT:    vmv1r.v v8, v9
251 ; CHECK-NEXT:    ret
252   %elt.head = insertelement <vscale x 2 x half> poison, half %b, i32 0
253   %vb = shufflevector <vscale x 2 x half> %elt.head, <vscale x 2 x half> poison, <vscale x 2 x i32> zeroinitializer
254   %splat = insertelement <vscale x 2 x i1> poison, i1 -1, i32 0
255   %allones = shufflevector <vscale x 2 x i1> %splat, <vscale x 2 x i1> poison, <vscale x 2 x i32> zeroinitializer
256   %v = call <vscale x 2 x half> @llvm.vp.fma.nxv2f16(<vscale x 2 x half> %vb, <vscale x 2 x half> %va, <vscale x 2 x half> %c, <vscale x 2 x i1> %allones, i32 %evl)
257   %u = call <vscale x 2 x half> @llvm.vp.select.nxv2f16(<vscale x 2 x i1> %m, <vscale x 2 x half> %v, <vscale x 2 x half> %c, i32 %evl)
258   ret <vscale x 2 x half> %u
261 declare <vscale x 4 x half> @llvm.vp.fma.nxv4f16(<vscale x 4 x half>, <vscale x 4 x half>, <vscale x 4 x half>, <vscale x 4 x i1>, i32)
262 declare <vscale x 4 x half> @llvm.vp.fneg.nxv4f16(<vscale x 4 x half>, <vscale x 4 x i1>, i32)
263 declare <vscale x 4 x half> @llvm.vp.merge.nxv4f16(<vscale x 4 x i1>, <vscale x 4 x half>, <vscale x 4 x half>, i32)
264 declare <vscale x 4 x half> @llvm.vp.select.nxv4f16(<vscale x 4 x i1>, <vscale x 4 x half>, <vscale x 4 x half>, i32)
266 define <vscale x 4 x half> @vfmacc_vv_nxv4f16(<vscale x 4 x half> %a, <vscale x 4 x half> %b, <vscale x 4 x half> %c, <vscale x 4 x i1> %m, i32 zeroext %evl) {
267 ; CHECK-LABEL: vfmacc_vv_nxv4f16:
268 ; CHECK:       # %bb.0:
269 ; CHECK-NEXT:    vsetvli zero, a0, e16, m1, tu, mu
270 ; CHECK-NEXT:    vfmacc.vv v10, v8, v9, v0.t
271 ; CHECK-NEXT:    vmv1r.v v8, v10
272 ; CHECK-NEXT:    ret
273   %splat = insertelement <vscale x 4 x i1> poison, i1 -1, i32 0
274   %allones = shufflevector <vscale x 4 x i1> %splat, <vscale x 4 x i1> poison, <vscale x 4 x i32> zeroinitializer
275   %v = call <vscale x 4 x half> @llvm.vp.fma.nxv4f16(<vscale x 4 x half> %a, <vscale x 4 x half> %b, <vscale x 4 x half> %c, <vscale x 4 x i1> %allones, i32 %evl)
276   %u = call <vscale x 4 x half> @llvm.vp.merge.nxv4f16(<vscale x 4 x i1> %m, <vscale x 4 x half> %v, <vscale x 4 x half> %c, i32 %evl)
277   ret <vscale x 4 x half> %u
280 define <vscale x 4 x half> @vfmacc_vv_nxv4f16_unmasked(<vscale x 4 x half> %a, <vscale x 4 x half> %b, <vscale x 4 x half> %c, <vscale x 4 x i1> %m, i32 zeroext %evl) {
281 ; CHECK-LABEL: vfmacc_vv_nxv4f16_unmasked:
282 ; CHECK:       # %bb.0:
283 ; CHECK-NEXT:    vsetvli zero, a0, e16, m1, tu, ma
284 ; CHECK-NEXT:    vfmacc.vv v10, v8, v9
285 ; CHECK-NEXT:    vmv1r.v v8, v10
286 ; CHECK-NEXT:    ret
287   %splat = insertelement <vscale x 4 x i1> poison, i1 -1, i32 0
288   %allones = shufflevector <vscale x 4 x i1> %splat, <vscale x 4 x i1> poison, <vscale x 4 x i32> zeroinitializer
289   %v = call <vscale x 4 x half> @llvm.vp.fma.nxv4f16(<vscale x 4 x half> %a, <vscale x 4 x half> %b, <vscale x 4 x half> %c, <vscale x 4 x i1> %allones, i32 %evl)
290   %u = call <vscale x 4 x half> @llvm.vp.merge.nxv4f16(<vscale x 4 x i1> %allones, <vscale x 4 x half> %v, <vscale x 4 x half> %c, i32 %evl)
291   ret <vscale x 4 x half> %u
294 define <vscale x 4 x half> @vfmacc_vf_nxv4f16(<vscale x 4 x half> %va, half %b, <vscale x 4 x half> %c, <vscale x 4 x i1> %m, i32 zeroext %evl) {
295 ; CHECK-LABEL: vfmacc_vf_nxv4f16:
296 ; CHECK:       # %bb.0:
297 ; CHECK-NEXT:    vsetvli zero, a0, e16, m1, tu, mu
298 ; CHECK-NEXT:    vfmacc.vf v9, fa0, v8, v0.t
299 ; CHECK-NEXT:    vmv1r.v v8, v9
300 ; CHECK-NEXT:    ret
301   %elt.head = insertelement <vscale x 4 x half> poison, half %b, i32 0
302   %vb = shufflevector <vscale x 4 x half> %elt.head, <vscale x 4 x half> poison, <vscale x 4 x i32> zeroinitializer
303   %splat = insertelement <vscale x 4 x i1> poison, i1 -1, i32 0
304   %allones = shufflevector <vscale x 4 x i1> %splat, <vscale x 4 x i1> poison, <vscale x 4 x i32> zeroinitializer
305   %v = call <vscale x 4 x half> @llvm.vp.fma.nxv4f16(<vscale x 4 x half> %va, <vscale x 4 x half> %vb, <vscale x 4 x half> %c, <vscale x 4 x i1> %allones, i32 %evl)
306   %u = call <vscale x 4 x half> @llvm.vp.merge.nxv4f16(<vscale x 4 x i1> %m, <vscale x 4 x half> %v, <vscale x 4 x half> %c, i32 %evl)
307   ret <vscale x 4 x half> %u
310 define <vscale x 4 x half> @vfmacc_vf_nxv4f16_commute(<vscale x 4 x half> %va, half %b, <vscale x 4 x half> %c, <vscale x 4 x i1> %m, i32 zeroext %evl) {
311 ; CHECK-LABEL: vfmacc_vf_nxv4f16_commute:
312 ; CHECK:       # %bb.0:
313 ; CHECK-NEXT:    vsetvli zero, a0, e16, m1, tu, mu
314 ; CHECK-NEXT:    vfmacc.vf v9, fa0, v8, v0.t
315 ; CHECK-NEXT:    vmv1r.v v8, v9
316 ; CHECK-NEXT:    ret
317   %elt.head = insertelement <vscale x 4 x half> poison, half %b, i32 0
318   %vb = shufflevector <vscale x 4 x half> %elt.head, <vscale x 4 x half> poison, <vscale x 4 x i32> zeroinitializer
319   %splat = insertelement <vscale x 4 x i1> poison, i1 -1, i32 0
320   %allones = shufflevector <vscale x 4 x i1> %splat, <vscale x 4 x i1> poison, <vscale x 4 x i32> zeroinitializer
321   %v = call <vscale x 4 x half> @llvm.vp.fma.nxv4f16(<vscale x 4 x half> %vb, <vscale x 4 x half> %va, <vscale x 4 x half> %c, <vscale x 4 x i1> %allones, i32 %evl)
322   %u = call <vscale x 4 x half> @llvm.vp.merge.nxv4f16(<vscale x 4 x i1> %m, <vscale x 4 x half> %v, <vscale x 4 x half> %c, i32 %evl)
323   ret <vscale x 4 x half> %u
326 define <vscale x 4 x half> @vfmacc_vf_nxv4f16_unmasked(<vscale x 4 x half> %va, half %b, <vscale x 4 x half> %c, i32 zeroext %evl) {
327 ; CHECK-LABEL: vfmacc_vf_nxv4f16_unmasked:
328 ; CHECK:       # %bb.0:
329 ; CHECK-NEXT:    vsetvli zero, a0, e16, m1, tu, ma
330 ; CHECK-NEXT:    vfmacc.vf v9, fa0, v8
331 ; CHECK-NEXT:    vmv1r.v v8, v9
332 ; CHECK-NEXT:    ret
333   %elt.head = insertelement <vscale x 4 x half> poison, half %b, i32 0
334   %vb = shufflevector <vscale x 4 x half> %elt.head, <vscale x 4 x half> poison, <vscale x 4 x i32> zeroinitializer
335   %splat = insertelement <vscale x 4 x i1> poison, i1 -1, i32 0
336   %allones = shufflevector <vscale x 4 x i1> %splat, <vscale x 4 x i1> poison, <vscale x 4 x i32> zeroinitializer
337   %v = call <vscale x 4 x half> @llvm.vp.fma.nxv4f16(<vscale x 4 x half> %va, <vscale x 4 x half> %vb, <vscale x 4 x half> %c, <vscale x 4 x i1> %allones, i32 %evl)
338   %u = call <vscale x 4 x half> @llvm.vp.merge.nxv4f16(<vscale x 4 x i1> %allones, <vscale x 4 x half> %v, <vscale x 4 x half> %c, i32 %evl)
339   ret <vscale x 4 x half> %u
342 define <vscale x 4 x half> @vfmacc_vv_nxv4f16_ta(<vscale x 4 x half> %a, <vscale x 4 x half> %b, <vscale x 4 x half> %c, <vscale x 4 x i1> %m, i32 zeroext %evl) {
343 ; CHECK-LABEL: vfmacc_vv_nxv4f16_ta:
344 ; CHECK:       # %bb.0:
345 ; CHECK-NEXT:    vsetvli zero, a0, e16, m1, ta, mu
346 ; CHECK-NEXT:    vfmacc.vv v10, v8, v9, v0.t
347 ; CHECK-NEXT:    vmv.v.v v8, v10
348 ; CHECK-NEXT:    ret
349   %splat = insertelement <vscale x 4 x i1> poison, i1 -1, i32 0
350   %allones = shufflevector <vscale x 4 x i1> %splat, <vscale x 4 x i1> poison, <vscale x 4 x i32> zeroinitializer
351   %v = call <vscale x 4 x half> @llvm.vp.fma.nxv4f16(<vscale x 4 x half> %a, <vscale x 4 x half> %b, <vscale x 4 x half> %c, <vscale x 4 x i1> %allones, i32 %evl)
352   %u = call <vscale x 4 x half> @llvm.vp.select.nxv4f16(<vscale x 4 x i1> %m, <vscale x 4 x half> %v, <vscale x 4 x half> %c, i32 %evl)
353   ret <vscale x 4 x half> %u
356 define <vscale x 4 x half> @vfmacc_vf_nxv4f16_ta(<vscale x 4 x half> %va, half %b, <vscale x 4 x half> %c, <vscale x 4 x i1> %m, i32 zeroext %evl) {
357 ; CHECK-LABEL: vfmacc_vf_nxv4f16_ta:
358 ; CHECK:       # %bb.0:
359 ; CHECK-NEXT:    vsetvli zero, a0, e16, m1, ta, mu
360 ; CHECK-NEXT:    vfmacc.vf v9, fa0, v8, v0.t
361 ; CHECK-NEXT:    vmv.v.v v8, v9
362 ; CHECK-NEXT:    ret
363   %elt.head = insertelement <vscale x 4 x half> poison, half %b, i32 0
364   %vb = shufflevector <vscale x 4 x half> %elt.head, <vscale x 4 x half> poison, <vscale x 4 x i32> zeroinitializer
365   %splat = insertelement <vscale x 4 x i1> poison, i1 -1, i32 0
366   %allones = shufflevector <vscale x 4 x i1> %splat, <vscale x 4 x i1> poison, <vscale x 4 x i32> zeroinitializer
367   %v = call <vscale x 4 x half> @llvm.vp.fma.nxv4f16(<vscale x 4 x half> %va, <vscale x 4 x half> %vb, <vscale x 4 x half> %c, <vscale x 4 x i1> %allones, i32 %evl)
368   %u = call <vscale x 4 x half> @llvm.vp.select.nxv4f16(<vscale x 4 x i1> %m, <vscale x 4 x half> %v, <vscale x 4 x half> %c, i32 %evl)
369   ret <vscale x 4 x half> %u
372 define <vscale x 4 x half> @vfmacc_vf_nxv4f16_commute_ta(<vscale x 4 x half> %va, half %b, <vscale x 4 x half> %c, <vscale x 4 x i1> %m, i32 zeroext %evl) {
373 ; CHECK-LABEL: vfmacc_vf_nxv4f16_commute_ta:
374 ; CHECK:       # %bb.0:
375 ; CHECK-NEXT:    vsetvli zero, a0, e16, m1, ta, mu
376 ; CHECK-NEXT:    vfmacc.vf v9, fa0, v8, v0.t
377 ; CHECK-NEXT:    vmv.v.v v8, v9
378 ; CHECK-NEXT:    ret
379   %elt.head = insertelement <vscale x 4 x half> poison, half %b, i32 0
380   %vb = shufflevector <vscale x 4 x half> %elt.head, <vscale x 4 x half> poison, <vscale x 4 x i32> zeroinitializer
381   %splat = insertelement <vscale x 4 x i1> poison, i1 -1, i32 0
382   %allones = shufflevector <vscale x 4 x i1> %splat, <vscale x 4 x i1> poison, <vscale x 4 x i32> zeroinitializer
383   %v = call <vscale x 4 x half> @llvm.vp.fma.nxv4f16(<vscale x 4 x half> %vb, <vscale x 4 x half> %va, <vscale x 4 x half> %c, <vscale x 4 x i1> %allones, i32 %evl)
384   %u = call <vscale x 4 x half> @llvm.vp.select.nxv4f16(<vscale x 4 x i1> %m, <vscale x 4 x half> %v, <vscale x 4 x half> %c, i32 %evl)
385   ret <vscale x 4 x half> %u
388 declare <vscale x 8 x half> @llvm.vp.fma.nxv8f16(<vscale x 8 x half>, <vscale x 8 x half>, <vscale x 8 x half>, <vscale x 8 x i1>, i32)
389 declare <vscale x 8 x half> @llvm.vp.fneg.nxv8f16(<vscale x 8 x half>, <vscale x 8 x i1>, i32)
390 declare <vscale x 8 x half> @llvm.vp.merge.nxv8f16(<vscale x 8 x i1>, <vscale x 8 x half>, <vscale x 8 x half>, i32)
391 declare <vscale x 8 x half> @llvm.vp.select.nxv8f16(<vscale x 8 x i1>, <vscale x 8 x half>, <vscale x 8 x half>, i32)
393 define <vscale x 8 x half> @vfmacc_vv_nxv8f16(<vscale x 8 x half> %a, <vscale x 8 x half> %b, <vscale x 8 x half> %c, <vscale x 8 x i1> %m, i32 zeroext %evl) {
394 ; CHECK-LABEL: vfmacc_vv_nxv8f16:
395 ; CHECK:       # %bb.0:
396 ; CHECK-NEXT:    vsetvli zero, a0, e16, m2, tu, mu
397 ; CHECK-NEXT:    vfmacc.vv v12, v8, v10, v0.t
398 ; CHECK-NEXT:    vmv2r.v v8, v12
399 ; CHECK-NEXT:    ret
400   %splat = insertelement <vscale x 8 x i1> poison, i1 -1, i32 0
401   %allones = shufflevector <vscale x 8 x i1> %splat, <vscale x 8 x i1> poison, <vscale x 8 x i32> zeroinitializer
402   %v = call <vscale x 8 x half> @llvm.vp.fma.nxv8f16(<vscale x 8 x half> %a, <vscale x 8 x half> %b, <vscale x 8 x half> %c, <vscale x 8 x i1> %allones, i32 %evl)
403   %u = call <vscale x 8 x half> @llvm.vp.merge.nxv8f16(<vscale x 8 x i1> %m, <vscale x 8 x half> %v, <vscale x 8 x half> %c, i32 %evl)
404   ret <vscale x 8 x half> %u
407 define <vscale x 8 x half> @vfmacc_vv_nxv8f16_unmasked(<vscale x 8 x half> %a, <vscale x 8 x half> %b, <vscale x 8 x half> %c, <vscale x 8 x i1> %m, i32 zeroext %evl) {
408 ; CHECK-LABEL: vfmacc_vv_nxv8f16_unmasked:
409 ; CHECK:       # %bb.0:
410 ; CHECK-NEXT:    vsetvli zero, a0, e16, m2, tu, ma
411 ; CHECK-NEXT:    vfmacc.vv v12, v8, v10
412 ; CHECK-NEXT:    vmv2r.v v8, v12
413 ; CHECK-NEXT:    ret
414   %splat = insertelement <vscale x 8 x i1> poison, i1 -1, i32 0
415   %allones = shufflevector <vscale x 8 x i1> %splat, <vscale x 8 x i1> poison, <vscale x 8 x i32> zeroinitializer
416   %v = call <vscale x 8 x half> @llvm.vp.fma.nxv8f16(<vscale x 8 x half> %a, <vscale x 8 x half> %b, <vscale x 8 x half> %c, <vscale x 8 x i1> %allones, i32 %evl)
417   %u = call <vscale x 8 x half> @llvm.vp.merge.nxv8f16(<vscale x 8 x i1> %allones, <vscale x 8 x half> %v, <vscale x 8 x half> %c, i32 %evl)
418   ret <vscale x 8 x half> %u
421 define <vscale x 8 x half> @vfmacc_vf_nxv8f16(<vscale x 8 x half> %va, half %b, <vscale x 8 x half> %c, <vscale x 8 x i1> %m, i32 zeroext %evl) {
422 ; CHECK-LABEL: vfmacc_vf_nxv8f16:
423 ; CHECK:       # %bb.0:
424 ; CHECK-NEXT:    vsetvli zero, a0, e16, m2, tu, mu
425 ; CHECK-NEXT:    vfmacc.vf v10, fa0, v8, v0.t
426 ; CHECK-NEXT:    vmv2r.v v8, v10
427 ; CHECK-NEXT:    ret
428   %elt.head = insertelement <vscale x 8 x half> poison, half %b, i32 0
429   %vb = shufflevector <vscale x 8 x half> %elt.head, <vscale x 8 x half> poison, <vscale x 8 x i32> zeroinitializer
430   %splat = insertelement <vscale x 8 x i1> poison, i1 -1, i32 0
431   %allones = shufflevector <vscale x 8 x i1> %splat, <vscale x 8 x i1> poison, <vscale x 8 x i32> zeroinitializer
432   %v = call <vscale x 8 x half> @llvm.vp.fma.nxv8f16(<vscale x 8 x half> %va, <vscale x 8 x half> %vb, <vscale x 8 x half> %c, <vscale x 8 x i1> %allones, i32 %evl)
433   %u = call <vscale x 8 x half> @llvm.vp.merge.nxv8f16(<vscale x 8 x i1> %m, <vscale x 8 x half> %v, <vscale x 8 x half> %c, i32 %evl)
434   ret <vscale x 8 x half> %u
437 define <vscale x 8 x half> @vfmacc_vf_nxv8f16_commute(<vscale x 8 x half> %va, half %b, <vscale x 8 x half> %c, <vscale x 8 x i1> %m, i32 zeroext %evl) {
438 ; CHECK-LABEL: vfmacc_vf_nxv8f16_commute:
439 ; CHECK:       # %bb.0:
440 ; CHECK-NEXT:    vsetvli zero, a0, e16, m2, tu, mu
441 ; CHECK-NEXT:    vfmacc.vf v10, fa0, v8, v0.t
442 ; CHECK-NEXT:    vmv2r.v v8, v10
443 ; CHECK-NEXT:    ret
444   %elt.head = insertelement <vscale x 8 x half> poison, half %b, i32 0
445   %vb = shufflevector <vscale x 8 x half> %elt.head, <vscale x 8 x half> poison, <vscale x 8 x i32> zeroinitializer
446   %splat = insertelement <vscale x 8 x i1> poison, i1 -1, i32 0
447   %allones = shufflevector <vscale x 8 x i1> %splat, <vscale x 8 x i1> poison, <vscale x 8 x i32> zeroinitializer
448   %v = call <vscale x 8 x half> @llvm.vp.fma.nxv8f16(<vscale x 8 x half> %vb, <vscale x 8 x half> %va, <vscale x 8 x half> %c, <vscale x 8 x i1> %allones, i32 %evl)
449   %u = call <vscale x 8 x half> @llvm.vp.merge.nxv8f16(<vscale x 8 x i1> %m, <vscale x 8 x half> %v, <vscale x 8 x half> %c, i32 %evl)
450   ret <vscale x 8 x half> %u
453 define <vscale x 8 x half> @vfmacc_vf_nxv8f16_unmasked(<vscale x 8 x half> %va, half %b, <vscale x 8 x half> %c, i32 zeroext %evl) {
454 ; CHECK-LABEL: vfmacc_vf_nxv8f16_unmasked:
455 ; CHECK:       # %bb.0:
456 ; CHECK-NEXT:    vsetvli zero, a0, e16, m2, tu, ma
457 ; CHECK-NEXT:    vfmacc.vf v10, fa0, v8
458 ; CHECK-NEXT:    vmv2r.v v8, v10
459 ; CHECK-NEXT:    ret
460   %elt.head = insertelement <vscale x 8 x half> poison, half %b, i32 0
461   %vb = shufflevector <vscale x 8 x half> %elt.head, <vscale x 8 x half> poison, <vscale x 8 x i32> zeroinitializer
462   %splat = insertelement <vscale x 8 x i1> poison, i1 -1, i32 0
463   %allones = shufflevector <vscale x 8 x i1> %splat, <vscale x 8 x i1> poison, <vscale x 8 x i32> zeroinitializer
464   %v = call <vscale x 8 x half> @llvm.vp.fma.nxv8f16(<vscale x 8 x half> %va, <vscale x 8 x half> %vb, <vscale x 8 x half> %c, <vscale x 8 x i1> %allones, i32 %evl)
465   %u = call <vscale x 8 x half> @llvm.vp.merge.nxv8f16(<vscale x 8 x i1> %allones, <vscale x 8 x half> %v, <vscale x 8 x half> %c, i32 %evl)
466   ret <vscale x 8 x half> %u
469 define <vscale x 8 x half> @vfmacc_vv_nxv8f16_ta(<vscale x 8 x half> %a, <vscale x 8 x half> %b, <vscale x 8 x half> %c, <vscale x 8 x i1> %m, i32 zeroext %evl) {
470 ; CHECK-LABEL: vfmacc_vv_nxv8f16_ta:
471 ; CHECK:       # %bb.0:
472 ; CHECK-NEXT:    vsetvli zero, a0, e16, m2, ta, mu
473 ; CHECK-NEXT:    vfmacc.vv v12, v8, v10, v0.t
474 ; CHECK-NEXT:    vmv.v.v v8, v12
475 ; CHECK-NEXT:    ret
476   %splat = insertelement <vscale x 8 x i1> poison, i1 -1, i32 0
477   %allones = shufflevector <vscale x 8 x i1> %splat, <vscale x 8 x i1> poison, <vscale x 8 x i32> zeroinitializer
478   %v = call <vscale x 8 x half> @llvm.vp.fma.nxv8f16(<vscale x 8 x half> %a, <vscale x 8 x half> %b, <vscale x 8 x half> %c, <vscale x 8 x i1> %allones, i32 %evl)
479   %u = call <vscale x 8 x half> @llvm.vp.select.nxv8f16(<vscale x 8 x i1> %m, <vscale x 8 x half> %v, <vscale x 8 x half> %c, i32 %evl)
480   ret <vscale x 8 x half> %u
483 define <vscale x 8 x half> @vfmacc_vf_nxv8f16_ta(<vscale x 8 x half> %va, half %b, <vscale x 8 x half> %c, <vscale x 8 x i1> %m, i32 zeroext %evl) {
484 ; CHECK-LABEL: vfmacc_vf_nxv8f16_ta:
485 ; CHECK:       # %bb.0:
486 ; CHECK-NEXT:    vsetvli zero, a0, e16, m2, ta, mu
487 ; CHECK-NEXT:    vfmacc.vf v10, fa0, v8, v0.t
488 ; CHECK-NEXT:    vmv.v.v v8, v10
489 ; CHECK-NEXT:    ret
490   %elt.head = insertelement <vscale x 8 x half> poison, half %b, i32 0
491   %vb = shufflevector <vscale x 8 x half> %elt.head, <vscale x 8 x half> poison, <vscale x 8 x i32> zeroinitializer
492   %splat = insertelement <vscale x 8 x i1> poison, i1 -1, i32 0
493   %allones = shufflevector <vscale x 8 x i1> %splat, <vscale x 8 x i1> poison, <vscale x 8 x i32> zeroinitializer
494   %v = call <vscale x 8 x half> @llvm.vp.fma.nxv8f16(<vscale x 8 x half> %va, <vscale x 8 x half> %vb, <vscale x 8 x half> %c, <vscale x 8 x i1> %allones, i32 %evl)
495   %u = call <vscale x 8 x half> @llvm.vp.select.nxv8f16(<vscale x 8 x i1> %m, <vscale x 8 x half> %v, <vscale x 8 x half> %c, i32 %evl)
496   ret <vscale x 8 x half> %u
499 define <vscale x 8 x half> @vfmacc_vf_nxv8f16_commute_ta(<vscale x 8 x half> %va, half %b, <vscale x 8 x half> %c, <vscale x 8 x i1> %m, i32 zeroext %evl) {
500 ; CHECK-LABEL: vfmacc_vf_nxv8f16_commute_ta:
501 ; CHECK:       # %bb.0:
502 ; CHECK-NEXT:    vsetvli zero, a0, e16, m2, ta, mu
503 ; CHECK-NEXT:    vfmacc.vf v10, fa0, v8, v0.t
504 ; CHECK-NEXT:    vmv.v.v v8, v10
505 ; CHECK-NEXT:    ret
506   %elt.head = insertelement <vscale x 8 x half> poison, half %b, i32 0
507   %vb = shufflevector <vscale x 8 x half> %elt.head, <vscale x 8 x half> poison, <vscale x 8 x i32> zeroinitializer
508   %splat = insertelement <vscale x 8 x i1> poison, i1 -1, i32 0
509   %allones = shufflevector <vscale x 8 x i1> %splat, <vscale x 8 x i1> poison, <vscale x 8 x i32> zeroinitializer
510   %v = call <vscale x 8 x half> @llvm.vp.fma.nxv8f16(<vscale x 8 x half> %vb, <vscale x 8 x half> %va, <vscale x 8 x half> %c, <vscale x 8 x i1> %allones, i32 %evl)
511   %u = call <vscale x 8 x half> @llvm.vp.select.nxv8f16(<vscale x 8 x i1> %m, <vscale x 8 x half> %v, <vscale x 8 x half> %c, i32 %evl)
512   ret <vscale x 8 x half> %u
515 declare <vscale x 16 x half> @llvm.vp.fma.nxv16f16(<vscale x 16 x half>, <vscale x 16 x half>, <vscale x 16 x half>, <vscale x 16 x i1>, i32)
516 declare <vscale x 16 x half> @llvm.vp.fneg.nxv16f16(<vscale x 16 x half>, <vscale x 16 x i1>, i32)
517 declare <vscale x 16 x half> @llvm.vp.merge.nxv16f16(<vscale x 16 x i1>, <vscale x 16 x half>, <vscale x 16 x half>, i32)
518 declare <vscale x 16 x half> @llvm.vp.select.nxv16f16(<vscale x 16 x i1>, <vscale x 16 x half>, <vscale x 16 x half>, i32)
520 define <vscale x 16 x half> @vfmacc_vv_nxv16f16(<vscale x 16 x half> %a, <vscale x 16 x half> %b, <vscale x 16 x half> %c, <vscale x 16 x i1> %m, i32 zeroext %evl) {
521 ; CHECK-LABEL: vfmacc_vv_nxv16f16:
522 ; CHECK:       # %bb.0:
523 ; CHECK-NEXT:    vsetvli zero, a0, e16, m4, tu, mu
524 ; CHECK-NEXT:    vfmacc.vv v16, v8, v12, v0.t
525 ; CHECK-NEXT:    vmv4r.v v8, v16
526 ; CHECK-NEXT:    ret
527   %splat = insertelement <vscale x 16 x i1> poison, i1 -1, i32 0
528   %allones = shufflevector <vscale x 16 x i1> %splat, <vscale x 16 x i1> poison, <vscale x 16 x i32> zeroinitializer
529   %v = call <vscale x 16 x half> @llvm.vp.fma.nxv16f16(<vscale x 16 x half> %a, <vscale x 16 x half> %b, <vscale x 16 x half> %c, <vscale x 16 x i1> %allones, i32 %evl)
530   %u = call <vscale x 16 x half> @llvm.vp.merge.nxv16f16(<vscale x 16 x i1> %m, <vscale x 16 x half> %v, <vscale x 16 x half> %c, i32 %evl)
531   ret <vscale x 16 x half> %u
534 define <vscale x 16 x half> @vfmacc_vv_nxv16f16_unmasked(<vscale x 16 x half> %a, <vscale x 16 x half> %b, <vscale x 16 x half> %c, <vscale x 16 x i1> %m, i32 zeroext %evl) {
535 ; CHECK-LABEL: vfmacc_vv_nxv16f16_unmasked:
536 ; CHECK:       # %bb.0:
537 ; CHECK-NEXT:    vsetvli zero, a0, e16, m4, tu, ma
538 ; CHECK-NEXT:    vfmacc.vv v16, v8, v12
539 ; CHECK-NEXT:    vmv4r.v v8, v16
540 ; CHECK-NEXT:    ret
541   %splat = insertelement <vscale x 16 x i1> poison, i1 -1, i32 0
542   %allones = shufflevector <vscale x 16 x i1> %splat, <vscale x 16 x i1> poison, <vscale x 16 x i32> zeroinitializer
543   %v = call <vscale x 16 x half> @llvm.vp.fma.nxv16f16(<vscale x 16 x half> %a, <vscale x 16 x half> %b, <vscale x 16 x half> %c, <vscale x 16 x i1> %allones, i32 %evl)
544   %u = call <vscale x 16 x half> @llvm.vp.merge.nxv16f16(<vscale x 16 x i1> %allones, <vscale x 16 x half> %v, <vscale x 16 x half> %c, i32 %evl)
545   ret <vscale x 16 x half> %u
548 define <vscale x 16 x half> @vfmacc_vf_nxv16f16(<vscale x 16 x half> %va, half %b, <vscale x 16 x half> %c, <vscale x 16 x i1> %m, i32 zeroext %evl) {
549 ; CHECK-LABEL: vfmacc_vf_nxv16f16:
550 ; CHECK:       # %bb.0:
551 ; CHECK-NEXT:    vsetvli zero, a0, e16, m4, tu, mu
552 ; CHECK-NEXT:    vfmacc.vf v12, fa0, v8, v0.t
553 ; CHECK-NEXT:    vmv4r.v v8, v12
554 ; CHECK-NEXT:    ret
555   %elt.head = insertelement <vscale x 16 x half> poison, half %b, i32 0
556   %vb = shufflevector <vscale x 16 x half> %elt.head, <vscale x 16 x half> poison, <vscale x 16 x i32> zeroinitializer
557   %splat = insertelement <vscale x 16 x i1> poison, i1 -1, i32 0
558   %allones = shufflevector <vscale x 16 x i1> %splat, <vscale x 16 x i1> poison, <vscale x 16 x i32> zeroinitializer
559   %v = call <vscale x 16 x half> @llvm.vp.fma.nxv16f16(<vscale x 16 x half> %va, <vscale x 16 x half> %vb, <vscale x 16 x half> %c, <vscale x 16 x i1> %allones, i32 %evl)
560   %u = call <vscale x 16 x half> @llvm.vp.merge.nxv16f16(<vscale x 16 x i1> %m, <vscale x 16 x half> %v, <vscale x 16 x half> %c, i32 %evl)
561   ret <vscale x 16 x half> %u
564 define <vscale x 16 x half> @vfmacc_vf_nxv16f16_commute(<vscale x 16 x half> %va, half %b, <vscale x 16 x half> %c, <vscale x 16 x i1> %m, i32 zeroext %evl) {
565 ; CHECK-LABEL: vfmacc_vf_nxv16f16_commute:
566 ; CHECK:       # %bb.0:
567 ; CHECK-NEXT:    vsetvli zero, a0, e16, m4, tu, mu
568 ; CHECK-NEXT:    vfmacc.vf v12, fa0, v8, v0.t
569 ; CHECK-NEXT:    vmv4r.v v8, v12
570 ; CHECK-NEXT:    ret
571   %elt.head = insertelement <vscale x 16 x half> poison, half %b, i32 0
572   %vb = shufflevector <vscale x 16 x half> %elt.head, <vscale x 16 x half> poison, <vscale x 16 x i32> zeroinitializer
573   %splat = insertelement <vscale x 16 x i1> poison, i1 -1, i32 0
574   %allones = shufflevector <vscale x 16 x i1> %splat, <vscale x 16 x i1> poison, <vscale x 16 x i32> zeroinitializer
575   %v = call <vscale x 16 x half> @llvm.vp.fma.nxv16f16(<vscale x 16 x half> %vb, <vscale x 16 x half> %va, <vscale x 16 x half> %c, <vscale x 16 x i1> %allones, i32 %evl)
576   %u = call <vscale x 16 x half> @llvm.vp.merge.nxv16f16(<vscale x 16 x i1> %m, <vscale x 16 x half> %v, <vscale x 16 x half> %c, i32 %evl)
577   ret <vscale x 16 x half> %u
580 define <vscale x 16 x half> @vfmacc_vf_nxv16f16_unmasked(<vscale x 16 x half> %va, half %b, <vscale x 16 x half> %c, i32 zeroext %evl) {
581 ; CHECK-LABEL: vfmacc_vf_nxv16f16_unmasked:
582 ; CHECK:       # %bb.0:
583 ; CHECK-NEXT:    vsetvli zero, a0, e16, m4, tu, ma
584 ; CHECK-NEXT:    vfmacc.vf v12, fa0, v8
585 ; CHECK-NEXT:    vmv4r.v v8, v12
586 ; CHECK-NEXT:    ret
587   %elt.head = insertelement <vscale x 16 x half> poison, half %b, i32 0
588   %vb = shufflevector <vscale x 16 x half> %elt.head, <vscale x 16 x half> poison, <vscale x 16 x i32> zeroinitializer
589   %splat = insertelement <vscale x 16 x i1> poison, i1 -1, i32 0
590   %allones = shufflevector <vscale x 16 x i1> %splat, <vscale x 16 x i1> poison, <vscale x 16 x i32> zeroinitializer
591   %v = call <vscale x 16 x half> @llvm.vp.fma.nxv16f16(<vscale x 16 x half> %va, <vscale x 16 x half> %vb, <vscale x 16 x half> %c, <vscale x 16 x i1> %allones, i32 %evl)
592   %u = call <vscale x 16 x half> @llvm.vp.merge.nxv16f16(<vscale x 16 x i1> %allones, <vscale x 16 x half> %v, <vscale x 16 x half> %c, i32 %evl)
593   ret <vscale x 16 x half> %u
596 define <vscale x 16 x half> @vfmacc_vv_nxv16f16_ta(<vscale x 16 x half> %a, <vscale x 16 x half> %b, <vscale x 16 x half> %c, <vscale x 16 x i1> %m, i32 zeroext %evl) {
597 ; CHECK-LABEL: vfmacc_vv_nxv16f16_ta:
598 ; CHECK:       # %bb.0:
599 ; CHECK-NEXT:    vsetvli zero, a0, e16, m4, ta, mu
600 ; CHECK-NEXT:    vfmacc.vv v16, v8, v12, v0.t
601 ; CHECK-NEXT:    vmv.v.v v8, v16
602 ; CHECK-NEXT:    ret
603   %splat = insertelement <vscale x 16 x i1> poison, i1 -1, i32 0
604   %allones = shufflevector <vscale x 16 x i1> %splat, <vscale x 16 x i1> poison, <vscale x 16 x i32> zeroinitializer
605   %v = call <vscale x 16 x half> @llvm.vp.fma.nxv16f16(<vscale x 16 x half> %a, <vscale x 16 x half> %b, <vscale x 16 x half> %c, <vscale x 16 x i1> %allones, i32 %evl)
606   %u = call <vscale x 16 x half> @llvm.vp.select.nxv16f16(<vscale x 16 x i1> %m, <vscale x 16 x half> %v, <vscale x 16 x half> %c, i32 %evl)
607   ret <vscale x 16 x half> %u
610 define <vscale x 16 x half> @vfmacc_vf_nxv16f16_ta(<vscale x 16 x half> %va, half %b, <vscale x 16 x half> %c, <vscale x 16 x i1> %m, i32 zeroext %evl) {
611 ; CHECK-LABEL: vfmacc_vf_nxv16f16_ta:
612 ; CHECK:       # %bb.0:
613 ; CHECK-NEXT:    vsetvli zero, a0, e16, m4, ta, mu
614 ; CHECK-NEXT:    vfmacc.vf v12, fa0, v8, v0.t
615 ; CHECK-NEXT:    vmv.v.v v8, v12
616 ; CHECK-NEXT:    ret
617   %elt.head = insertelement <vscale x 16 x half> poison, half %b, i32 0
618   %vb = shufflevector <vscale x 16 x half> %elt.head, <vscale x 16 x half> poison, <vscale x 16 x i32> zeroinitializer
619   %splat = insertelement <vscale x 16 x i1> poison, i1 -1, i32 0
620   %allones = shufflevector <vscale x 16 x i1> %splat, <vscale x 16 x i1> poison, <vscale x 16 x i32> zeroinitializer
621   %v = call <vscale x 16 x half> @llvm.vp.fma.nxv16f16(<vscale x 16 x half> %va, <vscale x 16 x half> %vb, <vscale x 16 x half> %c, <vscale x 16 x i1> %allones, i32 %evl)
622   %u = call <vscale x 16 x half> @llvm.vp.select.nxv16f16(<vscale x 16 x i1> %m, <vscale x 16 x half> %v, <vscale x 16 x half> %c, i32 %evl)
623   ret <vscale x 16 x half> %u
626 define <vscale x 16 x half> @vfmacc_vf_nxv16f16_commute_ta(<vscale x 16 x half> %va, half %b, <vscale x 16 x half> %c, <vscale x 16 x i1> %m, i32 zeroext %evl) {
627 ; CHECK-LABEL: vfmacc_vf_nxv16f16_commute_ta:
628 ; CHECK:       # %bb.0:
629 ; CHECK-NEXT:    vsetvli zero, a0, e16, m4, ta, mu
630 ; CHECK-NEXT:    vfmacc.vf v12, fa0, v8, v0.t
631 ; CHECK-NEXT:    vmv.v.v v8, v12
632 ; CHECK-NEXT:    ret
633   %elt.head = insertelement <vscale x 16 x half> poison, half %b, i32 0
634   %vb = shufflevector <vscale x 16 x half> %elt.head, <vscale x 16 x half> poison, <vscale x 16 x i32> zeroinitializer
635   %splat = insertelement <vscale x 16 x i1> poison, i1 -1, i32 0
636   %allones = shufflevector <vscale x 16 x i1> %splat, <vscale x 16 x i1> poison, <vscale x 16 x i32> zeroinitializer
637   %v = call <vscale x 16 x half> @llvm.vp.fma.nxv16f16(<vscale x 16 x half> %vb, <vscale x 16 x half> %va, <vscale x 16 x half> %c, <vscale x 16 x i1> %allones, i32 %evl)
638   %u = call <vscale x 16 x half> @llvm.vp.select.nxv16f16(<vscale x 16 x i1> %m, <vscale x 16 x half> %v, <vscale x 16 x half> %c, i32 %evl)
639   ret <vscale x 16 x half> %u
642 declare <vscale x 32 x half> @llvm.vp.fma.nxv32f16(<vscale x 32 x half>, <vscale x 32 x half>, <vscale x 32 x half>, <vscale x 32 x i1>, i32)
643 declare <vscale x 32 x half> @llvm.vp.fneg.nxv32f16(<vscale x 32 x half>, <vscale x 32 x i1>, i32)
644 declare <vscale x 32 x half> @llvm.vp.merge.nxv32f16(<vscale x 32 x i1>, <vscale x 32 x half>, <vscale x 32 x half>, i32)
645 declare <vscale x 32 x half> @llvm.vp.select.nxv32f16(<vscale x 32 x i1>, <vscale x 32 x half>, <vscale x 32 x half>, i32)
647 define <vscale x 32 x half> @vfmacc_vv_nxv32f16(<vscale x 32 x half> %a, <vscale x 32 x half> %b, <vscale x 32 x half> %c, <vscale x 32 x i1> %m, i32 zeroext %evl) {
648 ; CHECK-LABEL: vfmacc_vv_nxv32f16:
649 ; CHECK:       # %bb.0:
650 ; CHECK-NEXT:    vl8re16.v v24, (a0)
651 ; CHECK-NEXT:    vsetvli zero, a1, e16, m8, tu, mu
652 ; CHECK-NEXT:    vfmacc.vv v24, v8, v16, v0.t
653 ; CHECK-NEXT:    vmv8r.v v8, v24
654 ; CHECK-NEXT:    ret
655   %splat = insertelement <vscale x 32 x i1> poison, i1 -1, i32 0
656   %allones = shufflevector <vscale x 32 x i1> %splat, <vscale x 32 x i1> poison, <vscale x 32 x i32> zeroinitializer
657   %v = call <vscale x 32 x half> @llvm.vp.fma.nxv32f16(<vscale x 32 x half> %a, <vscale x 32 x half> %b, <vscale x 32 x half> %c, <vscale x 32 x i1> %allones, i32 %evl)
658   %u = call <vscale x 32 x half> @llvm.vp.merge.nxv32f16(<vscale x 32 x i1> %m, <vscale x 32 x half> %v, <vscale x 32 x half> %c, i32 %evl)
659   ret <vscale x 32 x half> %u
662 define <vscale x 32 x half> @vfmacc_vv_nxv32f16_unmasked(<vscale x 32 x half> %a, <vscale x 32 x half> %b, <vscale x 32 x half> %c, <vscale x 32 x i1> %m, i32 zeroext %evl) {
663 ; CHECK-LABEL: vfmacc_vv_nxv32f16_unmasked:
664 ; CHECK:       # %bb.0:
665 ; CHECK-NEXT:    vl8re16.v v24, (a0)
666 ; CHECK-NEXT:    vsetvli zero, a1, e16, m8, tu, ma
667 ; CHECK-NEXT:    vfmacc.vv v24, v8, v16
668 ; CHECK-NEXT:    vmv8r.v v8, v24
669 ; CHECK-NEXT:    ret
670   %splat = insertelement <vscale x 32 x i1> poison, i1 -1, i32 0
671   %allones = shufflevector <vscale x 32 x i1> %splat, <vscale x 32 x i1> poison, <vscale x 32 x i32> zeroinitializer
672   %v = call <vscale x 32 x half> @llvm.vp.fma.nxv32f16(<vscale x 32 x half> %a, <vscale x 32 x half> %b, <vscale x 32 x half> %c, <vscale x 32 x i1> %allones, i32 %evl)
673   %u = call <vscale x 32 x half> @llvm.vp.merge.nxv32f16(<vscale x 32 x i1> %allones, <vscale x 32 x half> %v, <vscale x 32 x half> %c, i32 %evl)
674   ret <vscale x 32 x half> %u
677 define <vscale x 32 x half> @vfmacc_vf_nxv32f16(<vscale x 32 x half> %va, half %b, <vscale x 32 x half> %c, <vscale x 32 x i1> %m, i32 zeroext %evl) {
678 ; CHECK-LABEL: vfmacc_vf_nxv32f16:
679 ; CHECK:       # %bb.0:
680 ; CHECK-NEXT:    vsetvli zero, a0, e16, m8, tu, mu
681 ; CHECK-NEXT:    vfmacc.vf v16, fa0, v8, v0.t
682 ; CHECK-NEXT:    vmv8r.v v8, v16
683 ; CHECK-NEXT:    ret
684   %elt.head = insertelement <vscale x 32 x half> poison, half %b, i32 0
685   %vb = shufflevector <vscale x 32 x half> %elt.head, <vscale x 32 x half> poison, <vscale x 32 x i32> zeroinitializer
686   %splat = insertelement <vscale x 32 x i1> poison, i1 -1, i32 0
687   %allones = shufflevector <vscale x 32 x i1> %splat, <vscale x 32 x i1> poison, <vscale x 32 x i32> zeroinitializer
688   %v = call <vscale x 32 x half> @llvm.vp.fma.nxv32f16(<vscale x 32 x half> %va, <vscale x 32 x half> %vb, <vscale x 32 x half> %c, <vscale x 32 x i1> %allones, i32 %evl)
689   %u = call <vscale x 32 x half> @llvm.vp.merge.nxv32f16(<vscale x 32 x i1> %m, <vscale x 32 x half> %v, <vscale x 32 x half> %c, i32 %evl)
690   ret <vscale x 32 x half> %u
693 define <vscale x 32 x half> @vfmacc_vf_nxv32f16_commute(<vscale x 32 x half> %va, half %b, <vscale x 32 x half> %c, <vscale x 32 x i1> %m, i32 zeroext %evl) {
694 ; CHECK-LABEL: vfmacc_vf_nxv32f16_commute:
695 ; CHECK:       # %bb.0:
696 ; CHECK-NEXT:    vsetvli zero, a0, e16, m8, tu, mu
697 ; CHECK-NEXT:    vfmacc.vf v16, fa0, v8, v0.t
698 ; CHECK-NEXT:    vmv8r.v v8, v16
699 ; CHECK-NEXT:    ret
700   %elt.head = insertelement <vscale x 32 x half> poison, half %b, i32 0
701   %vb = shufflevector <vscale x 32 x half> %elt.head, <vscale x 32 x half> poison, <vscale x 32 x i32> zeroinitializer
702   %splat = insertelement <vscale x 32 x i1> poison, i1 -1, i32 0
703   %allones = shufflevector <vscale x 32 x i1> %splat, <vscale x 32 x i1> poison, <vscale x 32 x i32> zeroinitializer
704   %v = call <vscale x 32 x half> @llvm.vp.fma.nxv32f16(<vscale x 32 x half> %vb, <vscale x 32 x half> %va, <vscale x 32 x half> %c, <vscale x 32 x i1> %allones, i32 %evl)
705   %u = call <vscale x 32 x half> @llvm.vp.merge.nxv32f16(<vscale x 32 x i1> %m, <vscale x 32 x half> %v, <vscale x 32 x half> %c, i32 %evl)
706   ret <vscale x 32 x half> %u
709 define <vscale x 32 x half> @vfmacc_vf_nxv32f16_unmasked(<vscale x 32 x half> %va, half %b, <vscale x 32 x half> %c, i32 zeroext %evl) {
710 ; CHECK-LABEL: vfmacc_vf_nxv32f16_unmasked:
711 ; CHECK:       # %bb.0:
712 ; CHECK-NEXT:    vsetvli zero, a0, e16, m8, tu, ma
713 ; CHECK-NEXT:    vfmacc.vf v16, fa0, v8
714 ; CHECK-NEXT:    vmv8r.v v8, v16
715 ; CHECK-NEXT:    ret
716   %elt.head = insertelement <vscale x 32 x half> poison, half %b, i32 0
717   %vb = shufflevector <vscale x 32 x half> %elt.head, <vscale x 32 x half> poison, <vscale x 32 x i32> zeroinitializer
718   %splat = insertelement <vscale x 32 x i1> poison, i1 -1, i32 0
719   %allones = shufflevector <vscale x 32 x i1> %splat, <vscale x 32 x i1> poison, <vscale x 32 x i32> zeroinitializer
720   %v = call <vscale x 32 x half> @llvm.vp.fma.nxv32f16(<vscale x 32 x half> %va, <vscale x 32 x half> %vb, <vscale x 32 x half> %c, <vscale x 32 x i1> %allones, i32 %evl)
721   %u = call <vscale x 32 x half> @llvm.vp.merge.nxv32f16(<vscale x 32 x i1> %allones, <vscale x 32 x half> %v, <vscale x 32 x half> %c, i32 %evl)
722   ret <vscale x 32 x half> %u
725 define <vscale x 32 x half> @vfmacc_vv_nxv32f16_ta(<vscale x 32 x half> %a, <vscale x 32 x half> %b, <vscale x 32 x half> %c, <vscale x 32 x i1> %m, i32 zeroext %evl) {
726 ; CHECK-LABEL: vfmacc_vv_nxv32f16_ta:
727 ; CHECK:       # %bb.0:
728 ; CHECK-NEXT:    vl8re16.v v24, (a0)
729 ; CHECK-NEXT:    vsetvli zero, a1, e16, m8, ta, mu
730 ; CHECK-NEXT:    vfmacc.vv v24, v8, v16, v0.t
731 ; CHECK-NEXT:    vmv.v.v v8, v24
732 ; CHECK-NEXT:    ret
733   %splat = insertelement <vscale x 32 x i1> poison, i1 -1, i32 0
734   %allones = shufflevector <vscale x 32 x i1> %splat, <vscale x 32 x i1> poison, <vscale x 32 x i32> zeroinitializer
735   %v = call <vscale x 32 x half> @llvm.vp.fma.nxv32f16(<vscale x 32 x half> %a, <vscale x 32 x half> %b, <vscale x 32 x half> %c, <vscale x 32 x i1> %allones, i32 %evl)
736   %u = call <vscale x 32 x half> @llvm.vp.select.nxv32f16(<vscale x 32 x i1> %m, <vscale x 32 x half> %v, <vscale x 32 x half> %c, i32 %evl)
737   ret <vscale x 32 x half> %u
740 define <vscale x 32 x half> @vfmacc_vf_nxv32f16_ta(<vscale x 32 x half> %va, half %b, <vscale x 32 x half> %c, <vscale x 32 x i1> %m, i32 zeroext %evl) {
741 ; CHECK-LABEL: vfmacc_vf_nxv32f16_ta:
742 ; CHECK:       # %bb.0:
743 ; CHECK-NEXT:    vsetvli zero, a0, e16, m8, ta, mu
744 ; CHECK-NEXT:    vfmacc.vf v16, fa0, v8, v0.t
745 ; CHECK-NEXT:    vmv.v.v v8, v16
746 ; CHECK-NEXT:    ret
747   %elt.head = insertelement <vscale x 32 x half> poison, half %b, i32 0
748   %vb = shufflevector <vscale x 32 x half> %elt.head, <vscale x 32 x half> poison, <vscale x 32 x i32> zeroinitializer
749   %splat = insertelement <vscale x 32 x i1> poison, i1 -1, i32 0
750   %allones = shufflevector <vscale x 32 x i1> %splat, <vscale x 32 x i1> poison, <vscale x 32 x i32> zeroinitializer
751   %v = call <vscale x 32 x half> @llvm.vp.fma.nxv32f16(<vscale x 32 x half> %va, <vscale x 32 x half> %vb, <vscale x 32 x half> %c, <vscale x 32 x i1> %allones, i32 %evl)
752   %u = call <vscale x 32 x half> @llvm.vp.select.nxv32f16(<vscale x 32 x i1> %m, <vscale x 32 x half> %v, <vscale x 32 x half> %c, i32 %evl)
753   ret <vscale x 32 x half> %u
756 define <vscale x 32 x half> @vfmacc_vf_nxv32f16_commute_ta(<vscale x 32 x half> %va, half %b, <vscale x 32 x half> %c, <vscale x 32 x i1> %m, i32 zeroext %evl) {
757 ; CHECK-LABEL: vfmacc_vf_nxv32f16_commute_ta:
758 ; CHECK:       # %bb.0:
759 ; CHECK-NEXT:    vsetvli zero, a0, e16, m8, ta, mu
760 ; CHECK-NEXT:    vfmacc.vf v16, fa0, v8, v0.t
761 ; CHECK-NEXT:    vmv.v.v v8, v16
762 ; CHECK-NEXT:    ret
763   %elt.head = insertelement <vscale x 32 x half> poison, half %b, i32 0
764   %vb = shufflevector <vscale x 32 x half> %elt.head, <vscale x 32 x half> poison, <vscale x 32 x i32> zeroinitializer
765   %splat = insertelement <vscale x 32 x i1> poison, i1 -1, i32 0
766   %allones = shufflevector <vscale x 32 x i1> %splat, <vscale x 32 x i1> poison, <vscale x 32 x i32> zeroinitializer
767   %v = call <vscale x 32 x half> @llvm.vp.fma.nxv32f16(<vscale x 32 x half> %vb, <vscale x 32 x half> %va, <vscale x 32 x half> %c, <vscale x 32 x i1> %allones, i32 %evl)
768   %u = call <vscale x 32 x half> @llvm.vp.select.nxv32f16(<vscale x 32 x i1> %m, <vscale x 32 x half> %v, <vscale x 32 x half> %c, i32 %evl)
769   ret <vscale x 32 x half> %u
772 declare <vscale x 1 x float> @llvm.vp.fma.nxv1f32(<vscale x 1 x float>, <vscale x 1 x float>, <vscale x 1 x float>, <vscale x 1 x i1>, i32)
773 declare <vscale x 1 x float> @llvm.vp.fneg.nxv1f32(<vscale x 1 x float>, <vscale x 1 x i1>, i32)
774 declare <vscale x 1 x float> @llvm.vp.merge.nxv1f32(<vscale x 1 x i1>, <vscale x 1 x float>, <vscale x 1 x float>, i32)
775 declare <vscale x 1 x float> @llvm.vp.select.nxv1f32(<vscale x 1 x i1>, <vscale x 1 x float>, <vscale x 1 x float>, i32)
777 define <vscale x 1 x float> @vfmacc_vv_nxv1f32(<vscale x 1 x float> %a, <vscale x 1 x float> %b, <vscale x 1 x float> %c, <vscale x 1 x i1> %m, i32 zeroext %evl) {
778 ; CHECK-LABEL: vfmacc_vv_nxv1f32:
779 ; CHECK:       # %bb.0:
780 ; CHECK-NEXT:    vsetvli zero, a0, e32, mf2, tu, mu
781 ; CHECK-NEXT:    vfmacc.vv v10, v8, v9, v0.t
782 ; CHECK-NEXT:    vmv1r.v v8, v10
783 ; CHECK-NEXT:    ret
784   %splat = insertelement <vscale x 1 x i1> poison, i1 -1, i32 0
785   %allones = shufflevector <vscale x 1 x i1> %splat, <vscale x 1 x i1> poison, <vscale x 1 x i32> zeroinitializer
786   %v = call <vscale x 1 x float> @llvm.vp.fma.nxv1f32(<vscale x 1 x float> %a, <vscale x 1 x float> %b, <vscale x 1 x float> %c, <vscale x 1 x i1> %allones, i32 %evl)
787   %u = call <vscale x 1 x float> @llvm.vp.merge.nxv1f32(<vscale x 1 x i1> %m, <vscale x 1 x float> %v, <vscale x 1 x float> %c, i32 %evl)
788   ret <vscale x 1 x float> %u
791 define <vscale x 1 x float> @vfmacc_vv_nxv1f32_unmasked(<vscale x 1 x float> %a, <vscale x 1 x float> %b, <vscale x 1 x float> %c, <vscale x 1 x i1> %m, i32 zeroext %evl) {
792 ; CHECK-LABEL: vfmacc_vv_nxv1f32_unmasked:
793 ; CHECK:       # %bb.0:
794 ; CHECK-NEXT:    vsetvli zero, a0, e32, mf2, tu, ma
795 ; CHECK-NEXT:    vfmacc.vv v10, v8, v9
796 ; CHECK-NEXT:    vmv1r.v v8, v10
797 ; CHECK-NEXT:    ret
798   %splat = insertelement <vscale x 1 x i1> poison, i1 -1, i32 0
799   %allones = shufflevector <vscale x 1 x i1> %splat, <vscale x 1 x i1> poison, <vscale x 1 x i32> zeroinitializer
800   %v = call <vscale x 1 x float> @llvm.vp.fma.nxv1f32(<vscale x 1 x float> %a, <vscale x 1 x float> %b, <vscale x 1 x float> %c, <vscale x 1 x i1> %allones, i32 %evl)
801   %u = call <vscale x 1 x float> @llvm.vp.merge.nxv1f32(<vscale x 1 x i1> %allones, <vscale x 1 x float> %v, <vscale x 1 x float> %c, i32 %evl)
802   ret <vscale x 1 x float> %u
805 define <vscale x 1 x float> @vfmacc_vf_nxv1f32(<vscale x 1 x float> %va, float %b, <vscale x 1 x float> %c, <vscale x 1 x i1> %m, i32 zeroext %evl) {
806 ; CHECK-LABEL: vfmacc_vf_nxv1f32:
807 ; CHECK:       # %bb.0:
808 ; CHECK-NEXT:    vsetvli zero, a0, e32, mf2, tu, mu
809 ; CHECK-NEXT:    vfmacc.vf v9, fa0, v8, v0.t
810 ; CHECK-NEXT:    vmv1r.v v8, v9
811 ; CHECK-NEXT:    ret
812   %elt.head = insertelement <vscale x 1 x float> poison, float %b, i32 0
813   %vb = shufflevector <vscale x 1 x float> %elt.head, <vscale x 1 x float> poison, <vscale x 1 x i32> zeroinitializer
814   %splat = insertelement <vscale x 1 x i1> poison, i1 -1, i32 0
815   %allones = shufflevector <vscale x 1 x i1> %splat, <vscale x 1 x i1> poison, <vscale x 1 x i32> zeroinitializer
816   %v = call <vscale x 1 x float> @llvm.vp.fma.nxv1f32(<vscale x 1 x float> %va, <vscale x 1 x float> %vb, <vscale x 1 x float> %c, <vscale x 1 x i1> %allones, i32 %evl)
817   %u = call <vscale x 1 x float> @llvm.vp.merge.nxv1f32(<vscale x 1 x i1> %m, <vscale x 1 x float> %v, <vscale x 1 x float> %c, i32 %evl)
818   ret <vscale x 1 x float> %u
821 define <vscale x 1 x float> @vfmacc_vf_nxv1f32_commute(<vscale x 1 x float> %va, float %b, <vscale x 1 x float> %c, <vscale x 1 x i1> %m, i32 zeroext %evl) {
822 ; CHECK-LABEL: vfmacc_vf_nxv1f32_commute:
823 ; CHECK:       # %bb.0:
824 ; CHECK-NEXT:    vsetvli zero, a0, e32, mf2, tu, mu
825 ; CHECK-NEXT:    vfmacc.vf v9, fa0, v8, v0.t
826 ; CHECK-NEXT:    vmv1r.v v8, v9
827 ; CHECK-NEXT:    ret
828   %elt.head = insertelement <vscale x 1 x float> poison, float %b, i32 0
829   %vb = shufflevector <vscale x 1 x float> %elt.head, <vscale x 1 x float> poison, <vscale x 1 x i32> zeroinitializer
830   %splat = insertelement <vscale x 1 x i1> poison, i1 -1, i32 0
831   %allones = shufflevector <vscale x 1 x i1> %splat, <vscale x 1 x i1> poison, <vscale x 1 x i32> zeroinitializer
832   %v = call <vscale x 1 x float> @llvm.vp.fma.nxv1f32(<vscale x 1 x float> %vb, <vscale x 1 x float> %va, <vscale x 1 x float> %c, <vscale x 1 x i1> %allones, i32 %evl)
833   %u = call <vscale x 1 x float> @llvm.vp.merge.nxv1f32(<vscale x 1 x i1> %m, <vscale x 1 x float> %v, <vscale x 1 x float> %c, i32 %evl)
834   ret <vscale x 1 x float> %u
837 define <vscale x 1 x float> @vfmacc_vf_nxv1f32_unmasked(<vscale x 1 x float> %va, float %b, <vscale x 1 x float> %c, i32 zeroext %evl) {
838 ; CHECK-LABEL: vfmacc_vf_nxv1f32_unmasked:
839 ; CHECK:       # %bb.0:
840 ; CHECK-NEXT:    vsetvli zero, a0, e32, mf2, tu, ma
841 ; CHECK-NEXT:    vfmacc.vf v9, fa0, v8
842 ; CHECK-NEXT:    vmv1r.v v8, v9
843 ; CHECK-NEXT:    ret
844   %elt.head = insertelement <vscale x 1 x float> poison, float %b, i32 0
845   %vb = shufflevector <vscale x 1 x float> %elt.head, <vscale x 1 x float> poison, <vscale x 1 x i32> zeroinitializer
846   %splat = insertelement <vscale x 1 x i1> poison, i1 -1, i32 0
847   %allones = shufflevector <vscale x 1 x i1> %splat, <vscale x 1 x i1> poison, <vscale x 1 x i32> zeroinitializer
848   %v = call <vscale x 1 x float> @llvm.vp.fma.nxv1f32(<vscale x 1 x float> %va, <vscale x 1 x float> %vb, <vscale x 1 x float> %c, <vscale x 1 x i1> %allones, i32 %evl)
849   %u = call <vscale x 1 x float> @llvm.vp.merge.nxv1f32(<vscale x 1 x i1> %allones, <vscale x 1 x float> %v, <vscale x 1 x float> %c, i32 %evl)
850   ret <vscale x 1 x float> %u
853 define <vscale x 1 x float> @vfmacc_vv_nxv1f32_ta(<vscale x 1 x float> %a, <vscale x 1 x float> %b, <vscale x 1 x float> %c, <vscale x 1 x i1> %m, i32 zeroext %evl) {
854 ; CHECK-LABEL: vfmacc_vv_nxv1f32_ta:
855 ; CHECK:       # %bb.0:
856 ; CHECK-NEXT:    vsetvli zero, a0, e32, mf2, ta, mu
857 ; CHECK-NEXT:    vfmacc.vv v10, v8, v9, v0.t
858 ; CHECK-NEXT:    vmv1r.v v8, v10
859 ; CHECK-NEXT:    ret
860   %splat = insertelement <vscale x 1 x i1> poison, i1 -1, i32 0
861   %allones = shufflevector <vscale x 1 x i1> %splat, <vscale x 1 x i1> poison, <vscale x 1 x i32> zeroinitializer
862   %v = call <vscale x 1 x float> @llvm.vp.fma.nxv1f32(<vscale x 1 x float> %a, <vscale x 1 x float> %b, <vscale x 1 x float> %c, <vscale x 1 x i1> %allones, i32 %evl)
863   %u = call <vscale x 1 x float> @llvm.vp.select.nxv1f32(<vscale x 1 x i1> %m, <vscale x 1 x float> %v, <vscale x 1 x float> %c, i32 %evl)
864   ret <vscale x 1 x float> %u
867 define <vscale x 1 x float> @vfmacc_vf_nxv1f32_ta(<vscale x 1 x float> %va, float %b, <vscale x 1 x float> %c, <vscale x 1 x i1> %m, i32 zeroext %evl) {
868 ; CHECK-LABEL: vfmacc_vf_nxv1f32_ta:
869 ; CHECK:       # %bb.0:
870 ; CHECK-NEXT:    vsetvli zero, a0, e32, mf2, ta, mu
871 ; CHECK-NEXT:    vfmacc.vf v9, fa0, v8, v0.t
872 ; CHECK-NEXT:    vmv1r.v v8, v9
873 ; CHECK-NEXT:    ret
874   %elt.head = insertelement <vscale x 1 x float> poison, float %b, i32 0
875   %vb = shufflevector <vscale x 1 x float> %elt.head, <vscale x 1 x float> poison, <vscale x 1 x i32> zeroinitializer
876   %splat = insertelement <vscale x 1 x i1> poison, i1 -1, i32 0
877   %allones = shufflevector <vscale x 1 x i1> %splat, <vscale x 1 x i1> poison, <vscale x 1 x i32> zeroinitializer
878   %v = call <vscale x 1 x float> @llvm.vp.fma.nxv1f32(<vscale x 1 x float> %va, <vscale x 1 x float> %vb, <vscale x 1 x float> %c, <vscale x 1 x i1> %allones, i32 %evl)
879   %u = call <vscale x 1 x float> @llvm.vp.select.nxv1f32(<vscale x 1 x i1> %m, <vscale x 1 x float> %v, <vscale x 1 x float> %c, i32 %evl)
880   ret <vscale x 1 x float> %u
883 define <vscale x 1 x float> @vfmacc_vf_nxv1f32_commute_ta(<vscale x 1 x float> %va, float %b, <vscale x 1 x float> %c, <vscale x 1 x i1> %m, i32 zeroext %evl) {
884 ; CHECK-LABEL: vfmacc_vf_nxv1f32_commute_ta:
885 ; CHECK:       # %bb.0:
886 ; CHECK-NEXT:    vsetvli zero, a0, e32, mf2, ta, mu
887 ; CHECK-NEXT:    vfmacc.vf v9, fa0, v8, v0.t
888 ; CHECK-NEXT:    vmv1r.v v8, v9
889 ; CHECK-NEXT:    ret
890   %elt.head = insertelement <vscale x 1 x float> poison, float %b, i32 0
891   %vb = shufflevector <vscale x 1 x float> %elt.head, <vscale x 1 x float> poison, <vscale x 1 x i32> zeroinitializer
892   %splat = insertelement <vscale x 1 x i1> poison, i1 -1, i32 0
893   %allones = shufflevector <vscale x 1 x i1> %splat, <vscale x 1 x i1> poison, <vscale x 1 x i32> zeroinitializer
894   %v = call <vscale x 1 x float> @llvm.vp.fma.nxv1f32(<vscale x 1 x float> %vb, <vscale x 1 x float> %va, <vscale x 1 x float> %c, <vscale x 1 x i1> %allones, i32 %evl)
895   %u = call <vscale x 1 x float> @llvm.vp.select.nxv1f32(<vscale x 1 x i1> %m, <vscale x 1 x float> %v, <vscale x 1 x float> %c, i32 %evl)
896   ret <vscale x 1 x float> %u
899 declare <vscale x 2 x float> @llvm.vp.fma.nxv2f32(<vscale x 2 x float>, <vscale x 2 x float>, <vscale x 2 x float>, <vscale x 2 x i1>, i32)
900 declare <vscale x 2 x float> @llvm.vp.fneg.nxv2f32(<vscale x 2 x float>, <vscale x 2 x i1>, i32)
901 declare <vscale x 2 x float> @llvm.vp.merge.nxv2f32(<vscale x 2 x i1>, <vscale x 2 x float>, <vscale x 2 x float>, i32)
902 declare <vscale x 2 x float> @llvm.vp.select.nxv2f32(<vscale x 2 x i1>, <vscale x 2 x float>, <vscale x 2 x float>, i32)
904 define <vscale x 2 x float> @vfmacc_vv_nxv2f32(<vscale x 2 x float> %a, <vscale x 2 x float> %b, <vscale x 2 x float> %c, <vscale x 2 x i1> %m, i32 zeroext %evl) {
905 ; CHECK-LABEL: vfmacc_vv_nxv2f32:
906 ; CHECK:       # %bb.0:
907 ; CHECK-NEXT:    vsetvli zero, a0, e32, m1, tu, mu
908 ; CHECK-NEXT:    vfmacc.vv v10, v8, v9, v0.t
909 ; CHECK-NEXT:    vmv1r.v v8, v10
910 ; CHECK-NEXT:    ret
911   %splat = insertelement <vscale x 2 x i1> poison, i1 -1, i32 0
912   %allones = shufflevector <vscale x 2 x i1> %splat, <vscale x 2 x i1> poison, <vscale x 2 x i32> zeroinitializer
913   %v = call <vscale x 2 x float> @llvm.vp.fma.nxv2f32(<vscale x 2 x float> %a, <vscale x 2 x float> %b, <vscale x 2 x float> %c, <vscale x 2 x i1> %allones, i32 %evl)
914   %u = call <vscale x 2 x float> @llvm.vp.merge.nxv2f32(<vscale x 2 x i1> %m, <vscale x 2 x float> %v, <vscale x 2 x float> %c, i32 %evl)
915   ret <vscale x 2 x float> %u
918 define <vscale x 2 x float> @vfmacc_vv_nxv2f32_unmasked(<vscale x 2 x float> %a, <vscale x 2 x float> %b, <vscale x 2 x float> %c, <vscale x 2 x i1> %m, i32 zeroext %evl) {
919 ; CHECK-LABEL: vfmacc_vv_nxv2f32_unmasked:
920 ; CHECK:       # %bb.0:
921 ; CHECK-NEXT:    vsetvli zero, a0, e32, m1, tu, ma
922 ; CHECK-NEXT:    vfmacc.vv v10, v8, v9
923 ; CHECK-NEXT:    vmv1r.v v8, v10
924 ; CHECK-NEXT:    ret
925   %splat = insertelement <vscale x 2 x i1> poison, i1 -1, i32 0
926   %allones = shufflevector <vscale x 2 x i1> %splat, <vscale x 2 x i1> poison, <vscale x 2 x i32> zeroinitializer
927   %v = call <vscale x 2 x float> @llvm.vp.fma.nxv2f32(<vscale x 2 x float> %a, <vscale x 2 x float> %b, <vscale x 2 x float> %c, <vscale x 2 x i1> %allones, i32 %evl)
928   %u = call <vscale x 2 x float> @llvm.vp.merge.nxv2f32(<vscale x 2 x i1> %allones, <vscale x 2 x float> %v, <vscale x 2 x float> %c, i32 %evl)
929   ret <vscale x 2 x float> %u
932 define <vscale x 2 x float> @vfmacc_vf_nxv2f32(<vscale x 2 x float> %va, float %b, <vscale x 2 x float> %c, <vscale x 2 x i1> %m, i32 zeroext %evl) {
933 ; CHECK-LABEL: vfmacc_vf_nxv2f32:
934 ; CHECK:       # %bb.0:
935 ; CHECK-NEXT:    vsetvli zero, a0, e32, m1, tu, mu
936 ; CHECK-NEXT:    vfmacc.vf v9, fa0, v8, v0.t
937 ; CHECK-NEXT:    vmv1r.v v8, v9
938 ; CHECK-NEXT:    ret
939   %elt.head = insertelement <vscale x 2 x float> poison, float %b, i32 0
940   %vb = shufflevector <vscale x 2 x float> %elt.head, <vscale x 2 x float> poison, <vscale x 2 x i32> zeroinitializer
941   %splat = insertelement <vscale x 2 x i1> poison, i1 -1, i32 0
942   %allones = shufflevector <vscale x 2 x i1> %splat, <vscale x 2 x i1> poison, <vscale x 2 x i32> zeroinitializer
943   %v = call <vscale x 2 x float> @llvm.vp.fma.nxv2f32(<vscale x 2 x float> %va, <vscale x 2 x float> %vb, <vscale x 2 x float> %c, <vscale x 2 x i1> %allones, i32 %evl)
944   %u = call <vscale x 2 x float> @llvm.vp.merge.nxv2f32(<vscale x 2 x i1> %m, <vscale x 2 x float> %v, <vscale x 2 x float> %c, i32 %evl)
945   ret <vscale x 2 x float> %u
948 define <vscale x 2 x float> @vfmacc_vf_nxv2f32_commute(<vscale x 2 x float> %va, float %b, <vscale x 2 x float> %c, <vscale x 2 x i1> %m, i32 zeroext %evl) {
949 ; CHECK-LABEL: vfmacc_vf_nxv2f32_commute:
950 ; CHECK:       # %bb.0:
951 ; CHECK-NEXT:    vsetvli zero, a0, e32, m1, tu, mu
952 ; CHECK-NEXT:    vfmacc.vf v9, fa0, v8, v0.t
953 ; CHECK-NEXT:    vmv1r.v v8, v9
954 ; CHECK-NEXT:    ret
955   %elt.head = insertelement <vscale x 2 x float> poison, float %b, i32 0
956   %vb = shufflevector <vscale x 2 x float> %elt.head, <vscale x 2 x float> poison, <vscale x 2 x i32> zeroinitializer
957   %splat = insertelement <vscale x 2 x i1> poison, i1 -1, i32 0
958   %allones = shufflevector <vscale x 2 x i1> %splat, <vscale x 2 x i1> poison, <vscale x 2 x i32> zeroinitializer
959   %v = call <vscale x 2 x float> @llvm.vp.fma.nxv2f32(<vscale x 2 x float> %vb, <vscale x 2 x float> %va, <vscale x 2 x float> %c, <vscale x 2 x i1> %allones, i32 %evl)
960   %u = call <vscale x 2 x float> @llvm.vp.merge.nxv2f32(<vscale x 2 x i1> %m, <vscale x 2 x float> %v, <vscale x 2 x float> %c, i32 %evl)
961   ret <vscale x 2 x float> %u
964 define <vscale x 2 x float> @vfmacc_vf_nxv2f32_unmasked(<vscale x 2 x float> %va, float %b, <vscale x 2 x float> %c, i32 zeroext %evl) {
965 ; CHECK-LABEL: vfmacc_vf_nxv2f32_unmasked:
966 ; CHECK:       # %bb.0:
967 ; CHECK-NEXT:    vsetvli zero, a0, e32, m1, tu, ma
968 ; CHECK-NEXT:    vfmacc.vf v9, fa0, v8
969 ; CHECK-NEXT:    vmv1r.v v8, v9
970 ; CHECK-NEXT:    ret
971   %elt.head = insertelement <vscale x 2 x float> poison, float %b, i32 0
972   %vb = shufflevector <vscale x 2 x float> %elt.head, <vscale x 2 x float> poison, <vscale x 2 x i32> zeroinitializer
973   %splat = insertelement <vscale x 2 x i1> poison, i1 -1, i32 0
974   %allones = shufflevector <vscale x 2 x i1> %splat, <vscale x 2 x i1> poison, <vscale x 2 x i32> zeroinitializer
975   %v = call <vscale x 2 x float> @llvm.vp.fma.nxv2f32(<vscale x 2 x float> %va, <vscale x 2 x float> %vb, <vscale x 2 x float> %c, <vscale x 2 x i1> %allones, i32 %evl)
976   %u = call <vscale x 2 x float> @llvm.vp.merge.nxv2f32(<vscale x 2 x i1> %allones, <vscale x 2 x float> %v, <vscale x 2 x float> %c, i32 %evl)
977   ret <vscale x 2 x float> %u
980 define <vscale x 2 x float> @vfmacc_vv_nxv2f32_ta(<vscale x 2 x float> %a, <vscale x 2 x float> %b, <vscale x 2 x float> %c, <vscale x 2 x i1> %m, i32 zeroext %evl) {
981 ; CHECK-LABEL: vfmacc_vv_nxv2f32_ta:
982 ; CHECK:       # %bb.0:
983 ; CHECK-NEXT:    vsetvli zero, a0, e32, m1, ta, mu
984 ; CHECK-NEXT:    vfmacc.vv v10, v8, v9, v0.t
985 ; CHECK-NEXT:    vmv.v.v v8, v10
986 ; CHECK-NEXT:    ret
987   %splat = insertelement <vscale x 2 x i1> poison, i1 -1, i32 0
988   %allones = shufflevector <vscale x 2 x i1> %splat, <vscale x 2 x i1> poison, <vscale x 2 x i32> zeroinitializer
989   %v = call <vscale x 2 x float> @llvm.vp.fma.nxv2f32(<vscale x 2 x float> %a, <vscale x 2 x float> %b, <vscale x 2 x float> %c, <vscale x 2 x i1> %allones, i32 %evl)
990   %u = call <vscale x 2 x float> @llvm.vp.select.nxv2f32(<vscale x 2 x i1> %m, <vscale x 2 x float> %v, <vscale x 2 x float> %c, i32 %evl)
991   ret <vscale x 2 x float> %u
994 define <vscale x 2 x float> @vfmacc_vf_nxv2f32_ta(<vscale x 2 x float> %va, float %b, <vscale x 2 x float> %c, <vscale x 2 x i1> %m, i32 zeroext %evl) {
995 ; CHECK-LABEL: vfmacc_vf_nxv2f32_ta:
996 ; CHECK:       # %bb.0:
997 ; CHECK-NEXT:    vsetvli zero, a0, e32, m1, ta, mu
998 ; CHECK-NEXT:    vfmacc.vf v9, fa0, v8, v0.t
999 ; CHECK-NEXT:    vmv.v.v v8, v9
1000 ; CHECK-NEXT:    ret
1001   %elt.head = insertelement <vscale x 2 x float> poison, float %b, i32 0
1002   %vb = shufflevector <vscale x 2 x float> %elt.head, <vscale x 2 x float> poison, <vscale x 2 x i32> zeroinitializer
1003   %splat = insertelement <vscale x 2 x i1> poison, i1 -1, i32 0
1004   %allones = shufflevector <vscale x 2 x i1> %splat, <vscale x 2 x i1> poison, <vscale x 2 x i32> zeroinitializer
1005   %v = call <vscale x 2 x float> @llvm.vp.fma.nxv2f32(<vscale x 2 x float> %va, <vscale x 2 x float> %vb, <vscale x 2 x float> %c, <vscale x 2 x i1> %allones, i32 %evl)
1006   %u = call <vscale x 2 x float> @llvm.vp.select.nxv2f32(<vscale x 2 x i1> %m, <vscale x 2 x float> %v, <vscale x 2 x float> %c, i32 %evl)
1007   ret <vscale x 2 x float> %u
1010 define <vscale x 2 x float> @vfmacc_vf_nxv2f32_commute_ta(<vscale x 2 x float> %va, float %b, <vscale x 2 x float> %c, <vscale x 2 x i1> %m, i32 zeroext %evl) {
1011 ; CHECK-LABEL: vfmacc_vf_nxv2f32_commute_ta:
1012 ; CHECK:       # %bb.0:
1013 ; CHECK-NEXT:    vsetvli zero, a0, e32, m1, ta, mu
1014 ; CHECK-NEXT:    vfmacc.vf v9, fa0, v8, v0.t
1015 ; CHECK-NEXT:    vmv.v.v v8, v9
1016 ; CHECK-NEXT:    ret
1017   %elt.head = insertelement <vscale x 2 x float> poison, float %b, i32 0
1018   %vb = shufflevector <vscale x 2 x float> %elt.head, <vscale x 2 x float> poison, <vscale x 2 x i32> zeroinitializer
1019   %splat = insertelement <vscale x 2 x i1> poison, i1 -1, i32 0
1020   %allones = shufflevector <vscale x 2 x i1> %splat, <vscale x 2 x i1> poison, <vscale x 2 x i32> zeroinitializer
1021   %v = call <vscale x 2 x float> @llvm.vp.fma.nxv2f32(<vscale x 2 x float> %vb, <vscale x 2 x float> %va, <vscale x 2 x float> %c, <vscale x 2 x i1> %allones, i32 %evl)
1022   %u = call <vscale x 2 x float> @llvm.vp.select.nxv2f32(<vscale x 2 x i1> %m, <vscale x 2 x float> %v, <vscale x 2 x float> %c, i32 %evl)
1023   ret <vscale x 2 x float> %u
1026 declare <vscale x 4 x float> @llvm.vp.fma.nxv4f32(<vscale x 4 x float>, <vscale x 4 x float>, <vscale x 4 x float>, <vscale x 4 x i1>, i32)
1027 declare <vscale x 4 x float> @llvm.vp.fneg.nxv4f32(<vscale x 4 x float>, <vscale x 4 x i1>, i32)
1028 declare <vscale x 4 x float> @llvm.vp.merge.nxv4f32(<vscale x 4 x i1>, <vscale x 4 x float>, <vscale x 4 x float>, i32)
1029 declare <vscale x 4 x float> @llvm.vp.select.nxv4f32(<vscale x 4 x i1>, <vscale x 4 x float>, <vscale x 4 x float>, i32)
1031 define <vscale x 4 x float> @vfmacc_vv_nxv4f32(<vscale x 4 x float> %a, <vscale x 4 x float> %b, <vscale x 4 x float> %c, <vscale x 4 x i1> %m, i32 zeroext %evl) {
1032 ; CHECK-LABEL: vfmacc_vv_nxv4f32:
1033 ; CHECK:       # %bb.0:
1034 ; CHECK-NEXT:    vsetvli zero, a0, e32, m2, tu, mu
1035 ; CHECK-NEXT:    vfmacc.vv v12, v8, v10, v0.t
1036 ; CHECK-NEXT:    vmv2r.v v8, v12
1037 ; CHECK-NEXT:    ret
1038   %splat = insertelement <vscale x 4 x i1> poison, i1 -1, i32 0
1039   %allones = shufflevector <vscale x 4 x i1> %splat, <vscale x 4 x i1> poison, <vscale x 4 x i32> zeroinitializer
1040   %v = call <vscale x 4 x float> @llvm.vp.fma.nxv4f32(<vscale x 4 x float> %a, <vscale x 4 x float> %b, <vscale x 4 x float> %c, <vscale x 4 x i1> %allones, i32 %evl)
1041   %u = call <vscale x 4 x float> @llvm.vp.merge.nxv4f32(<vscale x 4 x i1> %m, <vscale x 4 x float> %v, <vscale x 4 x float> %c, i32 %evl)
1042   ret <vscale x 4 x float> %u
1045 define <vscale x 4 x float> @vfmacc_vv_nxv4f32_unmasked(<vscale x 4 x float> %a, <vscale x 4 x float> %b, <vscale x 4 x float> %c, <vscale x 4 x i1> %m, i32 zeroext %evl) {
1046 ; CHECK-LABEL: vfmacc_vv_nxv4f32_unmasked:
1047 ; CHECK:       # %bb.0:
1048 ; CHECK-NEXT:    vsetvli zero, a0, e32, m2, tu, ma
1049 ; CHECK-NEXT:    vfmacc.vv v12, v8, v10
1050 ; CHECK-NEXT:    vmv2r.v v8, v12
1051 ; CHECK-NEXT:    ret
1052   %splat = insertelement <vscale x 4 x i1> poison, i1 -1, i32 0
1053   %allones = shufflevector <vscale x 4 x i1> %splat, <vscale x 4 x i1> poison, <vscale x 4 x i32> zeroinitializer
1054   %v = call <vscale x 4 x float> @llvm.vp.fma.nxv4f32(<vscale x 4 x float> %a, <vscale x 4 x float> %b, <vscale x 4 x float> %c, <vscale x 4 x i1> %allones, i32 %evl)
1055   %u = call <vscale x 4 x float> @llvm.vp.merge.nxv4f32(<vscale x 4 x i1> %allones, <vscale x 4 x float> %v, <vscale x 4 x float> %c, i32 %evl)
1056   ret <vscale x 4 x float> %u
1059 define <vscale x 4 x float> @vfmacc_vf_nxv4f32(<vscale x 4 x float> %va, float %b, <vscale x 4 x float> %c, <vscale x 4 x i1> %m, i32 zeroext %evl) {
1060 ; CHECK-LABEL: vfmacc_vf_nxv4f32:
1061 ; CHECK:       # %bb.0:
1062 ; CHECK-NEXT:    vsetvli zero, a0, e32, m2, tu, mu
1063 ; CHECK-NEXT:    vfmacc.vf v10, fa0, v8, v0.t
1064 ; CHECK-NEXT:    vmv2r.v v8, v10
1065 ; CHECK-NEXT:    ret
1066   %elt.head = insertelement <vscale x 4 x float> poison, float %b, i32 0
1067   %vb = shufflevector <vscale x 4 x float> %elt.head, <vscale x 4 x float> poison, <vscale x 4 x i32> zeroinitializer
1068   %splat = insertelement <vscale x 4 x i1> poison, i1 -1, i32 0
1069   %allones = shufflevector <vscale x 4 x i1> %splat, <vscale x 4 x i1> poison, <vscale x 4 x i32> zeroinitializer
1070   %v = call <vscale x 4 x float> @llvm.vp.fma.nxv4f32(<vscale x 4 x float> %va, <vscale x 4 x float> %vb, <vscale x 4 x float> %c, <vscale x 4 x i1> %allones, i32 %evl)
1071   %u = call <vscale x 4 x float> @llvm.vp.merge.nxv4f32(<vscale x 4 x i1> %m, <vscale x 4 x float> %v, <vscale x 4 x float> %c, i32 %evl)
1072   ret <vscale x 4 x float> %u
1075 define <vscale x 4 x float> @vfmacc_vf_nxv4f32_commute(<vscale x 4 x float> %va, float %b, <vscale x 4 x float> %c, <vscale x 4 x i1> %m, i32 zeroext %evl) {
1076 ; CHECK-LABEL: vfmacc_vf_nxv4f32_commute:
1077 ; CHECK:       # %bb.0:
1078 ; CHECK-NEXT:    vsetvli zero, a0, e32, m2, tu, mu
1079 ; CHECK-NEXT:    vfmacc.vf v10, fa0, v8, v0.t
1080 ; CHECK-NEXT:    vmv2r.v v8, v10
1081 ; CHECK-NEXT:    ret
1082   %elt.head = insertelement <vscale x 4 x float> poison, float %b, i32 0
1083   %vb = shufflevector <vscale x 4 x float> %elt.head, <vscale x 4 x float> poison, <vscale x 4 x i32> zeroinitializer
1084   %splat = insertelement <vscale x 4 x i1> poison, i1 -1, i32 0
1085   %allones = shufflevector <vscale x 4 x i1> %splat, <vscale x 4 x i1> poison, <vscale x 4 x i32> zeroinitializer
1086   %v = call <vscale x 4 x float> @llvm.vp.fma.nxv4f32(<vscale x 4 x float> %vb, <vscale x 4 x float> %va, <vscale x 4 x float> %c, <vscale x 4 x i1> %allones, i32 %evl)
1087   %u = call <vscale x 4 x float> @llvm.vp.merge.nxv4f32(<vscale x 4 x i1> %m, <vscale x 4 x float> %v, <vscale x 4 x float> %c, i32 %evl)
1088   ret <vscale x 4 x float> %u
1091 define <vscale x 4 x float> @vfmacc_vf_nxv4f32_unmasked(<vscale x 4 x float> %va, float %b, <vscale x 4 x float> %c, i32 zeroext %evl) {
1092 ; CHECK-LABEL: vfmacc_vf_nxv4f32_unmasked:
1093 ; CHECK:       # %bb.0:
1094 ; CHECK-NEXT:    vsetvli zero, a0, e32, m2, tu, ma
1095 ; CHECK-NEXT:    vfmacc.vf v10, fa0, v8
1096 ; CHECK-NEXT:    vmv2r.v v8, v10
1097 ; CHECK-NEXT:    ret
1098   %elt.head = insertelement <vscale x 4 x float> poison, float %b, i32 0
1099   %vb = shufflevector <vscale x 4 x float> %elt.head, <vscale x 4 x float> poison, <vscale x 4 x i32> zeroinitializer
1100   %splat = insertelement <vscale x 4 x i1> poison, i1 -1, i32 0
1101   %allones = shufflevector <vscale x 4 x i1> %splat, <vscale x 4 x i1> poison, <vscale x 4 x i32> zeroinitializer
1102   %v = call <vscale x 4 x float> @llvm.vp.fma.nxv4f32(<vscale x 4 x float> %va, <vscale x 4 x float> %vb, <vscale x 4 x float> %c, <vscale x 4 x i1> %allones, i32 %evl)
1103   %u = call <vscale x 4 x float> @llvm.vp.merge.nxv4f32(<vscale x 4 x i1> %allones, <vscale x 4 x float> %v, <vscale x 4 x float> %c, i32 %evl)
1104   ret <vscale x 4 x float> %u
1107 define <vscale x 4 x float> @vfmacc_vv_nxv4f32_ta(<vscale x 4 x float> %a, <vscale x 4 x float> %b, <vscale x 4 x float> %c, <vscale x 4 x i1> %m, i32 zeroext %evl) {
1108 ; CHECK-LABEL: vfmacc_vv_nxv4f32_ta:
1109 ; CHECK:       # %bb.0:
1110 ; CHECK-NEXT:    vsetvli zero, a0, e32, m2, ta, mu
1111 ; CHECK-NEXT:    vfmacc.vv v12, v8, v10, v0.t
1112 ; CHECK-NEXT:    vmv.v.v v8, v12
1113 ; CHECK-NEXT:    ret
1114   %splat = insertelement <vscale x 4 x i1> poison, i1 -1, i32 0
1115   %allones = shufflevector <vscale x 4 x i1> %splat, <vscale x 4 x i1> poison, <vscale x 4 x i32> zeroinitializer
1116   %v = call <vscale x 4 x float> @llvm.vp.fma.nxv4f32(<vscale x 4 x float> %a, <vscale x 4 x float> %b, <vscale x 4 x float> %c, <vscale x 4 x i1> %allones, i32 %evl)
1117   %u = call <vscale x 4 x float> @llvm.vp.select.nxv4f32(<vscale x 4 x i1> %m, <vscale x 4 x float> %v, <vscale x 4 x float> %c, i32 %evl)
1118   ret <vscale x 4 x float> %u
1121 define <vscale x 4 x float> @vfmacc_vf_nxv4f32_ta(<vscale x 4 x float> %va, float %b, <vscale x 4 x float> %c, <vscale x 4 x i1> %m, i32 zeroext %evl) {
1122 ; CHECK-LABEL: vfmacc_vf_nxv4f32_ta:
1123 ; CHECK:       # %bb.0:
1124 ; CHECK-NEXT:    vsetvli zero, a0, e32, m2, ta, mu
1125 ; CHECK-NEXT:    vfmacc.vf v10, fa0, v8, v0.t
1126 ; CHECK-NEXT:    vmv.v.v v8, v10
1127 ; CHECK-NEXT:    ret
1128   %elt.head = insertelement <vscale x 4 x float> poison, float %b, i32 0
1129   %vb = shufflevector <vscale x 4 x float> %elt.head, <vscale x 4 x float> poison, <vscale x 4 x i32> zeroinitializer
1130   %splat = insertelement <vscale x 4 x i1> poison, i1 -1, i32 0
1131   %allones = shufflevector <vscale x 4 x i1> %splat, <vscale x 4 x i1> poison, <vscale x 4 x i32> zeroinitializer
1132   %v = call <vscale x 4 x float> @llvm.vp.fma.nxv4f32(<vscale x 4 x float> %va, <vscale x 4 x float> %vb, <vscale x 4 x float> %c, <vscale x 4 x i1> %allones, i32 %evl)
1133   %u = call <vscale x 4 x float> @llvm.vp.select.nxv4f32(<vscale x 4 x i1> %m, <vscale x 4 x float> %v, <vscale x 4 x float> %c, i32 %evl)
1134   ret <vscale x 4 x float> %u
1137 define <vscale x 4 x float> @vfmacc_vf_nxv4f32_commute_ta(<vscale x 4 x float> %va, float %b, <vscale x 4 x float> %c, <vscale x 4 x i1> %m, i32 zeroext %evl) {
1138 ; CHECK-LABEL: vfmacc_vf_nxv4f32_commute_ta:
1139 ; CHECK:       # %bb.0:
1140 ; CHECK-NEXT:    vsetvli zero, a0, e32, m2, ta, mu
1141 ; CHECK-NEXT:    vfmacc.vf v10, fa0, v8, v0.t
1142 ; CHECK-NEXT:    vmv.v.v v8, v10
1143 ; CHECK-NEXT:    ret
1144   %elt.head = insertelement <vscale x 4 x float> poison, float %b, i32 0
1145   %vb = shufflevector <vscale x 4 x float> %elt.head, <vscale x 4 x float> poison, <vscale x 4 x i32> zeroinitializer
1146   %splat = insertelement <vscale x 4 x i1> poison, i1 -1, i32 0
1147   %allones = shufflevector <vscale x 4 x i1> %splat, <vscale x 4 x i1> poison, <vscale x 4 x i32> zeroinitializer
1148   %v = call <vscale x 4 x float> @llvm.vp.fma.nxv4f32(<vscale x 4 x float> %vb, <vscale x 4 x float> %va, <vscale x 4 x float> %c, <vscale x 4 x i1> %allones, i32 %evl)
1149   %u = call <vscale x 4 x float> @llvm.vp.select.nxv4f32(<vscale x 4 x i1> %m, <vscale x 4 x float> %v, <vscale x 4 x float> %c, i32 %evl)
1150   ret <vscale x 4 x float> %u
1153 declare <vscale x 8 x float> @llvm.vp.fma.nxv8f32(<vscale x 8 x float>, <vscale x 8 x float>, <vscale x 8 x float>, <vscale x 8 x i1>, i32)
1154 declare <vscale x 8 x float> @llvm.vp.fneg.nxv8f32(<vscale x 8 x float>, <vscale x 8 x i1>, i32)
1155 declare <vscale x 8 x float> @llvm.vp.merge.nxv8f32(<vscale x 8 x i1>, <vscale x 8 x float>, <vscale x 8 x float>, i32)
1156 declare <vscale x 8 x float> @llvm.vp.select.nxv8f32(<vscale x 8 x i1>, <vscale x 8 x float>, <vscale x 8 x float>, i32)
1158 define <vscale x 8 x float> @vfmacc_vv_nxv8f32(<vscale x 8 x float> %a, <vscale x 8 x float> %b, <vscale x 8 x float> %c, <vscale x 8 x i1> %m, i32 zeroext %evl) {
1159 ; CHECK-LABEL: vfmacc_vv_nxv8f32:
1160 ; CHECK:       # %bb.0:
1161 ; CHECK-NEXT:    vsetvli zero, a0, e32, m4, tu, mu
1162 ; CHECK-NEXT:    vfmacc.vv v16, v8, v12, v0.t
1163 ; CHECK-NEXT:    vmv4r.v v8, v16
1164 ; CHECK-NEXT:    ret
1165   %splat = insertelement <vscale x 8 x i1> poison, i1 -1, i32 0
1166   %allones = shufflevector <vscale x 8 x i1> %splat, <vscale x 8 x i1> poison, <vscale x 8 x i32> zeroinitializer
1167   %v = call <vscale x 8 x float> @llvm.vp.fma.nxv8f32(<vscale x 8 x float> %a, <vscale x 8 x float> %b, <vscale x 8 x float> %c, <vscale x 8 x i1> %allones, i32 %evl)
1168   %u = call <vscale x 8 x float> @llvm.vp.merge.nxv8f32(<vscale x 8 x i1> %m, <vscale x 8 x float> %v, <vscale x 8 x float> %c, i32 %evl)
1169   ret <vscale x 8 x float> %u
1172 define <vscale x 8 x float> @vfmacc_vv_nxv8f32_unmasked(<vscale x 8 x float> %a, <vscale x 8 x float> %b, <vscale x 8 x float> %c, <vscale x 8 x i1> %m, i32 zeroext %evl) {
1173 ; CHECK-LABEL: vfmacc_vv_nxv8f32_unmasked:
1174 ; CHECK:       # %bb.0:
1175 ; CHECK-NEXT:    vsetvli zero, a0, e32, m4, tu, ma
1176 ; CHECK-NEXT:    vfmacc.vv v16, v8, v12
1177 ; CHECK-NEXT:    vmv4r.v v8, v16
1178 ; CHECK-NEXT:    ret
1179   %splat = insertelement <vscale x 8 x i1> poison, i1 -1, i32 0
1180   %allones = shufflevector <vscale x 8 x i1> %splat, <vscale x 8 x i1> poison, <vscale x 8 x i32> zeroinitializer
1181   %v = call <vscale x 8 x float> @llvm.vp.fma.nxv8f32(<vscale x 8 x float> %a, <vscale x 8 x float> %b, <vscale x 8 x float> %c, <vscale x 8 x i1> %allones, i32 %evl)
1182   %u = call <vscale x 8 x float> @llvm.vp.merge.nxv8f32(<vscale x 8 x i1> %allones, <vscale x 8 x float> %v, <vscale x 8 x float> %c, i32 %evl)
1183   ret <vscale x 8 x float> %u
1186 define <vscale x 8 x float> @vfmacc_vf_nxv8f32(<vscale x 8 x float> %va, float %b, <vscale x 8 x float> %c, <vscale x 8 x i1> %m, i32 zeroext %evl) {
1187 ; CHECK-LABEL: vfmacc_vf_nxv8f32:
1188 ; CHECK:       # %bb.0:
1189 ; CHECK-NEXT:    vsetvli zero, a0, e32, m4, tu, mu
1190 ; CHECK-NEXT:    vfmacc.vf v12, fa0, v8, v0.t
1191 ; CHECK-NEXT:    vmv4r.v v8, v12
1192 ; CHECK-NEXT:    ret
1193   %elt.head = insertelement <vscale x 8 x float> poison, float %b, i32 0
1194   %vb = shufflevector <vscale x 8 x float> %elt.head, <vscale x 8 x float> poison, <vscale x 8 x i32> zeroinitializer
1195   %splat = insertelement <vscale x 8 x i1> poison, i1 -1, i32 0
1196   %allones = shufflevector <vscale x 8 x i1> %splat, <vscale x 8 x i1> poison, <vscale x 8 x i32> zeroinitializer
1197   %v = call <vscale x 8 x float> @llvm.vp.fma.nxv8f32(<vscale x 8 x float> %va, <vscale x 8 x float> %vb, <vscale x 8 x float> %c, <vscale x 8 x i1> %allones, i32 %evl)
1198   %u = call <vscale x 8 x float> @llvm.vp.merge.nxv8f32(<vscale x 8 x i1> %m, <vscale x 8 x float> %v, <vscale x 8 x float> %c, i32 %evl)
1199   ret <vscale x 8 x float> %u
1202 define <vscale x 8 x float> @vfmacc_vf_nxv8f32_commute(<vscale x 8 x float> %va, float %b, <vscale x 8 x float> %c, <vscale x 8 x i1> %m, i32 zeroext %evl) {
1203 ; CHECK-LABEL: vfmacc_vf_nxv8f32_commute:
1204 ; CHECK:       # %bb.0:
1205 ; CHECK-NEXT:    vsetvli zero, a0, e32, m4, tu, mu
1206 ; CHECK-NEXT:    vfmacc.vf v12, fa0, v8, v0.t
1207 ; CHECK-NEXT:    vmv4r.v v8, v12
1208 ; CHECK-NEXT:    ret
1209   %elt.head = insertelement <vscale x 8 x float> poison, float %b, i32 0
1210   %vb = shufflevector <vscale x 8 x float> %elt.head, <vscale x 8 x float> poison, <vscale x 8 x i32> zeroinitializer
1211   %splat = insertelement <vscale x 8 x i1> poison, i1 -1, i32 0
1212   %allones = shufflevector <vscale x 8 x i1> %splat, <vscale x 8 x i1> poison, <vscale x 8 x i32> zeroinitializer
1213   %v = call <vscale x 8 x float> @llvm.vp.fma.nxv8f32(<vscale x 8 x float> %vb, <vscale x 8 x float> %va, <vscale x 8 x float> %c, <vscale x 8 x i1> %allones, i32 %evl)
1214   %u = call <vscale x 8 x float> @llvm.vp.merge.nxv8f32(<vscale x 8 x i1> %m, <vscale x 8 x float> %v, <vscale x 8 x float> %c, i32 %evl)
1215   ret <vscale x 8 x float> %u
1218 define <vscale x 8 x float> @vfmacc_vf_nxv8f32_unmasked(<vscale x 8 x float> %va, float %b, <vscale x 8 x float> %c, i32 zeroext %evl) {
1219 ; CHECK-LABEL: vfmacc_vf_nxv8f32_unmasked:
1220 ; CHECK:       # %bb.0:
1221 ; CHECK-NEXT:    vsetvli zero, a0, e32, m4, tu, ma
1222 ; CHECK-NEXT:    vfmacc.vf v12, fa0, v8
1223 ; CHECK-NEXT:    vmv4r.v v8, v12
1224 ; CHECK-NEXT:    ret
1225   %elt.head = insertelement <vscale x 8 x float> poison, float %b, i32 0
1226   %vb = shufflevector <vscale x 8 x float> %elt.head, <vscale x 8 x float> poison, <vscale x 8 x i32> zeroinitializer
1227   %splat = insertelement <vscale x 8 x i1> poison, i1 -1, i32 0
1228   %allones = shufflevector <vscale x 8 x i1> %splat, <vscale x 8 x i1> poison, <vscale x 8 x i32> zeroinitializer
1229   %v = call <vscale x 8 x float> @llvm.vp.fma.nxv8f32(<vscale x 8 x float> %va, <vscale x 8 x float> %vb, <vscale x 8 x float> %c, <vscale x 8 x i1> %allones, i32 %evl)
1230   %u = call <vscale x 8 x float> @llvm.vp.merge.nxv8f32(<vscale x 8 x i1> %allones, <vscale x 8 x float> %v, <vscale x 8 x float> %c, i32 %evl)
1231   ret <vscale x 8 x float> %u
1234 define <vscale x 8 x float> @vfmacc_vv_nxv8f32_ta(<vscale x 8 x float> %a, <vscale x 8 x float> %b, <vscale x 8 x float> %c, <vscale x 8 x i1> %m, i32 zeroext %evl) {
1235 ; CHECK-LABEL: vfmacc_vv_nxv8f32_ta:
1236 ; CHECK:       # %bb.0:
1237 ; CHECK-NEXT:    vsetvli zero, a0, e32, m4, ta, mu
1238 ; CHECK-NEXT:    vfmacc.vv v16, v8, v12, v0.t
1239 ; CHECK-NEXT:    vmv.v.v v8, v16
1240 ; CHECK-NEXT:    ret
1241   %splat = insertelement <vscale x 8 x i1> poison, i1 -1, i32 0
1242   %allones = shufflevector <vscale x 8 x i1> %splat, <vscale x 8 x i1> poison, <vscale x 8 x i32> zeroinitializer
1243   %v = call <vscale x 8 x float> @llvm.vp.fma.nxv8f32(<vscale x 8 x float> %a, <vscale x 8 x float> %b, <vscale x 8 x float> %c, <vscale x 8 x i1> %allones, i32 %evl)
1244   %u = call <vscale x 8 x float> @llvm.vp.select.nxv8f32(<vscale x 8 x i1> %m, <vscale x 8 x float> %v, <vscale x 8 x float> %c, i32 %evl)
1245   ret <vscale x 8 x float> %u
1248 define <vscale x 8 x float> @vfmacc_vf_nxv8f32_ta(<vscale x 8 x float> %va, float %b, <vscale x 8 x float> %c, <vscale x 8 x i1> %m, i32 zeroext %evl) {
1249 ; CHECK-LABEL: vfmacc_vf_nxv8f32_ta:
1250 ; CHECK:       # %bb.0:
1251 ; CHECK-NEXT:    vsetvli zero, a0, e32, m4, ta, mu
1252 ; CHECK-NEXT:    vfmacc.vf v12, fa0, v8, v0.t
1253 ; CHECK-NEXT:    vmv.v.v v8, v12
1254 ; CHECK-NEXT:    ret
1255   %elt.head = insertelement <vscale x 8 x float> poison, float %b, i32 0
1256   %vb = shufflevector <vscale x 8 x float> %elt.head, <vscale x 8 x float> poison, <vscale x 8 x i32> zeroinitializer
1257   %splat = insertelement <vscale x 8 x i1> poison, i1 -1, i32 0
1258   %allones = shufflevector <vscale x 8 x i1> %splat, <vscale x 8 x i1> poison, <vscale x 8 x i32> zeroinitializer
1259   %v = call <vscale x 8 x float> @llvm.vp.fma.nxv8f32(<vscale x 8 x float> %va, <vscale x 8 x float> %vb, <vscale x 8 x float> %c, <vscale x 8 x i1> %allones, i32 %evl)
1260   %u = call <vscale x 8 x float> @llvm.vp.select.nxv8f32(<vscale x 8 x i1> %m, <vscale x 8 x float> %v, <vscale x 8 x float> %c, i32 %evl)
1261   ret <vscale x 8 x float> %u
1264 define <vscale x 8 x float> @vfmacc_vf_nxv8f32_commute_ta(<vscale x 8 x float> %va, float %b, <vscale x 8 x float> %c, <vscale x 8 x i1> %m, i32 zeroext %evl) {
1265 ; CHECK-LABEL: vfmacc_vf_nxv8f32_commute_ta:
1266 ; CHECK:       # %bb.0:
1267 ; CHECK-NEXT:    vsetvli zero, a0, e32, m4, ta, mu
1268 ; CHECK-NEXT:    vfmacc.vf v12, fa0, v8, v0.t
1269 ; CHECK-NEXT:    vmv.v.v v8, v12
1270 ; CHECK-NEXT:    ret
1271   %elt.head = insertelement <vscale x 8 x float> poison, float %b, i32 0
1272   %vb = shufflevector <vscale x 8 x float> %elt.head, <vscale x 8 x float> poison, <vscale x 8 x i32> zeroinitializer
1273   %splat = insertelement <vscale x 8 x i1> poison, i1 -1, i32 0
1274   %allones = shufflevector <vscale x 8 x i1> %splat, <vscale x 8 x i1> poison, <vscale x 8 x i32> zeroinitializer
1275   %v = call <vscale x 8 x float> @llvm.vp.fma.nxv8f32(<vscale x 8 x float> %vb, <vscale x 8 x float> %va, <vscale x 8 x float> %c, <vscale x 8 x i1> %allones, i32 %evl)
1276   %u = call <vscale x 8 x float> @llvm.vp.select.nxv8f32(<vscale x 8 x i1> %m, <vscale x 8 x float> %v, <vscale x 8 x float> %c, i32 %evl)
1277   ret <vscale x 8 x float> %u
1280 declare <vscale x 16 x float> @llvm.vp.fma.nxv16f32(<vscale x 16 x float>, <vscale x 16 x float>, <vscale x 16 x float>, <vscale x 16 x i1>, i32)
1281 declare <vscale x 16 x float> @llvm.vp.fneg.nxv16f32(<vscale x 16 x float>, <vscale x 16 x i1>, i32)
1282 declare <vscale x 16 x float> @llvm.vp.merge.nxv16f32(<vscale x 16 x i1>, <vscale x 16 x float>, <vscale x 16 x float>, i32)
1283 declare <vscale x 16 x float> @llvm.vp.select.nxv16f32(<vscale x 16 x i1>, <vscale x 16 x float>, <vscale x 16 x float>, i32)
1285 define <vscale x 16 x float> @vfmacc_vv_nxv16f32(<vscale x 16 x float> %a, <vscale x 16 x float> %b, <vscale x 16 x float> %c, <vscale x 16 x i1> %m, i32 zeroext %evl) {
1286 ; CHECK-LABEL: vfmacc_vv_nxv16f32:
1287 ; CHECK:       # %bb.0:
1288 ; CHECK-NEXT:    vl8re32.v v24, (a0)
1289 ; CHECK-NEXT:    vsetvli zero, a1, e32, m8, tu, mu
1290 ; CHECK-NEXT:    vfmacc.vv v24, v8, v16, v0.t
1291 ; CHECK-NEXT:    vmv8r.v v8, v24
1292 ; CHECK-NEXT:    ret
1293   %splat = insertelement <vscale x 16 x i1> poison, i1 -1, i32 0
1294   %allones = shufflevector <vscale x 16 x i1> %splat, <vscale x 16 x i1> poison, <vscale x 16 x i32> zeroinitializer
1295   %v = call <vscale x 16 x float> @llvm.vp.fma.nxv16f32(<vscale x 16 x float> %a, <vscale x 16 x float> %b, <vscale x 16 x float> %c, <vscale x 16 x i1> %allones, i32 %evl)
1296   %u = call <vscale x 16 x float> @llvm.vp.merge.nxv16f32(<vscale x 16 x i1> %m, <vscale x 16 x float> %v, <vscale x 16 x float> %c, i32 %evl)
1297   ret <vscale x 16 x float> %u
1300 define <vscale x 16 x float> @vfmacc_vv_nxv16f32_unmasked(<vscale x 16 x float> %a, <vscale x 16 x float> %b, <vscale x 16 x float> %c, <vscale x 16 x i1> %m, i32 zeroext %evl) {
1301 ; CHECK-LABEL: vfmacc_vv_nxv16f32_unmasked:
1302 ; CHECK:       # %bb.0:
1303 ; CHECK-NEXT:    vl8re32.v v24, (a0)
1304 ; CHECK-NEXT:    vsetvli zero, a1, e32, m8, tu, ma
1305 ; CHECK-NEXT:    vfmacc.vv v24, v8, v16
1306 ; CHECK-NEXT:    vmv8r.v v8, v24
1307 ; CHECK-NEXT:    ret
1308   %splat = insertelement <vscale x 16 x i1> poison, i1 -1, i32 0
1309   %allones = shufflevector <vscale x 16 x i1> %splat, <vscale x 16 x i1> poison, <vscale x 16 x i32> zeroinitializer
1310   %v = call <vscale x 16 x float> @llvm.vp.fma.nxv16f32(<vscale x 16 x float> %a, <vscale x 16 x float> %b, <vscale x 16 x float> %c, <vscale x 16 x i1> %allones, i32 %evl)
1311   %u = call <vscale x 16 x float> @llvm.vp.merge.nxv16f32(<vscale x 16 x i1> %allones, <vscale x 16 x float> %v, <vscale x 16 x float> %c, i32 %evl)
1312   ret <vscale x 16 x float> %u
1315 define <vscale x 16 x float> @vfmacc_vf_nxv16f32(<vscale x 16 x float> %va, float %b, <vscale x 16 x float> %c, <vscale x 16 x i1> %m, i32 zeroext %evl) {
1316 ; CHECK-LABEL: vfmacc_vf_nxv16f32:
1317 ; CHECK:       # %bb.0:
1318 ; CHECK-NEXT:    vsetvli zero, a0, e32, m8, tu, mu
1319 ; CHECK-NEXT:    vfmacc.vf v16, fa0, v8, v0.t
1320 ; CHECK-NEXT:    vmv8r.v v8, v16
1321 ; CHECK-NEXT:    ret
1322   %elt.head = insertelement <vscale x 16 x float> poison, float %b, i32 0
1323   %vb = shufflevector <vscale x 16 x float> %elt.head, <vscale x 16 x float> poison, <vscale x 16 x i32> zeroinitializer
1324   %splat = insertelement <vscale x 16 x i1> poison, i1 -1, i32 0
1325   %allones = shufflevector <vscale x 16 x i1> %splat, <vscale x 16 x i1> poison, <vscale x 16 x i32> zeroinitializer
1326   %v = call <vscale x 16 x float> @llvm.vp.fma.nxv16f32(<vscale x 16 x float> %va, <vscale x 16 x float> %vb, <vscale x 16 x float> %c, <vscale x 16 x i1> %allones, i32 %evl)
1327   %u = call <vscale x 16 x float> @llvm.vp.merge.nxv16f32(<vscale x 16 x i1> %m, <vscale x 16 x float> %v, <vscale x 16 x float> %c, i32 %evl)
1328   ret <vscale x 16 x float> %u
1331 define <vscale x 16 x float> @vfmacc_vf_nxv16f32_commute(<vscale x 16 x float> %va, float %b, <vscale x 16 x float> %c, <vscale x 16 x i1> %m, i32 zeroext %evl) {
1332 ; CHECK-LABEL: vfmacc_vf_nxv16f32_commute:
1333 ; CHECK:       # %bb.0:
1334 ; CHECK-NEXT:    vsetvli zero, a0, e32, m8, tu, mu
1335 ; CHECK-NEXT:    vfmacc.vf v16, fa0, v8, v0.t
1336 ; CHECK-NEXT:    vmv8r.v v8, v16
1337 ; CHECK-NEXT:    ret
1338   %elt.head = insertelement <vscale x 16 x float> poison, float %b, i32 0
1339   %vb = shufflevector <vscale x 16 x float> %elt.head, <vscale x 16 x float> poison, <vscale x 16 x i32> zeroinitializer
1340   %splat = insertelement <vscale x 16 x i1> poison, i1 -1, i32 0
1341   %allones = shufflevector <vscale x 16 x i1> %splat, <vscale x 16 x i1> poison, <vscale x 16 x i32> zeroinitializer
1342   %v = call <vscale x 16 x float> @llvm.vp.fma.nxv16f32(<vscale x 16 x float> %vb, <vscale x 16 x float> %va, <vscale x 16 x float> %c, <vscale x 16 x i1> %allones, i32 %evl)
1343   %u = call <vscale x 16 x float> @llvm.vp.merge.nxv16f32(<vscale x 16 x i1> %m, <vscale x 16 x float> %v, <vscale x 16 x float> %c, i32 %evl)
1344   ret <vscale x 16 x float> %u
1347 define <vscale x 16 x float> @vfmacc_vf_nxv16f32_unmasked(<vscale x 16 x float> %va, float %b, <vscale x 16 x float> %c, i32 zeroext %evl) {
1348 ; CHECK-LABEL: vfmacc_vf_nxv16f32_unmasked:
1349 ; CHECK:       # %bb.0:
1350 ; CHECK-NEXT:    vsetvli zero, a0, e32, m8, tu, ma
1351 ; CHECK-NEXT:    vfmacc.vf v16, fa0, v8
1352 ; CHECK-NEXT:    vmv8r.v v8, v16
1353 ; CHECK-NEXT:    ret
1354   %elt.head = insertelement <vscale x 16 x float> poison, float %b, i32 0
1355   %vb = shufflevector <vscale x 16 x float> %elt.head, <vscale x 16 x float> poison, <vscale x 16 x i32> zeroinitializer
1356   %splat = insertelement <vscale x 16 x i1> poison, i1 -1, i32 0
1357   %allones = shufflevector <vscale x 16 x i1> %splat, <vscale x 16 x i1> poison, <vscale x 16 x i32> zeroinitializer
1358   %v = call <vscale x 16 x float> @llvm.vp.fma.nxv16f32(<vscale x 16 x float> %va, <vscale x 16 x float> %vb, <vscale x 16 x float> %c, <vscale x 16 x i1> %allones, i32 %evl)
1359   %u = call <vscale x 16 x float> @llvm.vp.merge.nxv16f32(<vscale x 16 x i1> %allones, <vscale x 16 x float> %v, <vscale x 16 x float> %c, i32 %evl)
1360   ret <vscale x 16 x float> %u
1363 define <vscale x 16 x float> @vfmacc_vv_nxv16f32_ta(<vscale x 16 x float> %a, <vscale x 16 x float> %b, <vscale x 16 x float> %c, <vscale x 16 x i1> %m, i32 zeroext %evl) {
1364 ; CHECK-LABEL: vfmacc_vv_nxv16f32_ta:
1365 ; CHECK:       # %bb.0:
1366 ; CHECK-NEXT:    vl8re32.v v24, (a0)
1367 ; CHECK-NEXT:    vsetvli zero, a1, e32, m8, ta, mu
1368 ; CHECK-NEXT:    vfmacc.vv v24, v8, v16, v0.t
1369 ; CHECK-NEXT:    vmv.v.v v8, v24
1370 ; CHECK-NEXT:    ret
1371   %splat = insertelement <vscale x 16 x i1> poison, i1 -1, i32 0
1372   %allones = shufflevector <vscale x 16 x i1> %splat, <vscale x 16 x i1> poison, <vscale x 16 x i32> zeroinitializer
1373   %v = call <vscale x 16 x float> @llvm.vp.fma.nxv16f32(<vscale x 16 x float> %a, <vscale x 16 x float> %b, <vscale x 16 x float> %c, <vscale x 16 x i1> %allones, i32 %evl)
1374   %u = call <vscale x 16 x float> @llvm.vp.select.nxv16f32(<vscale x 16 x i1> %m, <vscale x 16 x float> %v, <vscale x 16 x float> %c, i32 %evl)
1375   ret <vscale x 16 x float> %u
1378 define <vscale x 16 x float> @vfmacc_vf_nxv16f32_ta(<vscale x 16 x float> %va, float %b, <vscale x 16 x float> %c, <vscale x 16 x i1> %m, i32 zeroext %evl) {
1379 ; CHECK-LABEL: vfmacc_vf_nxv16f32_ta:
1380 ; CHECK:       # %bb.0:
1381 ; CHECK-NEXT:    vsetvli zero, a0, e32, m8, ta, mu
1382 ; CHECK-NEXT:    vfmacc.vf v16, fa0, v8, v0.t
1383 ; CHECK-NEXT:    vmv.v.v v8, v16
1384 ; CHECK-NEXT:    ret
1385   %elt.head = insertelement <vscale x 16 x float> poison, float %b, i32 0
1386   %vb = shufflevector <vscale x 16 x float> %elt.head, <vscale x 16 x float> poison, <vscale x 16 x i32> zeroinitializer
1387   %splat = insertelement <vscale x 16 x i1> poison, i1 -1, i32 0
1388   %allones = shufflevector <vscale x 16 x i1> %splat, <vscale x 16 x i1> poison, <vscale x 16 x i32> zeroinitializer
1389   %v = call <vscale x 16 x float> @llvm.vp.fma.nxv16f32(<vscale x 16 x float> %va, <vscale x 16 x float> %vb, <vscale x 16 x float> %c, <vscale x 16 x i1> %allones, i32 %evl)
1390   %u = call <vscale x 16 x float> @llvm.vp.select.nxv16f32(<vscale x 16 x i1> %m, <vscale x 16 x float> %v, <vscale x 16 x float> %c, i32 %evl)
1391   ret <vscale x 16 x float> %u
1394 define <vscale x 16 x float> @vfmacc_vf_nxv16f32_commute_ta(<vscale x 16 x float> %va, float %b, <vscale x 16 x float> %c, <vscale x 16 x i1> %m, i32 zeroext %evl) {
1395 ; CHECK-LABEL: vfmacc_vf_nxv16f32_commute_ta:
1396 ; CHECK:       # %bb.0:
1397 ; CHECK-NEXT:    vsetvli zero, a0, e32, m8, ta, mu
1398 ; CHECK-NEXT:    vfmacc.vf v16, fa0, v8, v0.t
1399 ; CHECK-NEXT:    vmv.v.v v8, v16
1400 ; CHECK-NEXT:    ret
1401   %elt.head = insertelement <vscale x 16 x float> poison, float %b, i32 0
1402   %vb = shufflevector <vscale x 16 x float> %elt.head, <vscale x 16 x float> poison, <vscale x 16 x i32> zeroinitializer
1403   %splat = insertelement <vscale x 16 x i1> poison, i1 -1, i32 0
1404   %allones = shufflevector <vscale x 16 x i1> %splat, <vscale x 16 x i1> poison, <vscale x 16 x i32> zeroinitializer
1405   %v = call <vscale x 16 x float> @llvm.vp.fma.nxv16f32(<vscale x 16 x float> %vb, <vscale x 16 x float> %va, <vscale x 16 x float> %c, <vscale x 16 x i1> %allones, i32 %evl)
1406   %u = call <vscale x 16 x float> @llvm.vp.select.nxv16f32(<vscale x 16 x i1> %m, <vscale x 16 x float> %v, <vscale x 16 x float> %c, i32 %evl)
1407   ret <vscale x 16 x float> %u
1410 declare <vscale x 1 x double> @llvm.vp.fma.nxv1f64(<vscale x 1 x double>, <vscale x 1 x double>, <vscale x 1 x double>, <vscale x 1 x i1>, i32)
1411 declare <vscale x 1 x double> @llvm.vp.fneg.nxv1f64(<vscale x 1 x double>, <vscale x 1 x i1>, i32)
1412 declare <vscale x 1 x double> @llvm.vp.merge.nxv1f64(<vscale x 1 x i1>, <vscale x 1 x double>, <vscale x 1 x double>, i32)
1413 declare <vscale x 1 x double> @llvm.vp.select.nxv1f64(<vscale x 1 x i1>, <vscale x 1 x double>, <vscale x 1 x double>, i32)
1415 define <vscale x 1 x double> @vfmacc_vv_nxv1f64(<vscale x 1 x double> %a, <vscale x 1 x double> %b, <vscale x 1 x double> %c, <vscale x 1 x i1> %m, i32 zeroext %evl) {
1416 ; CHECK-LABEL: vfmacc_vv_nxv1f64:
1417 ; CHECK:       # %bb.0:
1418 ; CHECK-NEXT:    vsetvli zero, a0, e64, m1, tu, mu
1419 ; CHECK-NEXT:    vfmacc.vv v10, v8, v9, v0.t
1420 ; CHECK-NEXT:    vmv1r.v v8, v10
1421 ; CHECK-NEXT:    ret
1422   %splat = insertelement <vscale x 1 x i1> poison, i1 -1, i32 0
1423   %allones = shufflevector <vscale x 1 x i1> %splat, <vscale x 1 x i1> poison, <vscale x 1 x i32> zeroinitializer
1424   %v = call <vscale x 1 x double> @llvm.vp.fma.nxv1f64(<vscale x 1 x double> %a, <vscale x 1 x double> %b, <vscale x 1 x double> %c, <vscale x 1 x i1> %allones, i32 %evl)
1425   %u = call <vscale x 1 x double> @llvm.vp.merge.nxv1f64(<vscale x 1 x i1> %m, <vscale x 1 x double> %v, <vscale x 1 x double> %c, i32 %evl)
1426   ret <vscale x 1 x double> %u
1429 define <vscale x 1 x double> @vfmacc_vv_nxv1f64_unmasked(<vscale x 1 x double> %a, <vscale x 1 x double> %b, <vscale x 1 x double> %c, <vscale x 1 x i1> %m, i32 zeroext %evl) {
1430 ; CHECK-LABEL: vfmacc_vv_nxv1f64_unmasked:
1431 ; CHECK:       # %bb.0:
1432 ; CHECK-NEXT:    vsetvli zero, a0, e64, m1, tu, ma
1433 ; CHECK-NEXT:    vfmacc.vv v10, v8, v9
1434 ; CHECK-NEXT:    vmv1r.v v8, v10
1435 ; CHECK-NEXT:    ret
1436   %splat = insertelement <vscale x 1 x i1> poison, i1 -1, i32 0
1437   %allones = shufflevector <vscale x 1 x i1> %splat, <vscale x 1 x i1> poison, <vscale x 1 x i32> zeroinitializer
1438   %v = call <vscale x 1 x double> @llvm.vp.fma.nxv1f64(<vscale x 1 x double> %a, <vscale x 1 x double> %b, <vscale x 1 x double> %c, <vscale x 1 x i1> %allones, i32 %evl)
1439   %u = call <vscale x 1 x double> @llvm.vp.merge.nxv1f64(<vscale x 1 x i1> %allones, <vscale x 1 x double> %v, <vscale x 1 x double> %c, i32 %evl)
1440   ret <vscale x 1 x double> %u
1443 define <vscale x 1 x double> @vfmacc_vf_nxv1f64(<vscale x 1 x double> %va, double %b, <vscale x 1 x double> %c, <vscale x 1 x i1> %m, i32 zeroext %evl) {
1444 ; CHECK-LABEL: vfmacc_vf_nxv1f64:
1445 ; CHECK:       # %bb.0:
1446 ; CHECK-NEXT:    vsetvli zero, a0, e64, m1, tu, mu
1447 ; CHECK-NEXT:    vfmacc.vf v9, fa0, v8, v0.t
1448 ; CHECK-NEXT:    vmv1r.v v8, v9
1449 ; CHECK-NEXT:    ret
1450   %elt.head = insertelement <vscale x 1 x double> poison, double %b, i32 0
1451   %vb = shufflevector <vscale x 1 x double> %elt.head, <vscale x 1 x double> poison, <vscale x 1 x i32> zeroinitializer
1452   %splat = insertelement <vscale x 1 x i1> poison, i1 -1, i32 0
1453   %allones = shufflevector <vscale x 1 x i1> %splat, <vscale x 1 x i1> poison, <vscale x 1 x i32> zeroinitializer
1454   %v = call <vscale x 1 x double> @llvm.vp.fma.nxv1f64(<vscale x 1 x double> %va, <vscale x 1 x double> %vb, <vscale x 1 x double> %c, <vscale x 1 x i1> %allones, i32 %evl)
1455   %u = call <vscale x 1 x double> @llvm.vp.merge.nxv1f64(<vscale x 1 x i1> %m, <vscale x 1 x double> %v, <vscale x 1 x double> %c, i32 %evl)
1456   ret <vscale x 1 x double> %u
1459 define <vscale x 1 x double> @vfmacc_vf_nxv1f64_commute(<vscale x 1 x double> %va, double %b, <vscale x 1 x double> %c, <vscale x 1 x i1> %m, i32 zeroext %evl) {
1460 ; CHECK-LABEL: vfmacc_vf_nxv1f64_commute:
1461 ; CHECK:       # %bb.0:
1462 ; CHECK-NEXT:    vsetvli zero, a0, e64, m1, tu, mu
1463 ; CHECK-NEXT:    vfmacc.vf v9, fa0, v8, v0.t
1464 ; CHECK-NEXT:    vmv1r.v v8, v9
1465 ; CHECK-NEXT:    ret
1466   %elt.head = insertelement <vscale x 1 x double> poison, double %b, i32 0
1467   %vb = shufflevector <vscale x 1 x double> %elt.head, <vscale x 1 x double> poison, <vscale x 1 x i32> zeroinitializer
1468   %splat = insertelement <vscale x 1 x i1> poison, i1 -1, i32 0
1469   %allones = shufflevector <vscale x 1 x i1> %splat, <vscale x 1 x i1> poison, <vscale x 1 x i32> zeroinitializer
1470   %v = call <vscale x 1 x double> @llvm.vp.fma.nxv1f64(<vscale x 1 x double> %vb, <vscale x 1 x double> %va, <vscale x 1 x double> %c, <vscale x 1 x i1> %allones, i32 %evl)
1471   %u = call <vscale x 1 x double> @llvm.vp.merge.nxv1f64(<vscale x 1 x i1> %m, <vscale x 1 x double> %v, <vscale x 1 x double> %c, i32 %evl)
1472   ret <vscale x 1 x double> %u
1475 define <vscale x 1 x double> @vfmacc_vf_nxv1f64_unmasked(<vscale x 1 x double> %va, double %b, <vscale x 1 x double> %c, i32 zeroext %evl) {
1476 ; CHECK-LABEL: vfmacc_vf_nxv1f64_unmasked:
1477 ; CHECK:       # %bb.0:
1478 ; CHECK-NEXT:    vsetvli zero, a0, e64, m1, tu, ma
1479 ; CHECK-NEXT:    vfmacc.vf v9, fa0, v8
1480 ; CHECK-NEXT:    vmv1r.v v8, v9
1481 ; CHECK-NEXT:    ret
1482   %elt.head = insertelement <vscale x 1 x double> poison, double %b, i32 0
1483   %vb = shufflevector <vscale x 1 x double> %elt.head, <vscale x 1 x double> poison, <vscale x 1 x i32> zeroinitializer
1484   %splat = insertelement <vscale x 1 x i1> poison, i1 -1, i32 0
1485   %allones = shufflevector <vscale x 1 x i1> %splat, <vscale x 1 x i1> poison, <vscale x 1 x i32> zeroinitializer
1486   %v = call <vscale x 1 x double> @llvm.vp.fma.nxv1f64(<vscale x 1 x double> %va, <vscale x 1 x double> %vb, <vscale x 1 x double> %c, <vscale x 1 x i1> %allones, i32 %evl)
1487   %u = call <vscale x 1 x double> @llvm.vp.merge.nxv1f64(<vscale x 1 x i1> %allones, <vscale x 1 x double> %v, <vscale x 1 x double> %c, i32 %evl)
1488   ret <vscale x 1 x double> %u
1491 define <vscale x 1 x double> @vfmacc_vv_nxv1f64_ta(<vscale x 1 x double> %a, <vscale x 1 x double> %b, <vscale x 1 x double> %c, <vscale x 1 x i1> %m, i32 zeroext %evl) {
1492 ; CHECK-LABEL: vfmacc_vv_nxv1f64_ta:
1493 ; CHECK:       # %bb.0:
1494 ; CHECK-NEXT:    vsetvli zero, a0, e64, m1, ta, mu
1495 ; CHECK-NEXT:    vfmacc.vv v10, v8, v9, v0.t
1496 ; CHECK-NEXT:    vmv.v.v v8, v10
1497 ; CHECK-NEXT:    ret
1498   %splat = insertelement <vscale x 1 x i1> poison, i1 -1, i32 0
1499   %allones = shufflevector <vscale x 1 x i1> %splat, <vscale x 1 x i1> poison, <vscale x 1 x i32> zeroinitializer
1500   %v = call <vscale x 1 x double> @llvm.vp.fma.nxv1f64(<vscale x 1 x double> %a, <vscale x 1 x double> %b, <vscale x 1 x double> %c, <vscale x 1 x i1> %allones, i32 %evl)
1501   %u = call <vscale x 1 x double> @llvm.vp.select.nxv1f64(<vscale x 1 x i1> %m, <vscale x 1 x double> %v, <vscale x 1 x double> %c, i32 %evl)
1502   ret <vscale x 1 x double> %u
1505 define <vscale x 1 x double> @vfmacc_vf_nxv1f64_ta(<vscale x 1 x double> %va, double %b, <vscale x 1 x double> %c, <vscale x 1 x i1> %m, i32 zeroext %evl) {
1506 ; CHECK-LABEL: vfmacc_vf_nxv1f64_ta:
1507 ; CHECK:       # %bb.0:
1508 ; CHECK-NEXT:    vsetvli zero, a0, e64, m1, ta, mu
1509 ; CHECK-NEXT:    vfmacc.vf v9, fa0, v8, v0.t
1510 ; CHECK-NEXT:    vmv.v.v v8, v9
1511 ; CHECK-NEXT:    ret
1512   %elt.head = insertelement <vscale x 1 x double> poison, double %b, i32 0
1513   %vb = shufflevector <vscale x 1 x double> %elt.head, <vscale x 1 x double> poison, <vscale x 1 x i32> zeroinitializer
1514   %splat = insertelement <vscale x 1 x i1> poison, i1 -1, i32 0
1515   %allones = shufflevector <vscale x 1 x i1> %splat, <vscale x 1 x i1> poison, <vscale x 1 x i32> zeroinitializer
1516   %v = call <vscale x 1 x double> @llvm.vp.fma.nxv1f64(<vscale x 1 x double> %va, <vscale x 1 x double> %vb, <vscale x 1 x double> %c, <vscale x 1 x i1> %allones, i32 %evl)
1517   %u = call <vscale x 1 x double> @llvm.vp.select.nxv1f64(<vscale x 1 x i1> %m, <vscale x 1 x double> %v, <vscale x 1 x double> %c, i32 %evl)
1518   ret <vscale x 1 x double> %u
1521 define <vscale x 1 x double> @vfmacc_vf_nxv1f64_commute_ta(<vscale x 1 x double> %va, double %b, <vscale x 1 x double> %c, <vscale x 1 x i1> %m, i32 zeroext %evl) {
1522 ; CHECK-LABEL: vfmacc_vf_nxv1f64_commute_ta:
1523 ; CHECK:       # %bb.0:
1524 ; CHECK-NEXT:    vsetvli zero, a0, e64, m1, ta, mu
1525 ; CHECK-NEXT:    vfmacc.vf v9, fa0, v8, v0.t
1526 ; CHECK-NEXT:    vmv.v.v v8, v9
1527 ; CHECK-NEXT:    ret
1528   %elt.head = insertelement <vscale x 1 x double> poison, double %b, i32 0
1529   %vb = shufflevector <vscale x 1 x double> %elt.head, <vscale x 1 x double> poison, <vscale x 1 x i32> zeroinitializer
1530   %splat = insertelement <vscale x 1 x i1> poison, i1 -1, i32 0
1531   %allones = shufflevector <vscale x 1 x i1> %splat, <vscale x 1 x i1> poison, <vscale x 1 x i32> zeroinitializer
1532   %v = call <vscale x 1 x double> @llvm.vp.fma.nxv1f64(<vscale x 1 x double> %vb, <vscale x 1 x double> %va, <vscale x 1 x double> %c, <vscale x 1 x i1> %allones, i32 %evl)
1533   %u = call <vscale x 1 x double> @llvm.vp.select.nxv1f64(<vscale x 1 x i1> %m, <vscale x 1 x double> %v, <vscale x 1 x double> %c, i32 %evl)
1534   ret <vscale x 1 x double> %u
1537 declare <vscale x 2 x double> @llvm.vp.fma.nxv2f64(<vscale x 2 x double>, <vscale x 2 x double>, <vscale x 2 x double>, <vscale x 2 x i1>, i32)
1538 declare <vscale x 2 x double> @llvm.vp.fneg.nxv2f64(<vscale x 2 x double>, <vscale x 2 x i1>, i32)
1539 declare <vscale x 2 x double> @llvm.vp.merge.nxv2f64(<vscale x 2 x i1>, <vscale x 2 x double>, <vscale x 2 x double>, i32)
1540 declare <vscale x 2 x double> @llvm.vp.select.nxv2f64(<vscale x 2 x i1>, <vscale x 2 x double>, <vscale x 2 x double>, i32)
1542 define <vscale x 2 x double> @vfmacc_vv_nxv2f64(<vscale x 2 x double> %a, <vscale x 2 x double> %b, <vscale x 2 x double> %c, <vscale x 2 x i1> %m, i32 zeroext %evl) {
1543 ; CHECK-LABEL: vfmacc_vv_nxv2f64:
1544 ; CHECK:       # %bb.0:
1545 ; CHECK-NEXT:    vsetvli zero, a0, e64, m2, tu, mu
1546 ; CHECK-NEXT:    vfmacc.vv v12, v8, v10, v0.t
1547 ; CHECK-NEXT:    vmv2r.v v8, v12
1548 ; CHECK-NEXT:    ret
1549   %splat = insertelement <vscale x 2 x i1> poison, i1 -1, i32 0
1550   %allones = shufflevector <vscale x 2 x i1> %splat, <vscale x 2 x i1> poison, <vscale x 2 x i32> zeroinitializer
1551   %v = call <vscale x 2 x double> @llvm.vp.fma.nxv2f64(<vscale x 2 x double> %a, <vscale x 2 x double> %b, <vscale x 2 x double> %c, <vscale x 2 x i1> %allones, i32 %evl)
1552   %u = call <vscale x 2 x double> @llvm.vp.merge.nxv2f64(<vscale x 2 x i1> %m, <vscale x 2 x double> %v, <vscale x 2 x double> %c, i32 %evl)
1553   ret <vscale x 2 x double> %u
1556 define <vscale x 2 x double> @vfmacc_vv_nxv2f64_unmasked(<vscale x 2 x double> %a, <vscale x 2 x double> %b, <vscale x 2 x double> %c, <vscale x 2 x i1> %m, i32 zeroext %evl) {
1557 ; CHECK-LABEL: vfmacc_vv_nxv2f64_unmasked:
1558 ; CHECK:       # %bb.0:
1559 ; CHECK-NEXT:    vsetvli zero, a0, e64, m2, tu, ma
1560 ; CHECK-NEXT:    vfmacc.vv v12, v8, v10
1561 ; CHECK-NEXT:    vmv2r.v v8, v12
1562 ; CHECK-NEXT:    ret
1563   %splat = insertelement <vscale x 2 x i1> poison, i1 -1, i32 0
1564   %allones = shufflevector <vscale x 2 x i1> %splat, <vscale x 2 x i1> poison, <vscale x 2 x i32> zeroinitializer
1565   %v = call <vscale x 2 x double> @llvm.vp.fma.nxv2f64(<vscale x 2 x double> %a, <vscale x 2 x double> %b, <vscale x 2 x double> %c, <vscale x 2 x i1> %allones, i32 %evl)
1566   %u = call <vscale x 2 x double> @llvm.vp.merge.nxv2f64(<vscale x 2 x i1> %allones, <vscale x 2 x double> %v, <vscale x 2 x double> %c, i32 %evl)
1567   ret <vscale x 2 x double> %u
1570 define <vscale x 2 x double> @vfmacc_vf_nxv2f64(<vscale x 2 x double> %va, double %b, <vscale x 2 x double> %c, <vscale x 2 x i1> %m, i32 zeroext %evl) {
1571 ; CHECK-LABEL: vfmacc_vf_nxv2f64:
1572 ; CHECK:       # %bb.0:
1573 ; CHECK-NEXT:    vsetvli zero, a0, e64, m2, tu, mu
1574 ; CHECK-NEXT:    vfmacc.vf v10, fa0, v8, v0.t
1575 ; CHECK-NEXT:    vmv2r.v v8, v10
1576 ; CHECK-NEXT:    ret
1577   %elt.head = insertelement <vscale x 2 x double> poison, double %b, i32 0
1578   %vb = shufflevector <vscale x 2 x double> %elt.head, <vscale x 2 x double> poison, <vscale x 2 x i32> zeroinitializer
1579   %splat = insertelement <vscale x 2 x i1> poison, i1 -1, i32 0
1580   %allones = shufflevector <vscale x 2 x i1> %splat, <vscale x 2 x i1> poison, <vscale x 2 x i32> zeroinitializer
1581   %v = call <vscale x 2 x double> @llvm.vp.fma.nxv2f64(<vscale x 2 x double> %va, <vscale x 2 x double> %vb, <vscale x 2 x double> %c, <vscale x 2 x i1> %allones, i32 %evl)
1582   %u = call <vscale x 2 x double> @llvm.vp.merge.nxv2f64(<vscale x 2 x i1> %m, <vscale x 2 x double> %v, <vscale x 2 x double> %c, i32 %evl)
1583   ret <vscale x 2 x double> %u
1586 define <vscale x 2 x double> @vfmacc_vf_nxv2f64_commute(<vscale x 2 x double> %va, double %b, <vscale x 2 x double> %c, <vscale x 2 x i1> %m, i32 zeroext %evl) {
1587 ; CHECK-LABEL: vfmacc_vf_nxv2f64_commute:
1588 ; CHECK:       # %bb.0:
1589 ; CHECK-NEXT:    vsetvli zero, a0, e64, m2, tu, mu
1590 ; CHECK-NEXT:    vfmacc.vf v10, fa0, v8, v0.t
1591 ; CHECK-NEXT:    vmv2r.v v8, v10
1592 ; CHECK-NEXT:    ret
1593   %elt.head = insertelement <vscale x 2 x double> poison, double %b, i32 0
1594   %vb = shufflevector <vscale x 2 x double> %elt.head, <vscale x 2 x double> poison, <vscale x 2 x i32> zeroinitializer
1595   %splat = insertelement <vscale x 2 x i1> poison, i1 -1, i32 0
1596   %allones = shufflevector <vscale x 2 x i1> %splat, <vscale x 2 x i1> poison, <vscale x 2 x i32> zeroinitializer
1597   %v = call <vscale x 2 x double> @llvm.vp.fma.nxv2f64(<vscale x 2 x double> %vb, <vscale x 2 x double> %va, <vscale x 2 x double> %c, <vscale x 2 x i1> %allones, i32 %evl)
1598   %u = call <vscale x 2 x double> @llvm.vp.merge.nxv2f64(<vscale x 2 x i1> %m, <vscale x 2 x double> %v, <vscale x 2 x double> %c, i32 %evl)
1599   ret <vscale x 2 x double> %u
1602 define <vscale x 2 x double> @vfmacc_vf_nxv2f64_unmasked(<vscale x 2 x double> %va, double %b, <vscale x 2 x double> %c, i32 zeroext %evl) {
1603 ; CHECK-LABEL: vfmacc_vf_nxv2f64_unmasked:
1604 ; CHECK:       # %bb.0:
1605 ; CHECK-NEXT:    vsetvli zero, a0, e64, m2, tu, ma
1606 ; CHECK-NEXT:    vfmacc.vf v10, fa0, v8
1607 ; CHECK-NEXT:    vmv2r.v v8, v10
1608 ; CHECK-NEXT:    ret
1609   %elt.head = insertelement <vscale x 2 x double> poison, double %b, i32 0
1610   %vb = shufflevector <vscale x 2 x double> %elt.head, <vscale x 2 x double> poison, <vscale x 2 x i32> zeroinitializer
1611   %splat = insertelement <vscale x 2 x i1> poison, i1 -1, i32 0
1612   %allones = shufflevector <vscale x 2 x i1> %splat, <vscale x 2 x i1> poison, <vscale x 2 x i32> zeroinitializer
1613   %v = call <vscale x 2 x double> @llvm.vp.fma.nxv2f64(<vscale x 2 x double> %va, <vscale x 2 x double> %vb, <vscale x 2 x double> %c, <vscale x 2 x i1> %allones, i32 %evl)
1614   %u = call <vscale x 2 x double> @llvm.vp.merge.nxv2f64(<vscale x 2 x i1> %allones, <vscale x 2 x double> %v, <vscale x 2 x double> %c, i32 %evl)
1615   ret <vscale x 2 x double> %u
1618 define <vscale x 2 x double> @vfmacc_vv_nxv2f64_ta(<vscale x 2 x double> %a, <vscale x 2 x double> %b, <vscale x 2 x double> %c, <vscale x 2 x i1> %m, i32 zeroext %evl) {
1619 ; CHECK-LABEL: vfmacc_vv_nxv2f64_ta:
1620 ; CHECK:       # %bb.0:
1621 ; CHECK-NEXT:    vsetvli zero, a0, e64, m2, ta, mu
1622 ; CHECK-NEXT:    vfmacc.vv v12, v8, v10, v0.t
1623 ; CHECK-NEXT:    vmv.v.v v8, v12
1624 ; CHECK-NEXT:    ret
1625   %splat = insertelement <vscale x 2 x i1> poison, i1 -1, i32 0
1626   %allones = shufflevector <vscale x 2 x i1> %splat, <vscale x 2 x i1> poison, <vscale x 2 x i32> zeroinitializer
1627   %v = call <vscale x 2 x double> @llvm.vp.fma.nxv2f64(<vscale x 2 x double> %a, <vscale x 2 x double> %b, <vscale x 2 x double> %c, <vscale x 2 x i1> %allones, i32 %evl)
1628   %u = call <vscale x 2 x double> @llvm.vp.select.nxv2f64(<vscale x 2 x i1> %m, <vscale x 2 x double> %v, <vscale x 2 x double> %c, i32 %evl)
1629   ret <vscale x 2 x double> %u
1632 define <vscale x 2 x double> @vfmacc_vf_nxv2f64_ta(<vscale x 2 x double> %va, double %b, <vscale x 2 x double> %c, <vscale x 2 x i1> %m, i32 zeroext %evl) {
1633 ; CHECK-LABEL: vfmacc_vf_nxv2f64_ta:
1634 ; CHECK:       # %bb.0:
1635 ; CHECK-NEXT:    vsetvli zero, a0, e64, m2, ta, mu
1636 ; CHECK-NEXT:    vfmacc.vf v10, fa0, v8, v0.t
1637 ; CHECK-NEXT:    vmv.v.v v8, v10
1638 ; CHECK-NEXT:    ret
1639   %elt.head = insertelement <vscale x 2 x double> poison, double %b, i32 0
1640   %vb = shufflevector <vscale x 2 x double> %elt.head, <vscale x 2 x double> poison, <vscale x 2 x i32> zeroinitializer
1641   %splat = insertelement <vscale x 2 x i1> poison, i1 -1, i32 0
1642   %allones = shufflevector <vscale x 2 x i1> %splat, <vscale x 2 x i1> poison, <vscale x 2 x i32> zeroinitializer
1643   %v = call <vscale x 2 x double> @llvm.vp.fma.nxv2f64(<vscale x 2 x double> %va, <vscale x 2 x double> %vb, <vscale x 2 x double> %c, <vscale x 2 x i1> %allones, i32 %evl)
1644   %u = call <vscale x 2 x double> @llvm.vp.select.nxv2f64(<vscale x 2 x i1> %m, <vscale x 2 x double> %v, <vscale x 2 x double> %c, i32 %evl)
1645   ret <vscale x 2 x double> %u
1648 define <vscale x 2 x double> @vfmacc_vf_nxv2f64_commute_ta(<vscale x 2 x double> %va, double %b, <vscale x 2 x double> %c, <vscale x 2 x i1> %m, i32 zeroext %evl) {
1649 ; CHECK-LABEL: vfmacc_vf_nxv2f64_commute_ta:
1650 ; CHECK:       # %bb.0:
1651 ; CHECK-NEXT:    vsetvli zero, a0, e64, m2, ta, mu
1652 ; CHECK-NEXT:    vfmacc.vf v10, fa0, v8, v0.t
1653 ; CHECK-NEXT:    vmv.v.v v8, v10
1654 ; CHECK-NEXT:    ret
1655   %elt.head = insertelement <vscale x 2 x double> poison, double %b, i32 0
1656   %vb = shufflevector <vscale x 2 x double> %elt.head, <vscale x 2 x double> poison, <vscale x 2 x i32> zeroinitializer
1657   %splat = insertelement <vscale x 2 x i1> poison, i1 -1, i32 0
1658   %allones = shufflevector <vscale x 2 x i1> %splat, <vscale x 2 x i1> poison, <vscale x 2 x i32> zeroinitializer
1659   %v = call <vscale x 2 x double> @llvm.vp.fma.nxv2f64(<vscale x 2 x double> %vb, <vscale x 2 x double> %va, <vscale x 2 x double> %c, <vscale x 2 x i1> %allones, i32 %evl)
1660   %u = call <vscale x 2 x double> @llvm.vp.select.nxv2f64(<vscale x 2 x i1> %m, <vscale x 2 x double> %v, <vscale x 2 x double> %c, i32 %evl)
1661   ret <vscale x 2 x double> %u
1664 declare <vscale x 4 x double> @llvm.vp.fma.nxv4f64(<vscale x 4 x double>, <vscale x 4 x double>, <vscale x 4 x double>, <vscale x 4 x i1>, i32)
1665 declare <vscale x 4 x double> @llvm.vp.fneg.nxv4f64(<vscale x 4 x double>, <vscale x 4 x i1>, i32)
1666 declare <vscale x 4 x double> @llvm.vp.merge.nxv4f64(<vscale x 4 x i1>, <vscale x 4 x double>, <vscale x 4 x double>, i32)
1667 declare <vscale x 4 x double> @llvm.vp.select.nxv4f64(<vscale x 4 x i1>, <vscale x 4 x double>, <vscale x 4 x double>, i32)
1669 define <vscale x 4 x double> @vfmacc_vv_nxv4f64(<vscale x 4 x double> %a, <vscale x 4 x double> %b, <vscale x 4 x double> %c, <vscale x 4 x i1> %m, i32 zeroext %evl) {
1670 ; CHECK-LABEL: vfmacc_vv_nxv4f64:
1671 ; CHECK:       # %bb.0:
1672 ; CHECK-NEXT:    vsetvli zero, a0, e64, m4, tu, mu
1673 ; CHECK-NEXT:    vfmacc.vv v16, v8, v12, v0.t
1674 ; CHECK-NEXT:    vmv4r.v v8, v16
1675 ; CHECK-NEXT:    ret
1676   %splat = insertelement <vscale x 4 x i1> poison, i1 -1, i32 0
1677   %allones = shufflevector <vscale x 4 x i1> %splat, <vscale x 4 x i1> poison, <vscale x 4 x i32> zeroinitializer
1678   %v = call <vscale x 4 x double> @llvm.vp.fma.nxv4f64(<vscale x 4 x double> %a, <vscale x 4 x double> %b, <vscale x 4 x double> %c, <vscale x 4 x i1> %allones, i32 %evl)
1679   %u = call <vscale x 4 x double> @llvm.vp.merge.nxv4f64(<vscale x 4 x i1> %m, <vscale x 4 x double> %v, <vscale x 4 x double> %c, i32 %evl)
1680   ret <vscale x 4 x double> %u
1683 define <vscale x 4 x double> @vfmacc_vv_nxv4f64_unmasked(<vscale x 4 x double> %a, <vscale x 4 x double> %b, <vscale x 4 x double> %c, <vscale x 4 x i1> %m, i32 zeroext %evl) {
1684 ; CHECK-LABEL: vfmacc_vv_nxv4f64_unmasked:
1685 ; CHECK:       # %bb.0:
1686 ; CHECK-NEXT:    vsetvli zero, a0, e64, m4, tu, ma
1687 ; CHECK-NEXT:    vfmacc.vv v16, v8, v12
1688 ; CHECK-NEXT:    vmv4r.v v8, v16
1689 ; CHECK-NEXT:    ret
1690   %splat = insertelement <vscale x 4 x i1> poison, i1 -1, i32 0
1691   %allones = shufflevector <vscale x 4 x i1> %splat, <vscale x 4 x i1> poison, <vscale x 4 x i32> zeroinitializer
1692   %v = call <vscale x 4 x double> @llvm.vp.fma.nxv4f64(<vscale x 4 x double> %a, <vscale x 4 x double> %b, <vscale x 4 x double> %c, <vscale x 4 x i1> %allones, i32 %evl)
1693   %u = call <vscale x 4 x double> @llvm.vp.merge.nxv4f64(<vscale x 4 x i1> %allones, <vscale x 4 x double> %v, <vscale x 4 x double> %c, i32 %evl)
1694   ret <vscale x 4 x double> %u
1697 define <vscale x 4 x double> @vfmacc_vf_nxv4f64(<vscale x 4 x double> %va, double %b, <vscale x 4 x double> %c, <vscale x 4 x i1> %m, i32 zeroext %evl) {
1698 ; CHECK-LABEL: vfmacc_vf_nxv4f64:
1699 ; CHECK:       # %bb.0:
1700 ; CHECK-NEXT:    vsetvli zero, a0, e64, m4, tu, mu
1701 ; CHECK-NEXT:    vfmacc.vf v12, fa0, v8, v0.t
1702 ; CHECK-NEXT:    vmv4r.v v8, v12
1703 ; CHECK-NEXT:    ret
1704   %elt.head = insertelement <vscale x 4 x double> poison, double %b, i32 0
1705   %vb = shufflevector <vscale x 4 x double> %elt.head, <vscale x 4 x double> poison, <vscale x 4 x i32> zeroinitializer
1706   %splat = insertelement <vscale x 4 x i1> poison, i1 -1, i32 0
1707   %allones = shufflevector <vscale x 4 x i1> %splat, <vscale x 4 x i1> poison, <vscale x 4 x i32> zeroinitializer
1708   %v = call <vscale x 4 x double> @llvm.vp.fma.nxv4f64(<vscale x 4 x double> %va, <vscale x 4 x double> %vb, <vscale x 4 x double> %c, <vscale x 4 x i1> %allones, i32 %evl)
1709   %u = call <vscale x 4 x double> @llvm.vp.merge.nxv4f64(<vscale x 4 x i1> %m, <vscale x 4 x double> %v, <vscale x 4 x double> %c, i32 %evl)
1710   ret <vscale x 4 x double> %u
1713 define <vscale x 4 x double> @vfmacc_vf_nxv4f64_commute(<vscale x 4 x double> %va, double %b, <vscale x 4 x double> %c, <vscale x 4 x i1> %m, i32 zeroext %evl) {
1714 ; CHECK-LABEL: vfmacc_vf_nxv4f64_commute:
1715 ; CHECK:       # %bb.0:
1716 ; CHECK-NEXT:    vsetvli zero, a0, e64, m4, tu, mu
1717 ; CHECK-NEXT:    vfmacc.vf v12, fa0, v8, v0.t
1718 ; CHECK-NEXT:    vmv4r.v v8, v12
1719 ; CHECK-NEXT:    ret
1720   %elt.head = insertelement <vscale x 4 x double> poison, double %b, i32 0
1721   %vb = shufflevector <vscale x 4 x double> %elt.head, <vscale x 4 x double> poison, <vscale x 4 x i32> zeroinitializer
1722   %splat = insertelement <vscale x 4 x i1> poison, i1 -1, i32 0
1723   %allones = shufflevector <vscale x 4 x i1> %splat, <vscale x 4 x i1> poison, <vscale x 4 x i32> zeroinitializer
1724   %v = call <vscale x 4 x double> @llvm.vp.fma.nxv4f64(<vscale x 4 x double> %vb, <vscale x 4 x double> %va, <vscale x 4 x double> %c, <vscale x 4 x i1> %allones, i32 %evl)
1725   %u = call <vscale x 4 x double> @llvm.vp.merge.nxv4f64(<vscale x 4 x i1> %m, <vscale x 4 x double> %v, <vscale x 4 x double> %c, i32 %evl)
1726   ret <vscale x 4 x double> %u
1729 define <vscale x 4 x double> @vfmacc_vf_nxv4f64_unmasked(<vscale x 4 x double> %va, double %b, <vscale x 4 x double> %c, i32 zeroext %evl) {
1730 ; CHECK-LABEL: vfmacc_vf_nxv4f64_unmasked:
1731 ; CHECK:       # %bb.0:
1732 ; CHECK-NEXT:    vsetvli zero, a0, e64, m4, tu, ma
1733 ; CHECK-NEXT:    vfmacc.vf v12, fa0, v8
1734 ; CHECK-NEXT:    vmv4r.v v8, v12
1735 ; CHECK-NEXT:    ret
1736   %elt.head = insertelement <vscale x 4 x double> poison, double %b, i32 0
1737   %vb = shufflevector <vscale x 4 x double> %elt.head, <vscale x 4 x double> poison, <vscale x 4 x i32> zeroinitializer
1738   %splat = insertelement <vscale x 4 x i1> poison, i1 -1, i32 0
1739   %allones = shufflevector <vscale x 4 x i1> %splat, <vscale x 4 x i1> poison, <vscale x 4 x i32> zeroinitializer
1740   %v = call <vscale x 4 x double> @llvm.vp.fma.nxv4f64(<vscale x 4 x double> %va, <vscale x 4 x double> %vb, <vscale x 4 x double> %c, <vscale x 4 x i1> %allones, i32 %evl)
1741   %u = call <vscale x 4 x double> @llvm.vp.merge.nxv4f64(<vscale x 4 x i1> %allones, <vscale x 4 x double> %v, <vscale x 4 x double> %c, i32 %evl)
1742   ret <vscale x 4 x double> %u
1745 define <vscale x 4 x double> @vfmacc_vv_nxv4f64_ta(<vscale x 4 x double> %a, <vscale x 4 x double> %b, <vscale x 4 x double> %c, <vscale x 4 x i1> %m, i32 zeroext %evl) {
1746 ; CHECK-LABEL: vfmacc_vv_nxv4f64_ta:
1747 ; CHECK:       # %bb.0:
1748 ; CHECK-NEXT:    vsetvli zero, a0, e64, m4, ta, mu
1749 ; CHECK-NEXT:    vfmacc.vv v16, v8, v12, v0.t
1750 ; CHECK-NEXT:    vmv.v.v v8, v16
1751 ; CHECK-NEXT:    ret
1752   %splat = insertelement <vscale x 4 x i1> poison, i1 -1, i32 0
1753   %allones = shufflevector <vscale x 4 x i1> %splat, <vscale x 4 x i1> poison, <vscale x 4 x i32> zeroinitializer
1754   %v = call <vscale x 4 x double> @llvm.vp.fma.nxv4f64(<vscale x 4 x double> %a, <vscale x 4 x double> %b, <vscale x 4 x double> %c, <vscale x 4 x i1> %allones, i32 %evl)
1755   %u = call <vscale x 4 x double> @llvm.vp.select.nxv4f64(<vscale x 4 x i1> %m, <vscale x 4 x double> %v, <vscale x 4 x double> %c, i32 %evl)
1756   ret <vscale x 4 x double> %u
1759 define <vscale x 4 x double> @vfmacc_vf_nxv4f64_ta(<vscale x 4 x double> %va, double %b, <vscale x 4 x double> %c, <vscale x 4 x i1> %m, i32 zeroext %evl) {
1760 ; CHECK-LABEL: vfmacc_vf_nxv4f64_ta:
1761 ; CHECK:       # %bb.0:
1762 ; CHECK-NEXT:    vsetvli zero, a0, e64, m4, ta, mu
1763 ; CHECK-NEXT:    vfmacc.vf v12, fa0, v8, v0.t
1764 ; CHECK-NEXT:    vmv.v.v v8, v12
1765 ; CHECK-NEXT:    ret
1766   %elt.head = insertelement <vscale x 4 x double> poison, double %b, i32 0
1767   %vb = shufflevector <vscale x 4 x double> %elt.head, <vscale x 4 x double> poison, <vscale x 4 x i32> zeroinitializer
1768   %splat = insertelement <vscale x 4 x i1> poison, i1 -1, i32 0
1769   %allones = shufflevector <vscale x 4 x i1> %splat, <vscale x 4 x i1> poison, <vscale x 4 x i32> zeroinitializer
1770   %v = call <vscale x 4 x double> @llvm.vp.fma.nxv4f64(<vscale x 4 x double> %va, <vscale x 4 x double> %vb, <vscale x 4 x double> %c, <vscale x 4 x i1> %allones, i32 %evl)
1771   %u = call <vscale x 4 x double> @llvm.vp.select.nxv4f64(<vscale x 4 x i1> %m, <vscale x 4 x double> %v, <vscale x 4 x double> %c, i32 %evl)
1772   ret <vscale x 4 x double> %u
1775 define <vscale x 4 x double> @vfmacc_vf_nxv4f64_commute_ta(<vscale x 4 x double> %va, double %b, <vscale x 4 x double> %c, <vscale x 4 x i1> %m, i32 zeroext %evl) {
1776 ; CHECK-LABEL: vfmacc_vf_nxv4f64_commute_ta:
1777 ; CHECK:       # %bb.0:
1778 ; CHECK-NEXT:    vsetvli zero, a0, e64, m4, ta, mu
1779 ; CHECK-NEXT:    vfmacc.vf v12, fa0, v8, v0.t
1780 ; CHECK-NEXT:    vmv.v.v v8, v12
1781 ; CHECK-NEXT:    ret
1782   %elt.head = insertelement <vscale x 4 x double> poison, double %b, i32 0
1783   %vb = shufflevector <vscale x 4 x double> %elt.head, <vscale x 4 x double> poison, <vscale x 4 x i32> zeroinitializer
1784   %splat = insertelement <vscale x 4 x i1> poison, i1 -1, i32 0
1785   %allones = shufflevector <vscale x 4 x i1> %splat, <vscale x 4 x i1> poison, <vscale x 4 x i32> zeroinitializer
1786   %v = call <vscale x 4 x double> @llvm.vp.fma.nxv4f64(<vscale x 4 x double> %vb, <vscale x 4 x double> %va, <vscale x 4 x double> %c, <vscale x 4 x i1> %allones, i32 %evl)
1787   %u = call <vscale x 4 x double> @llvm.vp.select.nxv4f64(<vscale x 4 x i1> %m, <vscale x 4 x double> %v, <vscale x 4 x double> %c, i32 %evl)
1788   ret <vscale x 4 x double> %u
1791 declare <vscale x 8 x double> @llvm.vp.fma.nxv8f64(<vscale x 8 x double>, <vscale x 8 x double>, <vscale x 8 x double>, <vscale x 8 x i1>, i32)
1792 declare <vscale x 8 x double> @llvm.vp.fneg.nxv8f64(<vscale x 8 x double>, <vscale x 8 x i1>, i32)
1793 declare <vscale x 8 x double> @llvm.vp.merge.nxv8f64(<vscale x 8 x i1>, <vscale x 8 x double>, <vscale x 8 x double>, i32)
1794 declare <vscale x 8 x double> @llvm.vp.select.nxv8f64(<vscale x 8 x i1>, <vscale x 8 x double>, <vscale x 8 x double>, i32)
1796 define <vscale x 8 x double> @vfmacc_vv_nxv8f64(<vscale x 8 x double> %a, <vscale x 8 x double> %b, <vscale x 8 x double> %c, <vscale x 8 x i1> %m, i32 zeroext %evl) {
1797 ; CHECK-LABEL: vfmacc_vv_nxv8f64:
1798 ; CHECK:       # %bb.0:
1799 ; CHECK-NEXT:    vl8re64.v v24, (a0)
1800 ; CHECK-NEXT:    vsetvli zero, a1, e64, m8, tu, mu
1801 ; CHECK-NEXT:    vfmacc.vv v24, v8, v16, v0.t
1802 ; CHECK-NEXT:    vmv8r.v v8, v24
1803 ; CHECK-NEXT:    ret
1804   %splat = insertelement <vscale x 8 x i1> poison, i1 -1, i32 0
1805   %allones = shufflevector <vscale x 8 x i1> %splat, <vscale x 8 x i1> poison, <vscale x 8 x i32> zeroinitializer
1806   %v = call <vscale x 8 x double> @llvm.vp.fma.nxv8f64(<vscale x 8 x double> %a, <vscale x 8 x double> %b, <vscale x 8 x double> %c, <vscale x 8 x i1> %allones, i32 %evl)
1807   %u = call <vscale x 8 x double> @llvm.vp.merge.nxv8f64(<vscale x 8 x i1> %m, <vscale x 8 x double> %v, <vscale x 8 x double> %c, i32 %evl)
1808   ret <vscale x 8 x double> %u
1811 define <vscale x 8 x double> @vfmacc_vv_nxv8f64_unmasked(<vscale x 8 x double> %a, <vscale x 8 x double> %b, <vscale x 8 x double> %c, <vscale x 8 x i1> %m, i32 zeroext %evl) {
1812 ; CHECK-LABEL: vfmacc_vv_nxv8f64_unmasked:
1813 ; CHECK:       # %bb.0:
1814 ; CHECK-NEXT:    vl8re64.v v24, (a0)
1815 ; CHECK-NEXT:    vsetvli zero, a1, e64, m8, tu, ma
1816 ; CHECK-NEXT:    vfmacc.vv v24, v8, v16
1817 ; CHECK-NEXT:    vmv8r.v v8, v24
1818 ; CHECK-NEXT:    ret
1819   %splat = insertelement <vscale x 8 x i1> poison, i1 -1, i32 0
1820   %allones = shufflevector <vscale x 8 x i1> %splat, <vscale x 8 x i1> poison, <vscale x 8 x i32> zeroinitializer
1821   %v = call <vscale x 8 x double> @llvm.vp.fma.nxv8f64(<vscale x 8 x double> %a, <vscale x 8 x double> %b, <vscale x 8 x double> %c, <vscale x 8 x i1> %allones, i32 %evl)
1822   %u = call <vscale x 8 x double> @llvm.vp.merge.nxv8f64(<vscale x 8 x i1> %allones, <vscale x 8 x double> %v, <vscale x 8 x double> %c, i32 %evl)
1823   ret <vscale x 8 x double> %u
1826 define <vscale x 8 x double> @vfmacc_vf_nxv8f64(<vscale x 8 x double> %va, double %b, <vscale x 8 x double> %c, <vscale x 8 x i1> %m, i32 zeroext %evl) {
1827 ; CHECK-LABEL: vfmacc_vf_nxv8f64:
1828 ; CHECK:       # %bb.0:
1829 ; CHECK-NEXT:    vsetvli zero, a0, e64, m8, tu, mu
1830 ; CHECK-NEXT:    vfmacc.vf v16, fa0, v8, v0.t
1831 ; CHECK-NEXT:    vmv8r.v v8, v16
1832 ; CHECK-NEXT:    ret
1833   %elt.head = insertelement <vscale x 8 x double> poison, double %b, i32 0
1834   %vb = shufflevector <vscale x 8 x double> %elt.head, <vscale x 8 x double> poison, <vscale x 8 x i32> zeroinitializer
1835   %splat = insertelement <vscale x 8 x i1> poison, i1 -1, i32 0
1836   %allones = shufflevector <vscale x 8 x i1> %splat, <vscale x 8 x i1> poison, <vscale x 8 x i32> zeroinitializer
1837   %v = call <vscale x 8 x double> @llvm.vp.fma.nxv8f64(<vscale x 8 x double> %va, <vscale x 8 x double> %vb, <vscale x 8 x double> %c, <vscale x 8 x i1> %allones, i32 %evl)
1838   %u = call <vscale x 8 x double> @llvm.vp.merge.nxv8f64(<vscale x 8 x i1> %m, <vscale x 8 x double> %v, <vscale x 8 x double> %c, i32 %evl)
1839   ret <vscale x 8 x double> %u
1842 define <vscale x 8 x double> @vfmacc_vf_nxv8f64_commute(<vscale x 8 x double> %va, double %b, <vscale x 8 x double> %c, <vscale x 8 x i1> %m, i32 zeroext %evl) {
1843 ; CHECK-LABEL: vfmacc_vf_nxv8f64_commute:
1844 ; CHECK:       # %bb.0:
1845 ; CHECK-NEXT:    vsetvli zero, a0, e64, m8, tu, mu
1846 ; CHECK-NEXT:    vfmacc.vf v16, fa0, v8, v0.t
1847 ; CHECK-NEXT:    vmv8r.v v8, v16
1848 ; CHECK-NEXT:    ret
1849   %elt.head = insertelement <vscale x 8 x double> poison, double %b, i32 0
1850   %vb = shufflevector <vscale x 8 x double> %elt.head, <vscale x 8 x double> poison, <vscale x 8 x i32> zeroinitializer
1851   %splat = insertelement <vscale x 8 x i1> poison, i1 -1, i32 0
1852   %allones = shufflevector <vscale x 8 x i1> %splat, <vscale x 8 x i1> poison, <vscale x 8 x i32> zeroinitializer
1853   %v = call <vscale x 8 x double> @llvm.vp.fma.nxv8f64(<vscale x 8 x double> %vb, <vscale x 8 x double> %va, <vscale x 8 x double> %c, <vscale x 8 x i1> %allones, i32 %evl)
1854   %u = call <vscale x 8 x double> @llvm.vp.merge.nxv8f64(<vscale x 8 x i1> %m, <vscale x 8 x double> %v, <vscale x 8 x double> %c, i32 %evl)
1855   ret <vscale x 8 x double> %u
1858 define <vscale x 8 x double> @vfmacc_vf_nxv8f64_unmasked(<vscale x 8 x double> %va, double %b, <vscale x 8 x double> %c, i32 zeroext %evl) {
1859 ; CHECK-LABEL: vfmacc_vf_nxv8f64_unmasked:
1860 ; CHECK:       # %bb.0:
1861 ; CHECK-NEXT:    vsetvli zero, a0, e64, m8, tu, ma
1862 ; CHECK-NEXT:    vfmacc.vf v16, fa0, v8
1863 ; CHECK-NEXT:    vmv8r.v v8, v16
1864 ; CHECK-NEXT:    ret
1865   %elt.head = insertelement <vscale x 8 x double> poison, double %b, i32 0
1866   %vb = shufflevector <vscale x 8 x double> %elt.head, <vscale x 8 x double> poison, <vscale x 8 x i32> zeroinitializer
1867   %splat = insertelement <vscale x 8 x i1> poison, i1 -1, i32 0
1868   %allones = shufflevector <vscale x 8 x i1> %splat, <vscale x 8 x i1> poison, <vscale x 8 x i32> zeroinitializer
1869   %v = call <vscale x 8 x double> @llvm.vp.fma.nxv8f64(<vscale x 8 x double> %va, <vscale x 8 x double> %vb, <vscale x 8 x double> %c, <vscale x 8 x i1> %allones, i32 %evl)
1870   %u = call <vscale x 8 x double> @llvm.vp.merge.nxv8f64(<vscale x 8 x i1> %allones, <vscale x 8 x double> %v, <vscale x 8 x double> %c, i32 %evl)
1871   ret <vscale x 8 x double> %u
1874 define <vscale x 8 x double> @vfmacc_vv_nxv8f64_ta(<vscale x 8 x double> %a, <vscale x 8 x double> %b, <vscale x 8 x double> %c, <vscale x 8 x i1> %m, i32 zeroext %evl) {
1875 ; CHECK-LABEL: vfmacc_vv_nxv8f64_ta:
1876 ; CHECK:       # %bb.0:
1877 ; CHECK-NEXT:    vl8re64.v v24, (a0)
1878 ; CHECK-NEXT:    vsetvli zero, a1, e64, m8, ta, mu
1879 ; CHECK-NEXT:    vfmacc.vv v24, v8, v16, v0.t
1880 ; CHECK-NEXT:    vmv.v.v v8, v24
1881 ; CHECK-NEXT:    ret
1882   %splat = insertelement <vscale x 8 x i1> poison, i1 -1, i32 0
1883   %allones = shufflevector <vscale x 8 x i1> %splat, <vscale x 8 x i1> poison, <vscale x 8 x i32> zeroinitializer
1884   %v = call <vscale x 8 x double> @llvm.vp.fma.nxv8f64(<vscale x 8 x double> %a, <vscale x 8 x double> %b, <vscale x 8 x double> %c, <vscale x 8 x i1> %allones, i32 %evl)
1885   %u = call <vscale x 8 x double> @llvm.vp.select.nxv8f64(<vscale x 8 x i1> %m, <vscale x 8 x double> %v, <vscale x 8 x double> %c, i32 %evl)
1886   ret <vscale x 8 x double> %u
1889 define <vscale x 8 x double> @vfmacc_vf_nxv8f64_ta(<vscale x 8 x double> %va, double %b, <vscale x 8 x double> %c, <vscale x 8 x i1> %m, i32 zeroext %evl) {
1890 ; CHECK-LABEL: vfmacc_vf_nxv8f64_ta:
1891 ; CHECK:       # %bb.0:
1892 ; CHECK-NEXT:    vsetvli zero, a0, e64, m8, ta, mu
1893 ; CHECK-NEXT:    vfmacc.vf v16, fa0, v8, v0.t
1894 ; CHECK-NEXT:    vmv.v.v v8, v16
1895 ; CHECK-NEXT:    ret
1896   %elt.head = insertelement <vscale x 8 x double> poison, double %b, i32 0
1897   %vb = shufflevector <vscale x 8 x double> %elt.head, <vscale x 8 x double> poison, <vscale x 8 x i32> zeroinitializer
1898   %splat = insertelement <vscale x 8 x i1> poison, i1 -1, i32 0
1899   %allones = shufflevector <vscale x 8 x i1> %splat, <vscale x 8 x i1> poison, <vscale x 8 x i32> zeroinitializer
1900   %v = call <vscale x 8 x double> @llvm.vp.fma.nxv8f64(<vscale x 8 x double> %va, <vscale x 8 x double> %vb, <vscale x 8 x double> %c, <vscale x 8 x i1> %allones, i32 %evl)
1901   %u = call <vscale x 8 x double> @llvm.vp.select.nxv8f64(<vscale x 8 x i1> %m, <vscale x 8 x double> %v, <vscale x 8 x double> %c, i32 %evl)
1902   ret <vscale x 8 x double> %u
1905 define <vscale x 8 x double> @vfmacc_vf_nxv8f64_commute_ta(<vscale x 8 x double> %va, double %b, <vscale x 8 x double> %c, <vscale x 8 x i1> %m, i32 zeroext %evl) {
1906 ; CHECK-LABEL: vfmacc_vf_nxv8f64_commute_ta:
1907 ; CHECK:       # %bb.0:
1908 ; CHECK-NEXT:    vsetvli zero, a0, e64, m8, ta, mu
1909 ; CHECK-NEXT:    vfmacc.vf v16, fa0, v8, v0.t
1910 ; CHECK-NEXT:    vmv.v.v v8, v16
1911 ; CHECK-NEXT:    ret
1912   %elt.head = insertelement <vscale x 8 x double> poison, double %b, i32 0
1913   %vb = shufflevector <vscale x 8 x double> %elt.head, <vscale x 8 x double> poison, <vscale x 8 x i32> zeroinitializer
1914   %splat = insertelement <vscale x 8 x i1> poison, i1 -1, i32 0
1915   %allones = shufflevector <vscale x 8 x i1> %splat, <vscale x 8 x i1> poison, <vscale x 8 x i32> zeroinitializer
1916   %v = call <vscale x 8 x double> @llvm.vp.fma.nxv8f64(<vscale x 8 x double> %vb, <vscale x 8 x double> %va, <vscale x 8 x double> %c, <vscale x 8 x i1> %allones, i32 %evl)
1917   %u = call <vscale x 8 x double> @llvm.vp.select.nxv8f64(<vscale x 8 x i1> %m, <vscale x 8 x double> %v, <vscale x 8 x double> %c, i32 %evl)
1918   ret <vscale x 8 x double> %u