llvm/test/CodeGen/RISCV/rvv/fixed-vectors-vfmsac-vp.ll

   1 ; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
   2 ; RUN: llc -mtriple=riscv32 -mattr=+d,+zvfh,+v,+m -target-abi=ilp32d \
   3 ; RUN:     -verify-machineinstrs < %s | FileCheck %s
   4 ; RUN: llc -mtriple=riscv64 -mattr=+d,+zvfh,+v,+m -target-abi=lp64d \
   5 ; RUN:     -verify-machineinstrs < %s | FileCheck %s
   6
   7 declare <2 x half> @llvm.vp.fma.v2f16(<2 x half>, <2 x half>, <2 x half>, <2 x i1>, i32)
   8 declare <2 x half> @llvm.vp.fneg.v2f16(<2 x half>, <2 x i1>, i32)
   9 declare <2 x half> @llvm.vp.merge.v2f16(<2 x i1>, <2 x half>, <2 x half>, i32)
  10 declare <2 x half> @llvm.vp.select.v2f16(<2 x i1>, <2 x half>, <2 x half>, i32)
  11
  12 define <2 x half> @vfmsac_vv_v2f16(<2 x half> %a, <2 x half> %b, <2 x half> %c, <2 x i1> %m, i32 zeroext %evl) {
  13 ; CHECK-LABEL: vfmsac_vv_v2f16:
  14 ; CHECK:       # %bb.0:
  15 ; CHECK-NEXT:    vsetvli zero, a0, e16, mf4, tu, mu
  16 ; CHECK-NEXT:    vfmsac.vv v10, v8, v9, v0.t
  17 ; CHECK-NEXT:    vmv1r.v v8, v10
  18 ; CHECK-NEXT:    ret
  19   %negc = call <2 x half> @llvm.vp.fneg.v2f16(<2 x half> %c, <2 x i1> splat (i1 -1), i32 %evl)
  20   %v = call <2 x half> @llvm.vp.fma.v2f16(<2 x half> %a, <2 x half> %b, <2 x half> %negc, <2 x i1> splat (i1 -1), i32 %evl)
  21   %u = call <2 x half> @llvm.vp.merge.v2f16(<2 x i1> %m, <2 x half> %v, <2 x half> %c, i32 %evl)
  22   ret <2 x half> %u
  23 }
  24
  25 define <2 x half> @vfmsac_vv_v2f16_unmasked(<2 x half> %a, <2 x half> %b, <2 x half> %c, <2 x i1> %m, i32 zeroext %evl) {
  26 ; CHECK-LABEL: vfmsac_vv_v2f16_unmasked:
  27 ; CHECK:       # %bb.0:
  28 ; CHECK-NEXT:    vsetvli zero, a0, e16, mf4, tu, ma
  29 ; CHECK-NEXT:    vfmsac.vv v10, v8, v9
  30 ; CHECK-NEXT:    vmv1r.v v8, v10
  31 ; CHECK-NEXT:    ret
  32   %negc = call <2 x half> @llvm.vp.fneg.v2f16(<2 x half> %c, <2 x i1> splat (i1 -1), i32 %evl)
  33   %v = call <2 x half> @llvm.vp.fma.v2f16(<2 x half> %a, <2 x half> %b, <2 x half> %negc, <2 x i1> splat (i1 -1), i32 %evl)
  34   %u = call <2 x half> @llvm.vp.merge.v2f16(<2 x i1> splat (i1 -1), <2 x half> %v, <2 x half> %c, i32 %evl)
  35   ret <2 x half> %u
  36 }
  37
  38 define <2 x half> @vfmsac_vf_v2f16(<2 x half> %a, half %b, <2 x half> %c, <2 x i1> %m, i32 zeroext %evl) {
  39 ; CHECK-LABEL: vfmsac_vf_v2f16:
  40 ; CHECK:       # %bb.0:
  41 ; CHECK-NEXT:    vsetvli zero, a0, e16, mf4, tu, mu
  42 ; CHECK-NEXT:    vfmsac.vf v9, fa0, v8, v0.t
  43 ; CHECK-NEXT:    vmv1r.v v8, v9
  44 ; CHECK-NEXT:    ret
  45   %elt.head = insertelement <2 x half> poison, half %b, i32 0
  46   %vb = shufflevector <2 x half> %elt.head, <2 x half> poison, <2 x i32> zeroinitializer
  47   %negc = call <2 x half> @llvm.vp.fneg.v2f16(<2 x half> %c, <2 x i1> splat (i1 -1), i32 %evl)
  48   %v = call <2 x half> @llvm.vp.fma.v2f16(<2 x half> %a, <2 x half> %vb, <2 x half> %negc, <2 x i1> splat (i1 -1), i32 %evl)
  49   %u = call <2 x half> @llvm.vp.merge.v2f16(<2 x i1> %m, <2 x half> %v, <2 x half> %c, i32 %evl)
  50   ret <2 x half> %u
  51 }
  52
  53 define <2 x half> @vfmsac_vf_v2f16_commute(<2 x half> %a, half %b, <2 x half> %c, <2 x i1> %m, i32 zeroext %evl) {
  54 ; CHECK-LABEL: vfmsac_vf_v2f16_commute:
  55 ; CHECK:       # %bb.0:
  56 ; CHECK-NEXT:    vsetvli zero, a0, e16, mf4, tu, mu
  57 ; CHECK-NEXT:    vfmsac.vf v9, fa0, v8, v0.t
  58 ; CHECK-NEXT:    vmv1r.v v8, v9
  59 ; CHECK-NEXT:    ret
  60   %elt.head = insertelement <2 x half> poison, half %b, i32 0
  61   %vb = shufflevector <2 x half> %elt.head, <2 x half> poison, <2 x i32> zeroinitializer
  62   %negc = call <2 x half> @llvm.vp.fneg.v2f16(<2 x half> %c, <2 x i1> splat (i1 -1), i32 %evl)
  63   %v = call <2 x half> @llvm.vp.fma.v2f16(<2 x half> %vb, <2 x half> %a, <2 x half> %negc, <2 x i1> splat (i1 -1), i32 %evl)
  64   %u = call <2 x half> @llvm.vp.merge.v2f16(<2 x i1> %m, <2 x half> %v, <2 x half> %c, i32 %evl)
  65   ret <2 x half> %u
  66 }
  67
  68 define <2 x half> @vfmsac_vf_v2f16_unmasked(<2 x half> %a, half %b, <2 x half> %c, i32 zeroext %evl) {
  69 ; CHECK-LABEL: vfmsac_vf_v2f16_unmasked:
  70 ; CHECK:       # %bb.0:
  71 ; CHECK-NEXT:    vsetvli zero, a0, e16, mf4, tu, ma
  72 ; CHECK-NEXT:    vfmsac.vf v9, fa0, v8
  73 ; CHECK-NEXT:    vmv1r.v v8, v9
  74 ; CHECK-NEXT:    ret
  75   %elt.head = insertelement <2 x half> poison, half %b, i32 0
  76   %vb = shufflevector <2 x half> %elt.head, <2 x half> poison, <2 x i32> zeroinitializer
  77   %negc = call <2 x half> @llvm.vp.fneg.v2f16(<2 x half> %c, <2 x i1> splat (i1 -1), i32 %evl)
  78   %v = call <2 x half> @llvm.vp.fma.v2f16(<2 x half> %a, <2 x half> %vb, <2 x half> %negc, <2 x i1> splat (i1 -1), i32 %evl)
  79   %u = call <2 x half> @llvm.vp.merge.v2f16(<2 x i1> splat (i1 -1), <2 x half> %v, <2 x half> %c, i32 %evl)
  80   ret <2 x half> %u
  81 }
  82
  83 define <2 x half> @vfmsac_vv_v2f16_ta(<2 x half> %a, <2 x half> %b, <2 x half> %c, <2 x i1> %m, i32 zeroext %evl) {
  84 ; CHECK-LABEL: vfmsac_vv_v2f16_ta:
  85 ; CHECK:       # %bb.0:
  86 ; CHECK-NEXT:    vsetvli zero, a0, e16, mf4, ta, mu
  87 ; CHECK-NEXT:    vfmsac.vv v10, v8, v9, v0.t
  88 ; CHECK-NEXT:    vmv1r.v v8, v10
  89 ; CHECK-NEXT:    ret
  90   %negc = call <2 x half> @llvm.vp.fneg.v2f16(<2 x half> %c, <2 x i1> splat (i1 -1), i32 %evl)
  91   %v = call <2 x half> @llvm.vp.fma.v2f16(<2 x half> %a, <2 x half> %b, <2 x half> %negc, <2 x i1> splat (i1 -1), i32 %evl)
  92   %u = call <2 x half> @llvm.vp.select.v2f16(<2 x i1> %m, <2 x half> %v, <2 x half> %c, i32 %evl)
  93   ret <2 x half> %u
  94 }
  95
  96 define <2 x half> @vfmsac_vf_v2f16_ta(<2 x half> %a, half %b, <2 x half> %c, <2 x i1> %m, i32 zeroext %evl) {
  97 ; CHECK-LABEL: vfmsac_vf_v2f16_ta:
  98 ; CHECK:       # %bb.0:
  99 ; CHECK-NEXT:    vsetvli zero, a0, e16, mf4, ta, mu
 100 ; CHECK-NEXT:    vfmsac.vf v9, fa0, v8, v0.t
 101 ; CHECK-NEXT:    vmv1r.v v8, v9
 102 ; CHECK-NEXT:    ret
 103   %elt.head = insertelement <2 x half> poison, half %b, i32 0
 104   %vb = shufflevector <2 x half> %elt.head, <2 x half> poison, <2 x i32> zeroinitializer
 105   %negc = call <2 x half> @llvm.vp.fneg.v2f16(<2 x half> %c, <2 x i1> splat (i1 -1), i32 %evl)
 106   %v = call <2 x half> @llvm.vp.fma.v2f16(<2 x half> %a, <2 x half> %vb, <2 x half> %negc, <2 x i1> splat (i1 -1), i32 %evl)
 107   %u = call <2 x half> @llvm.vp.select.v2f16(<2 x i1> %m, <2 x half> %v, <2 x half> %c, i32 %evl)
 108   ret <2 x half> %u
 109 }
 110
 111 define <2 x half> @vfmsac_vf_v2f16_commute_ta(<2 x half> %a, half %b, <2 x half> %c, <2 x i1> %m, i32 zeroext %evl) {
 112 ; CHECK-LABEL: vfmsac_vf_v2f16_commute_ta:
 113 ; CHECK:       # %bb.0:
 114 ; CHECK-NEXT:    vsetvli zero, a0, e16, mf4, ta, mu
 115 ; CHECK-NEXT:    vfmsac.vf v9, fa0, v8, v0.t
 116 ; CHECK-NEXT:    vmv1r.v v8, v9
 117 ; CHECK-NEXT:    ret
 118   %elt.head = insertelement <2 x half> poison, half %b, i32 0
 119   %vb = shufflevector <2 x half> %elt.head, <2 x half> poison, <2 x i32> zeroinitializer
 120   %negc = call <2 x half> @llvm.vp.fneg.v2f16(<2 x half> %c, <2 x i1> splat (i1 -1), i32 %evl)
 121   %v = call <2 x half> @llvm.vp.fma.v2f16(<2 x half> %vb, <2 x half> %a, <2 x half> %negc, <2 x i1> splat (i1 -1), i32 %evl)
 122   %u = call <2 x half> @llvm.vp.select.v2f16(<2 x i1> %m, <2 x half> %v, <2 x half> %c, i32 %evl)
 123   ret <2 x half> %u
 124 }
 125
 126 declare <4 x half> @llvm.vp.fma.v4f16(<4 x half>, <4 x half>, <4 x half>, <4 x i1>, i32)
 127 declare <4 x half> @llvm.vp.fneg.v4f16(<4 x half>, <4 x i1>, i32)
 128 declare <4 x half> @llvm.vp.merge.v4f16(<4 x i1>, <4 x half>, <4 x half>, i32)
 129 declare <4 x half> @llvm.vp.select.v4f16(<4 x i1>, <4 x half>, <4 x half>, i32)
 130
 131 define <4 x half> @vfmsac_vv_v4f16(<4 x half> %a, <4 x half> %b, <4 x half> %c, <4 x i1> %m, i32 zeroext %evl) {
 132 ; CHECK-LABEL: vfmsac_vv_v4f16:
 133 ; CHECK:       # %bb.0:
 134 ; CHECK-NEXT:    vsetvli zero, a0, e16, mf2, tu, mu
 135 ; CHECK-NEXT:    vfmsac.vv v10, v8, v9, v0.t
 136 ; CHECK-NEXT:    vmv1r.v v8, v10
 137 ; CHECK-NEXT:    ret
 138   %negc = call <4 x half> @llvm.vp.fneg.v4f16(<4 x half> %c, <4 x i1> splat (i1 -1), i32 %evl)
 139   %v = call <4 x half> @llvm.vp.fma.v4f16(<4 x half> %a, <4 x half> %b, <4 x half> %negc, <4 x i1> splat (i1 -1), i32 %evl)
 140   %u = call <4 x half> @llvm.vp.merge.v4f16(<4 x i1> %m, <4 x half> %v, <4 x half> %c, i32 %evl)
 141   ret <4 x half> %u
 142 }
 143
 144 define <4 x half> @vfmsac_vv_v4f16_unmasked(<4 x half> %a, <4 x half> %b, <4 x half> %c, <4 x i1> %m, i32 zeroext %evl) {
 145 ; CHECK-LABEL: vfmsac_vv_v4f16_unmasked:
 146 ; CHECK:       # %bb.0:
 147 ; CHECK-NEXT:    vsetvli zero, a0, e16, mf2, tu, ma
 148 ; CHECK-NEXT:    vfmsac.vv v10, v8, v9
 149 ; CHECK-NEXT:    vmv1r.v v8, v10
 150 ; CHECK-NEXT:    ret
 151   %negc = call <4 x half> @llvm.vp.fneg.v4f16(<4 x half> %c, <4 x i1> splat (i1 -1), i32 %evl)
 152   %v = call <4 x half> @llvm.vp.fma.v4f16(<4 x half> %a, <4 x half> %b, <4 x half> %negc, <4 x i1> splat (i1 -1), i32 %evl)
 153   %u = call <4 x half> @llvm.vp.merge.v4f16(<4 x i1> splat (i1 -1), <4 x half> %v, <4 x half> %c, i32 %evl)
 154   ret <4 x half> %u
 155 }
 156
 157 define <4 x half> @vfmsac_vf_v4f16(<4 x half> %a, half %b, <4 x half> %c, <4 x i1> %m, i32 zeroext %evl) {
 158 ; CHECK-LABEL: vfmsac_vf_v4f16:
 159 ; CHECK:       # %bb.0:
 160 ; CHECK-NEXT:    vsetvli zero, a0, e16, mf2, tu, mu
 161 ; CHECK-NEXT:    vfmsac.vf v9, fa0, v8, v0.t
 162 ; CHECK-NEXT:    vmv1r.v v8, v9
 163 ; CHECK-NEXT:    ret
 164   %elt.head = insertelement <4 x half> poison, half %b, i32 0
 165   %vb = shufflevector <4 x half> %elt.head, <4 x half> poison, <4 x i32> zeroinitializer
 166   %negc = call <4 x half> @llvm.vp.fneg.v4f16(<4 x half> %c, <4 x i1> splat (i1 -1), i32 %evl)
 167   %v = call <4 x half> @llvm.vp.fma.v4f16(<4 x half> %a, <4 x half> %vb, <4 x half> %negc, <4 x i1> splat (i1 -1), i32 %evl)
 168   %u = call <4 x half> @llvm.vp.merge.v4f16(<4 x i1> %m, <4 x half> %v, <4 x half> %c, i32 %evl)
 169   ret <4 x half> %u
 170 }
 171
 172 define <4 x half> @vfmsac_vf_v4f16_commute(<4 x half> %a, half %b, <4 x half> %c, <4 x i1> %m, i32 zeroext %evl) {
 173 ; CHECK-LABEL: vfmsac_vf_v4f16_commute:
 174 ; CHECK:       # %bb.0:
 175 ; CHECK-NEXT:    vsetvli zero, a0, e16, mf2, tu, mu
 176 ; CHECK-NEXT:    vfmsac.vf v9, fa0, v8, v0.t
 177 ; CHECK-NEXT:    vmv1r.v v8, v9
 178 ; CHECK-NEXT:    ret
 179   %elt.head = insertelement <4 x half> poison, half %b, i32 0
 180   %vb = shufflevector <4 x half> %elt.head, <4 x half> poison, <4 x i32> zeroinitializer
 181   %negc = call <4 x half> @llvm.vp.fneg.v4f16(<4 x half> %c, <4 x i1> splat (i1 -1), i32 %evl)
 182   %v = call <4 x half> @llvm.vp.fma.v4f16(<4 x half> %vb, <4 x half> %a, <4 x half> %negc, <4 x i1> splat (i1 -1), i32 %evl)
 183   %u = call <4 x half> @llvm.vp.merge.v4f16(<4 x i1> %m, <4 x half> %v, <4 x half> %c, i32 %evl)
 184   ret <4 x half> %u
 185 }
 186
 187 define <4 x half> @vfmsac_vf_v4f16_unmasked(<4 x half> %a, half %b, <4 x half> %c, i32 zeroext %evl) {
 188 ; CHECK-LABEL: vfmsac_vf_v4f16_unmasked:
 189 ; CHECK:       # %bb.0:
 190 ; CHECK-NEXT:    vsetvli zero, a0, e16, mf2, tu, ma
 191 ; CHECK-NEXT:    vfmsac.vf v9, fa0, v8
 192 ; CHECK-NEXT:    vmv1r.v v8, v9
 193 ; CHECK-NEXT:    ret
 194   %elt.head = insertelement <4 x half> poison, half %b, i32 0
 195   %vb = shufflevector <4 x half> %elt.head, <4 x half> poison, <4 x i32> zeroinitializer
 196   %negc = call <4 x half> @llvm.vp.fneg.v4f16(<4 x half> %c, <4 x i1> splat (i1 -1), i32 %evl)
 197   %v = call <4 x half> @llvm.vp.fma.v4f16(<4 x half> %a, <4 x half> %vb, <4 x half> %negc, <4 x i1> splat (i1 -1), i32 %evl)
 198   %u = call <4 x half> @llvm.vp.merge.v4f16(<4 x i1> splat (i1 -1), <4 x half> %v, <4 x half> %c, i32 %evl)
 199   ret <4 x half> %u
 200 }
 201
 202 define <4 x half> @vfmsac_vv_v4f16_ta(<4 x half> %a, <4 x half> %b, <4 x half> %c, <4 x i1> %m, i32 zeroext %evl) {
 203 ; CHECK-LABEL: vfmsac_vv_v4f16_ta:
 204 ; CHECK:       # %bb.0:
 205 ; CHECK-NEXT:    vsetvli zero, a0, e16, mf2, ta, mu
 206 ; CHECK-NEXT:    vfmsac.vv v10, v8, v9, v0.t
 207 ; CHECK-NEXT:    vmv1r.v v8, v10
 208 ; CHECK-NEXT:    ret
 209   %negc = call <4 x half> @llvm.vp.fneg.v4f16(<4 x half> %c, <4 x i1> splat (i1 -1), i32 %evl)
 210   %v = call <4 x half> @llvm.vp.fma.v4f16(<4 x half> %a, <4 x half> %b, <4 x half> %negc, <4 x i1> splat (i1 -1), i32 %evl)
 211   %u = call <4 x half> @llvm.vp.select.v4f16(<4 x i1> %m, <4 x half> %v, <4 x half> %c, i32 %evl)
 212   ret <4 x half> %u
 213 }
 214
 215 define <4 x half> @vfmsac_vf_v4f16_ta(<4 x half> %a, half %b, <4 x half> %c, <4 x i1> %m, i32 zeroext %evl) {
 216 ; CHECK-LABEL: vfmsac_vf_v4f16_ta:
 217 ; CHECK:       # %bb.0:
 218 ; CHECK-NEXT:    vsetvli zero, a0, e16, mf2, ta, mu
 219 ; CHECK-NEXT:    vfmsac.vf v9, fa0, v8, v0.t
 220 ; CHECK-NEXT:    vmv1r.v v8, v9
 221 ; CHECK-NEXT:    ret
 222   %elt.head = insertelement <4 x half> poison, half %b, i32 0
 223   %vb = shufflevector <4 x half> %elt.head, <4 x half> poison, <4 x i32> zeroinitializer
 224   %negc = call <4 x half> @llvm.vp.fneg.v4f16(<4 x half> %c, <4 x i1> splat (i1 -1), i32 %evl)
 225   %v = call <4 x half> @llvm.vp.fma.v4f16(<4 x half> %a, <4 x half> %vb, <4 x half> %negc, <4 x i1> splat (i1 -1), i32 %evl)
 226   %u = call <4 x half> @llvm.vp.select.v4f16(<4 x i1> %m, <4 x half> %v, <4 x half> %c, i32 %evl)
 227   ret <4 x half> %u
 228 }
 229
 230 define <4 x half> @vfmsac_vf_v4f16_commute_ta(<4 x half> %a, half %b, <4 x half> %c, <4 x i1> %m, i32 zeroext %evl) {
 231 ; CHECK-LABEL: vfmsac_vf_v4f16_commute_ta:
 232 ; CHECK:       # %bb.0:
 233 ; CHECK-NEXT:    vsetvli zero, a0, e16, mf2, ta, mu
 234 ; CHECK-NEXT:    vfmsac.vf v9, fa0, v8, v0.t
 235 ; CHECK-NEXT:    vmv1r.v v8, v9
 236 ; CHECK-NEXT:    ret
 237   %elt.head = insertelement <4 x half> poison, half %b, i32 0
 238   %vb = shufflevector <4 x half> %elt.head, <4 x half> poison, <4 x i32> zeroinitializer
 239   %negc = call <4 x half> @llvm.vp.fneg.v4f16(<4 x half> %c, <4 x i1> splat (i1 -1), i32 %evl)
 240   %v = call <4 x half> @llvm.vp.fma.v4f16(<4 x half> %vb, <4 x half> %a, <4 x half> %negc, <4 x i1> splat (i1 -1), i32 %evl)
 241   %u = call <4 x half> @llvm.vp.select.v4f16(<4 x i1> %m, <4 x half> %v, <4 x half> %c, i32 %evl)
 242   ret <4 x half> %u
 243 }
 244
 245 declare <8 x half> @llvm.vp.fma.v8f16(<8 x half>, <8 x half>, <8 x half>, <8 x i1>, i32)
 246 declare <8 x half> @llvm.vp.fneg.v8f16(<8 x half>, <8 x i1>, i32)
 247 declare <8 x half> @llvm.vp.merge.v8f16(<8 x i1>, <8 x half>, <8 x half>, i32)
 248 declare <8 x half> @llvm.vp.select.v8f16(<8 x i1>, <8 x half>, <8 x half>, i32)
 249
 250 define <8 x half> @vfmsac_vv_v8f16(<8 x half> %a, <8 x half> %b, <8 x half> %c, <8 x i1> %m, i32 zeroext %evl) {
 251 ; CHECK-LABEL: vfmsac_vv_v8f16:
 252 ; CHECK:       # %bb.0:
 253 ; CHECK-NEXT:    vsetvli zero, a0, e16, m1, tu, mu
 254 ; CHECK-NEXT:    vfmsac.vv v10, v8, v9, v0.t
 255 ; CHECK-NEXT:    vmv1r.v v8, v10
 256 ; CHECK-NEXT:    ret
 257   %negc = call <8 x half> @llvm.vp.fneg.v8f16(<8 x half> %c, <8 x i1> splat (i1 -1), i32 %evl)
 258   %v = call <8 x half> @llvm.vp.fma.v8f16(<8 x half> %a, <8 x half> %b, <8 x half> %negc, <8 x i1> splat (i1 -1), i32 %evl)
 259   %u = call <8 x half> @llvm.vp.merge.v8f16(<8 x i1> %m, <8 x half> %v, <8 x half> %c, i32 %evl)
 260   ret <8 x half> %u
 261 }
 262
 263 define <8 x half> @vfmsac_vv_v8f16_unmasked(<8 x half> %a, <8 x half> %b, <8 x half> %c, <8 x i1> %m, i32 zeroext %evl) {
 264 ; CHECK-LABEL: vfmsac_vv_v8f16_unmasked:
 265 ; CHECK:       # %bb.0:
 266 ; CHECK-NEXT:    vsetvli zero, a0, e16, m1, tu, ma
 267 ; CHECK-NEXT:    vfmsac.vv v10, v8, v9
 268 ; CHECK-NEXT:    vmv1r.v v8, v10
 269 ; CHECK-NEXT:    ret
 270   %negc = call <8 x half> @llvm.vp.fneg.v8f16(<8 x half> %c, <8 x i1> splat (i1 -1), i32 %evl)
 271   %v = call <8 x half> @llvm.vp.fma.v8f16(<8 x half> %a, <8 x half> %b, <8 x half> %negc, <8 x i1> splat (i1 -1), i32 %evl)
 272   %u = call <8 x half> @llvm.vp.merge.v8f16(<8 x i1> splat (i1 -1), <8 x half> %v, <8 x half> %c, i32 %evl)
 273   ret <8 x half> %u
 274 }
 275
 276 define <8 x half> @vfmsac_vf_v8f16(<8 x half> %a, half %b, <8 x half> %c, <8 x i1> %m, i32 zeroext %evl) {
 277 ; CHECK-LABEL: vfmsac_vf_v8f16:
 278 ; CHECK:       # %bb.0:
 279 ; CHECK-NEXT:    vsetvli zero, a0, e16, m1, tu, mu
 280 ; CHECK-NEXT:    vfmsac.vf v9, fa0, v8, v0.t
 281 ; CHECK-NEXT:    vmv1r.v v8, v9
 282 ; CHECK-NEXT:    ret
 283   %elt.head = insertelement <8 x half> poison, half %b, i32 0
 284   %vb = shufflevector <8 x half> %elt.head, <8 x half> poison, <8 x i32> zeroinitializer
 285   %negc = call <8 x half> @llvm.vp.fneg.v8f16(<8 x half> %c, <8 x i1> splat (i1 -1), i32 %evl)
 286   %v = call <8 x half> @llvm.vp.fma.v8f16(<8 x half> %a, <8 x half> %vb, <8 x half> %negc, <8 x i1> splat (i1 -1), i32 %evl)
 287   %u = call <8 x half> @llvm.vp.merge.v8f16(<8 x i1> %m, <8 x half> %v, <8 x half> %c, i32 %evl)
 288   ret <8 x half> %u
 289 }
 290
 291 define <8 x half> @vfmsac_vf_v8f16_commute(<8 x half> %a, half %b, <8 x half> %c, <8 x i1> %m, i32 zeroext %evl) {
 292 ; CHECK-LABEL: vfmsac_vf_v8f16_commute:
 293 ; CHECK:       # %bb.0:
 294 ; CHECK-NEXT:    vsetvli zero, a0, e16, m1, tu, mu
 295 ; CHECK-NEXT:    vfmsac.vf v9, fa0, v8, v0.t
 296 ; CHECK-NEXT:    vmv1r.v v8, v9
 297 ; CHECK-NEXT:    ret
 298   %elt.head = insertelement <8 x half> poison, half %b, i32 0
 299   %vb = shufflevector <8 x half> %elt.head, <8 x half> poison, <8 x i32> zeroinitializer
 300   %negc = call <8 x half> @llvm.vp.fneg.v8f16(<8 x half> %c, <8 x i1> splat (i1 -1), i32 %evl)
 301   %v = call <8 x half> @llvm.vp.fma.v8f16(<8 x half> %vb, <8 x half> %a, <8 x half> %negc, <8 x i1> splat (i1 -1), i32 %evl)
 302   %u = call <8 x half> @llvm.vp.merge.v8f16(<8 x i1> %m, <8 x half> %v, <8 x half> %c, i32 %evl)
 303   ret <8 x half> %u
 304 }
 305
 306 define <8 x half> @vfmsac_vf_v8f16_unmasked(<8 x half> %a, half %b, <8 x half> %c, i32 zeroext %evl) {
 307 ; CHECK-LABEL: vfmsac_vf_v8f16_unmasked:
 308 ; CHECK:       # %bb.0:
 309 ; CHECK-NEXT:    vsetvli zero, a0, e16, m1, tu, ma
 310 ; CHECK-NEXT:    vfmsac.vf v9, fa0, v8
 311 ; CHECK-NEXT:    vmv1r.v v8, v9
 312 ; CHECK-NEXT:    ret
 313   %elt.head = insertelement <8 x half> poison, half %b, i32 0
 314   %vb = shufflevector <8 x half> %elt.head, <8 x half> poison, <8 x i32> zeroinitializer
 315   %negc = call <8 x half> @llvm.vp.fneg.v8f16(<8 x half> %c, <8 x i1> splat (i1 -1), i32 %evl)
 316   %v = call <8 x half> @llvm.vp.fma.v8f16(<8 x half> %a, <8 x half> %vb, <8 x half> %negc, <8 x i1> splat (i1 -1), i32 %evl)
 317   %u = call <8 x half> @llvm.vp.merge.v8f16(<8 x i1> splat (i1 -1), <8 x half> %v, <8 x half> %c, i32 %evl)
 318   ret <8 x half> %u
 319 }
 320
 321 define <8 x half> @vfmsac_vv_v8f16_ta(<8 x half> %a, <8 x half> %b, <8 x half> %c, <8 x i1> %m, i32 zeroext %evl) {
 322 ; CHECK-LABEL: vfmsac_vv_v8f16_ta:
 323 ; CHECK:       # %bb.0:
 324 ; CHECK-NEXT:    vsetvli zero, a0, e16, m1, ta, mu
 325 ; CHECK-NEXT:    vfmsac.vv v10, v8, v9, v0.t
 326 ; CHECK-NEXT:    vmv.v.v v8, v10
 327 ; CHECK-NEXT:    ret
 328   %negc = call <8 x half> @llvm.vp.fneg.v8f16(<8 x half> %c, <8 x i1> splat (i1 -1), i32 %evl)
 329   %v = call <8 x half> @llvm.vp.fma.v8f16(<8 x half> %a, <8 x half> %b, <8 x half> %negc, <8 x i1> splat (i1 -1), i32 %evl)
 330   %u = call <8 x half> @llvm.vp.select.v8f16(<8 x i1> %m, <8 x half> %v, <8 x half> %c, i32 %evl)
 331   ret <8 x half> %u
 332 }
 333
 334 define <8 x half> @vfmsac_vf_v8f16_ta(<8 x half> %a, half %b, <8 x half> %c, <8 x i1> %m, i32 zeroext %evl) {
 335 ; CHECK-LABEL: vfmsac_vf_v8f16_ta:
 336 ; CHECK:       # %bb.0:
 337 ; CHECK-NEXT:    vsetvli zero, a0, e16, m1, ta, mu
 338 ; CHECK-NEXT:    vfmsac.vf v9, fa0, v8, v0.t
 339 ; CHECK-NEXT:    vmv.v.v v8, v9
 340 ; CHECK-NEXT:    ret
 341   %elt.head = insertelement <8 x half> poison, half %b, i32 0
 342   %vb = shufflevector <8 x half> %elt.head, <8 x half> poison, <8 x i32> zeroinitializer
 343   %negc = call <8 x half> @llvm.vp.fneg.v8f16(<8 x half> %c, <8 x i1> splat (i1 -1), i32 %evl)
 344   %v = call <8 x half> @llvm.vp.fma.v8f16(<8 x half> %a, <8 x half> %vb, <8 x half> %negc, <8 x i1> splat (i1 -1), i32 %evl)
 345   %u = call <8 x half> @llvm.vp.select.v8f16(<8 x i1> %m, <8 x half> %v, <8 x half> %c, i32 %evl)
 346   ret <8 x half> %u
 347 }
 348
 349 define <8 x half> @vfmsac_vf_v8f16_commute_ta(<8 x half> %a, half %b, <8 x half> %c, <8 x i1> %m, i32 zeroext %evl) {
 350 ; CHECK-LABEL: vfmsac_vf_v8f16_commute_ta:
 351 ; CHECK:       # %bb.0:
 352 ; CHECK-NEXT:    vsetvli zero, a0, e16, m1, ta, mu
 353 ; CHECK-NEXT:    vfmsac.vf v9, fa0, v8, v0.t
 354 ; CHECK-NEXT:    vmv.v.v v8, v9
 355 ; CHECK-NEXT:    ret
 356   %elt.head = insertelement <8 x half> poison, half %b, i32 0
 357   %vb = shufflevector <8 x half> %elt.head, <8 x half> poison, <8 x i32> zeroinitializer
 358   %negc = call <8 x half> @llvm.vp.fneg.v8f16(<8 x half> %c, <8 x i1> splat (i1 -1), i32 %evl)
 359   %v = call <8 x half> @llvm.vp.fma.v8f16(<8 x half> %vb, <8 x half> %a, <8 x half> %negc, <8 x i1> splat (i1 -1), i32 %evl)
 360   %u = call <8 x half> @llvm.vp.select.v8f16(<8 x i1> %m, <8 x half> %v, <8 x half> %c, i32 %evl)
 361   ret <8 x half> %u
 362 }
 363
 364 declare <16 x half> @llvm.vp.fma.v16f16(<16 x half>, <16 x half>, <16 x half>, <16 x i1>, i32)
 365 declare <16 x half> @llvm.vp.fneg.v16f16(<16 x half>, <16 x i1>, i32)
 366 declare <16 x half> @llvm.vp.merge.v16f16(<16 x i1>, <16 x half>, <16 x half>, i32)
 367 declare <16 x half> @llvm.vp.select.v16f16(<16 x i1>, <16 x half>, <16 x half>, i32)
 368
 369 define <16 x half> @vfmsac_vv_v16f16(<16 x half> %a, <16 x half> %b, <16 x half> %c, <16 x i1> %m, i32 zeroext %evl) {
 370 ; CHECK-LABEL: vfmsac_vv_v16f16:
 371 ; CHECK:       # %bb.0:
 372 ; CHECK-NEXT:    vsetvli zero, a0, e16, m2, tu, mu
 373 ; CHECK-NEXT:    vfmsac.vv v12, v8, v10, v0.t
 374 ; CHECK-NEXT:    vmv2r.v v8, v12
 375 ; CHECK-NEXT:    ret
 376   %negc = call <16 x half> @llvm.vp.fneg.v16f16(<16 x half> %c, <16 x i1> splat (i1 -1), i32 %evl)
 377   %v = call <16 x half> @llvm.vp.fma.v16f16(<16 x half> %a, <16 x half> %b, <16 x half> %negc, <16 x i1> splat (i1 -1), i32 %evl)
 378   %u = call <16 x half> @llvm.vp.merge.v16f16(<16 x i1> %m, <16 x half> %v, <16 x half> %c, i32 %evl)
 379   ret <16 x half> %u
 380 }
 381
 382 define <16 x half> @vfmsac_vv_v16f16_unmasked(<16 x half> %a, <16 x half> %b, <16 x half> %c, <16 x i1> %m, i32 zeroext %evl) {
 383 ; CHECK-LABEL: vfmsac_vv_v16f16_unmasked:
 384 ; CHECK:       # %bb.0:
 385 ; CHECK-NEXT:    vsetvli zero, a0, e16, m2, tu, ma
 386 ; CHECK-NEXT:    vfmsac.vv v12, v8, v10
 387 ; CHECK-NEXT:    vmv2r.v v8, v12
 388 ; CHECK-NEXT:    ret
 389   %negc = call <16 x half> @llvm.vp.fneg.v16f16(<16 x half> %c, <16 x i1> splat (i1 -1), i32 %evl)
 390   %v = call <16 x half> @llvm.vp.fma.v16f16(<16 x half> %a, <16 x half> %b, <16 x half> %negc, <16 x i1> splat (i1 -1), i32 %evl)
 391   %u = call <16 x half> @llvm.vp.merge.v16f16(<16 x i1> splat (i1 -1), <16 x half> %v, <16 x half> %c, i32 %evl)
 392   ret <16 x half> %u
 393 }
 394
 395 define <16 x half> @vfmsac_vf_v16f16(<16 x half> %a, half %b, <16 x half> %c, <16 x i1> %m, i32 zeroext %evl) {
 396 ; CHECK-LABEL: vfmsac_vf_v16f16:
 397 ; CHECK:       # %bb.0:
 398 ; CHECK-NEXT:    vsetvli zero, a0, e16, m2, tu, mu
 399 ; CHECK-NEXT:    vfmsac.vf v10, fa0, v8, v0.t
 400 ; CHECK-NEXT:    vmv2r.v v8, v10
 401 ; CHECK-NEXT:    ret
 402   %elt.head = insertelement <16 x half> poison, half %b, i32 0
 403   %vb = shufflevector <16 x half> %elt.head, <16 x half> poison, <16 x i32> zeroinitializer
 404   %negc = call <16 x half> @llvm.vp.fneg.v16f16(<16 x half> %c, <16 x i1> splat (i1 -1), i32 %evl)
 405   %v = call <16 x half> @llvm.vp.fma.v16f16(<16 x half> %a, <16 x half> %vb, <16 x half> %negc, <16 x i1> splat (i1 -1), i32 %evl)
 406   %u = call <16 x half> @llvm.vp.merge.v16f16(<16 x i1> %m, <16 x half> %v, <16 x half> %c, i32 %evl)
 407   ret <16 x half> %u
 408 }
 409
 410 define <16 x half> @vfmsac_vf_v16f16_commute(<16 x half> %a, half %b, <16 x half> %c, <16 x i1> %m, i32 zeroext %evl) {
 411 ; CHECK-LABEL: vfmsac_vf_v16f16_commute:
 412 ; CHECK:       # %bb.0:
 413 ; CHECK-NEXT:    vsetvli zero, a0, e16, m2, tu, mu
 414 ; CHECK-NEXT:    vfmsac.vf v10, fa0, v8, v0.t
 415 ; CHECK-NEXT:    vmv2r.v v8, v10
 416 ; CHECK-NEXT:    ret
 417   %elt.head = insertelement <16 x half> poison, half %b, i32 0
 418   %vb = shufflevector <16 x half> %elt.head, <16 x half> poison, <16 x i32> zeroinitializer
 419   %negc = call <16 x half> @llvm.vp.fneg.v16f16(<16 x half> %c, <16 x i1> splat (i1 -1), i32 %evl)
 420   %v = call <16 x half> @llvm.vp.fma.v16f16(<16 x half> %vb, <16 x half> %a, <16 x half> %negc, <16 x i1> splat (i1 -1), i32 %evl)
 421   %u = call <16 x half> @llvm.vp.merge.v16f16(<16 x i1> %m, <16 x half> %v, <16 x half> %c, i32 %evl)
 422   ret <16 x half> %u
 423 }
 424
 425 define <16 x half> @vfmsac_vf_v16f16_unmasked(<16 x half> %a, half %b, <16 x half> %c, i32 zeroext %evl) {
 426 ; CHECK-LABEL: vfmsac_vf_v16f16_unmasked:
 427 ; CHECK:       # %bb.0:
 428 ; CHECK-NEXT:    vsetvli zero, a0, e16, m2, tu, ma
 429 ; CHECK-NEXT:    vfmsac.vf v10, fa0, v8
 430 ; CHECK-NEXT:    vmv2r.v v8, v10
 431 ; CHECK-NEXT:    ret
 432   %elt.head = insertelement <16 x half> poison, half %b, i32 0
 433   %vb = shufflevector <16 x half> %elt.head, <16 x half> poison, <16 x i32> zeroinitializer
 434   %negc = call <16 x half> @llvm.vp.fneg.v16f16(<16 x half> %c, <16 x i1> splat (i1 -1), i32 %evl)
 435   %v = call <16 x half> @llvm.vp.fma.v16f16(<16 x half> %a, <16 x half> %vb, <16 x half> %negc, <16 x i1> splat (i1 -1), i32 %evl)
 436   %u = call <16 x half> @llvm.vp.merge.v16f16(<16 x i1> splat (i1 -1), <16 x half> %v, <16 x half> %c, i32 %evl)
 437   ret <16 x half> %u
 438 }
 439
 440 define <16 x half> @vfmsac_vv_v16f16_ta(<16 x half> %a, <16 x half> %b, <16 x half> %c, <16 x i1> %m, i32 zeroext %evl) {
 441 ; CHECK-LABEL: vfmsac_vv_v16f16_ta:
 442 ; CHECK:       # %bb.0:
 443 ; CHECK-NEXT:    vsetvli zero, a0, e16, m2, ta, mu
 444 ; CHECK-NEXT:    vfmsac.vv v12, v8, v10, v0.t
 445 ; CHECK-NEXT:    vmv.v.v v8, v12
 446 ; CHECK-NEXT:    ret
 447   %negc = call <16 x half> @llvm.vp.fneg.v16f16(<16 x half> %c, <16 x i1> splat (i1 -1), i32 %evl)
 448   %v = call <16 x half> @llvm.vp.fma.v16f16(<16 x half> %a, <16 x half> %b, <16 x half> %negc, <16 x i1> splat (i1 -1), i32 %evl)
 449   %u = call <16 x half> @llvm.vp.select.v16f16(<16 x i1> %m, <16 x half> %v, <16 x half> %c, i32 %evl)
 450   ret <16 x half> %u
 451 }
 452
 453 define <16 x half> @vfmsac_vf_v16f16_ta(<16 x half> %a, half %b, <16 x half> %c, <16 x i1> %m, i32 zeroext %evl) {
 454 ; CHECK-LABEL: vfmsac_vf_v16f16_ta:
 455 ; CHECK:       # %bb.0:
 456 ; CHECK-NEXT:    vsetvli zero, a0, e16, m2, ta, mu
 457 ; CHECK-NEXT:    vfmsac.vf v10, fa0, v8, v0.t
 458 ; CHECK-NEXT:    vmv.v.v v8, v10
 459 ; CHECK-NEXT:    ret
 460   %elt.head = insertelement <16 x half> poison, half %b, i32 0
 461   %vb = shufflevector <16 x half> %elt.head, <16 x half> poison, <16 x i32> zeroinitializer
 462   %negc = call <16 x half> @llvm.vp.fneg.v16f16(<16 x half> %c, <16 x i1> splat (i1 -1), i32 %evl)
 463   %v = call <16 x half> @llvm.vp.fma.v16f16(<16 x half> %a, <16 x half> %vb, <16 x half> %negc, <16 x i1> splat (i1 -1), i32 %evl)
 464   %u = call <16 x half> @llvm.vp.select.v16f16(<16 x i1> %m, <16 x half> %v, <16 x half> %c, i32 %evl)
 465   ret <16 x half> %u
 466 }
 467
 468 define <16 x half> @vfmsac_vf_v16f16_commute_ta(<16 x half> %a, half %b, <16 x half> %c, <16 x i1> %m, i32 zeroext %evl) {
 469 ; CHECK-LABEL: vfmsac_vf_v16f16_commute_ta:
 470 ; CHECK:       # %bb.0:
 471 ; CHECK-NEXT:    vsetvli zero, a0, e16, m2, ta, mu
 472 ; CHECK-NEXT:    vfmsac.vf v10, fa0, v8, v0.t
 473 ; CHECK-NEXT:    vmv.v.v v8, v10
 474 ; CHECK-NEXT:    ret
 475   %elt.head = insertelement <16 x half> poison, half %b, i32 0
 476   %vb = shufflevector <16 x half> %elt.head, <16 x half> poison, <16 x i32> zeroinitializer
 477   %negc = call <16 x half> @llvm.vp.fneg.v16f16(<16 x half> %c, <16 x i1> splat (i1 -1), i32 %evl)
 478   %v = call <16 x half> @llvm.vp.fma.v16f16(<16 x half> %vb, <16 x half> %a, <16 x half> %negc, <16 x i1> splat (i1 -1), i32 %evl)
 479   %u = call <16 x half> @llvm.vp.select.v16f16(<16 x i1> %m, <16 x half> %v, <16 x half> %c, i32 %evl)
 480   ret <16 x half> %u
 481 }
 482
 483 declare <32 x half> @llvm.vp.fma.v32f16(<32 x half>, <32 x half>, <32 x half>, <32 x i1>, i32)
 484 declare <32 x half> @llvm.vp.fneg.v32f16(<32 x half>, <32 x i1>, i32)
 485 declare <32 x half> @llvm.vp.merge.v32f16(<32 x i1>, <32 x half>, <32 x half>, i32)
 486 declare <32 x half> @llvm.vp.select.v32f16(<32 x i1>, <32 x half>, <32 x half>, i32)
 487
 488 define <32 x half> @vfmsac_vv_v32f16(<32 x half> %a, <32 x half> %b, <32 x half> %c, <32 x i1> %m, i32 zeroext %evl) {
 489 ; CHECK-LABEL: vfmsac_vv_v32f16:
 490 ; CHECK:       # %bb.0:
 491 ; CHECK-NEXT:    vsetvli zero, a0, e16, m4, tu, mu
 492 ; CHECK-NEXT:    vfmsac.vv v16, v8, v12, v0.t
 493 ; CHECK-NEXT:    vmv4r.v v8, v16
 494 ; CHECK-NEXT:    ret
 495   %negc = call <32 x half> @llvm.vp.fneg.v32f16(<32 x half> %c, <32 x i1> splat (i1 -1), i32 %evl)
 496   %v = call <32 x half> @llvm.vp.fma.v32f16(<32 x half> %a, <32 x half> %b, <32 x half> %negc, <32 x i1> splat (i1 -1), i32 %evl)
 497   %u = call <32 x half> @llvm.vp.merge.v32f16(<32 x i1> %m, <32 x half> %v, <32 x half> %c, i32 %evl)
 498   ret <32 x half> %u
 499 }
 500
 501 define <32 x half> @vfmsac_vv_v32f16_unmasked(<32 x half> %a, <32 x half> %b, <32 x half> %c, <32 x i1> %m, i32 zeroext %evl) {
 502 ; CHECK-LABEL: vfmsac_vv_v32f16_unmasked:
 503 ; CHECK:       # %bb.0:
 504 ; CHECK-NEXT:    vsetvli zero, a0, e16, m4, tu, ma
 505 ; CHECK-NEXT:    vfmsac.vv v16, v8, v12
 506 ; CHECK-NEXT:    vmv4r.v v8, v16
 507 ; CHECK-NEXT:    ret
 508   %negc = call <32 x half> @llvm.vp.fneg.v32f16(<32 x half> %c, <32 x i1> splat (i1 -1), i32 %evl)
 509   %v = call <32 x half> @llvm.vp.fma.v32f16(<32 x half> %a, <32 x half> %b, <32 x half> %negc, <32 x i1> splat (i1 -1), i32 %evl)
 510   %u = call <32 x half> @llvm.vp.merge.v32f16(<32 x i1> splat (i1 -1), <32 x half> %v, <32 x half> %c, i32 %evl)
 511   ret <32 x half> %u
 512 }
 513
 514 define <32 x half> @vfmsac_vf_v32f16(<32 x half> %a, half %b, <32 x half> %c, <32 x i1> %m, i32 zeroext %evl) {
 515 ; CHECK-LABEL: vfmsac_vf_v32f16:
 516 ; CHECK:       # %bb.0:
 517 ; CHECK-NEXT:    vsetvli zero, a0, e16, m4, tu, mu
 518 ; CHECK-NEXT:    vfmsac.vf v12, fa0, v8, v0.t
 519 ; CHECK-NEXT:    vmv4r.v v8, v12
 520 ; CHECK-NEXT:    ret
 521   %elt.head = insertelement <32 x half> poison, half %b, i32 0
 522   %vb = shufflevector <32 x half> %elt.head, <32 x half> poison, <32 x i32> zeroinitializer
 523   %negc = call <32 x half> @llvm.vp.fneg.v32f16(<32 x half> %c, <32 x i1> splat (i1 -1), i32 %evl)
 524   %v = call <32 x half> @llvm.vp.fma.v32f16(<32 x half> %a, <32 x half> %vb, <32 x half> %negc, <32 x i1> splat (i1 -1), i32 %evl)
 525   %u = call <32 x half> @llvm.vp.merge.v32f16(<32 x i1> %m, <32 x half> %v, <32 x half> %c, i32 %evl)
 526   ret <32 x half> %u
 527 }
 528
 529 define <32 x half> @vfmsac_vf_v32f16_commute(<32 x half> %a, half %b, <32 x half> %c, <32 x i1> %m, i32 zeroext %evl) {
 530 ; CHECK-LABEL: vfmsac_vf_v32f16_commute:
 531 ; CHECK:       # %bb.0:
 532 ; CHECK-NEXT:    vsetvli zero, a0, e16, m4, tu, mu
 533 ; CHECK-NEXT:    vfmsac.vf v12, fa0, v8, v0.t
 534 ; CHECK-NEXT:    vmv4r.v v8, v12
 535 ; CHECK-NEXT:    ret
 536   %elt.head = insertelement <32 x half> poison, half %b, i32 0
 537   %vb = shufflevector <32 x half> %elt.head, <32 x half> poison, <32 x i32> zeroinitializer
 538   %negc = call <32 x half> @llvm.vp.fneg.v32f16(<32 x half> %c, <32 x i1> splat (i1 -1), i32 %evl)
 539   %v = call <32 x half> @llvm.vp.fma.v32f16(<32 x half> %vb, <32 x half> %a, <32 x half> %negc, <32 x i1> splat (i1 -1), i32 %evl)
 540   %u = call <32 x half> @llvm.vp.merge.v32f16(<32 x i1> %m, <32 x half> %v, <32 x half> %c, i32 %evl)
 541   ret <32 x half> %u
 542 }
 543
 544 define <32 x half> @vfmsac_vf_v32f16_unmasked(<32 x half> %a, half %b, <32 x half> %c, i32 zeroext %evl) {
 545 ; CHECK-LABEL: vfmsac_vf_v32f16_unmasked:
 546 ; CHECK:       # %bb.0:
 547 ; CHECK-NEXT:    vsetvli zero, a0, e16, m4, tu, ma
 548 ; CHECK-NEXT:    vfmsac.vf v12, fa0, v8
 549 ; CHECK-NEXT:    vmv4r.v v8, v12
 550 ; CHECK-NEXT:    ret
 551   %elt.head = insertelement <32 x half> poison, half %b, i32 0
 552   %vb = shufflevector <32 x half> %elt.head, <32 x half> poison, <32 x i32> zeroinitializer
 553   %negc = call <32 x half> @llvm.vp.fneg.v32f16(<32 x half> %c, <32 x i1> splat (i1 -1), i32 %evl)
 554   %v = call <32 x half> @llvm.vp.fma.v32f16(<32 x half> %a, <32 x half> %vb, <32 x half> %negc, <32 x i1> splat (i1 -1), i32 %evl)
 555   %u = call <32 x half> @llvm.vp.merge.v32f16(<32 x i1> splat (i1 -1), <32 x half> %v, <32 x half> %c, i32 %evl)
 556   ret <32 x half> %u
 557 }
 558
 559 define <32 x half> @vfmsac_vv_v32f16_ta(<32 x half> %a, <32 x half> %b, <32 x half> %c, <32 x i1> %m, i32 zeroext %evl) {
 560 ; CHECK-LABEL: vfmsac_vv_v32f16_ta:
 561 ; CHECK:       # %bb.0:
 562 ; CHECK-NEXT:    vsetvli zero, a0, e16, m4, ta, mu
 563 ; CHECK-NEXT:    vfmsac.vv v16, v8, v12, v0.t
 564 ; CHECK-NEXT:    vmv.v.v v8, v16
 565 ; CHECK-NEXT:    ret
 566   %negc = call <32 x half> @llvm.vp.fneg.v32f16(<32 x half> %c, <32 x i1> splat (i1 -1), i32 %evl)
 567   %v = call <32 x half> @llvm.vp.fma.v32f16(<32 x half> %a, <32 x half> %b, <32 x half> %negc, <32 x i1> splat (i1 -1), i32 %evl)
 568   %u = call <32 x half> @llvm.vp.select.v32f16(<32 x i1> %m, <32 x half> %v, <32 x half> %c, i32 %evl)
 569   ret <32 x half> %u
 570 }
 571
 572 define <32 x half> @vfmsac_vf_v32f16_ta(<32 x half> %a, half %b, <32 x half> %c, <32 x i1> %m, i32 zeroext %evl) {
 573 ; CHECK-LABEL: vfmsac_vf_v32f16_ta:
 574 ; CHECK:       # %bb.0:
 575 ; CHECK-NEXT:    vsetvli zero, a0, e16, m4, ta, mu
 576 ; CHECK-NEXT:    vfmsac.vf v12, fa0, v8, v0.t
 577 ; CHECK-NEXT:    vmv.v.v v8, v12
 578 ; CHECK-NEXT:    ret
 579   %elt.head = insertelement <32 x half> poison, half %b, i32 0
 580   %vb = shufflevector <32 x half> %elt.head, <32 x half> poison, <32 x i32> zeroinitializer
 581   %negc = call <32 x half> @llvm.vp.fneg.v32f16(<32 x half> %c, <32 x i1> splat (i1 -1), i32 %evl)
 582   %v = call <32 x half> @llvm.vp.fma.v32f16(<32 x half> %a, <32 x half> %vb, <32 x half> %negc, <32 x i1> splat (i1 -1), i32 %evl)
 583   %u = call <32 x half> @llvm.vp.select.v32f16(<32 x i1> %m, <32 x half> %v, <32 x half> %c, i32 %evl)
 584   ret <32 x half> %u
 585 }
 586
 587 define <32 x half> @vfmsac_vf_v32f16_commute_ta(<32 x half> %a, half %b, <32 x half> %c, <32 x i1> %m, i32 zeroext %evl) {
 588 ; CHECK-LABEL: vfmsac_vf_v32f16_commute_ta:
 589 ; CHECK:       # %bb.0:
 590 ; CHECK-NEXT:    vsetvli zero, a0, e16, m4, ta, mu
 591 ; CHECK-NEXT:    vfmsac.vf v12, fa0, v8, v0.t
 592 ; CHECK-NEXT:    vmv.v.v v8, v12
 593 ; CHECK-NEXT:    ret
 594   %elt.head = insertelement <32 x half> poison, half %b, i32 0
 595   %vb = shufflevector <32 x half> %elt.head, <32 x half> poison, <32 x i32> zeroinitializer
 596   %negc = call <32 x half> @llvm.vp.fneg.v32f16(<32 x half> %c, <32 x i1> splat (i1 -1), i32 %evl)
 597   %v = call <32 x half> @llvm.vp.fma.v32f16(<32 x half> %vb, <32 x half> %a, <32 x half> %negc, <32 x i1> splat (i1 -1), i32 %evl)
 598   %u = call <32 x half> @llvm.vp.select.v32f16(<32 x i1> %m, <32 x half> %v, <32 x half> %c, i32 %evl)
 599   ret <32 x half> %u
 600 }
 601
 602 declare <2 x float> @llvm.vp.fma.v2f32(<2 x float>, <2 x float>, <2 x float>, <2 x i1>, i32)
 603 declare <2 x float> @llvm.vp.fneg.v2f32(<2 x float>, <2 x i1>, i32)
 604 declare <2 x float> @llvm.vp.merge.v2f32(<2 x i1>, <2 x float>, <2 x float>, i32)
 605 declare <2 x float> @llvm.vp.select.v2f32(<2 x i1>, <2 x float>, <2 x float>, i32)
 606
 607 define <2 x float> @vfmsac_vv_v2f32(<2 x float> %a, <2 x float> %b, <2 x float> %c, <2 x i1> %m, i32 zeroext %evl) {
 608 ; CHECK-LABEL: vfmsac_vv_v2f32:
 609 ; CHECK:       # %bb.0:
 610 ; CHECK-NEXT:    vsetvli zero, a0, e32, mf2, tu, mu
 611 ; CHECK-NEXT:    vfmsac.vv v10, v8, v9, v0.t
 612 ; CHECK-NEXT:    vmv1r.v v8, v10
 613 ; CHECK-NEXT:    ret
 614   %negc = call <2 x float> @llvm.vp.fneg.v2f32(<2 x float> %c, <2 x i1> splat (i1 -1), i32 %evl)
 615   %v = call <2 x float> @llvm.vp.fma.v2f32(<2 x float> %a, <2 x float> %b, <2 x float> %negc, <2 x i1> splat (i1 -1), i32 %evl)
 616   %u = call <2 x float> @llvm.vp.merge.v2f32(<2 x i1> %m, <2 x float> %v, <2 x float> %c, i32 %evl)
 617   ret <2 x float> %u
 618 }
 619
 620 define <2 x float> @vfmsac_vv_v2f32_unmasked(<2 x float> %a, <2 x float> %b, <2 x float> %c, <2 x i1> %m, i32 zeroext %evl) {
 621 ; CHECK-LABEL: vfmsac_vv_v2f32_unmasked:
 622 ; CHECK:       # %bb.0:
 623 ; CHECK-NEXT:    vsetvli zero, a0, e32, mf2, tu, ma
 624 ; CHECK-NEXT:    vfmsac.vv v10, v8, v9
 625 ; CHECK-NEXT:    vmv1r.v v8, v10
 626 ; CHECK-NEXT:    ret
 627   %negc = call <2 x float> @llvm.vp.fneg.v2f32(<2 x float> %c, <2 x i1> splat (i1 -1), i32 %evl)
 628   %v = call <2 x float> @llvm.vp.fma.v2f32(<2 x float> %a, <2 x float> %b, <2 x float> %negc, <2 x i1> splat (i1 -1), i32 %evl)
 629   %u = call <2 x float> @llvm.vp.merge.v2f32(<2 x i1> splat (i1 -1), <2 x float> %v, <2 x float> %c, i32 %evl)
 630   ret <2 x float> %u
 631 }
 632
 633 define <2 x float> @vfmsac_vf_v2f32(<2 x float> %a, float %b, <2 x float> %c, <2 x i1> %m, i32 zeroext %evl) {
 634 ; CHECK-LABEL: vfmsac_vf_v2f32:
 635 ; CHECK:       # %bb.0:
 636 ; CHECK-NEXT:    vsetvli zero, a0, e32, mf2, tu, mu
 637 ; CHECK-NEXT:    vfmsac.vf v9, fa0, v8, v0.t
 638 ; CHECK-NEXT:    vmv1r.v v8, v9
 639 ; CHECK-NEXT:    ret
 640   %elt.head = insertelement <2 x float> poison, float %b, i32 0
 641   %vb = shufflevector <2 x float> %elt.head, <2 x float> poison, <2 x i32> zeroinitializer
 642   %negc = call <2 x float> @llvm.vp.fneg.v2f32(<2 x float> %c, <2 x i1> splat (i1 -1), i32 %evl)
 643   %v = call <2 x float> @llvm.vp.fma.v2f32(<2 x float> %a, <2 x float> %vb, <2 x float> %negc, <2 x i1> splat (i1 -1), i32 %evl)
 644   %u = call <2 x float> @llvm.vp.merge.v2f32(<2 x i1> %m, <2 x float> %v, <2 x float> %c, i32 %evl)
 645   ret <2 x float> %u
 646 }
 647
 648 define <2 x float> @vfmsac_vf_v2f32_commute(<2 x float> %a, float %b, <2 x float> %c, <2 x i1> %m, i32 zeroext %evl) {
 649 ; CHECK-LABEL: vfmsac_vf_v2f32_commute:
 650 ; CHECK:       # %bb.0:
 651 ; CHECK-NEXT:    vsetvli zero, a0, e32, mf2, tu, mu
 652 ; CHECK-NEXT:    vfmsac.vf v9, fa0, v8, v0.t
 653 ; CHECK-NEXT:    vmv1r.v v8, v9
 654 ; CHECK-NEXT:    ret
 655   %elt.head = insertelement <2 x float> poison, float %b, i32 0
 656   %vb = shufflevector <2 x float> %elt.head, <2 x float> poison, <2 x i32> zeroinitializer
 657   %negc = call <2 x float> @llvm.vp.fneg.v2f32(<2 x float> %c, <2 x i1> splat (i1 -1), i32 %evl)
 658   %v = call <2 x float> @llvm.vp.fma.v2f32(<2 x float> %vb, <2 x float> %a, <2 x float> %negc, <2 x i1> splat (i1 -1), i32 %evl)
 659   %u = call <2 x float> @llvm.vp.merge.v2f32(<2 x i1> %m, <2 x float> %v, <2 x float> %c, i32 %evl)
 660   ret <2 x float> %u
 661 }
 662
 663 define <2 x float> @vfmsac_vf_v2f32_unmasked(<2 x float> %a, float %b, <2 x float> %c, i32 zeroext %evl) {
 664 ; CHECK-LABEL: vfmsac_vf_v2f32_unmasked:
 665 ; CHECK:       # %bb.0:
 666 ; CHECK-NEXT:    vsetvli zero, a0, e32, mf2, tu, ma
 667 ; CHECK-NEXT:    vfmsac.vf v9, fa0, v8
 668 ; CHECK-NEXT:    vmv1r.v v8, v9
 669 ; CHECK-NEXT:    ret
 670   %elt.head = insertelement <2 x float> poison, float %b, i32 0
 671   %vb = shufflevector <2 x float> %elt.head, <2 x float> poison, <2 x i32> zeroinitializer
 672   %negc = call <2 x float> @llvm.vp.fneg.v2f32(<2 x float> %c, <2 x i1> splat (i1 -1), i32 %evl)
 673   %v = call <2 x float> @llvm.vp.fma.v2f32(<2 x float> %a, <2 x float> %vb, <2 x float> %negc, <2 x i1> splat (i1 -1), i32 %evl)
 674   %u = call <2 x float> @llvm.vp.merge.v2f32(<2 x i1> splat (i1 -1), <2 x float> %v, <2 x float> %c, i32 %evl)
 675   ret <2 x float> %u
 676 }
 677
 678 define <2 x float> @vfmsac_vv_v2f32_ta(<2 x float> %a, <2 x float> %b, <2 x float> %c, <2 x i1> %m, i32 zeroext %evl) {
 679 ; CHECK-LABEL: vfmsac_vv_v2f32_ta:
 680 ; CHECK:       # %bb.0:
 681 ; CHECK-NEXT:    vsetvli zero, a0, e32, mf2, ta, mu
 682 ; CHECK-NEXT:    vfmsac.vv v10, v8, v9, v0.t
 683 ; CHECK-NEXT:    vmv1r.v v8, v10
 684 ; CHECK-NEXT:    ret
 685   %negc = call <2 x float> @llvm.vp.fneg.v2f32(<2 x float> %c, <2 x i1> splat (i1 -1), i32 %evl)
 686   %v = call <2 x float> @llvm.vp.fma.v2f32(<2 x float> %a, <2 x float> %b, <2 x float> %negc, <2 x i1> splat (i1 -1), i32 %evl)
 687   %u = call <2 x float> @llvm.vp.select.v2f32(<2 x i1> %m, <2 x float> %v, <2 x float> %c, i32 %evl)
 688   ret <2 x float> %u
 689 }
 690
 691 define <2 x float> @vfmsac_vf_v2f32_ta(<2 x float> %a, float %b, <2 x float> %c, <2 x i1> %m, i32 zeroext %evl) {
 692 ; CHECK-LABEL: vfmsac_vf_v2f32_ta:
 693 ; CHECK:       # %bb.0:
 694 ; CHECK-NEXT:    vsetvli zero, a0, e32, mf2, ta, mu
 695 ; CHECK-NEXT:    vfmsac.vf v9, fa0, v8, v0.t
 696 ; CHECK-NEXT:    vmv1r.v v8, v9
 697 ; CHECK-NEXT:    ret
 698   %elt.head = insertelement <2 x float> poison, float %b, i32 0
 699   %vb = shufflevector <2 x float> %elt.head, <2 x float> poison, <2 x i32> zeroinitializer
 700   %negc = call <2 x float> @llvm.vp.fneg.v2f32(<2 x float> %c, <2 x i1> splat (i1 -1), i32 %evl)
 701   %v = call <2 x float> @llvm.vp.fma.v2f32(<2 x float> %a, <2 x float> %vb, <2 x float> %negc, <2 x i1> splat (i1 -1), i32 %evl)
 702   %u = call <2 x float> @llvm.vp.select.v2f32(<2 x i1> %m, <2 x float> %v, <2 x float> %c, i32 %evl)
 703   ret <2 x float> %u
 704 }
 705
 706 define <2 x float> @vfmsac_vf_v2f32_commute_ta(<2 x float> %a, float %b, <2 x float> %c, <2 x i1> %m, i32 zeroext %evl) {
 707 ; CHECK-LABEL: vfmsac_vf_v2f32_commute_ta:
 708 ; CHECK:       # %bb.0:
 709 ; CHECK-NEXT:    vsetvli zero, a0, e32, mf2, ta, mu
 710 ; CHECK-NEXT:    vfmsac.vf v9, fa0, v8, v0.t
 711 ; CHECK-NEXT:    vmv1r.v v8, v9
 712 ; CHECK-NEXT:    ret
 713   %elt.head = insertelement <2 x float> poison, float %b, i32 0
 714   %vb = shufflevector <2 x float> %elt.head, <2 x float> poison, <2 x i32> zeroinitializer
 715   %negc = call <2 x float> @llvm.vp.fneg.v2f32(<2 x float> %c, <2 x i1> splat (i1 -1), i32 %evl)
 716   %v = call <2 x float> @llvm.vp.fma.v2f32(<2 x float> %vb, <2 x float> %a, <2 x float> %negc, <2 x i1> splat (i1 -1), i32 %evl)
 717   %u = call <2 x float> @llvm.vp.select.v2f32(<2 x i1> %m, <2 x float> %v, <2 x float> %c, i32 %evl)
 718   ret <2 x float> %u
 719 }
 720
 721 declare <4 x float> @llvm.vp.fma.v4f32(<4 x float>, <4 x float>, <4 x float>, <4 x i1>, i32)
 722 declare <4 x float> @llvm.vp.fneg.v4f32(<4 x float>, <4 x i1>, i32)
 723 declare <4 x float> @llvm.vp.merge.v4f32(<4 x i1>, <4 x float>, <4 x float>, i32)
 724 declare <4 x float> @llvm.vp.select.v4f32(<4 x i1>, <4 x float>, <4 x float>, i32)
 725
 726 define <4 x float> @vfmsac_vv_v4f32(<4 x float> %a, <4 x float> %b, <4 x float> %c, <4 x i1> %m, i32 zeroext %evl) {
 727 ; CHECK-LABEL: vfmsac_vv_v4f32:
 728 ; CHECK:       # %bb.0:
 729 ; CHECK-NEXT:    vsetvli zero, a0, e32, m1, tu, mu
 730 ; CHECK-NEXT:    vfmsac.vv v10, v8, v9, v0.t
 731 ; CHECK-NEXT:    vmv1r.v v8, v10
 732 ; CHECK-NEXT:    ret
 733   %negc = call <4 x float> @llvm.vp.fneg.v4f32(<4 x float> %c, <4 x i1> splat (i1 -1), i32 %evl)
 734   %v = call <4 x float> @llvm.vp.fma.v4f32(<4 x float> %a, <4 x float> %b, <4 x float> %negc, <4 x i1> splat (i1 -1), i32 %evl)
 735   %u = call <4 x float> @llvm.vp.merge.v4f32(<4 x i1> %m, <4 x float> %v, <4 x float> %c, i32 %evl)
 736   ret <4 x float> %u
 737 }
 738
 739 define <4 x float> @vfmsac_vv_v4f32_unmasked(<4 x float> %a, <4 x float> %b, <4 x float> %c, <4 x i1> %m, i32 zeroext %evl) {
 740 ; CHECK-LABEL: vfmsac_vv_v4f32_unmasked:
 741 ; CHECK:       # %bb.0:
 742 ; CHECK-NEXT:    vsetvli zero, a0, e32, m1, tu, ma
 743 ; CHECK-NEXT:    vfmsac.vv v10, v8, v9
 744 ; CHECK-NEXT:    vmv1r.v v8, v10
 745 ; CHECK-NEXT:    ret
 746   %negc = call <4 x float> @llvm.vp.fneg.v4f32(<4 x float> %c, <4 x i1> splat (i1 -1), i32 %evl)
 747   %v = call <4 x float> @llvm.vp.fma.v4f32(<4 x float> %a, <4 x float> %b, <4 x float> %negc, <4 x i1> splat (i1 -1), i32 %evl)
 748   %u = call <4 x float> @llvm.vp.merge.v4f32(<4 x i1> splat (i1 -1), <4 x float> %v, <4 x float> %c, i32 %evl)
 749   ret <4 x float> %u
 750 }
 751
 752 define <4 x float> @vfmsac_vf_v4f32(<4 x float> %a, float %b, <4 x float> %c, <4 x i1> %m, i32 zeroext %evl) {
 753 ; CHECK-LABEL: vfmsac_vf_v4f32:
 754 ; CHECK:       # %bb.0:
 755 ; CHECK-NEXT:    vsetvli zero, a0, e32, m1, tu, mu
 756 ; CHECK-NEXT:    vfmsac.vf v9, fa0, v8, v0.t
 757 ; CHECK-NEXT:    vmv1r.v v8, v9
 758 ; CHECK-NEXT:    ret
 759   %elt.head = insertelement <4 x float> poison, float %b, i32 0
 760   %vb = shufflevector <4 x float> %elt.head, <4 x float> poison, <4 x i32> zeroinitializer
 761   %negc = call <4 x float> @llvm.vp.fneg.v4f32(<4 x float> %c, <4 x i1> splat (i1 -1), i32 %evl)
 762   %v = call <4 x float> @llvm.vp.fma.v4f32(<4 x float> %a, <4 x float> %vb, <4 x float> %negc, <4 x i1> splat (i1 -1), i32 %evl)
 763   %u = call <4 x float> @llvm.vp.merge.v4f32(<4 x i1> %m, <4 x float> %v, <4 x float> %c, i32 %evl)
 764   ret <4 x float> %u
 765 }
 766
 767 define <4 x float> @vfmsac_vf_v4f32_commute(<4 x float> %a, float %b, <4 x float> %c, <4 x i1> %m, i32 zeroext %evl) {
 768 ; CHECK-LABEL: vfmsac_vf_v4f32_commute:
 769 ; CHECK:       # %bb.0:
 770 ; CHECK-NEXT:    vsetvli zero, a0, e32, m1, tu, mu
 771 ; CHECK-NEXT:    vfmsac.vf v9, fa0, v8, v0.t
 772 ; CHECK-NEXT:    vmv1r.v v8, v9
 773 ; CHECK-NEXT:    ret
 774   %elt.head = insertelement <4 x float> poison, float %b, i32 0
 775   %vb = shufflevector <4 x float> %elt.head, <4 x float> poison, <4 x i32> zeroinitializer
 776   %negc = call <4 x float> @llvm.vp.fneg.v4f32(<4 x float> %c, <4 x i1> splat (i1 -1), i32 %evl)
 777   %v = call <4 x float> @llvm.vp.fma.v4f32(<4 x float> %vb, <4 x float> %a, <4 x float> %negc, <4 x i1> splat (i1 -1), i32 %evl)
 778   %u = call <4 x float> @llvm.vp.merge.v4f32(<4 x i1> %m, <4 x float> %v, <4 x float> %c, i32 %evl)
 779   ret <4 x float> %u
 780 }
 781
 782 define <4 x float> @vfmsac_vf_v4f32_unmasked(<4 x float> %a, float %b, <4 x float> %c, i32 zeroext %evl) {
 783 ; CHECK-LABEL: vfmsac_vf_v4f32_unmasked:
 784 ; CHECK:       # %bb.0:
 785 ; CHECK-NEXT:    vsetvli zero, a0, e32, m1, tu, ma
 786 ; CHECK-NEXT:    vfmsac.vf v9, fa0, v8
 787 ; CHECK-NEXT:    vmv1r.v v8, v9
 788 ; CHECK-NEXT:    ret
 789   %elt.head = insertelement <4 x float> poison, float %b, i32 0
 790   %vb = shufflevector <4 x float> %elt.head, <4 x float> poison, <4 x i32> zeroinitializer
 791   %negc = call <4 x float> @llvm.vp.fneg.v4f32(<4 x float> %c, <4 x i1> splat (i1 -1), i32 %evl)
 792   %v = call <4 x float> @llvm.vp.fma.v4f32(<4 x float> %a, <4 x float> %vb, <4 x float> %negc, <4 x i1> splat (i1 -1), i32 %evl)
 793   %u = call <4 x float> @llvm.vp.merge.v4f32(<4 x i1> splat (i1 -1), <4 x float> %v, <4 x float> %c, i32 %evl)
 794   ret <4 x float> %u
 795 }
 796
 797 define <4 x float> @vfmsac_vv_v4f32_ta(<4 x float> %a, <4 x float> %b, <4 x float> %c, <4 x i1> %m, i32 zeroext %evl) {
 798 ; CHECK-LABEL: vfmsac_vv_v4f32_ta:
 799 ; CHECK:       # %bb.0:
 800 ; CHECK-NEXT:    vsetvli zero, a0, e32, m1, ta, mu
 801 ; CHECK-NEXT:    vfmsac.vv v10, v8, v9, v0.t
 802 ; CHECK-NEXT:    vmv.v.v v8, v10
 803 ; CHECK-NEXT:    ret
 804   %negc = call <4 x float> @llvm.vp.fneg.v4f32(<4 x float> %c, <4 x i1> splat (i1 -1), i32 %evl)
 805   %v = call <4 x float> @llvm.vp.fma.v4f32(<4 x float> %a, <4 x float> %b, <4 x float> %negc, <4 x i1> splat (i1 -1), i32 %evl)
 806   %u = call <4 x float> @llvm.vp.select.v4f32(<4 x i1> %m, <4 x float> %v, <4 x float> %c, i32 %evl)
 807   ret <4 x float> %u
 808 }
 809
 810 define <4 x float> @vfmsac_vf_v4f32_ta(<4 x float> %a, float %b, <4 x float> %c, <4 x i1> %m, i32 zeroext %evl) {
 811 ; CHECK-LABEL: vfmsac_vf_v4f32_ta:
 812 ; CHECK:       # %bb.0:
 813 ; CHECK-NEXT:    vsetvli zero, a0, e32, m1, ta, mu
 814 ; CHECK-NEXT:    vfmsac.vf v9, fa0, v8, v0.t
 815 ; CHECK-NEXT:    vmv.v.v v8, v9
 816 ; CHECK-NEXT:    ret
 817   %elt.head = insertelement <4 x float> poison, float %b, i32 0
 818   %vb = shufflevector <4 x float> %elt.head, <4 x float> poison, <4 x i32> zeroinitializer
 819   %negc = call <4 x float> @llvm.vp.fneg.v4f32(<4 x float> %c, <4 x i1> splat (i1 -1), i32 %evl)
 820   %v = call <4 x float> @llvm.vp.fma.v4f32(<4 x float> %a, <4 x float> %vb, <4 x float> %negc, <4 x i1> splat (i1 -1), i32 %evl)
 821   %u = call <4 x float> @llvm.vp.select.v4f32(<4 x i1> %m, <4 x float> %v, <4 x float> %c, i32 %evl)
 822   ret <4 x float> %u
 823 }
 824
 825 define <4 x float> @vfmsac_vf_v4f32_commute_ta(<4 x float> %a, float %b, <4 x float> %c, <4 x i1> %m, i32 zeroext %evl) {
 826 ; CHECK-LABEL: vfmsac_vf_v4f32_commute_ta:
 827 ; CHECK:       # %bb.0:
 828 ; CHECK-NEXT:    vsetvli zero, a0, e32, m1, ta, mu
 829 ; CHECK-NEXT:    vfmsac.vf v9, fa0, v8, v0.t
 830 ; CHECK-NEXT:    vmv.v.v v8, v9
 831 ; CHECK-NEXT:    ret
 832   %elt.head = insertelement <4 x float> poison, float %b, i32 0
 833   %vb = shufflevector <4 x float> %elt.head, <4 x float> poison, <4 x i32> zeroinitializer
 834   %negc = call <4 x float> @llvm.vp.fneg.v4f32(<4 x float> %c, <4 x i1> splat (i1 -1), i32 %evl)
 835   %v = call <4 x float> @llvm.vp.fma.v4f32(<4 x float> %vb, <4 x float> %a, <4 x float> %negc, <4 x i1> splat (i1 -1), i32 %evl)
 836   %u = call <4 x float> @llvm.vp.select.v4f32(<4 x i1> %m, <4 x float> %v, <4 x float> %c, i32 %evl)
 837   ret <4 x float> %u
 838 }
 839
 840 declare <8 x float> @llvm.vp.fma.v8f32(<8 x float>, <8 x float>, <8 x float>, <8 x i1>, i32)
 841 declare <8 x float> @llvm.vp.fneg.v8f32(<8 x float>, <8 x i1>, i32)
 842 declare <8 x float> @llvm.vp.merge.v8f32(<8 x i1>, <8 x float>, <8 x float>, i32)
 843 declare <8 x float> @llvm.vp.select.v8f32(<8 x i1>, <8 x float>, <8 x float>, i32)
 844
 845 define <8 x float> @vfmsac_vv_v8f32(<8 x float> %a, <8 x float> %b, <8 x float> %c, <8 x i1> %m, i32 zeroext %evl) {
 846 ; CHECK-LABEL: vfmsac_vv_v8f32:
 847 ; CHECK:       # %bb.0:
 848 ; CHECK-NEXT:    vsetvli zero, a0, e32, m2, tu, mu
 849 ; CHECK-NEXT:    vfmsac.vv v12, v8, v10, v0.t
 850 ; CHECK-NEXT:    vmv2r.v v8, v12
 851 ; CHECK-NEXT:    ret
 852   %negc = call <8 x float> @llvm.vp.fneg.v8f32(<8 x float> %c, <8 x i1> splat (i1 -1), i32 %evl)
 853   %v = call <8 x float> @llvm.vp.fma.v8f32(<8 x float> %a, <8 x float> %b, <8 x float> %negc, <8 x i1> splat (i1 -1), i32 %evl)
 854   %u = call <8 x float> @llvm.vp.merge.v8f32(<8 x i1> %m, <8 x float> %v, <8 x float> %c, i32 %evl)
 855   ret <8 x float> %u
 856 }
 857
 858 define <8 x float> @vfmsac_vv_v8f32_unmasked(<8 x float> %a, <8 x float> %b, <8 x float> %c, <8 x i1> %m, i32 zeroext %evl) {
 859 ; CHECK-LABEL: vfmsac_vv_v8f32_unmasked:
 860 ; CHECK:       # %bb.0:
 861 ; CHECK-NEXT:    vsetvli zero, a0, e32, m2, tu, ma
 862 ; CHECK-NEXT:    vfmsac.vv v12, v8, v10
 863 ; CHECK-NEXT:    vmv2r.v v8, v12
 864 ; CHECK-NEXT:    ret
 865   %negc = call <8 x float> @llvm.vp.fneg.v8f32(<8 x float> %c, <8 x i1> splat (i1 -1), i32 %evl)
 866   %v = call <8 x float> @llvm.vp.fma.v8f32(<8 x float> %a, <8 x float> %b, <8 x float> %negc, <8 x i1> splat (i1 -1), i32 %evl)
 867   %u = call <8 x float> @llvm.vp.merge.v8f32(<8 x i1> splat (i1 -1), <8 x float> %v, <8 x float> %c, i32 %evl)
 868   ret <8 x float> %u
 869 }
 870
 871 define <8 x float> @vfmsac_vf_v8f32(<8 x float> %a, float %b, <8 x float> %c, <8 x i1> %m, i32 zeroext %evl) {
 872 ; CHECK-LABEL: vfmsac_vf_v8f32:
 873 ; CHECK:       # %bb.0:
 874 ; CHECK-NEXT:    vsetvli zero, a0, e32, m2, tu, mu
 875 ; CHECK-NEXT:    vfmsac.vf v10, fa0, v8, v0.t
 876 ; CHECK-NEXT:    vmv2r.v v8, v10
 877 ; CHECK-NEXT:    ret
 878   %elt.head = insertelement <8 x float> poison, float %b, i32 0
 879   %vb = shufflevector <8 x float> %elt.head, <8 x float> poison, <8 x i32> zeroinitializer
 880   %negc = call <8 x float> @llvm.vp.fneg.v8f32(<8 x float> %c, <8 x i1> splat (i1 -1), i32 %evl)
 881   %v = call <8 x float> @llvm.vp.fma.v8f32(<8 x float> %a, <8 x float> %vb, <8 x float> %negc, <8 x i1> splat (i1 -1), i32 %evl)
 882   %u = call <8 x float> @llvm.vp.merge.v8f32(<8 x i1> %m, <8 x float> %v, <8 x float> %c, i32 %evl)
 883   ret <8 x float> %u
 884 }
 885
 886 define <8 x float> @vfmsac_vf_v8f32_commute(<8 x float> %a, float %b, <8 x float> %c, <8 x i1> %m, i32 zeroext %evl) {
 887 ; CHECK-LABEL: vfmsac_vf_v8f32_commute:
 888 ; CHECK:       # %bb.0:
 889 ; CHECK-NEXT:    vsetvli zero, a0, e32, m2, tu, mu
 890 ; CHECK-NEXT:    vfmsac.vf v10, fa0, v8, v0.t
 891 ; CHECK-NEXT:    vmv2r.v v8, v10
 892 ; CHECK-NEXT:    ret
 893   %elt.head = insertelement <8 x float> poison, float %b, i32 0
 894   %vb = shufflevector <8 x float> %elt.head, <8 x float> poison, <8 x i32> zeroinitializer
 895   %negc = call <8 x float> @llvm.vp.fneg.v8f32(<8 x float> %c, <8 x i1> splat (i1 -1), i32 %evl)
 896   %v = call <8 x float> @llvm.vp.fma.v8f32(<8 x float> %vb, <8 x float> %a, <8 x float> %negc, <8 x i1> splat (i1 -1), i32 %evl)
 897   %u = call <8 x float> @llvm.vp.merge.v8f32(<8 x i1> %m, <8 x float> %v, <8 x float> %c, i32 %evl)
 898   ret <8 x float> %u
 899 }
 900
 901 define <8 x float> @vfmsac_vf_v8f32_unmasked(<8 x float> %a, float %b, <8 x float> %c, i32 zeroext %evl) {
 902 ; CHECK-LABEL: vfmsac_vf_v8f32_unmasked:
 903 ; CHECK:       # %bb.0:
 904 ; CHECK-NEXT:    vsetvli zero, a0, e32, m2, tu, ma
 905 ; CHECK-NEXT:    vfmsac.vf v10, fa0, v8
 906 ; CHECK-NEXT:    vmv2r.v v8, v10
 907 ; CHECK-NEXT:    ret
 908   %elt.head = insertelement <8 x float> poison, float %b, i32 0
 909   %vb = shufflevector <8 x float> %elt.head, <8 x float> poison, <8 x i32> zeroinitializer
 910   %negc = call <8 x float> @llvm.vp.fneg.v8f32(<8 x float> %c, <8 x i1> splat (i1 -1), i32 %evl)
 911   %v = call <8 x float> @llvm.vp.fma.v8f32(<8 x float> %a, <8 x float> %vb, <8 x float> %negc, <8 x i1> splat (i1 -1), i32 %evl)
 912   %u = call <8 x float> @llvm.vp.merge.v8f32(<8 x i1> splat (i1 -1), <8 x float> %v, <8 x float> %c, i32 %evl)
 913   ret <8 x float> %u
 914 }
 915
 916 define <8 x float> @vfmsac_vv_v8f32_ta(<8 x float> %a, <8 x float> %b, <8 x float> %c, <8 x i1> %m, i32 zeroext %evl) {
 917 ; CHECK-LABEL: vfmsac_vv_v8f32_ta:
 918 ; CHECK:       # %bb.0:
 919 ; CHECK-NEXT:    vsetvli zero, a0, e32, m2, ta, mu
 920 ; CHECK-NEXT:    vfmsac.vv v12, v8, v10, v0.t
 921 ; CHECK-NEXT:    vmv.v.v v8, v12
 922 ; CHECK-NEXT:    ret
 923   %negc = call <8 x float> @llvm.vp.fneg.v8f32(<8 x float> %c, <8 x i1> splat (i1 -1), i32 %evl)
 924   %v = call <8 x float> @llvm.vp.fma.v8f32(<8 x float> %a, <8 x float> %b, <8 x float> %negc, <8 x i1> splat (i1 -1), i32 %evl)
 925   %u = call <8 x float> @llvm.vp.select.v8f32(<8 x i1> %m, <8 x float> %v, <8 x float> %c, i32 %evl)
 926   ret <8 x float> %u
 927 }
 928
 929 define <8 x float> @vfmsac_vf_v8f32_ta(<8 x float> %a, float %b, <8 x float> %c, <8 x i1> %m, i32 zeroext %evl) {
 930 ; CHECK-LABEL: vfmsac_vf_v8f32_ta:
 931 ; CHECK:       # %bb.0:
 932 ; CHECK-NEXT:    vsetvli zero, a0, e32, m2, ta, mu
 933 ; CHECK-NEXT:    vfmsac.vf v10, fa0, v8, v0.t
 934 ; CHECK-NEXT:    vmv.v.v v8, v10
 935 ; CHECK-NEXT:    ret
 936   %elt.head = insertelement <8 x float> poison, float %b, i32 0
 937   %vb = shufflevector <8 x float> %elt.head, <8 x float> poison, <8 x i32> zeroinitializer
 938   %negc = call <8 x float> @llvm.vp.fneg.v8f32(<8 x float> %c, <8 x i1> splat (i1 -1), i32 %evl)
 939   %v = call <8 x float> @llvm.vp.fma.v8f32(<8 x float> %a, <8 x float> %vb, <8 x float> %negc, <8 x i1> splat (i1 -1), i32 %evl)
 940   %u = call <8 x float> @llvm.vp.select.v8f32(<8 x i1> %m, <8 x float> %v, <8 x float> %c, i32 %evl)
 941   ret <8 x float> %u
 942 }
 943
 944 define <8 x float> @vfmsac_vf_v8f32_commute_ta(<8 x float> %a, float %b, <8 x float> %c, <8 x i1> %m, i32 zeroext %evl) {
 945 ; CHECK-LABEL: vfmsac_vf_v8f32_commute_ta:
 946 ; CHECK:       # %bb.0:
 947 ; CHECK-NEXT:    vsetvli zero, a0, e32, m2, ta, mu
 948 ; CHECK-NEXT:    vfmsac.vf v10, fa0, v8, v0.t
 949 ; CHECK-NEXT:    vmv.v.v v8, v10
 950 ; CHECK-NEXT:    ret
 951   %elt.head = insertelement <8 x float> poison, float %b, i32 0
 952   %vb = shufflevector <8 x float> %elt.head, <8 x float> poison, <8 x i32> zeroinitializer
 953   %negc = call <8 x float> @llvm.vp.fneg.v8f32(<8 x float> %c, <8 x i1> splat (i1 -1), i32 %evl)
 954   %v = call <8 x float> @llvm.vp.fma.v8f32(<8 x float> %vb, <8 x float> %a, <8 x float> %negc, <8 x i1> splat (i1 -1), i32 %evl)
 955   %u = call <8 x float> @llvm.vp.select.v8f32(<8 x i1> %m, <8 x float> %v, <8 x float> %c, i32 %evl)
 956   ret <8 x float> %u
 957 }
 958
 959 declare <16 x float> @llvm.vp.fma.v16f32(<16 x float>, <16 x float>, <16 x float>, <16 x i1>, i32)
 960 declare <16 x float> @llvm.vp.fneg.v16f32(<16 x float>, <16 x i1>, i32)
 961 declare <16 x float> @llvm.vp.merge.v16f32(<16 x i1>, <16 x float>, <16 x float>, i32)
 962 declare <16 x float> @llvm.vp.select.v16f32(<16 x i1>, <16 x float>, <16 x float>, i32)
 963
 964 define <16 x float> @vfmsac_vv_v16f32(<16 x float> %a, <16 x float> %b, <16 x float> %c, <16 x i1> %m, i32 zeroext %evl) {
 965 ; CHECK-LABEL: vfmsac_vv_v16f32:
 966 ; CHECK:       # %bb.0:
 967 ; CHECK-NEXT:    vsetvli zero, a0, e32, m4, tu, mu
 968 ; CHECK-NEXT:    vfmsac.vv v16, v8, v12, v0.t
 969 ; CHECK-NEXT:    vmv4r.v v8, v16
 970 ; CHECK-NEXT:    ret
 971   %negc = call <16 x float> @llvm.vp.fneg.v16f32(<16 x float> %c, <16 x i1> splat (i1 -1), i32 %evl)
 972   %v = call <16 x float> @llvm.vp.fma.v16f32(<16 x float> %a, <16 x float> %b, <16 x float> %negc, <16 x i1> splat (i1 -1), i32 %evl)
 973   %u = call <16 x float> @llvm.vp.merge.v16f32(<16 x i1> %m, <16 x float> %v, <16 x float> %c, i32 %evl)
 974   ret <16 x float> %u
 975 }
 976
 977 define <16 x float> @vfmsac_vv_v16f32_unmasked(<16 x float> %a, <16 x float> %b, <16 x float> %c, <16 x i1> %m, i32 zeroext %evl) {
 978 ; CHECK-LABEL: vfmsac_vv_v16f32_unmasked:
 979 ; CHECK:       # %bb.0:
 980 ; CHECK-NEXT:    vsetvli zero, a0, e32, m4, tu, ma
 981 ; CHECK-NEXT:    vfmsac.vv v16, v8, v12
 982 ; CHECK-NEXT:    vmv4r.v v8, v16
 983 ; CHECK-NEXT:    ret
 984   %negc = call <16 x float> @llvm.vp.fneg.v16f32(<16 x float> %c, <16 x i1> splat (i1 -1), i32 %evl)
 985   %v = call <16 x float> @llvm.vp.fma.v16f32(<16 x float> %a, <16 x float> %b, <16 x float> %negc, <16 x i1> splat (i1 -1), i32 %evl)
 986   %u = call <16 x float> @llvm.vp.merge.v16f32(<16 x i1> splat (i1 -1), <16 x float> %v, <16 x float> %c, i32 %evl)
 987   ret <16 x float> %u
 988 }
 989
 990 define <16 x float> @vfmsac_vf_v16f32(<16 x float> %a, float %b, <16 x float> %c, <16 x i1> %m, i32 zeroext %evl) {
 991 ; CHECK-LABEL: vfmsac_vf_v16f32:
 992 ; CHECK:       # %bb.0:
 993 ; CHECK-NEXT:    vsetvli zero, a0, e32, m4, tu, mu
 994 ; CHECK-NEXT:    vfmsac.vf v12, fa0, v8, v0.t
 995 ; CHECK-NEXT:    vmv4r.v v8, v12
 996 ; CHECK-NEXT:    ret
 997   %elt.head = insertelement <16 x float> poison, float %b, i32 0
 998   %vb = shufflevector <16 x float> %elt.head, <16 x float> poison, <16 x i32> zeroinitializer
 999   %negc = call <16 x float> @llvm.vp.fneg.v16f32(<16 x float> %c, <16 x i1> splat (i1 -1), i32 %evl)
1000   %v = call <16 x float> @llvm.vp.fma.v16f32(<16 x float> %a, <16 x float> %vb, <16 x float> %negc, <16 x i1> splat (i1 -1), i32 %evl)
1001   %u = call <16 x float> @llvm.vp.merge.v16f32(<16 x i1> %m, <16 x float> %v, <16 x float> %c, i32 %evl)
1002   ret <16 x float> %u
1003 }
1004
1005 define <16 x float> @vfmsac_vf_v16f32_commute(<16 x float> %a, float %b, <16 x float> %c, <16 x i1> %m, i32 zeroext %evl) {
1006 ; CHECK-LABEL: vfmsac_vf_v16f32_commute:
1007 ; CHECK:       # %bb.0:
1008 ; CHECK-NEXT:    vsetvli zero, a0, e32, m4, tu, mu
1009 ; CHECK-NEXT:    vfmsac.vf v12, fa0, v8, v0.t
1010 ; CHECK-NEXT:    vmv4r.v v8, v12
1011 ; CHECK-NEXT:    ret
1012   %elt.head = insertelement <16 x float> poison, float %b, i32 0
1013   %vb = shufflevector <16 x float> %elt.head, <16 x float> poison, <16 x i32> zeroinitializer
1014   %negc = call <16 x float> @llvm.vp.fneg.v16f32(<16 x float> %c, <16 x i1> splat (i1 -1), i32 %evl)
1015   %v = call <16 x float> @llvm.vp.fma.v16f32(<16 x float> %vb, <16 x float> %a, <16 x float> %negc, <16 x i1> splat (i1 -1), i32 %evl)
1016   %u = call <16 x float> @llvm.vp.merge.v16f32(<16 x i1> %m, <16 x float> %v, <16 x float> %c, i32 %evl)
1017   ret <16 x float> %u
1018 }
1019
1020 define <16 x float> @vfmsac_vf_v16f32_unmasked(<16 x float> %a, float %b, <16 x float> %c, i32 zeroext %evl) {
1021 ; CHECK-LABEL: vfmsac_vf_v16f32_unmasked:
1022 ; CHECK:       # %bb.0:
1023 ; CHECK-NEXT:    vsetvli zero, a0, e32, m4, tu, ma
1024 ; CHECK-NEXT:    vfmsac.vf v12, fa0, v8
1025 ; CHECK-NEXT:    vmv4r.v v8, v12
1026 ; CHECK-NEXT:    ret
1027   %elt.head = insertelement <16 x float> poison, float %b, i32 0
1028   %vb = shufflevector <16 x float> %elt.head, <16 x float> poison, <16 x i32> zeroinitializer
1029   %negc = call <16 x float> @llvm.vp.fneg.v16f32(<16 x float> %c, <16 x i1> splat (i1 -1), i32 %evl)
1030   %v = call <16 x float> @llvm.vp.fma.v16f32(<16 x float> %a, <16 x float> %vb, <16 x float> %negc, <16 x i1> splat (i1 -1), i32 %evl)
1031   %u = call <16 x float> @llvm.vp.merge.v16f32(<16 x i1> splat (i1 -1), <16 x float> %v, <16 x float> %c, i32 %evl)
1032   ret <16 x float> %u
1033 }
1034
1035 define <16 x float> @vfmsac_vv_v16f32_ta(<16 x float> %a, <16 x float> %b, <16 x float> %c, <16 x i1> %m, i32 zeroext %evl) {
1036 ; CHECK-LABEL: vfmsac_vv_v16f32_ta:
1037 ; CHECK:       # %bb.0:
1038 ; CHECK-NEXT:    vsetvli zero, a0, e32, m4, ta, mu
1039 ; CHECK-NEXT:    vfmsac.vv v16, v8, v12, v0.t
1040 ; CHECK-NEXT:    vmv.v.v v8, v16
1041 ; CHECK-NEXT:    ret
1042   %negc = call <16 x float> @llvm.vp.fneg.v16f32(<16 x float> %c, <16 x i1> splat (i1 -1), i32 %evl)
1043   %v = call <16 x float> @llvm.vp.fma.v16f32(<16 x float> %a, <16 x float> %b, <16 x float> %negc, <16 x i1> splat (i1 -1), i32 %evl)
1044   %u = call <16 x float> @llvm.vp.select.v16f32(<16 x i1> %m, <16 x float> %v, <16 x float> %c, i32 %evl)
1045   ret <16 x float> %u
1046 }
1047
1048 define <16 x float> @vfmsac_vf_v16f32_ta(<16 x float> %a, float %b, <16 x float> %c, <16 x i1> %m, i32 zeroext %evl) {
1049 ; CHECK-LABEL: vfmsac_vf_v16f32_ta:
1050 ; CHECK:       # %bb.0:
1051 ; CHECK-NEXT:    vsetvli zero, a0, e32, m4, ta, mu
1052 ; CHECK-NEXT:    vfmsac.vf v12, fa0, v8, v0.t
1053 ; CHECK-NEXT:    vmv.v.v v8, v12
1054 ; CHECK-NEXT:    ret
1055   %elt.head = insertelement <16 x float> poison, float %b, i32 0
1056   %vb = shufflevector <16 x float> %elt.head, <16 x float> poison, <16 x i32> zeroinitializer
1057   %negc = call <16 x float> @llvm.vp.fneg.v16f32(<16 x float> %c, <16 x i1> splat (i1 -1), i32 %evl)
1058   %v = call <16 x float> @llvm.vp.fma.v16f32(<16 x float> %a, <16 x float> %vb, <16 x float> %negc, <16 x i1> splat (i1 -1), i32 %evl)
1059   %u = call <16 x float> @llvm.vp.select.v16f32(<16 x i1> %m, <16 x float> %v, <16 x float> %c, i32 %evl)
1060   ret <16 x float> %u
1061 }
1062
1063 define <16 x float> @vfmsac_vf_v16f32_commute_ta(<16 x float> %a, float %b, <16 x float> %c, <16 x i1> %m, i32 zeroext %evl) {
1064 ; CHECK-LABEL: vfmsac_vf_v16f32_commute_ta:
1065 ; CHECK:       # %bb.0:
1066 ; CHECK-NEXT:    vsetvli zero, a0, e32, m4, ta, mu
1067 ; CHECK-NEXT:    vfmsac.vf v12, fa0, v8, v0.t
1068 ; CHECK-NEXT:    vmv.v.v v8, v12
1069 ; CHECK-NEXT:    ret
1070   %elt.head = insertelement <16 x float> poison, float %b, i32 0
1071   %vb = shufflevector <16 x float> %elt.head, <16 x float> poison, <16 x i32> zeroinitializer
1072   %negc = call <16 x float> @llvm.vp.fneg.v16f32(<16 x float> %c, <16 x i1> splat (i1 -1), i32 %evl)
1073   %v = call <16 x float> @llvm.vp.fma.v16f32(<16 x float> %vb, <16 x float> %a, <16 x float> %negc, <16 x i1> splat (i1 -1), i32 %evl)
1074   %u = call <16 x float> @llvm.vp.select.v16f32(<16 x i1> %m, <16 x float> %v, <16 x float> %c, i32 %evl)
1075   ret <16 x float> %u
1076 }
1077
1078 declare <2 x double> @llvm.vp.fma.v2f64(<2 x double>, <2 x double>, <2 x double>, <2 x i1>, i32)
1079 declare <2 x double> @llvm.vp.fneg.v2f64(<2 x double>, <2 x i1>, i32)
1080 declare <2 x double> @llvm.vp.merge.v2f64(<2 x i1>, <2 x double>, <2 x double>, i32)
1081 declare <2 x double> @llvm.vp.select.v2f64(<2 x i1>, <2 x double>, <2 x double>, i32)
1082
1083 define <2 x double> @vfmsac_vv_v2f64(<2 x double> %a, <2 x double> %b, <2 x double> %c, <2 x i1> %m, i32 zeroext %evl) {
1084 ; CHECK-LABEL: vfmsac_vv_v2f64:
1085 ; CHECK:       # %bb.0:
1086 ; CHECK-NEXT:    vsetvli zero, a0, e64, m1, tu, mu
1087 ; CHECK-NEXT:    vfmsac.vv v10, v8, v9, v0.t
1088 ; CHECK-NEXT:    vmv1r.v v8, v10
1089 ; CHECK-NEXT:    ret
1090   %negc = call <2 x double> @llvm.vp.fneg.v2f64(<2 x double> %c, <2 x i1> splat (i1 -1), i32 %evl)
1091   %v = call <2 x double> @llvm.vp.fma.v2f64(<2 x double> %a, <2 x double> %b, <2 x double> %negc, <2 x i1> splat (i1 -1), i32 %evl)
1092   %u = call <2 x double> @llvm.vp.merge.v2f64(<2 x i1> %m, <2 x double> %v, <2 x double> %c, i32 %evl)
1093   ret <2 x double> %u
1094 }
1095
1096 define <2 x double> @vfmsac_vv_v2f64_unmasked(<2 x double> %a, <2 x double> %b, <2 x double> %c, <2 x i1> %m, i32 zeroext %evl) {
1097 ; CHECK-LABEL: vfmsac_vv_v2f64_unmasked:
1098 ; CHECK:       # %bb.0:
1099 ; CHECK-NEXT:    vsetvli zero, a0, e64, m1, tu, ma
1100 ; CHECK-NEXT:    vfmsac.vv v10, v8, v9
1101 ; CHECK-NEXT:    vmv1r.v v8, v10
1102 ; CHECK-NEXT:    ret
1103   %negc = call <2 x double> @llvm.vp.fneg.v2f64(<2 x double> %c, <2 x i1> splat (i1 -1), i32 %evl)
1104   %v = call <2 x double> @llvm.vp.fma.v2f64(<2 x double> %a, <2 x double> %b, <2 x double> %negc, <2 x i1> splat (i1 -1), i32 %evl)
1105   %u = call <2 x double> @llvm.vp.merge.v2f64(<2 x i1> splat (i1 -1), <2 x double> %v, <2 x double> %c, i32 %evl)
1106   ret <2 x double> %u
1107 }
1108
1109 define <2 x double> @vfmsac_vf_v2f64(<2 x double> %a, double %b, <2 x double> %c, <2 x i1> %m, i32 zeroext %evl) {
1110 ; CHECK-LABEL: vfmsac_vf_v2f64:
1111 ; CHECK:       # %bb.0:
1112 ; CHECK-NEXT:    vsetvli zero, a0, e64, m1, tu, mu
1113 ; CHECK-NEXT:    vfmsac.vf v9, fa0, v8, v0.t
1114 ; CHECK-NEXT:    vmv1r.v v8, v9
1115 ; CHECK-NEXT:    ret
1116   %elt.head = insertelement <2 x double> poison, double %b, i32 0
1117   %vb = shufflevector <2 x double> %elt.head, <2 x double> poison, <2 x i32> zeroinitializer
1118   %negc = call <2 x double> @llvm.vp.fneg.v2f64(<2 x double> %c, <2 x i1> splat (i1 -1), i32 %evl)
1119   %v = call <2 x double> @llvm.vp.fma.v2f64(<2 x double> %a, <2 x double> %vb, <2 x double> %negc, <2 x i1> splat (i1 -1), i32 %evl)
1120   %u = call <2 x double> @llvm.vp.merge.v2f64(<2 x i1> %m, <2 x double> %v, <2 x double> %c, i32 %evl)
1121   ret <2 x double> %u
1122 }
1123
1124 define <2 x double> @vfmsac_vf_v2f64_commute(<2 x double> %a, double %b, <2 x double> %c, <2 x i1> %m, i32 zeroext %evl) {
1125 ; CHECK-LABEL: vfmsac_vf_v2f64_commute:
1126 ; CHECK:       # %bb.0:
1127 ; CHECK-NEXT:    vsetvli zero, a0, e64, m1, tu, mu
1128 ; CHECK-NEXT:    vfmsac.vf v9, fa0, v8, v0.t
1129 ; CHECK-NEXT:    vmv1r.v v8, v9
1130 ; CHECK-NEXT:    ret
1131   %elt.head = insertelement <2 x double> poison, double %b, i32 0
1132   %vb = shufflevector <2 x double> %elt.head, <2 x double> poison, <2 x i32> zeroinitializer
1133   %negc = call <2 x double> @llvm.vp.fneg.v2f64(<2 x double> %c, <2 x i1> splat (i1 -1), i32 %evl)
1134   %v = call <2 x double> @llvm.vp.fma.v2f64(<2 x double> %vb, <2 x double> %a, <2 x double> %negc, <2 x i1> splat (i1 -1), i32 %evl)
1135   %u = call <2 x double> @llvm.vp.merge.v2f64(<2 x i1> %m, <2 x double> %v, <2 x double> %c, i32 %evl)
1136   ret <2 x double> %u
1137 }
1138
1139 define <2 x double> @vfmsac_vf_v2f64_unmasked(<2 x double> %a, double %b, <2 x double> %c, i32 zeroext %evl) {
1140 ; CHECK-LABEL: vfmsac_vf_v2f64_unmasked:
1141 ; CHECK:       # %bb.0:
1142 ; CHECK-NEXT:    vsetvli zero, a0, e64, m1, tu, ma
1143 ; CHECK-NEXT:    vfmsac.vf v9, fa0, v8
1144 ; CHECK-NEXT:    vmv1r.v v8, v9
1145 ; CHECK-NEXT:    ret
1146   %elt.head = insertelement <2 x double> poison, double %b, i32 0
1147   %vb = shufflevector <2 x double> %elt.head, <2 x double> poison, <2 x i32> zeroinitializer
1148   %negc = call <2 x double> @llvm.vp.fneg.v2f64(<2 x double> %c, <2 x i1> splat (i1 -1), i32 %evl)
1149   %v = call <2 x double> @llvm.vp.fma.v2f64(<2 x double> %a, <2 x double> %vb, <2 x double> %negc, <2 x i1> splat (i1 -1), i32 %evl)
1150   %u = call <2 x double> @llvm.vp.merge.v2f64(<2 x i1> splat (i1 -1), <2 x double> %v, <2 x double> %c, i32 %evl)
1151   ret <2 x double> %u
1152 }
1153
1154 define <2 x double> @vfmsac_vv_v2f64_ta(<2 x double> %a, <2 x double> %b, <2 x double> %c, <2 x i1> %m, i32 zeroext %evl) {
1155 ; CHECK-LABEL: vfmsac_vv_v2f64_ta:
1156 ; CHECK:       # %bb.0:
1157 ; CHECK-NEXT:    vsetvli zero, a0, e64, m1, ta, mu
1158 ; CHECK-NEXT:    vfmsac.vv v10, v8, v9, v0.t
1159 ; CHECK-NEXT:    vmv.v.v v8, v10
1160 ; CHECK-NEXT:    ret
1161   %negc = call <2 x double> @llvm.vp.fneg.v2f64(<2 x double> %c, <2 x i1> splat (i1 -1), i32 %evl)
1162   %v = call <2 x double> @llvm.vp.fma.v2f64(<2 x double> %a, <2 x double> %b, <2 x double> %negc, <2 x i1> splat (i1 -1), i32 %evl)
1163   %u = call <2 x double> @llvm.vp.select.v2f64(<2 x i1> %m, <2 x double> %v, <2 x double> %c, i32 %evl)
1164   ret <2 x double> %u
1165 }
1166
1167 define <2 x double> @vfmsac_vf_v2f64_ta(<2 x double> %a, double %b, <2 x double> %c, <2 x i1> %m, i32 zeroext %evl) {
1168 ; CHECK-LABEL: vfmsac_vf_v2f64_ta:
1169 ; CHECK:       # %bb.0:
1170 ; CHECK-NEXT:    vsetvli zero, a0, e64, m1, ta, mu
1171 ; CHECK-NEXT:    vfmsac.vf v9, fa0, v8, v0.t
1172 ; CHECK-NEXT:    vmv.v.v v8, v9
1173 ; CHECK-NEXT:    ret
1174   %elt.head = insertelement <2 x double> poison, double %b, i32 0
1175   %vb = shufflevector <2 x double> %elt.head, <2 x double> poison, <2 x i32> zeroinitializer
1176   %negc = call <2 x double> @llvm.vp.fneg.v2f64(<2 x double> %c, <2 x i1> splat (i1 -1), i32 %evl)
1177   %v = call <2 x double> @llvm.vp.fma.v2f64(<2 x double> %a, <2 x double> %vb, <2 x double> %negc, <2 x i1> splat (i1 -1), i32 %evl)
1178   %u = call <2 x double> @llvm.vp.select.v2f64(<2 x i1> %m, <2 x double> %v, <2 x double> %c, i32 %evl)
1179   ret <2 x double> %u
1180 }
1181
1182 define <2 x double> @vfmsac_vf_v2f64_commute_ta(<2 x double> %a, double %b, <2 x double> %c, <2 x i1> %m, i32 zeroext %evl) {
1183 ; CHECK-LABEL: vfmsac_vf_v2f64_commute_ta:
1184 ; CHECK:       # %bb.0:
1185 ; CHECK-NEXT:    vsetvli zero, a0, e64, m1, ta, mu
1186 ; CHECK-NEXT:    vfmsac.vf v9, fa0, v8, v0.t
1187 ; CHECK-NEXT:    vmv.v.v v8, v9
1188 ; CHECK-NEXT:    ret
1189   %elt.head = insertelement <2 x double> poison, double %b, i32 0
1190   %vb = shufflevector <2 x double> %elt.head, <2 x double> poison, <2 x i32> zeroinitializer
1191   %negc = call <2 x double> @llvm.vp.fneg.v2f64(<2 x double> %c, <2 x i1> splat (i1 -1), i32 %evl)
1192   %v = call <2 x double> @llvm.vp.fma.v2f64(<2 x double> %vb, <2 x double> %a, <2 x double> %negc, <2 x i1> splat (i1 -1), i32 %evl)
1193   %u = call <2 x double> @llvm.vp.select.v2f64(<2 x i1> %m, <2 x double> %v, <2 x double> %c, i32 %evl)
1194   ret <2 x double> %u
1195 }
1196
1197 declare <4 x double> @llvm.vp.fma.v4f64(<4 x double>, <4 x double>, <4 x double>, <4 x i1>, i32)
1198 declare <4 x double> @llvm.vp.fneg.v4f64(<4 x double>, <4 x i1>, i32)
1199 declare <4 x double> @llvm.vp.merge.v4f64(<4 x i1>, <4 x double>, <4 x double>, i32)
1200 declare <4 x double> @llvm.vp.select.v4f64(<4 x i1>, <4 x double>, <4 x double>, i32)
1201
1202 define <4 x double> @vfmsac_vv_v4f64(<4 x double> %a, <4 x double> %b, <4 x double> %c, <4 x i1> %m, i32 zeroext %evl) {
1203 ; CHECK-LABEL: vfmsac_vv_v4f64:
1204 ; CHECK:       # %bb.0:
1205 ; CHECK-NEXT:    vsetvli zero, a0, e64, m2, tu, mu
1206 ; CHECK-NEXT:    vfmsac.vv v12, v8, v10, v0.t
1207 ; CHECK-NEXT:    vmv2r.v v8, v12
1208 ; CHECK-NEXT:    ret
1209   %negc = call <4 x double> @llvm.vp.fneg.v4f64(<4 x double> %c, <4 x i1> splat (i1 -1), i32 %evl)
1210   %v = call <4 x double> @llvm.vp.fma.v4f64(<4 x double> %a, <4 x double> %b, <4 x double> %negc, <4 x i1> splat (i1 -1), i32 %evl)
1211   %u = call <4 x double> @llvm.vp.merge.v4f64(<4 x i1> %m, <4 x double> %v, <4 x double> %c, i32 %evl)
1212   ret <4 x double> %u
1213 }
1214
1215 define <4 x double> @vfmsac_vv_v4f64_unmasked(<4 x double> %a, <4 x double> %b, <4 x double> %c, <4 x i1> %m, i32 zeroext %evl) {
1216 ; CHECK-LABEL: vfmsac_vv_v4f64_unmasked:
1217 ; CHECK:       # %bb.0:
1218 ; CHECK-NEXT:    vsetvli zero, a0, e64, m2, tu, ma
1219 ; CHECK-NEXT:    vfmsac.vv v12, v8, v10
1220 ; CHECK-NEXT:    vmv2r.v v8, v12
1221 ; CHECK-NEXT:    ret
1222   %negc = call <4 x double> @llvm.vp.fneg.v4f64(<4 x double> %c, <4 x i1> splat (i1 -1), i32 %evl)
1223   %v = call <4 x double> @llvm.vp.fma.v4f64(<4 x double> %a, <4 x double> %b, <4 x double> %negc, <4 x i1> splat (i1 -1), i32 %evl)
1224   %u = call <4 x double> @llvm.vp.merge.v4f64(<4 x i1> splat (i1 -1), <4 x double> %v, <4 x double> %c, i32 %evl)
1225   ret <4 x double> %u
1226 }
1227
1228 define <4 x double> @vfmsac_vf_v4f64(<4 x double> %a, double %b, <4 x double> %c, <4 x i1> %m, i32 zeroext %evl) {
1229 ; CHECK-LABEL: vfmsac_vf_v4f64:
1230 ; CHECK:       # %bb.0:
1231 ; CHECK-NEXT:    vsetvli zero, a0, e64, m2, tu, mu
1232 ; CHECK-NEXT:    vfmsac.vf v10, fa0, v8, v0.t
1233 ; CHECK-NEXT:    vmv2r.v v8, v10
1234 ; CHECK-NEXT:    ret
1235   %elt.head = insertelement <4 x double> poison, double %b, i32 0
1236   %vb = shufflevector <4 x double> %elt.head, <4 x double> poison, <4 x i32> zeroinitializer
1237   %negc = call <4 x double> @llvm.vp.fneg.v4f64(<4 x double> %c, <4 x i1> splat (i1 -1), i32 %evl)
1238   %v = call <4 x double> @llvm.vp.fma.v4f64(<4 x double> %a, <4 x double> %vb, <4 x double> %negc, <4 x i1> splat (i1 -1), i32 %evl)
1239   %u = call <4 x double> @llvm.vp.merge.v4f64(<4 x i1> %m, <4 x double> %v, <4 x double> %c, i32 %evl)
1240   ret <4 x double> %u
1241 }
1242
1243 define <4 x double> @vfmsac_vf_v4f64_commute(<4 x double> %a, double %b, <4 x double> %c, <4 x i1> %m, i32 zeroext %evl) {
1244 ; CHECK-LABEL: vfmsac_vf_v4f64_commute:
1245 ; CHECK:       # %bb.0:
1246 ; CHECK-NEXT:    vsetvli zero, a0, e64, m2, tu, mu
1247 ; CHECK-NEXT:    vfmsac.vf v10, fa0, v8, v0.t
1248 ; CHECK-NEXT:    vmv2r.v v8, v10
1249 ; CHECK-NEXT:    ret
1250   %elt.head = insertelement <4 x double> poison, double %b, i32 0
1251   %vb = shufflevector <4 x double> %elt.head, <4 x double> poison, <4 x i32> zeroinitializer
1252   %negc = call <4 x double> @llvm.vp.fneg.v4f64(<4 x double> %c, <4 x i1> splat (i1 -1), i32 %evl)
1253   %v = call <4 x double> @llvm.vp.fma.v4f64(<4 x double> %vb, <4 x double> %a, <4 x double> %negc, <4 x i1> splat (i1 -1), i32 %evl)
1254   %u = call <4 x double> @llvm.vp.merge.v4f64(<4 x i1> %m, <4 x double> %v, <4 x double> %c, i32 %evl)
1255   ret <4 x double> %u
1256 }
1257
1258 define <4 x double> @vfmsac_vf_v4f64_unmasked(<4 x double> %a, double %b, <4 x double> %c, i32 zeroext %evl) {
1259 ; CHECK-LABEL: vfmsac_vf_v4f64_unmasked:
1260 ; CHECK:       # %bb.0:
1261 ; CHECK-NEXT:    vsetvli zero, a0, e64, m2, tu, ma
1262 ; CHECK-NEXT:    vfmsac.vf v10, fa0, v8
1263 ; CHECK-NEXT:    vmv2r.v v8, v10
1264 ; CHECK-NEXT:    ret
1265   %elt.head = insertelement <4 x double> poison, double %b, i32 0
1266   %vb = shufflevector <4 x double> %elt.head, <4 x double> poison, <4 x i32> zeroinitializer
1267   %negc = call <4 x double> @llvm.vp.fneg.v4f64(<4 x double> %c, <4 x i1> splat (i1 -1), i32 %evl)
1268   %v = call <4 x double> @llvm.vp.fma.v4f64(<4 x double> %a, <4 x double> %vb, <4 x double> %negc, <4 x i1> splat (i1 -1), i32 %evl)
1269   %u = call <4 x double> @llvm.vp.merge.v4f64(<4 x i1> splat (i1 -1), <4 x double> %v, <4 x double> %c, i32 %evl)
1270   ret <4 x double> %u
1271 }
1272
1273 define <4 x double> @vfmsac_vv_v4f64_ta(<4 x double> %a, <4 x double> %b, <4 x double> %c, <4 x i1> %m, i32 zeroext %evl) {
1274 ; CHECK-LABEL: vfmsac_vv_v4f64_ta:
1275 ; CHECK:       # %bb.0:
1276 ; CHECK-NEXT:    vsetvli zero, a0, e64, m2, ta, mu
1277 ; CHECK-NEXT:    vfmsac.vv v12, v8, v10, v0.t
1278 ; CHECK-NEXT:    vmv.v.v v8, v12
1279 ; CHECK-NEXT:    ret
1280   %negc = call <4 x double> @llvm.vp.fneg.v4f64(<4 x double> %c, <4 x i1> splat (i1 -1), i32 %evl)
1281   %v = call <4 x double> @llvm.vp.fma.v4f64(<4 x double> %a, <4 x double> %b, <4 x double> %negc, <4 x i1> splat (i1 -1), i32 %evl)
1282   %u = call <4 x double> @llvm.vp.select.v4f64(<4 x i1> %m, <4 x double> %v, <4 x double> %c, i32 %evl)
1283   ret <4 x double> %u
1284 }
1285
1286 define <4 x double> @vfmsac_vf_v4f64_ta(<4 x double> %a, double %b, <4 x double> %c, <4 x i1> %m, i32 zeroext %evl) {
1287 ; CHECK-LABEL: vfmsac_vf_v4f64_ta:
1288 ; CHECK:       # %bb.0:
1289 ; CHECK-NEXT:    vsetvli zero, a0, e64, m2, ta, mu
1290 ; CHECK-NEXT:    vfmsac.vf v10, fa0, v8, v0.t
1291 ; CHECK-NEXT:    vmv.v.v v8, v10
1292 ; CHECK-NEXT:    ret
1293   %elt.head = insertelement <4 x double> poison, double %b, i32 0
1294   %vb = shufflevector <4 x double> %elt.head, <4 x double> poison, <4 x i32> zeroinitializer
1295   %negc = call <4 x double> @llvm.vp.fneg.v4f64(<4 x double> %c, <4 x i1> splat (i1 -1), i32 %evl)
1296   %v = call <4 x double> @llvm.vp.fma.v4f64(<4 x double> %a, <4 x double> %vb, <4 x double> %negc, <4 x i1> splat (i1 -1), i32 %evl)
1297   %u = call <4 x double> @llvm.vp.select.v4f64(<4 x i1> %m, <4 x double> %v, <4 x double> %c, i32 %evl)
1298   ret <4 x double> %u
1299 }
1300
1301 define <4 x double> @vfmsac_vf_v4f64_commute_ta(<4 x double> %a, double %b, <4 x double> %c, <4 x i1> %m, i32 zeroext %evl) {
1302 ; CHECK-LABEL: vfmsac_vf_v4f64_commute_ta:
1303 ; CHECK:       # %bb.0:
1304 ; CHECK-NEXT:    vsetvli zero, a0, e64, m2, ta, mu
1305 ; CHECK-NEXT:    vfmsac.vf v10, fa0, v8, v0.t
1306 ; CHECK-NEXT:    vmv.v.v v8, v10
1307 ; CHECK-NEXT:    ret
1308   %elt.head = insertelement <4 x double> poison, double %b, i32 0
1309   %vb = shufflevector <4 x double> %elt.head, <4 x double> poison, <4 x i32> zeroinitializer
1310   %negc = call <4 x double> @llvm.vp.fneg.v4f64(<4 x double> %c, <4 x i1> splat (i1 -1), i32 %evl)
1311   %v = call <4 x double> @llvm.vp.fma.v4f64(<4 x double> %vb, <4 x double> %a, <4 x double> %negc, <4 x i1> splat (i1 -1), i32 %evl)
1312   %u = call <4 x double> @llvm.vp.select.v4f64(<4 x i1> %m, <4 x double> %v, <4 x double> %c, i32 %evl)
1313   ret <4 x double> %u
1314 }
1315
1316 declare <8 x double> @llvm.vp.fma.v8f64(<8 x double>, <8 x double>, <8 x double>, <8 x i1>, i32)
1317 declare <8 x double> @llvm.vp.fneg.v8f64(<8 x double>, <8 x i1>, i32)
1318 declare <8 x double> @llvm.vp.merge.v8f64(<8 x i1>, <8 x double>, <8 x double>, i32)
1319 declare <8 x double> @llvm.vp.select.v8f64(<8 x i1>, <8 x double>, <8 x double>, i32)
1320
1321 define <8 x double> @vfmsac_vv_v8f64(<8 x double> %a, <8 x double> %b, <8 x double> %c, <8 x i1> %m, i32 zeroext %evl) {
1322 ; CHECK-LABEL: vfmsac_vv_v8f64:
1323 ; CHECK:       # %bb.0:
1324 ; CHECK-NEXT:    vsetvli zero, a0, e64, m4, tu, mu
1325 ; CHECK-NEXT:    vfmsac.vv v16, v8, v12, v0.t
1326 ; CHECK-NEXT:    vmv4r.v v8, v16
1327 ; CHECK-NEXT:    ret
1328   %negc = call <8 x double> @llvm.vp.fneg.v8f64(<8 x double> %c, <8 x i1> splat (i1 -1), i32 %evl)
1329   %v = call <8 x double> @llvm.vp.fma.v8f64(<8 x double> %a, <8 x double> %b, <8 x double> %negc, <8 x i1> splat (i1 -1), i32 %evl)
1330   %u = call <8 x double> @llvm.vp.merge.v8f64(<8 x i1> %m, <8 x double> %v, <8 x double> %c, i32 %evl)
1331   ret <8 x double> %u
1332 }
1333
1334 define <8 x double> @vfmsac_vv_v8f64_unmasked(<8 x double> %a, <8 x double> %b, <8 x double> %c, <8 x i1> %m, i32 zeroext %evl) {
1335 ; CHECK-LABEL: vfmsac_vv_v8f64_unmasked:
1336 ; CHECK:       # %bb.0:
1337 ; CHECK-NEXT:    vsetvli zero, a0, e64, m4, tu, ma
1338 ; CHECK-NEXT:    vfmsac.vv v16, v8, v12
1339 ; CHECK-NEXT:    vmv4r.v v8, v16
1340 ; CHECK-NEXT:    ret
1341   %negc = call <8 x double> @llvm.vp.fneg.v8f64(<8 x double> %c, <8 x i1> splat (i1 -1), i32 %evl)
1342   %v = call <8 x double> @llvm.vp.fma.v8f64(<8 x double> %a, <8 x double> %b, <8 x double> %negc, <8 x i1> splat (i1 -1), i32 %evl)
1343   %u = call <8 x double> @llvm.vp.merge.v8f64(<8 x i1> splat (i1 -1), <8 x double> %v, <8 x double> %c, i32 %evl)
1344   ret <8 x double> %u
1345 }
1346
1347 define <8 x double> @vfmsac_vf_v8f64(<8 x double> %a, double %b, <8 x double> %c, <8 x i1> %m, i32 zeroext %evl) {
1348 ; CHECK-LABEL: vfmsac_vf_v8f64:
1349 ; CHECK:       # %bb.0:
1350 ; CHECK-NEXT:    vsetvli zero, a0, e64, m4, tu, mu
1351 ; CHECK-NEXT:    vfmsac.vf v12, fa0, v8, v0.t
1352 ; CHECK-NEXT:    vmv4r.v v8, v12
1353 ; CHECK-NEXT:    ret
1354   %elt.head = insertelement <8 x double> poison, double %b, i32 0
1355   %vb = shufflevector <8 x double> %elt.head, <8 x double> poison, <8 x i32> zeroinitializer
1356   %negc = call <8 x double> @llvm.vp.fneg.v8f64(<8 x double> %c, <8 x i1> splat (i1 -1), i32 %evl)
1357   %v = call <8 x double> @llvm.vp.fma.v8f64(<8 x double> %a, <8 x double> %vb, <8 x double> %negc, <8 x i1> splat (i1 -1), i32 %evl)
1358   %u = call <8 x double> @llvm.vp.merge.v8f64(<8 x i1> %m, <8 x double> %v, <8 x double> %c, i32 %evl)
1359   ret <8 x double> %u
1360 }
1361
1362 define <8 x double> @vfmsac_vf_v8f64_commute(<8 x double> %a, double %b, <8 x double> %c, <8 x i1> %m, i32 zeroext %evl) {
1363 ; CHECK-LABEL: vfmsac_vf_v8f64_commute:
1364 ; CHECK:       # %bb.0:
1365 ; CHECK-NEXT:    vsetvli zero, a0, e64, m4, tu, mu
1366 ; CHECK-NEXT:    vfmsac.vf v12, fa0, v8, v0.t
1367 ; CHECK-NEXT:    vmv4r.v v8, v12
1368 ; CHECK-NEXT:    ret
1369   %elt.head = insertelement <8 x double> poison, double %b, i32 0
1370   %vb = shufflevector <8 x double> %elt.head, <8 x double> poison, <8 x i32> zeroinitializer
1371   %negc = call <8 x double> @llvm.vp.fneg.v8f64(<8 x double> %c, <8 x i1> splat (i1 -1), i32 %evl)
1372   %v = call <8 x double> @llvm.vp.fma.v8f64(<8 x double> %vb, <8 x double> %a, <8 x double> %negc, <8 x i1> splat (i1 -1), i32 %evl)
1373   %u = call <8 x double> @llvm.vp.merge.v8f64(<8 x i1> %m, <8 x double> %v, <8 x double> %c, i32 %evl)
1374   ret <8 x double> %u
1375 }
1376
1377 define <8 x double> @vfmsac_vf_v8f64_unmasked(<8 x double> %a, double %b, <8 x double> %c, i32 zeroext %evl) {
1378 ; CHECK-LABEL: vfmsac_vf_v8f64_unmasked:
1379 ; CHECK:       # %bb.0:
1380 ; CHECK-NEXT:    vsetvli zero, a0, e64, m4, tu, ma
1381 ; CHECK-NEXT:    vfmsac.vf v12, fa0, v8
1382 ; CHECK-NEXT:    vmv4r.v v8, v12
1383 ; CHECK-NEXT:    ret
1384   %elt.head = insertelement <8 x double> poison, double %b, i32 0
1385   %vb = shufflevector <8 x double> %elt.head, <8 x double> poison, <8 x i32> zeroinitializer
1386   %negc = call <8 x double> @llvm.vp.fneg.v8f64(<8 x double> %c, <8 x i1> splat (i1 -1), i32 %evl)
1387   %v = call <8 x double> @llvm.vp.fma.v8f64(<8 x double> %a, <8 x double> %vb, <8 x double> %negc, <8 x i1> splat (i1 -1), i32 %evl)
1388   %u = call <8 x double> @llvm.vp.merge.v8f64(<8 x i1> splat (i1 -1), <8 x double> %v, <8 x double> %c, i32 %evl)
1389   ret <8 x double> %u
1390 }
1391
1392 define <8 x double> @vfmsac_vv_v8f64_ta(<8 x double> %a, <8 x double> %b, <8 x double> %c, <8 x i1> %m, i32 zeroext %evl) {
1393 ; CHECK-LABEL: vfmsac_vv_v8f64_ta:
1394 ; CHECK:       # %bb.0:
1395 ; CHECK-NEXT:    vsetvli zero, a0, e64, m4, ta, mu
1396 ; CHECK-NEXT:    vfmsac.vv v16, v8, v12, v0.t
1397 ; CHECK-NEXT:    vmv.v.v v8, v16
1398 ; CHECK-NEXT:    ret
1399   %negc = call <8 x double> @llvm.vp.fneg.v8f64(<8 x double> %c, <8 x i1> splat (i1 -1), i32 %evl)
1400   %v = call <8 x double> @llvm.vp.fma.v8f64(<8 x double> %a, <8 x double> %b, <8 x double> %negc, <8 x i1> splat (i1 -1), i32 %evl)
1401   %u = call <8 x double> @llvm.vp.select.v8f64(<8 x i1> %m, <8 x double> %v, <8 x double> %c, i32 %evl)
1402   ret <8 x double> %u
1403 }
1404
1405 define <8 x double> @vfmsac_vf_v8f64_ta(<8 x double> %a, double %b, <8 x double> %c, <8 x i1> %m, i32 zeroext %evl) {
1406 ; CHECK-LABEL: vfmsac_vf_v8f64_ta:
1407 ; CHECK:       # %bb.0:
1408 ; CHECK-NEXT:    vsetvli zero, a0, e64, m4, ta, mu
1409 ; CHECK-NEXT:    vfmsac.vf v12, fa0, v8, v0.t
1410 ; CHECK-NEXT:    vmv.v.v v8, v12
1411 ; CHECK-NEXT:    ret
1412   %elt.head = insertelement <8 x double> poison, double %b, i32 0
1413   %vb = shufflevector <8 x double> %elt.head, <8 x double> poison, <8 x i32> zeroinitializer
1414   %negc = call <8 x double> @llvm.vp.fneg.v8f64(<8 x double> %c, <8 x i1> splat (i1 -1), i32 %evl)
1415   %v = call <8 x double> @llvm.vp.fma.v8f64(<8 x double> %a, <8 x double> %vb, <8 x double> %negc, <8 x i1> splat (i1 -1), i32 %evl)
1416   %u = call <8 x double> @llvm.vp.select.v8f64(<8 x i1> %m, <8 x double> %v, <8 x double> %c, i32 %evl)
1417   ret <8 x double> %u
1418 }
1419
1420 define <8 x double> @vfmsac_vf_v8f64_commute_ta(<8 x double> %a, double %b, <8 x double> %c, <8 x i1> %m, i32 zeroext %evl) {
1421 ; CHECK-LABEL: vfmsac_vf_v8f64_commute_ta:
1422 ; CHECK:       # %bb.0:
1423 ; CHECK-NEXT:    vsetvli zero, a0, e64, m4, ta, mu
1424 ; CHECK-NEXT:    vfmsac.vf v12, fa0, v8, v0.t
1425 ; CHECK-NEXT:    vmv.v.v v8, v12
1426 ; CHECK-NEXT:    ret
1427   %elt.head = insertelement <8 x double> poison, double %b, i32 0
1428   %vb = shufflevector <8 x double> %elt.head, <8 x double> poison, <8 x i32> zeroinitializer
1429   %negc = call <8 x double> @llvm.vp.fneg.v8f64(<8 x double> %c, <8 x i1> splat (i1 -1), i32 %evl)
1430   %v = call <8 x double> @llvm.vp.fma.v8f64(<8 x double> %vb, <8 x double> %a, <8 x double> %negc, <8 x i1> splat (i1 -1), i32 %evl)
1431   %u = call <8 x double> @llvm.vp.select.v8f64(<8 x i1> %m, <8 x double> %v, <8 x double> %c, i32 %evl)
1432   ret <8 x double> %u
1433 }