llvm/test/CodeGen/RISCV/rvv/fixed-vectors-vfwsub.ll

   1 ; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
   2 ; RUN: llc -mtriple=riscv32 -mattr=+v,+zfh,+zvfh,+f,+d -target-abi=ilp32d \
   3 ; RUN:   -verify-machineinstrs < %s | FileCheck %s
   4 ; RUN: llc -mtriple=riscv64 -mattr=+v,+zfh,+zvfh,+f,+d -target-abi=lp64d \
   5 ; RUN:   -verify-machineinstrs < %s | FileCheck %s
   6
   7 define <2 x float> @vfwsub_v2f16(ptr %x, ptr %y) {
   8 ; CHECK-LABEL: vfwsub_v2f16:
   9 ; CHECK:       # %bb.0:
  10 ; CHECK-NEXT:    vsetivli zero, 2, e16, mf4, ta, ma
  11 ; CHECK-NEXT:    vle16.v v9, (a0)
  12 ; CHECK-NEXT:    vle16.v v10, (a1)
  13 ; CHECK-NEXT:    vfwsub.vv v8, v9, v10
  14 ; CHECK-NEXT:    ret
  15   %a = load <2 x half>, ptr %x
  16   %b = load <2 x half>, ptr %y
  17   %c = fpext <2 x half> %a to <2 x float>
  18   %d = fpext <2 x half> %b to <2 x float>
  19   %e = fsub <2 x float> %c, %d
  20   ret <2 x float> %e
  21 }
  22
  23 define <4 x float> @vfwsub_v4f16(ptr %x, ptr %y) {
  24 ; CHECK-LABEL: vfwsub_v4f16:
  25 ; CHECK:       # %bb.0:
  26 ; CHECK-NEXT:    vsetivli zero, 4, e16, mf2, ta, ma
  27 ; CHECK-NEXT:    vle16.v v9, (a0)
  28 ; CHECK-NEXT:    vle16.v v10, (a1)
  29 ; CHECK-NEXT:    vfwsub.vv v8, v9, v10
  30 ; CHECK-NEXT:    ret
  31   %a = load <4 x half>, ptr %x
  32   %b = load <4 x half>, ptr %y
  33   %c = fpext <4 x half> %a to <4 x float>
  34   %d = fpext <4 x half> %b to <4 x float>
  35   %e = fsub <4 x float> %c, %d
  36   ret <4 x float> %e
  37 }
  38
  39 define <8 x float> @vfwsub_v8f16(ptr %x, ptr %y) {
  40 ; CHECK-LABEL: vfwsub_v8f16:
  41 ; CHECK:       # %bb.0:
  42 ; CHECK-NEXT:    vsetivli zero, 8, e16, m1, ta, ma
  43 ; CHECK-NEXT:    vle16.v v10, (a0)
  44 ; CHECK-NEXT:    vle16.v v11, (a1)
  45 ; CHECK-NEXT:    vfwsub.vv v8, v10, v11
  46 ; CHECK-NEXT:    ret
  47   %a = load <8 x half>, ptr %x
  48   %b = load <8 x half>, ptr %y
  49   %c = fpext <8 x half> %a to <8 x float>
  50   %d = fpext <8 x half> %b to <8 x float>
  51   %e = fsub <8 x float> %c, %d
  52   ret <8 x float> %e
  53 }
  54
  55 define <16 x float> @vfwsub_v16f16(ptr %x, ptr %y) {
  56 ; CHECK-LABEL: vfwsub_v16f16:
  57 ; CHECK:       # %bb.0:
  58 ; CHECK-NEXT:    vsetivli zero, 16, e16, m2, ta, ma
  59 ; CHECK-NEXT:    vle16.v v12, (a0)
  60 ; CHECK-NEXT:    vle16.v v14, (a1)
  61 ; CHECK-NEXT:    vfwsub.vv v8, v12, v14
  62 ; CHECK-NEXT:    ret
  63   %a = load <16 x half>, ptr %x
  64   %b = load <16 x half>, ptr %y
  65   %c = fpext <16 x half> %a to <16 x float>
  66   %d = fpext <16 x half> %b to <16 x float>
  67   %e = fsub <16 x float> %c, %d
  68   ret <16 x float> %e
  69 }
  70
  71 define <32 x float> @vfwsub_v32f16(ptr %x, ptr %y) {
  72 ; CHECK-LABEL: vfwsub_v32f16:
  73 ; CHECK:       # %bb.0:
  74 ; CHECK-NEXT:    li a2, 32
  75 ; CHECK-NEXT:    vsetvli zero, a2, e16, m4, ta, ma
  76 ; CHECK-NEXT:    vle16.v v16, (a0)
  77 ; CHECK-NEXT:    vle16.v v20, (a1)
  78 ; CHECK-NEXT:    vfwsub.vv v8, v16, v20
  79 ; CHECK-NEXT:    ret
  80   %a = load <32 x half>, ptr %x
  81   %b = load <32 x half>, ptr %y
  82   %c = fpext <32 x half> %a to <32 x float>
  83   %d = fpext <32 x half> %b to <32 x float>
  84   %e = fsub <32 x float> %c, %d
  85   ret <32 x float> %e
  86 }
  87
  88 define <64 x float> @vfwsub_v64f16(ptr %x, ptr %y) {
  89 ; CHECK-LABEL: vfwsub_v64f16:
  90 ; CHECK:       # %bb.0:
  91 ; CHECK-NEXT:    addi sp, sp, -16
  92 ; CHECK-NEXT:    .cfi_def_cfa_offset 16
  93 ; CHECK-NEXT:    csrr a2, vlenb
  94 ; CHECK-NEXT:    slli a2, a2, 4
  95 ; CHECK-NEXT:    sub sp, sp, a2
  96 ; CHECK-NEXT:    .cfi_escape 0x0f, 0x0d, 0x72, 0x00, 0x11, 0x10, 0x22, 0x11, 0x10, 0x92, 0xa2, 0x38, 0x00, 0x1e, 0x22 # sp + 16 + 16 * vlenb
  97 ; CHECK-NEXT:    li a2, 64
  98 ; CHECK-NEXT:    vsetvli zero, a2, e16, m8, ta, ma
  99 ; CHECK-NEXT:    vle16.v v8, (a0)
 100 ; CHECK-NEXT:    addi a0, sp, 16
 101 ; CHECK-NEXT:    vs8r.v v8, (a0) # Unknown-size Folded Spill
 102 ; CHECK-NEXT:    vle16.v v0, (a1)
 103 ; CHECK-NEXT:    li a0, 32
 104 ; CHECK-NEXT:    vsetvli zero, a0, e16, m8, ta, ma
 105 ; CHECK-NEXT:    vslidedown.vx v16, v8, a0
 106 ; CHECK-NEXT:    vslidedown.vx v8, v0, a0
 107 ; CHECK-NEXT:    vsetvli zero, a0, e16, m4, ta, ma
 108 ; CHECK-NEXT:    vfwsub.vv v24, v16, v8
 109 ; CHECK-NEXT:    csrr a0, vlenb
 110 ; CHECK-NEXT:    slli a0, a0, 3
 111 ; CHECK-NEXT:    add a0, sp, a0
 112 ; CHECK-NEXT:    addi a0, a0, 16
 113 ; CHECK-NEXT:    vs8r.v v24, (a0) # Unknown-size Folded Spill
 114 ; CHECK-NEXT:    addi a0, sp, 16
 115 ; CHECK-NEXT:    vl8r.v v16, (a0) # Unknown-size Folded Reload
 116 ; CHECK-NEXT:    vfwsub.vv v8, v16, v0
 117 ; CHECK-NEXT:    csrr a0, vlenb
 118 ; CHECK-NEXT:    slli a0, a0, 3
 119 ; CHECK-NEXT:    add a0, sp, a0
 120 ; CHECK-NEXT:    addi a0, a0, 16
 121 ; CHECK-NEXT:    vl8r.v v16, (a0) # Unknown-size Folded Reload
 122 ; CHECK-NEXT:    csrr a0, vlenb
 123 ; CHECK-NEXT:    slli a0, a0, 4
 124 ; CHECK-NEXT:    add sp, sp, a0
 125 ; CHECK-NEXT:    addi sp, sp, 16
 126 ; CHECK-NEXT:    ret
 127   %a = load <64 x half>, ptr %x
 128   %b = load <64 x half>, ptr %y
 129   %c = fpext <64 x half> %a to <64 x float>
 130   %d = fpext <64 x half> %b to <64 x float>
 131   %e = fsub <64 x float> %c, %d
 132   ret <64 x float> %e
 133 }
 134
 135 define <2 x double> @vfwsub_v2f32(ptr %x, ptr %y) {
 136 ; CHECK-LABEL: vfwsub_v2f32:
 137 ; CHECK:       # %bb.0:
 138 ; CHECK-NEXT:    vsetivli zero, 2, e32, mf2, ta, ma
 139 ; CHECK-NEXT:    vle32.v v9, (a0)
 140 ; CHECK-NEXT:    vle32.v v10, (a1)
 141 ; CHECK-NEXT:    vfwsub.vv v8, v9, v10
 142 ; CHECK-NEXT:    ret
 143   %a = load <2 x float>, ptr %x
 144   %b = load <2 x float>, ptr %y
 145   %c = fpext <2 x float> %a to <2 x double>
 146   %d = fpext <2 x float> %b to <2 x double>
 147   %e = fsub <2 x double> %c, %d
 148   ret <2 x double> %e
 149 }
 150
 151 define <4 x double> @vfwsub_v4f32(ptr %x, ptr %y) {
 152 ; CHECK-LABEL: vfwsub_v4f32:
 153 ; CHECK:       # %bb.0:
 154 ; CHECK-NEXT:    vsetivli zero, 4, e32, m1, ta, ma
 155 ; CHECK-NEXT:    vle32.v v10, (a0)
 156 ; CHECK-NEXT:    vle32.v v11, (a1)
 157 ; CHECK-NEXT:    vfwsub.vv v8, v10, v11
 158 ; CHECK-NEXT:    ret
 159   %a = load <4 x float>, ptr %x
 160   %b = load <4 x float>, ptr %y
 161   %c = fpext <4 x float> %a to <4 x double>
 162   %d = fpext <4 x float> %b to <4 x double>
 163   %e = fsub <4 x double> %c, %d
 164   ret <4 x double> %e
 165 }
 166
 167 define <8 x double> @vfwsub_v8f32(ptr %x, ptr %y) {
 168 ; CHECK-LABEL: vfwsub_v8f32:
 169 ; CHECK:       # %bb.0:
 170 ; CHECK-NEXT:    vsetivli zero, 8, e32, m2, ta, ma
 171 ; CHECK-NEXT:    vle32.v v12, (a0)
 172 ; CHECK-NEXT:    vle32.v v14, (a1)
 173 ; CHECK-NEXT:    vfwsub.vv v8, v12, v14
 174 ; CHECK-NEXT:    ret
 175   %a = load <8 x float>, ptr %x
 176   %b = load <8 x float>, ptr %y
 177   %c = fpext <8 x float> %a to <8 x double>
 178   %d = fpext <8 x float> %b to <8 x double>
 179   %e = fsub <8 x double> %c, %d
 180   ret <8 x double> %e
 181 }
 182
 183 define <16 x double> @vfwsub_v16f32(ptr %x, ptr %y) {
 184 ; CHECK-LABEL: vfwsub_v16f32:
 185 ; CHECK:       # %bb.0:
 186 ; CHECK-NEXT:    vsetivli zero, 16, e32, m4, ta, ma
 187 ; CHECK-NEXT:    vle32.v v16, (a0)
 188 ; CHECK-NEXT:    vle32.v v20, (a1)
 189 ; CHECK-NEXT:    vfwsub.vv v8, v16, v20
 190 ; CHECK-NEXT:    ret
 191   %a = load <16 x float>, ptr %x
 192   %b = load <16 x float>, ptr %y
 193   %c = fpext <16 x float> %a to <16 x double>
 194   %d = fpext <16 x float> %b to <16 x double>
 195   %e = fsub <16 x double> %c, %d
 196   ret <16 x double> %e
 197 }
 198
 199 define <32 x double> @vfwsub_v32f32(ptr %x, ptr %y) {
 200 ; CHECK-LABEL: vfwsub_v32f32:
 201 ; CHECK:       # %bb.0:
 202 ; CHECK-NEXT:    addi sp, sp, -16
 203 ; CHECK-NEXT:    .cfi_def_cfa_offset 16
 204 ; CHECK-NEXT:    csrr a2, vlenb
 205 ; CHECK-NEXT:    slli a2, a2, 4
 206 ; CHECK-NEXT:    sub sp, sp, a2
 207 ; CHECK-NEXT:    .cfi_escape 0x0f, 0x0d, 0x72, 0x00, 0x11, 0x10, 0x22, 0x11, 0x10, 0x92, 0xa2, 0x38, 0x00, 0x1e, 0x22 # sp + 16 + 16 * vlenb
 208 ; CHECK-NEXT:    li a2, 32
 209 ; CHECK-NEXT:    vsetvli zero, a2, e32, m8, ta, ma
 210 ; CHECK-NEXT:    vle32.v v8, (a0)
 211 ; CHECK-NEXT:    addi a0, sp, 16
 212 ; CHECK-NEXT:    vs8r.v v8, (a0) # Unknown-size Folded Spill
 213 ; CHECK-NEXT:    vle32.v v0, (a1)
 214 ; CHECK-NEXT:    vsetivli zero, 16, e32, m8, ta, ma
 215 ; CHECK-NEXT:    vslidedown.vi v16, v8, 16
 216 ; CHECK-NEXT:    vslidedown.vi v8, v0, 16
 217 ; CHECK-NEXT:    vsetivli zero, 16, e32, m4, ta, ma
 218 ; CHECK-NEXT:    vfwsub.vv v24, v16, v8
 219 ; CHECK-NEXT:    csrr a0, vlenb
 220 ; CHECK-NEXT:    slli a0, a0, 3
 221 ; CHECK-NEXT:    add a0, sp, a0
 222 ; CHECK-NEXT:    addi a0, a0, 16
 223 ; CHECK-NEXT:    vs8r.v v24, (a0) # Unknown-size Folded Spill
 224 ; CHECK-NEXT:    addi a0, sp, 16
 225 ; CHECK-NEXT:    vl8r.v v16, (a0) # Unknown-size Folded Reload
 226 ; CHECK-NEXT:    vfwsub.vv v8, v16, v0
 227 ; CHECK-NEXT:    csrr a0, vlenb
 228 ; CHECK-NEXT:    slli a0, a0, 3
 229 ; CHECK-NEXT:    add a0, sp, a0
 230 ; CHECK-NEXT:    addi a0, a0, 16
 231 ; CHECK-NEXT:    vl8r.v v16, (a0) # Unknown-size Folded Reload
 232 ; CHECK-NEXT:    csrr a0, vlenb
 233 ; CHECK-NEXT:    slli a0, a0, 4
 234 ; CHECK-NEXT:    add sp, sp, a0
 235 ; CHECK-NEXT:    addi sp, sp, 16
 236 ; CHECK-NEXT:    ret
 237   %a = load <32 x float>, ptr %x
 238   %b = load <32 x float>, ptr %y
 239   %c = fpext <32 x float> %a to <32 x double>
 240   %d = fpext <32 x float> %b to <32 x double>
 241   %e = fsub <32 x double> %c, %d
 242   ret <32 x double> %e
 243 }
 244
 245 define <2 x float> @vfwsub_vf_v2f16(ptr %x, half %y) {
 246 ; CHECK-LABEL: vfwsub_vf_v2f16:
 247 ; CHECK:       # %bb.0:
 248 ; CHECK-NEXT:    vsetivli zero, 2, e16, mf4, ta, ma
 249 ; CHECK-NEXT:    vle16.v v9, (a0)
 250 ; CHECK-NEXT:    vfwsub.vf v8, v9, fa0
 251 ; CHECK-NEXT:    ret
 252   %a = load <2 x half>, ptr %x
 253   %b = insertelement <2 x half> poison, half %y, i32 0
 254   %c = shufflevector <2 x half> %b, <2 x half> poison, <2 x i32> zeroinitializer
 255   %d = fpext <2 x half> %a to <2 x float>
 256   %e = fpext <2 x half> %c to <2 x float>
 257   %f = fsub <2 x float> %d, %e
 258   ret <2 x float> %f
 259 }
 260
 261 define <4 x float> @vfwsub_vf_v4f16(ptr %x, half %y) {
 262 ; CHECK-LABEL: vfwsub_vf_v4f16:
 263 ; CHECK:       # %bb.0:
 264 ; CHECK-NEXT:    vsetivli zero, 4, e16, mf2, ta, ma
 265 ; CHECK-NEXT:    vle16.v v9, (a0)
 266 ; CHECK-NEXT:    vfwsub.vf v8, v9, fa0
 267 ; CHECK-NEXT:    ret
 268   %a = load <4 x half>, ptr %x
 269   %b = insertelement <4 x half> poison, half %y, i32 0
 270   %c = shufflevector <4 x half> %b, <4 x half> poison, <4 x i32> zeroinitializer
 271   %d = fpext <4 x half> %a to <4 x float>
 272   %e = fpext <4 x half> %c to <4 x float>
 273   %f = fsub <4 x float> %d, %e
 274   ret <4 x float> %f
 275 }
 276
 277 define <8 x float> @vfwsub_vf_v8f16(ptr %x, half %y) {
 278 ; CHECK-LABEL: vfwsub_vf_v8f16:
 279 ; CHECK:       # %bb.0:
 280 ; CHECK-NEXT:    vsetivli zero, 8, e16, m1, ta, ma
 281 ; CHECK-NEXT:    vle16.v v10, (a0)
 282 ; CHECK-NEXT:    vfwsub.vf v8, v10, fa0
 283 ; CHECK-NEXT:    ret
 284   %a = load <8 x half>, ptr %x
 285   %b = insertelement <8 x half> poison, half %y, i32 0
 286   %c = shufflevector <8 x half> %b, <8 x half> poison, <8 x i32> zeroinitializer
 287   %d = fpext <8 x half> %a to <8 x float>
 288   %e = fpext <8 x half> %c to <8 x float>
 289   %f = fsub <8 x float> %d, %e
 290   ret <8 x float> %f
 291 }
 292
 293 define <16 x float> @vfwsub_vf_v16f16(ptr %x, half %y) {
 294 ; CHECK-LABEL: vfwsub_vf_v16f16:
 295 ; CHECK:       # %bb.0:
 296 ; CHECK-NEXT:    vsetivli zero, 16, e16, m2, ta, ma
 297 ; CHECK-NEXT:    vle16.v v12, (a0)
 298 ; CHECK-NEXT:    vfwsub.vf v8, v12, fa0
 299 ; CHECK-NEXT:    ret
 300   %a = load <16 x half>, ptr %x
 301   %b = insertelement <16 x half> poison, half %y, i32 0
 302   %c = shufflevector <16 x half> %b, <16 x half> poison, <16 x i32> zeroinitializer
 303   %d = fpext <16 x half> %a to <16 x float>
 304   %e = fpext <16 x half> %c to <16 x float>
 305   %f = fsub <16 x float> %d, %e
 306   ret <16 x float> %f
 307 }
 308
 309 define <32 x float> @vfwsub_vf_v32f16(ptr %x, half %y) {
 310 ; CHECK-LABEL: vfwsub_vf_v32f16:
 311 ; CHECK:       # %bb.0:
 312 ; CHECK-NEXT:    li a1, 32
 313 ; CHECK-NEXT:    vsetvli zero, a1, e16, m4, ta, ma
 314 ; CHECK-NEXT:    vle16.v v16, (a0)
 315 ; CHECK-NEXT:    vfwsub.vf v8, v16, fa0
 316 ; CHECK-NEXT:    ret
 317   %a = load <32 x half>, ptr %x
 318   %b = insertelement <32 x half> poison, half %y, i32 0
 319   %c = shufflevector <32 x half> %b, <32 x half> poison, <32 x i32> zeroinitializer
 320   %d = fpext <32 x half> %a to <32 x float>
 321   %e = fpext <32 x half> %c to <32 x float>
 322   %f = fsub <32 x float> %d, %e
 323   ret <32 x float> %f
 324 }
 325
 326 define <2 x double> @vfwsub_vf_v2f32(ptr %x, float %y) {
 327 ; CHECK-LABEL: vfwsub_vf_v2f32:
 328 ; CHECK:       # %bb.0:
 329 ; CHECK-NEXT:    vsetivli zero, 2, e32, mf2, ta, ma
 330 ; CHECK-NEXT:    vle32.v v9, (a0)
 331 ; CHECK-NEXT:    vfwsub.vf v8, v9, fa0
 332 ; CHECK-NEXT:    ret
 333   %a = load <2 x float>, ptr %x
 334   %b = insertelement <2 x float> poison, float %y, i32 0
 335   %c = shufflevector <2 x float> %b, <2 x float> poison, <2 x i32> zeroinitializer
 336   %d = fpext <2 x float> %a to <2 x double>
 337   %e = fpext <2 x float> %c to <2 x double>
 338   %f = fsub <2 x double> %d, %e
 339   ret <2 x double> %f
 340 }
 341
 342 define <4 x double> @vfwsub_vf_v4f32(ptr %x, float %y) {
 343 ; CHECK-LABEL: vfwsub_vf_v4f32:
 344 ; CHECK:       # %bb.0:
 345 ; CHECK-NEXT:    vsetivli zero, 4, e32, m1, ta, ma
 346 ; CHECK-NEXT:    vle32.v v10, (a0)
 347 ; CHECK-NEXT:    vfwsub.vf v8, v10, fa0
 348 ; CHECK-NEXT:    ret
 349   %a = load <4 x float>, ptr %x
 350   %b = insertelement <4 x float> poison, float %y, i32 0
 351   %c = shufflevector <4 x float> %b, <4 x float> poison, <4 x i32> zeroinitializer
 352   %d = fpext <4 x float> %a to <4 x double>
 353   %e = fpext <4 x float> %c to <4 x double>
 354   %f = fsub <4 x double> %d, %e
 355   ret <4 x double> %f
 356 }
 357
 358 define <8 x double> @vfwsub_vf_v8f32(ptr %x, float %y) {
 359 ; CHECK-LABEL: vfwsub_vf_v8f32:
 360 ; CHECK:       # %bb.0:
 361 ; CHECK-NEXT:    vsetivli zero, 8, e32, m2, ta, ma
 362 ; CHECK-NEXT:    vle32.v v12, (a0)
 363 ; CHECK-NEXT:    vfwsub.vf v8, v12, fa0
 364 ; CHECK-NEXT:    ret
 365   %a = load <8 x float>, ptr %x
 366   %b = insertelement <8 x float> poison, float %y, i32 0
 367   %c = shufflevector <8 x float> %b, <8 x float> poison, <8 x i32> zeroinitializer
 368   %d = fpext <8 x float> %a to <8 x double>
 369   %e = fpext <8 x float> %c to <8 x double>
 370   %f = fsub <8 x double> %d, %e
 371   ret <8 x double> %f
 372 }
 373
 374 define <16 x double> @vfwsub_vf_v16f32(ptr %x, float %y) {
 375 ; CHECK-LABEL: vfwsub_vf_v16f32:
 376 ; CHECK:       # %bb.0:
 377 ; CHECK-NEXT:    vsetivli zero, 16, e32, m4, ta, ma
 378 ; CHECK-NEXT:    vle32.v v16, (a0)
 379 ; CHECK-NEXT:    vfwsub.vf v8, v16, fa0
 380 ; CHECK-NEXT:    ret
 381   %a = load <16 x float>, ptr %x
 382   %b = insertelement <16 x float> poison, float %y, i32 0
 383   %c = shufflevector <16 x float> %b, <16 x float> poison, <16 x i32> zeroinitializer
 384   %d = fpext <16 x float> %a to <16 x double>
 385   %e = fpext <16 x float> %c to <16 x double>
 386   %f = fsub <16 x double> %d, %e
 387   ret <16 x double> %f
 388 }
 389
 390 define <32 x double> @vfwsub_vf_v32f32(ptr %x, float %y) {
 391 ; CHECK-LABEL: vfwsub_vf_v32f32:
 392 ; CHECK:       # %bb.0:
 393 ; CHECK-NEXT:    li a1, 32
 394 ; CHECK-NEXT:    vsetvli zero, a1, e32, m8, ta, ma
 395 ; CHECK-NEXT:    vle32.v v24, (a0)
 396 ; CHECK-NEXT:    vsetivli zero, 16, e32, m8, ta, ma
 397 ; CHECK-NEXT:    vslidedown.vi v8, v24, 16
 398 ; CHECK-NEXT:    vsetivli zero, 16, e32, m4, ta, ma
 399 ; CHECK-NEXT:    vfwsub.vf v16, v8, fa0
 400 ; CHECK-NEXT:    vfwsub.vf v8, v24, fa0
 401 ; CHECK-NEXT:    ret
 402   %a = load <32 x float>, ptr %x
 403   %b = insertelement <32 x float> poison, float %y, i32 0
 404   %c = shufflevector <32 x float> %b, <32 x float> poison, <32 x i32> zeroinitializer
 405   %d = fpext <32 x float> %a to <32 x double>
 406   %e = fpext <32 x float> %c to <32 x double>
 407   %f = fsub <32 x double> %d, %e
 408   ret <32 x double> %f
 409 }
 410
 411 define <2 x float> @vfwsub_wv_v2f16(ptr %x, ptr %y) {
 412 ; CHECK-LABEL: vfwsub_wv_v2f16:
 413 ; CHECK:       # %bb.0:
 414 ; CHECK-NEXT:    vsetivli zero, 2, e16, mf4, ta, ma
 415 ; CHECK-NEXT:    vle32.v v8, (a0)
 416 ; CHECK-NEXT:    vle16.v v9, (a1)
 417 ; CHECK-NEXT:    vfwsub.wv v8, v8, v9
 418 ; CHECK-NEXT:    ret
 419   %a = load <2 x float>, ptr %x
 420   %b = load <2 x half>, ptr %y
 421   %c = fpext <2 x half> %b to <2 x float>
 422   %d = fsub <2 x float> %a, %c
 423   ret <2 x float> %d
 424 }
 425
 426 define <4 x float> @vfwsub_wv_v4f16(ptr %x, ptr %y) {
 427 ; CHECK-LABEL: vfwsub_wv_v4f16:
 428 ; CHECK:       # %bb.0:
 429 ; CHECK-NEXT:    vsetivli zero, 4, e16, mf2, ta, ma
 430 ; CHECK-NEXT:    vle32.v v8, (a0)
 431 ; CHECK-NEXT:    vle16.v v9, (a1)
 432 ; CHECK-NEXT:    vfwsub.wv v8, v8, v9
 433 ; CHECK-NEXT:    ret
 434   %a = load <4 x float>, ptr %x
 435   %b = load <4 x half>, ptr %y
 436   %c = fpext <4 x half> %b to <4 x float>
 437   %d = fsub <4 x float> %a, %c
 438   ret <4 x float> %d
 439 }
 440
 441 define <8 x float> @vfwsub_wv_v8f16(ptr %x, ptr %y) {
 442 ; CHECK-LABEL: vfwsub_wv_v8f16:
 443 ; CHECK:       # %bb.0:
 444 ; CHECK-NEXT:    vsetivli zero, 8, e16, m1, ta, ma
 445 ; CHECK-NEXT:    vle32.v v8, (a0)
 446 ; CHECK-NEXT:    vle16.v v10, (a1)
 447 ; CHECK-NEXT:    vfwsub.wv v8, v8, v10
 448 ; CHECK-NEXT:    ret
 449   %a = load <8 x float>, ptr %x
 450   %b = load <8 x half>, ptr %y
 451   %c = fpext <8 x half> %b to <8 x float>
 452   %d = fsub <8 x float> %a, %c
 453   ret <8 x float> %d
 454 }
 455
 456 define <16 x float> @vfwsub_wv_v16f16(ptr %x, ptr %y) {
 457 ; CHECK-LABEL: vfwsub_wv_v16f16:
 458 ; CHECK:       # %bb.0:
 459 ; CHECK-NEXT:    vsetivli zero, 16, e16, m2, ta, ma
 460 ; CHECK-NEXT:    vle32.v v8, (a0)
 461 ; CHECK-NEXT:    vle16.v v12, (a1)
 462 ; CHECK-NEXT:    vfwsub.wv v8, v8, v12
 463 ; CHECK-NEXT:    ret
 464   %a = load <16 x float>, ptr %x
 465   %b = load <16 x half>, ptr %y
 466   %c = fpext <16 x half> %b to <16 x float>
 467   %d = fsub <16 x float> %a, %c
 468   ret <16 x float> %d
 469 }
 470
 471 define <32 x float> @vfwsub_wv_v32f16(ptr %x, ptr %y) {
 472 ; CHECK-LABEL: vfwsub_wv_v32f16:
 473 ; CHECK:       # %bb.0:
 474 ; CHECK-NEXT:    li a2, 32
 475 ; CHECK-NEXT:    vsetvli zero, a2, e16, m4, ta, ma
 476 ; CHECK-NEXT:    vle32.v v8, (a0)
 477 ; CHECK-NEXT:    vle16.v v16, (a1)
 478 ; CHECK-NEXT:    vfwsub.wv v8, v8, v16
 479 ; CHECK-NEXT:    ret
 480   %a = load <32 x float>, ptr %x
 481   %b = load <32 x half>, ptr %y
 482   %c = fpext <32 x half> %b to <32 x float>
 483   %d = fsub <32 x float> %a, %c
 484   ret <32 x float> %d
 485 }
 486
 487 define <2 x double> @vfwsub_wv_v2f32(ptr %x, ptr %y) {
 488 ; CHECK-LABEL: vfwsub_wv_v2f32:
 489 ; CHECK:       # %bb.0:
 490 ; CHECK-NEXT:    vsetivli zero, 2, e32, mf2, ta, ma
 491 ; CHECK-NEXT:    vle64.v v8, (a0)
 492 ; CHECK-NEXT:    vle32.v v9, (a1)
 493 ; CHECK-NEXT:    vfwsub.wv v8, v8, v9
 494 ; CHECK-NEXT:    ret
 495   %a = load <2 x double>, ptr %x
 496   %b = load <2 x float>, ptr %y
 497   %c = fpext <2 x float> %b to <2 x double>
 498   %d = fsub <2 x double> %a, %c
 499   ret <2 x double> %d
 500 }
 501
 502 define <4 x double> @vfwsub_wv_v4f32(ptr %x, ptr %y) {
 503 ; CHECK-LABEL: vfwsub_wv_v4f32:
 504 ; CHECK:       # %bb.0:
 505 ; CHECK-NEXT:    vsetivli zero, 4, e32, m1, ta, ma
 506 ; CHECK-NEXT:    vle64.v v8, (a0)
 507 ; CHECK-NEXT:    vle32.v v10, (a1)
 508 ; CHECK-NEXT:    vfwsub.wv v8, v8, v10
 509 ; CHECK-NEXT:    ret
 510   %a = load <4 x double>, ptr %x
 511   %b = load <4 x float>, ptr %y
 512   %c = fpext <4 x float> %b to <4 x double>
 513   %d = fsub <4 x double> %a, %c
 514   ret <4 x double> %d
 515 }
 516
 517 define <8 x double> @vfwsub_wv_v8f32(ptr %x, ptr %y) {
 518 ; CHECK-LABEL: vfwsub_wv_v8f32:
 519 ; CHECK:       # %bb.0:
 520 ; CHECK-NEXT:    vsetivli zero, 8, e32, m2, ta, ma
 521 ; CHECK-NEXT:    vle64.v v8, (a0)
 522 ; CHECK-NEXT:    vle32.v v12, (a1)
 523 ; CHECK-NEXT:    vfwsub.wv v8, v8, v12
 524 ; CHECK-NEXT:    ret
 525   %a = load <8 x double>, ptr %x
 526   %b = load <8 x float>, ptr %y
 527   %c = fpext <8 x float> %b to <8 x double>
 528   %d = fsub <8 x double> %a, %c
 529   ret <8 x double> %d
 530 }
 531
 532 define <16 x double> @vfwsub_wv_v16f32(ptr %x, ptr %y) {
 533 ; CHECK-LABEL: vfwsub_wv_v16f32:
 534 ; CHECK:       # %bb.0:
 535 ; CHECK-NEXT:    vsetivli zero, 16, e32, m4, ta, ma
 536 ; CHECK-NEXT:    vle64.v v8, (a0)
 537 ; CHECK-NEXT:    vle32.v v16, (a1)
 538 ; CHECK-NEXT:    vfwsub.wv v8, v8, v16
 539 ; CHECK-NEXT:    ret
 540   %a = load <16 x double>, ptr %x
 541   %b = load <16 x float>, ptr %y
 542   %c = fpext <16 x float> %b to <16 x double>
 543   %d = fsub <16 x double> %a, %c
 544   ret <16 x double> %d
 545 }
 546
 547 define <2 x float> @vfwsub_wf_v2f16(ptr %x, half %y) {
 548 ; CHECK-LABEL: vfwsub_wf_v2f16:
 549 ; CHECK:       # %bb.0:
 550 ; CHECK-NEXT:    vsetivli zero, 2, e16, mf4, ta, ma
 551 ; CHECK-NEXT:    vle32.v v8, (a0)
 552 ; CHECK-NEXT:    vfwsub.wf v8, v8, fa0
 553 ; CHECK-NEXT:    ret
 554   %a = load <2 x float>, ptr %x
 555   %b = insertelement <2 x half> poison, half %y, i32 0
 556   %c = shufflevector <2 x half> %b, <2 x half> poison, <2 x i32> zeroinitializer
 557   %d = fpext <2 x half> %c to <2 x float>
 558   %e = fsub <2 x float> %a, %d
 559   ret <2 x float> %e
 560 }
 561
 562 define <4 x float> @vfwsub_wf_v4f16(ptr %x, half %y) {
 563 ; CHECK-LABEL: vfwsub_wf_v4f16:
 564 ; CHECK:       # %bb.0:
 565 ; CHECK-NEXT:    vsetivli zero, 4, e16, mf2, ta, ma
 566 ; CHECK-NEXT:    vle32.v v8, (a0)
 567 ; CHECK-NEXT:    vfwsub.wf v8, v8, fa0
 568 ; CHECK-NEXT:    ret
 569   %a = load <4 x float>, ptr %x
 570   %b = insertelement <4 x half> poison, half %y, i32 0
 571   %c = shufflevector <4 x half> %b, <4 x half> poison, <4 x i32> zeroinitializer
 572   %d = fpext <4 x half> %c to <4 x float>
 573   %e = fsub <4 x float> %a, %d
 574   ret <4 x float> %e
 575 }
 576
 577 define <8 x float> @vfwsub_wf_v8f16(ptr %x, half %y) {
 578 ; CHECK-LABEL: vfwsub_wf_v8f16:
 579 ; CHECK:       # %bb.0:
 580 ; CHECK-NEXT:    vsetivli zero, 8, e16, m1, ta, ma
 581 ; CHECK-NEXT:    vle32.v v8, (a0)
 582 ; CHECK-NEXT:    vfwsub.wf v8, v8, fa0
 583 ; CHECK-NEXT:    ret
 584   %a = load <8 x float>, ptr %x
 585   %b = insertelement <8 x half> poison, half %y, i32 0
 586   %c = shufflevector <8 x half> %b, <8 x half> poison, <8 x i32> zeroinitializer
 587   %d = fpext <8 x half> %c to <8 x float>
 588   %e = fsub <8 x float> %a, %d
 589   ret <8 x float> %e
 590 }
 591
 592 define <16 x float> @vfwsub_wf_v16f16(ptr %x, half %y) {
 593 ; CHECK-LABEL: vfwsub_wf_v16f16:
 594 ; CHECK:       # %bb.0:
 595 ; CHECK-NEXT:    vsetivli zero, 16, e16, m2, ta, ma
 596 ; CHECK-NEXT:    vle32.v v8, (a0)
 597 ; CHECK-NEXT:    vfwsub.wf v8, v8, fa0
 598 ; CHECK-NEXT:    ret
 599   %a = load <16 x float>, ptr %x
 600   %b = insertelement <16 x half> poison, half %y, i32 0
 601   %c = shufflevector <16 x half> %b, <16 x half> poison, <16 x i32> zeroinitializer
 602   %d = fpext <16 x half> %c to <16 x float>
 603   %e = fsub <16 x float> %a, %d
 604   ret <16 x float> %e
 605 }
 606
 607 define <2 x double> @vfwsub_wf_v2f32(ptr %x, float %y) {
 608 ; CHECK-LABEL: vfwsub_wf_v2f32:
 609 ; CHECK:       # %bb.0:
 610 ; CHECK-NEXT:    vsetivli zero, 2, e32, mf2, ta, ma
 611 ; CHECK-NEXT:    vle64.v v8, (a0)
 612 ; CHECK-NEXT:    vfwsub.wf v8, v8, fa0
 613 ; CHECK-NEXT:    ret
 614   %a = load <2 x double>, ptr %x
 615   %b = insertelement <2 x float> poison, float %y, i32 0
 616   %c = shufflevector <2 x float> %b, <2 x float> poison, <2 x i32> zeroinitializer
 617   %d = fpext <2 x float> %c to <2 x double>
 618   %e = fsub <2 x double> %a, %d
 619   ret <2 x double> %e
 620 }
 621
 622 define <4 x double> @vfwsub_wf_v4f32(ptr %x, float %y) {
 623 ; CHECK-LABEL: vfwsub_wf_v4f32:
 624 ; CHECK:       # %bb.0:
 625 ; CHECK-NEXT:    vsetivli zero, 4, e32, m1, ta, ma
 626 ; CHECK-NEXT:    vle64.v v8, (a0)
 627 ; CHECK-NEXT:    vfwsub.wf v8, v8, fa0
 628 ; CHECK-NEXT:    ret
 629   %a = load <4 x double>, ptr %x
 630   %b = insertelement <4 x float> poison, float %y, i32 0
 631   %c = shufflevector <4 x float> %b, <4 x float> poison, <4 x i32> zeroinitializer
 632   %d = fpext <4 x float> %c to <4 x double>
 633   %e = fsub <4 x double> %a, %d
 634   ret <4 x double> %e
 635 }
 636
 637 define <8 x double> @vfwsub_wf_v8f32(ptr %x, float %y) {
 638 ; CHECK-LABEL: vfwsub_wf_v8f32:
 639 ; CHECK:       # %bb.0:
 640 ; CHECK-NEXT:    vsetivli zero, 8, e32, m2, ta, ma
 641 ; CHECK-NEXT:    vle64.v v8, (a0)
 642 ; CHECK-NEXT:    vfwsub.wf v8, v8, fa0
 643 ; CHECK-NEXT:    ret
 644   %a = load <8 x double>, ptr %x
 645   %b = insertelement <8 x float> poison, float %y, i32 0
 646   %c = shufflevector <8 x float> %b, <8 x float> poison, <8 x i32> zeroinitializer
 647   %d = fpext <8 x float> %c to <8 x double>
 648   %e = fsub <8 x double> %a, %d
 649   ret <8 x double> %e
 650 }
 651
 652 define <16 x double> @vfwsub_wf_v16f32(ptr %x, float %y) {
 653 ; CHECK-LABEL: vfwsub_wf_v16f32:
 654 ; CHECK:       # %bb.0:
 655 ; CHECK-NEXT:    vsetivli zero, 16, e32, m4, ta, ma
 656 ; CHECK-NEXT:    vle64.v v8, (a0)
 657 ; CHECK-NEXT:    vfwsub.wf v8, v8, fa0
 658 ; CHECK-NEXT:    ret
 659   %a = load <16 x double>, ptr %x
 660   %b = insertelement <16 x float> poison, float %y, i32 0
 661   %c = shufflevector <16 x float> %b, <16 x float> poison, <16 x i32> zeroinitializer
 662   %d = fpext <16 x float> %c to <16 x double>
 663   %e = fsub <16 x double> %a, %d
 664   ret <16 x double> %e
 665 }