llvm/test/CodeGen/RISCV/rvv/fixed-vectors-fp-conv.ll

   1 ; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
   2 ; RUN: llc -mtriple=riscv32 -target-abi=ilp32d -mattr=+v,+zfh,+zvfh,+f,+d -riscv-v-fixed-length-vector-lmul-max=8 -verify-machineinstrs < %s | FileCheck %s --check-prefixes=CHECK,LMULMAX8
   3 ; RUN: llc -mtriple=riscv64 -target-abi=lp64d -mattr=+v,+zfh,+zvfh,+f,+d -riscv-v-fixed-length-vector-lmul-max=8 -verify-machineinstrs < %s | FileCheck %s --check-prefixes=CHECK,LMULMAX8
   4 ; RUN: llc -mtriple=riscv32 -target-abi=ilp32d -mattr=+v,+zfh,+zvfh,+f,+d -riscv-v-fixed-length-vector-lmul-max=1 -verify-machineinstrs < %s | FileCheck %s --check-prefixes=CHECK,LMULMAX1
   5 ; RUN: llc -mtriple=riscv64 -target-abi=lp64d -mattr=+v,+zfh,+zvfh,+f,+d -riscv-v-fixed-length-vector-lmul-max=1 -verify-machineinstrs < %s | FileCheck %s --check-prefixes=CHECK,LMULMAX1
   6
   7 define void @fpext_v2f16_v2f32(ptr %x, ptr %y) {
   8 ; CHECK-LABEL: fpext_v2f16_v2f32:
   9 ; CHECK:       # %bb.0:
  10 ; CHECK-NEXT:    vsetivli zero, 2, e16, mf4, ta, ma
  11 ; CHECK-NEXT:    vle16.v v8, (a0)
  12 ; CHECK-NEXT:    vfwcvt.f.f.v v9, v8
  13 ; CHECK-NEXT:    vse32.v v9, (a1)
  14 ; CHECK-NEXT:    ret
  15   %a = load <2 x half>, ptr %x
  16   %d = fpext <2 x half> %a to <2 x float>
  17   store <2 x float> %d, ptr %y
  18   ret void
  19 }
  20
  21 define void @fpext_v2f16_v2f64(ptr %x, ptr %y) {
  22 ; CHECK-LABEL: fpext_v2f16_v2f64:
  23 ; CHECK:       # %bb.0:
  24 ; CHECK-NEXT:    vsetivli zero, 2, e16, mf4, ta, ma
  25 ; CHECK-NEXT:    vle16.v v8, (a0)
  26 ; CHECK-NEXT:    vfwcvt.f.f.v v9, v8
  27 ; CHECK-NEXT:    vsetvli zero, zero, e32, mf2, ta, ma
  28 ; CHECK-NEXT:    vfwcvt.f.f.v v8, v9
  29 ; CHECK-NEXT:    vse64.v v8, (a1)
  30 ; CHECK-NEXT:    ret
  31   %a = load <2 x half>, ptr %x
  32   %d = fpext <2 x half> %a to <2 x double>
  33   store <2 x double> %d, ptr %y
  34   ret void
  35 }
  36
  37 define void @fpext_v8f16_v8f32(ptr %x, ptr %y) {
  38 ; LMULMAX8-LABEL: fpext_v8f16_v8f32:
  39 ; LMULMAX8:       # %bb.0:
  40 ; LMULMAX8-NEXT:    vsetivli zero, 8, e16, m1, ta, ma
  41 ; LMULMAX8-NEXT:    vle16.v v8, (a0)
  42 ; LMULMAX8-NEXT:    vfwcvt.f.f.v v10, v8
  43 ; LMULMAX8-NEXT:    vse32.v v10, (a1)
  44 ; LMULMAX8-NEXT:    ret
  45 ;
  46 ; LMULMAX1-LABEL: fpext_v8f16_v8f32:
  47 ; LMULMAX1:       # %bb.0:
  48 ; LMULMAX1-NEXT:    vsetivli zero, 8, e16, m1, ta, ma
  49 ; LMULMAX1-NEXT:    vle16.v v8, (a0)
  50 ; LMULMAX1-NEXT:    vsetivli zero, 4, e16, mf2, ta, ma
  51 ; LMULMAX1-NEXT:    vfwcvt.f.f.v v9, v8
  52 ; LMULMAX1-NEXT:    vsetivli zero, 4, e16, m1, ta, ma
  53 ; LMULMAX1-NEXT:    vslidedown.vi v8, v8, 4
  54 ; LMULMAX1-NEXT:    vsetivli zero, 4, e16, mf2, ta, ma
  55 ; LMULMAX1-NEXT:    vfwcvt.f.f.v v10, v8
  56 ; LMULMAX1-NEXT:    addi a0, a1, 16
  57 ; LMULMAX1-NEXT:    vse32.v v10, (a0)
  58 ; LMULMAX1-NEXT:    vse32.v v9, (a1)
  59 ; LMULMAX1-NEXT:    ret
  60   %a = load <8 x half>, ptr %x
  61   %d = fpext <8 x half> %a to <8 x float>
  62   store <8 x float> %d, ptr %y
  63   ret void
  64 }
  65
  66 define void @fpext_v8f16_v8f64(ptr %x, ptr %y) {
  67 ; LMULMAX8-LABEL: fpext_v8f16_v8f64:
  68 ; LMULMAX8:       # %bb.0:
  69 ; LMULMAX8-NEXT:    vsetivli zero, 8, e16, m1, ta, ma
  70 ; LMULMAX8-NEXT:    vle16.v v8, (a0)
  71 ; LMULMAX8-NEXT:    vfwcvt.f.f.v v10, v8
  72 ; LMULMAX8-NEXT:    vsetvli zero, zero, e32, m2, ta, ma
  73 ; LMULMAX8-NEXT:    vfwcvt.f.f.v v12, v10
  74 ; LMULMAX8-NEXT:    vse64.v v12, (a1)
  75 ; LMULMAX8-NEXT:    ret
  76 ;
  77 ; LMULMAX1-LABEL: fpext_v8f16_v8f64:
  78 ; LMULMAX1:       # %bb.0:
  79 ; LMULMAX1-NEXT:    vsetivli zero, 8, e16, m1, ta, ma
  80 ; LMULMAX1-NEXT:    vle16.v v8, (a0)
  81 ; LMULMAX1-NEXT:    vsetivli zero, 2, e16, mf2, ta, ma
  82 ; LMULMAX1-NEXT:    vslidedown.vi v9, v8, 2
  83 ; LMULMAX1-NEXT:    vsetivli zero, 2, e16, mf4, ta, ma
  84 ; LMULMAX1-NEXT:    vfwcvt.f.f.v v10, v9
  85 ; LMULMAX1-NEXT:    vsetvli zero, zero, e32, mf2, ta, ma
  86 ; LMULMAX1-NEXT:    vfwcvt.f.f.v v9, v10
  87 ; LMULMAX1-NEXT:    vsetvli zero, zero, e16, mf4, ta, ma
  88 ; LMULMAX1-NEXT:    vfwcvt.f.f.v v10, v8
  89 ; LMULMAX1-NEXT:    vsetvli zero, zero, e32, mf2, ta, ma
  90 ; LMULMAX1-NEXT:    vfwcvt.f.f.v v11, v10
  91 ; LMULMAX1-NEXT:    vsetivli zero, 4, e16, m1, ta, ma
  92 ; LMULMAX1-NEXT:    vslidedown.vi v8, v8, 4
  93 ; LMULMAX1-NEXT:    vsetivli zero, 2, e16, mf4, ta, ma
  94 ; LMULMAX1-NEXT:    vfwcvt.f.f.v v10, v8
  95 ; LMULMAX1-NEXT:    vsetvli zero, zero, e32, mf2, ta, ma
  96 ; LMULMAX1-NEXT:    vfwcvt.f.f.v v12, v10
  97 ; LMULMAX1-NEXT:    vsetivli zero, 2, e16, mf2, ta, ma
  98 ; LMULMAX1-NEXT:    vslidedown.vi v8, v8, 2
  99 ; LMULMAX1-NEXT:    vsetivli zero, 2, e16, mf4, ta, ma
 100 ; LMULMAX1-NEXT:    vfwcvt.f.f.v v10, v8
 101 ; LMULMAX1-NEXT:    vsetvli zero, zero, e32, mf2, ta, ma
 102 ; LMULMAX1-NEXT:    vfwcvt.f.f.v v8, v10
 103 ; LMULMAX1-NEXT:    addi a0, a1, 48
 104 ; LMULMAX1-NEXT:    vse64.v v8, (a0)
 105 ; LMULMAX1-NEXT:    addi a0, a1, 32
 106 ; LMULMAX1-NEXT:    vse64.v v12, (a0)
 107 ; LMULMAX1-NEXT:    vse64.v v11, (a1)
 108 ; LMULMAX1-NEXT:    addi a1, a1, 16
 109 ; LMULMAX1-NEXT:    vse64.v v9, (a1)
 110 ; LMULMAX1-NEXT:    ret
 111   %a = load <8 x half>, ptr %x
 112   %d = fpext <8 x half> %a to <8 x double>
 113   store <8 x double> %d, ptr %y
 114   ret void
 115 }
 116
 117 define void @fpround_v2f32_v2f16(ptr %x, ptr %y) {
 118 ; CHECK-LABEL: fpround_v2f32_v2f16:
 119 ; CHECK:       # %bb.0:
 120 ; CHECK-NEXT:    vsetivli zero, 2, e16, mf4, ta, ma
 121 ; CHECK-NEXT:    vle32.v v8, (a0)
 122 ; CHECK-NEXT:    vfncvt.f.f.w v9, v8
 123 ; CHECK-NEXT:    vse16.v v9, (a1)
 124 ; CHECK-NEXT:    ret
 125   %a = load <2 x float>, ptr %x
 126   %d = fptrunc <2 x float> %a to <2 x half>
 127   store <2 x half> %d, ptr %y
 128   ret void
 129 }
 130
 131 define void @fpround_v2f64_v2f16(ptr %x, ptr %y) {
 132 ; CHECK-LABEL: fpround_v2f64_v2f16:
 133 ; CHECK:       # %bb.0:
 134 ; CHECK-NEXT:    vsetivli zero, 2, e32, mf2, ta, ma
 135 ; CHECK-NEXT:    vle64.v v8, (a0)
 136 ; CHECK-NEXT:    vfncvt.rod.f.f.w v9, v8
 137 ; CHECK-NEXT:    vsetvli zero, zero, e16, mf4, ta, ma
 138 ; CHECK-NEXT:    vfncvt.f.f.w v8, v9
 139 ; CHECK-NEXT:    vse16.v v8, (a1)
 140 ; CHECK-NEXT:    ret
 141   %a = load <2 x double>, ptr %x
 142   %d = fptrunc <2 x double> %a to <2 x half>
 143   store <2 x half> %d, ptr %y
 144   ret void
 145 }
 146
 147 define void @fpround_v8f32_v8f16(ptr %x, ptr %y) {
 148 ; LMULMAX8-LABEL: fpround_v8f32_v8f16:
 149 ; LMULMAX8:       # %bb.0:
 150 ; LMULMAX8-NEXT:    vsetivli zero, 8, e16, m1, ta, ma
 151 ; LMULMAX8-NEXT:    vle32.v v8, (a0)
 152 ; LMULMAX8-NEXT:    vfncvt.f.f.w v10, v8
 153 ; LMULMAX8-NEXT:    vse16.v v10, (a1)
 154 ; LMULMAX8-NEXT:    ret
 155 ;
 156 ; LMULMAX1-LABEL: fpround_v8f32_v8f16:
 157 ; LMULMAX1:       # %bb.0:
 158 ; LMULMAX1-NEXT:    addi a2, a0, 16
 159 ; LMULMAX1-NEXT:    vsetivli zero, 4, e16, mf2, ta, ma
 160 ; LMULMAX1-NEXT:    vle32.v v8, (a0)
 161 ; LMULMAX1-NEXT:    vle32.v v9, (a2)
 162 ; LMULMAX1-NEXT:    vfncvt.f.f.w v10, v8
 163 ; LMULMAX1-NEXT:    vfncvt.f.f.w v8, v9
 164 ; LMULMAX1-NEXT:    vsetivli zero, 8, e16, m1, ta, ma
 165 ; LMULMAX1-NEXT:    vslideup.vi v10, v8, 4
 166 ; LMULMAX1-NEXT:    vse16.v v10, (a1)
 167 ; LMULMAX1-NEXT:    ret
 168   %a = load <8 x float>, ptr %x
 169   %d = fptrunc <8 x float> %a to <8 x half>
 170   store <8 x half> %d, ptr %y
 171   ret void
 172 }
 173
 174 define void @fpround_v8f64_v8f16(ptr %x, ptr %y) {
 175 ; LMULMAX8-LABEL: fpround_v8f64_v8f16:
 176 ; LMULMAX8:       # %bb.0:
 177 ; LMULMAX8-NEXT:    vsetivli zero, 8, e32, m2, ta, ma
 178 ; LMULMAX8-NEXT:    vle64.v v8, (a0)
 179 ; LMULMAX8-NEXT:    vfncvt.rod.f.f.w v12, v8
 180 ; LMULMAX8-NEXT:    vsetvli zero, zero, e16, m1, ta, ma
 181 ; LMULMAX8-NEXT:    vfncvt.f.f.w v8, v12
 182 ; LMULMAX8-NEXT:    vse16.v v8, (a1)
 183 ; LMULMAX8-NEXT:    ret
 184 ;
 185 ; LMULMAX1-LABEL: fpround_v8f64_v8f16:
 186 ; LMULMAX1:       # %bb.0:
 187 ; LMULMAX1-NEXT:    addi a2, a0, 48
 188 ; LMULMAX1-NEXT:    vsetivli zero, 2, e32, mf2, ta, ma
 189 ; LMULMAX1-NEXT:    vle64.v v8, (a2)
 190 ; LMULMAX1-NEXT:    addi a2, a0, 32
 191 ; LMULMAX1-NEXT:    vle64.v v9, (a0)
 192 ; LMULMAX1-NEXT:    vle64.v v10, (a2)
 193 ; LMULMAX1-NEXT:    addi a0, a0, 16
 194 ; LMULMAX1-NEXT:    vle64.v v11, (a0)
 195 ; LMULMAX1-NEXT:    vfncvt.rod.f.f.w v12, v9
 196 ; LMULMAX1-NEXT:    vsetvli zero, zero, e16, mf4, ta, ma
 197 ; LMULMAX1-NEXT:    vfncvt.f.f.w v9, v12
 198 ; LMULMAX1-NEXT:    vsetvli zero, zero, e32, mf2, ta, ma
 199 ; LMULMAX1-NEXT:    vfncvt.rod.f.f.w v12, v11
 200 ; LMULMAX1-NEXT:    vsetvli zero, zero, e16, mf4, ta, ma
 201 ; LMULMAX1-NEXT:    vfncvt.f.f.w v11, v12
 202 ; LMULMAX1-NEXT:    vsetivli zero, 4, e16, m1, tu, ma
 203 ; LMULMAX1-NEXT:    vslideup.vi v9, v11, 2
 204 ; LMULMAX1-NEXT:    vsetivli zero, 2, e32, mf2, ta, ma
 205 ; LMULMAX1-NEXT:    vfncvt.rod.f.f.w v11, v10
 206 ; LMULMAX1-NEXT:    vsetvli zero, zero, e16, mf4, ta, ma
 207 ; LMULMAX1-NEXT:    vfncvt.f.f.w v10, v11
 208 ; LMULMAX1-NEXT:    vsetivli zero, 6, e16, m1, tu, ma
 209 ; LMULMAX1-NEXT:    vslideup.vi v9, v10, 4
 210 ; LMULMAX1-NEXT:    vsetivli zero, 2, e32, mf2, ta, ma
 211 ; LMULMAX1-NEXT:    vfncvt.rod.f.f.w v10, v8
 212 ; LMULMAX1-NEXT:    vsetvli zero, zero, e16, mf4, ta, ma
 213 ; LMULMAX1-NEXT:    vfncvt.f.f.w v8, v10
 214 ; LMULMAX1-NEXT:    vsetivli zero, 8, e16, m1, ta, ma
 215 ; LMULMAX1-NEXT:    vslideup.vi v9, v8, 6
 216 ; LMULMAX1-NEXT:    vse16.v v9, (a1)
 217 ; LMULMAX1-NEXT:    ret
 218   %a = load <8 x double>, ptr %x
 219   %d = fptrunc <8 x double> %a to <8 x half>
 220   store <8 x half> %d, ptr %y
 221   ret void
 222 }