llvm/test/CodeGen/AArch64/sve-intrinsics-st1.ll

   1 ; RUN: llc -mtriple=aarch64-linux-gnu -mattr=+sve < %s | FileCheck %s
   2 ; RUN: llc -O0 -mtriple=aarch64-linux-gnu -mattr=+sve < %s | FileCheck %s
   3
   4 ;
   5 ; ST1B
   6 ;
   7
   8 define void @st1b_i8(<vscale x 16 x i8> %data, <vscale x 16 x i1> %pred, i8* %addr) {
   9 ; CHECK-LABEL: st1b_i8:
  10 ; CHECK: st1b { z0.b }, p0, [x0]
  11 ; CHECK-NEXT: ret
  12   call void @llvm.aarch64.sve.st1.nxv16i8(<vscale x 16 x i8> %data,
  13                                           <vscale x 16 x i1> %pred,
  14                                           i8* %addr)
  15   ret void
  16 }
  17
  18 define void @st1b_h(<vscale x 8 x i16> %data, <vscale x 8 x i1> %pred, i8* %addr) {
  19 ; CHECK-LABEL: st1b_h:
  20 ; CHECK: st1b { z0.h }, p0, [x0]
  21 ; CHECK-NEXT: ret
  22   %trunc = trunc <vscale x 8 x i16> %data to <vscale x 8 x i8>
  23   call void @llvm.aarch64.sve.st1.nxv8i8(<vscale x 8 x i8> %trunc,
  24                                          <vscale x 8 x i1> %pred,
  25                                          i8* %addr)
  26   ret void
  27 }
  28
  29 define void @st1b_s(<vscale x 4 x i32> %data, <vscale x 4 x i1> %pred, i8* %addr) {
  30 ; CHECK-LABEL: st1b_s:
  31 ; CHECK: st1b { z0.s }, p0, [x0]
  32 ; CHECK-NEXT: ret
  33   %trunc = trunc <vscale x 4 x i32> %data to <vscale x 4 x i8>
  34   call void @llvm.aarch64.sve.st1.nxv4i8(<vscale x 4 x i8> %trunc,
  35                                          <vscale x 4 x i1> %pred,
  36                                          i8* %addr)
  37   ret void
  38 }
  39
  40 define void @st1b_d(<vscale x 2 x i64> %data, <vscale x 2 x i1> %pred, i8* %addr) {
  41 ; CHECK-LABEL: st1b_d:
  42 ; CHECK: st1b { z0.d }, p0, [x0]
  43 ; CHECK-NEXT: ret
  44   %trunc = trunc <vscale x 2 x i64> %data to <vscale x 2 x i8>
  45   call void @llvm.aarch64.sve.st1.nxv2i8(<vscale x 2 x i8> %trunc,
  46                                          <vscale x 2 x i1> %pred,
  47                                          i8* %addr)
  48   ret void
  49 }
  50
  51 ;
  52 ; ST1H
  53 ;
  54
  55 define void @st1h_i16(<vscale x 8 x i16> %data, <vscale x 8 x i1> %pred, i16* %addr) {
  56 ; CHECK-LABEL: st1h_i16:
  57 ; CHECK: st1h { z0.h }, p0, [x0]
  58 ; CHECK-NEXT: ret
  59   call void @llvm.aarch64.sve.st1.nxv8i16(<vscale x 8 x i16> %data,
  60                                           <vscale x 8 x i1> %pred,
  61                                           i16* %addr)
  62   ret void
  63 }
  64
  65 define void @st1h_f16(<vscale x 8 x half> %data, <vscale x 8 x i1> %pred, half* %addr) {
  66 ; CHECK-LABEL: st1h_f16:
  67 ; CHECK: st1h { z0.h }, p0, [x0]
  68 ; CHECK-NEXT: ret
  69   call void @llvm.aarch64.sve.st1.nxv8f16(<vscale x 8 x half> %data,
  70                                           <vscale x 8 x i1> %pred,
  71                                           half* %addr)
  72   ret void
  73 }
  74
  75 define void @st1h_bf16(<vscale x 8 x bfloat> %data, <vscale x 8 x i1> %pred, bfloat* %addr) #0 {
  76 ; CHECK-LABEL: st1h_bf16:
  77 ; CHECK: st1h { z0.h }, p0, [x0]
  78 ; CHECK-NEXT: ret
  79   call void @llvm.aarch64.sve.st1.nxv8bf16(<vscale x 8 x bfloat> %data,
  80                                            <vscale x 8 x i1> %pred,
  81                                            bfloat* %addr)
  82   ret void
  83 }
  84
  85 define void @st1h_s(<vscale x 4 x i32> %data, <vscale x 4 x i1> %pred, i16* %addr) {
  86 ; CHECK-LABEL: st1h_s:
  87 ; CHECK: st1h { z0.s }, p0, [x0]
  88 ; CHECK-NEXT: ret
  89   %trunc = trunc <vscale x 4 x i32> %data to <vscale x 4 x i16>
  90   call void @llvm.aarch64.sve.st1.nxv4i16(<vscale x 4 x i16> %trunc,
  91                                          <vscale x 4 x i1> %pred,
  92                                          i16* %addr)
  93   ret void
  94 }
  95
  96 define void @st1h_d(<vscale x 2 x i64> %data, <vscale x 2 x i1> %pred, i16* %addr) {
  97 ; CHECK-LABEL: st1h_d:
  98 ; CHECK: st1h { z0.d }, p0, [x0]
  99 ; CHECK-NEXT: ret
 100   %trunc = trunc <vscale x 2 x i64> %data to <vscale x 2 x i16>
 101   call void @llvm.aarch64.sve.st1.nxv2i16(<vscale x 2 x i16> %trunc,
 102                                          <vscale x 2 x i1> %pred,
 103                                          i16* %addr)
 104   ret void
 105 }
 106
 107 ;
 108 ; ST1W
 109 ;
 110
 111 define void @st1w_i32(<vscale x 4 x i32> %data, <vscale x 4 x i1> %pred, i32* %addr) {
 112 ; CHECK-LABEL: st1w_i32:
 113 ; CHECK: st1w { z0.s }, p0, [x0]
 114 ; CHECK-NEXT: ret
 115   call void @llvm.aarch64.sve.st1.nxv4i32(<vscale x 4 x i32> %data,
 116                                           <vscale x 4 x i1> %pred,
 117                                           i32* %addr)
 118   ret void
 119 }
 120
 121 define void @st1w_f32(<vscale x 4 x float> %data, <vscale x 4 x i1> %pred, float* %addr) {
 122 ; CHECK-LABEL: st1w_f32:
 123 ; CHECK: st1w { z0.s }, p0, [x0]
 124 ; CHECK-NEXT: ret
 125   call void @llvm.aarch64.sve.st1.nxv4f32(<vscale x 4 x float> %data,
 126                                           <vscale x 4 x i1> %pred,
 127                                           float* %addr)
 128   ret void
 129 }
 130
 131 define void @st1w_d(<vscale x 2 x i64> %data, <vscale x 2 x i1> %pred, i32* %addr) {
 132 ; CHECK-LABEL: st1w_d:
 133 ; CHECK: st1w { z0.d }, p0, [x0]
 134 ; CHECK-NEXT: ret
 135   %trunc = trunc <vscale x 2 x i64> %data to <vscale x 2 x i32>
 136   call void @llvm.aarch64.sve.st1.nxv2i32(<vscale x 2 x i32> %trunc,
 137                                          <vscale x 2 x i1> %pred,
 138                                          i32* %addr)
 139   ret void
 140 }
 141
 142 ;
 143 ; ST1D
 144 ;
 145
 146 define void @st1d_i64(<vscale x 2 x i64> %data, <vscale x 2 x i1> %pred, i64* %addr) {
 147 ; CHECK-LABEL: st1d_i64:
 148 ; CHECK: st1d { z0.d }, p0, [x0]
 149 ; CHECK-NEXT: ret
 150   call void @llvm.aarch64.sve.st1.nxv2i64(<vscale x 2 x i64> %data,
 151                                           <vscale x 2 x i1> %pred,
 152                                           i64* %addr)
 153   ret void
 154 }
 155
 156 define void @st1d_f64(<vscale x 2 x double> %data, <vscale x 2 x i1> %pred, double* %addr) {
 157 ; CHECK-LABEL: st1d_f64:
 158 ; CHECK: st1d { z0.d }, p0, [x0]
 159 ; CHECK-NEXT: ret
 160   call void @llvm.aarch64.sve.st1.nxv2f64(<vscale x 2 x double> %data,
 161                                           <vscale x 2 x i1> %pred,
 162                                           double* %addr)
 163   ret void
 164 }
 165
 166 declare void @llvm.aarch64.sve.st1.nxv16i8(<vscale x 16 x i8>, <vscale x 16 x i1>, i8*)
 167
 168 declare void @llvm.aarch64.sve.st1.nxv8i8(<vscale x 8 x i8>, <vscale x 8 x i1>, i8*)
 169 declare void @llvm.aarch64.sve.st1.nxv8i16(<vscale x 8 x i16>, <vscale x 8 x i1>, i16*)
 170 declare void @llvm.aarch64.sve.st1.nxv8f16(<vscale x 8 x half>, <vscale x 8 x i1>, half*)
 171 declare void @llvm.aarch64.sve.st1.nxv8bf16(<vscale x 8 x bfloat>, <vscale x 8 x i1>, bfloat*)
 172
 173 declare void @llvm.aarch64.sve.st1.nxv4i8(<vscale x 4 x i8>, <vscale x 4 x i1>, i8*)
 174 declare void @llvm.aarch64.sve.st1.nxv4i16(<vscale x 4 x i16>, <vscale x 4 x i1>, i16*)
 175 declare void @llvm.aarch64.sve.st1.nxv4i32(<vscale x 4 x i32>, <vscale x 4 x i1>, i32*)
 176 declare void @llvm.aarch64.sve.st1.nxv4f32(<vscale x 4 x float>, <vscale x 4 x i1>, float*)
 177
 178 declare void @llvm.aarch64.sve.st1.nxv2i8(<vscale x 2 x i8>, <vscale x 2 x i1>, i8*)
 179 declare void @llvm.aarch64.sve.st1.nxv2i16(<vscale x 2 x i16>, <vscale x 2 x i1>, i16*)
 180 declare void @llvm.aarch64.sve.st1.nxv2i32(<vscale x 2 x i32>, <vscale x 2 x i1>, i32*)
 181 declare void @llvm.aarch64.sve.st1.nxv2i64(<vscale x 2 x i64>, <vscale x 2 x i1>, i64*)
 182 declare void @llvm.aarch64.sve.st1.nxv2f64(<vscale x 2 x double>, <vscale x 2 x i1>, double*)
 183
 184 ; +bf16 is required for the bfloat version.
 185 attributes #0 = { "target-features"="+sve,+bf16" }