llvm/test/CodeGen/AArch64/sve-intrinsics-int-arith-imm.ll

   1 ; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
   2 ; RUN: llc -mtriple=aarch64-linux-gnu -mattr=+sve < %s | FileCheck %s
   3
   4 ; ADD
   5
   6 define <vscale x 16 x i8> @add_i8(<vscale x 16 x i8> %a) {
   7 ; CHECK-LABEL: add_i8:
   8 ; CHECK:       // %bb.0:
   9 ; CHECK-NEXT:    add z0.b, z0.b, #127 // =0x7f
  10 ; CHECK-NEXT:    ret
  11   %pg = call <vscale x 16 x i1> @llvm.aarch64.sve.ptrue.nxv16i1(i32 31)
  12   %elt = insertelement <vscale x 16 x i8> undef, i8 127, i32 0
  13   %splat = shufflevector <vscale x 16 x i8> %elt, <vscale x 16 x i8> undef, <vscale x 16 x i32> zeroinitializer
  14   %out = call <vscale x 16 x i8> @llvm.aarch64.sve.add.u.nxv16i8(<vscale x 16 x i1> %pg,
  15                                                                  <vscale x 16 x i8> %a,
  16                                                                  <vscale x 16 x i8> %splat)
  17   ret <vscale x 16 x i8> %out
  18 }
  19
  20 define <vscale x 8 x i16> @add_i16(<vscale x 8 x i16> %a) {
  21 ; CHECK-LABEL: add_i16:
  22 ; CHECK:       // %bb.0:
  23 ; CHECK-NEXT:    add z0.h, z0.h, #127 // =0x7f
  24 ; CHECK-NEXT:    ret
  25   %pg = call <vscale x 8 x i1> @llvm.aarch64.sve.ptrue.nxv8i1(i32 31)
  26   %elt = insertelement <vscale x 8 x i16> undef, i16 127, i32 0
  27   %splat = shufflevector <vscale x 8 x i16> %elt, <vscale x 8 x i16> undef, <vscale x 8 x i32> zeroinitializer
  28   %out = call <vscale x 8 x i16> @llvm.aarch64.sve.add.u.nxv8i16(<vscale x 8 x i1> %pg,
  29                                                                  <vscale x 8 x i16> %a,
  30                                                                  <vscale x 8 x i16> %splat)
  31   ret <vscale x 8 x i16> %out
  32 }
  33
  34 define <vscale x 8 x i16> @add_i16_out_of_range(<vscale x 8 x i16> %a) {
  35 ; CHECK-LABEL: add_i16_out_of_range:
  36 ; CHECK:       // %bb.0:
  37 ; CHECK-NEXT:    dupm z1.b, #0x1
  38 ; CHECK-NEXT:    add z0.h, z0.h, z1.h
  39 ; CHECK-NEXT:    ret
  40   %pg = call <vscale x 8 x i1> @llvm.aarch64.sve.ptrue.nxv8i1(i32 31)
  41   %elt = insertelement <vscale x 8 x i16> undef, i16 257, i32 0
  42   %splat = shufflevector <vscale x 8 x i16> %elt, <vscale x 8 x i16> undef, <vscale x 8 x i32> zeroinitializer
  43   %out = call <vscale x 8 x i16> @llvm.aarch64.sve.add.u.nxv8i16(<vscale x 8 x i1> %pg,
  44                                                                  <vscale x 8 x i16> %a,
  45                                                                  <vscale x 8 x i16> %splat)
  46   ret <vscale x 8 x i16> %out
  47 }
  48
  49 define <vscale x 4 x i32> @add_i32(<vscale x 4 x i32> %a) {
  50 ; CHECK-LABEL: add_i32:
  51 ; CHECK:       // %bb.0:
  52 ; CHECK-NEXT:    add z0.s, z0.s, #127 // =0x7f
  53 ; CHECK-NEXT:    ret
  54   %pg = call <vscale x 4 x i1> @llvm.aarch64.sve.ptrue.nxv4i1(i32 31)
  55   %elt = insertelement <vscale x 4 x i32> undef, i32 127, i32 0
  56   %splat = shufflevector <vscale x 4 x i32> %elt, <vscale x 4 x i32> undef, <vscale x 4 x i32> zeroinitializer
  57   %out = call <vscale x 4 x i32> @llvm.aarch64.sve.add.u.nxv4i32(<vscale x 4 x i1> %pg,
  58                                                                  <vscale x 4 x i32> %a,
  59                                                                  <vscale x 4 x i32> %splat)
  60   ret <vscale x 4 x i32> %out
  61 }
  62
  63 define <vscale x 4 x i32> @add_i32_out_of_range(<vscale x 4 x i32> %a) {
  64 ; CHECK-LABEL: add_i32_out_of_range:
  65 ; CHECK:       // %bb.0:
  66 ; CHECK-NEXT:    mov w8, #257 // =0x101
  67 ; CHECK-NEXT:    mov z1.s, w8
  68 ; CHECK-NEXT:    add z0.s, z0.s, z1.s
  69 ; CHECK-NEXT:    ret
  70   %pg = call <vscale x 4 x i1> @llvm.aarch64.sve.ptrue.nxv4i1(i32 31)
  71   %elt = insertelement <vscale x 4 x i32> undef, i32 257, i32 0
  72   %splat = shufflevector <vscale x 4 x i32> %elt, <vscale x 4 x i32> undef, <vscale x 4 x i32> zeroinitializer
  73   %out = call <vscale x 4 x i32> @llvm.aarch64.sve.add.u.nxv4i32(<vscale x 4 x i1> %pg,
  74                                                                  <vscale x 4 x i32> %a,
  75                                                                  <vscale x 4 x i32> %splat)
  76   ret <vscale x 4 x i32> %out
  77 }
  78
  79 define <vscale x 2 x i64> @add_i64(<vscale x 2 x i64> %a) {
  80 ; CHECK-LABEL: add_i64:
  81 ; CHECK:       // %bb.0:
  82 ; CHECK-NEXT:    add z0.d, z0.d, #127 // =0x7f
  83 ; CHECK-NEXT:    ret
  84   %pg = call <vscale x 2 x i1> @llvm.aarch64.sve.ptrue.nxv2i1(i32 31)
  85   %elt = insertelement <vscale x 2 x i64> undef, i64 127, i64 0
  86   %splat = shufflevector <vscale x 2 x i64> %elt, <vscale x 2 x i64> undef, <vscale x 2 x i32> zeroinitializer
  87   %out = call <vscale x 2 x i64> @llvm.aarch64.sve.add.u.nxv2i64(<vscale x 2 x i1> %pg,
  88                                                                  <vscale x 2 x i64> %a,
  89                                                                  <vscale x 2 x i64> %splat)
  90   ret <vscale x 2 x i64> %out
  91 }
  92
  93 define <vscale x 2 x i64> @add_i64_out_of_range(<vscale x 2 x i64> %a) {
  94 ; CHECK-LABEL: add_i64_out_of_range:
  95 ; CHECK:       // %bb.0:
  96 ; CHECK-NEXT:    mov w8, #257 // =0x101
  97 ; CHECK-NEXT:    mov z1.d, x8
  98 ; CHECK-NEXT:    add z0.d, z0.d, z1.d
  99 ; CHECK-NEXT:    ret
 100   %pg = call <vscale x 2 x i1> @llvm.aarch64.sve.ptrue.nxv2i1(i32 31)
 101   %elt = insertelement <vscale x 2 x i64> undef, i64 257, i64 0
 102   %splat = shufflevector <vscale x 2 x i64> %elt, <vscale x 2 x i64> undef, <vscale x 2 x i32> zeroinitializer
 103   %out = call <vscale x 2 x i64> @llvm.aarch64.sve.add.u.nxv2i64(<vscale x 2 x i1> %pg,
 104                                                                  <vscale x 2 x i64> %a,
 105                                                                  <vscale x 2 x i64> %splat)
 106   ret <vscale x 2 x i64> %out
 107 }
 108
 109 ; SUB
 110
 111 define <vscale x 16 x i8> @sub_i8(<vscale x 16 x i8> %a) {
 112 ; CHECK-LABEL: sub_i8:
 113 ; CHECK:       // %bb.0:
 114 ; CHECK-NEXT:    sub z0.b, z0.b, #127 // =0x7f
 115 ; CHECK-NEXT:    ret
 116   %pg = call <vscale x 16 x i1> @llvm.aarch64.sve.ptrue.nxv16i1(i32 31)
 117   %elt = insertelement <vscale x 16 x i8> undef, i8 127, i32 0
 118   %splat = shufflevector <vscale x 16 x i8> %elt, <vscale x 16 x i8> undef, <vscale x 16 x i32> zeroinitializer
 119   %out = call <vscale x 16 x i8> @llvm.aarch64.sve.sub.u.nxv16i8(<vscale x 16 x i1> %pg,
 120                                                                  <vscale x 16 x i8> %a,
 121                                                                  <vscale x 16 x i8> %splat)
 122   ret <vscale x 16 x i8> %out
 123 }
 124
 125 define <vscale x 8 x i16> @sub_i16(<vscale x 8 x i16> %a) {
 126 ; CHECK-LABEL: sub_i16:
 127 ; CHECK:       // %bb.0:
 128 ; CHECK-NEXT:    sub z0.h, z0.h, #127 // =0x7f
 129 ; CHECK-NEXT:    ret
 130   %pg = call <vscale x 8 x i1> @llvm.aarch64.sve.ptrue.nxv8i1(i32 31)
 131   %elt = insertelement <vscale x 8 x i16> undef, i16 127, i32 0
 132   %splat = shufflevector <vscale x 8 x i16> %elt, <vscale x 8 x i16> undef, <vscale x 8 x i32> zeroinitializer
 133   %out = call <vscale x 8 x i16> @llvm.aarch64.sve.sub.u.nxv8i16(<vscale x 8 x i1> %pg,
 134                                                                  <vscale x 8 x i16> %a,
 135                                                                  <vscale x 8 x i16> %splat)
 136   ret <vscale x 8 x i16> %out
 137 }
 138
 139 define <vscale x 8 x i16> @sub_i16_out_of_range(<vscale x 8 x i16> %a) {
 140 ; CHECK-LABEL: sub_i16_out_of_range:
 141 ; CHECK:       // %bb.0:
 142 ; CHECK-NEXT:    dupm z1.b, #0x1
 143 ; CHECK-NEXT:    sub z0.h, z0.h, z1.h
 144 ; CHECK-NEXT:    ret
 145   %pg = call <vscale x 8 x i1> @llvm.aarch64.sve.ptrue.nxv8i1(i32 31)
 146   %elt = insertelement <vscale x 8 x i16> undef, i16 257, i32 0
 147   %splat = shufflevector <vscale x 8 x i16> %elt, <vscale x 8 x i16> undef, <vscale x 8 x i32> zeroinitializer
 148   %out = call <vscale x 8 x i16> @llvm.aarch64.sve.sub.u.nxv8i16(<vscale x 8 x i1> %pg,
 149                                                                  <vscale x 8 x i16> %a,
 150                                                                  <vscale x 8 x i16> %splat)
 151   ret <vscale x 8 x i16> %out
 152 }
 153
 154 define <vscale x 4 x i32> @sub_i32(<vscale x 4 x i32> %a) {
 155 ; CHECK-LABEL: sub_i32:
 156 ; CHECK:       // %bb.0:
 157 ; CHECK-NEXT:    sub z0.s, z0.s, #127 // =0x7f
 158 ; CHECK-NEXT:    ret
 159   %pg = call <vscale x 4 x i1> @llvm.aarch64.sve.ptrue.nxv4i1(i32 31)
 160   %elt = insertelement <vscale x 4 x i32> undef, i32 127, i32 0
 161   %splat = shufflevector <vscale x 4 x i32> %elt, <vscale x 4 x i32> undef, <vscale x 4 x i32> zeroinitializer
 162   %out = call <vscale x 4 x i32> @llvm.aarch64.sve.sub.u.nxv4i32(<vscale x 4 x i1> %pg,
 163                                                                  <vscale x 4 x i32> %a,
 164                                                                  <vscale x 4 x i32> %splat)
 165   ret <vscale x 4 x i32> %out
 166 }
 167
 168 define <vscale x 4 x i32> @sub_i32_out_of_range(<vscale x 4 x i32> %a) {
 169 ; CHECK-LABEL: sub_i32_out_of_range:
 170 ; CHECK:       // %bb.0:
 171 ; CHECK-NEXT:    mov w8, #257 // =0x101
 172 ; CHECK-NEXT:    mov z1.s, w8
 173 ; CHECK-NEXT:    sub z0.s, z0.s, z1.s
 174 ; CHECK-NEXT:    ret
 175   %pg = call <vscale x 4 x i1> @llvm.aarch64.sve.ptrue.nxv4i1(i32 31)
 176   %elt = insertelement <vscale x 4 x i32> undef, i32 257, i32 0
 177   %splat = shufflevector <vscale x 4 x i32> %elt, <vscale x 4 x i32> undef, <vscale x 4 x i32> zeroinitializer
 178   %out = call <vscale x 4 x i32> @llvm.aarch64.sve.sub.u.nxv4i32(<vscale x 4 x i1> %pg,
 179                                                                  <vscale x 4 x i32> %a,
 180                                                                  <vscale x 4 x i32> %splat)
 181   ret <vscale x 4 x i32> %out
 182 }
 183
 184 define <vscale x 2 x i64> @sub_i64(<vscale x 2 x i64> %a) {
 185 ; CHECK-LABEL: sub_i64:
 186 ; CHECK:       // %bb.0:
 187 ; CHECK-NEXT:    sub z0.d, z0.d, #127 // =0x7f
 188 ; CHECK-NEXT:    ret
 189   %pg = call <vscale x 2 x i1> @llvm.aarch64.sve.ptrue.nxv2i1(i32 31)
 190   %elt = insertelement <vscale x 2 x i64> undef, i64 127, i64 0
 191   %splat = shufflevector <vscale x 2 x i64> %elt, <vscale x 2 x i64> undef, <vscale x 2 x i32> zeroinitializer
 192   %out = call <vscale x 2 x i64> @llvm.aarch64.sve.sub.u.nxv2i64(<vscale x 2 x i1> %pg,
 193                                                                  <vscale x 2 x i64> %a,
 194                                                                  <vscale x 2 x i64> %splat)
 195   ret <vscale x 2 x i64> %out
 196 }
 197
 198 define <vscale x 2 x i64> @sub_i64_out_of_range(<vscale x 2 x i64> %a) {
 199 ; CHECK-LABEL: sub_i64_out_of_range:
 200 ; CHECK:       // %bb.0:
 201 ; CHECK-NEXT:    mov w8, #257 // =0x101
 202 ; CHECK-NEXT:    mov z1.d, x8
 203 ; CHECK-NEXT:    sub z0.d, z0.d, z1.d
 204 ; CHECK-NEXT:    ret
 205   %pg = call <vscale x 2 x i1> @llvm.aarch64.sve.ptrue.nxv2i1(i32 31)
 206   %elt = insertelement <vscale x 2 x i64> undef, i64 257, i64 0
 207   %splat = shufflevector <vscale x 2 x i64> %elt, <vscale x 2 x i64> undef, <vscale x 2 x i32> zeroinitializer
 208   %out = call <vscale x 2 x i64> @llvm.aarch64.sve.sub.u.nxv2i64(<vscale x 2 x i1> %pg,
 209                                                                  <vscale x 2 x i64> %a,
 210                                                                  <vscale x 2 x i64> %splat)
 211   ret <vscale x 2 x i64> %out
 212 }
 213
 214 ; As sub_i32 but where pg is i8 based and thus compatible for i32.
 215 define <vscale x 4 x i32> @sub_i32_ptrue_all_b(<vscale x 4 x i32> %a) #0 {
 216 ; CHECK-LABEL: sub_i32_ptrue_all_b:
 217 ; CHECK:       // %bb.0:
 218 ; CHECK-NEXT:    sub z0.s, z0.s, #1 // =0x1
 219 ; CHECK-NEXT:    ret
 220   %pg.b = tail call <vscale x 16 x i1> @llvm.aarch64.sve.ptrue.nxv16i1(i32 31)
 221   %pg.s = tail call <vscale x 4 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv4i1(<vscale x 16 x i1> %pg.b)
 222   %b = tail call <vscale x 4 x i32> @llvm.aarch64.sve.dup.x.nxv4i32(i32 1)
 223   %out = tail call <vscale x 4 x i32> @llvm.aarch64.sve.sub.u.nxv4i32(<vscale x 4 x i1> %pg.s,
 224                                                                       <vscale x 4 x i32> %a,
 225                                                                       <vscale x 4 x i32> %b)
 226   ret <vscale x 4 x i32> %out
 227 }
 228
 229 ; As sub_i32 but where pg is i16 based and thus compatible for i32.
 230 define <vscale x 4 x i32> @sub_i32_ptrue_all_h(<vscale x 4 x i32> %a) #0 {
 231 ; CHECK-LABEL: sub_i32_ptrue_all_h:
 232 ; CHECK:       // %bb.0:
 233 ; CHECK-NEXT:    sub z0.s, z0.s, #1 // =0x1
 234 ; CHECK-NEXT:    ret
 235   %pg.h = tail call <vscale x 8 x i1> @llvm.aarch64.sve.ptrue.nxv8i1(i32 31)
 236   %pg.b = tail call <vscale x 16 x i1> @llvm.aarch64.sve.convert.to.svbool.nxv8i1(<vscale x 8 x i1> %pg.h)
 237   %pg.s = tail call <vscale x 4 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv4i1(<vscale x 16 x i1> %pg.b)
 238   %b = tail call <vscale x 4 x i32> @llvm.aarch64.sve.dup.x.nxv4i32(i32 1)
 239   %out = tail call <vscale x 4 x i32> @llvm.aarch64.sve.sub.u.nxv4i32(<vscale x 4 x i1> %pg.s,
 240                                                                       <vscale x 4 x i32> %a,
 241                                                                       <vscale x 4 x i32> %b)
 242   ret <vscale x 4 x i32> %out
 243 }
 244
 245 ; As sub_i32 but where pg is i64 based, which is not compatibile for i32 and
 246 ; thus inactive lanes are important and the immediate form cannot be used.
 247 define <vscale x 4 x i32> @sub_i32_ptrue_all_d(<vscale x 4 x i32> %a) #0 {
 248 ; CHECK-LABEL: sub_i32_ptrue_all_d:
 249 ; CHECK:       // %bb.0:
 250 ; CHECK-NEXT:    mov z1.s, #1 // =0x1
 251 ; CHECK-NEXT:    ptrue p0.d
 252 ; CHECK-NEXT:    sub z0.s, p0/m, z0.s, z1.s
 253 ; CHECK-NEXT:    ret
 254   %pg.d = tail call <vscale x 2 x i1> @llvm.aarch64.sve.ptrue.nxv2i1(i32 31)
 255   %pg.b = tail call <vscale x 16 x i1> @llvm.aarch64.sve.convert.to.svbool.nxv2i1(<vscale x 2 x i1> %pg.d)
 256   %pg.s = tail call <vscale x 4 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv4i1(<vscale x 16 x i1> %pg.b)
 257   %b = tail call <vscale x 4 x i32> @llvm.aarch64.sve.dup.x.nxv4i32(i32 1)
 258   %out = tail call <vscale x 4 x i32> @llvm.aarch64.sve.sub.nxv4i32(<vscale x 4 x i1> %pg.s,
 259                                                                     <vscale x 4 x i32> %a,
 260                                                                     <vscale x 4 x i32> %b)
 261   ret <vscale x 4 x i32> %out
 262 }
 263
 264 ; SUBR
 265
 266 define <vscale x 16 x i8> @subr_i8(<vscale x 16 x i8> %a) {
 267 ; CHECK-LABEL: subr_i8:
 268 ; CHECK:       // %bb.0:
 269 ; CHECK-NEXT:    subr z0.b, z0.b, #127 // =0x7f
 270 ; CHECK-NEXT:    ret
 271   %pg = call <vscale x 16 x i1> @llvm.aarch64.sve.ptrue.nxv16i1(i32 31)
 272   %elt = insertelement <vscale x 16 x i8> undef, i8 127, i32 0
 273   %splat = shufflevector <vscale x 16 x i8> %elt, <vscale x 16 x i8> undef, <vscale x 16 x i32> zeroinitializer
 274   %out = call <vscale x 16 x i8> @llvm.aarch64.sve.subr.nxv16i8(<vscale x 16 x i1> %pg,
 275                                                                 <vscale x 16 x i8> %a,
 276                                                                 <vscale x 16 x i8> %splat)
 277   ret <vscale x 16 x i8> %out
 278 }
 279
 280 define <vscale x 8 x i16> @subr_i16(<vscale x 8 x i16> %a) {
 281 ; CHECK-LABEL: subr_i16:
 282 ; CHECK:       // %bb.0:
 283 ; CHECK-NEXT:    subr z0.h, z0.h, #127 // =0x7f
 284 ; CHECK-NEXT:    ret
 285   %pg = call <vscale x 8 x i1> @llvm.aarch64.sve.ptrue.nxv8i1(i32 31)
 286   %elt = insertelement <vscale x 8 x i16> undef, i16 127, i32 0
 287   %splat = shufflevector <vscale x 8 x i16> %elt, <vscale x 8 x i16> undef, <vscale x 8 x i32> zeroinitializer
 288   %out = call <vscale x 8 x i16> @llvm.aarch64.sve.subr.nxv8i16(<vscale x 8 x i1> %pg,
 289                                                                 <vscale x 8 x i16> %a,
 290                                                                 <vscale x 8 x i16> %splat)
 291   ret <vscale x 8 x i16> %out
 292 }
 293
 294 define <vscale x 8 x i16> @subr_i16_out_of_range(<vscale x 8 x i16> %a) {
 295 ; CHECK-LABEL: subr_i16_out_of_range:
 296 ; CHECK:       // %bb.0:
 297 ; CHECK-NEXT:    dupm z1.b, #0x1
 298 ; CHECK-NEXT:    sub z0.h, z1.h, z0.h
 299 ; CHECK-NEXT:    ret
 300   %pg = call <vscale x 8 x i1> @llvm.aarch64.sve.ptrue.nxv8i1(i32 31)
 301   %elt = insertelement <vscale x 8 x i16> undef, i16 257, i32 0
 302   %splat = shufflevector <vscale x 8 x i16> %elt, <vscale x 8 x i16> undef, <vscale x 8 x i32> zeroinitializer
 303   %out = call <vscale x 8 x i16> @llvm.aarch64.sve.subr.nxv8i16(<vscale x 8 x i1> %pg,
 304                                                                 <vscale x 8 x i16> %a,
 305                                                                 <vscale x 8 x i16> %splat)
 306   ret <vscale x 8 x i16> %out
 307 }
 308
 309 define <vscale x 4 x i32> @subr_i32(<vscale x 4 x i32> %a) {
 310 ; CHECK-LABEL: subr_i32:
 311 ; CHECK:       // %bb.0:
 312 ; CHECK-NEXT:    subr z0.s, z0.s, #127 // =0x7f
 313 ; CHECK-NEXT:    ret
 314   %pg = call <vscale x 4 x i1> @llvm.aarch64.sve.ptrue.nxv4i1(i32 31)
 315   %elt = insertelement <vscale x 4 x i32> undef, i32 127, i32 0
 316   %splat = shufflevector <vscale x 4 x i32> %elt, <vscale x 4 x i32> undef, <vscale x 4 x i32> zeroinitializer
 317   %out = call <vscale x 4 x i32> @llvm.aarch64.sve.subr.nxv4i32(<vscale x 4 x i1> %pg,
 318                                                                 <vscale x 4 x i32> %a,
 319                                                                 <vscale x 4 x i32> %splat)
 320   ret <vscale x 4 x i32> %out
 321 }
 322
 323 define <vscale x 4 x i32> @subr_i32_out_of_range(<vscale x 4 x i32> %a) {
 324 ; CHECK-LABEL: subr_i32_out_of_range:
 325 ; CHECK:       // %bb.0:
 326 ; CHECK-NEXT:    mov w8, #257 // =0x101
 327 ; CHECK-NEXT:    mov z1.s, w8
 328 ; CHECK-NEXT:    sub z0.s, z1.s, z0.s
 329 ; CHECK-NEXT:    ret
 330   %pg = call <vscale x 4 x i1> @llvm.aarch64.sve.ptrue.nxv4i1(i32 31)
 331   %elt = insertelement <vscale x 4 x i32> undef, i32 257, i32 0
 332   %splat = shufflevector <vscale x 4 x i32> %elt, <vscale x 4 x i32> undef, <vscale x 4 x i32> zeroinitializer
 333   %out = call <vscale x 4 x i32> @llvm.aarch64.sve.subr.nxv4i32(<vscale x 4 x i1> %pg,
 334                                                                 <vscale x 4 x i32> %a,
 335                                                                 <vscale x 4 x i32> %splat)
 336   ret <vscale x 4 x i32> %out
 337 }
 338
 339 define <vscale x 2 x i64> @subr_i64(<vscale x 2 x i64> %a) {
 340 ; CHECK-LABEL: subr_i64:
 341 ; CHECK:       // %bb.0:
 342 ; CHECK-NEXT:    subr z0.d, z0.d, #127 // =0x7f
 343 ; CHECK-NEXT:    ret
 344   %pg = call <vscale x 2 x i1> @llvm.aarch64.sve.ptrue.nxv2i1(i32 31)
 345   %elt = insertelement <vscale x 2 x i64> undef, i64 127, i64 0
 346   %splat = shufflevector <vscale x 2 x i64> %elt, <vscale x 2 x i64> undef, <vscale x 2 x i32> zeroinitializer
 347   %out = call <vscale x 2 x i64> @llvm.aarch64.sve.subr.nxv2i64(<vscale x 2 x i1> %pg,
 348                                                                 <vscale x 2 x i64> %a,
 349                                                                 <vscale x 2 x i64> %splat)
 350   ret <vscale x 2 x i64> %out
 351 }
 352
 353 define <vscale x 2 x i64> @subr_i64_out_of_range(<vscale x 2 x i64> %a) {
 354 ; CHECK-LABEL: subr_i64_out_of_range:
 355 ; CHECK:       // %bb.0:
 356 ; CHECK-NEXT:    mov w8, #257 // =0x101
 357 ; CHECK-NEXT:    mov z1.d, x8
 358 ; CHECK-NEXT:    sub z0.d, z1.d, z0.d
 359 ; CHECK-NEXT:    ret
 360   %pg = call <vscale x 2 x i1> @llvm.aarch64.sve.ptrue.nxv2i1(i32 31)
 361   %elt = insertelement <vscale x 2 x i64> undef, i64 257, i64 0
 362   %splat = shufflevector <vscale x 2 x i64> %elt, <vscale x 2 x i64> undef, <vscale x 2 x i32> zeroinitializer
 363   %out = call <vscale x 2 x i64> @llvm.aarch64.sve.subr.nxv2i64(<vscale x 2 x i1> %pg,
 364                                                                 <vscale x 2 x i64> %a,
 365                                                                 <vscale x 2 x i64> %splat)
 366   ret <vscale x 2 x i64> %out
 367 }
 368
 369 ; As subr_i32 but where pg is i8 based and thus compatible for i32.
 370 define <vscale x 4 x i32> @subr_i32_ptrue_all_b(<vscale x 4 x i32> %a) #0 {
 371 ; CHECK-LABEL: subr_i32_ptrue_all_b:
 372 ; CHECK:       // %bb.0:
 373 ; CHECK-NEXT:    subr z0.s, z0.s, #1 // =0x1
 374 ; CHECK-NEXT:    ret
 375   %pg.b = tail call <vscale x 16 x i1> @llvm.aarch64.sve.ptrue.nxv16i1(i32 31)
 376   %pg.s = tail call <vscale x 4 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv4i1(<vscale x 16 x i1> %pg.b)
 377   %b = tail call <vscale x 4 x i32> @llvm.aarch64.sve.dup.x.nxv4i32(i32 1)
 378   %out = tail call <vscale x 4 x i32> @llvm.aarch64.sve.subr.nxv4i32(<vscale x 4 x i1> %pg.s,
 379                                                                      <vscale x 4 x i32> %a,
 380                                                                      <vscale x 4 x i32> %b)
 381   ret <vscale x 4 x i32> %out
 382 }
 383
 384 ; As subr_i32 but where pg is i16 based and thus compatible for i32.
 385 define <vscale x 4 x i32> @subr_i32_ptrue_all_h(<vscale x 4 x i32> %a) #0 {
 386 ; CHECK-LABEL: subr_i32_ptrue_all_h:
 387 ; CHECK:       // %bb.0:
 388 ; CHECK-NEXT:    subr z0.s, z0.s, #1 // =0x1
 389 ; CHECK-NEXT:    ret
 390   %pg.h = tail call <vscale x 8 x i1> @llvm.aarch64.sve.ptrue.nxv8i1(i32 31)
 391   %pg.b = tail call <vscale x 16 x i1> @llvm.aarch64.sve.convert.to.svbool.nxv8i1(<vscale x 8 x i1> %pg.h)
 392   %pg.s = tail call <vscale x 4 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv4i1(<vscale x 16 x i1> %pg.b)
 393   %b = tail call <vscale x 4 x i32> @llvm.aarch64.sve.dup.x.nxv4i32(i32 1)
 394   %out = tail call <vscale x 4 x i32> @llvm.aarch64.sve.subr.nxv4i32(<vscale x 4 x i1> %pg.s,
 395                                                                      <vscale x 4 x i32> %a,
 396                                                                      <vscale x 4 x i32> %b)
 397   ret <vscale x 4 x i32> %out
 398 }
 399
 400 ; As subr_i32 but where pg is i64 based, which is not compatibile for i32 and
 401 ; thus inactive lanes are important and the immediate form cannot be used.
 402 define <vscale x 4 x i32> @subr_i32_ptrue_all_d(<vscale x 4 x i32> %a) #0 {
 403 ; CHECK-LABEL: subr_i32_ptrue_all_d:
 404 ; CHECK:       // %bb.0:
 405 ; CHECK-NEXT:    mov z1.s, #1 // =0x1
 406 ; CHECK-NEXT:    ptrue p0.d
 407 ; CHECK-NEXT:    subr z0.s, p0/m, z0.s, z1.s
 408 ; CHECK-NEXT:    ret
 409   %pg.d = tail call <vscale x 2 x i1> @llvm.aarch64.sve.ptrue.nxv2i1(i32 31)
 410   %pg.b = tail call <vscale x 16 x i1> @llvm.aarch64.sve.convert.to.svbool.nxv2i1(<vscale x 2 x i1> %pg.d)
 411   %pg.s = tail call <vscale x 4 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv4i1(<vscale x 16 x i1> %pg.b)
 412   %b = tail call <vscale x 4 x i32> @llvm.aarch64.sve.dup.x.nxv4i32(i32 1)
 413   %out = tail call <vscale x 4 x i32> @llvm.aarch64.sve.subr.nxv4i32(<vscale x 4 x i1> %pg.s,
 414                                                                      <vscale x 4 x i32> %a,
 415                                                                      <vscale x 4 x i32> %b)
 416   ret <vscale x 4 x i32> %out
 417 }
 418
 419 ; SMAX
 420
 421 define <vscale x 16 x i8> @smax_i8(<vscale x 16 x i8> %a) {
 422 ; CHECK-LABEL: smax_i8:
 423 ; CHECK:       // %bb.0:
 424 ; CHECK-NEXT:    smax z0.b, z0.b, #-128
 425 ; CHECK-NEXT:    ret
 426   %pg = call <vscale x 16 x i1> @llvm.aarch64.sve.ptrue.nxv16i1(i32 31)
 427   %elt = insertelement <vscale x 16 x i8> undef, i8 -128, i32 0
 428   %splat = shufflevector <vscale x 16 x i8> %elt, <vscale x 16 x i8> undef, <vscale x 16 x i32> zeroinitializer
 429   %out = call <vscale x 16 x i8> @llvm.aarch64.sve.smax.u.nxv16i8(<vscale x 16 x i1> %pg,
 430                                                                   <vscale x 16 x i8> %a,
 431                                                                   <vscale x 16 x i8> %splat)
 432   ret <vscale x 16 x i8> %out
 433 }
 434
 435 define <vscale x 8 x i16> @smax_i16(<vscale x 8 x i16> %a) {
 436 ; CHECK-LABEL: smax_i16:
 437 ; CHECK:       // %bb.0:
 438 ; CHECK-NEXT:    smax z0.h, z0.h, #127
 439 ; CHECK-NEXT:    ret
 440   %pg = call <vscale x 8 x i1> @llvm.aarch64.sve.ptrue.nxv8i1(i32 31)
 441   %elt = insertelement <vscale x 8 x i16> undef, i16 127, i32 0
 442   %splat = shufflevector <vscale x 8 x i16> %elt, <vscale x 8 x i16> undef, <vscale x 8 x i32> zeroinitializer
 443   %out = call <vscale x 8 x i16> @llvm.aarch64.sve.smax.u.nxv8i16(<vscale x 8 x i1> %pg,
 444                                                                   <vscale x 8 x i16> %a,
 445                                                                   <vscale x 8 x i16> %splat)
 446   ret <vscale x 8 x i16> %out
 447 }
 448
 449 define <vscale x 8 x i16> @smax_i16_out_of_range(<vscale x 8 x i16> %a) {
 450 ; CHECK-LABEL: smax_i16_out_of_range:
 451 ; CHECK:       // %bb.0:
 452 ; CHECK-NEXT:    mov w8, #129 // =0x81
 453 ; CHECK-NEXT:    ptrue p0.h
 454 ; CHECK-NEXT:    mov z1.h, w8
 455 ; CHECK-NEXT:    smax z0.h, p0/m, z0.h, z1.h
 456 ; CHECK-NEXT:    ret
 457   %pg = call <vscale x 8 x i1> @llvm.aarch64.sve.ptrue.nxv8i1(i32 31)
 458   %elt = insertelement <vscale x 8 x i16> undef, i16 129, i32 0
 459   %splat = shufflevector <vscale x 8 x i16> %elt, <vscale x 8 x i16> undef, <vscale x 8 x i32> zeroinitializer
 460   %out = call <vscale x 8 x i16> @llvm.aarch64.sve.smax.u.nxv8i16(<vscale x 8 x i1> %pg,
 461                                                                   <vscale x 8 x i16> %a,
 462                                                                   <vscale x 8 x i16> %splat)
 463   ret <vscale x 8 x i16> %out
 464 }
 465
 466 define <vscale x 4 x i32> @smax_i32(<vscale x 4 x i32> %a) {
 467 ; CHECK-LABEL: smax_i32:
 468 ; CHECK:       // %bb.0:
 469 ; CHECK-NEXT:    smax z0.s, z0.s, #-128
 470 ; CHECK-NEXT:    ret
 471   %pg = call <vscale x 4 x i1> @llvm.aarch64.sve.ptrue.nxv4i1(i32 31)
 472   %elt = insertelement <vscale x 4 x i32> undef, i32 -128, i32 0
 473   %splat = shufflevector <vscale x 4 x i32> %elt, <vscale x 4 x i32> undef, <vscale x 4 x i32> zeroinitializer
 474   %out = call <vscale x 4 x i32> @llvm.aarch64.sve.smax.u.nxv4i32(<vscale x 4 x i1> %pg,
 475                                                                   <vscale x 4 x i32> %a,
 476                                                                   <vscale x 4 x i32> %splat)
 477   ret <vscale x 4 x i32> %out
 478 }
 479
 480 define <vscale x 4 x i32> @smax_i32_out_of_range(<vscale x 4 x i32> %a) {
 481 ; CHECK-LABEL: smax_i32_out_of_range:
 482 ; CHECK:       // %bb.0:
 483 ; CHECK-NEXT:    mov z1.s, #-129 // =0xffffffffffffff7f
 484 ; CHECK-NEXT:    ptrue p0.s
 485 ; CHECK-NEXT:    smax z0.s, p0/m, z0.s, z1.s
 486 ; CHECK-NEXT:    ret
 487   %pg = call <vscale x 4 x i1> @llvm.aarch64.sve.ptrue.nxv4i1(i32 31)
 488   %elt = insertelement <vscale x 4 x i32> undef, i32 -129, i32 0
 489   %splat = shufflevector <vscale x 4 x i32> %elt, <vscale x 4 x i32> undef, <vscale x 4 x i32> zeroinitializer
 490   %out = call <vscale x 4 x i32> @llvm.aarch64.sve.smax.u.nxv4i32(<vscale x 4 x i1> %pg,
 491                                                                   <vscale x 4 x i32> %a,
 492                                                                   <vscale x 4 x i32> %splat)
 493   ret <vscale x 4 x i32> %out
 494 }
 495
 496 define <vscale x 2 x i64> @smax_i64(<vscale x 2 x i64> %a) {
 497 ; CHECK-LABEL: smax_i64:
 498 ; CHECK:       // %bb.0:
 499 ; CHECK-NEXT:    smax z0.d, z0.d, #127
 500 ; CHECK-NEXT:    ret
 501   %pg = call <vscale x 2 x i1> @llvm.aarch64.sve.ptrue.nxv2i1(i32 31)
 502   %elt = insertelement <vscale x 2 x i64> undef, i64 127, i64 0
 503   %splat = shufflevector <vscale x 2 x i64> %elt, <vscale x 2 x i64> undef, <vscale x 2 x i32> zeroinitializer
 504   %out = call <vscale x 2 x i64> @llvm.aarch64.sve.smax.u.nxv2i64(<vscale x 2 x i1> %pg,
 505                                                                   <vscale x 2 x i64> %a,
 506                                                                   <vscale x 2 x i64> %splat)
 507   ret <vscale x 2 x i64> %out
 508 }
 509
 510 define <vscale x 2 x i64> @smax_i64_out_of_range(<vscale x 2 x i64> %a) {
 511 ; CHECK-LABEL: smax_i64_out_of_range:
 512 ; CHECK:       // %bb.0:
 513 ; CHECK-NEXT:    mov z1.d, #65535 // =0xffff
 514 ; CHECK-NEXT:    ptrue p0.d
 515 ; CHECK-NEXT:    smax z0.d, p0/m, z0.d, z1.d
 516 ; CHECK-NEXT:    ret
 517   %pg = call <vscale x 2 x i1> @llvm.aarch64.sve.ptrue.nxv2i1(i32 31)
 518   %elt = insertelement <vscale x 2 x i64> undef, i64 65535, i64 0
 519   %splat = shufflevector <vscale x 2 x i64> %elt, <vscale x 2 x i64> undef, <vscale x 2 x i32> zeroinitializer
 520   %out = call <vscale x 2 x i64> @llvm.aarch64.sve.smax.u.nxv2i64(<vscale x 2 x i1> %pg,
 521                                                                   <vscale x 2 x i64> %a,
 522                                                                   <vscale x 2 x i64> %splat)
 523   ret <vscale x 2 x i64> %out
 524 }
 525
 526 ; As smax_i32 but where pg is i8 based and thus compatible for i32.
 527 define <vscale x 4 x i32> @smax_i32_ptrue_all_b(<vscale x 4 x i32> %a) #0 {
 528 ; CHECK-LABEL: smax_i32_ptrue_all_b:
 529 ; CHECK:       // %bb.0:
 530 ; CHECK-NEXT:    smax z0.s, z0.s, #1
 531 ; CHECK-NEXT:    ret
 532   %pg.b = tail call <vscale x 16 x i1> @llvm.aarch64.sve.ptrue.nxv16i1(i32 31)
 533   %pg.s = tail call <vscale x 4 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv4i1(<vscale x 16 x i1> %pg.b)
 534   %b = tail call <vscale x 4 x i32> @llvm.aarch64.sve.dup.x.nxv4i32(i32 1)
 535   %out = tail call <vscale x 4 x i32> @llvm.aarch64.sve.smax.u.nxv4i32(<vscale x 4 x i1> %pg.s,
 536                                                                        <vscale x 4 x i32> %a,
 537                                                                        <vscale x 4 x i32> %b)
 538   ret <vscale x 4 x i32> %out
 539 }
 540
 541 ; As smax_i32 but where pg is i16 based and thus compatible for i32.
 542 define <vscale x 4 x i32> @smax_i32_ptrue_all_h(<vscale x 4 x i32> %a) #0 {
 543 ; CHECK-LABEL: smax_i32_ptrue_all_h:
 544 ; CHECK:       // %bb.0:
 545 ; CHECK-NEXT:    smax z0.s, z0.s, #1
 546 ; CHECK-NEXT:    ret
 547   %pg.h = tail call <vscale x 8 x i1> @llvm.aarch64.sve.ptrue.nxv8i1(i32 31)
 548   %pg.b = tail call <vscale x 16 x i1> @llvm.aarch64.sve.convert.to.svbool.nxv8i1(<vscale x 8 x i1> %pg.h)
 549   %pg.s = tail call <vscale x 4 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv4i1(<vscale x 16 x i1> %pg.b)
 550   %b = tail call <vscale x 4 x i32> @llvm.aarch64.sve.dup.x.nxv4i32(i32 1)
 551   %out = tail call <vscale x 4 x i32> @llvm.aarch64.sve.smax.u.nxv4i32(<vscale x 4 x i1> %pg.s,
 552                                                                        <vscale x 4 x i32> %a,
 553                                                                        <vscale x 4 x i32> %b)
 554   ret <vscale x 4 x i32> %out
 555 }
 556
 557 ; As smax_i32 but where pg is i64 based, which is not compatibile for i32 and
 558 ; thus inactive lanes are important and the immediate form cannot be used.
 559 define <vscale x 4 x i32> @smax_i32_ptrue_all_d(<vscale x 4 x i32> %a) #0 {
 560 ; CHECK-LABEL: smax_i32_ptrue_all_d:
 561 ; CHECK:       // %bb.0:
 562 ; CHECK-NEXT:    mov z1.s, #1 // =0x1
 563 ; CHECK-NEXT:    ptrue p0.d
 564 ; CHECK-NEXT:    smax z0.s, p0/m, z0.s, z1.s
 565 ; CHECK-NEXT:    ret
 566   %pg.d = tail call <vscale x 2 x i1> @llvm.aarch64.sve.ptrue.nxv2i1(i32 31)
 567   %pg.b = tail call <vscale x 16 x i1> @llvm.aarch64.sve.convert.to.svbool.nxv2i1(<vscale x 2 x i1> %pg.d)
 568   %pg.s = tail call <vscale x 4 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv4i1(<vscale x 16 x i1> %pg.b)
 569   %b = tail call <vscale x 4 x i32> @llvm.aarch64.sve.dup.x.nxv4i32(i32 1)
 570   %out = tail call <vscale x 4 x i32> @llvm.aarch64.sve.smax.nxv4i32(<vscale x 4 x i1> %pg.s,
 571                                                                      <vscale x 4 x i32> %a,
 572                                                                      <vscale x 4 x i32> %b)
 573   ret <vscale x 4 x i32> %out
 574 }
 575
 576 ; SMIN
 577
 578 define <vscale x 16 x i8> @smin_i8(<vscale x 16 x i8> %a) {
 579 ; CHECK-LABEL: smin_i8:
 580 ; CHECK:       // %bb.0:
 581 ; CHECK-NEXT:    smin z0.b, z0.b, #127
 582 ; CHECK-NEXT:    ret
 583   %pg = call <vscale x 16 x i1> @llvm.aarch64.sve.ptrue.nxv16i1(i32 31)
 584   %elt = insertelement <vscale x 16 x i8> undef, i8 127, i32 0
 585   %splat = shufflevector <vscale x 16 x i8> %elt, <vscale x 16 x i8> undef, <vscale x 16 x i32> zeroinitializer
 586   %out = call <vscale x 16 x i8> @llvm.aarch64.sve.smin.u.nxv16i8(<vscale x 16 x i1> %pg,
 587                                                                   <vscale x 16 x i8> %a,
 588                                                                   <vscale x 16 x i8> %splat)
 589   ret <vscale x 16 x i8> %out
 590 }
 591
 592 define <vscale x 8 x i16> @smin_i16(<vscale x 8 x i16> %a) {
 593 ; CHECK-LABEL: smin_i16:
 594 ; CHECK:       // %bb.0:
 595 ; CHECK-NEXT:    smin z0.h, z0.h, #-128
 596 ; CHECK-NEXT:    ret
 597   %pg = call <vscale x 8 x i1> @llvm.aarch64.sve.ptrue.nxv8i1(i32 31)
 598   %elt = insertelement <vscale x 8 x i16> undef, i16 -128, i32 0
 599   %splat = shufflevector <vscale x 8 x i16> %elt, <vscale x 8 x i16> undef, <vscale x 8 x i32> zeroinitializer
 600   %out = call <vscale x 8 x i16> @llvm.aarch64.sve.smin.u.nxv8i16(<vscale x 8 x i1> %pg,
 601                                                                   <vscale x 8 x i16> %a,
 602                                                                   <vscale x 8 x i16> %splat)
 603   ret <vscale x 8 x i16> %out
 604 }
 605
 606 define <vscale x 8 x i16> @smin_i16_out_of_range(<vscale x 8 x i16> %a) {
 607 ; CHECK-LABEL: smin_i16_out_of_range:
 608 ; CHECK:       // %bb.0:
 609 ; CHECK-NEXT:    mov z1.h, #-129 // =0xffffffffffffff7f
 610 ; CHECK-NEXT:    ptrue p0.h
 611 ; CHECK-NEXT:    smin z0.h, p0/m, z0.h, z1.h
 612 ; CHECK-NEXT:    ret
 613   %pg = call <vscale x 8 x i1> @llvm.aarch64.sve.ptrue.nxv8i1(i32 31)
 614   %elt = insertelement <vscale x 8 x i16> undef, i16 -129, i32 0
 615   %splat = shufflevector <vscale x 8 x i16> %elt, <vscale x 8 x i16> undef, <vscale x 8 x i32> zeroinitializer
 616   %out = call <vscale x 8 x i16> @llvm.aarch64.sve.smin.u.nxv8i16(<vscale x 8 x i1> %pg,
 617                                                                   <vscale x 8 x i16> %a,
 618                                                                   <vscale x 8 x i16> %splat)
 619   ret <vscale x 8 x i16> %out
 620 }
 621
 622 define <vscale x 4 x i32> @smin_i32(<vscale x 4 x i32> %a) {
 623 ; CHECK-LABEL: smin_i32:
 624 ; CHECK:       // %bb.0:
 625 ; CHECK-NEXT:    smin z0.s, z0.s, #127
 626 ; CHECK-NEXT:    ret
 627   %pg = call <vscale x 4 x i1> @llvm.aarch64.sve.ptrue.nxv4i1(i32 31)
 628   %elt = insertelement <vscale x 4 x i32> undef, i32 127, i32 0
 629   %splat = shufflevector <vscale x 4 x i32> %elt, <vscale x 4 x i32> undef, <vscale x 4 x i32> zeroinitializer
 630   %out = call <vscale x 4 x i32> @llvm.aarch64.sve.smin.u.nxv4i32(<vscale x 4 x i1> %pg,
 631                                                                   <vscale x 4 x i32> %a,
 632                                                                   <vscale x 4 x i32> %splat)
 633   ret <vscale x 4 x i32> %out
 634 }
 635
 636 define <vscale x 4 x i32> @smin_i32_out_of_range(<vscale x 4 x i32> %a) {
 637 ; CHECK-LABEL: smin_i32_out_of_range:
 638 ; CHECK:       // %bb.0:
 639 ; CHECK-NEXT:    mov w8, #257 // =0x101
 640 ; CHECK-NEXT:    ptrue p0.s
 641 ; CHECK-NEXT:    mov z1.s, w8
 642 ; CHECK-NEXT:    smin z0.s, p0/m, z0.s, z1.s
 643 ; CHECK-NEXT:    ret
 644   %pg = call <vscale x 4 x i1> @llvm.aarch64.sve.ptrue.nxv4i1(i32 31)
 645   %elt = insertelement <vscale x 4 x i32> undef, i32 257, i32 0
 646   %splat = shufflevector <vscale x 4 x i32> %elt, <vscale x 4 x i32> undef, <vscale x 4 x i32> zeroinitializer
 647   %out = call <vscale x 4 x i32> @llvm.aarch64.sve.smin.u.nxv4i32(<vscale x 4 x i1> %pg,
 648                                                                   <vscale x 4 x i32> %a,
 649                                                                   <vscale x 4 x i32> %splat)
 650   ret <vscale x 4 x i32> %out
 651 }
 652
 653
 654 define <vscale x 2 x i64> @smin_i64(<vscale x 2 x i64> %a) {
 655 ; CHECK-LABEL: smin_i64:
 656 ; CHECK:       // %bb.0:
 657 ; CHECK-NEXT:    smin z0.d, z0.d, #-128
 658 ; CHECK-NEXT:    ret
 659   %pg = call <vscale x 2 x i1> @llvm.aarch64.sve.ptrue.nxv2i1(i32 31)
 660   %elt = insertelement <vscale x 2 x i64> undef, i64 -128, i64 0
 661   %splat = shufflevector <vscale x 2 x i64> %elt, <vscale x 2 x i64> undef, <vscale x 2 x i32> zeroinitializer
 662   %out = call <vscale x 2 x i64> @llvm.aarch64.sve.smin.u.nxv2i64(<vscale x 2 x i1> %pg,
 663                                                                   <vscale x 2 x i64> %a,
 664                                                                   <vscale x 2 x i64> %splat)
 665   ret <vscale x 2 x i64> %out
 666 }
 667
 668 define <vscale x 2 x i64> @smin_i64_out_of_range(<vscale x 2 x i64> %a) {
 669 ; CHECK-LABEL: smin_i64_out_of_range:
 670 ; CHECK:       // %bb.0:
 671 ; CHECK-NEXT:    mov z1.d, #-256 // =0xffffffffffffff00
 672 ; CHECK-NEXT:    ptrue p0.d
 673 ; CHECK-NEXT:    smin z0.d, p0/m, z0.d, z1.d
 674 ; CHECK-NEXT:    ret
 675   %pg = call <vscale x 2 x i1> @llvm.aarch64.sve.ptrue.nxv2i1(i32 31)
 676   %elt = insertelement <vscale x 2 x i64> undef, i64 -256, i64 0
 677   %splat = shufflevector <vscale x 2 x i64> %elt, <vscale x 2 x i64> undef, <vscale x 2 x i32> zeroinitializer
 678   %out = call <vscale x 2 x i64> @llvm.aarch64.sve.smin.u.nxv2i64(<vscale x 2 x i1> %pg,
 679                                                                   <vscale x 2 x i64> %a,
 680                                                                   <vscale x 2 x i64> %splat)
 681   ret <vscale x 2 x i64> %out
 682 }
 683
 684 ; As smin_i32 but where pg is i8 based and thus compatible for i32.
 685 define <vscale x 4 x i32> @smin_i32_ptrue_all_b(<vscale x 4 x i32> %a) #0 {
 686 ; CHECK-LABEL: smin_i32_ptrue_all_b:
 687 ; CHECK:       // %bb.0:
 688 ; CHECK-NEXT:    smin z0.s, z0.s, #1
 689 ; CHECK-NEXT:    ret
 690   %pg.b = tail call <vscale x 16 x i1> @llvm.aarch64.sve.ptrue.nxv16i1(i32 31)
 691   %pg.s = tail call <vscale x 4 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv4i1(<vscale x 16 x i1> %pg.b)
 692   %b = tail call <vscale x 4 x i32> @llvm.aarch64.sve.dup.x.nxv4i32(i32 1)
 693   %out = tail call <vscale x 4 x i32> @llvm.aarch64.sve.smin.u.nxv4i32(<vscale x 4 x i1> %pg.s,
 694                                                                        <vscale x 4 x i32> %a,
 695                                                                        <vscale x 4 x i32> %b)
 696   ret <vscale x 4 x i32> %out
 697 }
 698
 699 ; As smin_i32 but where pg is i16 based and thus compatible for i32.
 700 define <vscale x 4 x i32> @smin_i32_ptrue_all_h(<vscale x 4 x i32> %a) #0 {
 701 ; CHECK-LABEL: smin_i32_ptrue_all_h:
 702 ; CHECK:       // %bb.0:
 703 ; CHECK-NEXT:    smin z0.s, z0.s, #1
 704 ; CHECK-NEXT:    ret
 705   %pg.h = tail call <vscale x 8 x i1> @llvm.aarch64.sve.ptrue.nxv8i1(i32 31)
 706   %pg.b = tail call <vscale x 16 x i1> @llvm.aarch64.sve.convert.to.svbool.nxv8i1(<vscale x 8 x i1> %pg.h)
 707   %pg.s = tail call <vscale x 4 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv4i1(<vscale x 16 x i1> %pg.b)
 708   %b = tail call <vscale x 4 x i32> @llvm.aarch64.sve.dup.x.nxv4i32(i32 1)
 709   %out = tail call <vscale x 4 x i32> @llvm.aarch64.sve.smin.u.nxv4i32(<vscale x 4 x i1> %pg.s,
 710                                                                        <vscale x 4 x i32> %a,
 711                                                                        <vscale x 4 x i32> %b)
 712   ret <vscale x 4 x i32> %out
 713 }
 714
 715 ; As smin_i32 but where pg is i64 based, which is not compatibile for i32 and
 716 ; thus inactive lanes are important and the immediate form cannot be used.
 717 define <vscale x 4 x i32> @smin_i32_ptrue_all_d(<vscale x 4 x i32> %a) #0 {
 718 ; CHECK-LABEL: smin_i32_ptrue_all_d:
 719 ; CHECK:       // %bb.0:
 720 ; CHECK-NEXT:    mov z1.s, #1 // =0x1
 721 ; CHECK-NEXT:    ptrue p0.d
 722 ; CHECK-NEXT:    smin z0.s, p0/m, z0.s, z1.s
 723 ; CHECK-NEXT:    ret
 724   %pg.d = tail call <vscale x 2 x i1> @llvm.aarch64.sve.ptrue.nxv2i1(i32 31)
 725   %pg.b = tail call <vscale x 16 x i1> @llvm.aarch64.sve.convert.to.svbool.nxv2i1(<vscale x 2 x i1> %pg.d)
 726   %pg.s = tail call <vscale x 4 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv4i1(<vscale x 16 x i1> %pg.b)
 727   %b = tail call <vscale x 4 x i32> @llvm.aarch64.sve.dup.x.nxv4i32(i32 1)
 728   %out = tail call <vscale x 4 x i32> @llvm.aarch64.sve.smin.nxv4i32(<vscale x 4 x i1> %pg.s,
 729                                                                      <vscale x 4 x i32> %a,
 730                                                                      <vscale x 4 x i32> %b)
 731   ret <vscale x 4 x i32> %out
 732 }
 733
 734 ; UMAX
 735
 736 define <vscale x 16 x i8> @umax_i8(<vscale x 16 x i8> %a) {
 737 ; CHECK-LABEL: umax_i8:
 738 ; CHECK:       // %bb.0:
 739 ; CHECK-NEXT:    umax z0.b, z0.b, #0
 740 ; CHECK-NEXT:    ret
 741   %pg = call <vscale x 16 x i1> @llvm.aarch64.sve.ptrue.nxv16i1(i32 31)
 742   %elt = insertelement <vscale x 16 x i8> undef, i8 0, i32 0
 743   %splat = shufflevector <vscale x 16 x i8> %elt, <vscale x 16 x i8> undef, <vscale x 16 x i32> zeroinitializer
 744   %out = call <vscale x 16 x i8> @llvm.aarch64.sve.umax.u.nxv16i8(<vscale x 16 x i1> %pg,
 745                                                                   <vscale x 16 x i8> %a,
 746                                                                   <vscale x 16 x i8> %splat)
 747   ret <vscale x 16 x i8> %out
 748 }
 749
 750 define <vscale x 8 x i16> @umax_i16(<vscale x 8 x i16> %a) {
 751 ; CHECK-LABEL: umax_i16:
 752 ; CHECK:       // %bb.0:
 753 ; CHECK-NEXT:    umax z0.h, z0.h, #255
 754 ; CHECK-NEXT:    ret
 755   %pg = call <vscale x 8 x i1> @llvm.aarch64.sve.ptrue.nxv8i1(i32 31)
 756   %elt = insertelement <vscale x 8 x i16> undef, i16 255, i32 0
 757   %splat = shufflevector <vscale x 8 x i16> %elt, <vscale x 8 x i16> undef, <vscale x 8 x i32> zeroinitializer
 758   %out = call <vscale x 8 x i16> @llvm.aarch64.sve.umax.u.nxv8i16(<vscale x 8 x i1> %pg,
 759                                                                   <vscale x 8 x i16> %a,
 760                                                                   <vscale x 8 x i16> %splat)
 761   ret <vscale x 8 x i16> %out
 762 }
 763
 764 define <vscale x 8 x i16> @umax_i16_out_of_range(<vscale x 8 x i16> %a) {
 765 ; CHECK-LABEL: umax_i16_out_of_range:
 766 ; CHECK:       // %bb.0:
 767 ; CHECK-NEXT:    dupm z1.b, #0x1
 768 ; CHECK-NEXT:    ptrue p0.h
 769 ; CHECK-NEXT:    umax z0.h, p0/m, z0.h, z1.h
 770 ; CHECK-NEXT:    ret
 771   %pg = call <vscale x 8 x i1> @llvm.aarch64.sve.ptrue.nxv8i1(i32 31)
 772   %elt = insertelement <vscale x 8 x i16> undef, i16 257, i32 0
 773   %splat = shufflevector <vscale x 8 x i16> %elt, <vscale x 8 x i16> undef, <vscale x 8 x i32> zeroinitializer
 774   %out = call <vscale x 8 x i16> @llvm.aarch64.sve.umax.u.nxv8i16(<vscale x 8 x i1> %pg,
 775                                                                   <vscale x 8 x i16> %a,
 776                                                                   <vscale x 8 x i16> %splat)
 777   ret <vscale x 8 x i16> %out
 778 }
 779
 780 define <vscale x 4 x i32> @umax_i32(<vscale x 4 x i32> %a) {
 781 ; CHECK-LABEL: umax_i32:
 782 ; CHECK:       // %bb.0:
 783 ; CHECK-NEXT:    umax z0.s, z0.s, #0
 784 ; CHECK-NEXT:    ret
 785   %pg = call <vscale x 4 x i1> @llvm.aarch64.sve.ptrue.nxv4i1(i32 31)
 786   %elt = insertelement <vscale x 4 x i32> undef, i32 0, i32 0
 787   %splat = shufflevector <vscale x 4 x i32> %elt, <vscale x 4 x i32> undef, <vscale x 4 x i32> zeroinitializer
 788   %out = call <vscale x 4 x i32> @llvm.aarch64.sve.umax.u.nxv4i32(<vscale x 4 x i1> %pg,
 789                                                                   <vscale x 4 x i32> %a,
 790                                                                   <vscale x 4 x i32> %splat)
 791   ret <vscale x 4 x i32> %out
 792 }
 793
 794 define <vscale x 4 x i32> @umax_i32_out_of_range(<vscale x 4 x i32> %a) {
 795 ; CHECK-LABEL: umax_i32_out_of_range:
 796 ; CHECK:       // %bb.0:
 797 ; CHECK-NEXT:    mov w8, #257 // =0x101
 798 ; CHECK-NEXT:    ptrue p0.s
 799 ; CHECK-NEXT:    mov z1.s, w8
 800 ; CHECK-NEXT:    umax z0.s, p0/m, z0.s, z1.s
 801 ; CHECK-NEXT:    ret
 802   %pg = call <vscale x 4 x i1> @llvm.aarch64.sve.ptrue.nxv4i1(i32 31)
 803   %elt = insertelement <vscale x 4 x i32> undef, i32 257, i32 0
 804   %splat = shufflevector <vscale x 4 x i32> %elt, <vscale x 4 x i32> undef, <vscale x 4 x i32> zeroinitializer
 805   %out = call <vscale x 4 x i32> @llvm.aarch64.sve.umax.u.nxv4i32(<vscale x 4 x i1> %pg,
 806                                                                   <vscale x 4 x i32> %a,
 807                                                                   <vscale x 4 x i32> %splat)
 808   ret <vscale x 4 x i32> %out
 809 }
 810
 811 define <vscale x 2 x i64> @umax_i64(<vscale x 2 x i64> %a) {
 812 ; CHECK-LABEL: umax_i64:
 813 ; CHECK:       // %bb.0:
 814 ; CHECK-NEXT:    umax z0.d, z0.d, #255
 815 ; CHECK-NEXT:    ret
 816   %pg = call <vscale x 2 x i1> @llvm.aarch64.sve.ptrue.nxv2i1(i32 31)
 817   %elt = insertelement <vscale x 2 x i64> undef, i64 255, i64 0
 818   %splat = shufflevector <vscale x 2 x i64> %elt, <vscale x 2 x i64> undef, <vscale x 2 x i32> zeroinitializer
 819   %out = call <vscale x 2 x i64> @llvm.aarch64.sve.umax.u.nxv2i64(<vscale x 2 x i1> %pg,
 820                                                                   <vscale x 2 x i64> %a,
 821                                                                   <vscale x 2 x i64> %splat)
 822   ret <vscale x 2 x i64> %out
 823 }
 824
 825 define <vscale x 2 x i64> @umax_i64_out_of_range(<vscale x 2 x i64> %a) {
 826 ; CHECK-LABEL: umax_i64_out_of_range:
 827 ; CHECK:       // %bb.0:
 828 ; CHECK-NEXT:    mov z1.d, #65535 // =0xffff
 829 ; CHECK-NEXT:    ptrue p0.d
 830 ; CHECK-NEXT:    umax z0.d, p0/m, z0.d, z1.d
 831 ; CHECK-NEXT:    ret
 832   %pg = call <vscale x 2 x i1> @llvm.aarch64.sve.ptrue.nxv2i1(i32 31)
 833   %elt = insertelement <vscale x 2 x i64> undef, i64 65535, i64 0
 834   %splat = shufflevector <vscale x 2 x i64> %elt, <vscale x 2 x i64> undef, <vscale x 2 x i32> zeroinitializer
 835   %out = call <vscale x 2 x i64> @llvm.aarch64.sve.umax.u.nxv2i64(<vscale x 2 x i1> %pg,
 836                                                                   <vscale x 2 x i64> %a,
 837                                                                   <vscale x 2 x i64> %splat)
 838   ret <vscale x 2 x i64> %out
 839 }
 840
 841 ; As umax_i32 but where pg is i8 based and thus compatible for i32.
 842 define <vscale x 4 x i32> @umax_i32_ptrue_all_b(<vscale x 4 x i32> %a) #0 {
 843 ; CHECK-LABEL: umax_i32_ptrue_all_b:
 844 ; CHECK:       // %bb.0:
 845 ; CHECK-NEXT:    umax z0.s, z0.s, #1
 846 ; CHECK-NEXT:    ret
 847   %pg.b = tail call <vscale x 16 x i1> @llvm.aarch64.sve.ptrue.nxv16i1(i32 31)
 848   %pg.s = tail call <vscale x 4 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv4i1(<vscale x 16 x i1> %pg.b)
 849   %b = tail call <vscale x 4 x i32> @llvm.aarch64.sve.dup.x.nxv4i32(i32 1)
 850   %out = tail call <vscale x 4 x i32> @llvm.aarch64.sve.umax.u.nxv4i32(<vscale x 4 x i1> %pg.s,
 851                                                                        <vscale x 4 x i32> %a,
 852                                                                        <vscale x 4 x i32> %b)
 853   ret <vscale x 4 x i32> %out
 854 }
 855
 856 ; As umax_i32 but where pg is i16 based and thus compatible for i32.
 857 define <vscale x 4 x i32> @umax_i32_ptrue_all_h(<vscale x 4 x i32> %a) #0 {
 858 ; CHECK-LABEL: umax_i32_ptrue_all_h:
 859 ; CHECK:       // %bb.0:
 860 ; CHECK-NEXT:    umax z0.s, z0.s, #1
 861 ; CHECK-NEXT:    ret
 862   %pg.h = tail call <vscale x 8 x i1> @llvm.aarch64.sve.ptrue.nxv8i1(i32 31)
 863   %pg.b = tail call <vscale x 16 x i1> @llvm.aarch64.sve.convert.to.svbool.nxv8i1(<vscale x 8 x i1> %pg.h)
 864   %pg.s = tail call <vscale x 4 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv4i1(<vscale x 16 x i1> %pg.b)
 865   %b = tail call <vscale x 4 x i32> @llvm.aarch64.sve.dup.x.nxv4i32(i32 1)
 866   %out = tail call <vscale x 4 x i32> @llvm.aarch64.sve.umax.u.nxv4i32(<vscale x 4 x i1> %pg.s,
 867                                                                        <vscale x 4 x i32> %a,
 868                                                                        <vscale x 4 x i32> %b)
 869   ret <vscale x 4 x i32> %out
 870 }
 871
 872 ; As umax_i32 but where pg is i64 based, which is not compatibile for i32 and
 873 ; thus inactive lanes are important and the immediate form cannot be used.
 874 define <vscale x 4 x i32> @umax_i32_ptrue_all_d(<vscale x 4 x i32> %a) #0 {
 875 ; CHECK-LABEL: umax_i32_ptrue_all_d:
 876 ; CHECK:       // %bb.0:
 877 ; CHECK-NEXT:    mov z1.s, #1 // =0x1
 878 ; CHECK-NEXT:    ptrue p0.d
 879 ; CHECK-NEXT:    umax z0.s, p0/m, z0.s, z1.s
 880 ; CHECK-NEXT:    ret
 881   %pg.d = tail call <vscale x 2 x i1> @llvm.aarch64.sve.ptrue.nxv2i1(i32 31)
 882   %pg.b = tail call <vscale x 16 x i1> @llvm.aarch64.sve.convert.to.svbool.nxv2i1(<vscale x 2 x i1> %pg.d)
 883   %pg.s = tail call <vscale x 4 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv4i1(<vscale x 16 x i1> %pg.b)
 884   %b = tail call <vscale x 4 x i32> @llvm.aarch64.sve.dup.x.nxv4i32(i32 1)
 885   %out = tail call <vscale x 4 x i32> @llvm.aarch64.sve.umax.nxv4i32(<vscale x 4 x i1> %pg.s,
 886                                                                      <vscale x 4 x i32> %a,
 887                                                                      <vscale x 4 x i32> %b)
 888   ret <vscale x 4 x i32> %out
 889 }
 890
 891 ; UMIN
 892
 893 define <vscale x 16 x i8> @umin_i8(<vscale x 16 x i8> %a) {
 894 ; CHECK-LABEL: umin_i8:
 895 ; CHECK:       // %bb.0:
 896 ; CHECK-NEXT:    umin z0.b, z0.b, #255
 897 ; CHECK-NEXT:    ret
 898   %pg = call <vscale x 16 x i1> @llvm.aarch64.sve.ptrue.nxv16i1(i32 31)
 899   %elt = insertelement <vscale x 16 x i8> undef, i8 255, i32 0
 900   %splat = shufflevector <vscale x 16 x i8> %elt, <vscale x 16 x i8> undef, <vscale x 16 x i32> zeroinitializer
 901   %out = call <vscale x 16 x i8> @llvm.aarch64.sve.umin.u.nxv16i8(<vscale x 16 x i1> %pg,
 902                                                                   <vscale x 16 x i8> %a,
 903                                                                   <vscale x 16 x i8> %splat)
 904   ret <vscale x 16 x i8> %out
 905 }
 906
 907 define <vscale x 8 x i16> @umin_i16(<vscale x 8 x i16> %a) {
 908 ; CHECK-LABEL: umin_i16:
 909 ; CHECK:       // %bb.0:
 910 ; CHECK-NEXT:    umin z0.h, z0.h, #0
 911 ; CHECK-NEXT:    ret
 912   %pg = call <vscale x 8 x i1> @llvm.aarch64.sve.ptrue.nxv8i1(i32 31)
 913   %elt = insertelement <vscale x 8 x i16> undef, i16 0, i32 0
 914   %splat = shufflevector <vscale x 8 x i16> %elt, <vscale x 8 x i16> undef, <vscale x 8 x i32> zeroinitializer
 915   %out = call <vscale x 8 x i16> @llvm.aarch64.sve.umin.u.nxv8i16(<vscale x 8 x i1> %pg,
 916                                                                   <vscale x 8 x i16> %a,
 917                                                                   <vscale x 8 x i16> %splat)
 918   ret <vscale x 8 x i16> %out
 919 }
 920
 921 define <vscale x 8 x i16> @umin_i16_out_of_range(<vscale x 8 x i16> %a) {
 922 ; CHECK-LABEL: umin_i16_out_of_range:
 923 ; CHECK:       // %bb.0:
 924 ; CHECK-NEXT:    dupm z1.b, #0x1
 925 ; CHECK-NEXT:    ptrue p0.h
 926 ; CHECK-NEXT:    umin z0.h, p0/m, z0.h, z1.h
 927 ; CHECK-NEXT:    ret
 928   %pg = call <vscale x 8 x i1> @llvm.aarch64.sve.ptrue.nxv8i1(i32 31)
 929   %elt = insertelement <vscale x 8 x i16> undef, i16 257, i32 0
 930   %splat = shufflevector <vscale x 8 x i16> %elt, <vscale x 8 x i16> undef, <vscale x 8 x i32> zeroinitializer
 931   %out = call <vscale x 8 x i16> @llvm.aarch64.sve.umin.u.nxv8i16(<vscale x 8 x i1> %pg,
 932                                                                   <vscale x 8 x i16> %a,
 933                                                                   <vscale x 8 x i16> %splat)
 934   ret <vscale x 8 x i16> %out
 935 }
 936
 937 define <vscale x 4 x i32> @umin_i32(<vscale x 4 x i32> %a) {
 938 ; CHECK-LABEL: umin_i32:
 939 ; CHECK:       // %bb.0:
 940 ; CHECK-NEXT:    umin z0.s, z0.s, #255
 941 ; CHECK-NEXT:    ret
 942   %pg = call <vscale x 4 x i1> @llvm.aarch64.sve.ptrue.nxv4i1(i32 31)
 943   %elt = insertelement <vscale x 4 x i32> undef, i32 255, i32 0
 944   %splat = shufflevector <vscale x 4 x i32> %elt, <vscale x 4 x i32> undef, <vscale x 4 x i32> zeroinitializer
 945   %out = call <vscale x 4 x i32> @llvm.aarch64.sve.umin.u.nxv4i32(<vscale x 4 x i1> %pg,
 946                                                                   <vscale x 4 x i32> %a,
 947                                                                   <vscale x 4 x i32> %splat)
 948   ret <vscale x 4 x i32> %out
 949 }
 950
 951 define <vscale x 4 x i32> @umin_i32_out_of_range(<vscale x 4 x i32> %a) {
 952 ; CHECK-LABEL: umin_i32_out_of_range:
 953 ; CHECK:       // %bb.0:
 954 ; CHECK-NEXT:    mov w8, #257 // =0x101
 955 ; CHECK-NEXT:    ptrue p0.s
 956 ; CHECK-NEXT:    mov z1.s, w8
 957 ; CHECK-NEXT:    umin z0.s, p0/m, z0.s, z1.s
 958 ; CHECK-NEXT:    ret
 959   %pg = call <vscale x 4 x i1> @llvm.aarch64.sve.ptrue.nxv4i1(i32 31)
 960   %elt = insertelement <vscale x 4 x i32> undef, i32 257, i32 0
 961   %splat = shufflevector <vscale x 4 x i32> %elt, <vscale x 4 x i32> undef, <vscale x 4 x i32> zeroinitializer
 962   %out = call <vscale x 4 x i32> @llvm.aarch64.sve.umin.u.nxv4i32(<vscale x 4 x i1> %pg,
 963                                                                   <vscale x 4 x i32> %a,
 964                                                                   <vscale x 4 x i32> %splat)
 965   ret <vscale x 4 x i32> %out
 966 }
 967
 968 define <vscale x 2 x i64> @umin_i64(<vscale x 2 x i64> %a) {
 969 ; CHECK-LABEL: umin_i64:
 970 ; CHECK:       // %bb.0:
 971 ; CHECK-NEXT:    umin z0.d, z0.d, #0
 972 ; CHECK-NEXT:    ret
 973   %pg = call <vscale x 2 x i1> @llvm.aarch64.sve.ptrue.nxv2i1(i32 31)
 974   %elt = insertelement <vscale x 2 x i64> undef, i64 0, i64 0
 975   %splat = shufflevector <vscale x 2 x i64> %elt, <vscale x 2 x i64> undef, <vscale x 2 x i32> zeroinitializer
 976   %out = call <vscale x 2 x i64> @llvm.aarch64.sve.umin.u.nxv2i64(<vscale x 2 x i1> %pg,
 977                                                                   <vscale x 2 x i64> %a,
 978                                                                   <vscale x 2 x i64> %splat)
 979   ret <vscale x 2 x i64> %out
 980 }
 981
 982 define <vscale x 2 x i64> @umin_i64_out_of_range(<vscale x 2 x i64> %a) {
 983 ; CHECK-LABEL: umin_i64_out_of_range:
 984 ; CHECK:       // %bb.0:
 985 ; CHECK-NEXT:    mov z1.d, #65535 // =0xffff
 986 ; CHECK-NEXT:    ptrue p0.d
 987 ; CHECK-NEXT:    umin z0.d, p0/m, z0.d, z1.d
 988 ; CHECK-NEXT:    ret
 989   %pg = call <vscale x 2 x i1> @llvm.aarch64.sve.ptrue.nxv2i1(i32 31)
 990   %elt = insertelement <vscale x 2 x i64> undef, i64 65535, i64 0
 991   %splat = shufflevector <vscale x 2 x i64> %elt, <vscale x 2 x i64> undef, <vscale x 2 x i32> zeroinitializer
 992   %out = call <vscale x 2 x i64> @llvm.aarch64.sve.umin.u.nxv2i64(<vscale x 2 x i1> %pg,
 993                                                                   <vscale x 2 x i64> %a,
 994                                                                   <vscale x 2 x i64> %splat)
 995   ret <vscale x 2 x i64> %out
 996 }
 997
 998 ; As umin_i32 but where pg is i8 based and thus compatible for i32.
 999 define <vscale x 4 x i32> @umin_i32_ptrue_all_b(<vscale x 4 x i32> %a) #0 {
1000 ; CHECK-LABEL: umin_i32_ptrue_all_b:
1001 ; CHECK:       // %bb.0:
1002 ; CHECK-NEXT:    umin z0.s, z0.s, #1
1003 ; CHECK-NEXT:    ret
1004   %pg.b = tail call <vscale x 16 x i1> @llvm.aarch64.sve.ptrue.nxv16i1(i32 31)
1005   %pg.s = tail call <vscale x 4 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv4i1(<vscale x 16 x i1> %pg.b)
1006   %b = tail call <vscale x 4 x i32> @llvm.aarch64.sve.dup.x.nxv4i32(i32 1)
1007   %out = tail call <vscale x 4 x i32> @llvm.aarch64.sve.umin.u.nxv4i32(<vscale x 4 x i1> %pg.s,
1008                                                                        <vscale x 4 x i32> %a,
1009                                                                        <vscale x 4 x i32> %b)
1010   ret <vscale x 4 x i32> %out
1011 }
1012
1013 ; As umin_i32 but where pg is i16 based and thus compatible for i32.
1014 define <vscale x 4 x i32> @umin_i32_ptrue_all_h(<vscale x 4 x i32> %a) #0 {
1015 ; CHECK-LABEL: umin_i32_ptrue_all_h:
1016 ; CHECK:       // %bb.0:
1017 ; CHECK-NEXT:    umin z0.s, z0.s, #1
1018 ; CHECK-NEXT:    ret
1019   %pg.h = tail call <vscale x 8 x i1> @llvm.aarch64.sve.ptrue.nxv8i1(i32 31)
1020   %pg.b = tail call <vscale x 16 x i1> @llvm.aarch64.sve.convert.to.svbool.nxv8i1(<vscale x 8 x i1> %pg.h)
1021   %pg.s = tail call <vscale x 4 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv4i1(<vscale x 16 x i1> %pg.b)
1022   %b = tail call <vscale x 4 x i32> @llvm.aarch64.sve.dup.x.nxv4i32(i32 1)
1023   %out = tail call <vscale x 4 x i32> @llvm.aarch64.sve.umin.u.nxv4i32(<vscale x 4 x i1> %pg.s,
1024                                                                        <vscale x 4 x i32> %a,
1025                                                                        <vscale x 4 x i32> %b)
1026   ret <vscale x 4 x i32> %out
1027 }
1028
1029 ; As umin_i32 but where pg is i64 based, which is not compatibile for i32 and
1030 ; thus inactive lanes are important and the immediate form cannot be used.
1031 define <vscale x 4 x i32> @umin_i32_ptrue_all_d(<vscale x 4 x i32> %a) #0 {
1032 ; CHECK-LABEL: umin_i32_ptrue_all_d:
1033 ; CHECK:       // %bb.0:
1034 ; CHECK-NEXT:    mov z1.s, #1 // =0x1
1035 ; CHECK-NEXT:    ptrue p0.d
1036 ; CHECK-NEXT:    umin z0.s, p0/m, z0.s, z1.s
1037 ; CHECK-NEXT:    ret
1038   %pg.d = tail call <vscale x 2 x i1> @llvm.aarch64.sve.ptrue.nxv2i1(i32 31)
1039   %pg.b = tail call <vscale x 16 x i1> @llvm.aarch64.sve.convert.to.svbool.nxv2i1(<vscale x 2 x i1> %pg.d)
1040   %pg.s = tail call <vscale x 4 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv4i1(<vscale x 16 x i1> %pg.b)
1041   %b = tail call <vscale x 4 x i32> @llvm.aarch64.sve.dup.x.nxv4i32(i32 1)
1042   %out = tail call <vscale x 4 x i32> @llvm.aarch64.sve.umin.nxv4i32(<vscale x 4 x i1> %pg.s,
1043                                                                      <vscale x 4 x i32> %a,
1044                                                                      <vscale x 4 x i32> %b)
1045   ret <vscale x 4 x i32> %out
1046 }
1047
1048 ; SQADD
1049
1050 define <vscale x 16 x i8> @sqadd_b_lowimm(<vscale x 16 x i8> %a) {
1051 ; CHECK-LABEL: sqadd_b_lowimm:
1052 ; CHECK:       // %bb.0:
1053 ; CHECK-NEXT:    sqadd z0.b, z0.b, #27 // =0x1b
1054 ; CHECK-NEXT:    ret
1055   %elt = insertelement <vscale x 16 x i8> undef, i8 27, i32 0
1056   %splat = shufflevector <vscale x 16 x i8> %elt, <vscale x 16 x i8> undef, <vscale x 16 x i32> zeroinitializer
1057   %out = call <vscale x 16 x i8> @llvm.aarch64.sve.sqadd.x.nxv16i8(<vscale x 16 x i8> %a,
1058                                                                    <vscale x 16 x i8> %splat)
1059   ret <vscale x 16 x i8> %out
1060 }
1061
1062 ; Immediate instruction form only supports positive values.
1063 define <vscale x 16 x i8> @sqadd_b_negimm(<vscale x 16 x i8> %a) {
1064 ; CHECK-LABEL: sqadd_b_negimm:
1065 ; CHECK:       // %bb.0:
1066 ; CHECK-NEXT:    sqsub z0.b, z0.b, #128 // =0x80
1067 ; CHECK-NEXT:    ret
1068   %elt = insertelement <vscale x 16 x i8> undef, i8 -128, i32 0
1069   %splat = shufflevector <vscale x 16 x i8> %elt, <vscale x 16 x i8> undef, <vscale x 16 x i32> zeroinitializer
1070   %out = call <vscale x 16 x i8> @llvm.aarch64.sve.sqadd.x.nxv16i8(<vscale x 16 x i8> %a,
1071                                                                    <vscale x 16 x i8> %splat)
1072   ret <vscale x 16 x i8> %out
1073 }
1074
1075 define <vscale x 8 x i16> @sqadd_h_lowimm(<vscale x 8 x i16> %a) {
1076 ; CHECK-LABEL: sqadd_h_lowimm:
1077 ; CHECK:       // %bb.0:
1078 ; CHECK-NEXT:    sqadd z0.h, z0.h, #43 // =0x2b
1079 ; CHECK-NEXT:    ret
1080   %elt = insertelement <vscale x 8 x i16> undef, i16 43, i32 0
1081   %splat = shufflevector <vscale x 8 x i16> %elt, <vscale x 8 x i16> undef, <vscale x 8 x i32> zeroinitializer
1082   %out = call <vscale x 8 x i16> @llvm.aarch64.sve.sqadd.x.nxv8i16(<vscale x 8 x i16> %a,
1083                                                                    <vscale x 8 x i16> %splat)
1084   ret <vscale x 8 x i16> %out
1085 }
1086
1087 define <vscale x 8 x i16> @sqadd_h_highimm(<vscale x 8 x i16> %a) {
1088 ; CHECK-LABEL: sqadd_h_highimm:
1089 ; CHECK:       // %bb.0:
1090 ; CHECK-NEXT:    sqadd z0.h, z0.h, #2048 // =0x800
1091 ; CHECK-NEXT:    ret
1092   %elt = insertelement <vscale x 8 x i16> undef, i16 2048, i32 0
1093   %splat = shufflevector <vscale x 8 x i16> %elt, <vscale x 8 x i16> undef, <vscale x 8 x i32> zeroinitializer
1094   %out = call <vscale x 8 x i16> @llvm.aarch64.sve.sqadd.x.nxv8i16(<vscale x 8 x i16> %a,
1095                                                                    <vscale x 8 x i16> %splat)
1096   ret <vscale x 8 x i16> %out
1097 }
1098
1099 ; Immediate instruction form only supports positive values.
1100 define <vscale x 8 x i16> @sqadd_h_negimm(<vscale x 8 x i16> %a) {
1101 ; CHECK-LABEL: sqadd_h_negimm:
1102 ; CHECK:       // %bb.0:
1103 ; CHECK-NEXT:    sqsub z0.h, z0.h, #1 // =0x1
1104 ; CHECK-NEXT:    ret
1105   %elt = insertelement <vscale x 8 x i16> undef, i16 -1, i32 0
1106   %splat = shufflevector <vscale x 8 x i16> %elt, <vscale x 8 x i16> undef, <vscale x 8 x i32> zeroinitializer
1107   %out = call <vscale x 8 x i16> @llvm.aarch64.sve.sqadd.x.nxv8i16(<vscale x 8 x i16> %a,
1108                                                                    <vscale x 8 x i16> %splat)
1109   ret <vscale x 8 x i16> %out
1110 }
1111
1112 define <vscale x 4 x i32> @sqadd_s_lowimm(<vscale x 4 x i32> %a) {
1113 ; CHECK-LABEL: sqadd_s_lowimm:
1114 ; CHECK:       // %bb.0:
1115 ; CHECK-NEXT:    sqadd z0.s, z0.s, #1 // =0x1
1116 ; CHECK-NEXT:    ret
1117   %elt = insertelement <vscale x 4 x i32> undef, i32 1, i32 0
1118   %splat = shufflevector <vscale x 4 x i32> %elt, <vscale x 4 x i32> undef, <vscale x 4 x i32> zeroinitializer
1119   %out = call <vscale x 4 x i32> @llvm.aarch64.sve.sqadd.x.nxv4i32(<vscale x 4 x i32> %a,
1120                                                                    <vscale x 4 x i32> %splat)
1121   ret <vscale x 4 x i32> %out
1122 }
1123
1124 define <vscale x 4 x i32> @sqadd_s_highimm(<vscale x 4 x i32> %a) {
1125 ; CHECK-LABEL: sqadd_s_highimm:
1126 ; CHECK:       // %bb.0:
1127 ; CHECK-NEXT:    sqadd z0.s, z0.s, #8192 // =0x2000
1128 ; CHECK-NEXT:    ret
1129   %elt = insertelement <vscale x 4 x i32> undef, i32 8192, i32 0
1130   %splat = shufflevector <vscale x 4 x i32> %elt, <vscale x 4 x i32> undef, <vscale x 4 x i32> zeroinitializer
1131   %out = call <vscale x 4 x i32> @llvm.aarch64.sve.sqadd.x.nxv4i32(<vscale x 4 x i32> %a,
1132                                                                    <vscale x 4 x i32> %splat)
1133   ret <vscale x 4 x i32> %out
1134 }
1135
1136 ; Immediate instruction form only supports positive values.
1137 define <vscale x 4 x i32> @sqadd_s_negimm(<vscale x 4 x i32> %a) {
1138 ; CHECK-LABEL: sqadd_s_negimm:
1139 ; CHECK:       // %bb.0:
1140 ; CHECK-NEXT:    sqsub z0.s, z0.s, #65280 // =0xff00
1141 ; CHECK-NEXT:    ret
1142   %elt = insertelement <vscale x 4 x i32> undef, i32 -65280, i32 0
1143   %splat = shufflevector <vscale x 4 x i32> %elt, <vscale x 4 x i32> undef, <vscale x 4 x i32> zeroinitializer
1144   %out = call <vscale x 4 x i32> @llvm.aarch64.sve.sqadd.x.nxv4i32(<vscale x 4 x i32> %a,
1145                                                                    <vscale x 4 x i32> %splat)
1146   ret <vscale x 4 x i32> %out
1147 }
1148
1149 define <vscale x 2 x i64> @sqadd_d_lowimm(<vscale x 2 x i64> %a) {
1150 ; CHECK-LABEL: sqadd_d_lowimm:
1151 ; CHECK:       // %bb.0:
1152 ; CHECK-NEXT:    sqadd z0.d, z0.d, #255 // =0xff
1153 ; CHECK-NEXT:    ret
1154   %elt = insertelement <vscale x 2 x i64> undef, i64 255, i32 0
1155   %splat = shufflevector <vscale x 2 x i64> %elt, <vscale x 2 x i64> undef, <vscale x 2 x i32> zeroinitializer
1156   %out = call <vscale x 2 x i64> @llvm.aarch64.sve.sqadd.x.nxv2i64(<vscale x 2 x i64> %a,
1157                                                                    <vscale x 2 x i64> %splat)
1158   ret <vscale x 2 x i64> %out
1159 }
1160
1161 define <vscale x 2 x i64> @sqadd_d_highimm(<vscale x 2 x i64> %a) {
1162 ; CHECK-LABEL: sqadd_d_highimm:
1163 ; CHECK:       // %bb.0:
1164 ; CHECK-NEXT:    sqadd z0.d, z0.d, #65280 // =0xff00
1165 ; CHECK-NEXT:    ret
1166   %elt = insertelement <vscale x 2 x i64> undef, i64 65280, i32 0
1167   %splat = shufflevector <vscale x 2 x i64> %elt, <vscale x 2 x i64> undef, <vscale x 2 x i32> zeroinitializer
1168   %out = call <vscale x 2 x i64> @llvm.aarch64.sve.sqadd.x.nxv2i64(<vscale x 2 x i64> %a,
1169                                                                    <vscale x 2 x i64> %splat)
1170   ret <vscale x 2 x i64> %out
1171 }
1172
1173 ; Immediate instruction form only supports positive values.
1174 define <vscale x 2 x i64> @sqadd_d_negimm(<vscale x 2 x i64> %a) {
1175 ; CHECK-LABEL: sqadd_d_negimm:
1176 ; CHECK:       // %bb.0:
1177 ; CHECK-NEXT:    sqsub z0.d, z0.d, #3840 // =0xf00
1178 ; CHECK-NEXT:    ret
1179   %elt = insertelement <vscale x 2 x i64> undef, i64 -3840, i32 0
1180   %splat = shufflevector <vscale x 2 x i64> %elt, <vscale x 2 x i64> undef, <vscale x 2 x i32> zeroinitializer
1181   %out = call <vscale x 2 x i64> @llvm.aarch64.sve.sqadd.x.nxv2i64(<vscale x 2 x i64> %a,
1182                                                                    <vscale x 2 x i64> %splat)
1183   ret <vscale x 2 x i64> %out
1184 }
1185
1186 ; SQSUB
1187
1188 define <vscale x 16 x i8> @sqsub_b_lowimm(<vscale x 16 x i8> %a) {
1189 ; CHECK-LABEL: sqsub_b_lowimm:
1190 ; CHECK:       // %bb.0:
1191 ; CHECK-NEXT:    sqsub z0.b, z0.b, #27 // =0x1b
1192 ; CHECK-NEXT:    ret
1193   %elt = insertelement <vscale x 16 x i8> undef, i8 27, i32 0
1194   %splat = shufflevector <vscale x 16 x i8> %elt, <vscale x 16 x i8> undef, <vscale x 16 x i32> zeroinitializer
1195   %out = call <vscale x 16 x i8> @llvm.aarch64.sve.sqsub.x.nxv16i8(<vscale x 16 x i8> %a,
1196                                                                    <vscale x 16 x i8> %splat)
1197   ret <vscale x 16 x i8> %out
1198 }
1199
1200 ; Immediate instruction form only supports positive values.
1201 define <vscale x 16 x i8> @sqsub_b_negimm(<vscale x 16 x i8> %a) {
1202 ; CHECK-LABEL: sqsub_b_negimm:
1203 ; CHECK:       // %bb.0:
1204 ; CHECK-NEXT:    sqadd z0.b, z0.b, #1 // =0x1
1205 ; CHECK-NEXT:    ret
1206   %elt = insertelement <vscale x 16 x i8> undef, i8 -1, i32 0
1207   %splat = shufflevector <vscale x 16 x i8> %elt, <vscale x 16 x i8> undef, <vscale x 16 x i32> zeroinitializer
1208   %out = call <vscale x 16 x i8> @llvm.aarch64.sve.sqsub.x.nxv16i8(<vscale x 16 x i8> %a,
1209                                                                    <vscale x 16 x i8> %splat)
1210   ret <vscale x 16 x i8> %out
1211 }
1212
1213 define <vscale x 8 x i16> @sqsub_h_lowimm(<vscale x 8 x i16> %a) {
1214 ; CHECK-LABEL: sqsub_h_lowimm:
1215 ; CHECK:       // %bb.0:
1216 ; CHECK-NEXT:    sqsub z0.h, z0.h, #43 // =0x2b
1217 ; CHECK-NEXT:    ret
1218   %elt = insertelement <vscale x 8 x i16> undef, i16 43, i32 0
1219   %splat = shufflevector <vscale x 8 x i16> %elt, <vscale x 8 x i16> undef, <vscale x 8 x i32> zeroinitializer
1220   %out = call <vscale x 8 x i16> @llvm.aarch64.sve.sqsub.x.nxv8i16(<vscale x 8 x i16> %a,
1221                                                                    <vscale x 8 x i16> %splat)
1222   ret <vscale x 8 x i16> %out
1223 }
1224
1225 define <vscale x 8 x i16> @sqsub_h_highimm(<vscale x 8 x i16> %a) {
1226 ; CHECK-LABEL: sqsub_h_highimm:
1227 ; CHECK:       // %bb.0:
1228 ; CHECK-NEXT:    sqsub z0.h, z0.h, #2048 // =0x800
1229 ; CHECK-NEXT:    ret
1230   %elt = insertelement <vscale x 8 x i16> undef, i16 2048, i32 0
1231   %splat = shufflevector <vscale x 8 x i16> %elt, <vscale x 8 x i16> undef, <vscale x 8 x i32> zeroinitializer
1232   %out = call <vscale x 8 x i16> @llvm.aarch64.sve.sqsub.x.nxv8i16(<vscale x 8 x i16> %a,
1233                                                                    <vscale x 8 x i16> %splat)
1234   ret <vscale x 8 x i16> %out
1235 }
1236
1237 ; Immediate instruction form only supports positive values.
1238 define <vscale x 8 x i16> @sqsub_h_negimm(<vscale x 8 x i16> %a) {
1239 ; CHECK-LABEL: sqsub_h_negimm:
1240 ; CHECK:       // %bb.0:
1241 ; CHECK-NEXT:    sqadd z0.h, z0.h, #128 // =0x80
1242 ; CHECK-NEXT:    ret
1243   %elt = insertelement <vscale x 8 x i16> undef, i16 -128, i32 0
1244   %splat = shufflevector <vscale x 8 x i16> %elt, <vscale x 8 x i16> undef, <vscale x 8 x i32> zeroinitializer
1245   %out = call <vscale x 8 x i16> @llvm.aarch64.sve.sqsub.x.nxv8i16(<vscale x 8 x i16> %a,
1246                                                                    <vscale x 8 x i16> %splat)
1247   ret <vscale x 8 x i16> %out
1248 }
1249
1250 define <vscale x 4 x i32> @sqsub_s_lowimm(<vscale x 4 x i32> %a) {
1251 ; CHECK-LABEL: sqsub_s_lowimm:
1252 ; CHECK:       // %bb.0:
1253 ; CHECK-NEXT:    sqsub z0.s, z0.s, #1 // =0x1
1254 ; CHECK-NEXT:    ret
1255   %elt = insertelement <vscale x 4 x i32> undef, i32 1, i32 0
1256   %splat = shufflevector <vscale x 4 x i32> %elt, <vscale x 4 x i32> undef, <vscale x 4 x i32> zeroinitializer
1257   %out = call <vscale x 4 x i32> @llvm.aarch64.sve.sqsub.x.nxv4i32(<vscale x 4 x i32> %a,
1258                                                                    <vscale x 4 x i32> %splat)
1259   ret <vscale x 4 x i32> %out
1260 }
1261
1262 define <vscale x 4 x i32> @sqsub_s_highimm(<vscale x 4 x i32> %a) {
1263 ; CHECK-LABEL: sqsub_s_highimm:
1264 ; CHECK:       // %bb.0:
1265 ; CHECK-NEXT:    sqsub z0.s, z0.s, #8192 // =0x2000
1266 ; CHECK-NEXT:    ret
1267   %elt = insertelement <vscale x 4 x i32> undef, i32 8192, i32 0
1268   %splat = shufflevector <vscale x 4 x i32> %elt, <vscale x 4 x i32> undef, <vscale x 4 x i32> zeroinitializer
1269   %out = call <vscale x 4 x i32> @llvm.aarch64.sve.sqsub.x.nxv4i32(<vscale x 4 x i32> %a,
1270                                                                    <vscale x 4 x i32> %splat)
1271   ret <vscale x 4 x i32> %out
1272 }
1273
1274 ; Immediate instruction form only supports positive values.
1275 define <vscale x 4 x i32> @sqsub_s_negimm(<vscale x 4 x i32> %a) {
1276 ; CHECK-LABEL: sqsub_s_negimm:
1277 ; CHECK:       // %bb.0:
1278 ; CHECK-NEXT:    sqadd z0.s, z0.s, #32768 // =0x8000
1279 ; CHECK-NEXT:    ret
1280   %elt = insertelement <vscale x 4 x i32> undef, i32 -32768, i32 0
1281   %splat = shufflevector <vscale x 4 x i32> %elt, <vscale x 4 x i32> undef, <vscale x 4 x i32> zeroinitializer
1282   %out = call <vscale x 4 x i32> @llvm.aarch64.sve.sqsub.x.nxv4i32(<vscale x 4 x i32> %a,
1283                                                                    <vscale x 4 x i32> %splat)
1284   ret <vscale x 4 x i32> %out
1285 }
1286
1287 define <vscale x 2 x i64> @sqsub_d_lowimm(<vscale x 2 x i64> %a) {
1288 ; CHECK-LABEL: sqsub_d_lowimm:
1289 ; CHECK:       // %bb.0:
1290 ; CHECK-NEXT:    sqsub z0.d, z0.d, #255 // =0xff
1291 ; CHECK-NEXT:    ret
1292   %elt = insertelement <vscale x 2 x i64> undef, i64 255, i32 0
1293   %splat = shufflevector <vscale x 2 x i64> %elt, <vscale x 2 x i64> undef, <vscale x 2 x i32> zeroinitializer
1294   %out = call <vscale x 2 x i64> @llvm.aarch64.sve.sqsub.x.nxv2i64(<vscale x 2 x i64> %a,
1295                                                                    <vscale x 2 x i64> %splat)
1296   ret <vscale x 2 x i64> %out
1297 }
1298
1299 define <vscale x 2 x i64> @sqsub_d_highimm(<vscale x 2 x i64> %a) {
1300 ; CHECK-LABEL: sqsub_d_highimm:
1301 ; CHECK:       // %bb.0:
1302 ; CHECK-NEXT:    sqsub z0.d, z0.d, #65280 // =0xff00
1303 ; CHECK-NEXT:    ret
1304   %elt = insertelement <vscale x 2 x i64> undef, i64 65280, i32 0
1305   %splat = shufflevector <vscale x 2 x i64> %elt, <vscale x 2 x i64> undef, <vscale x 2 x i32> zeroinitializer
1306   %out = call <vscale x 2 x i64> @llvm.aarch64.sve.sqsub.x.nxv2i64(<vscale x 2 x i64> %a,
1307                                                                    <vscale x 2 x i64> %splat)
1308   ret <vscale x 2 x i64> %out
1309 }
1310
1311 ; Immediate instruction form only supports positive values.
1312 define <vscale x 2 x i64> @sqsub_d_negimm(<vscale x 2 x i64> %a) {
1313 ; CHECK-LABEL: sqsub_d_negimm:
1314 ; CHECK:       // %bb.0:
1315 ; CHECK-NEXT:    sqadd z0.d, z0.d, #57344 // =0xe000
1316 ; CHECK-NEXT:    ret
1317   %elt = insertelement <vscale x 2 x i64> undef, i64 -57344, i32 0
1318   %splat = shufflevector <vscale x 2 x i64> %elt, <vscale x 2 x i64> undef, <vscale x 2 x i32> zeroinitializer
1319   %out = call <vscale x 2 x i64> @llvm.aarch64.sve.sqsub.x.nxv2i64(<vscale x 2 x i64> %a,
1320                                                                    <vscale x 2 x i64> %splat)
1321   ret <vscale x 2 x i64> %out
1322 }
1323
1324 ; UQADD
1325
1326 define <vscale x 16 x i8> @uqadd_b_lowimm(<vscale x 16 x i8> %a) {
1327 ; CHECK-LABEL: uqadd_b_lowimm:
1328 ; CHECK:       // %bb.0:
1329 ; CHECK-NEXT:    uqadd z0.b, z0.b, #27 // =0x1b
1330 ; CHECK-NEXT:    ret
1331   %elt = insertelement <vscale x 16 x i8> undef, i8 27, i32 0
1332   %splat = shufflevector <vscale x 16 x i8> %elt, <vscale x 16 x i8> undef, <vscale x 16 x i32> zeroinitializer
1333   %out = call <vscale x 16 x i8> @llvm.aarch64.sve.uqadd.x.nxv16i8(<vscale x 16 x i8> %a,
1334                                                                    <vscale x 16 x i8> %splat)
1335   ret <vscale x 16 x i8> %out
1336 }
1337
1338 define <vscale x 8 x i16> @uqadd_h_lowimm(<vscale x 8 x i16> %a) {
1339 ; CHECK-LABEL: uqadd_h_lowimm:
1340 ; CHECK:       // %bb.0:
1341 ; CHECK-NEXT:    uqadd z0.h, z0.h, #43 // =0x2b
1342 ; CHECK-NEXT:    ret
1343   %elt = insertelement <vscale x 8 x i16> undef, i16 43, i32 0
1344   %splat = shufflevector <vscale x 8 x i16> %elt, <vscale x 8 x i16> undef, <vscale x 8 x i32> zeroinitializer
1345   %out = call <vscale x 8 x i16> @llvm.aarch64.sve.uqadd.x.nxv8i16(<vscale x 8 x i16> %a,
1346                                                                    <vscale x 8 x i16> %splat)
1347   ret <vscale x 8 x i16> %out
1348 }
1349
1350 define <vscale x 8 x i16> @uqadd_h_highimm(<vscale x 8 x i16> %a) {
1351 ; CHECK-LABEL: uqadd_h_highimm:
1352 ; CHECK:       // %bb.0:
1353 ; CHECK-NEXT:    uqadd z0.h, z0.h, #2048 // =0x800
1354 ; CHECK-NEXT:    ret
1355   %elt = insertelement <vscale x 8 x i16> undef, i16 2048, i32 0
1356   %splat = shufflevector <vscale x 8 x i16> %elt, <vscale x 8 x i16> undef, <vscale x 8 x i32> zeroinitializer
1357   %out = call <vscale x 8 x i16> @llvm.aarch64.sve.uqadd.x.nxv8i16(<vscale x 8 x i16> %a,
1358                                                                    <vscale x 8 x i16> %splat)
1359   ret <vscale x 8 x i16> %out
1360 }
1361
1362 define <vscale x 4 x i32> @uqadd_s_lowimm(<vscale x 4 x i32> %a) {
1363 ; CHECK-LABEL: uqadd_s_lowimm:
1364 ; CHECK:       // %bb.0:
1365 ; CHECK-NEXT:    uqadd z0.s, z0.s, #1 // =0x1
1366 ; CHECK-NEXT:    ret
1367   %elt = insertelement <vscale x 4 x i32> undef, i32 1, i32 0
1368   %splat = shufflevector <vscale x 4 x i32> %elt, <vscale x 4 x i32> undef, <vscale x 4 x i32> zeroinitializer
1369   %out = call <vscale x 4 x i32> @llvm.aarch64.sve.uqadd.x.nxv4i32(<vscale x 4 x i32> %a,
1370                                                                    <vscale x 4 x i32> %splat)
1371   ret <vscale x 4 x i32> %out
1372 }
1373
1374 define <vscale x 4 x i32> @uqadd_s_highimm(<vscale x 4 x i32> %a) {
1375 ; CHECK-LABEL: uqadd_s_highimm:
1376 ; CHECK:       // %bb.0:
1377 ; CHECK-NEXT:    uqadd z0.s, z0.s, #8192 // =0x2000
1378 ; CHECK-NEXT:    ret
1379   %elt = insertelement <vscale x 4 x i32> undef, i32 8192, i32 0
1380   %splat = shufflevector <vscale x 4 x i32> %elt, <vscale x 4 x i32> undef, <vscale x 4 x i32> zeroinitializer
1381   %out = call <vscale x 4 x i32> @llvm.aarch64.sve.uqadd.x.nxv4i32(<vscale x 4 x i32> %a,
1382                                                                    <vscale x 4 x i32> %splat)
1383   ret <vscale x 4 x i32> %out
1384 }
1385
1386 define <vscale x 2 x i64> @uqadd_d_lowimm(<vscale x 2 x i64> %a) {
1387 ; CHECK-LABEL: uqadd_d_lowimm:
1388 ; CHECK:       // %bb.0:
1389 ; CHECK-NEXT:    uqadd z0.d, z0.d, #255 // =0xff
1390 ; CHECK-NEXT:    ret
1391   %elt = insertelement <vscale x 2 x i64> undef, i64 255, i32 0
1392   %splat = shufflevector <vscale x 2 x i64> %elt, <vscale x 2 x i64> undef, <vscale x 2 x i32> zeroinitializer
1393   %out = call <vscale x 2 x i64> @llvm.aarch64.sve.uqadd.x.nxv2i64(<vscale x 2 x i64> %a,
1394                                                                    <vscale x 2 x i64> %splat)
1395   ret <vscale x 2 x i64> %out
1396 }
1397
1398 define <vscale x 2 x i64> @uqadd_d_highimm(<vscale x 2 x i64> %a) {
1399 ; CHECK-LABEL: uqadd_d_highimm:
1400 ; CHECK:       // %bb.0:
1401 ; CHECK-NEXT:    uqadd z0.d, z0.d, #65280 // =0xff00
1402 ; CHECK-NEXT:    ret
1403   %elt = insertelement <vscale x 2 x i64> undef, i64 65280, i32 0
1404   %splat = shufflevector <vscale x 2 x i64> %elt, <vscale x 2 x i64> undef, <vscale x 2 x i32> zeroinitializer
1405   %out = call <vscale x 2 x i64> @llvm.aarch64.sve.uqadd.x.nxv2i64(<vscale x 2 x i64> %a,
1406                                                                    <vscale x 2 x i64> %splat)
1407   ret <vscale x 2 x i64> %out
1408 }
1409
1410 ; UQSUB
1411
1412 define <vscale x 16 x i8> @uqsub_b_lowimm(<vscale x 16 x i8> %a) {
1413 ; CHECK-LABEL: uqsub_b_lowimm:
1414 ; CHECK:       // %bb.0:
1415 ; CHECK-NEXT:    uqsub z0.b, z0.b, #27 // =0x1b
1416 ; CHECK-NEXT:    ret
1417   %elt = insertelement <vscale x 16 x i8> undef, i8 27, i32 0
1418   %splat = shufflevector <vscale x 16 x i8> %elt, <vscale x 16 x i8> undef, <vscale x 16 x i32> zeroinitializer
1419   %out = call <vscale x 16 x i8> @llvm.aarch64.sve.uqsub.x.nxv16i8(<vscale x 16 x i8> %a,
1420                                                                    <vscale x 16 x i8> %splat)
1421   ret <vscale x 16 x i8> %out
1422 }
1423
1424 define <vscale x 8 x i16> @uqsub_h_lowimm(<vscale x 8 x i16> %a) {
1425 ; CHECK-LABEL: uqsub_h_lowimm:
1426 ; CHECK:       // %bb.0:
1427 ; CHECK-NEXT:    uqsub z0.h, z0.h, #43 // =0x2b
1428 ; CHECK-NEXT:    ret
1429   %elt = insertelement <vscale x 8 x i16> undef, i16 43, i32 0
1430   %splat = shufflevector <vscale x 8 x i16> %elt, <vscale x 8 x i16> undef, <vscale x 8 x i32> zeroinitializer
1431   %out = call <vscale x 8 x i16> @llvm.aarch64.sve.uqsub.x.nxv8i16(<vscale x 8 x i16> %a,
1432                                                                    <vscale x 8 x i16> %splat)
1433   ret <vscale x 8 x i16> %out
1434 }
1435
1436 define <vscale x 8 x i16> @uqsub_h_highimm(<vscale x 8 x i16> %a) {
1437 ; CHECK-LABEL: uqsub_h_highimm:
1438 ; CHECK:       // %bb.0:
1439 ; CHECK-NEXT:    uqsub z0.h, z0.h, #2048 // =0x800
1440 ; CHECK-NEXT:    ret
1441   %elt = insertelement <vscale x 8 x i16> undef, i16 2048, i32 0
1442   %splat = shufflevector <vscale x 8 x i16> %elt, <vscale x 8 x i16> undef, <vscale x 8 x i32> zeroinitializer
1443   %out = call <vscale x 8 x i16> @llvm.aarch64.sve.uqsub.x.nxv8i16(<vscale x 8 x i16> %a,
1444                                                                    <vscale x 8 x i16> %splat)
1445   ret <vscale x 8 x i16> %out
1446 }
1447
1448 define <vscale x 4 x i32> @uqsub_s_lowimm(<vscale x 4 x i32> %a) {
1449 ; CHECK-LABEL: uqsub_s_lowimm:
1450 ; CHECK:       // %bb.0:
1451 ; CHECK-NEXT:    uqsub z0.s, z0.s, #1 // =0x1
1452 ; CHECK-NEXT:    ret
1453   %elt = insertelement <vscale x 4 x i32> undef, i32 1, i32 0
1454   %splat = shufflevector <vscale x 4 x i32> %elt, <vscale x 4 x i32> undef, <vscale x 4 x i32> zeroinitializer
1455   %out = call <vscale x 4 x i32> @llvm.aarch64.sve.uqsub.x.nxv4i32(<vscale x 4 x i32> %a,
1456                                                                    <vscale x 4 x i32> %splat)
1457   ret <vscale x 4 x i32> %out
1458 }
1459
1460 define <vscale x 4 x i32> @uqsub_s_highimm(<vscale x 4 x i32> %a) {
1461 ; CHECK-LABEL: uqsub_s_highimm:
1462 ; CHECK:       // %bb.0:
1463 ; CHECK-NEXT:    uqsub z0.s, z0.s, #8192 // =0x2000
1464 ; CHECK-NEXT:    ret
1465   %elt = insertelement <vscale x 4 x i32> undef, i32 8192, i32 0
1466   %splat = shufflevector <vscale x 4 x i32> %elt, <vscale x 4 x i32> undef, <vscale x 4 x i32> zeroinitializer
1467   %out = call <vscale x 4 x i32> @llvm.aarch64.sve.uqsub.x.nxv4i32(<vscale x 4 x i32> %a,
1468                                                                    <vscale x 4 x i32> %splat)
1469   ret <vscale x 4 x i32> %out
1470 }
1471
1472 define <vscale x 2 x i64> @uqsub_d_lowimm(<vscale x 2 x i64> %a) {
1473 ; CHECK-LABEL: uqsub_d_lowimm:
1474 ; CHECK:       // %bb.0:
1475 ; CHECK-NEXT:    uqsub z0.d, z0.d, #255 // =0xff
1476 ; CHECK-NEXT:    ret
1477   %elt = insertelement <vscale x 2 x i64> undef, i64 255, i32 0
1478   %splat = shufflevector <vscale x 2 x i64> %elt, <vscale x 2 x i64> undef, <vscale x 2 x i32> zeroinitializer
1479   %out = call <vscale x 2 x i64> @llvm.aarch64.sve.uqsub.x.nxv2i64(<vscale x 2 x i64> %a,
1480                                                                    <vscale x 2 x i64> %splat)
1481   ret <vscale x 2 x i64> %out
1482 }
1483
1484 define <vscale x 2 x i64> @uqsub_d_highimm(<vscale x 2 x i64> %a) {
1485 ; CHECK-LABEL: uqsub_d_highimm:
1486 ; CHECK:       // %bb.0:
1487 ; CHECK-NEXT:    uqsub z0.d, z0.d, #65280 // =0xff00
1488 ; CHECK-NEXT:    ret
1489   %elt = insertelement <vscale x 2 x i64> undef, i64 65280, i32 0
1490   %splat = shufflevector <vscale x 2 x i64> %elt, <vscale x 2 x i64> undef, <vscale x 2 x i32> zeroinitializer
1491   %out = call <vscale x 2 x i64> @llvm.aarch64.sve.uqsub.x.nxv2i64(<vscale x 2 x i64> %a,
1492                                                                    <vscale x 2 x i64> %splat)
1493   ret <vscale x 2 x i64> %out
1494 }
1495
1496 ; ASR
1497
1498 define <vscale x 16 x i8> @asr_i8(<vscale x 16 x i1> %pg, <vscale x 16 x i8> %a) {
1499 ; CHECK-LABEL: asr_i8:
1500 ; CHECK:       // %bb.0:
1501 ; CHECK-NEXT:    asr z0.b, p0/m, z0.b, #8
1502 ; CHECK-NEXT:    ret
1503   %elt = insertelement <vscale x 16 x i8> undef, i8 9, i32 0
1504   %splat = shufflevector <vscale x 16 x i8> %elt, <vscale x 16 x i8> undef, <vscale x 16 x i32> zeroinitializer
1505   %out = call <vscale x 16 x i8> @llvm.aarch64.sve.asr.nxv16i8(<vscale x 16 x i1> %pg,
1506                                                                <vscale x 16 x i8> %a,
1507                                                                <vscale x 16 x i8> %splat)
1508   ret <vscale x 16 x i8> %out
1509 }
1510
1511 define <vscale x 16 x i8> @asr_i8_all_active(<vscale x 16 x i8> %a) {
1512 ; CHECK-LABEL: asr_i8_all_active:
1513 ; CHECK:       // %bb.0:
1514 ; CHECK-NEXT:    asr z0.b, z0.b, #8
1515 ; CHECK-NEXT:    ret
1516   %pg = call <vscale x 16 x i1> @llvm.aarch64.sve.ptrue.nxv16i1(i32 31)
1517   %elt = insertelement <vscale x 16 x i8> undef, i8 8, i32 0
1518   %splat = shufflevector <vscale x 16 x i8> %elt, <vscale x 16 x i8> undef, <vscale x 16 x i32> zeroinitializer
1519   %out = call <vscale x 16 x i8> @llvm.aarch64.sve.asr.u.nxv16i8(<vscale x 16 x i1> %pg,
1520                                                                  <vscale x 16 x i8> %a,
1521                                                                  <vscale x 16 x i8> %splat)
1522   ret <vscale x 16 x i8> %out
1523 }
1524
1525 ; Ensure we don't match a right shift by zero to the immediate form.
1526 define <vscale x 16 x i8> @asr_i8_too_small(<vscale x 16 x i1> %pg, <vscale x 16 x i8> %a) {
1527 ; CHECK-LABEL: asr_i8_too_small:
1528 ; CHECK:       // %bb.0:
1529 ; CHECK-NEXT:    mov z1.b, #0 // =0x0
1530 ; CHECK-NEXT:    asr z0.b, p0/m, z0.b, z1.b
1531 ; CHECK-NEXT:    ret
1532   %out = call <vscale x 16 x i8> @llvm.aarch64.sve.asr.nxv16i8(<vscale x 16 x i1> %pg,
1533                                                                <vscale x 16 x i8> %a,
1534                                                                <vscale x 16 x i8> zeroinitializer)
1535   ret <vscale x 16 x i8> %out
1536 }
1537
1538 define <vscale x 8 x i16> @asr_i16(<vscale x 8 x i1> %pg, <vscale x 8 x i16> %a) {
1539 ; CHECK-LABEL: asr_i16:
1540 ; CHECK:       // %bb.0:
1541 ; CHECK-NEXT:    asr z0.h, p0/m, z0.h, #16
1542 ; CHECK-NEXT:    ret
1543   %elt = insertelement <vscale x 8 x i16> undef, i16 17, i32 0
1544   %splat = shufflevector <vscale x 8 x i16> %elt, <vscale x 8 x i16> undef, <vscale x 8 x i32> zeroinitializer
1545   %out = call <vscale x 8 x i16> @llvm.aarch64.sve.asr.nxv8i16(<vscale x 8 x i1> %pg,
1546                                                                <vscale x 8 x i16> %a,
1547                                                                <vscale x 8 x i16> %splat)
1548   ret <vscale x 8 x i16> %out
1549 }
1550
1551 define <vscale x 8 x i16> @asr_i16_all_active(<vscale x 8 x i16> %a) {
1552 ; CHECK-LABEL: asr_i16_all_active:
1553 ; CHECK:       // %bb.0:
1554 ; CHECK-NEXT:    asr z0.h, z0.h, #16
1555 ; CHECK-NEXT:    ret
1556   %pg = call <vscale x 8 x i1> @llvm.aarch64.sve.ptrue.nxv8i1(i32 31)
1557   %elt = insertelement <vscale x 8 x i16> undef, i16 16, i32 0
1558   %splat = shufflevector <vscale x 8 x i16> %elt, <vscale x 8 x i16> undef, <vscale x 8 x i32> zeroinitializer
1559   %out = call <vscale x 8 x i16> @llvm.aarch64.sve.asr.u.nxv8i16(<vscale x 8 x i1> %pg,
1560                                                                  <vscale x 8 x i16> %a,
1561                                                                  <vscale x 8 x i16> %splat)
1562   ret <vscale x 8 x i16> %out
1563 }
1564
1565 ; Ensure we don't match a right shift by zero to the immediate form.
1566 define <vscale x 8 x i16> @asr_i16_too_small(<vscale x 8 x i1> %pg, <vscale x 8 x i16> %a) {
1567 ; CHECK-LABEL: asr_i16_too_small:
1568 ; CHECK:       // %bb.0:
1569 ; CHECK-NEXT:    mov z1.h, #0 // =0x0
1570 ; CHECK-NEXT:    asr z0.h, p0/m, z0.h, z1.h
1571 ; CHECK-NEXT:    ret
1572   %out = call <vscale x 8 x i16> @llvm.aarch64.sve.asr.nxv8i16(<vscale x 8 x i1> %pg,
1573                                                                <vscale x 8 x i16> %a,
1574                                                                <vscale x 8 x i16> zeroinitializer)
1575   ret <vscale x 8 x i16> %out
1576 }
1577
1578 define <vscale x 4 x i32> @asr_i32(<vscale x 4 x i1> %pg, <vscale x 4 x i32> %a) {
1579 ; CHECK-LABEL: asr_i32:
1580 ; CHECK:       // %bb.0:
1581 ; CHECK-NEXT:    asr z0.s, p0/m, z0.s, #32
1582 ; CHECK-NEXT:    ret
1583   %elt = insertelement <vscale x 4 x i32> undef, i32 33, i32 0
1584   %splat = shufflevector <vscale x 4 x i32> %elt, <vscale x 4 x i32> undef, <vscale x 4 x i32> zeroinitializer
1585   %out = call <vscale x 4 x i32> @llvm.aarch64.sve.asr.nxv4i32(<vscale x 4 x i1> %pg,
1586                                                                <vscale x 4 x i32> %a,
1587                                                                <vscale x 4 x i32> %splat)
1588   ret <vscale x 4 x i32> %out
1589 }
1590
1591 define <vscale x 4 x i32> @asr_i32_all_active(<vscale x 4 x i32> %a) {
1592 ; CHECK-LABEL: asr_i32_all_active:
1593 ; CHECK:       // %bb.0:
1594 ; CHECK-NEXT:    asr z0.s, z0.s, #32
1595 ; CHECK-NEXT:    ret
1596   %pg = call <vscale x 4 x i1> @llvm.aarch64.sve.ptrue.nxv4i1(i32 31)
1597   %elt = insertelement <vscale x 4 x i32> undef, i32 32, i32 0
1598   %splat = shufflevector <vscale x 4 x i32> %elt, <vscale x 4 x i32> undef, <vscale x 4 x i32> zeroinitializer
1599   %out = call <vscale x 4 x i32> @llvm.aarch64.sve.asr.u.nxv4i32(<vscale x 4 x i1> %pg,
1600                                                                  <vscale x 4 x i32> %a,
1601                                                                  <vscale x 4 x i32> %splat)
1602   ret <vscale x 4 x i32> %out
1603 }
1604
1605 ; Ensure we don't match a right shift by zero to the immediate form.
1606 define <vscale x 4 x i32> @asr_i32_too_small(<vscale x 4 x i1> %pg, <vscale x 4 x i32> %a) {
1607 ; CHECK-LABEL: asr_i32_too_small:
1608 ; CHECK:       // %bb.0:
1609 ; CHECK-NEXT:    mov z1.s, #0 // =0x0
1610 ; CHECK-NEXT:    asr z0.s, p0/m, z0.s, z1.s
1611 ; CHECK-NEXT:    ret
1612   %out = call <vscale x 4 x i32> @llvm.aarch64.sve.asr.nxv4i32(<vscale x 4 x i1> %pg,
1613                                                                <vscale x 4 x i32> %a,
1614                                                                <vscale x 4 x i32> zeroinitializer)
1615   ret <vscale x 4 x i32> %out
1616 }
1617
1618 define <vscale x 2 x i64> @asr_i64(<vscale x 2 x i1> %pg, <vscale x 2 x i64> %a) {
1619 ; CHECK-LABEL: asr_i64:
1620 ; CHECK:       // %bb.0:
1621 ; CHECK-NEXT:    asr z0.d, p0/m, z0.d, #64
1622 ; CHECK-NEXT:    ret
1623   %elt = insertelement <vscale x 2 x i64> undef, i64 65, i64 0
1624   %splat = shufflevector <vscale x 2 x i64> %elt, <vscale x 2 x i64> undef, <vscale x 2 x i32> zeroinitializer
1625   %out = call <vscale x 2 x i64> @llvm.aarch64.sve.asr.nxv2i64(<vscale x 2 x i1> %pg,
1626                                                                <vscale x 2 x i64> %a,
1627                                                                <vscale x 2 x i64> %splat)
1628   ret <vscale x 2 x i64> %out
1629 }
1630
1631 define <vscale x 2 x i64> @asr_i64_all_active(<vscale x 2 x i64> %a) {
1632 ; CHECK-LABEL: asr_i64_all_active:
1633 ; CHECK:       // %bb.0:
1634 ; CHECK-NEXT:    asr z0.d, z0.d, #64
1635 ; CHECK-NEXT:    ret
1636   %pg = call <vscale x 2 x i1> @llvm.aarch64.sve.ptrue.nxv2i1(i32 31)
1637   %elt = insertelement <vscale x 2 x i64> undef, i64 64, i64 0
1638   %splat = shufflevector <vscale x 2 x i64> %elt, <vscale x 2 x i64> undef, <vscale x 2 x i32> zeroinitializer
1639   %out = call <vscale x 2 x i64> @llvm.aarch64.sve.asr.u.nxv2i64(<vscale x 2 x i1> %pg,
1640                                                                  <vscale x 2 x i64> %a,
1641                                                                  <vscale x 2 x i64> %splat)
1642   ret <vscale x 2 x i64> %out
1643 }
1644
1645 ; Ensure we don't match a right shift by zero to the immediate form.
1646 define <vscale x 2 x i64> @asr_i64_too_small(<vscale x 2 x i1> %pg, <vscale x 2 x i64> %a) {
1647 ; CHECK-LABEL: asr_i64_too_small:
1648 ; CHECK:       // %bb.0:
1649 ; CHECK-NEXT:    mov z1.d, #0 // =0x0
1650 ; CHECK-NEXT:    asr z0.d, p0/m, z0.d, z1.d
1651 ; CHECK-NEXT:    ret
1652   %out = call <vscale x 2 x i64> @llvm.aarch64.sve.asr.nxv2i64(<vscale x 2 x i1> %pg,
1653                                                                <vscale x 2 x i64> %a,
1654                                                                <vscale x 2 x i64> zeroinitializer)
1655   ret <vscale x 2 x i64> %out
1656 }
1657
1658 ; LSL
1659
1660 define <vscale x 16 x i8> @lsl_i8(<vscale x 16 x i1> %pg, <vscale x 16 x i8> %a) {
1661 ; CHECK-LABEL: lsl_i8:
1662 ; CHECK:       // %bb.0:
1663 ; CHECK-NEXT:    lsl z0.b, p0/m, z0.b, #7
1664 ; CHECK-NEXT:    ret
1665   %elt = insertelement <vscale x 16 x i8> undef, i8 7, i32 0
1666   %splat = shufflevector <vscale x 16 x i8> %elt, <vscale x 16 x i8> undef, <vscale x 16 x i32> zeroinitializer
1667   %out = call <vscale x 16 x i8> @llvm.aarch64.sve.lsl.nxv16i8(<vscale x 16 x i1> %pg,
1668                                                                <vscale x 16 x i8> %a,
1669                                                                <vscale x 16 x i8> %splat)
1670   ret <vscale x 16 x i8> %out
1671 }
1672
1673 define <vscale x 16 x i8> @lsl_i8_all_active(<vscale x 16 x i8> %a) {
1674 ; CHECK-LABEL: lsl_i8_all_active:
1675 ; CHECK:       // %bb.0:
1676 ; CHECK-NEXT:    lsl z0.b, z0.b, #7
1677 ; CHECK-NEXT:    ret
1678   %pg = call <vscale x 16 x i1> @llvm.aarch64.sve.ptrue.nxv16i1(i32 31)
1679   %elt = insertelement <vscale x 16 x i8> undef, i8 7, i32 0
1680   %splat = shufflevector <vscale x 16 x i8> %elt, <vscale x 16 x i8> undef, <vscale x 16 x i32> zeroinitializer
1681   %out = call <vscale x 16 x i8> @llvm.aarch64.sve.lsl.u.nxv16i8(<vscale x 16 x i1> %pg,
1682                                                                  <vscale x 16 x i8> %a,
1683                                                                  <vscale x 16 x i8> %splat)
1684   ret <vscale x 16 x i8> %out
1685 }
1686
1687 ; Ensure we don't match a left shift bigger than its bitwidth to the immediate form.
1688 define <vscale x 16 x i8> @lsl_i8_too_big(<vscale x 16 x i1> %pg, <vscale x 16 x i8> %a) {
1689 ; CHECK-LABEL: lsl_i8_too_big:
1690 ; CHECK:       // %bb.0:
1691 ; CHECK-NEXT:    mov z1.b, #8 // =0x8
1692 ; CHECK-NEXT:    lsl z0.b, p0/m, z0.b, z1.b
1693 ; CHECK-NEXT:    ret
1694   %elt = insertelement <vscale x 16 x i8> undef, i8 8, i32 0
1695   %splat = shufflevector <vscale x 16 x i8> %elt, <vscale x 16 x i8> undef, <vscale x 16 x i32> zeroinitializer
1696   %out = call <vscale x 16 x i8> @llvm.aarch64.sve.lsl.nxv16i8(<vscale x 16 x i1> %pg,
1697                                                                <vscale x 16 x i8> %a,
1698                                                                <vscale x 16 x i8> %splat)
1699   ret <vscale x 16 x i8> %out
1700 }
1701
1702 define <vscale x 16 x i8> @lsl_i8_zero(<vscale x 16 x i1> %pg, <vscale x 16 x i8> %a) {
1703 ; CHECK-LABEL: lsl_i8_zero:
1704 ; CHECK:       // %bb.0:
1705 ; CHECK-NEXT:    lsl z0.b, p0/m, z0.b, #0
1706 ; CHECK-NEXT:    ret
1707   %out = call <vscale x 16 x i8> @llvm.aarch64.sve.lsl.nxv16i8(<vscale x 16 x i1> %pg,
1708                                                                <vscale x 16 x i8> %a,
1709                                                                <vscale x 16 x i8> zeroinitializer)
1710   ret <vscale x 16 x i8> %out
1711 }
1712
1713 define <vscale x 8 x i16> @lsl_i16(<vscale x 8 x i1> %pg, <vscale x 8 x i16> %a) {
1714 ; CHECK-LABEL: lsl_i16:
1715 ; CHECK:       // %bb.0:
1716 ; CHECK-NEXT:    lsl z0.h, p0/m, z0.h, #15
1717 ; CHECK-NEXT:    ret
1718   %elt = insertelement <vscale x 8 x i16> undef, i16 15, i32 0
1719   %splat = shufflevector <vscale x 8 x i16> %elt, <vscale x 8 x i16> undef, <vscale x 8 x i32> zeroinitializer
1720   %out = call <vscale x 8 x i16> @llvm.aarch64.sve.lsl.nxv8i16(<vscale x 8 x i1> %pg,
1721                                                                <vscale x 8 x i16> %a,
1722                                                                <vscale x 8 x i16> %splat)
1723   ret <vscale x 8 x i16> %out
1724 }
1725
1726 define <vscale x 8 x i16> @lsl_i16_all_active(<vscale x 8 x i16> %a) {
1727 ; CHECK-LABEL: lsl_i16_all_active:
1728 ; CHECK:       // %bb.0:
1729 ; CHECK-NEXT:    lsl z0.h, z0.h, #15
1730 ; CHECK-NEXT:    ret
1731   %pg = call <vscale x 8 x i1> @llvm.aarch64.sve.ptrue.nxv8i1(i32 31)
1732   %elt = insertelement <vscale x 8 x i16> undef, i16 15, i32 0
1733   %splat = shufflevector <vscale x 8 x i16> %elt, <vscale x 8 x i16> undef, <vscale x 8 x i32> zeroinitializer
1734   %out = call <vscale x 8 x i16> @llvm.aarch64.sve.lsl.u.nxv8i16(<vscale x 8 x i1> %pg,
1735                                                                  <vscale x 8 x i16> %a,
1736                                                                  <vscale x 8 x i16> %splat)
1737   ret <vscale x 8 x i16> %out
1738 }
1739
1740 ; Ensure we don't match a left shift bigger than its bitwidth to the immediate form.
1741 define <vscale x 8 x i16> @lsl_i16_too_big(<vscale x 8 x i1> %pg, <vscale x 8 x i16> %a) {
1742 ; CHECK-LABEL: lsl_i16_too_big:
1743 ; CHECK:       // %bb.0:
1744 ; CHECK-NEXT:    mov z1.h, #16 // =0x10
1745 ; CHECK-NEXT:    lsl z0.h, p0/m, z0.h, z1.h
1746 ; CHECK-NEXT:    ret
1747   %elt = insertelement <vscale x 8 x i16> undef, i16 16, i32 0
1748   %splat = shufflevector <vscale x 8 x i16> %elt, <vscale x 8 x i16> undef, <vscale x 8 x i32> zeroinitializer
1749   %out = call <vscale x 8 x i16> @llvm.aarch64.sve.lsl.nxv8i16(<vscale x 8 x i1> %pg,
1750                                                                <vscale x 8 x i16> %a,
1751                                                                <vscale x 8 x i16> %splat)
1752   ret <vscale x 8 x i16> %out
1753 }
1754
1755 define <vscale x 8 x i16> @lsl_i16_zero(<vscale x 8 x i1> %pg, <vscale x 8 x i16> %a) {
1756 ; CHECK-LABEL: lsl_i16_zero:
1757 ; CHECK:       // %bb.0:
1758 ; CHECK-NEXT:    lsl z0.h, p0/m, z0.h, #0
1759 ; CHECK-NEXT:    ret
1760   %out = call <vscale x 8 x i16> @llvm.aarch64.sve.lsl.nxv8i16(<vscale x 8 x i1> %pg,
1761                                                                <vscale x 8 x i16> %a,
1762                                                                <vscale x 8 x i16> zeroinitializer)
1763   ret <vscale x 8 x i16> %out
1764 }
1765
1766 define <vscale x 4 x i32> @lsl_i32(<vscale x 4 x i1> %pg, <vscale x 4 x i32> %a) {
1767 ; CHECK-LABEL: lsl_i32:
1768 ; CHECK:       // %bb.0:
1769 ; CHECK-NEXT:    lsl z0.s, p0/m, z0.s, #31
1770 ; CHECK-NEXT:    ret
1771   %elt = insertelement <vscale x 4 x i32> undef, i32 31, i32 0
1772   %splat = shufflevector <vscale x 4 x i32> %elt, <vscale x 4 x i32> undef, <vscale x 4 x i32> zeroinitializer
1773   %out = call <vscale x 4 x i32> @llvm.aarch64.sve.lsl.nxv4i32(<vscale x 4 x i1> %pg,
1774                                                                <vscale x 4 x i32> %a,
1775                                                                <vscale x 4 x i32> %splat)
1776   ret <vscale x 4 x i32> %out
1777 }
1778
1779 define <vscale x 4 x i32> @lsl_i32_all_active(<vscale x 4 x i32> %a) {
1780 ; CHECK-LABEL: lsl_i32_all_active:
1781 ; CHECK:       // %bb.0:
1782 ; CHECK-NEXT:    lsl z0.s, z0.s, #31
1783 ; CHECK-NEXT:    ret
1784   %pg = call <vscale x 4 x i1> @llvm.aarch64.sve.ptrue.nxv4i1(i32 31)
1785   %elt = insertelement <vscale x 4 x i32> undef, i32 31, i32 0
1786   %splat = shufflevector <vscale x 4 x i32> %elt, <vscale x 4 x i32> undef, <vscale x 4 x i32> zeroinitializer
1787   %out = call <vscale x 4 x i32> @llvm.aarch64.sve.lsl.u.nxv4i32(<vscale x 4 x i1> %pg,
1788                                                                  <vscale x 4 x i32> %a,
1789                                                                  <vscale x 4 x i32> %splat)
1790   ret <vscale x 4 x i32> %out
1791 }
1792
1793 ; Ensure we don't match a left shift bigger than its bitwidth to the immediate form.
1794 define <vscale x 4 x i32> @lsl_i32_too_big(<vscale x 4 x i1> %pg, <vscale x 4 x i32> %a) {
1795 ; CHECK-LABEL: lsl_i32_too_big:
1796 ; CHECK:       // %bb.0:
1797 ; CHECK-NEXT:    mov z1.s, #32 // =0x20
1798 ; CHECK-NEXT:    lsl z0.s, p0/m, z0.s, z1.s
1799 ; CHECK-NEXT:    ret
1800   %elt = insertelement <vscale x 4 x i32> undef, i32 32, i32 0
1801   %splat = shufflevector <vscale x 4 x i32> %elt, <vscale x 4 x i32> undef, <vscale x 4 x i32> zeroinitializer
1802   %out = call <vscale x 4 x i32> @llvm.aarch64.sve.lsl.nxv4i32(<vscale x 4 x i1> %pg,
1803                                                                <vscale x 4 x i32> %a,
1804                                                                <vscale x 4 x i32> %splat)
1805   ret <vscale x 4 x i32> %out
1806 }
1807
1808 define <vscale x 4 x i32> @lsl_i32_zero(<vscale x 4 x i1> %pg, <vscale x 4 x i32> %a) {
1809 ; CHECK-LABEL: lsl_i32_zero:
1810 ; CHECK:       // %bb.0:
1811 ; CHECK-NEXT:    lsl z0.s, p0/m, z0.s, #0
1812 ; CHECK-NEXT:    ret
1813   %out = call <vscale x 4 x i32> @llvm.aarch64.sve.lsl.nxv4i32(<vscale x 4 x i1> %pg,
1814                                                                <vscale x 4 x i32> %a,
1815                                                                <vscale x 4 x i32> zeroinitializer)
1816   ret <vscale x 4 x i32> %out
1817 }
1818
1819 define <vscale x 2 x i64> @lsl_i64(<vscale x 2 x i1> %pg, <vscale x 2 x i64> %a) {
1820 ; CHECK-LABEL: lsl_i64:
1821 ; CHECK:       // %bb.0:
1822 ; CHECK-NEXT:    lsl z0.d, p0/m, z0.d, #63
1823 ; CHECK-NEXT:    ret
1824   %elt = insertelement <vscale x 2 x i64> undef, i64 63, i64 0
1825   %splat = shufflevector <vscale x 2 x i64> %elt, <vscale x 2 x i64> undef, <vscale x 2 x i32> zeroinitializer
1826   %out = call <vscale x 2 x i64> @llvm.aarch64.sve.lsl.nxv2i64(<vscale x 2 x i1> %pg,
1827                                                                <vscale x 2 x i64> %a,
1828                                                                <vscale x 2 x i64> %splat)
1829   ret <vscale x 2 x i64> %out
1830 }
1831
1832 define <vscale x 2 x i64> @lsl_i64_all_active(<vscale x 2 x i64> %a) {
1833 ; CHECK-LABEL: lsl_i64_all_active:
1834 ; CHECK:       // %bb.0:
1835 ; CHECK-NEXT:    lsl z0.d, z0.d, #63
1836 ; CHECK-NEXT:    ret
1837   %pg = call <vscale x 2 x i1> @llvm.aarch64.sve.ptrue.nxv2i1(i32 31)
1838   %elt = insertelement <vscale x 2 x i64> undef, i64 63, i64 0
1839   %splat = shufflevector <vscale x 2 x i64> %elt, <vscale x 2 x i64> undef, <vscale x 2 x i32> zeroinitializer
1840   %out = call <vscale x 2 x i64> @llvm.aarch64.sve.lsl.u.nxv2i64(<vscale x 2 x i1> %pg,
1841                                                                  <vscale x 2 x i64> %a,
1842                                                                  <vscale x 2 x i64> %splat)
1843   ret <vscale x 2 x i64> %out
1844 }
1845
1846 ; Ensure we don't match a left shift bigger than its bitwidth to the immediate form.
1847 define <vscale x 2 x i64> @lsl_i64_too_big(<vscale x 2 x i1> %pg, <vscale x 2 x i64> %a) {
1848 ; CHECK-LABEL: lsl_i64_too_big:
1849 ; CHECK:       // %bb.0:
1850 ; CHECK-NEXT:    mov z1.d, #64 // =0x40
1851 ; CHECK-NEXT:    lsl z0.d, p0/m, z0.d, z1.d
1852 ; CHECK-NEXT:    ret
1853   %elt = insertelement <vscale x 2 x i64> undef, i64 64, i64 0
1854   %splat = shufflevector <vscale x 2 x i64> %elt, <vscale x 2 x i64> undef, <vscale x 2 x i32> zeroinitializer
1855   %out = call <vscale x 2 x i64> @llvm.aarch64.sve.lsl.nxv2i64(<vscale x 2 x i1> %pg,
1856                                                                <vscale x 2 x i64> %a,
1857                                                                <vscale x 2 x i64> %splat)
1858   ret <vscale x 2 x i64> %out
1859 }
1860
1861 define <vscale x 2 x i64> @lsl_i64_zero(<vscale x 2 x i1> %pg, <vscale x 2 x i64> %a) {
1862 ; CHECK-LABEL: lsl_i64_zero:
1863 ; CHECK:       // %bb.0:
1864 ; CHECK-NEXT:    lsl z0.d, p0/m, z0.d, #0
1865 ; CHECK-NEXT:    ret
1866   %out = call <vscale x 2 x i64> @llvm.aarch64.sve.lsl.nxv2i64(<vscale x 2 x i1> %pg,
1867                                                                <vscale x 2 x i64> %a,
1868                                                                <vscale x 2 x i64> zeroinitializer)
1869   ret <vscale x 2 x i64> %out
1870 }
1871
1872 ; LSR
1873
1874 define <vscale x 16 x i8> @lsr_i8(<vscale x 16 x i1> %pg, <vscale x 16 x i8> %a) {
1875 ; CHECK-LABEL: lsr_i8:
1876 ; CHECK:       // %bb.0:
1877 ; CHECK-NEXT:    lsr z0.b, p0/m, z0.b, #8
1878 ; CHECK-NEXT:    ret
1879   %elt = insertelement <vscale x 16 x i8> undef, i8 9, i32 0
1880   %splat = shufflevector <vscale x 16 x i8> %elt, <vscale x 16 x i8> undef, <vscale x 16 x i32> zeroinitializer
1881   %out = call <vscale x 16 x i8> @llvm.aarch64.sve.lsr.nxv16i8(<vscale x 16 x i1> %pg,
1882                                                                <vscale x 16 x i8> %a,
1883                                                                <vscale x 16 x i8> %splat)
1884   ret <vscale x 16 x i8> %out
1885 }
1886
1887 define <vscale x 16 x i8> @lsr_i8_all_active(<vscale x 16 x i8> %a) {
1888 ; CHECK-LABEL: lsr_i8_all_active:
1889 ; CHECK:       // %bb.0:
1890 ; CHECK-NEXT:    lsr z0.b, z0.b, #8
1891 ; CHECK-NEXT:    ret
1892   %pg = call <vscale x 16 x i1> @llvm.aarch64.sve.ptrue.nxv16i1(i32 31)
1893   %elt = insertelement <vscale x 16 x i8> undef, i8 8, i32 0
1894   %splat = shufflevector <vscale x 16 x i8> %elt, <vscale x 16 x i8> undef, <vscale x 16 x i32> zeroinitializer
1895   %out = call <vscale x 16 x i8> @llvm.aarch64.sve.lsr.u.nxv16i8(<vscale x 16 x i1> %pg,
1896                                                                  <vscale x 16 x i8> %a,
1897                                                                  <vscale x 16 x i8> %splat)
1898   ret <vscale x 16 x i8> %out
1899 }
1900
1901 ; Ensure we don't match a right shift by zero to the immediate form.
1902 define <vscale x 16 x i8> @lsr_i8_too_small(<vscale x 16 x i1> %pg, <vscale x 16 x i8> %a) {
1903 ; CHECK-LABEL: lsr_i8_too_small:
1904 ; CHECK:       // %bb.0:
1905 ; CHECK-NEXT:    mov z1.b, #0 // =0x0
1906 ; CHECK-NEXT:    lsr z0.b, p0/m, z0.b, z1.b
1907 ; CHECK-NEXT:    ret
1908   %out = call <vscale x 16 x i8> @llvm.aarch64.sve.lsr.nxv16i8(<vscale x 16 x i1> %pg,
1909                                                                <vscale x 16 x i8> %a,
1910                                                                <vscale x 16 x i8> zeroinitializer)
1911   ret <vscale x 16 x i8> %out
1912 }
1913
1914 define <vscale x 8 x i16> @lsr_i16(<vscale x 8 x i1> %pg, <vscale x 8 x i16> %a) {
1915 ; CHECK-LABEL: lsr_i16:
1916 ; CHECK:       // %bb.0:
1917 ; CHECK-NEXT:    lsr z0.h, p0/m, z0.h, #16
1918 ; CHECK-NEXT:    ret
1919   %elt = insertelement <vscale x 8 x i16> undef, i16 17, i32 0
1920   %splat = shufflevector <vscale x 8 x i16> %elt, <vscale x 8 x i16> undef, <vscale x 8 x i32> zeroinitializer
1921   %out = call <vscale x 8 x i16> @llvm.aarch64.sve.lsr.nxv8i16(<vscale x 8 x i1> %pg,
1922                                                                <vscale x 8 x i16> %a,
1923                                                                <vscale x 8 x i16> %splat)
1924   ret <vscale x 8 x i16> %out
1925 }
1926
1927 define <vscale x 8 x i16> @lsr_i16_all_active(<vscale x 8 x i16> %a) {
1928 ; CHECK-LABEL: lsr_i16_all_active:
1929 ; CHECK:       // %bb.0:
1930 ; CHECK-NEXT:    lsr z0.h, z0.h, #16
1931 ; CHECK-NEXT:    ret
1932   %pg = call <vscale x 8 x i1> @llvm.aarch64.sve.ptrue.nxv8i1(i32 31)
1933   %elt = insertelement <vscale x 8 x i16> undef, i16 16, i32 0
1934   %splat = shufflevector <vscale x 8 x i16> %elt, <vscale x 8 x i16> undef, <vscale x 8 x i32> zeroinitializer
1935   %out = call <vscale x 8 x i16> @llvm.aarch64.sve.lsr.u.nxv8i16(<vscale x 8 x i1> %pg,
1936                                                                  <vscale x 8 x i16> %a,
1937                                                                  <vscale x 8 x i16> %splat)
1938   ret <vscale x 8 x i16> %out
1939 }
1940
1941 ; Ensure we don't match a right shift by zero to the immediate form.
1942 define <vscale x 8 x i16> @lsr_i16_too_small(<vscale x 8 x i1> %pg, <vscale x 8 x i16> %a) {
1943 ; CHECK-LABEL: lsr_i16_too_small:
1944 ; CHECK:       // %bb.0:
1945 ; CHECK-NEXT:    mov z1.h, #0 // =0x0
1946 ; CHECK-NEXT:    lsr z0.h, p0/m, z0.h, z1.h
1947 ; CHECK-NEXT:    ret
1948   %out = call <vscale x 8 x i16> @llvm.aarch64.sve.lsr.nxv8i16(<vscale x 8 x i1> %pg,
1949                                                                <vscale x 8 x i16> %a,
1950                                                                <vscale x 8 x i16> zeroinitializer)
1951   ret <vscale x 8 x i16> %out
1952 }
1953
1954 define <vscale x 4 x i32> @lsr_i32(<vscale x 4 x i1> %pg, <vscale x 4 x i32> %a) {
1955 ; CHECK-LABEL: lsr_i32:
1956 ; CHECK:       // %bb.0:
1957 ; CHECK-NEXT:    lsr z0.s, p0/m, z0.s, #32
1958 ; CHECK-NEXT:    ret
1959   %elt = insertelement <vscale x 4 x i32> undef, i32 33, i32 0
1960   %splat = shufflevector <vscale x 4 x i32> %elt, <vscale x 4 x i32> undef, <vscale x 4 x i32> zeroinitializer
1961   %out = call <vscale x 4 x i32> @llvm.aarch64.sve.lsr.nxv4i32(<vscale x 4 x i1> %pg,
1962                                                                <vscale x 4 x i32> %a,
1963                                                                <vscale x 4 x i32> %splat)
1964   ret <vscale x 4 x i32> %out
1965 }
1966
1967 define <vscale x 4 x i32> @lsr_i32_all_active(<vscale x 4 x i32> %a) {
1968 ; CHECK-LABEL: lsr_i32_all_active:
1969 ; CHECK:       // %bb.0:
1970 ; CHECK-NEXT:    lsr z0.s, z0.s, #32
1971 ; CHECK-NEXT:    ret
1972   %pg = call <vscale x 4 x i1> @llvm.aarch64.sve.ptrue.nxv4i1(i32 31)
1973   %elt = insertelement <vscale x 4 x i32> undef, i32 32, i32 0
1974   %splat = shufflevector <vscale x 4 x i32> %elt, <vscale x 4 x i32> undef, <vscale x 4 x i32> zeroinitializer
1975   %out = call <vscale x 4 x i32> @llvm.aarch64.sve.lsr.u.nxv4i32(<vscale x 4 x i1> %pg,
1976                                                                  <vscale x 4 x i32> %a,
1977                                                                  <vscale x 4 x i32> %splat)
1978   ret <vscale x 4 x i32> %out
1979 }
1980
1981 ; Ensure we don't match a right shift by zero to the immediate form.
1982 define <vscale x 4 x i32> @lsr_i32_too_small(<vscale x 4 x i1> %pg, <vscale x 4 x i32> %a) {
1983 ; CHECK-LABEL: lsr_i32_too_small:
1984 ; CHECK:       // %bb.0:
1985 ; CHECK-NEXT:    mov z1.s, #0 // =0x0
1986 ; CHECK-NEXT:    lsr z0.s, p0/m, z0.s, z1.s
1987 ; CHECK-NEXT:    ret
1988   %out = call <vscale x 4 x i32> @llvm.aarch64.sve.lsr.nxv4i32(<vscale x 4 x i1> %pg,
1989                                                                <vscale x 4 x i32> %a,
1990                                                                <vscale x 4 x i32> zeroinitializer)
1991   ret <vscale x 4 x i32> %out
1992 }
1993
1994 define <vscale x 2 x i64> @lsr_i64(<vscale x 2 x i1> %pg, <vscale x 2 x i64> %a) {
1995 ; CHECK-LABEL: lsr_i64:
1996 ; CHECK:       // %bb.0:
1997 ; CHECK-NEXT:    lsr z0.d, p0/m, z0.d, #64
1998 ; CHECK-NEXT:    ret
1999   %elt = insertelement <vscale x 2 x i64> undef, i64 65, i64 0
2000   %splat = shufflevector <vscale x 2 x i64> %elt, <vscale x 2 x i64> undef, <vscale x 2 x i32> zeroinitializer
2001   %out = call <vscale x 2 x i64> @llvm.aarch64.sve.lsr.nxv2i64(<vscale x 2 x i1> %pg,
2002                                                                <vscale x 2 x i64> %a,
2003                                                                <vscale x 2 x i64> %splat)
2004   ret <vscale x 2 x i64> %out
2005 }
2006
2007 define <vscale x 2 x i64> @lsr_i64_all_active(<vscale x 2 x i64> %a) {
2008 ; CHECK-LABEL: lsr_i64_all_active:
2009 ; CHECK:       // %bb.0:
2010 ; CHECK-NEXT:    lsr z0.d, z0.d, #64
2011 ; CHECK-NEXT:    ret
2012   %pg = call <vscale x 2 x i1> @llvm.aarch64.sve.ptrue.nxv2i1(i32 31)
2013   %elt = insertelement <vscale x 2 x i64> undef, i64 64, i64 0
2014   %splat = shufflevector <vscale x 2 x i64> %elt, <vscale x 2 x i64> undef, <vscale x 2 x i32> zeroinitializer
2015   %out = call <vscale x 2 x i64> @llvm.aarch64.sve.lsr.u.nxv2i64(<vscale x 2 x i1> %pg,
2016                                                                  <vscale x 2 x i64> %a,
2017                                                                  <vscale x 2 x i64> %splat)
2018   ret <vscale x 2 x i64> %out
2019 }
2020
2021 ; Ensure we don't match a right shift by zero to the immediate form.
2022 define <vscale x 2 x i64> @lsr_i64_too_small(<vscale x 2 x i1> %pg, <vscale x 2 x i64> %a) {
2023 ; CHECK-LABEL: lsr_i64_too_small:
2024 ; CHECK:       // %bb.0:
2025 ; CHECK-NEXT:    mov z1.d, #0 // =0x0
2026 ; CHECK-NEXT:    lsr z0.d, p0/m, z0.d, z1.d
2027 ; CHECK-NEXT:    ret
2028   %out = call <vscale x 2 x i64> @llvm.aarch64.sve.lsr.nxv2i64(<vscale x 2 x i1> %pg,
2029                                                                <vscale x 2 x i64> %a,
2030                                                                <vscale x 2 x i64> zeroinitializer)
2031   ret <vscale x 2 x i64> %out
2032 }
2033
2034 ; As lsr_i32 but where pg is i8 based and thus compatible for i32.
2035 define <vscale x 4 x i32> @lsr_i32_ptrue_all_b(<vscale x 4 x i32> %a) #0 {
2036 ; CHECK-LABEL: lsr_i32_ptrue_all_b:
2037 ; CHECK:       // %bb.0:
2038 ; CHECK-NEXT:    lsr z0.s, z0.s, #1
2039 ; CHECK-NEXT:    ret
2040   %pg.b = tail call <vscale x 16 x i1> @llvm.aarch64.sve.ptrue.nxv16i1(i32 31)
2041   %pg.s = tail call <vscale x 4 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv4i1(<vscale x 16 x i1> %pg.b)
2042   %b = tail call <vscale x 4 x i32> @llvm.aarch64.sve.dup.x.nxv4i32(i32 1)
2043   %out = tail call <vscale x 4 x i32> @llvm.aarch64.sve.lsr.u.nxv4i32(<vscale x 4 x i1> %pg.s,
2044                                                                       <vscale x 4 x i32> %a,
2045                                                                       <vscale x 4 x i32> %b)
2046   ret <vscale x 4 x i32> %out
2047 }
2048
2049 ; As lsr_i32 but where pg is i16 based and thus compatible for i32.
2050 define <vscale x 4 x i32> @lsr_i32_ptrue_all_h(<vscale x 4 x i32> %a) #0 {
2051 ; CHECK-LABEL: lsr_i32_ptrue_all_h:
2052 ; CHECK:       // %bb.0:
2053 ; CHECK-NEXT:    lsr z0.s, z0.s, #1
2054 ; CHECK-NEXT:    ret
2055   %pg.h = tail call <vscale x 8 x i1> @llvm.aarch64.sve.ptrue.nxv8i1(i32 31)
2056   %pg.b = tail call <vscale x 16 x i1> @llvm.aarch64.sve.convert.to.svbool.nxv8i1(<vscale x 8 x i1> %pg.h)
2057   %pg.s = tail call <vscale x 4 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv4i1(<vscale x 16 x i1> %pg.b)
2058   %b = tail call <vscale x 4 x i32> @llvm.aarch64.sve.dup.x.nxv4i32(i32 1)
2059   %out = tail call <vscale x 4 x i32> @llvm.aarch64.sve.lsr.u.nxv4i32(<vscale x 4 x i1> %pg.s,
2060                                                                       <vscale x 4 x i32> %a,
2061                                                                       <vscale x 4 x i32> %b)
2062   ret <vscale x 4 x i32> %out
2063 }
2064
2065 ; As lsr_i32 but where pg is i64 based, which is not compatibile for i32 and
2066 ; thus inactive lanes are important and the immediate form cannot be used.
2067 define <vscale x 4 x i32> @lsr_i32_ptrue_all_d(<vscale x 4 x i32> %a) #0 {
2068 ; CHECK-LABEL: lsr_i32_ptrue_all_d:
2069 ; CHECK:       // %bb.0:
2070 ; CHECK-NEXT:    ptrue p0.d
2071 ; CHECK-NEXT:    lsr z0.s, p0/m, z0.s, #1
2072 ; CHECK-NEXT:    ret
2073   %pg.d = tail call <vscale x 2 x i1> @llvm.aarch64.sve.ptrue.nxv2i1(i32 31)
2074   %pg.b = tail call <vscale x 16 x i1> @llvm.aarch64.sve.convert.to.svbool.nxv2i1(<vscale x 2 x i1> %pg.d)
2075   %pg.s = tail call <vscale x 4 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv4i1(<vscale x 16 x i1> %pg.b)
2076   %b = tail call <vscale x 4 x i32> @llvm.aarch64.sve.dup.x.nxv4i32(i32 1)
2077   %out = tail call <vscale x 4 x i32> @llvm.aarch64.sve.lsr.nxv4i32(<vscale x 4 x i1> %pg.s,
2078                                                                     <vscale x 4 x i32> %a,
2079                                                                     <vscale x 4 x i32> %b)
2080   ret <vscale x 4 x i32> %out
2081 }
2082
2083 ;
2084 ; MUL
2085 ;
2086
2087 ; As mul_i32 but where pg is i8 based and thus compatible for i32.
2088 define <vscale x 4 x i32> @mul_i32_ptrue_all_b(<vscale x 4 x i32> %a) #0 {
2089 ; CHECK-LABEL: mul_i32_ptrue_all_b:
2090 ; CHECK:       // %bb.0:
2091 ; CHECK-NEXT:    mul z0.s, z0.s, #1
2092 ; CHECK-NEXT:    ret
2093   %pg.b = tail call <vscale x 16 x i1> @llvm.aarch64.sve.ptrue.nxv16i1(i32 31)
2094   %pg.s = tail call <vscale x 4 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv4i1(<vscale x 16 x i1> %pg.b)
2095   %b = tail call <vscale x 4 x i32> @llvm.aarch64.sve.dup.x.nxv4i32(i32 1)
2096   %out = tail call <vscale x 4 x i32> @llvm.aarch64.sve.mul.u.nxv4i32(<vscale x 4 x i1> %pg.s,
2097                                                                       <vscale x 4 x i32> %a,
2098                                                                       <vscale x 4 x i32> %b)
2099   ret <vscale x 4 x i32> %out
2100 }
2101
2102 ; As mul_i32 but where pg is i16 based and thus compatible for i32.
2103 define <vscale x 4 x i32> @mul_i32_ptrue_all_h(<vscale x 4 x i32> %a) #0 {
2104 ; CHECK-LABEL: mul_i32_ptrue_all_h:
2105 ; CHECK:       // %bb.0:
2106 ; CHECK-NEXT:    mul z0.s, z0.s, #1
2107 ; CHECK-NEXT:    ret
2108   %pg.h = tail call <vscale x 8 x i1> @llvm.aarch64.sve.ptrue.nxv8i1(i32 31)
2109   %pg.b = tail call <vscale x 16 x i1> @llvm.aarch64.sve.convert.to.svbool.nxv8i1(<vscale x 8 x i1> %pg.h)
2110   %pg.s = tail call <vscale x 4 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv4i1(<vscale x 16 x i1> %pg.b)
2111   %b = tail call <vscale x 4 x i32> @llvm.aarch64.sve.dup.x.nxv4i32(i32 1)
2112   %out = tail call <vscale x 4 x i32> @llvm.aarch64.sve.mul.u.nxv4i32(<vscale x 4 x i1> %pg.s,
2113                                                                       <vscale x 4 x i32> %a,
2114                                                                       <vscale x 4 x i32> %b)
2115   ret <vscale x 4 x i32> %out
2116 }
2117
2118 ; As mul_i32 but where pg is i64 based, which is not compatibile for i32 and
2119 ; thus inactive lanes are important and the immediate form cannot be used.
2120 define <vscale x 4 x i32> @mul_i32_ptrue_all_d(<vscale x 4 x i32> %a) #0 {
2121 ; CHECK-LABEL: mul_i32_ptrue_all_d:
2122 ; CHECK:       // %bb.0:
2123 ; CHECK-NEXT:    mov z1.s, #1 // =0x1
2124 ; CHECK-NEXT:    ptrue p0.d
2125 ; CHECK-NEXT:    mul z0.s, p0/m, z0.s, z1.s
2126 ; CHECK-NEXT:    ret
2127   %pg.d = tail call <vscale x 2 x i1> @llvm.aarch64.sve.ptrue.nxv2i1(i32 31)
2128   %pg.b = tail call <vscale x 16 x i1> @llvm.aarch64.sve.convert.to.svbool.nxv2i1(<vscale x 2 x i1> %pg.d)
2129   %pg.s = tail call <vscale x 4 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv4i1(<vscale x 16 x i1> %pg.b)
2130   %b = tail call <vscale x 4 x i32> @llvm.aarch64.sve.dup.x.nxv4i32(i32 1)
2131   %out = tail call <vscale x 4 x i32> @llvm.aarch64.sve.mul.nxv4i32(<vscale x 4 x i1> %pg.s,
2132                                                                     <vscale x 4 x i32> %a,
2133                                                                     <vscale x 4 x i32> %b)
2134   ret <vscale x 4 x i32> %out
2135 }
2136
2137 declare <vscale x 16 x i8> @llvm.aarch64.sve.add.u.nxv16i8(<vscale x 16 x i1>, <vscale x 16 x i8>, <vscale x 16 x i8>)
2138 declare <vscale x 8 x i16> @llvm.aarch64.sve.add.u.nxv8i16(<vscale x 8 x i1>, <vscale x 8 x i16>, <vscale x 8 x i16>)
2139 declare <vscale x 4 x i32> @llvm.aarch64.sve.add.u.nxv4i32(<vscale x 4 x i1>, <vscale x 4 x i32>, <vscale x 4 x i32>)
2140 declare <vscale x 2 x i64> @llvm.aarch64.sve.add.u.nxv2i64(<vscale x 2 x i1>, <vscale x 2 x i64>, <vscale x 2 x i64>)
2141
2142 declare <vscale x 4 x i32> @llvm.aarch64.sve.sub.nxv4i32(<vscale x 4 x i1>, <vscale x 4 x i32>, <vscale x 4 x i32>)
2143
2144 declare <vscale x 16 x i8> @llvm.aarch64.sve.sub.u.nxv16i8(<vscale x 16 x i1>, <vscale x 16 x i8>, <vscale x 16 x i8>)
2145 declare <vscale x 8 x i16> @llvm.aarch64.sve.sub.u.nxv8i16(<vscale x 8 x i1>, <vscale x 8 x i16>, <vscale x 8 x i16>)
2146 declare <vscale x 4 x i32> @llvm.aarch64.sve.sub.u.nxv4i32(<vscale x 4 x i1>, <vscale x 4 x i32>, <vscale x 4 x i32>)
2147 declare <vscale x 2 x i64> @llvm.aarch64.sve.sub.u.nxv2i64(<vscale x 2 x i1>, <vscale x 2 x i64>, <vscale x 2 x i64>)
2148
2149 declare <vscale x 16 x i8> @llvm.aarch64.sve.subr.nxv16i8(<vscale x 16 x i1>, <vscale x 16 x i8>, <vscale x 16 x i8>)
2150 declare <vscale x 8 x i16> @llvm.aarch64.sve.subr.nxv8i16(<vscale x 8 x i1>, <vscale x 8 x i16>, <vscale x 8 x i16>)
2151 declare <vscale x 4 x i32> @llvm.aarch64.sve.subr.nxv4i32(<vscale x 4 x i1>, <vscale x 4 x i32>, <vscale x 4 x i32>)
2152 declare <vscale x 2 x i64> @llvm.aarch64.sve.subr.nxv2i64(<vscale x 2 x i1>, <vscale x 2 x i64>, <vscale x 2 x i64>)
2153
2154 declare <vscale x 16 x i8> @llvm.aarch64.sve.sqadd.x.nxv16i8(<vscale x 16 x i8>, <vscale x 16 x i8>)
2155 declare <vscale x 8 x i16> @llvm.aarch64.sve.sqadd.x.nxv8i16(<vscale x 8 x i16>, <vscale x 8 x i16>)
2156 declare <vscale x 4 x i32> @llvm.aarch64.sve.sqadd.x.nxv4i32(<vscale x 4 x i32>, <vscale x 4 x i32>)
2157 declare <vscale x 2 x i64> @llvm.aarch64.sve.sqadd.x.nxv2i64(<vscale x 2 x i64>, <vscale x 2 x i64>)
2158
2159 declare <vscale x 16 x i8> @llvm.aarch64.sve.sqsub.x.nxv16i8(<vscale x 16 x i8>, <vscale x 16 x i8>)
2160 declare <vscale x 8 x i16> @llvm.aarch64.sve.sqsub.x.nxv8i16(<vscale x 8 x i16>, <vscale x 8 x i16>)
2161 declare <vscale x 4 x i32> @llvm.aarch64.sve.sqsub.x.nxv4i32(<vscale x 4 x i32>, <vscale x 4 x i32>)
2162 declare <vscale x 2 x i64> @llvm.aarch64.sve.sqsub.x.nxv2i64(<vscale x 2 x i64>, <vscale x 2 x i64>)
2163
2164 declare <vscale x 16 x i8> @llvm.aarch64.sve.uqadd.x.nxv16i8(<vscale x 16 x i8>, <vscale x 16 x i8>)
2165 declare <vscale x 8 x i16> @llvm.aarch64.sve.uqadd.x.nxv8i16(<vscale x 8 x i16>, <vscale x 8 x i16>)
2166 declare <vscale x 4 x i32> @llvm.aarch64.sve.uqadd.x.nxv4i32(<vscale x 4 x i32>, <vscale x 4 x i32>)
2167 declare <vscale x 2 x i64> @llvm.aarch64.sve.uqadd.x.nxv2i64(<vscale x 2 x i64>, <vscale x 2 x i64>)
2168
2169 declare <vscale x 16 x i8> @llvm.aarch64.sve.uqsub.x.nxv16i8(<vscale x 16 x i8>, <vscale x 16 x i8>)
2170 declare <vscale x 8 x i16> @llvm.aarch64.sve.uqsub.x.nxv8i16(<vscale x 8 x i16>, <vscale x 8 x i16>)
2171 declare <vscale x 4 x i32> @llvm.aarch64.sve.uqsub.x.nxv4i32(<vscale x 4 x i32>, <vscale x 4 x i32>)
2172 declare <vscale x 2 x i64> @llvm.aarch64.sve.uqsub.x.nxv2i64(<vscale x 2 x i64>, <vscale x 2 x i64>)
2173
2174 declare <vscale x 4 x i32> @llvm.aarch64.sve.smax.nxv4i32(<vscale x 4 x i1>, <vscale x 4 x i32>, <vscale x 4 x i32>)
2175
2176 declare <vscale x 16 x i8> @llvm.aarch64.sve.smax.u.nxv16i8(<vscale x 16 x i1>, <vscale x 16 x i8>, <vscale x 16 x i8>)
2177 declare <vscale x 8 x i16> @llvm.aarch64.sve.smax.u.nxv8i16(<vscale x 8 x i1>, <vscale x 8 x i16>, <vscale x 8 x i16>)
2178 declare <vscale x 4 x i32> @llvm.aarch64.sve.smax.u.nxv4i32(<vscale x 4 x i1>, <vscale x 4 x i32>, <vscale x 4 x i32>)
2179 declare <vscale x 2 x i64> @llvm.aarch64.sve.smax.u.nxv2i64(<vscale x 2 x i1>, <vscale x 2 x i64>, <vscale x 2 x i64>)
2180
2181 declare <vscale x 4 x i32> @llvm.aarch64.sve.smin.nxv4i32(<vscale x 4 x i1>, <vscale x 4 x i32>, <vscale x 4 x i32>)
2182
2183 declare <vscale x 16 x i8> @llvm.aarch64.sve.smin.u.nxv16i8(<vscale x 16 x i1>, <vscale x 16 x i8>, <vscale x 16 x i8>)
2184 declare <vscale x 8 x i16> @llvm.aarch64.sve.smin.u.nxv8i16(<vscale x 8 x i1>, <vscale x 8 x i16>, <vscale x 8 x i16>)
2185 declare <vscale x 4 x i32> @llvm.aarch64.sve.smin.u.nxv4i32(<vscale x 4 x i1>, <vscale x 4 x i32>, <vscale x 4 x i32>)
2186 declare <vscale x 2 x i64> @llvm.aarch64.sve.smin.u.nxv2i64(<vscale x 2 x i1>, <vscale x 2 x i64>, <vscale x 2 x i64>)
2187
2188 declare <vscale x 4 x i32> @llvm.aarch64.sve.umax.nxv4i32(<vscale x 4 x i1>, <vscale x 4 x i32>, <vscale x 4 x i32>)
2189
2190 declare <vscale x 16 x i8> @llvm.aarch64.sve.umax.u.nxv16i8(<vscale x 16 x i1>, <vscale x 16 x i8>, <vscale x 16 x i8>)
2191 declare <vscale x 8 x i16> @llvm.aarch64.sve.umax.u.nxv8i16(<vscale x 8 x i1>, <vscale x 8 x i16>, <vscale x 8 x i16>)
2192 declare <vscale x 4 x i32> @llvm.aarch64.sve.umax.u.nxv4i32(<vscale x 4 x i1>, <vscale x 4 x i32>, <vscale x 4 x i32>)
2193 declare <vscale x 2 x i64> @llvm.aarch64.sve.umax.u.nxv2i64(<vscale x 2 x i1>, <vscale x 2 x i64>, <vscale x 2 x i64>)
2194
2195 declare <vscale x 4 x i32> @llvm.aarch64.sve.umin.nxv4i32(<vscale x 4 x i1>, <vscale x 4 x i32>, <vscale x 4 x i32>)
2196
2197 declare <vscale x 16 x i8> @llvm.aarch64.sve.umin.u.nxv16i8(<vscale x 16 x i1>, <vscale x 16 x i8>, <vscale x 16 x i8>)
2198 declare <vscale x 8 x i16> @llvm.aarch64.sve.umin.u.nxv8i16(<vscale x 8 x i1>, <vscale x 8 x i16>, <vscale x 8 x i16>)
2199 declare <vscale x 4 x i32> @llvm.aarch64.sve.umin.u.nxv4i32(<vscale x 4 x i1>, <vscale x 4 x i32>, <vscale x 4 x i32>)
2200 declare <vscale x 2 x i64> @llvm.aarch64.sve.umin.u.nxv2i64(<vscale x 2 x i1>, <vscale x 2 x i64>, <vscale x 2 x i64>)
2201
2202 declare <vscale x 16 x i8> @llvm.aarch64.sve.asr.nxv16i8(<vscale x 16 x i1>, <vscale x 16 x i8>, <vscale x 16 x i8>)
2203 declare <vscale x 8 x i16> @llvm.aarch64.sve.asr.nxv8i16(<vscale x 8 x i1>, <vscale x 8 x i16>, <vscale x 8 x i16>)
2204 declare <vscale x 4 x i32> @llvm.aarch64.sve.asr.nxv4i32(<vscale x 4 x i1>, <vscale x 4 x i32>, <vscale x 4 x i32>)
2205 declare <vscale x 2 x i64> @llvm.aarch64.sve.asr.nxv2i64(<vscale x 2 x i1>, <vscale x 2 x i64>, <vscale x 2 x i64>)
2206
2207 declare <vscale x 16 x i8> @llvm.aarch64.sve.asr.u.nxv16i8(<vscale x 16 x i1>, <vscale x 16 x i8>, <vscale x 16 x i8>)
2208 declare <vscale x 8 x i16> @llvm.aarch64.sve.asr.u.nxv8i16(<vscale x 8 x i1>, <vscale x 8 x i16>, <vscale x 8 x i16>)
2209 declare <vscale x 4 x i32> @llvm.aarch64.sve.asr.u.nxv4i32(<vscale x 4 x i1>, <vscale x 4 x i32>, <vscale x 4 x i32>)
2210 declare <vscale x 2 x i64> @llvm.aarch64.sve.asr.u.nxv2i64(<vscale x 2 x i1>, <vscale x 2 x i64>, <vscale x 2 x i64>)
2211
2212 declare <vscale x 16 x i8> @llvm.aarch64.sve.lsl.nxv16i8(<vscale x 16 x i1>, <vscale x 16 x i8>, <vscale x 16 x i8>)
2213 declare <vscale x 8 x i16> @llvm.aarch64.sve.lsl.nxv8i16(<vscale x 8 x i1>, <vscale x 8 x i16>, <vscale x 8 x i16>)
2214 declare <vscale x 4 x i32> @llvm.aarch64.sve.lsl.nxv4i32(<vscale x 4 x i1>, <vscale x 4 x i32>, <vscale x 4 x i32>)
2215 declare <vscale x 2 x i64> @llvm.aarch64.sve.lsl.nxv2i64(<vscale x 2 x i1>, <vscale x 2 x i64>, <vscale x 2 x i64>)
2216
2217 declare <vscale x 16 x i8> @llvm.aarch64.sve.lsl.u.nxv16i8(<vscale x 16 x i1>, <vscale x 16 x i8>, <vscale x 16 x i8>)
2218 declare <vscale x 8 x i16> @llvm.aarch64.sve.lsl.u.nxv8i16(<vscale x 8 x i1>, <vscale x 8 x i16>, <vscale x 8 x i16>)
2219 declare <vscale x 4 x i32> @llvm.aarch64.sve.lsl.u.nxv4i32(<vscale x 4 x i1>, <vscale x 4 x i32>, <vscale x 4 x i32>)
2220 declare <vscale x 2 x i64> @llvm.aarch64.sve.lsl.u.nxv2i64(<vscale x 2 x i1>, <vscale x 2 x i64>, <vscale x 2 x i64>)
2221
2222 declare <vscale x 16 x i8> @llvm.aarch64.sve.lsr.nxv16i8(<vscale x 16 x i1>, <vscale x 16 x i8>, <vscale x 16 x i8>)
2223 declare <vscale x 8 x i16> @llvm.aarch64.sve.lsr.nxv8i16(<vscale x 8 x i1>, <vscale x 8 x i16>, <vscale x 8 x i16>)
2224 declare <vscale x 4 x i32> @llvm.aarch64.sve.lsr.nxv4i32(<vscale x 4 x i1>, <vscale x 4 x i32>, <vscale x 4 x i32>)
2225 declare <vscale x 2 x i64> @llvm.aarch64.sve.lsr.nxv2i64(<vscale x 2 x i1>, <vscale x 2 x i64>, <vscale x 2 x i64>)
2226
2227 declare <vscale x 16 x i8> @llvm.aarch64.sve.lsr.u.nxv16i8(<vscale x 16 x i1>, <vscale x 16 x i8>, <vscale x 16 x i8>)
2228 declare <vscale x 8 x i16> @llvm.aarch64.sve.lsr.u.nxv8i16(<vscale x 8 x i1>, <vscale x 8 x i16>, <vscale x 8 x i16>)
2229 declare <vscale x 4 x i32> @llvm.aarch64.sve.lsr.u.nxv4i32(<vscale x 4 x i1>, <vscale x 4 x i32>, <vscale x 4 x i32>)
2230 declare <vscale x 2 x i64> @llvm.aarch64.sve.lsr.u.nxv2i64(<vscale x 2 x i1>, <vscale x 2 x i64>, <vscale x 2 x i64>)
2231
2232 declare <vscale x 4 x i32> @llvm.aarch64.sve.mul.nxv4i32(<vscale x 4 x i1>, <vscale x 4 x i32>, <vscale x 4 x i32>)
2233
2234 declare <vscale x 16 x i8> @llvm.aarch64.sve.mul.u.nxv16i8(<vscale x 16 x i1>, <vscale x 16 x i8>, <vscale x 16 x i8>)
2235 declare <vscale x 8 x i16> @llvm.aarch64.sve.mul.u.nxv8i16(<vscale x 8 x i1>, <vscale x 8 x i16>, <vscale x 8 x i16>)
2236 declare <vscale x 4 x i32> @llvm.aarch64.sve.mul.u.nxv4i32(<vscale x 4 x i1>, <vscale x 4 x i32>, <vscale x 4 x i32>)
2237 declare <vscale x 2 x i64> @llvm.aarch64.sve.mul.u.nxv2i64(<vscale x 2 x i1>, <vscale x 2 x i64>, <vscale x 2 x i64>)
2238
2239 declare <vscale x 4 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv4i1(<vscale x 16 x i1>)
2240 declare <vscale x 8 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv8i1(<vscale x 16 x i1>)
2241 declare <vscale x 2 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv2i1(<vscale x 16 x i1>)
2242
2243 declare <vscale x 16 x i1> @llvm.aarch64.sve.convert.to.svbool.nxv4i1(<vscale x 16 x i1>)
2244 declare <vscale x 16 x i1> @llvm.aarch64.sve.convert.to.svbool.nxv8i1(<vscale x 8 x i1>)
2245 declare <vscale x 16 x i1> @llvm.aarch64.sve.convert.to.svbool.nxv2i1(<vscale x 2 x i1>)
2246
2247 declare <vscale x 4 x i32> @llvm.aarch64.sve.dup.x.nxv4i32(i32)
2248
2249 declare <vscale x 16 x i1> @llvm.aarch64.sve.ptrue.nxv16i1(i32 %pattern)
2250 declare <vscale x 8 x i1> @llvm.aarch64.sve.ptrue.nxv8i1(i32 %pattern)
2251 declare <vscale x 4 x i1> @llvm.aarch64.sve.ptrue.nxv4i1(i32 %pattern)
2252 declare <vscale x 2 x i1> @llvm.aarch64.sve.ptrue.nxv2i1(i32 %pattern)