llvm/test/CodeGen/AArch64/sve-intrinsics-int-arith-imm.ll

   1 ; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
   2 ; RUN: llc -mtriple=aarch64-linux-gnu -mattr=+sve < %s | FileCheck %s
   3
   4 ; ADD
   5
   6 define <vscale x 16 x i8> @add_i8(<vscale x 16 x i8> %a) {
   7 ; CHECK-LABEL: add_i8:
   8 ; CHECK:       // %bb.0:
   9 ; CHECK-NEXT:    add z0.b, z0.b, #127
  10 ; CHECK-NEXT:    ret
  11   %pg = call <vscale x 16 x i1> @llvm.aarch64.sve.ptrue.nxv16i1(i32 31)
  12   %elt = insertelement <vscale x 16 x i8> undef, i8 127, i32 0
  13   %splat = shufflevector <vscale x 16 x i8> %elt, <vscale x 16 x i8> undef, <vscale x 16 x i32> zeroinitializer
  14   %out = call <vscale x 16 x i8> @llvm.aarch64.sve.add.nxv16i8(<vscale x 16 x i1> %pg,
  15                                                                <vscale x 16 x i8> %a,
  16                                                                <vscale x 16 x i8> %splat)
  17   ret <vscale x 16 x i8> %out
  18 }
  19
  20 define <vscale x 8 x i16> @add_i16(<vscale x 8 x i16> %a) {
  21 ; CHECK-LABEL: add_i16:
  22 ; CHECK:       // %bb.0:
  23 ; CHECK-NEXT:    add z0.h, z0.h, #127
  24 ; CHECK-NEXT:    ret
  25   %pg = call <vscale x 8 x i1> @llvm.aarch64.sve.ptrue.nxv8i1(i32 31)
  26   %elt = insertelement <vscale x 8 x i16> undef, i16 127, i32 0
  27   %splat = shufflevector <vscale x 8 x i16> %elt, <vscale x 8 x i16> undef, <vscale x 8 x i32> zeroinitializer
  28   %out = call <vscale x 8 x i16> @llvm.aarch64.sve.add.nxv8i16(<vscale x 8 x i1> %pg,
  29                                                                <vscale x 8 x i16> %a,
  30                                                                <vscale x 8 x i16> %splat)
  31   ret <vscale x 8 x i16> %out
  32 }
  33
  34 define <vscale x 8 x i16> @add_i16_out_of_range(<vscale x 8 x i16> %a) {
  35 ; CHECK-LABEL: add_i16_out_of_range:
  36 ; CHECK:       // %bb.0:
  37 ; CHECK-NEXT:    mov w8, #257
  38 ; CHECK-NEXT:    mov z1.h, w8
  39 ; CHECK-NEXT:    add z0.h, z0.h, z1.h
  40 ; CHECK-NEXT:    ret
  41   %pg = call <vscale x 8 x i1> @llvm.aarch64.sve.ptrue.nxv8i1(i32 31)
  42   %elt = insertelement <vscale x 8 x i16> undef, i16 257, i32 0
  43   %splat = shufflevector <vscale x 8 x i16> %elt, <vscale x 8 x i16> undef, <vscale x 8 x i32> zeroinitializer
  44   %out = call <vscale x 8 x i16> @llvm.aarch64.sve.add.nxv8i16(<vscale x 8 x i1> %pg,
  45                                                                <vscale x 8 x i16> %a,
  46                                                                <vscale x 8 x i16> %splat)
  47   ret <vscale x 8 x i16> %out
  48 }
  49
  50 define <vscale x 4 x i32> @add_i32(<vscale x 4 x i32> %a) {
  51 ; CHECK-LABEL: add_i32:
  52 ; CHECK:       // %bb.0:
  53 ; CHECK-NEXT:    add z0.s, z0.s, #127
  54 ; CHECK-NEXT:    ret
  55   %pg = call <vscale x 4 x i1> @llvm.aarch64.sve.ptrue.nxv4i1(i32 31)
  56   %elt = insertelement <vscale x 4 x i32> undef, i32 127, i32 0
  57   %splat = shufflevector <vscale x 4 x i32> %elt, <vscale x 4 x i32> undef, <vscale x 4 x i32> zeroinitializer
  58   %out = call <vscale x 4 x i32> @llvm.aarch64.sve.add.nxv4i32(<vscale x 4 x i1> %pg,
  59                                                                <vscale x 4 x i32> %a,
  60                                                                <vscale x 4 x i32> %splat)
  61   ret <vscale x 4 x i32> %out
  62 }
  63
  64 define <vscale x 4 x i32> @add_i32_out_of_range(<vscale x 4 x i32> %a) {
  65 ; CHECK-LABEL: add_i32_out_of_range:
  66 ; CHECK:       // %bb.0:
  67 ; CHECK-NEXT:    mov w8, #257
  68 ; CHECK-NEXT:    mov z1.s, w8
  69 ; CHECK-NEXT:    add z0.s, z0.s, z1.s
  70 ; CHECK-NEXT:    ret
  71   %pg = call <vscale x 4 x i1> @llvm.aarch64.sve.ptrue.nxv4i1(i32 31)
  72   %elt = insertelement <vscale x 4 x i32> undef, i32 257, i32 0
  73   %splat = shufflevector <vscale x 4 x i32> %elt, <vscale x 4 x i32> undef, <vscale x 4 x i32> zeroinitializer
  74   %out = call <vscale x 4 x i32> @llvm.aarch64.sve.add.nxv4i32(<vscale x 4 x i1> %pg,
  75                                                                <vscale x 4 x i32> %a,
  76                                                                <vscale x 4 x i32> %splat)
  77   ret <vscale x 4 x i32> %out
  78 }
  79
  80 define <vscale x 2 x i64> @add_i64(<vscale x 2 x i64> %a) {
  81 ; CHECK-LABEL: add_i64:
  82 ; CHECK:       // %bb.0:
  83 ; CHECK-NEXT:    add z0.d, z0.d, #127
  84 ; CHECK-NEXT:    ret
  85   %pg = call <vscale x 2 x i1> @llvm.aarch64.sve.ptrue.nxv2i1(i32 31)
  86   %elt = insertelement <vscale x 2 x i64> undef, i64 127, i64 0
  87   %splat = shufflevector <vscale x 2 x i64> %elt, <vscale x 2 x i64> undef, <vscale x 2 x i32> zeroinitializer
  88   %out = call <vscale x 2 x i64> @llvm.aarch64.sve.add.nxv2i64(<vscale x 2 x i1> %pg,
  89                                                                <vscale x 2 x i64> %a,
  90                                                                <vscale x 2 x i64> %splat)
  91   ret <vscale x 2 x i64> %out
  92 }
  93
  94 define <vscale x 2 x i64> @add_i64_out_of_range(<vscale x 2 x i64> %a) {
  95 ; CHECK-LABEL: add_i64_out_of_range:
  96 ; CHECK:       // %bb.0:
  97 ; CHECK-NEXT:    mov w8, #257
  98 ; CHECK-NEXT:    mov z1.d, x8
  99 ; CHECK-NEXT:    add z0.d, z0.d, z1.d
 100 ; CHECK-NEXT:    ret
 101   %pg = call <vscale x 2 x i1> @llvm.aarch64.sve.ptrue.nxv2i1(i32 31)
 102   %elt = insertelement <vscale x 2 x i64> undef, i64 257, i64 0
 103   %splat = shufflevector <vscale x 2 x i64> %elt, <vscale x 2 x i64> undef, <vscale x 2 x i32> zeroinitializer
 104   %out = call <vscale x 2 x i64> @llvm.aarch64.sve.add.nxv2i64(<vscale x 2 x i1> %pg,
 105                                                                <vscale x 2 x i64> %a,
 106                                                                <vscale x 2 x i64> %splat)
 107   ret <vscale x 2 x i64> %out
 108 }
 109
 110 ; SUB
 111
 112 define <vscale x 16 x i8> @sub_i8(<vscale x 16 x i8> %a) {
 113 ; CHECK-LABEL: sub_i8:
 114 ; CHECK:       // %bb.0:
 115 ; CHECK-NEXT:    sub z0.b, z0.b, #127
 116 ; CHECK-NEXT:    ret
 117   %pg = call <vscale x 16 x i1> @llvm.aarch64.sve.ptrue.nxv16i1(i32 31)
 118   %elt = insertelement <vscale x 16 x i8> undef, i8 127, i32 0
 119   %splat = shufflevector <vscale x 16 x i8> %elt, <vscale x 16 x i8> undef, <vscale x 16 x i32> zeroinitializer
 120   %out = call <vscale x 16 x i8> @llvm.aarch64.sve.sub.nxv16i8(<vscale x 16 x i1> %pg,
 121                                                                <vscale x 16 x i8> %a,
 122                                                                <vscale x 16 x i8> %splat)
 123   ret <vscale x 16 x i8> %out
 124 }
 125
 126 define <vscale x 8 x i16> @sub_i16(<vscale x 8 x i16> %a) {
 127 ; CHECK-LABEL: sub_i16:
 128 ; CHECK:       // %bb.0:
 129 ; CHECK-NEXT:    sub z0.h, z0.h, #127
 130 ; CHECK-NEXT:    ret
 131   %pg = call <vscale x 8 x i1> @llvm.aarch64.sve.ptrue.nxv8i1(i32 31)
 132   %elt = insertelement <vscale x 8 x i16> undef, i16 127, i32 0
 133   %splat = shufflevector <vscale x 8 x i16> %elt, <vscale x 8 x i16> undef, <vscale x 8 x i32> zeroinitializer
 134   %out = call <vscale x 8 x i16> @llvm.aarch64.sve.sub.nxv8i16(<vscale x 8 x i1> %pg,
 135                                                                <vscale x 8 x i16> %a,
 136                                                                <vscale x 8 x i16> %splat)
 137   ret <vscale x 8 x i16> %out
 138 }
 139
 140 define <vscale x 8 x i16> @sub_i16_out_of_range(<vscale x 8 x i16> %a) {
 141 ; CHECK-LABEL: sub_i16_out_of_range:
 142 ; CHECK:       // %bb.0:
 143 ; CHECK-NEXT:    mov w8, #257
 144 ; CHECK-NEXT:    mov z1.h, w8
 145 ; CHECK-NEXT:    sub z0.h, z0.h, z1.h
 146 ; CHECK-NEXT:    ret
 147   %pg = call <vscale x 8 x i1> @llvm.aarch64.sve.ptrue.nxv8i1(i32 31)
 148   %elt = insertelement <vscale x 8 x i16> undef, i16 257, i32 0
 149   %splat = shufflevector <vscale x 8 x i16> %elt, <vscale x 8 x i16> undef, <vscale x 8 x i32> zeroinitializer
 150   %out = call <vscale x 8 x i16> @llvm.aarch64.sve.sub.nxv8i16(<vscale x 8 x i1> %pg,
 151                                                                <vscale x 8 x i16> %a,
 152                                                                <vscale x 8 x i16> %splat)
 153   ret <vscale x 8 x i16> %out
 154 }
 155
 156 define <vscale x 4 x i32> @sub_i32(<vscale x 4 x i32> %a) {
 157 ; CHECK-LABEL: sub_i32:
 158 ; CHECK:       // %bb.0:
 159 ; CHECK-NEXT:    sub z0.s, z0.s, #127
 160 ; CHECK-NEXT:    ret
 161   %pg = call <vscale x 4 x i1> @llvm.aarch64.sve.ptrue.nxv4i1(i32 31)
 162   %elt = insertelement <vscale x 4 x i32> undef, i32 127, i32 0
 163   %splat = shufflevector <vscale x 4 x i32> %elt, <vscale x 4 x i32> undef, <vscale x 4 x i32> zeroinitializer
 164   %out = call <vscale x 4 x i32> @llvm.aarch64.sve.sub.nxv4i32(<vscale x 4 x i1> %pg,
 165                                                                <vscale x 4 x i32> %a,
 166                                                                <vscale x 4 x i32> %splat)
 167   ret <vscale x 4 x i32> %out
 168 }
 169
 170 define <vscale x 4 x i32> @sub_i32_out_of_range(<vscale x 4 x i32> %a) {
 171 ; CHECK-LABEL: sub_i32_out_of_range:
 172 ; CHECK:       // %bb.0:
 173 ; CHECK-NEXT:    mov w8, #257
 174 ; CHECK-NEXT:    mov z1.s, w8
 175 ; CHECK-NEXT:    sub z0.s, z0.s, z1.s
 176 ; CHECK-NEXT:    ret
 177   %pg = call <vscale x 4 x i1> @llvm.aarch64.sve.ptrue.nxv4i1(i32 31)
 178   %elt = insertelement <vscale x 4 x i32> undef, i32 257, i32 0
 179   %splat = shufflevector <vscale x 4 x i32> %elt, <vscale x 4 x i32> undef, <vscale x 4 x i32> zeroinitializer
 180   %out = call <vscale x 4 x i32> @llvm.aarch64.sve.sub.nxv4i32(<vscale x 4 x i1> %pg,
 181                                                                <vscale x 4 x i32> %a,
 182                                                                <vscale x 4 x i32> %splat)
 183   ret <vscale x 4 x i32> %out
 184 }
 185
 186 define <vscale x 2 x i64> @sub_i64(<vscale x 2 x i64> %a) {
 187 ; CHECK-LABEL: sub_i64:
 188 ; CHECK:       // %bb.0:
 189 ; CHECK-NEXT:    sub z0.d, z0.d, #127
 190 ; CHECK-NEXT:    ret
 191   %pg = call <vscale x 2 x i1> @llvm.aarch64.sve.ptrue.nxv2i1(i32 31)
 192   %elt = insertelement <vscale x 2 x i64> undef, i64 127, i64 0
 193   %splat = shufflevector <vscale x 2 x i64> %elt, <vscale x 2 x i64> undef, <vscale x 2 x i32> zeroinitializer
 194   %out = call <vscale x 2 x i64> @llvm.aarch64.sve.sub.nxv2i64(<vscale x 2 x i1> %pg,
 195                                                                <vscale x 2 x i64> %a,
 196                                                                <vscale x 2 x i64> %splat)
 197   ret <vscale x 2 x i64> %out
 198 }
 199
 200 define <vscale x 2 x i64> @sub_i64_out_of_range(<vscale x 2 x i64> %a) {
 201 ; CHECK-LABEL: sub_i64_out_of_range:
 202 ; CHECK:       // %bb.0:
 203 ; CHECK-NEXT:    mov w8, #257
 204 ; CHECK-NEXT:    mov z1.d, x8
 205 ; CHECK-NEXT:    sub z0.d, z0.d, z1.d
 206 ; CHECK-NEXT:    ret
 207   %pg = call <vscale x 2 x i1> @llvm.aarch64.sve.ptrue.nxv2i1(i32 31)
 208   %elt = insertelement <vscale x 2 x i64> undef, i64 257, i64 0
 209   %splat = shufflevector <vscale x 2 x i64> %elt, <vscale x 2 x i64> undef, <vscale x 2 x i32> zeroinitializer
 210   %out = call <vscale x 2 x i64> @llvm.aarch64.sve.sub.nxv2i64(<vscale x 2 x i1> %pg,
 211                                                                <vscale x 2 x i64> %a,
 212                                                                <vscale x 2 x i64> %splat)
 213   ret <vscale x 2 x i64> %out
 214 }
 215
 216 ; As sub_i32 but where pg is i8 based and thus compatible for i32.
 217 define <vscale x 4 x i32> @sub_i32_ptrue_all_b(<vscale x 4 x i32> %a) #0 {
 218 ; CHECK-LABEL: sub_i32_ptrue_all_b:
 219 ; CHECK: sub z0.s, z0.s, #1
 220 ; CHECK-NEXT: ret
 221   %pg.b = tail call <vscale x 16 x i1> @llvm.aarch64.sve.ptrue.nxv16i1(i32 31)
 222   %pg.s = tail call <vscale x 4 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv4i1(<vscale x 16 x i1> %pg.b)
 223   %b = tail call <vscale x 4 x i32> @llvm.aarch64.sve.dup.x.nxv4i32(i32 1)
 224   %out = tail call <vscale x 4 x i32> @llvm.aarch64.sve.sub.nxv4i32(<vscale x 4 x i1> %pg.s,
 225                                                                     <vscale x 4 x i32> %a,
 226                                                                     <vscale x 4 x i32> %b)
 227   ret <vscale x 4 x i32> %out
 228 }
 229
 230 ; As sub_i32 but where pg is i16 based and thus compatible for i32.
 231 define <vscale x 4 x i32> @sub_i32_ptrue_all_h(<vscale x 4 x i32> %a) #0 {
 232 ; CHECK-LABEL: sub_i32_ptrue_all_h:
 233 ; CHECK: sub z0.s, z0.s, #1
 234 ; CHECK-NEXT: ret
 235   %pg.h = tail call <vscale x 8 x i1> @llvm.aarch64.sve.ptrue.nxv8i1(i32 31)
 236   %pg.b = tail call <vscale x 16 x i1> @llvm.aarch64.sve.convert.to.svbool.nxv8i1(<vscale x 8 x i1> %pg.h)
 237   %pg.s = tail call <vscale x 4 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv4i1(<vscale x 16 x i1> %pg.b)
 238   %b = tail call <vscale x 4 x i32> @llvm.aarch64.sve.dup.x.nxv4i32(i32 1)
 239   %out = tail call <vscale x 4 x i32> @llvm.aarch64.sve.sub.nxv4i32(<vscale x 4 x i1> %pg.s,
 240                                                                     <vscale x 4 x i32> %a,
 241                                                                     <vscale x 4 x i32> %b)
 242   ret <vscale x 4 x i32> %out
 243 }
 244
 245 ; As sub_i32 but where pg is i64 based, which is not compatibile for i32 and
 246 ; thus inactive lanes are important and the immediate form cannot be used.
 247 define <vscale x 4 x i32> @sub_i32_ptrue_all_d(<vscale x 4 x i32> %a) #0 {
 248 ; CHECK-LABEL: sub_i32_ptrue_all_d:
 249 ; CHECK-DAG: ptrue [[PG:p[0-9]+]].d
 250 ; CHECK-DAG: mov [[DUP:z[0-9]+]].s, #1
 251 ; CHECK-DAG: sub z0.s, [[PG]]/m, z0.s, [[DUP]].s
 252 ; CHECK-NEXT: ret
 253   %pg.d = tail call <vscale x 2 x i1> @llvm.aarch64.sve.ptrue.nxv2i1(i32 31)
 254   %pg.b = tail call <vscale x 16 x i1> @llvm.aarch64.sve.convert.to.svbool.nxv2i1(<vscale x 2 x i1> %pg.d)
 255   %pg.s = tail call <vscale x 4 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv4i1(<vscale x 16 x i1> %pg.b)
 256   %b = tail call <vscale x 4 x i32> @llvm.aarch64.sve.dup.x.nxv4i32(i32 1)
 257   %out = tail call <vscale x 4 x i32> @llvm.aarch64.sve.sub.nxv4i32(<vscale x 4 x i1> %pg.s,
 258                                                                     <vscale x 4 x i32> %a,
 259                                                                     <vscale x 4 x i32> %b)
 260   ret <vscale x 4 x i32> %out
 261 }
 262
 263 ; SMAX
 264
 265 define <vscale x 16 x i8> @smax_i8(<vscale x 16 x i8> %a) {
 266 ; CHECK-LABEL: smax_i8:
 267 ; CHECK:       // %bb.0:
 268 ; CHECK-NEXT:    smax z0.b, z0.b, #-128
 269 ; CHECK-NEXT:    ret
 270   %pg = call <vscale x 16 x i1> @llvm.aarch64.sve.ptrue.nxv16i1(i32 31)
 271   %elt = insertelement <vscale x 16 x i8> undef, i8 -128, i32 0
 272   %splat = shufflevector <vscale x 16 x i8> %elt, <vscale x 16 x i8> undef, <vscale x 16 x i32> zeroinitializer
 273   %out = call <vscale x 16 x i8> @llvm.aarch64.sve.smax.nxv16i8(<vscale x 16 x i1> %pg,
 274                                                                 <vscale x 16 x i8> %a,
 275                                                                 <vscale x 16 x i8> %splat)
 276   ret <vscale x 16 x i8> %out
 277 }
 278
 279 define <vscale x 8 x i16> @smax_i16(<vscale x 8 x i16> %a) {
 280 ; CHECK-LABEL: smax_i16:
 281 ; CHECK:       // %bb.0:
 282 ; CHECK-NEXT:    smax z0.h, z0.h, #127
 283 ; CHECK-NEXT:    ret
 284   %pg = call <vscale x 8 x i1> @llvm.aarch64.sve.ptrue.nxv8i1(i32 31)
 285   %elt = insertelement <vscale x 8 x i16> undef, i16 127, i32 0
 286   %splat = shufflevector <vscale x 8 x i16> %elt, <vscale x 8 x i16> undef, <vscale x 8 x i32> zeroinitializer
 287   %out = call <vscale x 8 x i16> @llvm.aarch64.sve.smax.nxv8i16(<vscale x 8 x i1> %pg,
 288                                                                 <vscale x 8 x i16> %a,
 289                                                                 <vscale x 8 x i16> %splat)
 290   ret <vscale x 8 x i16> %out
 291 }
 292
 293 define <vscale x 8 x i16> @smax_i16_out_of_range(<vscale x 8 x i16> %a) {
 294 ; CHECK-LABEL: smax_i16_out_of_range:
 295 ; CHECK:       // %bb.0:
 296 ; CHECK-NEXT:    mov w8, #129
 297 ; CHECK-NEXT:    ptrue p0.h
 298 ; CHECK-NEXT:    mov z1.h, w8
 299 ; CHECK-NEXT:    smax z0.h, p0/m, z0.h, z1.h
 300 ; CHECK-NEXT:    ret
 301   %pg = call <vscale x 8 x i1> @llvm.aarch64.sve.ptrue.nxv8i1(i32 31)
 302   %elt = insertelement <vscale x 8 x i16> undef, i16 129, i32 0
 303   %splat = shufflevector <vscale x 8 x i16> %elt, <vscale x 8 x i16> undef, <vscale x 8 x i32> zeroinitializer
 304   %out = call <vscale x 8 x i16> @llvm.aarch64.sve.smax.nxv8i16(<vscale x 8 x i1> %pg,
 305                                                                 <vscale x 8 x i16> %a,
 306                                                                 <vscale x 8 x i16> %splat)
 307   ret <vscale x 8 x i16> %out
 308 }
 309
 310 define <vscale x 4 x i32> @smax_i32(<vscale x 4 x i32> %a) {
 311 ; CHECK-LABEL: smax_i32:
 312 ; CHECK:       // %bb.0:
 313 ; CHECK-NEXT:    smax z0.s, z0.s, #-128
 314 ; CHECK-NEXT:    ret
 315   %pg = call <vscale x 4 x i1> @llvm.aarch64.sve.ptrue.nxv4i1(i32 31)
 316   %elt = insertelement <vscale x 4 x i32> undef, i32 -128, i32 0
 317   %splat = shufflevector <vscale x 4 x i32> %elt, <vscale x 4 x i32> undef, <vscale x 4 x i32> zeroinitializer
 318   %out = call <vscale x 4 x i32> @llvm.aarch64.sve.smax.nxv4i32(<vscale x 4 x i1> %pg,
 319                                                                 <vscale x 4 x i32> %a,
 320                                                                 <vscale x 4 x i32> %splat)
 321   ret <vscale x 4 x i32> %out
 322 }
 323
 324 define <vscale x 4 x i32> @smax_i32_out_of_range(<vscale x 4 x i32> %a) {
 325 ; CHECK-LABEL: smax_i32_out_of_range:
 326 ; CHECK:       // %bb.0:
 327 ; CHECK-NEXT:    mov w8, #-129
 328 ; CHECK-NEXT:    ptrue p0.s
 329 ; CHECK-NEXT:    mov z1.s, w8
 330 ; CHECK-NEXT:    smax z0.s, p0/m, z0.s, z1.s
 331 ; CHECK-NEXT:    ret
 332   %pg = call <vscale x 4 x i1> @llvm.aarch64.sve.ptrue.nxv4i1(i32 31)
 333   %elt = insertelement <vscale x 4 x i32> undef, i32 -129, i32 0
 334   %splat = shufflevector <vscale x 4 x i32> %elt, <vscale x 4 x i32> undef, <vscale x 4 x i32> zeroinitializer
 335   %out = call <vscale x 4 x i32> @llvm.aarch64.sve.smax.nxv4i32(<vscale x 4 x i1> %pg,
 336                                                                 <vscale x 4 x i32> %a,
 337                                                                 <vscale x 4 x i32> %splat)
 338   ret <vscale x 4 x i32> %out
 339 }
 340
 341 define <vscale x 2 x i64> @smax_i64(<vscale x 2 x i64> %a) {
 342 ; CHECK-LABEL: smax_i64:
 343 ; CHECK:       // %bb.0:
 344 ; CHECK-NEXT:    smax z0.d, z0.d, #127
 345 ; CHECK-NEXT:    ret
 346   %pg = call <vscale x 2 x i1> @llvm.aarch64.sve.ptrue.nxv2i1(i32 31)
 347   %elt = insertelement <vscale x 2 x i64> undef, i64 127, i64 0
 348   %splat = shufflevector <vscale x 2 x i64> %elt, <vscale x 2 x i64> undef, <vscale x 2 x i32> zeroinitializer
 349   %out = call <vscale x 2 x i64> @llvm.aarch64.sve.smax.nxv2i64(<vscale x 2 x i1> %pg,
 350                                                                 <vscale x 2 x i64> %a,
 351                                                                 <vscale x 2 x i64> %splat)
 352   ret <vscale x 2 x i64> %out
 353 }
 354
 355 define <vscale x 2 x i64> @smax_i64_out_of_range(<vscale x 2 x i64> %a) {
 356 ; CHECK-LABEL: smax_i64_out_of_range:
 357 ; CHECK:       // %bb.0:
 358 ; CHECK-NEXT:    mov w8, #65535
 359 ; CHECK-NEXT:    ptrue p0.d
 360 ; CHECK-NEXT:    mov z1.d, x8
 361 ; CHECK-NEXT:    smax z0.d, p0/m, z0.d, z1.d
 362 ; CHECK-NEXT:    ret
 363   %pg = call <vscale x 2 x i1> @llvm.aarch64.sve.ptrue.nxv2i1(i32 31)
 364   %elt = insertelement <vscale x 2 x i64> undef, i64 65535, i64 0
 365   %splat = shufflevector <vscale x 2 x i64> %elt, <vscale x 2 x i64> undef, <vscale x 2 x i32> zeroinitializer
 366   %out = call <vscale x 2 x i64> @llvm.aarch64.sve.smax.nxv2i64(<vscale x 2 x i1> %pg,
 367                                                                 <vscale x 2 x i64> %a,
 368                                                                 <vscale x 2 x i64> %splat)
 369   ret <vscale x 2 x i64> %out
 370 }
 371
 372 ; As smax_i32 but where pg is i8 based and thus compatible for i32.
 373 define <vscale x 4 x i32> @smax_i32_ptrue_all_b(<vscale x 4 x i32> %a) #0 {
 374 ; CHECK-LABEL: smax_i32_ptrue_all_b:
 375 ; CHECK: smax z0.s, z0.s, #1
 376 ; CHECK-NEXT: ret
 377   %pg.b = tail call <vscale x 16 x i1> @llvm.aarch64.sve.ptrue.nxv16i1(i32 31)
 378   %pg.s = tail call <vscale x 4 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv4i1(<vscale x 16 x i1> %pg.b)
 379   %b = tail call <vscale x 4 x i32> @llvm.aarch64.sve.dup.x.nxv4i32(i32 1)
 380   %out = tail call <vscale x 4 x i32> @llvm.aarch64.sve.smax.nxv4i32(<vscale x 4 x i1> %pg.s,
 381                                                                      <vscale x 4 x i32> %a,
 382                                                                      <vscale x 4 x i32> %b)
 383   ret <vscale x 4 x i32> %out
 384 }
 385
 386 ; As smax_i32 but where pg is i16 based and thus compatible for i32.
 387 define <vscale x 4 x i32> @smax_i32_ptrue_all_h(<vscale x 4 x i32> %a) #0 {
 388 ; CHECK-LABEL: smax_i32_ptrue_all_h:
 389 ; CHECK: smax z0.s, z0.s, #1
 390 ; CHECK-NEXT: ret
 391   %pg.h = tail call <vscale x 8 x i1> @llvm.aarch64.sve.ptrue.nxv8i1(i32 31)
 392   %pg.b = tail call <vscale x 16 x i1> @llvm.aarch64.sve.convert.to.svbool.nxv8i1(<vscale x 8 x i1> %pg.h)
 393   %pg.s = tail call <vscale x 4 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv4i1(<vscale x 16 x i1> %pg.b)
 394   %b = tail call <vscale x 4 x i32> @llvm.aarch64.sve.dup.x.nxv4i32(i32 1)
 395   %out = tail call <vscale x 4 x i32> @llvm.aarch64.sve.smax.nxv4i32(<vscale x 4 x i1> %pg.s,
 396                                                                      <vscale x 4 x i32> %a,
 397                                                                      <vscale x 4 x i32> %b)
 398   ret <vscale x 4 x i32> %out
 399 }
 400
 401 ; As smax_i32 but where pg is i64 based, which is not compatibile for i32 and
 402 ; thus inactive lanes are important and the immediate form cannot be used.
 403 define <vscale x 4 x i32> @smax_i32_ptrue_all_d(<vscale x 4 x i32> %a) #0 {
 404 ; CHECK-LABEL: smax_i32_ptrue_all_d:
 405 ; CHECK-DAG: ptrue [[PG:p[0-9]+]].d
 406 ; CHECK-DAG: mov [[DUP:z[0-9]+]].s, #1
 407 ; CHECK-DAG: smax z0.s, [[PG]]/m, z0.s, [[DUP]].s
 408 ; CHECK-NEXT: ret
 409   %pg.d = tail call <vscale x 2 x i1> @llvm.aarch64.sve.ptrue.nxv2i1(i32 31)
 410   %pg.b = tail call <vscale x 16 x i1> @llvm.aarch64.sve.convert.to.svbool.nxv2i1(<vscale x 2 x i1> %pg.d)
 411   %pg.s = tail call <vscale x 4 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv4i1(<vscale x 16 x i1> %pg.b)
 412   %b = tail call <vscale x 4 x i32> @llvm.aarch64.sve.dup.x.nxv4i32(i32 1)
 413   %out = tail call <vscale x 4 x i32> @llvm.aarch64.sve.smax.nxv4i32(<vscale x 4 x i1> %pg.s,
 414                                                                      <vscale x 4 x i32> %a,
 415                                                                      <vscale x 4 x i32> %b)
 416   ret <vscale x 4 x i32> %out
 417 }
 418
 419 ; SMIN
 420
 421 define <vscale x 16 x i8> @smin_i8(<vscale x 16 x i8> %a) {
 422 ; CHECK-LABEL: smin_i8:
 423 ; CHECK:       // %bb.0:
 424 ; CHECK-NEXT:    smin z0.b, z0.b, #127
 425 ; CHECK-NEXT:    ret
 426   %pg = call <vscale x 16 x i1> @llvm.aarch64.sve.ptrue.nxv16i1(i32 31)
 427   %elt = insertelement <vscale x 16 x i8> undef, i8 127, i32 0
 428   %splat = shufflevector <vscale x 16 x i8> %elt, <vscale x 16 x i8> undef, <vscale x 16 x i32> zeroinitializer
 429   %out = call <vscale x 16 x i8> @llvm.aarch64.sve.smin.nxv16i8(<vscale x 16 x i1> %pg,
 430                                                                 <vscale x 16 x i8> %a,
 431                                                                 <vscale x 16 x i8> %splat)
 432   ret <vscale x 16 x i8> %out
 433 }
 434
 435 define <vscale x 8 x i16> @smin_i16(<vscale x 8 x i16> %a) {
 436 ; CHECK-LABEL: smin_i16:
 437 ; CHECK:       // %bb.0:
 438 ; CHECK-NEXT:    smin z0.h, z0.h, #-128
 439 ; CHECK-NEXT:    ret
 440   %pg = call <vscale x 8 x i1> @llvm.aarch64.sve.ptrue.nxv8i1(i32 31)
 441   %elt = insertelement <vscale x 8 x i16> undef, i16 -128, i32 0
 442   %splat = shufflevector <vscale x 8 x i16> %elt, <vscale x 8 x i16> undef, <vscale x 8 x i32> zeroinitializer
 443   %out = call <vscale x 8 x i16> @llvm.aarch64.sve.smin.nxv8i16(<vscale x 8 x i1> %pg,
 444                                                                 <vscale x 8 x i16> %a,
 445                                                                 <vscale x 8 x i16> %splat)
 446   ret <vscale x 8 x i16> %out
 447 }
 448
 449 define <vscale x 8 x i16> @smin_i16_out_of_range(<vscale x 8 x i16> %a) {
 450 ; CHECK-LABEL: smin_i16_out_of_range:
 451 ; CHECK:       // %bb.0:
 452 ; CHECK-NEXT:    mov w8, #-129
 453 ; CHECK-NEXT:    ptrue p0.h
 454 ; CHECK-NEXT:    mov z1.h, w8
 455 ; CHECK-NEXT:    smin z0.h, p0/m, z0.h, z1.h
 456 ; CHECK-NEXT:    ret
 457   %pg = call <vscale x 8 x i1> @llvm.aarch64.sve.ptrue.nxv8i1(i32 31)
 458   %elt = insertelement <vscale x 8 x i16> undef, i16 -129, i32 0
 459   %splat = shufflevector <vscale x 8 x i16> %elt, <vscale x 8 x i16> undef, <vscale x 8 x i32> zeroinitializer
 460   %out = call <vscale x 8 x i16> @llvm.aarch64.sve.smin.nxv8i16(<vscale x 8 x i1> %pg,
 461                                                                 <vscale x 8 x i16> %a,
 462                                                                 <vscale x 8 x i16> %splat)
 463   ret <vscale x 8 x i16> %out
 464 }
 465
 466 define <vscale x 4 x i32> @smin_i32(<vscale x 4 x i32> %a) {
 467 ; CHECK-LABEL: smin_i32:
 468 ; CHECK:       // %bb.0:
 469 ; CHECK-NEXT:    smin z0.s, z0.s, #127
 470 ; CHECK-NEXT:    ret
 471   %pg = call <vscale x 4 x i1> @llvm.aarch64.sve.ptrue.nxv4i1(i32 31)
 472   %elt = insertelement <vscale x 4 x i32> undef, i32 127, i32 0
 473   %splat = shufflevector <vscale x 4 x i32> %elt, <vscale x 4 x i32> undef, <vscale x 4 x i32> zeroinitializer
 474   %out = call <vscale x 4 x i32> @llvm.aarch64.sve.smin.nxv4i32(<vscale x 4 x i1> %pg,
 475                                                                 <vscale x 4 x i32> %a,
 476                                                                 <vscale x 4 x i32> %splat)
 477   ret <vscale x 4 x i32> %out
 478 }
 479
 480 define <vscale x 4 x i32> @smin_i32_out_of_range(<vscale x 4 x i32> %a) {
 481 ; CHECK-LABEL: smin_i32_out_of_range:
 482 ; CHECK:       // %bb.0:
 483 ; CHECK-NEXT:    mov w8, #257
 484 ; CHECK-NEXT:    ptrue p0.s
 485 ; CHECK-NEXT:    mov z1.s, w8
 486 ; CHECK-NEXT:    smin z0.s, p0/m, z0.s, z1.s
 487 ; CHECK-NEXT:    ret
 488   %pg = call <vscale x 4 x i1> @llvm.aarch64.sve.ptrue.nxv4i1(i32 31)
 489   %elt = insertelement <vscale x 4 x i32> undef, i32 257, i32 0
 490   %splat = shufflevector <vscale x 4 x i32> %elt, <vscale x 4 x i32> undef, <vscale x 4 x i32> zeroinitializer
 491   %out = call <vscale x 4 x i32> @llvm.aarch64.sve.smin.nxv4i32(<vscale x 4 x i1> %pg,
 492                                                                 <vscale x 4 x i32> %a,
 493                                                                 <vscale x 4 x i32> %splat)
 494   ret <vscale x 4 x i32> %out
 495 }
 496
 497
 498 define <vscale x 2 x i64> @smin_i64(<vscale x 2 x i64> %a) {
 499 ; CHECK-LABEL: smin_i64:
 500 ; CHECK:       // %bb.0:
 501 ; CHECK-NEXT:    smin z0.d, z0.d, #-128
 502 ; CHECK-NEXT:    ret
 503   %pg = call <vscale x 2 x i1> @llvm.aarch64.sve.ptrue.nxv2i1(i32 31)
 504   %elt = insertelement <vscale x 2 x i64> undef, i64 -128, i64 0
 505   %splat = shufflevector <vscale x 2 x i64> %elt, <vscale x 2 x i64> undef, <vscale x 2 x i32> zeroinitializer
 506   %out = call <vscale x 2 x i64> @llvm.aarch64.sve.smin.nxv2i64(<vscale x 2 x i1> %pg,
 507                                                                 <vscale x 2 x i64> %a,
 508                                                                 <vscale x 2 x i64> %splat)
 509   ret <vscale x 2 x i64> %out
 510 }
 511
 512 define <vscale x 2 x i64> @smin_i64_out_of_range(<vscale x 2 x i64> %a) {
 513 ; CHECK-LABEL: smin_i64_out_of_range:
 514 ; CHECK:       // %bb.0:
 515 ; CHECK-NEXT:    ptrue p0.d
 516 ; CHECK-NEXT:    mov z1.d, #-256 // =0xffffffffffffff00
 517 ; CHECK-NEXT:    smin z0.d, p0/m, z0.d, z1.d
 518 ; CHECK-NEXT:    ret
 519   %pg = call <vscale x 2 x i1> @llvm.aarch64.sve.ptrue.nxv2i1(i32 31)
 520   %elt = insertelement <vscale x 2 x i64> undef, i64 -256, i64 0
 521   %splat = shufflevector <vscale x 2 x i64> %elt, <vscale x 2 x i64> undef, <vscale x 2 x i32> zeroinitializer
 522   %out = call <vscale x 2 x i64> @llvm.aarch64.sve.smin.nxv2i64(<vscale x 2 x i1> %pg,
 523                                                                 <vscale x 2 x i64> %a,
 524                                                                 <vscale x 2 x i64> %splat)
 525   ret <vscale x 2 x i64> %out
 526 }
 527
 528 ; As smin_i32 but where pg is i8 based and thus compatible for i32.
 529 define <vscale x 4 x i32> @smin_i32_ptrue_all_b(<vscale x 4 x i32> %a) #0 {
 530 ; CHECK-LABEL: smin_i32_ptrue_all_b:
 531 ; CHECK: smin z0.s, z0.s, #1
 532 ; CHECK-NEXT: ret
 533   %pg.b = tail call <vscale x 16 x i1> @llvm.aarch64.sve.ptrue.nxv16i1(i32 31)
 534   %pg.s = tail call <vscale x 4 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv4i1(<vscale x 16 x i1> %pg.b)
 535   %b = tail call <vscale x 4 x i32> @llvm.aarch64.sve.dup.x.nxv4i32(i32 1)
 536   %out = tail call <vscale x 4 x i32> @llvm.aarch64.sve.smin.nxv4i32(<vscale x 4 x i1> %pg.s,
 537                                                                      <vscale x 4 x i32> %a,
 538                                                                      <vscale x 4 x i32> %b)
 539   ret <vscale x 4 x i32> %out
 540 }
 541
 542 ; As smin_i32 but where pg is i16 based and thus compatible for i32.
 543 define <vscale x 4 x i32> @smin_i32_ptrue_all_h(<vscale x 4 x i32> %a) #0 {
 544 ; CHECK-LABEL: smin_i32_ptrue_all_h:
 545 ; CHECK: smin z0.s, z0.s, #1
 546 ; CHECK-NEXT: ret
 547   %pg.h = tail call <vscale x 8 x i1> @llvm.aarch64.sve.ptrue.nxv8i1(i32 31)
 548   %pg.b = tail call <vscale x 16 x i1> @llvm.aarch64.sve.convert.to.svbool.nxv8i1(<vscale x 8 x i1> %pg.h)
 549   %pg.s = tail call <vscale x 4 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv4i1(<vscale x 16 x i1> %pg.b)
 550   %b = tail call <vscale x 4 x i32> @llvm.aarch64.sve.dup.x.nxv4i32(i32 1)
 551   %out = tail call <vscale x 4 x i32> @llvm.aarch64.sve.smin.nxv4i32(<vscale x 4 x i1> %pg.s,
 552                                                                      <vscale x 4 x i32> %a,
 553                                                                      <vscale x 4 x i32> %b)
 554   ret <vscale x 4 x i32> %out
 555 }
 556
 557 ; As smin_i32 but where pg is i64 based, which is not compatibile for i32 and
 558 ; thus inactive lanes are important and the immediate form cannot be used.
 559 define <vscale x 4 x i32> @smin_i32_ptrue_all_d(<vscale x 4 x i32> %a) #0 {
 560 ; CHECK-LABEL: smin_i32_ptrue_all_d:
 561 ; CHECK-DAG: ptrue [[PG:p[0-9]+]].d
 562 ; CHECK-DAG: mov [[DUP:z[0-9]+]].s, #1
 563 ; CHECK-DAG: smin z0.s, [[PG]]/m, z0.s, [[DUP]].s
 564 ; CHECK-NEXT: ret
 565   %pg.d = tail call <vscale x 2 x i1> @llvm.aarch64.sve.ptrue.nxv2i1(i32 31)
 566   %pg.b = tail call <vscale x 16 x i1> @llvm.aarch64.sve.convert.to.svbool.nxv2i1(<vscale x 2 x i1> %pg.d)
 567   %pg.s = tail call <vscale x 4 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv4i1(<vscale x 16 x i1> %pg.b)
 568   %b = tail call <vscale x 4 x i32> @llvm.aarch64.sve.dup.x.nxv4i32(i32 1)
 569   %out = tail call <vscale x 4 x i32> @llvm.aarch64.sve.smin.nxv4i32(<vscale x 4 x i1> %pg.s,
 570                                                                      <vscale x 4 x i32> %a,
 571                                                                      <vscale x 4 x i32> %b)
 572   ret <vscale x 4 x i32> %out
 573 }
 574
 575 ; UMAX
 576
 577 define <vscale x 16 x i8> @umax_i8(<vscale x 16 x i8> %a) {
 578 ; CHECK-LABEL: umax_i8:
 579 ; CHECK:       // %bb.0:
 580 ; CHECK-NEXT:    umax z0.b, z0.b, #0
 581 ; CHECK-NEXT:    ret
 582   %pg = call <vscale x 16 x i1> @llvm.aarch64.sve.ptrue.nxv16i1(i32 31)
 583   %elt = insertelement <vscale x 16 x i8> undef, i8 0, i32 0
 584   %splat = shufflevector <vscale x 16 x i8> %elt, <vscale x 16 x i8> undef, <vscale x 16 x i32> zeroinitializer
 585   %out = call <vscale x 16 x i8> @llvm.aarch64.sve.umax.nxv16i8(<vscale x 16 x i1> %pg,
 586                                                                 <vscale x 16 x i8> %a,
 587                                                                 <vscale x 16 x i8> %splat)
 588   ret <vscale x 16 x i8> %out
 589 }
 590
 591 define <vscale x 8 x i16> @umax_i16(<vscale x 8 x i16> %a) {
 592 ; CHECK-LABEL: umax_i16:
 593 ; CHECK:       // %bb.0:
 594 ; CHECK-NEXT:    umax z0.h, z0.h, #255
 595 ; CHECK-NEXT:    ret
 596   %pg = call <vscale x 8 x i1> @llvm.aarch64.sve.ptrue.nxv8i1(i32 31)
 597   %elt = insertelement <vscale x 8 x i16> undef, i16 255, i32 0
 598   %splat = shufflevector <vscale x 8 x i16> %elt, <vscale x 8 x i16> undef, <vscale x 8 x i32> zeroinitializer
 599   %out = call <vscale x 8 x i16> @llvm.aarch64.sve.umax.nxv8i16(<vscale x 8 x i1> %pg,
 600                                                                 <vscale x 8 x i16> %a,
 601                                                                 <vscale x 8 x i16> %splat)
 602   ret <vscale x 8 x i16> %out
 603 }
 604
 605 define <vscale x 8 x i16> @umax_i16_out_of_range(<vscale x 8 x i16> %a) {
 606 ; CHECK-LABEL: umax_i16_out_of_range:
 607 ; CHECK:       // %bb.0:
 608 ; CHECK-NEXT:    mov w8, #257
 609 ; CHECK-NEXT:    ptrue p0.h
 610 ; CHECK-NEXT:    mov z1.h, w8
 611 ; CHECK-NEXT:    umax z0.h, p0/m, z0.h, z1.h
 612 ; CHECK-NEXT:    ret
 613   %pg = call <vscale x 8 x i1> @llvm.aarch64.sve.ptrue.nxv8i1(i32 31)
 614   %elt = insertelement <vscale x 8 x i16> undef, i16 257, i32 0
 615   %splat = shufflevector <vscale x 8 x i16> %elt, <vscale x 8 x i16> undef, <vscale x 8 x i32> zeroinitializer
 616   %out = call <vscale x 8 x i16> @llvm.aarch64.sve.umax.nxv8i16(<vscale x 8 x i1> %pg,
 617                                                                 <vscale x 8 x i16> %a,
 618                                                                 <vscale x 8 x i16> %splat)
 619   ret <vscale x 8 x i16> %out
 620 }
 621
 622 define <vscale x 4 x i32> @umax_i32(<vscale x 4 x i32> %a) {
 623 ; CHECK-LABEL: umax_i32:
 624 ; CHECK:       // %bb.0:
 625 ; CHECK-NEXT:    umax z0.s, z0.s, #0
 626 ; CHECK-NEXT:    ret
 627   %pg = call <vscale x 4 x i1> @llvm.aarch64.sve.ptrue.nxv4i1(i32 31)
 628   %elt = insertelement <vscale x 4 x i32> undef, i32 0, i32 0
 629   %splat = shufflevector <vscale x 4 x i32> %elt, <vscale x 4 x i32> undef, <vscale x 4 x i32> zeroinitializer
 630   %out = call <vscale x 4 x i32> @llvm.aarch64.sve.umax.nxv4i32(<vscale x 4 x i1> %pg,
 631                                                                 <vscale x 4 x i32> %a,
 632                                                                 <vscale x 4 x i32> %splat)
 633   ret <vscale x 4 x i32> %out
 634 }
 635
 636 define <vscale x 4 x i32> @umax_i32_out_of_range(<vscale x 4 x i32> %a) {
 637 ; CHECK-LABEL: umax_i32_out_of_range:
 638 ; CHECK:       // %bb.0:
 639 ; CHECK-NEXT:    mov w8, #257
 640 ; CHECK-NEXT:    ptrue p0.s
 641 ; CHECK-NEXT:    mov z1.s, w8
 642 ; CHECK-NEXT:    umax z0.s, p0/m, z0.s, z1.s
 643 ; CHECK-NEXT:    ret
 644   %pg = call <vscale x 4 x i1> @llvm.aarch64.sve.ptrue.nxv4i1(i32 31)
 645   %elt = insertelement <vscale x 4 x i32> undef, i32 257, i32 0
 646   %splat = shufflevector <vscale x 4 x i32> %elt, <vscale x 4 x i32> undef, <vscale x 4 x i32> zeroinitializer
 647   %out = call <vscale x 4 x i32> @llvm.aarch64.sve.umax.nxv4i32(<vscale x 4 x i1> %pg,
 648                                                                 <vscale x 4 x i32> %a,
 649                                                                 <vscale x 4 x i32> %splat)
 650   ret <vscale x 4 x i32> %out
 651 }
 652
 653 define <vscale x 2 x i64> @umax_i64(<vscale x 2 x i64> %a) {
 654 ; CHECK-LABEL: umax_i64:
 655 ; CHECK:       // %bb.0:
 656 ; CHECK-NEXT:    umax z0.d, z0.d, #255
 657 ; CHECK-NEXT:    ret
 658   %pg = call <vscale x 2 x i1> @llvm.aarch64.sve.ptrue.nxv2i1(i32 31)
 659   %elt = insertelement <vscale x 2 x i64> undef, i64 255, i64 0
 660   %splat = shufflevector <vscale x 2 x i64> %elt, <vscale x 2 x i64> undef, <vscale x 2 x i32> zeroinitializer
 661   %out = call <vscale x 2 x i64> @llvm.aarch64.sve.umax.nxv2i64(<vscale x 2 x i1> %pg,
 662                                                                 <vscale x 2 x i64> %a,
 663                                                                 <vscale x 2 x i64> %splat)
 664   ret <vscale x 2 x i64> %out
 665 }
 666
 667 define <vscale x 2 x i64> @umax_i64_out_of_range(<vscale x 2 x i64> %a) {
 668 ; CHECK-LABEL: umax_i64_out_of_range:
 669 ; CHECK:       // %bb.0:
 670 ; CHECK-NEXT:    mov w8, #65535
 671 ; CHECK-NEXT:    ptrue p0.d
 672 ; CHECK-NEXT:    mov z1.d, x8
 673 ; CHECK-NEXT:    umax z0.d, p0/m, z0.d, z1.d
 674 ; CHECK-NEXT:    ret
 675   %pg = call <vscale x 2 x i1> @llvm.aarch64.sve.ptrue.nxv2i1(i32 31)
 676   %elt = insertelement <vscale x 2 x i64> undef, i64 65535, i64 0
 677   %splat = shufflevector <vscale x 2 x i64> %elt, <vscale x 2 x i64> undef, <vscale x 2 x i32> zeroinitializer
 678   %out = call <vscale x 2 x i64> @llvm.aarch64.sve.umax.nxv2i64(<vscale x 2 x i1> %pg,
 679                                                                 <vscale x 2 x i64> %a,
 680                                                                 <vscale x 2 x i64> %splat)
 681   ret <vscale x 2 x i64> %out
 682 }
 683
 684 ; As umax_i32 but where pg is i8 based and thus compatible for i32.
 685 define <vscale x 4 x i32> @umax_i32_ptrue_all_b(<vscale x 4 x i32> %a) #0 {
 686 ; CHECK-LABEL: umax_i32_ptrue_all_b:
 687 ; CHECK: umax z0.s, z0.s, #1
 688 ; CHECK-NEXT: ret
 689   %pg.b = tail call <vscale x 16 x i1> @llvm.aarch64.sve.ptrue.nxv16i1(i32 31)
 690   %pg.s = tail call <vscale x 4 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv4i1(<vscale x 16 x i1> %pg.b)
 691   %b = tail call <vscale x 4 x i32> @llvm.aarch64.sve.dup.x.nxv4i32(i32 1)
 692   %out = tail call <vscale x 4 x i32> @llvm.aarch64.sve.umax.nxv4i32(<vscale x 4 x i1> %pg.s,
 693                                                                      <vscale x 4 x i32> %a,
 694                                                                      <vscale x 4 x i32> %b)
 695   ret <vscale x 4 x i32> %out
 696 }
 697
 698 ; As umax_i32 but where pg is i16 based and thus compatible for i32.
 699 define <vscale x 4 x i32> @umax_i32_ptrue_all_h(<vscale x 4 x i32> %a) #0 {
 700 ; CHECK-LABEL: umax_i32_ptrue_all_h:
 701 ; CHECK: umax z0.s, z0.s, #1
 702 ; CHECK-NEXT: ret
 703   %pg.h = tail call <vscale x 8 x i1> @llvm.aarch64.sve.ptrue.nxv8i1(i32 31)
 704   %pg.b = tail call <vscale x 16 x i1> @llvm.aarch64.sve.convert.to.svbool.nxv8i1(<vscale x 8 x i1> %pg.h)
 705   %pg.s = tail call <vscale x 4 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv4i1(<vscale x 16 x i1> %pg.b)
 706   %b = tail call <vscale x 4 x i32> @llvm.aarch64.sve.dup.x.nxv4i32(i32 1)
 707   %out = tail call <vscale x 4 x i32> @llvm.aarch64.sve.umax.nxv4i32(<vscale x 4 x i1> %pg.s,
 708                                                                      <vscale x 4 x i32> %a,
 709                                                                      <vscale x 4 x i32> %b)
 710   ret <vscale x 4 x i32> %out
 711 }
 712
 713 ; As umax_i32 but where pg is i64 based, which is not compatibile for i32 and
 714 ; thus inactive lanes are important and the immediate form cannot be used.
 715 define <vscale x 4 x i32> @umax_i32_ptrue_all_d(<vscale x 4 x i32> %a) #0 {
 716 ; CHECK-LABEL: umax_i32_ptrue_all_d:
 717 ; CHECK-DAG: ptrue [[PG:p[0-9]+]].d
 718 ; CHECK-DAG: mov [[DUP:z[0-9]+]].s, #1
 719 ; CHECK-DAG: umax z0.s, [[PG]]/m, z0.s, [[DUP]].s
 720 ; CHECK-NEXT: ret
 721   %pg.d = tail call <vscale x 2 x i1> @llvm.aarch64.sve.ptrue.nxv2i1(i32 31)
 722   %pg.b = tail call <vscale x 16 x i1> @llvm.aarch64.sve.convert.to.svbool.nxv2i1(<vscale x 2 x i1> %pg.d)
 723   %pg.s = tail call <vscale x 4 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv4i1(<vscale x 16 x i1> %pg.b)
 724   %b = tail call <vscale x 4 x i32> @llvm.aarch64.sve.dup.x.nxv4i32(i32 1)
 725   %out = tail call <vscale x 4 x i32> @llvm.aarch64.sve.umax.nxv4i32(<vscale x 4 x i1> %pg.s,
 726                                                                      <vscale x 4 x i32> %a,
 727                                                                      <vscale x 4 x i32> %b)
 728   ret <vscale x 4 x i32> %out
 729 }
 730
 731 ; UMIN
 732
 733 define <vscale x 16 x i8> @umin_i8(<vscale x 16 x i8> %a) {
 734 ; CHECK-LABEL: umin_i8:
 735 ; CHECK:       // %bb.0:
 736 ; CHECK-NEXT:    umin z0.b, z0.b, #255
 737 ; CHECK-NEXT:    ret
 738   %pg = call <vscale x 16 x i1> @llvm.aarch64.sve.ptrue.nxv16i1(i32 31)
 739   %elt = insertelement <vscale x 16 x i8> undef, i8 255, i32 0
 740   %splat = shufflevector <vscale x 16 x i8> %elt, <vscale x 16 x i8> undef, <vscale x 16 x i32> zeroinitializer
 741   %out = call <vscale x 16 x i8> @llvm.aarch64.sve.umin.nxv16i8(<vscale x 16 x i1> %pg,
 742                                                                 <vscale x 16 x i8> %a,
 743                                                                 <vscale x 16 x i8> %splat)
 744   ret <vscale x 16 x i8> %out
 745 }
 746
 747 define <vscale x 8 x i16> @umin_i16(<vscale x 8 x i16> %a) {
 748 ; CHECK-LABEL: umin_i16:
 749 ; CHECK:       // %bb.0:
 750 ; CHECK-NEXT:    umin z0.h, z0.h, #0
 751 ; CHECK-NEXT:    ret
 752   %pg = call <vscale x 8 x i1> @llvm.aarch64.sve.ptrue.nxv8i1(i32 31)
 753   %elt = insertelement <vscale x 8 x i16> undef, i16 0, i32 0
 754   %splat = shufflevector <vscale x 8 x i16> %elt, <vscale x 8 x i16> undef, <vscale x 8 x i32> zeroinitializer
 755   %out = call <vscale x 8 x i16> @llvm.aarch64.sve.umin.nxv8i16(<vscale x 8 x i1> %pg,
 756                                                                 <vscale x 8 x i16> %a,
 757                                                                 <vscale x 8 x i16> %splat)
 758   ret <vscale x 8 x i16> %out
 759 }
 760
 761 define <vscale x 8 x i16> @umin_i16_out_of_range(<vscale x 8 x i16> %a) {
 762 ; CHECK-LABEL: umin_i16_out_of_range:
 763 ; CHECK:       // %bb.0:
 764 ; CHECK-NEXT:    mov w8, #257
 765 ; CHECK-NEXT:    ptrue p0.h
 766 ; CHECK-NEXT:    mov z1.h, w8
 767 ; CHECK-NEXT:    umin z0.h, p0/m, z0.h, z1.h
 768 ; CHECK-NEXT:    ret
 769   %pg = call <vscale x 8 x i1> @llvm.aarch64.sve.ptrue.nxv8i1(i32 31)
 770   %elt = insertelement <vscale x 8 x i16> undef, i16 257, i32 0
 771   %splat = shufflevector <vscale x 8 x i16> %elt, <vscale x 8 x i16> undef, <vscale x 8 x i32> zeroinitializer
 772   %out = call <vscale x 8 x i16> @llvm.aarch64.sve.umin.nxv8i16(<vscale x 8 x i1> %pg,
 773                                                                 <vscale x 8 x i16> %a,
 774                                                                 <vscale x 8 x i16> %splat)
 775   ret <vscale x 8 x i16> %out
 776 }
 777
 778 define <vscale x 4 x i32> @umin_i32(<vscale x 4 x i32> %a) {
 779 ; CHECK-LABEL: umin_i32:
 780 ; CHECK:       // %bb.0:
 781 ; CHECK-NEXT:    umin z0.s, z0.s, #255
 782 ; CHECK-NEXT:    ret
 783   %pg = call <vscale x 4 x i1> @llvm.aarch64.sve.ptrue.nxv4i1(i32 31)
 784   %elt = insertelement <vscale x 4 x i32> undef, i32 255, i32 0
 785   %splat = shufflevector <vscale x 4 x i32> %elt, <vscale x 4 x i32> undef, <vscale x 4 x i32> zeroinitializer
 786   %out = call <vscale x 4 x i32> @llvm.aarch64.sve.umin.nxv4i32(<vscale x 4 x i1> %pg,
 787                                                                 <vscale x 4 x i32> %a,
 788                                                                 <vscale x 4 x i32> %splat)
 789   ret <vscale x 4 x i32> %out
 790 }
 791
 792 define <vscale x 4 x i32> @umin_i32_out_of_range(<vscale x 4 x i32> %a) {
 793 ; CHECK-LABEL: umin_i32_out_of_range:
 794 ; CHECK:       // %bb.0:
 795 ; CHECK-NEXT:    mov w8, #257
 796 ; CHECK-NEXT:    ptrue p0.s
 797 ; CHECK-NEXT:    mov z1.s, w8
 798 ; CHECK-NEXT:    umin z0.s, p0/m, z0.s, z1.s
 799 ; CHECK-NEXT:    ret
 800   %pg = call <vscale x 4 x i1> @llvm.aarch64.sve.ptrue.nxv4i1(i32 31)
 801   %elt = insertelement <vscale x 4 x i32> undef, i32 257, i32 0
 802   %splat = shufflevector <vscale x 4 x i32> %elt, <vscale x 4 x i32> undef, <vscale x 4 x i32> zeroinitializer
 803   %out = call <vscale x 4 x i32> @llvm.aarch64.sve.umin.nxv4i32(<vscale x 4 x i1> %pg,
 804                                                                 <vscale x 4 x i32> %a,
 805                                                                 <vscale x 4 x i32> %splat)
 806   ret <vscale x 4 x i32> %out
 807 }
 808
 809 define <vscale x 2 x i64> @umin_i64(<vscale x 2 x i64> %a) {
 810 ; CHECK-LABEL: umin_i64:
 811 ; CHECK:       // %bb.0:
 812 ; CHECK-NEXT:    umin z0.d, z0.d, #0
 813 ; CHECK-NEXT:    ret
 814   %pg = call <vscale x 2 x i1> @llvm.aarch64.sve.ptrue.nxv2i1(i32 31)
 815   %elt = insertelement <vscale x 2 x i64> undef, i64 0, i64 0
 816   %splat = shufflevector <vscale x 2 x i64> %elt, <vscale x 2 x i64> undef, <vscale x 2 x i32> zeroinitializer
 817   %out = call <vscale x 2 x i64> @llvm.aarch64.sve.umin.nxv2i64(<vscale x 2 x i1> %pg,
 818                                                                 <vscale x 2 x i64> %a,
 819                                                                 <vscale x 2 x i64> %splat)
 820   ret <vscale x 2 x i64> %out
 821 }
 822
 823 define <vscale x 2 x i64> @umin_i64_out_of_range(<vscale x 2 x i64> %a) {
 824 ; CHECK-LABEL: umin_i64_out_of_range:
 825 ; CHECK:       // %bb.0:
 826 ; CHECK-NEXT:    mov w8, #65535
 827 ; CHECK-NEXT:    ptrue p0.d
 828 ; CHECK-NEXT:    mov z1.d, x8
 829 ; CHECK-NEXT:    umin z0.d, p0/m, z0.d, z1.d
 830 ; CHECK-NEXT:    ret
 831   %pg = call <vscale x 2 x i1> @llvm.aarch64.sve.ptrue.nxv2i1(i32 31)
 832   %elt = insertelement <vscale x 2 x i64> undef, i64 65535, i64 0
 833   %splat = shufflevector <vscale x 2 x i64> %elt, <vscale x 2 x i64> undef, <vscale x 2 x i32> zeroinitializer
 834   %out = call <vscale x 2 x i64> @llvm.aarch64.sve.umin.nxv2i64(<vscale x 2 x i1> %pg,
 835                                                                 <vscale x 2 x i64> %a,
 836                                                                 <vscale x 2 x i64> %splat)
 837   ret <vscale x 2 x i64> %out
 838 }
 839
 840 ; As umin_i32 but where pg is i8 based and thus compatible for i32.
 841 define <vscale x 4 x i32> @umin_i32_ptrue_all_b(<vscale x 4 x i32> %a) #0 {
 842 ; CHECK-LABEL: umin_i32_ptrue_all_b:
 843 ; CHECK: umin z0.s, z0.s, #1
 844 ; CHECK-NEXT: ret
 845   %pg.b = tail call <vscale x 16 x i1> @llvm.aarch64.sve.ptrue.nxv16i1(i32 31)
 846   %pg.s = tail call <vscale x 4 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv4i1(<vscale x 16 x i1> %pg.b)
 847   %b = tail call <vscale x 4 x i32> @llvm.aarch64.sve.dup.x.nxv4i32(i32 1)
 848   %out = tail call <vscale x 4 x i32> @llvm.aarch64.sve.umin.nxv4i32(<vscale x 4 x i1> %pg.s,
 849                                                                      <vscale x 4 x i32> %a,
 850                                                                      <vscale x 4 x i32> %b)
 851   ret <vscale x 4 x i32> %out
 852 }
 853
 854 ; As umin_i32 but where pg is i16 based and thus compatible for i32.
 855 define <vscale x 4 x i32> @umin_i32_ptrue_all_h(<vscale x 4 x i32> %a) #0 {
 856 ; CHECK-LABEL: umin_i32_ptrue_all_h:
 857 ; CHECK: umin z0.s, z0.s, #1
 858 ; CHECK-NEXT: ret
 859   %pg.h = tail call <vscale x 8 x i1> @llvm.aarch64.sve.ptrue.nxv8i1(i32 31)
 860   %pg.b = tail call <vscale x 16 x i1> @llvm.aarch64.sve.convert.to.svbool.nxv8i1(<vscale x 8 x i1> %pg.h)
 861   %pg.s = tail call <vscale x 4 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv4i1(<vscale x 16 x i1> %pg.b)
 862   %b = tail call <vscale x 4 x i32> @llvm.aarch64.sve.dup.x.nxv4i32(i32 1)
 863   %out = tail call <vscale x 4 x i32> @llvm.aarch64.sve.umin.nxv4i32(<vscale x 4 x i1> %pg.s,
 864                                                                      <vscale x 4 x i32> %a,
 865                                                                      <vscale x 4 x i32> %b)
 866   ret <vscale x 4 x i32> %out
 867 }
 868
 869 ; As umin_i32 but where pg is i64 based, which is not compatibile for i32 and
 870 ; thus inactive lanes are important and the immediate form cannot be used.
 871 define <vscale x 4 x i32> @umin_i32_ptrue_all_d(<vscale x 4 x i32> %a) #0 {
 872 ; CHECK-LABEL: umin_i32_ptrue_all_d:
 873 ; CHECK-DAG: ptrue [[PG:p[0-9]+]].d
 874 ; CHECK-DAG: mov [[DUP:z[0-9]+]].s, #1
 875 ; CHECK-DAG: umin z0.s, [[PG]]/m, z0.s, [[DUP]].s
 876 ; CHECK-NEXT: ret
 877   %pg.d = tail call <vscale x 2 x i1> @llvm.aarch64.sve.ptrue.nxv2i1(i32 31)
 878   %pg.b = tail call <vscale x 16 x i1> @llvm.aarch64.sve.convert.to.svbool.nxv2i1(<vscale x 2 x i1> %pg.d)
 879   %pg.s = tail call <vscale x 4 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv4i1(<vscale x 16 x i1> %pg.b)
 880   %b = tail call <vscale x 4 x i32> @llvm.aarch64.sve.dup.x.nxv4i32(i32 1)
 881   %out = tail call <vscale x 4 x i32> @llvm.aarch64.sve.umin.nxv4i32(<vscale x 4 x i1> %pg.s,
 882                                                                      <vscale x 4 x i32> %a,
 883                                                                      <vscale x 4 x i32> %b)
 884   ret <vscale x 4 x i32> %out
 885 }
 886
 887 ; SQADD
 888
 889 define <vscale x 16 x i8> @sqadd_b_lowimm(<vscale x 16 x i8> %a) {
 890 ; CHECK-LABEL: sqadd_b_lowimm:
 891 ; CHECK:       // %bb.0:
 892 ; CHECK-NEXT:    sqadd z0.b, z0.b, #27 // =0x1b
 893 ; CHECK-NEXT:    ret
 894   %elt = insertelement <vscale x 16 x i8> undef, i8 27, i32 0
 895   %splat = shufflevector <vscale x 16 x i8> %elt, <vscale x 16 x i8> undef, <vscale x 16 x i32> zeroinitializer
 896   %out = call <vscale x 16 x i8> @llvm.aarch64.sve.sqadd.x.nxv16i8(<vscale x 16 x i8> %a,
 897                                                                    <vscale x 16 x i8> %splat)
 898   ret <vscale x 16 x i8> %out
 899 }
 900
 901 define <vscale x 8 x i16> @sqadd_h_lowimm(<vscale x 8 x i16> %a) {
 902 ; CHECK-LABEL: sqadd_h_lowimm:
 903 ; CHECK:       // %bb.0:
 904 ; CHECK-NEXT:    sqadd z0.h, z0.h, #43 // =0x2b
 905 ; CHECK-NEXT:    ret
 906   %elt = insertelement <vscale x 8 x i16> undef, i16 43, i32 0
 907   %splat = shufflevector <vscale x 8 x i16> %elt, <vscale x 8 x i16> undef, <vscale x 8 x i32> zeroinitializer
 908   %out = call <vscale x 8 x i16> @llvm.aarch64.sve.sqadd.x.nxv8i16(<vscale x 8 x i16> %a,
 909                                                                    <vscale x 8 x i16> %splat)
 910   ret <vscale x 8 x i16> %out
 911 }
 912
 913 define <vscale x 8 x i16> @sqadd_h_highimm(<vscale x 8 x i16> %a) {
 914 ; CHECK-LABEL: sqadd_h_highimm:
 915 ; CHECK:       // %bb.0:
 916 ; CHECK-NEXT:    sqadd z0.h, z0.h, #2048 // =0x800
 917 ; CHECK-NEXT:    ret
 918   %elt = insertelement <vscale x 8 x i16> undef, i16 2048, i32 0
 919   %splat = shufflevector <vscale x 8 x i16> %elt, <vscale x 8 x i16> undef, <vscale x 8 x i32> zeroinitializer
 920   %out = call <vscale x 8 x i16> @llvm.aarch64.sve.sqadd.x.nxv8i16(<vscale x 8 x i16> %a,
 921                                                                    <vscale x 8 x i16> %splat)
 922   ret <vscale x 8 x i16> %out
 923 }
 924
 925 define <vscale x 4 x i32> @sqadd_s_lowimm(<vscale x 4 x i32> %a) {
 926 ; CHECK-LABEL: sqadd_s_lowimm:
 927 ; CHECK:       // %bb.0:
 928 ; CHECK-NEXT:    sqadd z0.s, z0.s, #1 // =0x1
 929 ; CHECK-NEXT:    ret
 930   %elt = insertelement <vscale x 4 x i32> undef, i32 1, i32 0
 931   %splat = shufflevector <vscale x 4 x i32> %elt, <vscale x 4 x i32> undef, <vscale x 4 x i32> zeroinitializer
 932   %out = call <vscale x 4 x i32> @llvm.aarch64.sve.sqadd.x.nxv4i32(<vscale x 4 x i32> %a,
 933                                                                    <vscale x 4 x i32> %splat)
 934   ret <vscale x 4 x i32> %out
 935 }
 936
 937 define <vscale x 4 x i32> @sqadd_s_highimm(<vscale x 4 x i32> %a) {
 938 ; CHECK-LABEL: sqadd_s_highimm:
 939 ; CHECK:       // %bb.0:
 940 ; CHECK-NEXT:    sqadd z0.s, z0.s, #8192 // =0x2000
 941 ; CHECK-NEXT:    ret
 942   %elt = insertelement <vscale x 4 x i32> undef, i32 8192, i32 0
 943   %splat = shufflevector <vscale x 4 x i32> %elt, <vscale x 4 x i32> undef, <vscale x 4 x i32> zeroinitializer
 944   %out = call <vscale x 4 x i32> @llvm.aarch64.sve.sqadd.x.nxv4i32(<vscale x 4 x i32> %a,
 945                                                                    <vscale x 4 x i32> %splat)
 946   ret <vscale x 4 x i32> %out
 947 }
 948
 949 define <vscale x 2 x i64> @sqadd_d_lowimm(<vscale x 2 x i64> %a) {
 950 ; CHECK-LABEL: sqadd_d_lowimm:
 951 ; CHECK:       // %bb.0:
 952 ; CHECK-NEXT:    sqadd z0.d, z0.d, #255 // =0xff
 953 ; CHECK-NEXT:    ret
 954   %elt = insertelement <vscale x 2 x i64> undef, i64 255, i32 0
 955   %splat = shufflevector <vscale x 2 x i64> %elt, <vscale x 2 x i64> undef, <vscale x 2 x i32> zeroinitializer
 956   %out = call <vscale x 2 x i64> @llvm.aarch64.sve.sqadd.x.nxv2i64(<vscale x 2 x i64> %a,
 957                                                                    <vscale x 2 x i64> %splat)
 958   ret <vscale x 2 x i64> %out
 959 }
 960
 961 define <vscale x 2 x i64> @sqadd_d_highimm(<vscale x 2 x i64> %a) {
 962 ; CHECK-LABEL: sqadd_d_highimm:
 963 ; CHECK:       // %bb.0:
 964 ; CHECK-NEXT:    sqadd z0.d, z0.d, #65280 // =0xff00
 965 ; CHECK-NEXT:    ret
 966   %elt = insertelement <vscale x 2 x i64> undef, i64 65280, i32 0
 967   %splat = shufflevector <vscale x 2 x i64> %elt, <vscale x 2 x i64> undef, <vscale x 2 x i32> zeroinitializer
 968   %out = call <vscale x 2 x i64> @llvm.aarch64.sve.sqadd.x.nxv2i64(<vscale x 2 x i64> %a,
 969                                                                    <vscale x 2 x i64> %splat)
 970   ret <vscale x 2 x i64> %out
 971 }
 972
 973 ; SQSUB
 974
 975 define <vscale x 16 x i8> @sqsub_b_lowimm(<vscale x 16 x i8> %a) {
 976 ; CHECK-LABEL: sqsub_b_lowimm:
 977 ; CHECK:       // %bb.0:
 978 ; CHECK-NEXT:    sqsub z0.b, z0.b, #27 // =0x1b
 979 ; CHECK-NEXT:    ret
 980   %elt = insertelement <vscale x 16 x i8> undef, i8 27, i32 0
 981   %splat = shufflevector <vscale x 16 x i8> %elt, <vscale x 16 x i8> undef, <vscale x 16 x i32> zeroinitializer
 982   %out = call <vscale x 16 x i8> @llvm.aarch64.sve.sqsub.x.nxv16i8(<vscale x 16 x i8> %a,
 983                                                                    <vscale x 16 x i8> %splat)
 984   ret <vscale x 16 x i8> %out
 985 }
 986
 987 define <vscale x 8 x i16> @sqsub_h_lowimm(<vscale x 8 x i16> %a) {
 988 ; CHECK-LABEL: sqsub_h_lowimm:
 989 ; CHECK:       // %bb.0:
 990 ; CHECK-NEXT:    sqsub z0.h, z0.h, #43 // =0x2b
 991 ; CHECK-NEXT:    ret
 992   %elt = insertelement <vscale x 8 x i16> undef, i16 43, i32 0
 993   %splat = shufflevector <vscale x 8 x i16> %elt, <vscale x 8 x i16> undef, <vscale x 8 x i32> zeroinitializer
 994   %out = call <vscale x 8 x i16> @llvm.aarch64.sve.sqsub.x.nxv8i16(<vscale x 8 x i16> %a,
 995                                                                    <vscale x 8 x i16> %splat)
 996   ret <vscale x 8 x i16> %out
 997 }
 998
 999 define <vscale x 8 x i16> @sqsub_h_highimm(<vscale x 8 x i16> %a) {
1000 ; CHECK-LABEL: sqsub_h_highimm:
1001 ; CHECK:       // %bb.0:
1002 ; CHECK-NEXT:    sqsub z0.h, z0.h, #2048 // =0x800
1003 ; CHECK-NEXT:    ret
1004   %elt = insertelement <vscale x 8 x i16> undef, i16 2048, i32 0
1005   %splat = shufflevector <vscale x 8 x i16> %elt, <vscale x 8 x i16> undef, <vscale x 8 x i32> zeroinitializer
1006   %out = call <vscale x 8 x i16> @llvm.aarch64.sve.sqsub.x.nxv8i16(<vscale x 8 x i16> %a,
1007                                                                    <vscale x 8 x i16> %splat)
1008   ret <vscale x 8 x i16> %out
1009 }
1010
1011 define <vscale x 4 x i32> @sqsub_s_lowimm(<vscale x 4 x i32> %a) {
1012 ; CHECK-LABEL: sqsub_s_lowimm:
1013 ; CHECK:       // %bb.0:
1014 ; CHECK-NEXT:    sqsub z0.s, z0.s, #1 // =0x1
1015 ; CHECK-NEXT:    ret
1016   %elt = insertelement <vscale x 4 x i32> undef, i32 1, i32 0
1017   %splat = shufflevector <vscale x 4 x i32> %elt, <vscale x 4 x i32> undef, <vscale x 4 x i32> zeroinitializer
1018   %out = call <vscale x 4 x i32> @llvm.aarch64.sve.sqsub.x.nxv4i32(<vscale x 4 x i32> %a,
1019                                                                    <vscale x 4 x i32> %splat)
1020   ret <vscale x 4 x i32> %out
1021 }
1022
1023 define <vscale x 4 x i32> @sqsub_s_highimm(<vscale x 4 x i32> %a) {
1024 ; CHECK-LABEL: sqsub_s_highimm:
1025 ; CHECK:       // %bb.0:
1026 ; CHECK-NEXT:    sqsub z0.s, z0.s, #8192 // =0x2000
1027 ; CHECK-NEXT:    ret
1028   %elt = insertelement <vscale x 4 x i32> undef, i32 8192, i32 0
1029   %splat = shufflevector <vscale x 4 x i32> %elt, <vscale x 4 x i32> undef, <vscale x 4 x i32> zeroinitializer
1030   %out = call <vscale x 4 x i32> @llvm.aarch64.sve.sqsub.x.nxv4i32(<vscale x 4 x i32> %a,
1031                                                                    <vscale x 4 x i32> %splat)
1032   ret <vscale x 4 x i32> %out
1033 }
1034
1035 define <vscale x 2 x i64> @sqsub_d_lowimm(<vscale x 2 x i64> %a) {
1036 ; CHECK-LABEL: sqsub_d_lowimm:
1037 ; CHECK:       // %bb.0:
1038 ; CHECK-NEXT:    sqsub z0.d, z0.d, #255 // =0xff
1039 ; CHECK-NEXT:    ret
1040   %elt = insertelement <vscale x 2 x i64> undef, i64 255, i32 0
1041   %splat = shufflevector <vscale x 2 x i64> %elt, <vscale x 2 x i64> undef, <vscale x 2 x i32> zeroinitializer
1042   %out = call <vscale x 2 x i64> @llvm.aarch64.sve.sqsub.x.nxv2i64(<vscale x 2 x i64> %a,
1043                                                                    <vscale x 2 x i64> %splat)
1044   ret <vscale x 2 x i64> %out
1045 }
1046
1047 define <vscale x 2 x i64> @sqsub_d_highimm(<vscale x 2 x i64> %a) {
1048 ; CHECK-LABEL: sqsub_d_highimm:
1049 ; CHECK:       // %bb.0:
1050 ; CHECK-NEXT:    sqsub z0.d, z0.d, #65280 // =0xff00
1051 ; CHECK-NEXT:    ret
1052   %elt = insertelement <vscale x 2 x i64> undef, i64 65280, i32 0
1053   %splat = shufflevector <vscale x 2 x i64> %elt, <vscale x 2 x i64> undef, <vscale x 2 x i32> zeroinitializer
1054   %out = call <vscale x 2 x i64> @llvm.aarch64.sve.sqsub.x.nxv2i64(<vscale x 2 x i64> %a,
1055                                                                    <vscale x 2 x i64> %splat)
1056   ret <vscale x 2 x i64> %out
1057 }
1058
1059 ; UQADD
1060
1061 define <vscale x 16 x i8> @uqadd_b_lowimm(<vscale x 16 x i8> %a) {
1062 ; CHECK-LABEL: uqadd_b_lowimm:
1063 ; CHECK:       // %bb.0:
1064 ; CHECK-NEXT:    uqadd z0.b, z0.b, #27 // =0x1b
1065 ; CHECK-NEXT:    ret
1066   %elt = insertelement <vscale x 16 x i8> undef, i8 27, i32 0
1067   %splat = shufflevector <vscale x 16 x i8> %elt, <vscale x 16 x i8> undef, <vscale x 16 x i32> zeroinitializer
1068   %out = call <vscale x 16 x i8> @llvm.aarch64.sve.uqadd.x.nxv16i8(<vscale x 16 x i8> %a,
1069                                                                    <vscale x 16 x i8> %splat)
1070   ret <vscale x 16 x i8> %out
1071 }
1072
1073 define <vscale x 8 x i16> @uqadd_h_lowimm(<vscale x 8 x i16> %a) {
1074 ; CHECK-LABEL: uqadd_h_lowimm:
1075 ; CHECK:       // %bb.0:
1076 ; CHECK-NEXT:    uqadd z0.h, z0.h, #43 // =0x2b
1077 ; CHECK-NEXT:    ret
1078   %elt = insertelement <vscale x 8 x i16> undef, i16 43, i32 0
1079   %splat = shufflevector <vscale x 8 x i16> %elt, <vscale x 8 x i16> undef, <vscale x 8 x i32> zeroinitializer
1080   %out = call <vscale x 8 x i16> @llvm.aarch64.sve.uqadd.x.nxv8i16(<vscale x 8 x i16> %a,
1081                                                                    <vscale x 8 x i16> %splat)
1082   ret <vscale x 8 x i16> %out
1083 }
1084
1085 define <vscale x 8 x i16> @uqadd_h_highimm(<vscale x 8 x i16> %a) {
1086 ; CHECK-LABEL: uqadd_h_highimm:
1087 ; CHECK:       // %bb.0:
1088 ; CHECK-NEXT:    uqadd z0.h, z0.h, #2048 // =0x800
1089 ; CHECK-NEXT:    ret
1090   %elt = insertelement <vscale x 8 x i16> undef, i16 2048, i32 0
1091   %splat = shufflevector <vscale x 8 x i16> %elt, <vscale x 8 x i16> undef, <vscale x 8 x i32> zeroinitializer
1092   %out = call <vscale x 8 x i16> @llvm.aarch64.sve.uqadd.x.nxv8i16(<vscale x 8 x i16> %a,
1093                                                                    <vscale x 8 x i16> %splat)
1094   ret <vscale x 8 x i16> %out
1095 }
1096
1097 define <vscale x 4 x i32> @uqadd_s_lowimm(<vscale x 4 x i32> %a) {
1098 ; CHECK-LABEL: uqadd_s_lowimm:
1099 ; CHECK:       // %bb.0:
1100 ; CHECK-NEXT:    uqadd z0.s, z0.s, #1 // =0x1
1101 ; CHECK-NEXT:    ret
1102   %elt = insertelement <vscale x 4 x i32> undef, i32 1, i32 0
1103   %splat = shufflevector <vscale x 4 x i32> %elt, <vscale x 4 x i32> undef, <vscale x 4 x i32> zeroinitializer
1104   %out = call <vscale x 4 x i32> @llvm.aarch64.sve.uqadd.x.nxv4i32(<vscale x 4 x i32> %a,
1105                                                                    <vscale x 4 x i32> %splat)
1106   ret <vscale x 4 x i32> %out
1107 }
1108
1109 define <vscale x 4 x i32> @uqadd_s_highimm(<vscale x 4 x i32> %a) {
1110 ; CHECK-LABEL: uqadd_s_highimm:
1111 ; CHECK:       // %bb.0:
1112 ; CHECK-NEXT:    uqadd z0.s, z0.s, #8192 // =0x2000
1113 ; CHECK-NEXT:    ret
1114   %elt = insertelement <vscale x 4 x i32> undef, i32 8192, i32 0
1115   %splat = shufflevector <vscale x 4 x i32> %elt, <vscale x 4 x i32> undef, <vscale x 4 x i32> zeroinitializer
1116   %out = call <vscale x 4 x i32> @llvm.aarch64.sve.uqadd.x.nxv4i32(<vscale x 4 x i32> %a,
1117                                                                    <vscale x 4 x i32> %splat)
1118   ret <vscale x 4 x i32> %out
1119 }
1120
1121 define <vscale x 2 x i64> @uqadd_d_lowimm(<vscale x 2 x i64> %a) {
1122 ; CHECK-LABEL: uqadd_d_lowimm:
1123 ; CHECK:       // %bb.0:
1124 ; CHECK-NEXT:    uqadd z0.d, z0.d, #255 // =0xff
1125 ; CHECK-NEXT:    ret
1126   %elt = insertelement <vscale x 2 x i64> undef, i64 255, i32 0
1127   %splat = shufflevector <vscale x 2 x i64> %elt, <vscale x 2 x i64> undef, <vscale x 2 x i32> zeroinitializer
1128   %out = call <vscale x 2 x i64> @llvm.aarch64.sve.uqadd.x.nxv2i64(<vscale x 2 x i64> %a,
1129                                                                    <vscale x 2 x i64> %splat)
1130   ret <vscale x 2 x i64> %out
1131 }
1132
1133 define <vscale x 2 x i64> @uqadd_d_highimm(<vscale x 2 x i64> %a) {
1134 ; CHECK-LABEL: uqadd_d_highimm:
1135 ; CHECK:       // %bb.0:
1136 ; CHECK-NEXT:    uqadd z0.d, z0.d, #65280 // =0xff00
1137 ; CHECK-NEXT:    ret
1138   %elt = insertelement <vscale x 2 x i64> undef, i64 65280, i32 0
1139   %splat = shufflevector <vscale x 2 x i64> %elt, <vscale x 2 x i64> undef, <vscale x 2 x i32> zeroinitializer
1140   %out = call <vscale x 2 x i64> @llvm.aarch64.sve.uqadd.x.nxv2i64(<vscale x 2 x i64> %a,
1141                                                                    <vscale x 2 x i64> %splat)
1142   ret <vscale x 2 x i64> %out
1143 }
1144
1145 ; UQSUB
1146
1147 define <vscale x 16 x i8> @uqsub_b_lowimm(<vscale x 16 x i8> %a) {
1148 ; CHECK-LABEL: uqsub_b_lowimm:
1149 ; CHECK:       // %bb.0:
1150 ; CHECK-NEXT:    uqsub z0.b, z0.b, #27 // =0x1b
1151 ; CHECK-NEXT:    ret
1152   %elt = insertelement <vscale x 16 x i8> undef, i8 27, i32 0
1153   %splat = shufflevector <vscale x 16 x i8> %elt, <vscale x 16 x i8> undef, <vscale x 16 x i32> zeroinitializer
1154   %out = call <vscale x 16 x i8> @llvm.aarch64.sve.uqsub.x.nxv16i8(<vscale x 16 x i8> %a,
1155                                                                    <vscale x 16 x i8> %splat)
1156   ret <vscale x 16 x i8> %out
1157 }
1158
1159 define <vscale x 8 x i16> @uqsub_h_lowimm(<vscale x 8 x i16> %a) {
1160 ; CHECK-LABEL: uqsub_h_lowimm:
1161 ; CHECK:       // %bb.0:
1162 ; CHECK-NEXT:    uqsub z0.h, z0.h, #43 // =0x2b
1163 ; CHECK-NEXT:    ret
1164   %elt = insertelement <vscale x 8 x i16> undef, i16 43, i32 0
1165   %splat = shufflevector <vscale x 8 x i16> %elt, <vscale x 8 x i16> undef, <vscale x 8 x i32> zeroinitializer
1166   %out = call <vscale x 8 x i16> @llvm.aarch64.sve.uqsub.x.nxv8i16(<vscale x 8 x i16> %a,
1167                                                                    <vscale x 8 x i16> %splat)
1168   ret <vscale x 8 x i16> %out
1169 }
1170
1171 define <vscale x 8 x i16> @uqsub_h_highimm(<vscale x 8 x i16> %a) {
1172 ; CHECK-LABEL: uqsub_h_highimm:
1173 ; CHECK:       // %bb.0:
1174 ; CHECK-NEXT:    uqsub z0.h, z0.h, #2048 // =0x800
1175 ; CHECK-NEXT:    ret
1176   %elt = insertelement <vscale x 8 x i16> undef, i16 2048, i32 0
1177   %splat = shufflevector <vscale x 8 x i16> %elt, <vscale x 8 x i16> undef, <vscale x 8 x i32> zeroinitializer
1178   %out = call <vscale x 8 x i16> @llvm.aarch64.sve.uqsub.x.nxv8i16(<vscale x 8 x i16> %a,
1179                                                                    <vscale x 8 x i16> %splat)
1180   ret <vscale x 8 x i16> %out
1181 }
1182
1183 define <vscale x 4 x i32> @uqsub_s_lowimm(<vscale x 4 x i32> %a) {
1184 ; CHECK-LABEL: uqsub_s_lowimm:
1185 ; CHECK:       // %bb.0:
1186 ; CHECK-NEXT:    uqsub z0.s, z0.s, #1 // =0x1
1187 ; CHECK-NEXT:    ret
1188   %elt = insertelement <vscale x 4 x i32> undef, i32 1, i32 0
1189   %splat = shufflevector <vscale x 4 x i32> %elt, <vscale x 4 x i32> undef, <vscale x 4 x i32> zeroinitializer
1190   %out = call <vscale x 4 x i32> @llvm.aarch64.sve.uqsub.x.nxv4i32(<vscale x 4 x i32> %a,
1191                                                                    <vscale x 4 x i32> %splat)
1192   ret <vscale x 4 x i32> %out
1193 }
1194
1195 define <vscale x 4 x i32> @uqsub_s_highimm(<vscale x 4 x i32> %a) {
1196 ; CHECK-LABEL: uqsub_s_highimm:
1197 ; CHECK:       // %bb.0:
1198 ; CHECK-NEXT:    uqsub z0.s, z0.s, #8192 // =0x2000
1199 ; CHECK-NEXT:    ret
1200   %elt = insertelement <vscale x 4 x i32> undef, i32 8192, i32 0
1201   %splat = shufflevector <vscale x 4 x i32> %elt, <vscale x 4 x i32> undef, <vscale x 4 x i32> zeroinitializer
1202   %out = call <vscale x 4 x i32> @llvm.aarch64.sve.uqsub.x.nxv4i32(<vscale x 4 x i32> %a,
1203                                                                    <vscale x 4 x i32> %splat)
1204   ret <vscale x 4 x i32> %out
1205 }
1206
1207 define <vscale x 2 x i64> @uqsub_d_lowimm(<vscale x 2 x i64> %a) {
1208 ; CHECK-LABEL: uqsub_d_lowimm:
1209 ; CHECK:       // %bb.0:
1210 ; CHECK-NEXT:    uqsub z0.d, z0.d, #255 // =0xff
1211 ; CHECK-NEXT:    ret
1212   %elt = insertelement <vscale x 2 x i64> undef, i64 255, i32 0
1213   %splat = shufflevector <vscale x 2 x i64> %elt, <vscale x 2 x i64> undef, <vscale x 2 x i32> zeroinitializer
1214   %out = call <vscale x 2 x i64> @llvm.aarch64.sve.uqsub.x.nxv2i64(<vscale x 2 x i64> %a,
1215                                                                    <vscale x 2 x i64> %splat)
1216   ret <vscale x 2 x i64> %out
1217 }
1218
1219 define <vscale x 2 x i64> @uqsub_d_highimm(<vscale x 2 x i64> %a) {
1220 ; CHECK-LABEL: uqsub_d_highimm:
1221 ; CHECK:       // %bb.0:
1222 ; CHECK-NEXT:    uqsub z0.d, z0.d, #65280 // =0xff00
1223 ; CHECK-NEXT:    ret
1224   %elt = insertelement <vscale x 2 x i64> undef, i64 65280, i32 0
1225   %splat = shufflevector <vscale x 2 x i64> %elt, <vscale x 2 x i64> undef, <vscale x 2 x i32> zeroinitializer
1226   %out = call <vscale x 2 x i64> @llvm.aarch64.sve.uqsub.x.nxv2i64(<vscale x 2 x i64> %a,
1227                                                                    <vscale x 2 x i64> %splat)
1228   ret <vscale x 2 x i64> %out
1229 }
1230
1231 ; ASR
1232
1233 define <vscale x 16 x i8> @asr_i8(<vscale x 16 x i1> %pg, <vscale x 16 x i8> %a) {
1234 ; CHECK-LABEL: asr_i8:
1235 ; CHECK:       // %bb.0:
1236 ; CHECK-NEXT:    asr z0.b, p0/m, z0.b, #8
1237 ; CHECK-NEXT:    ret
1238   %elt = insertelement <vscale x 16 x i8> undef, i8 9, i32 0
1239   %splat = shufflevector <vscale x 16 x i8> %elt, <vscale x 16 x i8> undef, <vscale x 16 x i32> zeroinitializer
1240   %out = call <vscale x 16 x i8> @llvm.aarch64.sve.asr.nxv16i8(<vscale x 16 x i1> %pg,
1241                                                                <vscale x 16 x i8> %a,
1242                                                                <vscale x 16 x i8> %splat)
1243   ret <vscale x 16 x i8> %out
1244 }
1245
1246 define <vscale x 16 x i8> @asr_i8_all_active(<vscale x 16 x i8> %a) {
1247 ; CHECK-LABEL: asr_i8_all_active:
1248 ; CHECK:       // %bb.0:
1249 ; CHECK-NEXT:    asr z0.b, z0.b, #8
1250 ; CHECK-NEXT:    ret
1251   %pg = call <vscale x 16 x i1> @llvm.aarch64.sve.ptrue.nxv16i1(i32 31)
1252   %elt = insertelement <vscale x 16 x i8> undef, i8 8, i32 0
1253   %splat = shufflevector <vscale x 16 x i8> %elt, <vscale x 16 x i8> undef, <vscale x 16 x i32> zeroinitializer
1254   %out = call <vscale x 16 x i8> @llvm.aarch64.sve.asr.nxv16i8(<vscale x 16 x i1> %pg,
1255                                                                <vscale x 16 x i8> %a,
1256                                                                <vscale x 16 x i8> %splat)
1257   ret <vscale x 16 x i8> %out
1258 }
1259
1260 ; Ensure we don't match a right shift by zero to the immediate form.
1261 define <vscale x 16 x i8> @asr_i8_too_small(<vscale x 16 x i1> %pg, <vscale x 16 x i8> %a) {
1262 ; CHECK-LABEL: asr_i8_too_small:
1263 ; CHECK:       // %bb.0:
1264 ; CHECK-NEXT:    mov z1.b, #0 // =0x0
1265 ; CHECK-NEXT:    asr z0.b, p0/m, z0.b, z1.b
1266 ; CHECK-NEXT:    ret
1267   %out = call <vscale x 16 x i8> @llvm.aarch64.sve.asr.nxv16i8(<vscale x 16 x i1> %pg,
1268                                                                <vscale x 16 x i8> %a,
1269                                                                <vscale x 16 x i8> zeroinitializer)
1270   ret <vscale x 16 x i8> %out
1271 }
1272
1273 define <vscale x 8 x i16> @asr_i16(<vscale x 8 x i1> %pg, <vscale x 8 x i16> %a) {
1274 ; CHECK-LABEL: asr_i16:
1275 ; CHECK:       // %bb.0:
1276 ; CHECK-NEXT:    asr z0.h, p0/m, z0.h, #16
1277 ; CHECK-NEXT:    ret
1278   %elt = insertelement <vscale x 8 x i16> undef, i16 17, i32 0
1279   %splat = shufflevector <vscale x 8 x i16> %elt, <vscale x 8 x i16> undef, <vscale x 8 x i32> zeroinitializer
1280   %out = call <vscale x 8 x i16> @llvm.aarch64.sve.asr.nxv8i16(<vscale x 8 x i1> %pg,
1281                                                                <vscale x 8 x i16> %a,
1282                                                                <vscale x 8 x i16> %splat)
1283   ret <vscale x 8 x i16> %out
1284 }
1285
1286 define <vscale x 8 x i16> @asr_i16_all_active(<vscale x 8 x i16> %a) {
1287 ; CHECK-LABEL: asr_i16_all_active:
1288 ; CHECK:       // %bb.0:
1289 ; CHECK-NEXT:    asr z0.h, z0.h, #16
1290 ; CHECK-NEXT:    ret
1291   %pg = call <vscale x 8 x i1> @llvm.aarch64.sve.ptrue.nxv8i1(i32 31)
1292   %elt = insertelement <vscale x 8 x i16> undef, i16 16, i32 0
1293   %splat = shufflevector <vscale x 8 x i16> %elt, <vscale x 8 x i16> undef, <vscale x 8 x i32> zeroinitializer
1294   %out = call <vscale x 8 x i16> @llvm.aarch64.sve.asr.nxv8i16(<vscale x 8 x i1> %pg,
1295                                                                <vscale x 8 x i16> %a,
1296                                                                <vscale x 8 x i16> %splat)
1297   ret <vscale x 8 x i16> %out
1298 }
1299
1300 ; Ensure we don't match a right shift by zero to the immediate form.
1301 define <vscale x 8 x i16> @asr_i16_too_small(<vscale x 8 x i1> %pg, <vscale x 8 x i16> %a) {
1302 ; CHECK-LABEL: asr_i16_too_small:
1303 ; CHECK:       // %bb.0:
1304 ; CHECK-NEXT:    mov z1.h, #0 // =0x0
1305 ; CHECK-NEXT:    asr z0.h, p0/m, z0.h, z1.h
1306 ; CHECK-NEXT:    ret
1307   %out = call <vscale x 8 x i16> @llvm.aarch64.sve.asr.nxv8i16(<vscale x 8 x i1> %pg,
1308                                                                <vscale x 8 x i16> %a,
1309                                                                <vscale x 8 x i16> zeroinitializer)
1310   ret <vscale x 8 x i16> %out
1311 }
1312
1313 define <vscale x 4 x i32> @asr_i32(<vscale x 4 x i1> %pg, <vscale x 4 x i32> %a) {
1314 ; CHECK-LABEL: asr_i32:
1315 ; CHECK:       // %bb.0:
1316 ; CHECK-NEXT:    asr z0.s, p0/m, z0.s, #32
1317 ; CHECK-NEXT:    ret
1318   %elt = insertelement <vscale x 4 x i32> undef, i32 33, i32 0
1319   %splat = shufflevector <vscale x 4 x i32> %elt, <vscale x 4 x i32> undef, <vscale x 4 x i32> zeroinitializer
1320   %out = call <vscale x 4 x i32> @llvm.aarch64.sve.asr.nxv4i32(<vscale x 4 x i1> %pg,
1321                                                                <vscale x 4 x i32> %a,
1322                                                                <vscale x 4 x i32> %splat)
1323   ret <vscale x 4 x i32> %out
1324 }
1325
1326 define <vscale x 4 x i32> @asr_i32_all_active(<vscale x 4 x i32> %a) {
1327 ; CHECK-LABEL: asr_i32_all_active:
1328 ; CHECK:       // %bb.0:
1329 ; CHECK-NEXT:    asr z0.s, z0.s, #32
1330 ; CHECK-NEXT:    ret
1331   %pg = call <vscale x 4 x i1> @llvm.aarch64.sve.ptrue.nxv4i1(i32 31)
1332   %elt = insertelement <vscale x 4 x i32> undef, i32 32, i32 0
1333   %splat = shufflevector <vscale x 4 x i32> %elt, <vscale x 4 x i32> undef, <vscale x 4 x i32> zeroinitializer
1334   %out = call <vscale x 4 x i32> @llvm.aarch64.sve.asr.nxv4i32(<vscale x 4 x i1> %pg,
1335                                                                <vscale x 4 x i32> %a,
1336                                                                <vscale x 4 x i32> %splat)
1337   ret <vscale x 4 x i32> %out
1338 }
1339
1340 ; Ensure we don't match a right shift by zero to the immediate form.
1341 define <vscale x 4 x i32> @asr_i32_too_small(<vscale x 4 x i1> %pg, <vscale x 4 x i32> %a) {
1342 ; CHECK-LABEL: asr_i32_too_small:
1343 ; CHECK:       // %bb.0:
1344 ; CHECK-NEXT:    mov z1.s, #0 // =0x0
1345 ; CHECK-NEXT:    asr z0.s, p0/m, z0.s, z1.s
1346 ; CHECK-NEXT:    ret
1347   %out = call <vscale x 4 x i32> @llvm.aarch64.sve.asr.nxv4i32(<vscale x 4 x i1> %pg,
1348                                                                <vscale x 4 x i32> %a,
1349                                                                <vscale x 4 x i32> zeroinitializer)
1350   ret <vscale x 4 x i32> %out
1351 }
1352
1353 define <vscale x 2 x i64> @asr_i64(<vscale x 2 x i1> %pg, <vscale x 2 x i64> %a) {
1354 ; CHECK-LABEL: asr_i64:
1355 ; CHECK:       // %bb.0:
1356 ; CHECK-NEXT:    asr z0.d, p0/m, z0.d, #64
1357 ; CHECK-NEXT:    ret
1358   %elt = insertelement <vscale x 2 x i64> undef, i64 65, i64 0
1359   %splat = shufflevector <vscale x 2 x i64> %elt, <vscale x 2 x i64> undef, <vscale x 2 x i32> zeroinitializer
1360   %out = call <vscale x 2 x i64> @llvm.aarch64.sve.asr.nxv2i64(<vscale x 2 x i1> %pg,
1361                                                                <vscale x 2 x i64> %a,
1362                                                                <vscale x 2 x i64> %splat)
1363   ret <vscale x 2 x i64> %out
1364 }
1365
1366 define <vscale x 2 x i64> @asr_i64_all_active(<vscale x 2 x i64> %a) {
1367 ; CHECK-LABEL: asr_i64_all_active:
1368 ; CHECK:       // %bb.0:
1369 ; CHECK-NEXT:    asr z0.d, z0.d, #64
1370 ; CHECK-NEXT:    ret
1371   %pg = call <vscale x 2 x i1> @llvm.aarch64.sve.ptrue.nxv2i1(i32 31)
1372   %elt = insertelement <vscale x 2 x i64> undef, i64 64, i64 0
1373   %splat = shufflevector <vscale x 2 x i64> %elt, <vscale x 2 x i64> undef, <vscale x 2 x i32> zeroinitializer
1374   %out = call <vscale x 2 x i64> @llvm.aarch64.sve.asr.nxv2i64(<vscale x 2 x i1> %pg,
1375                                                                <vscale x 2 x i64> %a,
1376                                                                <vscale x 2 x i64> %splat)
1377   ret <vscale x 2 x i64> %out
1378 }
1379
1380 ; Ensure we don't match a right shift by zero to the immediate form.
1381 define <vscale x 2 x i64> @asr_i64_too_small(<vscale x 2 x i1> %pg, <vscale x 2 x i64> %a) {
1382 ; CHECK-LABEL: asr_i64_too_small:
1383 ; CHECK:       // %bb.0:
1384 ; CHECK-NEXT:    mov z1.d, #0 // =0x0
1385 ; CHECK-NEXT:    asr z0.d, p0/m, z0.d, z1.d
1386 ; CHECK-NEXT:    ret
1387   %out = call <vscale x 2 x i64> @llvm.aarch64.sve.asr.nxv2i64(<vscale x 2 x i1> %pg,
1388                                                                <vscale x 2 x i64> %a,
1389                                                                <vscale x 2 x i64> zeroinitializer)
1390   ret <vscale x 2 x i64> %out
1391 }
1392
1393 ; LSL
1394
1395 define <vscale x 16 x i8> @lsl_i8(<vscale x 16 x i1> %pg, <vscale x 16 x i8> %a) {
1396 ; CHECK-LABEL: lsl_i8:
1397 ; CHECK:       // %bb.0:
1398 ; CHECK-NEXT:    lsl z0.b, p0/m, z0.b, #7
1399 ; CHECK-NEXT:    ret
1400   %elt = insertelement <vscale x 16 x i8> undef, i8 7, i32 0
1401   %splat = shufflevector <vscale x 16 x i8> %elt, <vscale x 16 x i8> undef, <vscale x 16 x i32> zeroinitializer
1402   %out = call <vscale x 16 x i8> @llvm.aarch64.sve.lsl.nxv16i8(<vscale x 16 x i1> %pg,
1403                                                                <vscale x 16 x i8> %a,
1404                                                                <vscale x 16 x i8> %splat)
1405   ret <vscale x 16 x i8> %out
1406 }
1407
1408 define <vscale x 16 x i8> @lsl_i8_all_active(<vscale x 16 x i8> %a) {
1409 ; CHECK-LABEL: lsl_i8_all_active:
1410 ; CHECK:       // %bb.0:
1411 ; CHECK-NEXT:    lsl z0.b, z0.b, #7
1412 ; CHECK-NEXT:    ret
1413   %pg = call <vscale x 16 x i1> @llvm.aarch64.sve.ptrue.nxv16i1(i32 31)
1414   %elt = insertelement <vscale x 16 x i8> undef, i8 7, i32 0
1415   %splat = shufflevector <vscale x 16 x i8> %elt, <vscale x 16 x i8> undef, <vscale x 16 x i32> zeroinitializer
1416   %out = call <vscale x 16 x i8> @llvm.aarch64.sve.lsl.nxv16i8(<vscale x 16 x i1> %pg,
1417                                                                <vscale x 16 x i8> %a,
1418                                                                <vscale x 16 x i8> %splat)
1419   ret <vscale x 16 x i8> %out
1420 }
1421
1422 ; Ensure we don't match a left shift bigger than its bitwidth to the immediate form.
1423 define <vscale x 16 x i8> @lsl_i8_too_big(<vscale x 16 x i1> %pg, <vscale x 16 x i8> %a) {
1424 ; CHECK-LABEL: lsl_i8_too_big:
1425 ; CHECK:       // %bb.0:
1426 ; CHECK-NEXT:    mov z1.b, #8 // =0x8
1427 ; CHECK-NEXT:    lsl z0.b, p0/m, z0.b, z1.b
1428 ; CHECK-NEXT:    ret
1429   %elt = insertelement <vscale x 16 x i8> undef, i8 8, i32 0
1430   %splat = shufflevector <vscale x 16 x i8> %elt, <vscale x 16 x i8> undef, <vscale x 16 x i32> zeroinitializer
1431   %out = call <vscale x 16 x i8> @llvm.aarch64.sve.lsl.nxv16i8(<vscale x 16 x i1> %pg,
1432                                                                <vscale x 16 x i8> %a,
1433                                                                <vscale x 16 x i8> %splat)
1434   ret <vscale x 16 x i8> %out
1435 }
1436
1437 define <vscale x 16 x i8> @lsl_i8_zero(<vscale x 16 x i1> %pg, <vscale x 16 x i8> %a) {
1438 ; CHECK-LABEL: lsl_i8_zero:
1439 ; CHECK:       // %bb.0:
1440 ; CHECK-NEXT:    lsl z0.b, p0/m, z0.b, #0
1441 ; CHECK-NEXT:    ret
1442   %out = call <vscale x 16 x i8> @llvm.aarch64.sve.lsl.nxv16i8(<vscale x 16 x i1> %pg,
1443                                                                <vscale x 16 x i8> %a,
1444                                                                <vscale x 16 x i8> zeroinitializer)
1445   ret <vscale x 16 x i8> %out
1446 }
1447
1448 define <vscale x 8 x i16> @lsl_i16(<vscale x 8 x i1> %pg, <vscale x 8 x i16> %a) {
1449 ; CHECK-LABEL: lsl_i16:
1450 ; CHECK:       // %bb.0:
1451 ; CHECK-NEXT:    lsl z0.h, p0/m, z0.h, #15
1452 ; CHECK-NEXT:    ret
1453   %elt = insertelement <vscale x 8 x i16> undef, i16 15, i32 0
1454   %splat = shufflevector <vscale x 8 x i16> %elt, <vscale x 8 x i16> undef, <vscale x 8 x i32> zeroinitializer
1455   %out = call <vscale x 8 x i16> @llvm.aarch64.sve.lsl.nxv8i16(<vscale x 8 x i1> %pg,
1456                                                                <vscale x 8 x i16> %a,
1457                                                                <vscale x 8 x i16> %splat)
1458   ret <vscale x 8 x i16> %out
1459 }
1460
1461 define <vscale x 8 x i16> @lsl_i16_all_active(<vscale x 8 x i16> %a) {
1462 ; CHECK-LABEL: lsl_i16_all_active:
1463 ; CHECK:       // %bb.0:
1464 ; CHECK-NEXT:    lsl z0.h, z0.h, #15
1465 ; CHECK-NEXT:    ret
1466   %pg = call <vscale x 8 x i1> @llvm.aarch64.sve.ptrue.nxv8i1(i32 31)
1467   %elt = insertelement <vscale x 8 x i16> undef, i16 15, i32 0
1468   %splat = shufflevector <vscale x 8 x i16> %elt, <vscale x 8 x i16> undef, <vscale x 8 x i32> zeroinitializer
1469   %out = call <vscale x 8 x i16> @llvm.aarch64.sve.lsl.nxv8i16(<vscale x 8 x i1> %pg,
1470                                                                <vscale x 8 x i16> %a,
1471                                                                <vscale x 8 x i16> %splat)
1472   ret <vscale x 8 x i16> %out
1473 }
1474
1475 ; Ensure we don't match a left shift bigger than its bitwidth to the immediate form.
1476 define <vscale x 8 x i16> @lsl_i16_too_big(<vscale x 8 x i1> %pg, <vscale x 8 x i16> %a) {
1477 ; CHECK-LABEL: lsl_i16_too_big:
1478 ; CHECK:       // %bb.0:
1479 ; CHECK-NEXT:    mov z1.h, #16 // =0x10
1480 ; CHECK-NEXT:    lsl z0.h, p0/m, z0.h, z1.h
1481 ; CHECK-NEXT:    ret
1482   %elt = insertelement <vscale x 8 x i16> undef, i16 16, i32 0
1483   %splat = shufflevector <vscale x 8 x i16> %elt, <vscale x 8 x i16> undef, <vscale x 8 x i32> zeroinitializer
1484   %out = call <vscale x 8 x i16> @llvm.aarch64.sve.lsl.nxv8i16(<vscale x 8 x i1> %pg,
1485                                                                <vscale x 8 x i16> %a,
1486                                                                <vscale x 8 x i16> %splat)
1487   ret <vscale x 8 x i16> %out
1488 }
1489
1490 define <vscale x 8 x i16> @lsl_i16_zero(<vscale x 8 x i1> %pg, <vscale x 8 x i16> %a) {
1491 ; CHECK-LABEL: lsl_i16_zero:
1492 ; CHECK:       // %bb.0:
1493 ; CHECK-NEXT:    lsl z0.h, p0/m, z0.h, #0
1494 ; CHECK-NEXT:    ret
1495   %out = call <vscale x 8 x i16> @llvm.aarch64.sve.lsl.nxv8i16(<vscale x 8 x i1> %pg,
1496                                                                <vscale x 8 x i16> %a,
1497                                                                <vscale x 8 x i16> zeroinitializer)
1498   ret <vscale x 8 x i16> %out
1499 }
1500
1501 define <vscale x 4 x i32> @lsl_i32(<vscale x 4 x i1> %pg, <vscale x 4 x i32> %a) {
1502 ; CHECK-LABEL: lsl_i32:
1503 ; CHECK:       // %bb.0:
1504 ; CHECK-NEXT:    lsl z0.s, p0/m, z0.s, #31
1505 ; CHECK-NEXT:    ret
1506   %elt = insertelement <vscale x 4 x i32> undef, i32 31, i32 0
1507   %splat = shufflevector <vscale x 4 x i32> %elt, <vscale x 4 x i32> undef, <vscale x 4 x i32> zeroinitializer
1508   %out = call <vscale x 4 x i32> @llvm.aarch64.sve.lsl.nxv4i32(<vscale x 4 x i1> %pg,
1509                                                                <vscale x 4 x i32> %a,
1510                                                                <vscale x 4 x i32> %splat)
1511   ret <vscale x 4 x i32> %out
1512 }
1513
1514 define <vscale x 4 x i32> @lsl_i32_all_active(<vscale x 4 x i32> %a) {
1515 ; CHECK-LABEL: lsl_i32_all_active:
1516 ; CHECK:       // %bb.0:
1517 ; CHECK-NEXT:    lsl z0.s, z0.s, #31
1518 ; CHECK-NEXT:    ret
1519   %pg = call <vscale x 4 x i1> @llvm.aarch64.sve.ptrue.nxv4i1(i32 31)
1520   %elt = insertelement <vscale x 4 x i32> undef, i32 31, i32 0
1521   %splat = shufflevector <vscale x 4 x i32> %elt, <vscale x 4 x i32> undef, <vscale x 4 x i32> zeroinitializer
1522   %out = call <vscale x 4 x i32> @llvm.aarch64.sve.lsl.nxv4i32(<vscale x 4 x i1> %pg,
1523                                                                <vscale x 4 x i32> %a,
1524                                                                <vscale x 4 x i32> %splat)
1525   ret <vscale x 4 x i32> %out
1526 }
1527
1528 ; Ensure we don't match a left shift bigger than its bitwidth to the immediate form.
1529 define <vscale x 4 x i32> @lsl_i32_too_big(<vscale x 4 x i1> %pg, <vscale x 4 x i32> %a) {
1530 ; CHECK-LABEL: lsl_i32_too_big:
1531 ; CHECK:       // %bb.0:
1532 ; CHECK-NEXT:    mov z1.s, #32 // =0x20
1533 ; CHECK-NEXT:    lsl z0.s, p0/m, z0.s, z1.s
1534 ; CHECK-NEXT:    ret
1535   %elt = insertelement <vscale x 4 x i32> undef, i32 32, i32 0
1536   %splat = shufflevector <vscale x 4 x i32> %elt, <vscale x 4 x i32> undef, <vscale x 4 x i32> zeroinitializer
1537   %out = call <vscale x 4 x i32> @llvm.aarch64.sve.lsl.nxv4i32(<vscale x 4 x i1> %pg,
1538                                                                <vscale x 4 x i32> %a,
1539                                                                <vscale x 4 x i32> %splat)
1540   ret <vscale x 4 x i32> %out
1541 }
1542
1543 define <vscale x 4 x i32> @lsl_i32_zero(<vscale x 4 x i1> %pg, <vscale x 4 x i32> %a) {
1544 ; CHECK-LABEL: lsl_i32_zero:
1545 ; CHECK:       // %bb.0:
1546 ; CHECK-NEXT:    lsl z0.s, p0/m, z0.s, #0
1547 ; CHECK-NEXT:    ret
1548   %out = call <vscale x 4 x i32> @llvm.aarch64.sve.lsl.nxv4i32(<vscale x 4 x i1> %pg,
1549                                                                <vscale x 4 x i32> %a,
1550                                                                <vscale x 4 x i32> zeroinitializer)
1551   ret <vscale x 4 x i32> %out
1552 }
1553
1554 define <vscale x 2 x i64> @lsl_i64(<vscale x 2 x i1> %pg, <vscale x 2 x i64> %a) {
1555 ; CHECK-LABEL: lsl_i64:
1556 ; CHECK:       // %bb.0:
1557 ; CHECK-NEXT:    lsl z0.d, p0/m, z0.d, #63
1558 ; CHECK-NEXT:    ret
1559   %elt = insertelement <vscale x 2 x i64> undef, i64 63, i64 0
1560   %splat = shufflevector <vscale x 2 x i64> %elt, <vscale x 2 x i64> undef, <vscale x 2 x i32> zeroinitializer
1561   %out = call <vscale x 2 x i64> @llvm.aarch64.sve.lsl.nxv2i64(<vscale x 2 x i1> %pg,
1562                                                                <vscale x 2 x i64> %a,
1563                                                                <vscale x 2 x i64> %splat)
1564   ret <vscale x 2 x i64> %out
1565 }
1566
1567 define <vscale x 2 x i64> @lsl_i64_all_active(<vscale x 2 x i64> %a) {
1568 ; CHECK-LABEL: lsl_i64_all_active:
1569 ; CHECK:       // %bb.0:
1570 ; CHECK-NEXT:    lsl z0.d, z0.d, #63
1571 ; CHECK-NEXT:    ret
1572   %pg = call <vscale x 2 x i1> @llvm.aarch64.sve.ptrue.nxv2i1(i32 31)
1573   %elt = insertelement <vscale x 2 x i64> undef, i64 63, i64 0
1574   %splat = shufflevector <vscale x 2 x i64> %elt, <vscale x 2 x i64> undef, <vscale x 2 x i32> zeroinitializer
1575   %out = call <vscale x 2 x i64> @llvm.aarch64.sve.lsl.nxv2i64(<vscale x 2 x i1> %pg,
1576                                                                <vscale x 2 x i64> %a,
1577                                                                <vscale x 2 x i64> %splat)
1578   ret <vscale x 2 x i64> %out
1579 }
1580
1581 ; Ensure we don't match a left shift bigger than its bitwidth to the immediate form.
1582 define <vscale x 2 x i64> @lsl_i64_too_big(<vscale x 2 x i1> %pg, <vscale x 2 x i64> %a) {
1583 ; CHECK-LABEL: lsl_i64_too_big:
1584 ; CHECK:       // %bb.0:
1585 ; CHECK-NEXT:    mov z1.d, #64 // =0x40
1586 ; CHECK-NEXT:    lsl z0.d, p0/m, z0.d, z1.d
1587 ; CHECK-NEXT:    ret
1588   %elt = insertelement <vscale x 2 x i64> undef, i64 64, i64 0
1589   %splat = shufflevector <vscale x 2 x i64> %elt, <vscale x 2 x i64> undef, <vscale x 2 x i32> zeroinitializer
1590   %out = call <vscale x 2 x i64> @llvm.aarch64.sve.lsl.nxv2i64(<vscale x 2 x i1> %pg,
1591                                                                <vscale x 2 x i64> %a,
1592                                                                <vscale x 2 x i64> %splat)
1593   ret <vscale x 2 x i64> %out
1594 }
1595
1596 define <vscale x 2 x i64> @lsl_i64_zero(<vscale x 2 x i1> %pg, <vscale x 2 x i64> %a) {
1597 ; CHECK-LABEL: lsl_i64_zero:
1598 ; CHECK:       // %bb.0:
1599 ; CHECK-NEXT:    lsl z0.d, p0/m, z0.d, #0
1600 ; CHECK-NEXT:    ret
1601   %out = call <vscale x 2 x i64> @llvm.aarch64.sve.lsl.nxv2i64(<vscale x 2 x i1> %pg,
1602                                                                <vscale x 2 x i64> %a,
1603                                                                <vscale x 2 x i64> zeroinitializer)
1604   ret <vscale x 2 x i64> %out
1605 }
1606
1607 ; LSR
1608
1609 define <vscale x 16 x i8> @lsr_i8(<vscale x 16 x i1> %pg, <vscale x 16 x i8> %a) {
1610 ; CHECK-LABEL: lsr_i8:
1611 ; CHECK:       // %bb.0:
1612 ; CHECK-NEXT:    lsr z0.b, p0/m, z0.b, #8
1613 ; CHECK-NEXT:    ret
1614   %elt = insertelement <vscale x 16 x i8> undef, i8 9, i32 0
1615   %splat = shufflevector <vscale x 16 x i8> %elt, <vscale x 16 x i8> undef, <vscale x 16 x i32> zeroinitializer
1616   %out = call <vscale x 16 x i8> @llvm.aarch64.sve.lsr.nxv16i8(<vscale x 16 x i1> %pg,
1617                                                                <vscale x 16 x i8> %a,
1618                                                                <vscale x 16 x i8> %splat)
1619   ret <vscale x 16 x i8> %out
1620 }
1621
1622 define <vscale x 16 x i8> @lsr_i8_all_active(<vscale x 16 x i8> %a) {
1623 ; CHECK-LABEL: lsr_i8_all_active:
1624 ; CHECK:       // %bb.0:
1625 ; CHECK-NEXT:    lsr z0.b, z0.b, #8
1626 ; CHECK-NEXT:    ret
1627   %pg = call <vscale x 16 x i1> @llvm.aarch64.sve.ptrue.nxv16i1(i32 31)
1628   %elt = insertelement <vscale x 16 x i8> undef, i8 8, i32 0
1629   %splat = shufflevector <vscale x 16 x i8> %elt, <vscale x 16 x i8> undef, <vscale x 16 x i32> zeroinitializer
1630   %out = call <vscale x 16 x i8> @llvm.aarch64.sve.lsr.nxv16i8(<vscale x 16 x i1> %pg,
1631                                                                <vscale x 16 x i8> %a,
1632                                                                <vscale x 16 x i8> %splat)
1633   ret <vscale x 16 x i8> %out
1634 }
1635
1636 ; Ensure we don't match a right shift by zero to the immediate form.
1637 define <vscale x 16 x i8> @lsr_i8_too_small(<vscale x 16 x i1> %pg, <vscale x 16 x i8> %a) {
1638 ; CHECK-LABEL: lsr_i8_too_small:
1639 ; CHECK:       // %bb.0:
1640 ; CHECK-NEXT:    mov z1.b, #0 // =0x0
1641 ; CHECK-NEXT:    lsr z0.b, p0/m, z0.b, z1.b
1642 ; CHECK-NEXT:    ret
1643   %out = call <vscale x 16 x i8> @llvm.aarch64.sve.lsr.nxv16i8(<vscale x 16 x i1> %pg,
1644                                                                <vscale x 16 x i8> %a,
1645                                                                <vscale x 16 x i8> zeroinitializer)
1646   ret <vscale x 16 x i8> %out
1647 }
1648
1649 define <vscale x 8 x i16> @lsr_i16(<vscale x 8 x i1> %pg, <vscale x 8 x i16> %a) {
1650 ; CHECK-LABEL: lsr_i16:
1651 ; CHECK:       // %bb.0:
1652 ; CHECK-NEXT:    lsr z0.h, p0/m, z0.h, #16
1653 ; CHECK-NEXT:    ret
1654   %elt = insertelement <vscale x 8 x i16> undef, i16 17, i32 0
1655   %splat = shufflevector <vscale x 8 x i16> %elt, <vscale x 8 x i16> undef, <vscale x 8 x i32> zeroinitializer
1656   %out = call <vscale x 8 x i16> @llvm.aarch64.sve.lsr.nxv8i16(<vscale x 8 x i1> %pg,
1657                                                                <vscale x 8 x i16> %a,
1658                                                                <vscale x 8 x i16> %splat)
1659   ret <vscale x 8 x i16> %out
1660 }
1661
1662 define <vscale x 8 x i16> @lsr_i16_all_active(<vscale x 8 x i16> %a) {
1663 ; CHECK-LABEL: lsr_i16_all_active:
1664 ; CHECK:       // %bb.0:
1665 ; CHECK-NEXT:    lsr z0.h, z0.h, #16
1666 ; CHECK-NEXT:    ret
1667   %pg = call <vscale x 8 x i1> @llvm.aarch64.sve.ptrue.nxv8i1(i32 31)
1668   %elt = insertelement <vscale x 8 x i16> undef, i16 16, i32 0
1669   %splat = shufflevector <vscale x 8 x i16> %elt, <vscale x 8 x i16> undef, <vscale x 8 x i32> zeroinitializer
1670   %out = call <vscale x 8 x i16> @llvm.aarch64.sve.lsr.nxv8i16(<vscale x 8 x i1> %pg,
1671                                                                <vscale x 8 x i16> %a,
1672                                                                <vscale x 8 x i16> %splat)
1673   ret <vscale x 8 x i16> %out
1674 }
1675
1676 ; Ensure we don't match a right shift by zero to the immediate form.
1677 define <vscale x 8 x i16> @lsr_i16_too_small(<vscale x 8 x i1> %pg, <vscale x 8 x i16> %a) {
1678 ; CHECK-LABEL: lsr_i16_too_small:
1679 ; CHECK:       // %bb.0:
1680 ; CHECK-NEXT:    mov z1.h, #0 // =0x0
1681 ; CHECK-NEXT:    lsr z0.h, p0/m, z0.h, z1.h
1682 ; CHECK-NEXT:    ret
1683   %out = call <vscale x 8 x i16> @llvm.aarch64.sve.lsr.nxv8i16(<vscale x 8 x i1> %pg,
1684                                                                <vscale x 8 x i16> %a,
1685                                                                <vscale x 8 x i16> zeroinitializer)
1686   ret <vscale x 8 x i16> %out
1687 }
1688
1689 define <vscale x 4 x i32> @lsr_i32(<vscale x 4 x i1> %pg, <vscale x 4 x i32> %a) {
1690 ; CHECK-LABEL: lsr_i32:
1691 ; CHECK:       // %bb.0:
1692 ; CHECK-NEXT:    lsr z0.s, p0/m, z0.s, #32
1693 ; CHECK-NEXT:    ret
1694   %elt = insertelement <vscale x 4 x i32> undef, i32 33, i32 0
1695   %splat = shufflevector <vscale x 4 x i32> %elt, <vscale x 4 x i32> undef, <vscale x 4 x i32> zeroinitializer
1696   %out = call <vscale x 4 x i32> @llvm.aarch64.sve.lsr.nxv4i32(<vscale x 4 x i1> %pg,
1697                                                                <vscale x 4 x i32> %a,
1698                                                                <vscale x 4 x i32> %splat)
1699   ret <vscale x 4 x i32> %out
1700 }
1701
1702 define <vscale x 4 x i32> @lsr_i32_all_active(<vscale x 4 x i32> %a) {
1703 ; CHECK-LABEL: lsr_i32_all_active:
1704 ; CHECK:       // %bb.0:
1705 ; CHECK-NEXT:    lsr z0.s, z0.s, #32
1706 ; CHECK-NEXT:    ret
1707   %pg = call <vscale x 4 x i1> @llvm.aarch64.sve.ptrue.nxv4i1(i32 31)
1708   %elt = insertelement <vscale x 4 x i32> undef, i32 32, i32 0
1709   %splat = shufflevector <vscale x 4 x i32> %elt, <vscale x 4 x i32> undef, <vscale x 4 x i32> zeroinitializer
1710   %out = call <vscale x 4 x i32> @llvm.aarch64.sve.lsr.nxv4i32(<vscale x 4 x i1> %pg,
1711                                                                <vscale x 4 x i32> %a,
1712                                                                <vscale x 4 x i32> %splat)
1713   ret <vscale x 4 x i32> %out
1714 }
1715
1716 ; Ensure we don't match a right shift by zero to the immediate form.
1717 define <vscale x 4 x i32> @lsr_i32_too_small(<vscale x 4 x i1> %pg, <vscale x 4 x i32> %a) {
1718 ; CHECK-LABEL: lsr_i32_too_small:
1719 ; CHECK:       // %bb.0:
1720 ; CHECK-NEXT:    mov z1.s, #0 // =0x0
1721 ; CHECK-NEXT:    lsr z0.s, p0/m, z0.s, z1.s
1722 ; CHECK-NEXT:    ret
1723   %out = call <vscale x 4 x i32> @llvm.aarch64.sve.lsr.nxv4i32(<vscale x 4 x i1> %pg,
1724                                                                <vscale x 4 x i32> %a,
1725                                                                <vscale x 4 x i32> zeroinitializer)
1726   ret <vscale x 4 x i32> %out
1727 }
1728
1729 define <vscale x 2 x i64> @lsr_i64(<vscale x 2 x i1> %pg, <vscale x 2 x i64> %a) {
1730 ; CHECK-LABEL: lsr_i64:
1731 ; CHECK:       // %bb.0:
1732 ; CHECK-NEXT:    lsr z0.d, p0/m, z0.d, #64
1733 ; CHECK-NEXT:    ret
1734   %elt = insertelement <vscale x 2 x i64> undef, i64 65, i64 0
1735   %splat = shufflevector <vscale x 2 x i64> %elt, <vscale x 2 x i64> undef, <vscale x 2 x i32> zeroinitializer
1736   %out = call <vscale x 2 x i64> @llvm.aarch64.sve.lsr.nxv2i64(<vscale x 2 x i1> %pg,
1737                                                                <vscale x 2 x i64> %a,
1738                                                                <vscale x 2 x i64> %splat)
1739   ret <vscale x 2 x i64> %out
1740 }
1741
1742 define <vscale x 2 x i64> @lsr_i64_all_active(<vscale x 2 x i64> %a) {
1743 ; CHECK-LABEL: lsr_i64_all_active:
1744 ; CHECK:       // %bb.0:
1745 ; CHECK-NEXT:    lsr z0.d, z0.d, #64
1746 ; CHECK-NEXT:    ret
1747   %pg = call <vscale x 2 x i1> @llvm.aarch64.sve.ptrue.nxv2i1(i32 31)
1748   %elt = insertelement <vscale x 2 x i64> undef, i64 64, i64 0
1749   %splat = shufflevector <vscale x 2 x i64> %elt, <vscale x 2 x i64> undef, <vscale x 2 x i32> zeroinitializer
1750   %out = call <vscale x 2 x i64> @llvm.aarch64.sve.lsr.nxv2i64(<vscale x 2 x i1> %pg,
1751                                                                <vscale x 2 x i64> %a,
1752                                                                <vscale x 2 x i64> %splat)
1753   ret <vscale x 2 x i64> %out
1754 }
1755
1756 ; Ensure we don't match a right shift by zero to the immediate form.
1757 define <vscale x 2 x i64> @lsr_i64_too_small(<vscale x 2 x i1> %pg, <vscale x 2 x i64> %a) {
1758 ; CHECK-LABEL: lsr_i64_too_small:
1759 ; CHECK:       // %bb.0:
1760 ; CHECK-NEXT:    mov z1.d, #0 // =0x0
1761 ; CHECK-NEXT:    lsr z0.d, p0/m, z0.d, z1.d
1762 ; CHECK-NEXT:    ret
1763   %out = call <vscale x 2 x i64> @llvm.aarch64.sve.lsr.nxv2i64(<vscale x 2 x i1> %pg,
1764                                                                <vscale x 2 x i64> %a,
1765                                                                <vscale x 2 x i64> zeroinitializer)
1766   ret <vscale x 2 x i64> %out
1767 }
1768
1769 ; As lsr_i32 but where pg is i8 based and thus compatible for i32.
1770 define <vscale x 4 x i32> @lsr_i32_ptrue_all_b(<vscale x 4 x i32> %a) #0 {
1771 ; CHECK-LABEL: lsr_i32_ptrue_all_b:
1772 ; CHECK: lsr z0.s, z0.s, #1
1773 ; CHECK-NEXT: ret
1774   %pg.b = tail call <vscale x 16 x i1> @llvm.aarch64.sve.ptrue.nxv16i1(i32 31)
1775   %pg.s = tail call <vscale x 4 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv4i1(<vscale x 16 x i1> %pg.b)
1776   %b = tail call <vscale x 4 x i32> @llvm.aarch64.sve.dup.x.nxv4i32(i32 1)
1777   %out = tail call <vscale x 4 x i32> @llvm.aarch64.sve.lsr.nxv4i32(<vscale x 4 x i1> %pg.s,
1778                                                                     <vscale x 4 x i32> %a,
1779                                                                     <vscale x 4 x i32> %b)
1780   ret <vscale x 4 x i32> %out
1781 }
1782
1783 ; As lsr_i32 but where pg is i16 based and thus compatible for i32.
1784 define <vscale x 4 x i32> @lsr_i32_ptrue_all_h(<vscale x 4 x i32> %a) #0 {
1785 ; CHECK-LABEL: lsr_i32_ptrue_all_h:
1786 ; CHECK: lsr z0.s, z0.s, #1
1787 ; CHECK-NEXT: ret
1788   %pg.h = tail call <vscale x 8 x i1> @llvm.aarch64.sve.ptrue.nxv8i1(i32 31)
1789   %pg.b = tail call <vscale x 16 x i1> @llvm.aarch64.sve.convert.to.svbool.nxv8i1(<vscale x 8 x i1> %pg.h)
1790   %pg.s = tail call <vscale x 4 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv4i1(<vscale x 16 x i1> %pg.b)
1791   %b = tail call <vscale x 4 x i32> @llvm.aarch64.sve.dup.x.nxv4i32(i32 1)
1792   %out = tail call <vscale x 4 x i32> @llvm.aarch64.sve.lsr.nxv4i32(<vscale x 4 x i1> %pg.s,
1793                                                                     <vscale x 4 x i32> %a,
1794                                                                     <vscale x 4 x i32> %b)
1795   ret <vscale x 4 x i32> %out
1796 }
1797
1798 ; As lsr_i32 but where pg is i64 based, which is not compatibile for i32 and
1799 ; thus inactive lanes are important and the immediate form cannot be used.
1800 define <vscale x 4 x i32> @lsr_i32_ptrue_all_d(<vscale x 4 x i32> %a) #0 {
1801 ; CHECK-LABEL: lsr_i32_ptrue_all_d:
1802 ; CHECK-DAG: ptrue [[PG:p[0-9]+]].d
1803 ; CHECK-DAG: lsr z0.s, [[PG]]/m, z0.s, #1
1804 ; CHECK-NEXT: ret
1805   %pg.d = tail call <vscale x 2 x i1> @llvm.aarch64.sve.ptrue.nxv2i1(i32 31)
1806   %pg.b = tail call <vscale x 16 x i1> @llvm.aarch64.sve.convert.to.svbool.nxv2i1(<vscale x 2 x i1> %pg.d)
1807   %pg.s = tail call <vscale x 4 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv4i1(<vscale x 16 x i1> %pg.b)
1808   %b = tail call <vscale x 4 x i32> @llvm.aarch64.sve.dup.x.nxv4i32(i32 1)
1809   %out = tail call <vscale x 4 x i32> @llvm.aarch64.sve.lsr.nxv4i32(<vscale x 4 x i1> %pg.s,
1810                                                                     <vscale x 4 x i32> %a,
1811                                                                     <vscale x 4 x i32> %b)
1812   ret <vscale x 4 x i32> %out
1813 }
1814
1815 ;
1816 ; MUL
1817 ;
1818
1819 ; As mul_i32 but where pg is i8 based and thus compatible for i32.
1820 define <vscale x 4 x i32> @mul_i32_ptrue_all_b(<vscale x 4 x i32> %a) #0 {
1821 ; CHECK-LABEL: mul_i32_ptrue_all_b:
1822 ; CHECK: mul z0.s, z0.s, #1
1823 ; CHECK-NEXT: ret
1824   %pg.b = tail call <vscale x 16 x i1> @llvm.aarch64.sve.ptrue.nxv16i1(i32 31)
1825   %pg.s = tail call <vscale x 4 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv4i1(<vscale x 16 x i1> %pg.b)
1826   %b = tail call <vscale x 4 x i32> @llvm.aarch64.sve.dup.x.nxv4i32(i32 1)
1827   %out = tail call <vscale x 4 x i32> @llvm.aarch64.sve.mul.nxv4i32(<vscale x 4 x i1> %pg.s,
1828                                                                      <vscale x 4 x i32> %a,
1829                                                                      <vscale x 4 x i32> %b)
1830   ret <vscale x 4 x i32> %out
1831 }
1832
1833 ; As mul_i32 but where pg is i16 based and thus compatible for i32.
1834 define <vscale x 4 x i32> @mul_i32_ptrue_all_h(<vscale x 4 x i32> %a) #0 {
1835 ; CHECK-LABEL: mul_i32_ptrue_all_h:
1836 ; CHECK: mul z0.s, z0.s, #1
1837 ; CHECK-NEXT: ret
1838   %pg.h = tail call <vscale x 8 x i1> @llvm.aarch64.sve.ptrue.nxv8i1(i32 31)
1839   %pg.b = tail call <vscale x 16 x i1> @llvm.aarch64.sve.convert.to.svbool.nxv8i1(<vscale x 8 x i1> %pg.h)
1840   %pg.s = tail call <vscale x 4 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv4i1(<vscale x 16 x i1> %pg.b)
1841   %b = tail call <vscale x 4 x i32> @llvm.aarch64.sve.dup.x.nxv4i32(i32 1)
1842   %out = tail call <vscale x 4 x i32> @llvm.aarch64.sve.mul.nxv4i32(<vscale x 4 x i1> %pg.s,
1843                                                                      <vscale x 4 x i32> %a,
1844                                                                      <vscale x 4 x i32> %b)
1845   ret <vscale x 4 x i32> %out
1846 }
1847
1848 ; As mul_i32 but where pg is i64 based, which is not compatibile for i32 and
1849 ; thus inactive lanes are important and the immediate form cannot be used.
1850 define <vscale x 4 x i32> @mul_i32_ptrue_all_d(<vscale x 4 x i32> %a) #0 {
1851 ; CHECK-LABEL: mul_i32_ptrue_all_d:
1852 ; CHECK-DAG: ptrue [[PG:p[0-9]+]].d
1853 ; CHECK-DAG: mov [[DUP:z[0-9]+]].s, #1
1854 ; CHECK-DAG: mul z0.s, [[PG]]/m, z0.s, [[DUP]].s
1855 ; CHECK-NEXT: ret
1856   %pg.d = tail call <vscale x 2 x i1> @llvm.aarch64.sve.ptrue.nxv2i1(i32 31)
1857   %pg.b = tail call <vscale x 16 x i1> @llvm.aarch64.sve.convert.to.svbool.nxv2i1(<vscale x 2 x i1> %pg.d)
1858   %pg.s = tail call <vscale x 4 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv4i1(<vscale x 16 x i1> %pg.b)
1859   %b = tail call <vscale x 4 x i32> @llvm.aarch64.sve.dup.x.nxv4i32(i32 1)
1860   %out = tail call <vscale x 4 x i32> @llvm.aarch64.sve.mul.nxv4i32(<vscale x 4 x i1> %pg.s,
1861                                                                      <vscale x 4 x i32> %a,
1862                                                                      <vscale x 4 x i32> %b)
1863   ret <vscale x 4 x i32> %out
1864 }
1865
1866 declare <vscale x 16 x i8> @llvm.aarch64.sve.add.nxv16i8(<vscale x 16 x i1>, <vscale x 16 x i8>, <vscale x 16 x i8>)
1867 declare <vscale x 8 x i16> @llvm.aarch64.sve.add.nxv8i16(<vscale x 8 x i1>, <vscale x 8 x i16>, <vscale x 8 x i16>)
1868 declare <vscale x 4 x i32> @llvm.aarch64.sve.add.nxv4i32(<vscale x 4 x i1>, <vscale x 4 x i32>, <vscale x 4 x i32>)
1869 declare <vscale x 2 x i64> @llvm.aarch64.sve.add.nxv2i64(<vscale x 2 x i1>, <vscale x 2 x i64>, <vscale x 2 x i64>)
1870
1871 declare <vscale x 16 x i8> @llvm.aarch64.sve.sub.nxv16i8(<vscale x 16 x i1>, <vscale x 16 x i8>, <vscale x 16 x i8>)
1872 declare <vscale x 8 x i16> @llvm.aarch64.sve.sub.nxv8i16(<vscale x 8 x i1>, <vscale x 8 x i16>, <vscale x 8 x i16>)
1873 declare <vscale x 4 x i32> @llvm.aarch64.sve.sub.nxv4i32(<vscale x 4 x i1>, <vscale x 4 x i32>, <vscale x 4 x i32>)
1874 declare <vscale x 2 x i64> @llvm.aarch64.sve.sub.nxv2i64(<vscale x 2 x i1>, <vscale x 2 x i64>, <vscale x 2 x i64>)
1875
1876 declare <vscale x 16 x i8> @llvm.aarch64.sve.sqadd.x.nxv16i8(<vscale x 16 x i8>, <vscale x 16 x i8>)
1877 declare <vscale x 8 x i16> @llvm.aarch64.sve.sqadd.x.nxv8i16(<vscale x 8 x i16>, <vscale x 8 x i16>)
1878 declare <vscale x 4 x i32> @llvm.aarch64.sve.sqadd.x.nxv4i32(<vscale x 4 x i32>, <vscale x 4 x i32>)
1879 declare <vscale x 2 x i64> @llvm.aarch64.sve.sqadd.x.nxv2i64(<vscale x 2 x i64>, <vscale x 2 x i64>)
1880
1881 declare <vscale x 16 x i8> @llvm.aarch64.sve.sqsub.x.nxv16i8(<vscale x 16 x i8>, <vscale x 16 x i8>)
1882 declare <vscale x 8 x i16> @llvm.aarch64.sve.sqsub.x.nxv8i16(<vscale x 8 x i16>, <vscale x 8 x i16>)
1883 declare <vscale x 4 x i32> @llvm.aarch64.sve.sqsub.x.nxv4i32(<vscale x 4 x i32>, <vscale x 4 x i32>)
1884 declare <vscale x 2 x i64> @llvm.aarch64.sve.sqsub.x.nxv2i64(<vscale x 2 x i64>, <vscale x 2 x i64>)
1885
1886 declare <vscale x 16 x i8> @llvm.aarch64.sve.uqadd.x.nxv16i8(<vscale x 16 x i8>, <vscale x 16 x i8>)
1887 declare <vscale x 8 x i16> @llvm.aarch64.sve.uqadd.x.nxv8i16(<vscale x 8 x i16>, <vscale x 8 x i16>)
1888 declare <vscale x 4 x i32> @llvm.aarch64.sve.uqadd.x.nxv4i32(<vscale x 4 x i32>, <vscale x 4 x i32>)
1889 declare <vscale x 2 x i64> @llvm.aarch64.sve.uqadd.x.nxv2i64(<vscale x 2 x i64>, <vscale x 2 x i64>)
1890
1891 declare <vscale x 16 x i8> @llvm.aarch64.sve.uqsub.x.nxv16i8(<vscale x 16 x i8>, <vscale x 16 x i8>)
1892 declare <vscale x 8 x i16> @llvm.aarch64.sve.uqsub.x.nxv8i16(<vscale x 8 x i16>, <vscale x 8 x i16>)
1893 declare <vscale x 4 x i32> @llvm.aarch64.sve.uqsub.x.nxv4i32(<vscale x 4 x i32>, <vscale x 4 x i32>)
1894 declare <vscale x 2 x i64> @llvm.aarch64.sve.uqsub.x.nxv2i64(<vscale x 2 x i64>, <vscale x 2 x i64>)
1895
1896 declare <vscale x 16 x i8> @llvm.aarch64.sve.smax.nxv16i8(<vscale x 16 x i1>, <vscale x 16 x i8>, <vscale x 16 x i8>)
1897 declare <vscale x 8 x i16> @llvm.aarch64.sve.smax.nxv8i16(<vscale x 8 x i1>, <vscale x 8 x i16>, <vscale x 8 x i16>)
1898 declare <vscale x 4 x i32> @llvm.aarch64.sve.smax.nxv4i32(<vscale x 4 x i1>, <vscale x 4 x i32>, <vscale x 4 x i32>)
1899 declare <vscale x 2 x i64> @llvm.aarch64.sve.smax.nxv2i64(<vscale x 2 x i1>, <vscale x 2 x i64>, <vscale x 2 x i64>)
1900
1901 declare <vscale x 16 x i8> @llvm.aarch64.sve.smin.nxv16i8(<vscale x 16 x i1>, <vscale x 16 x i8>, <vscale x 16 x i8>)
1902 declare <vscale x 8 x i16> @llvm.aarch64.sve.smin.nxv8i16(<vscale x 8 x i1>, <vscale x 8 x i16>, <vscale x 8 x i16>)
1903 declare <vscale x 4 x i32> @llvm.aarch64.sve.smin.nxv4i32(<vscale x 4 x i1>, <vscale x 4 x i32>, <vscale x 4 x i32>)
1904 declare <vscale x 2 x i64> @llvm.aarch64.sve.smin.nxv2i64(<vscale x 2 x i1>, <vscale x 2 x i64>, <vscale x 2 x i64>)
1905
1906 declare <vscale x 16 x i8> @llvm.aarch64.sve.umax.nxv16i8(<vscale x 16 x i1>, <vscale x 16 x i8>, <vscale x 16 x i8>)
1907 declare <vscale x 8 x i16> @llvm.aarch64.sve.umax.nxv8i16(<vscale x 8 x i1>, <vscale x 8 x i16>, <vscale x 8 x i16>)
1908 declare <vscale x 4 x i32> @llvm.aarch64.sve.umax.nxv4i32(<vscale x 4 x i1>, <vscale x 4 x i32>, <vscale x 4 x i32>)
1909 declare <vscale x 2 x i64> @llvm.aarch64.sve.umax.nxv2i64(<vscale x 2 x i1>, <vscale x 2 x i64>, <vscale x 2 x i64>)
1910
1911 declare <vscale x 16 x i8> @llvm.aarch64.sve.umin.nxv16i8(<vscale x 16 x i1>, <vscale x 16 x i8>, <vscale x 16 x i8>)
1912 declare <vscale x 8 x i16> @llvm.aarch64.sve.umin.nxv8i16(<vscale x 8 x i1>, <vscale x 8 x i16>, <vscale x 8 x i16>)
1913 declare <vscale x 4 x i32> @llvm.aarch64.sve.umin.nxv4i32(<vscale x 4 x i1>, <vscale x 4 x i32>, <vscale x 4 x i32>)
1914 declare <vscale x 2 x i64> @llvm.aarch64.sve.umin.nxv2i64(<vscale x 2 x i1>, <vscale x 2 x i64>, <vscale x 2 x i64>)
1915
1916 declare <vscale x 16 x i8> @llvm.aarch64.sve.asr.nxv16i8(<vscale x 16 x i1>, <vscale x 16 x i8>, <vscale x 16 x i8>)
1917 declare <vscale x 8 x i16> @llvm.aarch64.sve.asr.nxv8i16(<vscale x 8 x i1>, <vscale x 8 x i16>, <vscale x 8 x i16>)
1918 declare <vscale x 4 x i32> @llvm.aarch64.sve.asr.nxv4i32(<vscale x 4 x i1>, <vscale x 4 x i32>, <vscale x 4 x i32>)
1919 declare <vscale x 2 x i64> @llvm.aarch64.sve.asr.nxv2i64(<vscale x 2 x i1>, <vscale x 2 x i64>, <vscale x 2 x i64>)
1920
1921 declare <vscale x 16 x i8> @llvm.aarch64.sve.lsl.nxv16i8(<vscale x 16 x i1>, <vscale x 16 x i8>, <vscale x 16 x i8>)
1922 declare <vscale x 8 x i16> @llvm.aarch64.sve.lsl.nxv8i16(<vscale x 8 x i1>, <vscale x 8 x i16>, <vscale x 8 x i16>)
1923 declare <vscale x 4 x i32> @llvm.aarch64.sve.lsl.nxv4i32(<vscale x 4 x i1>, <vscale x 4 x i32>, <vscale x 4 x i32>)
1924 declare <vscale x 2 x i64> @llvm.aarch64.sve.lsl.nxv2i64(<vscale x 2 x i1>, <vscale x 2 x i64>, <vscale x 2 x i64>)
1925
1926 declare <vscale x 16 x i8> @llvm.aarch64.sve.lsr.nxv16i8(<vscale x 16 x i1>, <vscale x 16 x i8>, <vscale x 16 x i8>)
1927 declare <vscale x 8 x i16> @llvm.aarch64.sve.lsr.nxv8i16(<vscale x 8 x i1>, <vscale x 8 x i16>, <vscale x 8 x i16>)
1928 declare <vscale x 4 x i32> @llvm.aarch64.sve.lsr.nxv4i32(<vscale x 4 x i1>, <vscale x 4 x i32>, <vscale x 4 x i32>)
1929 declare <vscale x 2 x i64> @llvm.aarch64.sve.lsr.nxv2i64(<vscale x 2 x i1>, <vscale x 2 x i64>, <vscale x 2 x i64>)
1930
1931 declare <vscale x 16 x i8> @llvm.aarch64.sve.mul.nxv16i8(<vscale x 16 x i1>, <vscale x 16 x i8>, <vscale x 16 x i8>)
1932 declare <vscale x 8 x i16> @llvm.aarch64.sve.mul.nxv8i16(<vscale x 8 x i1>, <vscale x 8 x i16>, <vscale x 8 x i16>)
1933 declare <vscale x 4 x i32> @llvm.aarch64.sve.mul.nxv4i32(<vscale x 4 x i1>, <vscale x 4 x i32>, <vscale x 4 x i32>)
1934 declare <vscale x 2 x i64> @llvm.aarch64.sve.mul.nxv2i64(<vscale x 2 x i1>, <vscale x 2 x i64>, <vscale x 2 x i64>)
1935
1936 declare <vscale x 4 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv4i1(<vscale x 16 x i1>)
1937 declare <vscale x 8 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv8i1(<vscale x 16 x i1>)
1938 declare <vscale x 2 x i1> @llvm.aarch64.sve.convert.from.svbool.nxv2i1(<vscale x 16 x i1>)
1939
1940 declare <vscale x 16 x i1> @llvm.aarch64.sve.convert.to.svbool.nxv4i1(<vscale x 16 x i1>)
1941 declare <vscale x 16 x i1> @llvm.aarch64.sve.convert.to.svbool.nxv8i1(<vscale x 8 x i1>)
1942 declare <vscale x 16 x i1> @llvm.aarch64.sve.convert.to.svbool.nxv2i1(<vscale x 2 x i1>)
1943
1944 declare <vscale x 4 x i32> @llvm.aarch64.sve.dup.x.nxv4i32(i32)
1945
1946 declare <vscale x 16 x i1> @llvm.aarch64.sve.ptrue.nxv16i1(i32 %pattern)
1947 declare <vscale x 8 x i1> @llvm.aarch64.sve.ptrue.nxv8i1(i32 %pattern)
1948 declare <vscale x 4 x i1> @llvm.aarch64.sve.ptrue.nxv4i1(i32 %pattern)
1949 declare <vscale x 2 x i1> @llvm.aarch64.sve.ptrue.nxv2i1(i32 %pattern)