Run DCE after a LoopFlatten test to reduce spurious output [nfc]
[llvm-project.git] / llvm / test / CodeGen / RISCV / rvv / pr61561.ll
blobf27edd36116657e47f3e623cf0aeac47c0ffca95
1 ; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py UTC_ARGS: --version 2
2 ; RUN: llc < %s -mtriple=riscv64 -mattr=+v | FileCheck %s
4 define <vscale x 4 x i8> @foo(ptr %p) {
5 ; CHECK-LABEL: foo:
6 ; CHECK:       # %bb.0:
7 ; CHECK-NEXT:    vl1re16.v v8, (a0)
8 ; CHECK-NEXT:    vsetvli a0, zero, e16, m1, ta, ma
9 ; CHECK-NEXT:    vsll.vi v8, v8, 3
10 ; CHECK-NEXT:    vsetvli zero, zero, e32, m2, ta, ma
11 ; CHECK-NEXT:    vzext.vf2 v10, v8
12 ; CHECK-NEXT:    li a0, 248
13 ; CHECK-NEXT:    vand.vx v8, v10, a0
14 ; CHECK-NEXT:    lui a0, 4
15 ; CHECK-NEXT:    vmv.v.x v10, a0
16 ; CHECK-NEXT:    lui a0, 1
17 ; CHECK-NEXT:    addi a0, a0, -361
18 ; CHECK-NEXT:    vmacc.vx v10, a0, v8
19 ; CHECK-NEXT:    vsetvli zero, zero, e16, m1, ta, ma
20 ; CHECK-NEXT:    vnsrl.wi v8, v10, 15
21 ; CHECK-NEXT:    vsetvli zero, zero, e8, mf2, ta, ma
22 ; CHECK-NEXT:    vnsrl.wi v8, v8, 0
23 ; CHECK-NEXT:    ret
24   %i13 = load <vscale x 4 x i16>, ptr %p, align 2
25   %i14 = zext <vscale x 4 x i16> %i13 to <vscale x 4 x i32>
26   %i15 = shl nuw nsw <vscale x 4 x i32> %i14, shufflevector (<vscale x 4 x i32> insertelement (<vscale x 4 x i32> poison, i32 3, i64 0), <vscale x 4 x i32> poison, <vscale x 4 x i32> zeroinitializer)
27   %i16 = and <vscale x 4 x i32> %i15, shufflevector (<vscale x 4 x i32> insertelement (<vscale x 4 x i32> poison, i32 248, i64 0), <vscale x 4 x i32> poison, <vscale x 4 x i32> zeroinitializer)
28   %i17 = mul nuw nsw <vscale x 4 x i32> %i16, shufflevector (<vscale x 4 x i32> insertelement (<vscale x 4 x i32> poison, i32 3735, i64 0), <vscale x 4 x i32> poison, <vscale x 4 x i32> zeroinitializer)
29   %i18 = add nuw nsw <vscale x 4 x i32> %i17, shufflevector (<vscale x 4 x i32> insertelement (<vscale x 4 x i32> poison, i32 16384, i64 0), <vscale x 4 x i32> poison, <vscale x 4 x i32> zeroinitializer)
30   %i21 = lshr <vscale x 4 x i32> %i18, shufflevector (<vscale x 4 x i32> insertelement (<vscale x 4 x i32> poison, i32 15, i64 0), <vscale x 4 x i32> poison, <vscale x 4 x i32> zeroinitializer)
31   %i22 = trunc <vscale x 4 x i32> %i21 to <vscale x 4 x i8>
32   ret <vscale x 4 x i8> %i22