Run DCE after a LoopFlatten test to reduce spurious output [nfc]
[llvm-project.git] / llvm / test / CodeGen / RISCV / rvv / expand-no-v.ll
blobd34c10798f482198f60e0b803dfcca6574be65eb
1 ; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
2 ; RUN: llc -mtriple=riscv32 -verify-machineinstrs < %s | FileCheck %s --check-prefixes=RV32
3 ; RUN: llc -mtriple=riscv64 -verify-machineinstrs < %s | FileCheck %s --check-prefixes=RV64
4 ; Should expand to scalar instructions and do not crash
6 declare i32 @llvm.vp.reduce.add.v4i32(i32, <4 x i32>, <4 x i1>, i32)
8 define i32 @vpreduce_add_v4i32(i32 %s, <4 x i32> %v, <4 x i1> %m, i32 %evl) {
9 ; RV32-LABEL: vpreduce_add_v4i32:
10 ; RV32:       # %bb.0:
11 ; RV32-NEXT:    lw a4, 4(a1)
12 ; RV32-NEXT:    lw a5, 12(a1)
13 ; RV32-NEXT:    lw a6, 8(a1)
14 ; RV32-NEXT:    lw a1, 0(a1)
15 ; RV32-NEXT:    lw a7, 0(a2)
16 ; RV32-NEXT:    lw t0, 8(a2)
17 ; RV32-NEXT:    lw t1, 12(a2)
18 ; RV32-NEXT:    lw a2, 4(a2)
19 ; RV32-NEXT:    snez t2, a3
20 ; RV32-NEXT:    sltiu t3, a3, 3
21 ; RV32-NEXT:    xori t3, t3, 1
22 ; RV32-NEXT:    sltiu t4, a3, 4
23 ; RV32-NEXT:    xori t4, t4, 1
24 ; RV32-NEXT:    sltiu a3, a3, 2
25 ; RV32-NEXT:    xori a3, a3, 1
26 ; RV32-NEXT:    and a2, a3, a2
27 ; RV32-NEXT:    and a3, t4, t1
28 ; RV32-NEXT:    and t0, t3, t0
29 ; RV32-NEXT:    and a7, t2, a7
30 ; RV32-NEXT:    neg a7, a7
31 ; RV32-NEXT:    and a1, a7, a1
32 ; RV32-NEXT:    neg a7, t0
33 ; RV32-NEXT:    and a6, a7, a6
34 ; RV32-NEXT:    neg a3, a3
35 ; RV32-NEXT:    and a3, a3, a5
36 ; RV32-NEXT:    neg a2, a2
37 ; RV32-NEXT:    and a2, a2, a4
38 ; RV32-NEXT:    add a2, a2, a3
39 ; RV32-NEXT:    add a1, a1, a6
40 ; RV32-NEXT:    add a1, a1, a2
41 ; RV32-NEXT:    add a0, a1, a0
42 ; RV32-NEXT:    ret
44 ; RV64-LABEL: vpreduce_add_v4i32:
45 ; RV64:       # %bb.0:
46 ; RV64-NEXT:    lw a4, 8(a1)
47 ; RV64-NEXT:    lw a5, 24(a1)
48 ; RV64-NEXT:    lw a6, 16(a1)
49 ; RV64-NEXT:    lw a1, 0(a1)
50 ; RV64-NEXT:    ld a7, 0(a2)
51 ; RV64-NEXT:    ld t0, 16(a2)
52 ; RV64-NEXT:    ld t1, 24(a2)
53 ; RV64-NEXT:    ld a2, 8(a2)
54 ; RV64-NEXT:    sext.w a3, a3
55 ; RV64-NEXT:    snez t2, a3
56 ; RV64-NEXT:    sltiu t3, a3, 3
57 ; RV64-NEXT:    xori t3, t3, 1
58 ; RV64-NEXT:    sltiu t4, a3, 4
59 ; RV64-NEXT:    xori t4, t4, 1
60 ; RV64-NEXT:    sltiu a3, a3, 2
61 ; RV64-NEXT:    xori a3, a3, 1
62 ; RV64-NEXT:    and a2, a3, a2
63 ; RV64-NEXT:    and a3, t4, t1
64 ; RV64-NEXT:    and t0, t3, t0
65 ; RV64-NEXT:    and a7, t2, a7
66 ; RV64-NEXT:    negw a7, a7
67 ; RV64-NEXT:    and a1, a7, a1
68 ; RV64-NEXT:    negw a7, t0
69 ; RV64-NEXT:    and a6, a7, a6
70 ; RV64-NEXT:    negw a3, a3
71 ; RV64-NEXT:    and a3, a3, a5
72 ; RV64-NEXT:    negw a2, a2
73 ; RV64-NEXT:    and a2, a2, a4
74 ; RV64-NEXT:    add a2, a2, a3
75 ; RV64-NEXT:    add a1, a1, a6
76 ; RV64-NEXT:    add a1, a1, a2
77 ; RV64-NEXT:    addw a0, a1, a0
78 ; RV64-NEXT:    ret
79   %r = call i32 @llvm.vp.reduce.add.v4i32(i32 %s, <4 x i32> %v, <4 x i1> %m, i32 %evl)
80   ret i32 %r