[x86] fix assert with horizontal math + broadcast of vector (PR43402)
[llvm-core.git] / test / CodeGen / RISCV / rv64i-w-insts-legalization.ll
blobc4a4de7681b08c160195df640f125bd1f806092c
1 ; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
2 ; RUN: llc -mtriple=riscv64 -mattr=+m -verify-machineinstrs < %s | FileCheck %s
4 define signext i32 @addw(i32 signext %s, i32 signext %n, i32 signext %k) nounwind {
5 ; CHECK-LABEL: addw:
6 ; CHECK:       # %bb.0: # %entry
7 ; CHECK-NEXT:    bge a0, a1, .LBB0_2
8 ; CHECK-NEXT:  # %bb.1: # %for.body.preheader
9 ; CHECK-NEXT:    not a2, a0
10 ; CHECK-NEXT:    add a2, a2, a1
11 ; CHECK-NEXT:    addi a3, a0, 1
12 ; CHECK-NEXT:    mul a3, a2, a3
13 ; CHECK-NEXT:    slli a2, a2, 32
14 ; CHECK-NEXT:    srli a2, a2, 32
15 ; CHECK-NEXT:    sub a1, a1, a0
16 ; CHECK-NEXT:    addi a1, a1, -2
17 ; CHECK-NEXT:    slli a1, a1, 32
18 ; CHECK-NEXT:    srli a1, a1, 32
19 ; CHECK-NEXT:    mul a1, a2, a1
20 ; CHECK-NEXT:    srli a1, a1, 1
21 ; CHECK-NEXT:    add a0, a3, a0
22 ; CHECK-NEXT:    addw a0, a0, a1
23 ; CHECK-NEXT:    ret
24 ; CHECK-NEXT:  .LBB0_2:
25 ; CHECK-NEXT:    mv a0, zero
26 ; CHECK-NEXT:    ret
27 entry:
28   %cmp6 = icmp slt i32 %s, %n
29   br i1 %cmp6, label %for.body.preheader, label %for.cond.cleanup
31 for.body.preheader:                               ; preds = %entry
32   %0 = xor i32 %s, -1
33   %1 = add i32 %0, %n
34   %2 = add i32 %s, 1
35   %3 = mul i32 %1, %2
36   %4 = zext i32 %1 to i33
37   %5 = add i32 %n, -2
38   %6 = sub i32 %5, %s
39   %7 = zext i32 %6 to i33
40   %8 = mul i33 %4, %7
41   %9 = lshr i33 %8, 1
42   %10 = trunc i33 %9 to i32
43   %11 = add i32 %3, %s
44   %12 = add i32 %11, %10
45   br label %for.cond.cleanup
47 for.cond.cleanup:                                 ; preds = %for.body.preheader, %entry
48   %sum.0.lcssa = phi i32 [ 0, %entry ], [ %12, %for.body.preheader ]
49   ret i32 %sum.0.lcssa
52 define signext i32 @subw(i32 signext %s, i32 signext %n, i32 signext %k) nounwind {
53 ; CHECK-LABEL: subw:
54 ; CHECK:       # %bb.0: # %entry
55 ; CHECK-NEXT:    bge a0, a1, .LBB1_2
56 ; CHECK-NEXT:  # %bb.1: # %for.body.preheader
57 ; CHECK-NEXT:    not a2, a0
58 ; CHECK-NEXT:    add a3, a2, a1
59 ; CHECK-NEXT:    mul a2, a3, a2
60 ; CHECK-NEXT:    slli a3, a3, 32
61 ; CHECK-NEXT:    srli a3, a3, 32
62 ; CHECK-NEXT:    sub a1, a1, a0
63 ; CHECK-NEXT:    addi a1, a1, -2
64 ; CHECK-NEXT:    slli a1, a1, 32
65 ; CHECK-NEXT:    srli a1, a1, 32
66 ; CHECK-NEXT:    mul a1, a3, a1
67 ; CHECK-NEXT:    srli a1, a1, 1
68 ; CHECK-NEXT:    sub a0, a2, a0
69 ; CHECK-NEXT:    subw a0, a0, a1
70 ; CHECK-NEXT:    ret
71 ; CHECK-NEXT:  .LBB1_2:
72 ; CHECK-NEXT:    mv a0, zero
73 ; CHECK-NEXT:    ret
74 entry:
75   %cmp6 = icmp slt i32 %s, %n
76   br i1 %cmp6, label %for.body.preheader, label %for.cond.cleanup
78 for.body.preheader:                               ; preds = %entry
79   %0 = xor i32 %s, -1
80   %1 = add i32 %0, %n
81   %2 = xor i32 %s, -1
82   %3 = mul i32 %1, %2
83   %4 = zext i32 %1 to i33
84   %5 = add i32 %n, -2
85   %6 = sub i32 %5, %s
86   %7 = zext i32 %6 to i33
87   %8 = mul i33 %4, %7
88   %9 = lshr i33 %8, 1
89   %10 = trunc i33 %9 to i32
90   %11 = sub i32 %3, %s
91   %12 = sub i32 %11, %10
92   br label %for.cond.cleanup
94 for.cond.cleanup:                                 ; preds = %for.body.preheader, %entry
95   %sum.0.lcssa = phi i32 [ 0, %entry ], [ %12, %for.body.preheader ]
96   ret i32 %sum.0.lcssa