Run DCE after a LoopFlatten test to reduce spurious output [nfc]
[llvm-project.git] / llvm / test / CodeGen / ARM / cortex-a57-misched-ldm-wrback.ll
blob0e49a334e5a5b8ae6b4b9e066307c3b4612ac966
1 ; REQUIRES: asserts
2 ; RUN: llc < %s -mtriple=armv8r-eabi -mcpu=cortex-a57 -mattr=use-misched -verify-misched -debug-only=machine-scheduler -o - 2>&1 > /dev/null | FileCheck %s
3
5 @a = dso_local global i32 0, align 4
6 @b = dso_local global i32 0, align 4
7 @c = dso_local global i32 0, align 4
9 ; CHECK:       ********** MI Scheduling **********
10 ; We need second, post-ra scheduling to have LDM instruction combined from single-loads
11 ; CHECK:       ********** MI Scheduling **********
12 ; CHECK:       LDMIA_UPD
13 ; CHECK:       rdefs left
14 ; CHECK-NEXT:  Latency            : 4
15 ; CHECK:       Successors:
16 ; CHECK:       Data
17 ; CHECK-SAME:  Latency=1
18 ; CHECK-NEXT:  Data
19 ; CHECK-SAME:  Latency=3
20 ; CHECK-NEXT:  Data
21 ; CHECK-SAME:  Latency=0
22 ; CHECK-NEXT:  Data
23 ; CHECK-SAME:  Latency=0
24 define dso_local i32 @bar(i32 %a1, i32 %b1, i32 %c1) minsize optsize {
25   %1 = load i32, ptr @a, align 4
26   %2 = load i32, ptr @b, align 4
27   %3 = load i32, ptr @c, align 4
29   %ptr_after = getelementptr i32, ptr @a, i32 3
31   %ptr_val = ptrtoint ptr %ptr_after to i32
32   %mul1 = mul i32 %ptr_val, %1
33   %mul2 = mul i32 %mul1, %2
34   %mul3 = mul i32 %mul2, %3
35   ret i32 %mul3