Run DCE after a LoopFlatten test to reduce spurious output [nfc]
[llvm-project.git] / llvm / test / CodeGen / X86 / merge-store-dependency.ll
blob1e1802b1d50b360343de212540a12498ec686d63
1 ; RUN: llc < %s -mtriple=i686-unknown-linux-android24 -verify-machineinstrs \
2 ; RUN:   -debug-only=machine-scheduler -o - 2>&1 | FileCheck %s
3 ; REQUIRES: asserts
5 ;; MOVUPSmr is a merged store from stack objects %ir.arg1, %ir.arg2, %ir.arg3,
6 ;; %ir.arg4.
7 ;; Check that the merged store has dependency with %ir.arg4.
9 ; CHECK:       ********** MI Scheduling **********
10 ; CHECK-LABEL: f:%bb.0 bb
11 ; CHECK:       SU([[ARG4:[0-9]+]]):{{.*}}MOV32rm{{.*}}load (s32) from %ir.arg4
12 ; CHECK:       SU([[#WIDEN:]]):{{.*}}MOVUPSmr{{.*}}store (s128) into
13 ; CHECK:         Predecessors:
14 ; CHECK:           SU([[ARG4]]):{{.*}}Memory
15 ; CHECK:       SU([[#WIDEN+1]])
18 define void @f(ptr %arg, ptr byval(ptr) %arg1, ptr byval(ptr) %arg2, ptr byval(ptr) %arg3, ptr byval(ptr) %arg4) #0 {
19 bb:
20   %inst = alloca ptr, align 4
21   %inst5 = alloca ptr, align 4
22   %inst6 = alloca ptr, align 4
23   %inst7 = alloca ptr, align 4
24   %inst9 = load ptr, ptr %arg1, align 4
25   store ptr null, ptr %arg1, align 4
26   store ptr %inst9, ptr %inst, align 4
27   %inst10 = load ptr, ptr %arg2, align 4
28   store ptr null, ptr %arg2, align 4
29   store ptr %inst10, ptr %inst5, align 4
30   %inst11 = load ptr, ptr %arg3, align 4
31   store ptr null, ptr %arg3, align 4
32   store ptr %inst11, ptr %inst6, align 4
33   %inst12 = load ptr, ptr %arg4, align 4
34   store ptr null, ptr %arg4, align 4
35   store ptr %inst12, ptr %inst7, align 4
36   call void @g(ptr %arg, ptr byval(ptr) %inst, ptr byval(ptr) %inst5, ptr byval(ptr) %inst6, ptr byval(ptr) %inst7)
37   call void @h(ptr %arg4)
38   call void @h(ptr %arg3)
39   call void @h(ptr %arg2)
40   call void @h(ptr %arg1)
41   ret void
44 declare void @g(ptr, ptr, ptr, ptr, ptr)
46 declare void @h(ptr)
48 attributes #0 = { optsize "frame-pointer"="non-leaf" "target-cpu"="i686" "target-features"="+sse,+sse2" "tune-cpu"="generic" }