Run DCE after a LoopFlatten test to reduce spurious output [nfc]
[llvm-project.git] / llvm / test / CodeGen / X86 / merge_store_duplicated_loads.ll
blob70c3e804f1216163603f4a7ac2c41b13f1519b6d
1 ; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
2 ; RUN: llc %s -mtriple=x86_64-unknown-linux-gnu -mcpu=corei7 -o - | FileCheck %s
5 target triple = "x86_64-unknown-linux-gnu"
7 define void @merge_double(ptr noalias nocapture %st, ptr noalias nocapture readonly %ld) #0 {
8 ; CHECK-LABEL: merge_double:
9 ; CHECK:       # %bb.0:
10 ; CHECK-NEXT:    movsd {{.*#+}} xmm0 = mem[0],zero
11 ; CHECK-NEXT:    movsd {{.*#+}} xmm1 = mem[0],zero
12 ; CHECK-NEXT:    movsd %xmm0, (%rdi)
13 ; CHECK-NEXT:    movsd %xmm1, 8(%rdi)
14 ; CHECK-NEXT:    movsd %xmm0, 16(%rdi)
15 ; CHECK-NEXT:    movsd %xmm1, 24(%rdi)
16 ; CHECK-NEXT:    retq
17   %ld_idx1 = getelementptr inbounds double, ptr %ld, i64 1
18   %ld0 = load double, ptr %ld, align 8, !tbaa !2
19   %ld1 = load double, ptr %ld_idx1, align 8, !tbaa !2
21   %st_idx1 = getelementptr inbounds double, ptr %st, i64 1
22   %st_idx2 = getelementptr inbounds double, ptr %st, i64 2
23   %st_idx3 = getelementptr inbounds double, ptr %st, i64 3
25   store double %ld0, ptr %st, align 8, !tbaa !2
26   store double %ld1, ptr %st_idx1, align 8, !tbaa !2
27   store double %ld0, ptr %st_idx2, align 8, !tbaa !2
28   store double %ld1, ptr %st_idx3, align 8, !tbaa !2
29   ret void
32 define void @merge_loadstore_int(ptr noalias nocapture readonly %p, ptr noalias nocapture %q) local_unnamed_addr #0 {
33 ; CHECK-LABEL: merge_loadstore_int:
34 ; CHECK:       # %bb.0: # %entry
35 ; CHECK-NEXT:    movq (%rdi), %rax
36 ; CHECK-NEXT:    movq 8(%rdi), %rcx
37 ; CHECK-NEXT:    movq %rax, (%rsi)
38 ; CHECK-NEXT:    movq %rcx, 8(%rsi)
39 ; CHECK-NEXT:    movq %rax, 16(%rsi)
40 ; CHECK-NEXT:    movq %rcx, 24(%rsi)
41 ; CHECK-NEXT:    retq
42 entry:
43   %0 = load i64, ptr %p, align 8, !tbaa !1
44   %arrayidx1 = getelementptr inbounds i64, ptr %p, i64 1
45   %1 = load i64, ptr %arrayidx1, align 8, !tbaa !1
46   store i64 %0, ptr %q, align 8, !tbaa !1
47   %arrayidx3 = getelementptr inbounds i64, ptr %q, i64 1
48   store i64 %1, ptr %arrayidx3, align 8, !tbaa !1
49   %arrayidx4 = getelementptr inbounds i64, ptr %q, i64 2
50   store i64 %0, ptr %arrayidx4, align 8, !tbaa !1
51   %arrayidx5 = getelementptr inbounds i64, ptr %q, i64 3
52   store i64 %1, ptr %arrayidx5, align 8, !tbaa !1
53   ret void
56 define i64 @merge_loadstore_int_with_extra_use(ptr noalias nocapture readonly %p, ptr noalias nocapture %q) local_unnamed_addr #0 {
57 ; CHECK-LABEL: merge_loadstore_int_with_extra_use:
58 ; CHECK:       # %bb.0: # %entry
59 ; CHECK-NEXT:    movq (%rdi), %rax
60 ; CHECK-NEXT:    movq 8(%rdi), %rcx
61 ; CHECK-NEXT:    movq %rax, (%rsi)
62 ; CHECK-NEXT:    movq %rcx, 8(%rsi)
63 ; CHECK-NEXT:    movq %rax, 16(%rsi)
64 ; CHECK-NEXT:    movq %rcx, 24(%rsi)
65 ; CHECK-NEXT:    retq
66 entry:
67   %0 = load i64, ptr %p, align 8, !tbaa !1
68   %arrayidx1 = getelementptr inbounds i64, ptr %p, i64 1
69   %1 = load i64, ptr %arrayidx1, align 8, !tbaa !1
70   store i64 %0, ptr %q, align 8, !tbaa !1
71   %arrayidx3 = getelementptr inbounds i64, ptr %q, i64 1
72   store i64 %1, ptr %arrayidx3, align 8, !tbaa !1
73   %arrayidx4 = getelementptr inbounds i64, ptr %q, i64 2
74   store i64 %0, ptr %arrayidx4, align 8, !tbaa !1
75   %arrayidx5 = getelementptr inbounds i64, ptr %q, i64 3
76   store i64 %1, ptr %arrayidx5, align 8, !tbaa !1
77   ret i64 %0
81 attributes #0 = { "target-cpu"="x86-64" "target-features"="+fxsr,+mmx,+sse,+sse2,+x87" }
84 !0 = !{!"clang version 5.0.0 (trunk 296467) (llvm/trunk 296476)"}
85 !1 = !{!2, !2, i64 0}
86 !2 = !{!"double", !3, i64 0}
87 !3 = !{!"omnipotent char", !4, i64 0}
88 !4 = !{!"Simple C/C++ TBAA"}