Run DCE after a LoopFlatten test to reduce spurious output [nfc]
[llvm-project.git] / llvm / test / CodeGen / PowerPC / stdux-constuse.ll
blob3af218900d62082ae55954afc2cf5abc31adb9d7
1 ; RUN: llc -verify-machineinstrs -mcpu=a2 -disable-lsr < %s | FileCheck %s
2 target datalayout = "E-p:64:64:64-i1:8:8-i8:8:8-i16:16:16-i32:32:32-i64:64:64-f32:32:32-f64:64:64-v128:128:128-n32:64"
3 target triple = "powerpc64-unknown-linux-gnu"
5 define i32 @test1(i64 %add, ptr %ptr) nounwind {
6 entry:
7   %p1 = getelementptr i64, ptr %ptr, i64 144115188075855
8   br label %for.cond2.preheader
10 for.cond2.preheader:
11   %nl.018 = phi i32 [ 0, %entry ], [ %inc9, %for.end ]
12   br label %for.body4
14 for.body4:
15   %lsr.iv = phi i32 [ %lsr.iv.next, %for.body4 ], [ 16000, %for.cond2.preheader ]
16   %i0 = phi ptr [ %p1, %for.cond2.preheader ], [ %i6, %for.body4 ]
17   %i6 = getelementptr i64, ptr %i0, i64 400000
18   %i7 = getelementptr i64, ptr %i6, i64 300000
19   %i8 = getelementptr i64, ptr %i6, i64 200000
20   %i9 = getelementptr i64, ptr %i6, i64 100000
21   store i64 %add, ptr %i6, align 32
22   store i64 %add, ptr %i7, align 32
23   store i64 %add, ptr %i8, align 32
24   store i64 %add, ptr %i9, align 32
25   %lsr.iv.next = add i32 %lsr.iv, -16
26   %exitcond.15 = icmp eq i32 %lsr.iv.next, 0
27   br i1 %exitcond.15, label %for.end, label %for.body4
29 ; Make sure that we generate the most compact form of this loop with no
30 ; unnecessary moves
31 ; CHECK: @test1
32 ; CHECK: mtctr
33 ; CHECK: stdux
34 ; CHECK-NEXT: stdx
35 ; CHECK-NEXT: stdx
36 ; CHECK-NEXT: stdx
37 ; CHECK-NEXT: bdnz
39 for.end:
40   %inc9 = add nsw i32 %nl.018, 1
41   %exitcond = icmp eq i32 %inc9, 400000
42   br i1 %exitcond, label %for.end10, label %for.cond2.preheader
44 for.end10:
45   ret i32 0