Run DCE after a LoopFlatten test to reduce spurious output [nfc]
[llvm-project.git] / llvm / test / CodeGen / X86 / regalloc-advanced-split-cost.ll
blob50422a867dc3248e639c21b35573818d908a3b20
1 ; RUN: llc < %s -mtriple=i686 -regalloc=greedy --debug-only=regalloc 2>&1 | FileCheck %s
3 ; REQUIRES: asserts
5 ; This test is meant to make sure that the weight of local intervals that are
6 ; created during split is taken into account when choosing the best candidate
7 ; register.
8 ; %shl is the interval that will be split.
9 ; The inline assembly calls interfere with %shl and make only 2 available split
10 ; candidates - %esi and %ebp.
11 ; The old code would have chosen %esi as the split candidate ignoring the fact
12 ; that this choice will cause the creation of a local interval that will have a
13 ;  certain spill cost.
14 ; The new code choses %ebp as the split candidate as it has lower spill cost.
16 ; Make sure the split behaves as expected
17 ; CHECK: RS_Split Cascade 1
18 ; CHECK-NOT: $eax       static = 
19 ; CHECK: $eax   no positive bundles
20 ; CHECK-NEXT: $ecx      no positive bundles
21 ; CHECK-NEXT: $edx      no positive bundles
22 ; CHECK-NEXT: $esi      static = 
23 ; CHECK-NEXT: $edi      no positive bundles
24 ; CHECK-NEXT: $ebx      no positive bundles
25 ; CHECK-NEXT: $ebp      static = 
26 ; CHECK: Split for $ebp
28 ; Function Attrs: nounwind
29 define i32 @foo(ptr %array, i32 %cond1, i32 %val) local_unnamed_addr #0 {
30 entry:
31   %array.addr = alloca ptr, align 4
32   store ptr %array, ptr %array.addr, align 4, !tbaa !3
33   %0 = load i32, ptr %array, align 4, !tbaa !7
34   %arrayidx1 = getelementptr inbounds i32, ptr %array, i32 1
35   %1 = load i32, ptr %arrayidx1, align 4, !tbaa !7
36   %arrayidx2 = getelementptr inbounds i32, ptr %array, i32 2
37   %2 = load i32, ptr %arrayidx2, align 4, !tbaa !7
38   %arrayidx3 = getelementptr inbounds i32, ptr %array, i32 3
39   %3 = load i32, ptr %arrayidx3, align 4, !tbaa !7
40   %arrayidx4 = getelementptr inbounds i32, ptr %array, i32 4
41   %4 = load i32, ptr %arrayidx4, align 4, !tbaa !7
42   %arrayidx6 = getelementptr inbounds i32, ptr %array, i32 %val
43   %5 = load i32, ptr %arrayidx6, align 4, !tbaa !7
44   %shl = shl i32 %5, 5
45   %tobool = icmp eq i32 %cond1, 0
46   br i1 %tobool, label %if.else, label %if.then
48 if.then:                                          ; preds = %entry
49   %arrayidx7 = getelementptr inbounds i32, ptr %array, i32 6
50   store i32 %shl, ptr %arrayidx7, align 4, !tbaa !7
51   call void asm "nop", "=*m,r,r,r,r,r,*m,~{dirflag},~{fpsr},~{flags}"(ptr elementtype(ptr) nonnull %array.addr, i32 %0, i32 %1, i32 %2, i32 %3, i32 %4, ptr elementtype(ptr) nonnull %array.addr) #1, !srcloc !9
52   %6 = load ptr, ptr %array.addr, align 4, !tbaa !3
53   %arrayidx8 = getelementptr inbounds i32, ptr %6, i32 7
54   br label %if.end
56 if.else:                                          ; preds = %entry
57   %arrayidx5 = getelementptr inbounds i32, ptr %array, i32 5
58   %7 = load i32, ptr %arrayidx5, align 4, !tbaa !7
59   %arrayidx9 = getelementptr inbounds i32, ptr %array, i32 8
60   store i32 %shl, ptr %arrayidx9, align 4, !tbaa !7
61   call void asm "nop", "=*m,{ax},{bx},{cx},{dx},{di},{si},{ebp},*m,~{dirflag},~{fpsr},~{flags}"(ptr elementtype(ptr) nonnull %array.addr, i32 %0, i32 %1, i32 %2, i32 %3, i32 %4, i32 %7, ptr undef, ptr elementtype(ptr) nonnull %array.addr) #1, !srcloc !10
62   %8 = load ptr, ptr %array.addr, align 4, !tbaa !3
63   %arrayidx10 = getelementptr inbounds i32, ptr %8, i32 9
64   br label %if.end
66 if.end:                                           ; preds = %if.else, %if.then
67   %arrayidx10.sink = phi ptr [ %arrayidx10, %if.else ], [ %arrayidx8, %if.then ]
68   %9 = phi ptr [ %8, %if.else ], [ %6, %if.then ]
69   store i32 %shl, ptr %arrayidx10.sink, align 4, !tbaa !7
70   %10 = load i32, ptr %9, align 4, !tbaa !7
71   %add = add nsw i32 %10, %shl
72   ret i32 %add
75 attributes #0 = { nounwind "correctly-rounded-divide-sqrt-fp-math"="false" "disable-tail-calls"="false" "less-precise-fpmad"="false" "frame-pointer"="none" "no-infs-fp-math"="false" "no-jump-tables"="false" "no-nans-fp-math"="false" "no-signed-zeros-fp-math"="false" "no-trapping-math"="false" "stack-protector-buffer-size"="8" "target-features"="+x87" "unsafe-fp-math"="false" "use-soft-float"="false" }
76 attributes #1 = { nounwind }
78 !llvm.module.flags = !{!0, !1}
79 !llvm.ident = !{!2}
81 !0 = !{i32 1, !"NumRegisterParameters", i32 0}
82 !1 = !{i32 1, !"wchar_size", i32 4}
83 !2 = !{!"clang version 6.0.0"}
84 !3 = !{!4, !4, i64 0}
85 !4 = !{!"any pointer", !5, i64 0}
86 !5 = !{!"omnipotent char", !6, i64 0}
87 !6 = !{!"Simple C/C++ TBAA"}
88 !7 = !{!8, !8, i64 0}
89 !8 = !{!"int", !5, i64 0}
90 !9 = !{i32 268}
91 !10 = !{i32 390}