[sanitizer] Improve FreeBSD ASLR detection
[llvm-project.git] / llvm / test / Transforms / SampleProfile / csspgo-inline.ll
blob3f2829297fb2c2bce0ceb9f9b17eb8fe41997dca
1 ; Test for CSSPGO's new early inliner using priority queue
3 ; Note that we need new pass manager to enable top-down processing for sample profile loader
4 ; Test we inlined the following in top-down order with old inliner
5 ;   main:3 @ _Z5funcAi
6 ;   main:3 @ _Z5funcAi:1 @ _Z8funcLeafi
7 ;   _Z5funcBi:1 @ _Z8funcLeafi
8 ; RUN: opt < %s -passes=sample-profile -sample-profile-file=%S/Inputs/profile-context-tracker.prof -sample-profile-inline-size -sample-profile-prioritized-inline=0 -profile-sample-accurate -S -pass-remarks=inline -o /dev/null 2>&1 | FileCheck %s --check-prefix=INLINE-BASE
10 ; RUN: llvm-profdata merge --sample --extbinary --use-md5 %S/Inputs/profile-context-tracker.prof -o %t.md5
11 ; RUN: opt < %s -passes=sample-profile -sample-profile-file=%t.md5 -sample-profile-inline-size -sample-profile-prioritized-inline=0 -profile-sample-accurate -S -pass-remarks=inline -o /dev/null 2>&1 | FileCheck %s --check-prefix=INLINE-BASE
13 ; RUN: llvm-profdata merge --sample --text --gen-cs-nested-profile %S/Inputs/profile-context-tracker.prof -o %t.prof
14 ; RUN: opt < %s -passes=sample-profile -sample-profile-file=%t.prof -sample-profile-inline-size -sample-profile-prioritized-inline=0 -profile-sample-accurate -S -pass-remarks=inline -o /dev/null 2>&1 | FileCheck %s --check-prefix=INLINE-BASE
16 ; With new FDO early inliner, callee entry count is used to drive inlining instead of callee total samples, so we get less inlining for given profile
17 ; RUN: opt < %s -passes=sample-profile -sample-profile-file=%S/Inputs/profile-context-tracker.prof -sample-profile-inline-size -profile-sample-accurate -S -pass-remarks=inline -o /dev/null 2>&1 | FileCheck %s --check-prefix=INLINE-NEW
18 ; RUN: opt < %s -passes=sample-profile -sample-profile-file=%t.prof -sample-profile-prioritized-inline -sample-profile-inline-size -profile-sample-accurate -S -pass-remarks=inline -o /dev/null 2>&1 | FileCheck %s --check-prefix=INLINE-NEW
20 ; With new FDO early inliner, callee entry count is used to drive inlining instead of callee total samples, tuning hot cutoff can get us the same inlining
21 ; RUN: opt < %s -passes=sample-profile -sample-profile-file=%S/Inputs/profile-context-tracker.prof -sample-profile-inline-size -profile-summary-cutoff-hot=999900 -profile-sample-accurate -S -pass-remarks=inline -o /dev/null 2>&1 | FileCheck %s --check-prefix=INLINE-BASE
23 ; With new FDO early inliner, callee entry count is used to drive inlining instead of callee total samples, tuning cold sample profile inline threshold can get us the same inlining
24 ; RUN: opt < %s -passes=sample-profile -sample-profile-file=%S/Inputs/profile-context-tracker.prof -sample-profile-inline-size -sample-profile-cold-inline-threshold=200 -profile-sample-accurate -S -pass-remarks=inline -o /dev/null 2>&1 | FileCheck %s --check-prefix=INLINE-BASE
26 ; With new FDO early inliner and tuned cutoff, we can control inlining through size growth tuning knob.
27 ; RUN: opt < %s -passes=sample-profile -sample-profile-file=%S/Inputs/profile-context-tracker.prof -sample-profile-inline-size -profile-summary-cutoff-hot=999900 -sample-profile-inline-limit-min=0 -sample-profile-inline-growth-limit=1 -profile-sample-accurate -S -pass-remarks=inline -o /dev/null 2>&1 | FileCheck %s --allow-empty --check-prefix=INLINE-NEW-LIMIT1
28 ; RUN: opt < %s -passes=sample-profile -sample-profile-file=%S/Inputs/profile-context-tracker.prof -sample-profile-inline-size -profile-summary-cutoff-hot=999900 -sample-profile-inline-limit-min=10 -sample-profile-inline-growth-limit=1 -profile-sample-accurate -S -pass-remarks=inline -o /dev/null 2>&1 | FileCheck %s --check-prefix=INLINE-NEW-LIMIT2
31 ; INLINE-BASE: remark: merged.cpp:14:10: '_Z5funcAi' inlined into 'main' to match profiling context with (cost={{[0-9]+}}, threshold={{[0-9]+}}) at callsite main:3:10
32 ; INLINE-BASE: remark: merged.cpp:27:11: '_Z8funcLeafi' inlined into 'main' to match profiling context with (cost={{[0-9]+}}, threshold={{[0-9]+}}) at callsite _Z5funcAi:1:11 @ main:3:10
33 ; INLINE-BASE: remark: merged.cpp:33:11: '_Z8funcLeafi' inlined into '_Z5funcBi' to match profiling context with (cost={{[0-9]+}}, threshold={{[0-9]+}}) at callsite _Z5funcBi:1:11
35 ; INLINE-NEW: remark: merged.cpp:14:10: '_Z5funcAi' inlined into 'main' to match profiling context with (cost={{[0-9]+}}, threshold={{[0-9]+}}) at callsite main:3:10
36 ; INLINE-NEW-NOT: remark
38 ; INLINE-NEW-LIMIT1-NOT: remark
40 ; INLINE-NEW-LIMIT2: remark: merged.cpp:33:11: '_Z8funcLeafi' inlined into '_Z5funcBi' to match profiling context with (cost={{[0-9]+}}, threshold={{[0-9]+}}) at callsite _Z5funcBi:1:11
41 ; INLINE-NEW-LIMIT2-NOT: remark
43 @factor = dso_local global i32 3, align 4, !dbg !0
45 define dso_local i32 @main() local_unnamed_addr #0 !dbg !18 {
46 entry:
47   br label %for.body, !dbg !25
49 for.cond.cleanup:                                 ; preds = %for.body
50   ret i32 %add3, !dbg !27
52 for.body:                                         ; preds = %for.body, %entry
53   %x.011 = phi i32 [ 300000, %entry ], [ %dec, %for.body ]
54   %r.010 = phi i32 [ 0, %entry ], [ %add3, %for.body ]
55   %call = tail call i32 @_Z5funcBi(i32 %x.011), !dbg !32
56   %add = add nuw nsw i32 %x.011, 1, !dbg !31
57   %call1 = tail call i32 @_Z5funcAi(i32 %add), !dbg !28
58   %add2 = add i32 %call, %r.010, !dbg !34
59   %add3 = add i32 %add2, %call1, !dbg !35
60   %dec = add nsw i32 %x.011, -1, !dbg !36
61   %cmp = icmp eq i32 %x.011, 0, !dbg !38
62   br i1 %cmp, label %for.cond.cleanup, label %for.body, !dbg !25
65 define dso_local i32 @_Z5funcAi(i32 %x) local_unnamed_addr #1 !dbg !40 {
66 entry:
67   %add = add nsw i32 %x, 100000, !dbg !44
68   %call = tail call i32 @_Z8funcLeafi(i32 %add), !dbg !45
69   ret i32 %call, !dbg !46
72 define dso_local i32 @_Z8funcLeafi(i32 %x) local_unnamed_addr #1 !dbg !54 {
73 entry:
74   %cmp = icmp sgt i32 %x, 0, !dbg !57
75   br i1 %cmp, label %while.body, label %while.cond2.preheader, !dbg !59
77 while.cond2.preheader:                            ; preds = %entry
78   %cmp313 = icmp slt i32 %x, 0, !dbg !60
79   br i1 %cmp313, label %while.body4, label %if.end, !dbg !63
81 while.body:                                       ; preds = %while.body, %entry
82   %x.addr.016 = phi i32 [ %sub, %while.body ], [ %x, %entry ]
83   %tmp = load volatile i32, i32* @factor, align 4, !dbg !64
84   %call = tail call i32 @_Z3fibi(i32 %tmp), !dbg !67
85   %sub = sub nsw i32 %x.addr.016, %call, !dbg !68
86   %cmp1 = icmp sgt i32 %sub, 0, !dbg !69
87   br i1 %cmp1, label %while.body, label %if.end, !dbg !71
89 while.body4:                                      ; preds = %while.body4, %while.cond2.preheader
90   %x.addr.114 = phi i32 [ %add, %while.body4 ], [ %x, %while.cond2.preheader ]
91   %tmp1 = load volatile i32, i32* @factor, align 4, !dbg !72
92   %call5 = tail call i32 @_Z3fibi(i32 %tmp1), !dbg !74
93   %add = add nsw i32 %call5, %x.addr.114, !dbg !75
94   %cmp3 = icmp slt i32 %add, 0, !dbg !60
95   br i1 %cmp3, label %while.body4, label %if.end, !dbg !63
97 if.end:                                           ; preds = %while.body4, %while.body, %while.cond2.preheader
98   %x.addr.2 = phi i32 [ 0, %while.cond2.preheader ], [ %sub, %while.body ], [ %add, %while.body4 ]
99   ret i32 %x.addr.2, !dbg !76
102 define dso_local i32 @_Z5funcBi(i32 %x) local_unnamed_addr #0 !dbg !47 {
103 entry:
104   %sub = add nsw i32 %x, -100000, !dbg !51
105   %call = tail call i32 @_Z8funcLeafi(i32 %sub), !dbg !52
106   ret i32 %call, !dbg !53
109 declare i32 @_Z3fibi(i32)
111 attributes #0 = { nofree noinline norecurse nounwind uwtable "correctly-rounded-divide-sqrt-fp-math"="false" "disable-tail-calls"="false" "frame-pointer"="none" "less-precise-fpmad"="false" "min-legal-vector-width"="0" "no-infs-fp-math"="false" "no-jump-tables"="false" "no-nans-fp-math"="false" "no-signed-zeros-fp-math"="false" "no-trapping-math"="false" "stack-protector-buffer-size"="8" "target-cpu"="x86-64" "target-features"="+cx8,+fxsr,+mmx,+sse,+sse2,+x87" "unsafe-fp-math"="false" "use-soft-float"="false" "use-sample-profile" }
112 attributes #1 = { nofree norecurse nounwind uwtable "correctly-rounded-divide-sqrt-fp-math"="false" "disable-tail-calls"="false" "frame-pointer"="none" "less-precise-fpmad"="false" "min-legal-vector-width"="0" "no-infs-fp-math"="false" "no-jump-tables"="false" "no-nans-fp-math"="false" "no-signed-zeros-fp-math"="false" "no-trapping-math"="false" "stack-protector-buffer-size"="8" "target-cpu"="x86-64" "target-features"="+cx8,+fxsr,+mmx,+sse,+sse2,+x87" "unsafe-fp-math"="false" "use-soft-float"="false" "use-sample-profile" }
114 !llvm.dbg.cu = !{!2}
115 !llvm.module.flags = !{!14, !15, !16}
116 !llvm.ident = !{!17}
118 !0 = !DIGlobalVariableExpression(var: !1, expr: !DIExpression())
119 !1 = distinct !DIGlobalVariable(name: "factor", scope: !2, file: !3, line: 21, type: !13, isLocal: false, isDefinition: true)
120 !2 = distinct !DICompileUnit(language: DW_LANG_C_plus_plus_14, file: !3, producer: "clang version 11.0.0", isOptimized: true, runtimeVersion: 0, emissionKind: FullDebug, enums: !4, retainedTypes: !5, globals: !12, splitDebugInlining: false, debugInfoForProfiling: true, nameTableKind: None)
121 !3 = !DIFile(filename: "merged.cpp", directory: "/local/autofdo")
122 !4 = !{}
123 !5 = !{!6, !10, !11}
124 !6 = !DISubprogram(name: "funcA", linkageName: "_Z5funcAi", scope: !3, file: !3, line: 6, type: !7, flags: DIFlagPrototyped, spFlags: DISPFlagOptimized, retainedNodes: !4)
125 !7 = !DISubroutineType(types: !8)
126 !8 = !{!9, !9}
127 !9 = !DIBasicType(name: "int", size: 32, encoding: DW_ATE_signed)
128 !10 = !DISubprogram(name: "funcB", linkageName: "_Z5funcBi", scope: !3, file: !3, line: 7, type: !7, flags: DIFlagPrototyped, spFlags: DISPFlagOptimized, retainedNodes: !4)
129 !11 = !DISubprogram(name: "funcLeaf", linkageName: "_Z8funcLeafi", scope: !3, file: !3, line: 22, type: !7, flags: DIFlagPrototyped, spFlags: DISPFlagOptimized, retainedNodes: !4)
130 !12 = !{!0}
131 !13 = !DIDerivedType(tag: DW_TAG_volatile_type, baseType: !9)
132 !14 = !{i32 7, !"Dwarf Version", i32 4}
133 !15 = !{i32 2, !"Debug Info Version", i32 3}
134 !16 = !{i32 1, !"wchar_size", i32 4}
135 !17 = !{!"clang version 11.0.0"}
136 !18 = distinct !DISubprogram(name: "main", scope: !3, file: !3, line: 11, type: !19, scopeLine: 11, flags: DIFlagPrototyped | DIFlagAllCallsDescribed, spFlags: DISPFlagDefinition | DISPFlagOptimized, unit: !2, retainedNodes: !21)
137 !19 = !DISubroutineType(types: !20)
138 !20 = !{!9}
139 !21 = !{!22, !23}
140 !22 = !DILocalVariable(name: "r", scope: !18, file: !3, line: 12, type: !9)
141 !23 = !DILocalVariable(name: "x", scope: !24, file: !3, line: 13, type: !9)
142 !24 = distinct !DILexicalBlock(scope: !18, file: !3, line: 13, column: 3)
143 !25 = !DILocation(line: 13, column: 3, scope: !26)
144 !26 = !DILexicalBlockFile(scope: !24, file: !3, discriminator: 2)
145 !27 = !DILocation(line: 17, column: 3, scope: !18)
146 !28 = !DILocation(line: 14, column: 10, scope: !29)
147 !29 = distinct !DILexicalBlock(scope: !30, file: !3, line: 13, column: 37)
148 !30 = distinct !DILexicalBlock(scope: !24, file: !3, line: 13, column: 3)
149 !31 = !DILocation(line: 14, column: 29, scope: !29)
150 !32 = !DILocation(line: 14, column: 21, scope: !33)
151 !33 = !DILexicalBlockFile(scope: !29, file: !3, discriminator: 2)
152 !34 = !DILocation(line: 14, column: 19, scope: !29)
153 !35 = !DILocation(line: 14, column: 7, scope: !29)
154 !36 = !DILocation(line: 13, column: 33, scope: !37)
155 !37 = !DILexicalBlockFile(scope: !30, file: !3, discriminator: 6)
156 !38 = !DILocation(line: 13, column: 26, scope: !39)
157 !39 = !DILexicalBlockFile(scope: !30, file: !3, discriminator: 2)
158 !40 = distinct !DISubprogram(name: "funcA", linkageName: "_Z5funcAi", scope: !3, file: !3, line: 26, type: !7, scopeLine: 26, flags: DIFlagPrototyped | DIFlagAllCallsDescribed, spFlags: DISPFlagDefinition | DISPFlagOptimized, unit: !2)
159 !44 = !DILocation(line: 27, column: 22, scope: !40)
160 !45 = !DILocation(line: 27, column: 11, scope: !40)
161 !46 = !DILocation(line: 29, column: 3, scope: !40)
162 !47 = distinct !DISubprogram(name: "funcB", linkageName: "_Z5funcBi", scope: !3, file: !3, line: 32, type: !7, scopeLine: 32, flags: DIFlagPrototyped | DIFlagAllCallsDescribed, spFlags: DISPFlagDefinition | DISPFlagOptimized, unit: !2)
163 !51 = !DILocation(line: 33, column: 22, scope: !47)
164 !52 = !DILocation(line: 33, column: 11, scope: !47)
165 !53 = !DILocation(line: 35, column: 3, scope: !47)
166 !54 = distinct !DISubprogram(name: "funcLeaf", linkageName: "_Z8funcLeafi", scope: !3, file: !3, line: 48, type: !7, scopeLine: 48, flags: DIFlagPrototyped | DIFlagAllCallsDescribed, spFlags: DISPFlagDefinition | DISPFlagOptimized, unit: !2)
167 !57 = !DILocation(line: 49, column: 9, scope: !58)
168 !58 = distinct !DILexicalBlock(scope: !54, file: !3, line: 49, column: 7)
169 !59 = !DILocation(line: 49, column: 7, scope: !54)
170 !60 = !DILocation(line: 58, column: 14, scope: !61)
171 !61 = !DILexicalBlockFile(scope: !62, file: !3, discriminator: 2)
172 !62 = distinct !DILexicalBlock(scope: !58, file: !3, line: 56, column: 8)
173 !63 = !DILocation(line: 58, column: 5, scope: !61)
174 !64 = !DILocation(line: 52, column: 16, scope: !65)
175 !65 = distinct !DILexicalBlock(scope: !66, file: !3, line: 51, column: 19)
176 !66 = distinct !DILexicalBlock(scope: !58, file: !3, line: 49, column: 14)
177 !67 = !DILocation(line: 52, column: 12, scope: !65)
178 !68 = !DILocation(line: 52, column: 9, scope: !65)
179 !69 = !DILocation(line: 51, column: 14, scope: !70)
180 !70 = !DILexicalBlockFile(scope: !66, file: !3, discriminator: 2)
181 !71 = !DILocation(line: 51, column: 5, scope: !70)
182 !72 = !DILocation(line: 59, column: 16, scope: !73)
183 !73 = distinct !DILexicalBlock(scope: !62, file: !3, line: 58, column: 19)
184 !74 = !DILocation(line: 59, column: 12, scope: !73)
185 !75 = !DILocation(line: 59, column: 9, scope: !73)
186 !76 = !DILocation(line: 63, column: 3, scope: !54)