Bump version to 19.1.0-rc3
[llvm-project.git] / llvm / test / Transforms / SampleProfile / profile-context-tracker-debug.ll
blobbb0abb19b29575fe6b2b40e77acd4be8f4730c74
1 ; REQUIRES: asserts
2 ; Test for CSSPGO's SampleContextTracker to make sure context profile tree is promoted and merged properly
3 ; based on inline decision, so post inline counts are accurate.
5 ;; The order of nodes within Context Profile Tree depends on the implmementation of std::hash<std::string>.
6 ;; Using check-dag instead of check-next.
9 ; Note that we need new pass manager to enable top-down processing for sample profile loader
10 ; RUN: opt < %s -passes=sample-profile -sample-profile-file=%S/Inputs/profile-context-tracker.prof -sample-profile-inline-size -sample-profile-cold-inline-threshold=200 -debug-only=sample-context-tracker -o /dev/null 2>&1 | FileCheck %s --check-prefix=INLINE-ALL
11 ; RUN: opt < %s -passes=sample-profile -sample-profile-file=%S/Inputs/profile-context-tracker.prof -sample-profile-prioritized-inline=0 -sample-profile-inline-size=0 -debug-only=sample-context-tracker -o /dev/null 2>&1 | FileCheck %s --check-prefix=INLINE-HOT
14 ; Test we inlined the following in top-down order and promot rest not inlined context profile into base profile
15 ;   main:3 @ _Z5funcAi
16 ;   main:3 @ _Z5funcAi:1 @ _Z8funcLeafi
17 ;   _Z5funcBi:1 @ _Z8funcLeafi
18 ; INLINE-ALL:      Getting base profile for function: main
19 ; INLINE-ALL-NEXT:   Merging context profile into base profile: main
20 ; INLINE-ALL-NEXT:   Found context tree root to promote: external:12 @ main
21 ; INLINE-ALL-NEXT:   Context promoted and merged to: main
22 ; INLINE-ALL-NEXT: Getting callee context for instr:   %call = tail call i32 @_Z5funcBi
23 ; INLINE-ALL-NEXT:   Callee context found: main:3.1 @ _Z5funcBi
24 ; INLINE-ALL-NEXT: Getting callee context for instr:   %call1 = tail call i32 @_Z5funcAi
25 ; INLINE-ALL-NEXT:   Callee context found: main:3 @ _Z5funcAi
26 ; INLINE-ALL-NEXT: Marking context profile as inlined: main:3 @ _Z5funcAi
27 ; INLINE-ALL-NEXT: Getting callee context for instr:   %call.i = tail call i32 @_Z8funcLeafi
28 ; INLINE-ALL-NEXT:   Callee context found: main:3 @ _Z5funcAi:1 @ _Z8funcLeafi
29 ; INLINE-ALL-NEXT: Marking context profile as inlined: main:3 @ _Z5funcAi:1 @ _Z8funcLeafi
30 ; INLINE-ALL-NEXT: Getting callee context for instr:   %call.i2 = tail call i32 @_Z3fibi
31 ; INLINE-ALL-NEXT: Getting callee context for instr:   %call5.i = tail call i32 @_Z3fibi
32 ; INLINE-ALL-DAG:  Getting base profile for function: _Z5funcAi
33 ; INLINE-ALL-DAG-NEXT:   Merging context profile into base profile: _Z5funcAi
34 ; INLINE-ALL-DAG:  Getting base profile for function: _Z5funcBi
35 ; INLINE-ALL-DAG-NEXT:   Merging context profile into base profile: _Z5funcBi
36 ; INLINE-ALL-DAG-NEXT:   Found context tree root to promote: external:10 @ _Z5funcBi
37 ; INLINE-ALL-DAG-NEXT:   Context promoted to: _Z5funcBi
38 ; INLINE-ALL-DAG-NEXT:   Found context tree root to promote: externalA:17 @ _Z5funcBi
39 ; INLINE-ALL-DAG-NEXT:   Context promoted and merged to: _Z5funcBi
40 ; INLINE-ALL-DAG-NEXT:   Found context tree root to promote: main:3.1 @ _Z5funcBi
41 ; INLINE-ALL-DAG-NEXT:   Context promoted and merged to: _Z5funcBi
42 ; INLINE-ALL-DAG-NEXT:   Context promoted to: _Z5funcBi:1 @ _Z8funcLeafi
43 ; INLINE-ALL-DAG-NEXT:   Getting callee context for instr:   %call = tail call i32 @_Z8funcLeafi
44 ; INLINE-ALL-DAG-NEXT:   Callee context found: _Z5funcBi:1 @ _Z8funcLeafi
45 ; INLINE-ALL-DAG-NEXT:   Marking context profile as inlined: _Z5funcBi:1 @ _Z8funcLeafi
46 ; INLINE-ALL-DAG-NEXT:   Getting callee context for instr:   %call.i = tail call i32 @_Z3fibi
47 ; INLINE-ALL-DAG-NEXT:   Getting callee context for instr:   %call5.i = tail call i32 @_Z3fibi
48 ; INLINE-ALL:     Getting base profile for function: _Z8funcLeafi
49 ; INLINE-ALL-NEXT:   Merging context profile into base profile: _Z8funcLeafi
51 ; Test we inlined the following in top-down order and promot rest not inlined context profile into base profile
52 ;   _Z5funcAi:1 @ _Z8funcLeafi
53 ;   _Z5funcBi:1 @ _Z8funcLeafi
54 ; INLINE-HOT:      Getting base profile for function: main
55 ; INLINE-HOT-NEXT:   Merging context profile into base profile: main
56 ; INLINE-HOT-NEXT:   Found context tree root to promote: external:12 @ main
57 ; INLINE-HOT-NEXT:   Context promoted and merged to: main
58 ; INLINE-HOT-NEXT: Getting callee context for instr:   %call = tail call i32 @_Z5funcBi
59 ; INLINE-HOT-NEXT:   Callee context found: main:3.1 @ _Z5funcBi
60 ; INLINE-HOT-NEXT: Getting callee context for instr:   %call1 = tail call i32 @_Z5funcAi
61 ; INLINE-HOT-NEXT:   Callee context found: main:3 @ _Z5funcAi
62 ; INLINE-HOT-DAG: Getting base profile for function: _Z5funcAi
63 ; INLINE-HOT-DAG-NEXT:   Merging context profile into base profile: _Z5funcAi
64 ; INLINE-HOT-DAG-NEXT:   Found context tree root to promote: main:3 @ _Z5funcAi
65 ; INLINE-HOT-DAG-NEXT:   Context promoted to: _Z5funcAi
66 ; INLINE-HOT-DAG-NEXT:   Context promoted to: _Z5funcAi:1 @ _Z8funcLeafi
67 ; INLINE-HOT-DAG-NEXT:   Getting callee context for instr:   %call = tail call i32 @_Z8funcLeafi(i32 %add), !dbg !50
68 ; INLINE-HOT-DAG-NEXT:   Callee context found: _Z5funcAi:1 @ _Z8funcLeafi
69 ; INLINE-HOT-DAG-NEXT:   Marking context profile as inlined: _Z5funcAi:1 @ _Z8funcLeafi
70 ; INLINE-HOT-DAG-NEXT:   Getting callee context for instr:   %call.i = tail call i32 @_Z3fibi(i32 %tmp.i) #2, !dbg !62
71 ; INLINE-HOT-DAG-NEXT:   Getting callee context for instr:   %call5.i = tail call i32 @_Z3fibi(i32 %tmp1.i) #2, !dbg !69
72 ; INLINE-HOT-DAG: Getting base profile for function: _Z5funcBi
73 ; INLINE-HOT-DAG-NEXT:   Merging context profile into base profile: _Z5funcBi
74 ; INLINE-HOT-DAG-NEXT:   Found context tree root to promote: external:10 @ _Z5funcBi
75 ; INLINE-HOT-DAG-NEXT:   Context promoted to: _Z5funcBi
76 ; INLINE-HOT-DAG-NEXT:   Found context tree root to promote: externalA:17 @ _Z5funcBi
77 ; INLINE-HOT-DAG-NEXT:   Context promoted and merged to: _Z5funcBi
78 ; INLINE-HOT-DAG-NEXT:   Found context tree root to promote: main:3.1 @ _Z5funcBi
79 ; INLINE-HOT-DAG-NEXT:   Context promoted and merged to: _Z5funcBi
80 ; INLINE-HOT-DAG-NEXT:   Context promoted to: _Z5funcBi:1 @ _Z8funcLeafi
81 ; INLINE-HOT-DAG-NEXT:   Getting callee context for instr:   %call = tail call i32 @_Z8funcLeafi
82 ; INLINE-HOT-DAG-NEXT:   Callee context found: _Z5funcBi:1 @ _Z8funcLeafi
83 ; INLINE-HOT-DAG-NEXT:   Marking context profile as inlined: _Z5funcBi:1 @ _Z8funcLeafi
84 ; INLINE-HOT-DAG-NEXT:   Getting callee context for instr:   %call.i = tail call i32 @_Z3fibi
85 ; INLINE-HOT-DAG-NEXT:   Getting callee context for instr:   %call5.i = tail call i32 @_Z3fibi
86 ; INLINE-HOT:      Getting base profile for function: _Z8funcLeafi
87 ; INLINE-HOT-NEXT:   Merging context profile into base profile: _Z8funcLeafi
90 @factor = dso_local global i32 3, align 4, !dbg !0
92 define dso_local i32 @main() local_unnamed_addr #0 !dbg !18 {
93 entry:
94   br label %for.body, !dbg !25
96 for.cond.cleanup:                                 ; preds = %for.body
97   ret i32 %add3, !dbg !27
99 for.body:                                         ; preds = %for.body, %entry
100   %x.011 = phi i32 [ 300000, %entry ], [ %dec, %for.body ]
101   %r.010 = phi i32 [ 0, %entry ], [ %add3, %for.body ]
102   %call = tail call i32 @_Z5funcBi(i32 %x.011), !dbg !32
103   %add = add nuw nsw i32 %x.011, 1, !dbg !31
104   %call1 = tail call i32 @_Z5funcAi(i32 %add), !dbg !28
105   %add2 = add i32 %call, %r.010, !dbg !34
106   %add3 = add i32 %add2, %call1, !dbg !35
107   %dec = add nsw i32 %x.011, -1, !dbg !36
108   %cmp = icmp eq i32 %x.011, 0, !dbg !38
109   br i1 %cmp, label %for.cond.cleanup, label %for.body, !dbg !25
112 define dso_local i32 @_Z5funcAi(i32 %x) local_unnamed_addr #1 !dbg !40 {
113 entry:
114   %add = add nsw i32 %x, 100000, !dbg !44
115   %call = tail call i32 @_Z8funcLeafi(i32 %add), !dbg !45
116   ret i32 %call, !dbg !46
119 define dso_local i32 @_Z8funcLeafi(i32 %x) local_unnamed_addr #1 !dbg !54 {
120 entry:
121   %cmp = icmp sgt i32 %x, 0, !dbg !57
122   br i1 %cmp, label %while.body, label %while.cond2.preheader, !dbg !59
124 while.cond2.preheader:                            ; preds = %entry
125   %cmp313 = icmp slt i32 %x, 0, !dbg !60
126   br i1 %cmp313, label %while.body4, label %if.end, !dbg !63
128 while.body:                                       ; preds = %while.body, %entry
129   %x.addr.016 = phi i32 [ %sub, %while.body ], [ %x, %entry ]
130   %tmp = load volatile i32, ptr @factor, align 4, !dbg !64
131   %call = tail call i32 @_Z3fibi(i32 %tmp), !dbg !67
132   %sub = sub nsw i32 %x.addr.016, %call, !dbg !68
133   %cmp1 = icmp sgt i32 %sub, 0, !dbg !69
134   br i1 %cmp1, label %while.body, label %if.end, !dbg !71
136 while.body4:                                      ; preds = %while.body4, %while.cond2.preheader
137   %x.addr.114 = phi i32 [ %add, %while.body4 ], [ %x, %while.cond2.preheader ]
138   %tmp1 = load volatile i32, ptr @factor, align 4, !dbg !72
139   %call5 = tail call i32 @_Z3fibi(i32 %tmp1), !dbg !74
140   %add = add nsw i32 %call5, %x.addr.114, !dbg !75
141   %cmp3 = icmp slt i32 %add, 0, !dbg !60
142   br i1 %cmp3, label %while.body4, label %if.end, !dbg !63
144 if.end:                                           ; preds = %while.body4, %while.body, %while.cond2.preheader
145   %x.addr.2 = phi i32 [ 0, %while.cond2.preheader ], [ %sub, %while.body ], [ %add, %while.body4 ]
146   ret i32 %x.addr.2, !dbg !76
149 define dso_local i32 @_Z5funcBi(i32 %x) local_unnamed_addr #0 !dbg !47 {
150 entry:
151   %sub = add nsw i32 %x, -100000, !dbg !51
152   %call = tail call i32 @_Z8funcLeafi(i32 %sub), !dbg !52
153   ret i32 %call, !dbg !53
156 declare i32 @_Z3fibi(i32)
158 attributes #0 = { nofree noinline norecurse nounwind uwtable "correctly-rounded-divide-sqrt-fp-math"="false" "disable-tail-calls"="false" "frame-pointer"="none" "less-precise-fpmad"="false" "min-legal-vector-width"="0" "no-infs-fp-math"="false" "no-jump-tables"="false" "no-nans-fp-math"="false" "no-signed-zeros-fp-math"="false" "no-trapping-math"="false" "stack-protector-buffer-size"="8" "target-cpu"="x86-64" "target-features"="+cx8,+fxsr,+mmx,+sse,+sse2,+x87" "unsafe-fp-math"="false" "use-soft-float"="false" "use-sample-profile" }
159 attributes #1 = { nofree norecurse nounwind uwtable "correctly-rounded-divide-sqrt-fp-math"="false" "disable-tail-calls"="false" "frame-pointer"="none" "less-precise-fpmad"="false" "min-legal-vector-width"="0" "no-infs-fp-math"="false" "no-jump-tables"="false" "no-nans-fp-math"="false" "no-signed-zeros-fp-math"="false" "no-trapping-math"="false" "stack-protector-buffer-size"="8" "target-cpu"="x86-64" "target-features"="+cx8,+fxsr,+mmx,+sse,+sse2,+x87" "unsafe-fp-math"="false" "use-soft-float"="false" "use-sample-profile" }
161 !llvm.dbg.cu = !{!2}
162 !llvm.module.flags = !{!14, !15, !16}
163 !llvm.ident = !{!17}
165 !0 = !DIGlobalVariableExpression(var: !1, expr: !DIExpression())
166 !1 = distinct !DIGlobalVariable(name: "factor", scope: !2, file: !3, line: 21, type: !13, isLocal: false, isDefinition: true)
167 !2 = distinct !DICompileUnit(language: DW_LANG_C_plus_plus_14, file: !3, producer: "clang version 11.0.0", isOptimized: true, runtimeVersion: 0, emissionKind: FullDebug, enums: !4, retainedTypes: !5, globals: !12, splitDebugInlining: false, debugInfoForProfiling: true, nameTableKind: None)
168 !3 = !DIFile(filename: "merged.cpp", directory: "/local/autofdo")
169 !4 = !{}
170 !5 = !{!6, !10, !11}
171 !6 = !DISubprogram(name: "funcA", linkageName: "_Z5funcAi", scope: !3, file: !3, line: 6, type: !7, flags: DIFlagPrototyped, spFlags: DISPFlagOptimized, retainedNodes: !4)
172 !7 = !DISubroutineType(types: !8)
173 !8 = !{!9, !9}
174 !9 = !DIBasicType(name: "int", size: 32, encoding: DW_ATE_signed)
175 !10 = !DISubprogram(name: "funcB", linkageName: "_Z5funcBi", scope: !3, file: !3, line: 7, type: !7, flags: DIFlagPrototyped, spFlags: DISPFlagOptimized, retainedNodes: !4)
176 !11 = !DISubprogram(name: "funcLeaf", linkageName: "_Z8funcLeafi", scope: !3, file: !3, line: 22, type: !7, flags: DIFlagPrototyped, spFlags: DISPFlagOptimized, retainedNodes: !4)
177 !12 = !{!0}
178 !13 = !DIDerivedType(tag: DW_TAG_volatile_type, baseType: !9)
179 !14 = !{i32 7, !"Dwarf Version", i32 4}
180 !15 = !{i32 2, !"Debug Info Version", i32 3}
181 !16 = !{i32 1, !"wchar_size", i32 4}
182 !17 = !{!"clang version 11.0.0"}
183 !18 = distinct !DISubprogram(name: "main", scope: !3, file: !3, line: 11, type: !19, scopeLine: 11, flags: DIFlagPrototyped | DIFlagAllCallsDescribed, spFlags: DISPFlagDefinition | DISPFlagOptimized, unit: !2, retainedNodes: !21)
184 !19 = !DISubroutineType(types: !20)
185 !20 = !{!9}
186 !21 = !{!22, !23}
187 !22 = !DILocalVariable(name: "r", scope: !18, file: !3, line: 12, type: !9)
188 !23 = !DILocalVariable(name: "x", scope: !24, file: !3, line: 13, type: !9)
189 !24 = distinct !DILexicalBlock(scope: !18, file: !3, line: 13, column: 3)
190 !25 = !DILocation(line: 13, column: 3, scope: !26)
191 !26 = !DILexicalBlockFile(scope: !24, file: !3, discriminator: 2)
192 !27 = !DILocation(line: 17, column: 3, scope: !18)
193 !28 = !DILocation(line: 14, column: 10, scope: !29)
194 !29 = distinct !DILexicalBlock(scope: !30, file: !3, line: 13, column: 37)
195 !30 = distinct !DILexicalBlock(scope: !24, file: !3, line: 13, column: 3)
196 !31 = !DILocation(line: 14, column: 29, scope: !29)
197 !32 = !DILocation(line: 14, column: 21, scope: !33)
198 !33 = !DILexicalBlockFile(scope: !29, file: !3, discriminator: 2)
199 !34 = !DILocation(line: 14, column: 19, scope: !29)
200 !35 = !DILocation(line: 14, column: 7, scope: !29)
201 !36 = !DILocation(line: 13, column: 33, scope: !37)
202 !37 = !DILexicalBlockFile(scope: !30, file: !3, discriminator: 6)
203 !38 = !DILocation(line: 13, column: 26, scope: !39)
204 !39 = !DILexicalBlockFile(scope: !30, file: !3, discriminator: 2)
205 !40 = distinct !DISubprogram(name: "funcA", linkageName: "_Z5funcAi", scope: !3, file: !3, line: 26, type: !7, scopeLine: 26, flags: DIFlagPrototyped | DIFlagAllCallsDescribed, spFlags: DISPFlagDefinition | DISPFlagOptimized, unit: !2)
206 !44 = !DILocation(line: 27, column: 22, scope: !40)
207 !45 = !DILocation(line: 27, column: 11, scope: !40)
208 !46 = !DILocation(line: 29, column: 3, scope: !40)
209 !47 = distinct !DISubprogram(name: "funcB", linkageName: "_Z5funcBi", scope: !3, file: !3, line: 32, type: !7, scopeLine: 32, flags: DIFlagPrototyped | DIFlagAllCallsDescribed, spFlags: DISPFlagDefinition | DISPFlagOptimized, unit: !2)
210 !51 = !DILocation(line: 33, column: 22, scope: !47)
211 !52 = !DILocation(line: 33, column: 11, scope: !47)
212 !53 = !DILocation(line: 35, column: 3, scope: !47)
213 !54 = distinct !DISubprogram(name: "funcLeaf", linkageName: "_Z8funcLeafi", scope: !3, file: !3, line: 48, type: !7, scopeLine: 48, flags: DIFlagPrototyped | DIFlagAllCallsDescribed, spFlags: DISPFlagDefinition | DISPFlagOptimized, unit: !2)
214 !57 = !DILocation(line: 49, column: 9, scope: !58)
215 !58 = distinct !DILexicalBlock(scope: !54, file: !3, line: 49, column: 7)
216 !59 = !DILocation(line: 49, column: 7, scope: !54)
217 !60 = !DILocation(line: 58, column: 14, scope: !61)
218 !61 = !DILexicalBlockFile(scope: !62, file: !3, discriminator: 2)
219 !62 = distinct !DILexicalBlock(scope: !58, file: !3, line: 56, column: 8)
220 !63 = !DILocation(line: 58, column: 5, scope: !61)
221 !64 = !DILocation(line: 52, column: 16, scope: !65)
222 !65 = distinct !DILexicalBlock(scope: !66, file: !3, line: 51, column: 19)
223 !66 = distinct !DILexicalBlock(scope: !58, file: !3, line: 49, column: 14)
224 !67 = !DILocation(line: 52, column: 12, scope: !65)
225 !68 = !DILocation(line: 52, column: 9, scope: !65)
226 !69 = !DILocation(line: 51, column: 14, scope: !70)
227 !70 = !DILexicalBlockFile(scope: !66, file: !3, discriminator: 2)
228 !71 = !DILocation(line: 51, column: 5, scope: !70)
229 !72 = !DILocation(line: 59, column: 16, scope: !73)
230 !73 = distinct !DILexicalBlock(scope: !62, file: !3, line: 58, column: 19)
231 !74 = !DILocation(line: 59, column: 12, scope: !73)
232 !75 = !DILocation(line: 59, column: 9, scope: !73)
233 !76 = !DILocation(line: 63, column: 3, scope: !54)