1 ; Like frame-05.ll, but with i64s rather than i32s. Internally this
2 ; uses a different register class, but the set of saved and restored
3 ; registers should be the same.
5 ; RUN: llc < %s -mtriple=s390x-linux-gnu | FileCheck %s
7 ; This function should require all GPRs, but no other spill slots. The caller
8 ; allocates room for the GPR save slots, so we shouldn't need to allocate any
11 ; Use a different address for the final store, so that we can check that
12 ; %r15 isn't referenced again until after that.
13 define void @f1(i64 *%ptr) {
15 ; CHECK: stmg %r6, %r15, 48(%r15)
17 ; CHECK: .cfi_offset %r6, -112
18 ; CHECK: .cfi_offset %r7, -104
19 ; CHECK: .cfi_offset %r8, -96
20 ; CHECK: .cfi_offset %r9, -88
21 ; CHECK: .cfi_offset %r10, -80
22 ; CHECK: .cfi_offset %r11, -72
23 ; CHECK: .cfi_offset %r12, -64
24 ; CHECK: .cfi_offset %r13, -56
25 ; CHECK: .cfi_offset %r14, -48
26 ; CHECK: .cfi_offset %r15, -40
27 ; ...main function body...
29 ; CHECK: stg {{.*}}, 8(%r2)
30 ; CHECK: lmg %r6, %r15, 48(%r15)
32 %l0 = load volatile i64, i64 *%ptr
33 %l1 = load volatile i64, i64 *%ptr
34 %l3 = load volatile i64, i64 *%ptr
35 %l4 = load volatile i64, i64 *%ptr
36 %l5 = load volatile i64, i64 *%ptr
37 %l6 = load volatile i64, i64 *%ptr
38 %l7 = load volatile i64, i64 *%ptr
39 %l8 = load volatile i64, i64 *%ptr
40 %l9 = load volatile i64, i64 *%ptr
41 %l10 = load volatile i64, i64 *%ptr
42 %l11 = load volatile i64, i64 *%ptr
43 %l12 = load volatile i64, i64 *%ptr
44 %l13 = load volatile i64, i64 *%ptr
45 %l14 = load volatile i64, i64 *%ptr
46 %add0 = add i64 %l0, %l0
47 %add1 = add i64 %l1, %add0
48 %add3 = add i64 %l3, %add1
49 %add4 = add i64 %l4, %add3
50 %add5 = add i64 %l5, %add4
51 %add6 = add i64 %l6, %add5
52 %add7 = add i64 %l7, %add6
53 %add8 = add i64 %l8, %add7
54 %add9 = add i64 %l9, %add8
55 %add10 = add i64 %l10, %add9
56 %add11 = add i64 %l11, %add10
57 %add12 = add i64 %l12, %add11
58 %add13 = add i64 %l13, %add12
59 %add14 = add i64 %l14, %add13
60 store volatile i64 %add0, i64 *%ptr
61 store volatile i64 %add1, i64 *%ptr
62 store volatile i64 %add3, i64 *%ptr
63 store volatile i64 %add4, i64 *%ptr
64 store volatile i64 %add5, i64 *%ptr
65 store volatile i64 %add6, i64 *%ptr
66 store volatile i64 %add7, i64 *%ptr
67 store volatile i64 %add8, i64 *%ptr
68 store volatile i64 %add9, i64 *%ptr
69 store volatile i64 %add10, i64 *%ptr
70 store volatile i64 %add11, i64 *%ptr
71 store volatile i64 %add12, i64 *%ptr
72 store volatile i64 %add13, i64 *%ptr
73 %final = getelementptr i64, i64 *%ptr, i64 1
74 store volatile i64 %add14, i64 *%final
78 ; Like f1, but requires one fewer GPR. We allocate the call-saved GPRs
79 ; from %r14 down, so that the STMG/LMG sequences aren't any longer than
81 define void @f2(i64 *%ptr) {
83 ; CHECK: stmg %r7, %r15, 56(%r15)
85 ; CHECK: .cfi_offset %r7, -104
86 ; CHECK: .cfi_offset %r8, -96
87 ; CHECK: .cfi_offset %r9, -88
88 ; CHECK: .cfi_offset %r10, -80
89 ; CHECK: .cfi_offset %r11, -72
90 ; CHECK: .cfi_offset %r12, -64
91 ; CHECK: .cfi_offset %r13, -56
92 ; CHECK: .cfi_offset %r14, -48
93 ; CHECK: .cfi_offset %r15, -40
94 ; ...main function body...
97 ; CHECK: stg {{.*}}, 8(%r2)
98 ; CHECK: lmg %r7, %r15, 56(%r15)
100 %l0 = load volatile i64, i64 *%ptr
101 %l1 = load volatile i64, i64 *%ptr
102 %l3 = load volatile i64, i64 *%ptr
103 %l4 = load volatile i64, i64 *%ptr
104 %l5 = load volatile i64, i64 *%ptr
105 %l7 = load volatile i64, i64 *%ptr
106 %l8 = load volatile i64, i64 *%ptr
107 %l9 = load volatile i64, i64 *%ptr
108 %l10 = load volatile i64, i64 *%ptr
109 %l11 = load volatile i64, i64 *%ptr
110 %l12 = load volatile i64, i64 *%ptr
111 %l13 = load volatile i64, i64 *%ptr
112 %l14 = load volatile i64, i64 *%ptr
113 %add0 = add i64 %l0, %l0
114 %add1 = add i64 %l1, %add0
115 %add3 = add i64 %l3, %add1
116 %add4 = add i64 %l4, %add3
117 %add5 = add i64 %l5, %add4
118 %add7 = add i64 %l7, %add5
119 %add8 = add i64 %l8, %add7
120 %add9 = add i64 %l9, %add8
121 %add10 = add i64 %l10, %add9
122 %add11 = add i64 %l11, %add10
123 %add12 = add i64 %l12, %add11
124 %add13 = add i64 %l13, %add12
125 %add14 = add i64 %l14, %add13
126 store volatile i64 %add0, i64 *%ptr
127 store volatile i64 %add1, i64 *%ptr
128 store volatile i64 %add3, i64 *%ptr
129 store volatile i64 %add4, i64 *%ptr
130 store volatile i64 %add5, i64 *%ptr
131 store volatile i64 %add7, i64 *%ptr
132 store volatile i64 %add8, i64 *%ptr
133 store volatile i64 %add9, i64 *%ptr
134 store volatile i64 %add10, i64 *%ptr
135 store volatile i64 %add11, i64 *%ptr
136 store volatile i64 %add12, i64 *%ptr
137 store volatile i64 %add13, i64 *%ptr
138 %final = getelementptr i64, i64 *%ptr, i64 1
139 store volatile i64 %add14, i64 *%final
143 ; Like f1, but only needs one call-saved GPR, which ought to be %r14.
144 define void @f3(i64 *%ptr) {
146 ; CHECK: stmg %r14, %r15, 112(%r15)
148 ; CHECK: .cfi_offset %r14, -48
149 ; CHECK: .cfi_offset %r15, -40
150 ; ...main function body...
160 ; CHECK: stg {{.*}}, 8(%r2)
161 ; CHECK: lmg %r14, %r15, 112(%r15)
163 %l0 = load volatile i64, i64 *%ptr
164 %l1 = load volatile i64, i64 *%ptr
165 %l3 = load volatile i64, i64 *%ptr
166 %l4 = load volatile i64, i64 *%ptr
167 %l5 = load volatile i64, i64 *%ptr
168 %l14 = load volatile i64, i64 *%ptr
169 %add0 = add i64 %l0, %l0
170 %add1 = add i64 %l1, %add0
171 %add3 = add i64 %l3, %add1
172 %add4 = add i64 %l4, %add3
173 %add5 = add i64 %l5, %add4
174 %add14 = add i64 %l14, %add5
175 store volatile i64 %add0, i64 *%ptr
176 store volatile i64 %add1, i64 *%ptr
177 store volatile i64 %add3, i64 *%ptr
178 store volatile i64 %add4, i64 *%ptr
179 store volatile i64 %add5, i64 *%ptr
180 %final = getelementptr i64, i64 *%ptr, i64 1
181 store volatile i64 %add14, i64 *%final
185 ; This function should use all call-clobbered GPRs but no call-saved ones.
186 ; It shouldn't need to touch the stack at all.
187 define void @f4(i64 *%ptr) {
199 %l0 = load volatile i64, i64 *%ptr
200 %l1 = load volatile i64, i64 *%ptr
201 %l3 = load volatile i64, i64 *%ptr
202 %l4 = load volatile i64, i64 *%ptr
203 %l5 = load volatile i64, i64 *%ptr
204 %add0 = add i64 %l0, %l0
205 %add1 = add i64 %l1, %add0
206 %add3 = add i64 %l3, %add1
207 %add4 = add i64 %l4, %add3
208 %add5 = add i64 %l5, %add4
209 store volatile i64 %add0, i64 *%ptr
210 store volatile i64 %add1, i64 *%ptr
211 store volatile i64 %add3, i64 *%ptr
212 store volatile i64 %add4, i64 *%ptr
213 %final = getelementptr i64, i64 *%ptr, i64 1
214 store volatile i64 %add5, i64 *%final