1 ; Like frame-05.ll, but with i64s rather than i32s. Internally this
2 ; uses a different register class, but the set of saved and restored
3 ; registers should be the same.
5 ; RUN: llc < %s -mtriple=s390x-linux-gnu | FileCheck %s
7 ; This function should require all GPRs, but no other spill slots. The caller
8 ; allocates room for the GPR save slots, so we shouldn't need to allocate any
11 ; Use a different address for the final store, so that we can check that
12 ; %r15 isn't referenced again until after that.
13 define void @f1(ptr %ptr) {
15 ; CHECK: stmg %r6, %r15, 48(%r15)
17 ; CHECK: .cfi_offset %r6, -112
18 ; CHECK: .cfi_offset %r7, -104
19 ; CHECK: .cfi_offset %r8, -96
20 ; CHECK: .cfi_offset %r9, -88
21 ; CHECK: .cfi_offset %r10, -80
22 ; CHECK: .cfi_offset %r11, -72
23 ; CHECK: .cfi_offset %r12, -64
24 ; CHECK: .cfi_offset %r13, -56
25 ; CHECK: .cfi_offset %r14, -48
26 ; CHECK: .cfi_offset %r15, -40
27 ; ...main function body...
29 ; CHECK: stg {{.*}}, 8(%r2)
30 ; CHECK: lmg %r6, %r15, 48(%r15)
32 %l0 = load volatile i64, ptr %ptr
33 %l1 = load volatile i64, ptr %ptr
34 %l3 = load volatile i64, ptr %ptr
35 %l4 = load volatile i64, ptr %ptr
36 %l5 = load volatile i64, ptr %ptr
37 %l6 = load volatile i64, ptr %ptr
38 %l7 = load volatile i64, ptr %ptr
39 %l8 = load volatile i64, ptr %ptr
40 %l9 = load volatile i64, ptr %ptr
41 %l10 = load volatile i64, ptr %ptr
42 %l11 = load volatile i64, ptr %ptr
43 %l12 = load volatile i64, ptr %ptr
44 %l13 = load volatile i64, ptr %ptr
45 %l14 = load volatile i64, ptr %ptr
46 %add0 = add i64 %l0, %l0
47 %add1 = add i64 %l1, %add0
48 %add3 = add i64 %l3, %add1
49 %add4 = add i64 %l4, %add3
50 %add5 = add i64 %l5, %add4
51 %add6 = add i64 %l6, %add5
52 %add7 = add i64 %l7, %add6
53 %add8 = add i64 %l8, %add7
54 %add9 = add i64 %l9, %add8
55 %add10 = add i64 %l10, %add9
56 %add11 = add i64 %l11, %add10
57 %add12 = add i64 %l12, %add11
58 %add13 = add i64 %l13, %add12
59 %add14 = add i64 %l14, %add13
60 store volatile i64 %add0, ptr %ptr
61 store volatile i64 %add1, ptr %ptr
62 store volatile i64 %add3, ptr %ptr
63 store volatile i64 %add4, ptr %ptr
64 store volatile i64 %add5, ptr %ptr
65 store volatile i64 %add6, ptr %ptr
66 store volatile i64 %add7, ptr %ptr
67 store volatile i64 %add8, ptr %ptr
68 store volatile i64 %add9, ptr %ptr
69 store volatile i64 %add10, ptr %ptr
70 store volatile i64 %add11, ptr %ptr
71 store volatile i64 %add12, ptr %ptr
72 store volatile i64 %add13, ptr %ptr
73 %final = getelementptr i64, ptr %ptr, i64 1
74 store volatile i64 %add14, ptr %final
78 ; Like f1, but requires one fewer GPR. We allocate the call-saved GPRs
79 ; from %r14 down, so that the STMG/LMG sequences aren't any longer than
81 define void @f2(ptr %ptr) {
83 ; CHECK: stmg %r7, %r15, 56(%r15)
85 ; CHECK: .cfi_offset %r7, -104
86 ; CHECK: .cfi_offset %r8, -96
87 ; CHECK: .cfi_offset %r9, -88
88 ; CHECK: .cfi_offset %r10, -80
89 ; CHECK: .cfi_offset %r11, -72
90 ; CHECK: .cfi_offset %r12, -64
91 ; CHECK: .cfi_offset %r13, -56
92 ; CHECK: .cfi_offset %r14, -48
93 ; CHECK: .cfi_offset %r15, -40
94 ; ...main function body...
97 ; CHECK: stg {{.*}}, 8(%r2)
98 ; CHECK: lmg %r7, %r15, 56(%r15)
100 %l0 = load volatile i64, ptr %ptr
101 %l1 = load volatile i64, ptr %ptr
102 %l3 = load volatile i64, ptr %ptr
103 %l4 = load volatile i64, ptr %ptr
104 %l5 = load volatile i64, ptr %ptr
105 %l7 = load volatile i64, ptr %ptr
106 %l8 = load volatile i64, ptr %ptr
107 %l9 = load volatile i64, ptr %ptr
108 %l10 = load volatile i64, ptr %ptr
109 %l11 = load volatile i64, ptr %ptr
110 %l12 = load volatile i64, ptr %ptr
111 %l13 = load volatile i64, ptr %ptr
112 %l14 = load volatile i64, ptr %ptr
113 %add0 = add i64 %l0, %l0
114 %add1 = add i64 %l1, %add0
115 %add3 = add i64 %l3, %add1
116 %add4 = add i64 %l4, %add3
117 %add5 = add i64 %l5, %add4
118 %add7 = add i64 %l7, %add5
119 %add8 = add i64 %l8, %add7
120 %add9 = add i64 %l9, %add8
121 %add10 = add i64 %l10, %add9
122 %add11 = add i64 %l11, %add10
123 %add12 = add i64 %l12, %add11
124 %add13 = add i64 %l13, %add12
125 %add14 = add i64 %l14, %add13
126 store volatile i64 %add0, ptr %ptr
127 store volatile i64 %add1, ptr %ptr
128 store volatile i64 %add3, ptr %ptr
129 store volatile i64 %add4, ptr %ptr
130 store volatile i64 %add5, ptr %ptr
131 store volatile i64 %add7, ptr %ptr
132 store volatile i64 %add8, ptr %ptr
133 store volatile i64 %add9, ptr %ptr
134 store volatile i64 %add10, ptr %ptr
135 store volatile i64 %add11, ptr %ptr
136 store volatile i64 %add12, ptr %ptr
137 store volatile i64 %add13, ptr %ptr
138 %final = getelementptr i64, ptr %ptr, i64 1
139 store volatile i64 %add14, ptr %final
143 ; Like f1, but only needs one call-saved GPR, which ought to be %r14.
144 define void @f3(ptr %ptr) {
146 ; CHECK: stmg %r14, %r15, 112(%r15)
148 ; CHECK: .cfi_offset %r14, -48
149 ; CHECK: .cfi_offset %r15, -40
150 ; ...main function body...
160 ; CHECK: stg {{.*}}, 8(%r2)
161 ; CHECK: lmg %r14, %r15, 112(%r15)
163 %l0 = load volatile i64, ptr %ptr
164 %l1 = load volatile i64, ptr %ptr
165 %l3 = load volatile i64, ptr %ptr
166 %l4 = load volatile i64, ptr %ptr
167 %l5 = load volatile i64, ptr %ptr
168 %l14 = load volatile i64, ptr %ptr
169 %add0 = add i64 %l0, %l0
170 %add1 = add i64 %l1, %add0
171 %add3 = add i64 %l3, %add1
172 %add4 = add i64 %l4, %add3
173 %add5 = add i64 %l5, %add4
174 %add14 = add i64 %l14, %add5
175 store volatile i64 %add0, ptr %ptr
176 store volatile i64 %add1, ptr %ptr
177 store volatile i64 %add3, ptr %ptr
178 store volatile i64 %add4, ptr %ptr
179 store volatile i64 %add5, ptr %ptr
180 %final = getelementptr i64, ptr %ptr, i64 1
181 store volatile i64 %add14, ptr %final
185 ; This function should use all call-clobbered GPRs but no call-saved ones.
186 ; It shouldn't need to touch the stack at all.
187 define void @f4(ptr %ptr) {
199 %l0 = load volatile i64, ptr %ptr
200 %l1 = load volatile i64, ptr %ptr
201 %l3 = load volatile i64, ptr %ptr
202 %l4 = load volatile i64, ptr %ptr
203 %l5 = load volatile i64, ptr %ptr
204 %add0 = add i64 %l0, %l0
205 %add1 = add i64 %l1, %add0
206 %add3 = add i64 %l3, %add1
207 %add4 = add i64 %l4, %add3
208 %add5 = add i64 %l5, %add4
209 store volatile i64 %add0, ptr %ptr
210 store volatile i64 %add1, ptr %ptr
211 store volatile i64 %add3, ptr %ptr
212 store volatile i64 %add4, ptr %ptr
213 %final = getelementptr i64, ptr %ptr, i64 1
214 store volatile i64 %add5, ptr %final