Run DCE after a LoopFlatten test to reduce spurious output [nfc]
[llvm-project.git] / llvm / test / CodeGen / RISCV / calling-conv-ilp32d.ll
blob4897170a82f2e2a03b35ea8dece9f4cf73e16b60
1 ; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
2 ; RUN: llc -mtriple=riscv32 -verify-machineinstrs -mattr=+d \
3 ; RUN:     -target-abi ilp32d < %s \
4 ; RUN:   | FileCheck -check-prefix=RV32-ILP32D %s
6 ; This file contains tests that will have differing output for the ilp32 and
7 ; ilp32f ABIs.
9 define i32 @callee_double_in_fpr(i32 %a, double %b) nounwind {
10 ; RV32-ILP32D-LABEL: callee_double_in_fpr:
11 ; RV32-ILP32D:       # %bb.0:
12 ; RV32-ILP32D-NEXT:    fcvt.w.d a1, fa0, rtz
13 ; RV32-ILP32D-NEXT:    add a0, a0, a1
14 ; RV32-ILP32D-NEXT:    ret
15   %b_fptosi = fptosi double %b to i32
16   %1 = add i32 %a, %b_fptosi
17   ret i32 %1
20 define i32 @caller_double_in_fpr() nounwind {
21 ; RV32-ILP32D-LABEL: caller_double_in_fpr:
22 ; RV32-ILP32D:       # %bb.0:
23 ; RV32-ILP32D-NEXT:    addi sp, sp, -16
24 ; RV32-ILP32D-NEXT:    sw ra, 12(sp) # 4-byte Folded Spill
25 ; RV32-ILP32D-NEXT:    lui a0, %hi(.LCPI1_0)
26 ; RV32-ILP32D-NEXT:    fld fa0, %lo(.LCPI1_0)(a0)
27 ; RV32-ILP32D-NEXT:    li a0, 1
28 ; RV32-ILP32D-NEXT:    call callee_double_in_fpr@plt
29 ; RV32-ILP32D-NEXT:    lw ra, 12(sp) # 4-byte Folded Reload
30 ; RV32-ILP32D-NEXT:    addi sp, sp, 16
31 ; RV32-ILP32D-NEXT:    ret
32   %1 = call i32 @callee_double_in_fpr(i32 1, double 2.0)
33   ret i32 %1
36 ; Must keep define on a single line due to an update_llc_test_checks.py limitation
37 define i32 @callee_double_in_fpr_exhausted_gprs(i64 %a, i64 %b, i64 %c, i64 %d, i32 %e, double %f) nounwind {
38 ; RV32-ILP32D-LABEL: callee_double_in_fpr_exhausted_gprs:
39 ; RV32-ILP32D:       # %bb.0:
40 ; RV32-ILP32D-NEXT:    lw a0, 0(sp)
41 ; RV32-ILP32D-NEXT:    fcvt.w.d a1, fa0, rtz
42 ; RV32-ILP32D-NEXT:    add a0, a0, a1
43 ; RV32-ILP32D-NEXT:    ret
44   %f_fptosi = fptosi double %f to i32
45   %1 = add i32 %e, %f_fptosi
46   ret i32 %1
49 define i32 @caller_double_in_fpr_exhausted_gprs() nounwind {
50 ; RV32-ILP32D-LABEL: caller_double_in_fpr_exhausted_gprs:
51 ; RV32-ILP32D:       # %bb.0:
52 ; RV32-ILP32D-NEXT:    addi sp, sp, -16
53 ; RV32-ILP32D-NEXT:    sw ra, 12(sp) # 4-byte Folded Spill
54 ; RV32-ILP32D-NEXT:    li a1, 5
55 ; RV32-ILP32D-NEXT:    lui a0, %hi(.LCPI3_0)
56 ; RV32-ILP32D-NEXT:    fld fa0, %lo(.LCPI3_0)(a0)
57 ; RV32-ILP32D-NEXT:    li a0, 1
58 ; RV32-ILP32D-NEXT:    li a2, 2
59 ; RV32-ILP32D-NEXT:    li a4, 3
60 ; RV32-ILP32D-NEXT:    li a6, 4
61 ; RV32-ILP32D-NEXT:    sw a1, 0(sp)
62 ; RV32-ILP32D-NEXT:    li a1, 0
63 ; RV32-ILP32D-NEXT:    li a3, 0
64 ; RV32-ILP32D-NEXT:    li a5, 0
65 ; RV32-ILP32D-NEXT:    li a7, 0
66 ; RV32-ILP32D-NEXT:    call callee_double_in_fpr_exhausted_gprs@plt
67 ; RV32-ILP32D-NEXT:    lw ra, 12(sp) # 4-byte Folded Reload
68 ; RV32-ILP32D-NEXT:    addi sp, sp, 16
69 ; RV32-ILP32D-NEXT:    ret
70   %1 = call i32 @callee_double_in_fpr_exhausted_gprs(
71       i64 1, i64 2, i64 3, i64 4, i32 5, double 6.0)
72   ret i32 %1
75 ; Must keep define on a single line due to an update_llc_test_checks.py limitation
76 define i32 @callee_double_in_gpr_exhausted_fprs(double %a, double %b, double %c, double %d, double %e, double %f, double %g, double %h, double %i) nounwind {
77 ; RV32-ILP32D-LABEL: callee_double_in_gpr_exhausted_fprs:
78 ; RV32-ILP32D:       # %bb.0:
79 ; RV32-ILP32D-NEXT:    addi sp, sp, -16
80 ; RV32-ILP32D-NEXT:    sw a0, 8(sp)
81 ; RV32-ILP32D-NEXT:    sw a1, 12(sp)
82 ; RV32-ILP32D-NEXT:    fld fa5, 8(sp)
83 ; RV32-ILP32D-NEXT:    fcvt.w.d a0, fa7, rtz
84 ; RV32-ILP32D-NEXT:    fcvt.w.d a1, fa5, rtz
85 ; RV32-ILP32D-NEXT:    add a0, a0, a1
86 ; RV32-ILP32D-NEXT:    addi sp, sp, 16
87 ; RV32-ILP32D-NEXT:    ret
88   %h_fptosi = fptosi double %h to i32
89   %i_fptosi = fptosi double %i to i32
90   %1 = add i32 %h_fptosi, %i_fptosi
91   ret i32 %1
94 define i32 @caller_double_in_gpr_exhausted_fprs() nounwind {
95 ; RV32-ILP32D-LABEL: caller_double_in_gpr_exhausted_fprs:
96 ; RV32-ILP32D:       # %bb.0:
97 ; RV32-ILP32D-NEXT:    addi sp, sp, -16
98 ; RV32-ILP32D-NEXT:    sw ra, 12(sp) # 4-byte Folded Spill
99 ; RV32-ILP32D-NEXT:    lui a0, %hi(.LCPI5_0)
100 ; RV32-ILP32D-NEXT:    fld fa0, %lo(.LCPI5_0)(a0)
101 ; RV32-ILP32D-NEXT:    lui a0, %hi(.LCPI5_1)
102 ; RV32-ILP32D-NEXT:    fld fa1, %lo(.LCPI5_1)(a0)
103 ; RV32-ILP32D-NEXT:    lui a0, %hi(.LCPI5_2)
104 ; RV32-ILP32D-NEXT:    fld fa2, %lo(.LCPI5_2)(a0)
105 ; RV32-ILP32D-NEXT:    lui a0, %hi(.LCPI5_3)
106 ; RV32-ILP32D-NEXT:    fld fa3, %lo(.LCPI5_3)(a0)
107 ; RV32-ILP32D-NEXT:    lui a0, %hi(.LCPI5_4)
108 ; RV32-ILP32D-NEXT:    fld fa4, %lo(.LCPI5_4)(a0)
109 ; RV32-ILP32D-NEXT:    lui a0, %hi(.LCPI5_5)
110 ; RV32-ILP32D-NEXT:    fld fa5, %lo(.LCPI5_5)(a0)
111 ; RV32-ILP32D-NEXT:    lui a0, %hi(.LCPI5_6)
112 ; RV32-ILP32D-NEXT:    fld fa6, %lo(.LCPI5_6)(a0)
113 ; RV32-ILP32D-NEXT:    lui a0, %hi(.LCPI5_7)
114 ; RV32-ILP32D-NEXT:    fld fa7, %lo(.LCPI5_7)(a0)
115 ; RV32-ILP32D-NEXT:    lui a1, 262688
116 ; RV32-ILP32D-NEXT:    li a0, 0
117 ; RV32-ILP32D-NEXT:    call callee_double_in_gpr_exhausted_fprs@plt
118 ; RV32-ILP32D-NEXT:    lw ra, 12(sp) # 4-byte Folded Reload
119 ; RV32-ILP32D-NEXT:    addi sp, sp, 16
120 ; RV32-ILP32D-NEXT:    ret
121   %1 = call i32 @callee_double_in_gpr_exhausted_fprs(
122       double 1.0, double 2.0, double 3.0, double 4.0, double 5.0, double 6.0,
123       double 7.0, double 8.0, double 9.0)
124   ret i32 %1
127 ; Must keep define on a single line due to an update_llc_test_checks.py limitation
128 define i32 @callee_double_in_gpr_and_stack_almost_exhausted_gprs_fprs(i64 %a, double %b, i64 %c, double %d, i64 %e, double %f, i32 %g, double %h, double %i, double %j, double %k, double %l, double %m) nounwind {
129 ; RV32-ILP32D-LABEL: callee_double_in_gpr_and_stack_almost_exhausted_gprs_fprs:
130 ; RV32-ILP32D:       # %bb.0:
131 ; RV32-ILP32D-NEXT:    addi sp, sp, -16
132 ; RV32-ILP32D-NEXT:    lw a0, 16(sp)
133 ; RV32-ILP32D-NEXT:    sw a7, 8(sp)
134 ; RV32-ILP32D-NEXT:    sw a0, 12(sp)
135 ; RV32-ILP32D-NEXT:    fld fa5, 8(sp)
136 ; RV32-ILP32D-NEXT:    fcvt.w.d a0, fa5, rtz
137 ; RV32-ILP32D-NEXT:    add a0, a6, a0
138 ; RV32-ILP32D-NEXT:    addi sp, sp, 16
139 ; RV32-ILP32D-NEXT:    ret
140   %m_fptosi = fptosi double %m to i32
141   %1 = add i32 %g, %m_fptosi
142   ret i32 %1
145 define i32 @caller_double_in_gpr_and_stack_almost_exhausted_gprs_fprs() nounwind {
146 ; RV32-ILP32D-LABEL: caller_double_in_gpr_and_stack_almost_exhausted_gprs_fprs:
147 ; RV32-ILP32D:       # %bb.0:
148 ; RV32-ILP32D-NEXT:    addi sp, sp, -16
149 ; RV32-ILP32D-NEXT:    sw ra, 12(sp) # 4-byte Folded Spill
150 ; RV32-ILP32D-NEXT:    lui a1, 262816
151 ; RV32-ILP32D-NEXT:    lui a0, %hi(.LCPI7_0)
152 ; RV32-ILP32D-NEXT:    fld fa0, %lo(.LCPI7_0)(a0)
153 ; RV32-ILP32D-NEXT:    lui a0, %hi(.LCPI7_1)
154 ; RV32-ILP32D-NEXT:    fld fa1, %lo(.LCPI7_1)(a0)
155 ; RV32-ILP32D-NEXT:    lui a0, %hi(.LCPI7_2)
156 ; RV32-ILP32D-NEXT:    fld fa2, %lo(.LCPI7_2)(a0)
157 ; RV32-ILP32D-NEXT:    lui a0, %hi(.LCPI7_3)
158 ; RV32-ILP32D-NEXT:    fld fa3, %lo(.LCPI7_3)(a0)
159 ; RV32-ILP32D-NEXT:    lui a0, %hi(.LCPI7_4)
160 ; RV32-ILP32D-NEXT:    fld fa4, %lo(.LCPI7_4)(a0)
161 ; RV32-ILP32D-NEXT:    lui a0, %hi(.LCPI7_5)
162 ; RV32-ILP32D-NEXT:    fld fa5, %lo(.LCPI7_5)(a0)
163 ; RV32-ILP32D-NEXT:    lui a0, %hi(.LCPI7_6)
164 ; RV32-ILP32D-NEXT:    fld fa6, %lo(.LCPI7_6)(a0)
165 ; RV32-ILP32D-NEXT:    lui a0, %hi(.LCPI7_7)
166 ; RV32-ILP32D-NEXT:    fld fa7, %lo(.LCPI7_7)(a0)
167 ; RV32-ILP32D-NEXT:    li a0, 1
168 ; RV32-ILP32D-NEXT:    li a2, 3
169 ; RV32-ILP32D-NEXT:    li a4, 5
170 ; RV32-ILP32D-NEXT:    li a6, 7
171 ; RV32-ILP32D-NEXT:    sw a1, 0(sp)
172 ; RV32-ILP32D-NEXT:    li a1, 0
173 ; RV32-ILP32D-NEXT:    li a3, 0
174 ; RV32-ILP32D-NEXT:    li a5, 0
175 ; RV32-ILP32D-NEXT:    li a7, 0
176 ; RV32-ILP32D-NEXT:    call callee_double_in_gpr_and_stack_almost_exhausted_gprs_fprs@plt
177 ; RV32-ILP32D-NEXT:    lw ra, 12(sp) # 4-byte Folded Reload
178 ; RV32-ILP32D-NEXT:    addi sp, sp, 16
179 ; RV32-ILP32D-NEXT:    ret
180   %1 = call i32 @callee_double_in_gpr_and_stack_almost_exhausted_gprs_fprs(
181       i64 1, double 2.0, i64 3, double 4.0, i64 5, double 6.0, i32 7, double 8.0,
182       double 9.0, double 10.0, double 11.0, double 12.0, double 13.0)
183   ret i32 %1
187 ; Must keep define on a single line due to an update_llc_test_checks.py limitation
188 define i32 @callee_double_on_stack_exhausted_gprs_fprs(i64 %a, double %b, i64 %c, double %d, i64 %e, double %f, i64 %g, double %h, double %i, double %j, double %k, double %l, double %m) nounwind {
189 ; RV32-ILP32D-LABEL: callee_double_on_stack_exhausted_gprs_fprs:
190 ; RV32-ILP32D:       # %bb.0:
191 ; RV32-ILP32D-NEXT:    fld fa5, 0(sp)
192 ; RV32-ILP32D-NEXT:    fcvt.w.d a0, fa5, rtz
193 ; RV32-ILP32D-NEXT:    add a0, a6, a0
194 ; RV32-ILP32D-NEXT:    ret
195   %g_trunc = trunc i64 %g to i32
196   %m_fptosi = fptosi double %m to i32
197   %1 = add i32 %g_trunc, %m_fptosi
198   ret i32 %1
201 define i32 @caller_double_on_stack_exhausted_gprs_fprs() nounwind {
202 ; RV32-ILP32D-LABEL: caller_double_on_stack_exhausted_gprs_fprs:
203 ; RV32-ILP32D:       # %bb.0:
204 ; RV32-ILP32D-NEXT:    addi sp, sp, -16
205 ; RV32-ILP32D-NEXT:    sw ra, 12(sp) # 4-byte Folded Spill
206 ; RV32-ILP32D-NEXT:    lui a0, 262816
207 ; RV32-ILP32D-NEXT:    sw a0, 4(sp)
208 ; RV32-ILP32D-NEXT:    lui a0, %hi(.LCPI9_0)
209 ; RV32-ILP32D-NEXT:    fld fa0, %lo(.LCPI9_0)(a0)
210 ; RV32-ILP32D-NEXT:    lui a0, %hi(.LCPI9_1)
211 ; RV32-ILP32D-NEXT:    fld fa1, %lo(.LCPI9_1)(a0)
212 ; RV32-ILP32D-NEXT:    lui a0, %hi(.LCPI9_2)
213 ; RV32-ILP32D-NEXT:    fld fa2, %lo(.LCPI9_2)(a0)
214 ; RV32-ILP32D-NEXT:    lui a0, %hi(.LCPI9_3)
215 ; RV32-ILP32D-NEXT:    fld fa3, %lo(.LCPI9_3)(a0)
216 ; RV32-ILP32D-NEXT:    lui a0, %hi(.LCPI9_4)
217 ; RV32-ILP32D-NEXT:    fld fa4, %lo(.LCPI9_4)(a0)
218 ; RV32-ILP32D-NEXT:    lui a0, %hi(.LCPI9_5)
219 ; RV32-ILP32D-NEXT:    fld fa5, %lo(.LCPI9_5)(a0)
220 ; RV32-ILP32D-NEXT:    lui a0, %hi(.LCPI9_6)
221 ; RV32-ILP32D-NEXT:    fld fa6, %lo(.LCPI9_6)(a0)
222 ; RV32-ILP32D-NEXT:    lui a0, %hi(.LCPI9_7)
223 ; RV32-ILP32D-NEXT:    fld fa7, %lo(.LCPI9_7)(a0)
224 ; RV32-ILP32D-NEXT:    li a0, 1
225 ; RV32-ILP32D-NEXT:    li a2, 3
226 ; RV32-ILP32D-NEXT:    li a4, 5
227 ; RV32-ILP32D-NEXT:    li a6, 7
228 ; RV32-ILP32D-NEXT:    sw zero, 0(sp)
229 ; RV32-ILP32D-NEXT:    li a1, 0
230 ; RV32-ILP32D-NEXT:    li a3, 0
231 ; RV32-ILP32D-NEXT:    li a5, 0
232 ; RV32-ILP32D-NEXT:    li a7, 0
233 ; RV32-ILP32D-NEXT:    call callee_double_on_stack_exhausted_gprs_fprs@plt
234 ; RV32-ILP32D-NEXT:    lw ra, 12(sp) # 4-byte Folded Reload
235 ; RV32-ILP32D-NEXT:    addi sp, sp, 16
236 ; RV32-ILP32D-NEXT:    ret
237   %1 = call i32 @callee_double_on_stack_exhausted_gprs_fprs(
238       i64 1, double 2.0, i64 3, double 4.0, i64 5, double 6.0, i64 7, double 8.0,
239       double 9.0, double 10.0, double 11.0, double 12.0, double 13.0)
240   ret i32 %1
243 define double @callee_double_ret() nounwind {
244 ; RV32-ILP32D-LABEL: callee_double_ret:
245 ; RV32-ILP32D:       # %bb.0:
246 ; RV32-ILP32D-NEXT:    lui a0, %hi(.LCPI10_0)
247 ; RV32-ILP32D-NEXT:    fld fa0, %lo(.LCPI10_0)(a0)
248 ; RV32-ILP32D-NEXT:    ret
249   ret double 1.0
252 define i32 @caller_double_ret() nounwind {
253 ; RV32-ILP32D-LABEL: caller_double_ret:
254 ; RV32-ILP32D:       # %bb.0:
255 ; RV32-ILP32D-NEXT:    addi sp, sp, -16
256 ; RV32-ILP32D-NEXT:    sw ra, 12(sp) # 4-byte Folded Spill
257 ; RV32-ILP32D-NEXT:    call callee_double_ret@plt
258 ; RV32-ILP32D-NEXT:    fsd fa0, 0(sp)
259 ; RV32-ILP32D-NEXT:    lw a0, 0(sp)
260 ; RV32-ILP32D-NEXT:    lw ra, 12(sp) # 4-byte Folded Reload
261 ; RV32-ILP32D-NEXT:    addi sp, sp, 16
262 ; RV32-ILP32D-NEXT:    ret
263   %1 = call double @callee_double_ret()
264   %2 = bitcast double %1 to i64
265   %3 = trunc i64 %2 to i32
266   ret i32 %3