Re-land [openmp] Fix warnings when building on Windows with latest MSVC or Clang...
[llvm-project.git] / llvm / test / CodeGen / RISCV / calling-conv-lp64e.ll
blobbb2fd5934025122bd61d9510d0fff0c20f037b82
1 ; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
2 ; RUN: llc -mtriple=riscv64 -target-abi lp64e -verify-machineinstrs < %s \
3 ; RUN:   | FileCheck -check-prefix=RV64I-LP64E-FPELIM %s
4 ; RUN: llc -mtriple=riscv64 -target-abi lp64e -verify-machineinstrs -frame-pointer=all < %s \
5 ; RUN:   | FileCheck -check-prefix=RV64I-LP64E-WITHFP %s
7 ; This file contains tests that will have differing output for the lp64e ABIs.
9 define i64 @callee_float_in_regs(i64 %a, float %b) nounwind {
10 ; RV64I-LP64E-FPELIM-LABEL: callee_float_in_regs:
11 ; RV64I-LP64E-FPELIM:       # %bb.0:
12 ; RV64I-LP64E-FPELIM-NEXT:    addi sp, sp, -16
13 ; RV64I-LP64E-FPELIM-NEXT:    sd ra, 8(sp) # 8-byte Folded Spill
14 ; RV64I-LP64E-FPELIM-NEXT:    sd s0, 0(sp) # 8-byte Folded Spill
15 ; RV64I-LP64E-FPELIM-NEXT:    mv s0, a0
16 ; RV64I-LP64E-FPELIM-NEXT:    sext.w a0, a1
17 ; RV64I-LP64E-FPELIM-NEXT:    call __fixsfdi
18 ; RV64I-LP64E-FPELIM-NEXT:    add a0, s0, a0
19 ; RV64I-LP64E-FPELIM-NEXT:    ld ra, 8(sp) # 8-byte Folded Reload
20 ; RV64I-LP64E-FPELIM-NEXT:    ld s0, 0(sp) # 8-byte Folded Reload
21 ; RV64I-LP64E-FPELIM-NEXT:    addi sp, sp, 16
22 ; RV64I-LP64E-FPELIM-NEXT:    ret
24 ; RV64I-LP64E-WITHFP-LABEL: callee_float_in_regs:
25 ; RV64I-LP64E-WITHFP:       # %bb.0:
26 ; RV64I-LP64E-WITHFP-NEXT:    addi sp, sp, -24
27 ; RV64I-LP64E-WITHFP-NEXT:    sd ra, 16(sp) # 8-byte Folded Spill
28 ; RV64I-LP64E-WITHFP-NEXT:    sd s0, 8(sp) # 8-byte Folded Spill
29 ; RV64I-LP64E-WITHFP-NEXT:    sd s1, 0(sp) # 8-byte Folded Spill
30 ; RV64I-LP64E-WITHFP-NEXT:    addi s0, sp, 24
31 ; RV64I-LP64E-WITHFP-NEXT:    mv s1, a0
32 ; RV64I-LP64E-WITHFP-NEXT:    sext.w a0, a1
33 ; RV64I-LP64E-WITHFP-NEXT:    call __fixsfdi
34 ; RV64I-LP64E-WITHFP-NEXT:    add a0, s1, a0
35 ; RV64I-LP64E-WITHFP-NEXT:    ld ra, 16(sp) # 8-byte Folded Reload
36 ; RV64I-LP64E-WITHFP-NEXT:    ld s0, 8(sp) # 8-byte Folded Reload
37 ; RV64I-LP64E-WITHFP-NEXT:    ld s1, 0(sp) # 8-byte Folded Reload
38 ; RV64I-LP64E-WITHFP-NEXT:    addi sp, sp, 24
39 ; RV64I-LP64E-WITHFP-NEXT:    ret
40   %b_fptosi = fptosi float %b to i64
41   %1 = add i64 %a, %b_fptosi
42   ret i64 %1
45 define i64 @caller_float_in_regs() nounwind {
46 ; RV64I-LP64E-FPELIM-LABEL: caller_float_in_regs:
47 ; RV64I-LP64E-FPELIM:       # %bb.0:
48 ; RV64I-LP64E-FPELIM-NEXT:    addi sp, sp, -8
49 ; RV64I-LP64E-FPELIM-NEXT:    sd ra, 0(sp) # 8-byte Folded Spill
50 ; RV64I-LP64E-FPELIM-NEXT:    li a0, 1
51 ; RV64I-LP64E-FPELIM-NEXT:    lui a1, 262144
52 ; RV64I-LP64E-FPELIM-NEXT:    call callee_float_in_regs
53 ; RV64I-LP64E-FPELIM-NEXT:    ld ra, 0(sp) # 8-byte Folded Reload
54 ; RV64I-LP64E-FPELIM-NEXT:    addi sp, sp, 8
55 ; RV64I-LP64E-FPELIM-NEXT:    ret
57 ; RV64I-LP64E-WITHFP-LABEL: caller_float_in_regs:
58 ; RV64I-LP64E-WITHFP:       # %bb.0:
59 ; RV64I-LP64E-WITHFP-NEXT:    addi sp, sp, -16
60 ; RV64I-LP64E-WITHFP-NEXT:    sd ra, 8(sp) # 8-byte Folded Spill
61 ; RV64I-LP64E-WITHFP-NEXT:    sd s0, 0(sp) # 8-byte Folded Spill
62 ; RV64I-LP64E-WITHFP-NEXT:    addi s0, sp, 16
63 ; RV64I-LP64E-WITHFP-NEXT:    li a0, 1
64 ; RV64I-LP64E-WITHFP-NEXT:    lui a1, 262144
65 ; RV64I-LP64E-WITHFP-NEXT:    call callee_float_in_regs
66 ; RV64I-LP64E-WITHFP-NEXT:    ld ra, 8(sp) # 8-byte Folded Reload
67 ; RV64I-LP64E-WITHFP-NEXT:    ld s0, 0(sp) # 8-byte Folded Reload
68 ; RV64I-LP64E-WITHFP-NEXT:    addi sp, sp, 16
69 ; RV64I-LP64E-WITHFP-NEXT:    ret
70   %1 = call i64 @callee_float_in_regs(i64 1, float 2.0)
71   ret i64 %1
74 define i64 @callee_float_on_stack(i128 %a, i128 %b, i128 %c, i128 %d, float %e) nounwind {
75 ; RV64I-LP64E-FPELIM-LABEL: callee_float_on_stack:
76 ; RV64I-LP64E-FPELIM:       # %bb.0:
77 ; RV64I-LP64E-FPELIM-NEXT:    addi sp, sp, -16
78 ; RV64I-LP64E-FPELIM-NEXT:    sd ra, 8(sp) # 8-byte Folded Spill
79 ; RV64I-LP64E-FPELIM-NEXT:    sd s0, 0(sp) # 8-byte Folded Spill
80 ; RV64I-LP64E-FPELIM-NEXT:    addi s0, sp, 16
81 ; RV64I-LP64E-FPELIM-NEXT:    andi sp, sp, -16
82 ; RV64I-LP64E-FPELIM-NEXT:    lw a0, 16(s0)
83 ; RV64I-LP64E-FPELIM-NEXT:    addi sp, s0, -16
84 ; RV64I-LP64E-FPELIM-NEXT:    ld ra, 8(sp) # 8-byte Folded Reload
85 ; RV64I-LP64E-FPELIM-NEXT:    ld s0, 0(sp) # 8-byte Folded Reload
86 ; RV64I-LP64E-FPELIM-NEXT:    addi sp, sp, 16
87 ; RV64I-LP64E-FPELIM-NEXT:    ret
89 ; RV64I-LP64E-WITHFP-LABEL: callee_float_on_stack:
90 ; RV64I-LP64E-WITHFP:       # %bb.0:
91 ; RV64I-LP64E-WITHFP-NEXT:    addi sp, sp, -16
92 ; RV64I-LP64E-WITHFP-NEXT:    sd ra, 8(sp) # 8-byte Folded Spill
93 ; RV64I-LP64E-WITHFP-NEXT:    sd s0, 0(sp) # 8-byte Folded Spill
94 ; RV64I-LP64E-WITHFP-NEXT:    addi s0, sp, 16
95 ; RV64I-LP64E-WITHFP-NEXT:    andi sp, sp, -16
96 ; RV64I-LP64E-WITHFP-NEXT:    lw a0, 16(s0)
97 ; RV64I-LP64E-WITHFP-NEXT:    addi sp, s0, -16
98 ; RV64I-LP64E-WITHFP-NEXT:    ld ra, 8(sp) # 8-byte Folded Reload
99 ; RV64I-LP64E-WITHFP-NEXT:    ld s0, 0(sp) # 8-byte Folded Reload
100 ; RV64I-LP64E-WITHFP-NEXT:    addi sp, sp, 16
101 ; RV64I-LP64E-WITHFP-NEXT:    ret
102   %1 = trunc i128 %d to i64
103   %2 = bitcast float %e to i32
104   %3 = sext i32 %2 to i64
105   %4 = add i64 %1, %3
106   ret i64 %3
109 define i64 @caller_float_on_stack() nounwind {
110 ; RV64I-LP64E-FPELIM-LABEL: caller_float_on_stack:
111 ; RV64I-LP64E-FPELIM:       # %bb.0:
112 ; RV64I-LP64E-FPELIM-NEXT:    addi sp, sp, -48
113 ; RV64I-LP64E-FPELIM-NEXT:    sd ra, 40(sp) # 8-byte Folded Spill
114 ; RV64I-LP64E-FPELIM-NEXT:    sd s0, 32(sp) # 8-byte Folded Spill
115 ; RV64I-LP64E-FPELIM-NEXT:    addi s0, sp, 48
116 ; RV64I-LP64E-FPELIM-NEXT:    andi sp, sp, -16
117 ; RV64I-LP64E-FPELIM-NEXT:    lui a0, 264704
118 ; RV64I-LP64E-FPELIM-NEXT:    sd a0, 16(sp)
119 ; RV64I-LP64E-FPELIM-NEXT:    sd zero, 8(sp)
120 ; RV64I-LP64E-FPELIM-NEXT:    li a1, 4
121 ; RV64I-LP64E-FPELIM-NEXT:    li a0, 1
122 ; RV64I-LP64E-FPELIM-NEXT:    li a2, 2
123 ; RV64I-LP64E-FPELIM-NEXT:    li a4, 3
124 ; RV64I-LP64E-FPELIM-NEXT:    sd a1, 0(sp)
125 ; RV64I-LP64E-FPELIM-NEXT:    li a1, 0
126 ; RV64I-LP64E-FPELIM-NEXT:    li a3, 0
127 ; RV64I-LP64E-FPELIM-NEXT:    li a5, 0
128 ; RV64I-LP64E-FPELIM-NEXT:    call callee_float_on_stack
129 ; RV64I-LP64E-FPELIM-NEXT:    addi sp, s0, -48
130 ; RV64I-LP64E-FPELIM-NEXT:    ld ra, 40(sp) # 8-byte Folded Reload
131 ; RV64I-LP64E-FPELIM-NEXT:    ld s0, 32(sp) # 8-byte Folded Reload
132 ; RV64I-LP64E-FPELIM-NEXT:    addi sp, sp, 48
133 ; RV64I-LP64E-FPELIM-NEXT:    ret
135 ; RV64I-LP64E-WITHFP-LABEL: caller_float_on_stack:
136 ; RV64I-LP64E-WITHFP:       # %bb.0:
137 ; RV64I-LP64E-WITHFP-NEXT:    addi sp, sp, -48
138 ; RV64I-LP64E-WITHFP-NEXT:    sd ra, 40(sp) # 8-byte Folded Spill
139 ; RV64I-LP64E-WITHFP-NEXT:    sd s0, 32(sp) # 8-byte Folded Spill
140 ; RV64I-LP64E-WITHFP-NEXT:    addi s0, sp, 48
141 ; RV64I-LP64E-WITHFP-NEXT:    andi sp, sp, -16
142 ; RV64I-LP64E-WITHFP-NEXT:    lui a0, 264704
143 ; RV64I-LP64E-WITHFP-NEXT:    sd a0, 16(sp)
144 ; RV64I-LP64E-WITHFP-NEXT:    sd zero, 8(sp)
145 ; RV64I-LP64E-WITHFP-NEXT:    li a1, 4
146 ; RV64I-LP64E-WITHFP-NEXT:    li a0, 1
147 ; RV64I-LP64E-WITHFP-NEXT:    li a2, 2
148 ; RV64I-LP64E-WITHFP-NEXT:    li a4, 3
149 ; RV64I-LP64E-WITHFP-NEXT:    sd a1, 0(sp)
150 ; RV64I-LP64E-WITHFP-NEXT:    li a1, 0
151 ; RV64I-LP64E-WITHFP-NEXT:    li a3, 0
152 ; RV64I-LP64E-WITHFP-NEXT:    li a5, 0
153 ; RV64I-LP64E-WITHFP-NEXT:    call callee_float_on_stack
154 ; RV64I-LP64E-WITHFP-NEXT:    addi sp, s0, -48
155 ; RV64I-LP64E-WITHFP-NEXT:    ld ra, 40(sp) # 8-byte Folded Reload
156 ; RV64I-LP64E-WITHFP-NEXT:    ld s0, 32(sp) # 8-byte Folded Reload
157 ; RV64I-LP64E-WITHFP-NEXT:    addi sp, sp, 48
158 ; RV64I-LP64E-WITHFP-NEXT:    ret
159   %1 = call i64 @callee_float_on_stack(i128 1, i128 2, i128 3, i128 4, float 5.0)
160   ret i64 %1
163 define float @callee_tiny_scalar_ret() nounwind {
164 ; RV64I-LP64E-FPELIM-LABEL: callee_tiny_scalar_ret:
165 ; RV64I-LP64E-FPELIM:       # %bb.0:
166 ; RV64I-LP64E-FPELIM-NEXT:    lui a0, 260096
167 ; RV64I-LP64E-FPELIM-NEXT:    ret
169 ; RV64I-LP64E-WITHFP-LABEL: callee_tiny_scalar_ret:
170 ; RV64I-LP64E-WITHFP:       # %bb.0:
171 ; RV64I-LP64E-WITHFP-NEXT:    addi sp, sp, -16
172 ; RV64I-LP64E-WITHFP-NEXT:    sd ra, 8(sp) # 8-byte Folded Spill
173 ; RV64I-LP64E-WITHFP-NEXT:    sd s0, 0(sp) # 8-byte Folded Spill
174 ; RV64I-LP64E-WITHFP-NEXT:    addi s0, sp, 16
175 ; RV64I-LP64E-WITHFP-NEXT:    lui a0, 260096
176 ; RV64I-LP64E-WITHFP-NEXT:    ld ra, 8(sp) # 8-byte Folded Reload
177 ; RV64I-LP64E-WITHFP-NEXT:    ld s0, 0(sp) # 8-byte Folded Reload
178 ; RV64I-LP64E-WITHFP-NEXT:    addi sp, sp, 16
179 ; RV64I-LP64E-WITHFP-NEXT:    ret
180   ret float 1.0
183 ; The sign extension of the float return is necessary, as softened floats are
184 ; passed anyext.
186 define i64 @caller_tiny_scalar_ret() nounwind {
187 ; RV64I-LP64E-FPELIM-LABEL: caller_tiny_scalar_ret:
188 ; RV64I-LP64E-FPELIM:       # %bb.0:
189 ; RV64I-LP64E-FPELIM-NEXT:    addi sp, sp, -8
190 ; RV64I-LP64E-FPELIM-NEXT:    sd ra, 0(sp) # 8-byte Folded Spill
191 ; RV64I-LP64E-FPELIM-NEXT:    call callee_tiny_scalar_ret
192 ; RV64I-LP64E-FPELIM-NEXT:    sext.w a0, a0
193 ; RV64I-LP64E-FPELIM-NEXT:    ld ra, 0(sp) # 8-byte Folded Reload
194 ; RV64I-LP64E-FPELIM-NEXT:    addi sp, sp, 8
195 ; RV64I-LP64E-FPELIM-NEXT:    ret
197 ; RV64I-LP64E-WITHFP-LABEL: caller_tiny_scalar_ret:
198 ; RV64I-LP64E-WITHFP:       # %bb.0:
199 ; RV64I-LP64E-WITHFP-NEXT:    addi sp, sp, -16
200 ; RV64I-LP64E-WITHFP-NEXT:    sd ra, 8(sp) # 8-byte Folded Spill
201 ; RV64I-LP64E-WITHFP-NEXT:    sd s0, 0(sp) # 8-byte Folded Spill
202 ; RV64I-LP64E-WITHFP-NEXT:    addi s0, sp, 16
203 ; RV64I-LP64E-WITHFP-NEXT:    call callee_tiny_scalar_ret
204 ; RV64I-LP64E-WITHFP-NEXT:    sext.w a0, a0
205 ; RV64I-LP64E-WITHFP-NEXT:    ld ra, 8(sp) # 8-byte Folded Reload
206 ; RV64I-LP64E-WITHFP-NEXT:    ld s0, 0(sp) # 8-byte Folded Reload
207 ; RV64I-LP64E-WITHFP-NEXT:    addi sp, sp, 16
208 ; RV64I-LP64E-WITHFP-NEXT:    ret
209   %1 = call float @callee_tiny_scalar_ret()
210   %2 = bitcast float %1 to i32
211   %3 = sext i32 %2 to i64
212   ret i64 %3