Run DCE after a LoopFlatten test to reduce spurious output [nfc]
[llvm-project.git] / llvm / test / CodeGen / X86 / fp-strict-scalar.ll
blobf1be74f5c3ac4c77aff7400b252616f80bdca1d1
1 ; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
2 ; RUN: llc < %s -mtriple=i686-unknown-unknown -mattr=+sse2 -O3 | FileCheck %s --check-prefixes=SSE-X86
3 ; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+sse2 -O3 | FileCheck %s --check-prefixes=SSE-X64
4 ; RUN: llc < %s -mtriple=i686-unknown-unknown -mattr=+fma -O3 | FileCheck %s --check-prefixes=AVX-X86
5 ; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+fma -O3 | FileCheck %s --check-prefixes=AVX-X64
6 ; RUN: llc < %s -mtriple=i686-unknown-unknown -mattr=+avx512f -mattr=+avx512vl -O3 | FileCheck %s --check-prefixes=AVX-X86
7 ; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+avx512f -mattr=+avx512vl -O3 | FileCheck %s --check-prefixes=AVX-X64
8 ; RUN: llc < %s -mtriple=i686-unknown-unknown -mattr=-sse -O3 | FileCheck %s --check-prefixes=X87
10 declare double @llvm.experimental.constrained.fadd.f64(double, double, metadata, metadata)
11 declare float @llvm.experimental.constrained.fadd.f32(float, float, metadata, metadata)
12 declare double @llvm.experimental.constrained.fsub.f64(double, double, metadata, metadata)
13 declare float @llvm.experimental.constrained.fsub.f32(float, float, metadata, metadata)
14 declare double @llvm.experimental.constrained.fmul.f64(double, double, metadata, metadata)
15 declare float @llvm.experimental.constrained.fmul.f32(float, float, metadata, metadata)
16 declare double @llvm.experimental.constrained.fdiv.f64(double, double, metadata, metadata)
17 declare float @llvm.experimental.constrained.fdiv.f32(float, float, metadata, metadata)
18 declare double @llvm.experimental.constrained.fpext.f64.f32(float, metadata)
19 declare float @llvm.experimental.constrained.fptrunc.f32.f64(double, metadata, metadata)
20 declare float @llvm.experimental.constrained.sqrt.f32(float, metadata, metadata)
21 declare double @llvm.experimental.constrained.sqrt.f64(double, metadata, metadata)
22 declare float @llvm.experimental.constrained.fma.f32(float, float, float, metadata, metadata)
23 declare double @llvm.experimental.constrained.fma.f64(double, double, double, metadata, metadata)
25 define double @fadd_f64(double %a, double %b) nounwind strictfp {
26 ; SSE-X86-LABEL: fadd_f64:
27 ; SSE-X86:       # %bb.0:
28 ; SSE-X86-NEXT:    pushl %ebp
29 ; SSE-X86-NEXT:    movl %esp, %ebp
30 ; SSE-X86-NEXT:    andl $-8, %esp
31 ; SSE-X86-NEXT:    subl $8, %esp
32 ; SSE-X86-NEXT:    movsd {{.*#+}} xmm0 = mem[0],zero
33 ; SSE-X86-NEXT:    addsd 16(%ebp), %xmm0
34 ; SSE-X86-NEXT:    movsd %xmm0, (%esp)
35 ; SSE-X86-NEXT:    fldl (%esp)
36 ; SSE-X86-NEXT:    wait
37 ; SSE-X86-NEXT:    movl %ebp, %esp
38 ; SSE-X86-NEXT:    popl %ebp
39 ; SSE-X86-NEXT:    retl
41 ; SSE-X64-LABEL: fadd_f64:
42 ; SSE-X64:       # %bb.0:
43 ; SSE-X64-NEXT:    addsd %xmm1, %xmm0
44 ; SSE-X64-NEXT:    retq
46 ; AVX-X86-LABEL: fadd_f64:
47 ; AVX-X86:       # %bb.0:
48 ; AVX-X86-NEXT:    pushl %ebp
49 ; AVX-X86-NEXT:    movl %esp, %ebp
50 ; AVX-X86-NEXT:    andl $-8, %esp
51 ; AVX-X86-NEXT:    subl $8, %esp
52 ; AVX-X86-NEXT:    vmovsd {{.*#+}} xmm0 = mem[0],zero
53 ; AVX-X86-NEXT:    vaddsd 16(%ebp), %xmm0, %xmm0
54 ; AVX-X86-NEXT:    vmovsd %xmm0, (%esp)
55 ; AVX-X86-NEXT:    fldl (%esp)
56 ; AVX-X86-NEXT:    wait
57 ; AVX-X86-NEXT:    movl %ebp, %esp
58 ; AVX-X86-NEXT:    popl %ebp
59 ; AVX-X86-NEXT:    retl
61 ; AVX-X64-LABEL: fadd_f64:
62 ; AVX-X64:       # %bb.0:
63 ; AVX-X64-NEXT:    vaddsd %xmm1, %xmm0, %xmm0
64 ; AVX-X64-NEXT:    retq
66 ; X87-LABEL: fadd_f64:
67 ; X87:       # %bb.0:
68 ; X87-NEXT:    fldl {{[0-9]+}}(%esp)
69 ; X87-NEXT:    faddl {{[0-9]+}}(%esp)
70 ; X87-NEXT:    wait
71 ; X87-NEXT:    retl
72   %ret = call double @llvm.experimental.constrained.fadd.f64(double %a, double %b,
73                                                              metadata !"round.dynamic",
74                                                              metadata !"fpexcept.strict") #0
75   ret double %ret
78 define float @fadd_f32(float %a, float %b) nounwind strictfp {
79 ; SSE-X86-LABEL: fadd_f32:
80 ; SSE-X86:       # %bb.0:
81 ; SSE-X86-NEXT:    pushl %eax
82 ; SSE-X86-NEXT:    movss {{.*#+}} xmm0 = mem[0],zero,zero,zero
83 ; SSE-X86-NEXT:    addss {{[0-9]+}}(%esp), %xmm0
84 ; SSE-X86-NEXT:    movss %xmm0, (%esp)
85 ; SSE-X86-NEXT:    flds (%esp)
86 ; SSE-X86-NEXT:    wait
87 ; SSE-X86-NEXT:    popl %eax
88 ; SSE-X86-NEXT:    retl
90 ; SSE-X64-LABEL: fadd_f32:
91 ; SSE-X64:       # %bb.0:
92 ; SSE-X64-NEXT:    addss %xmm1, %xmm0
93 ; SSE-X64-NEXT:    retq
95 ; AVX-X86-LABEL: fadd_f32:
96 ; AVX-X86:       # %bb.0:
97 ; AVX-X86-NEXT:    pushl %eax
98 ; AVX-X86-NEXT:    vmovss {{.*#+}} xmm0 = mem[0],zero,zero,zero
99 ; AVX-X86-NEXT:    vaddss {{[0-9]+}}(%esp), %xmm0, %xmm0
100 ; AVX-X86-NEXT:    vmovss %xmm0, (%esp)
101 ; AVX-X86-NEXT:    flds (%esp)
102 ; AVX-X86-NEXT:    wait
103 ; AVX-X86-NEXT:    popl %eax
104 ; AVX-X86-NEXT:    retl
106 ; AVX-X64-LABEL: fadd_f32:
107 ; AVX-X64:       # %bb.0:
108 ; AVX-X64-NEXT:    vaddss %xmm1, %xmm0, %xmm0
109 ; AVX-X64-NEXT:    retq
111 ; X87-LABEL: fadd_f32:
112 ; X87:       # %bb.0:
113 ; X87-NEXT:    flds {{[0-9]+}}(%esp)
114 ; X87-NEXT:    fadds {{[0-9]+}}(%esp)
115 ; X87-NEXT:    wait
116 ; X87-NEXT:    retl
117   %ret = call float @llvm.experimental.constrained.fadd.f32(float %a, float %b,
118                                                             metadata !"round.dynamic",
119                                                             metadata !"fpexcept.strict") #0
120   ret float %ret
123 define double @fsub_f64(double %a, double %b) nounwind strictfp {
124 ; SSE-X86-LABEL: fsub_f64:
125 ; SSE-X86:       # %bb.0:
126 ; SSE-X86-NEXT:    pushl %ebp
127 ; SSE-X86-NEXT:    movl %esp, %ebp
128 ; SSE-X86-NEXT:    andl $-8, %esp
129 ; SSE-X86-NEXT:    subl $8, %esp
130 ; SSE-X86-NEXT:    movsd {{.*#+}} xmm0 = mem[0],zero
131 ; SSE-X86-NEXT:    subsd 16(%ebp), %xmm0
132 ; SSE-X86-NEXT:    movsd %xmm0, (%esp)
133 ; SSE-X86-NEXT:    fldl (%esp)
134 ; SSE-X86-NEXT:    wait
135 ; SSE-X86-NEXT:    movl %ebp, %esp
136 ; SSE-X86-NEXT:    popl %ebp
137 ; SSE-X86-NEXT:    retl
139 ; SSE-X64-LABEL: fsub_f64:
140 ; SSE-X64:       # %bb.0:
141 ; SSE-X64-NEXT:    subsd %xmm1, %xmm0
142 ; SSE-X64-NEXT:    retq
144 ; AVX-X86-LABEL: fsub_f64:
145 ; AVX-X86:       # %bb.0:
146 ; AVX-X86-NEXT:    pushl %ebp
147 ; AVX-X86-NEXT:    movl %esp, %ebp
148 ; AVX-X86-NEXT:    andl $-8, %esp
149 ; AVX-X86-NEXT:    subl $8, %esp
150 ; AVX-X86-NEXT:    vmovsd {{.*#+}} xmm0 = mem[0],zero
151 ; AVX-X86-NEXT:    vsubsd 16(%ebp), %xmm0, %xmm0
152 ; AVX-X86-NEXT:    vmovsd %xmm0, (%esp)
153 ; AVX-X86-NEXT:    fldl (%esp)
154 ; AVX-X86-NEXT:    wait
155 ; AVX-X86-NEXT:    movl %ebp, %esp
156 ; AVX-X86-NEXT:    popl %ebp
157 ; AVX-X86-NEXT:    retl
159 ; AVX-X64-LABEL: fsub_f64:
160 ; AVX-X64:       # %bb.0:
161 ; AVX-X64-NEXT:    vsubsd %xmm1, %xmm0, %xmm0
162 ; AVX-X64-NEXT:    retq
164 ; X87-LABEL: fsub_f64:
165 ; X87:       # %bb.0:
166 ; X87-NEXT:    fldl {{[0-9]+}}(%esp)
167 ; X87-NEXT:    fsubl {{[0-9]+}}(%esp)
168 ; X87-NEXT:    wait
169 ; X87-NEXT:    retl
170   %ret = call double @llvm.experimental.constrained.fsub.f64(double %a, double %b,
171                                                              metadata !"round.dynamic",
172                                                              metadata !"fpexcept.strict") #0
173   ret double %ret
176 define float @fsub_f32(float %a, float %b) nounwind strictfp {
177 ; SSE-X86-LABEL: fsub_f32:
178 ; SSE-X86:       # %bb.0:
179 ; SSE-X86-NEXT:    pushl %eax
180 ; SSE-X86-NEXT:    movss {{.*#+}} xmm0 = mem[0],zero,zero,zero
181 ; SSE-X86-NEXT:    subss {{[0-9]+}}(%esp), %xmm0
182 ; SSE-X86-NEXT:    movss %xmm0, (%esp)
183 ; SSE-X86-NEXT:    flds (%esp)
184 ; SSE-X86-NEXT:    wait
185 ; SSE-X86-NEXT:    popl %eax
186 ; SSE-X86-NEXT:    retl
188 ; SSE-X64-LABEL: fsub_f32:
189 ; SSE-X64:       # %bb.0:
190 ; SSE-X64-NEXT:    subss %xmm1, %xmm0
191 ; SSE-X64-NEXT:    retq
193 ; AVX-X86-LABEL: fsub_f32:
194 ; AVX-X86:       # %bb.0:
195 ; AVX-X86-NEXT:    pushl %eax
196 ; AVX-X86-NEXT:    vmovss {{.*#+}} xmm0 = mem[0],zero,zero,zero
197 ; AVX-X86-NEXT:    vsubss {{[0-9]+}}(%esp), %xmm0, %xmm0
198 ; AVX-X86-NEXT:    vmovss %xmm0, (%esp)
199 ; AVX-X86-NEXT:    flds (%esp)
200 ; AVX-X86-NEXT:    wait
201 ; AVX-X86-NEXT:    popl %eax
202 ; AVX-X86-NEXT:    retl
204 ; AVX-X64-LABEL: fsub_f32:
205 ; AVX-X64:       # %bb.0:
206 ; AVX-X64-NEXT:    vsubss %xmm1, %xmm0, %xmm0
207 ; AVX-X64-NEXT:    retq
209 ; X87-LABEL: fsub_f32:
210 ; X87:       # %bb.0:
211 ; X87-NEXT:    flds {{[0-9]+}}(%esp)
212 ; X87-NEXT:    fsubs {{[0-9]+}}(%esp)
213 ; X87-NEXT:    wait
214 ; X87-NEXT:    retl
215   %ret = call float @llvm.experimental.constrained.fsub.f32(float %a, float %b,
216                                                             metadata !"round.dynamic",
217                                                             metadata !"fpexcept.strict") #0
218   ret float %ret
221 define double @fmul_f64(double %a, double %b) nounwind strictfp {
222 ; SSE-X86-LABEL: fmul_f64:
223 ; SSE-X86:       # %bb.0:
224 ; SSE-X86-NEXT:    pushl %ebp
225 ; SSE-X86-NEXT:    movl %esp, %ebp
226 ; SSE-X86-NEXT:    andl $-8, %esp
227 ; SSE-X86-NEXT:    subl $8, %esp
228 ; SSE-X86-NEXT:    movsd {{.*#+}} xmm0 = mem[0],zero
229 ; SSE-X86-NEXT:    mulsd 16(%ebp), %xmm0
230 ; SSE-X86-NEXT:    movsd %xmm0, (%esp)
231 ; SSE-X86-NEXT:    fldl (%esp)
232 ; SSE-X86-NEXT:    wait
233 ; SSE-X86-NEXT:    movl %ebp, %esp
234 ; SSE-X86-NEXT:    popl %ebp
235 ; SSE-X86-NEXT:    retl
237 ; SSE-X64-LABEL: fmul_f64:
238 ; SSE-X64:       # %bb.0:
239 ; SSE-X64-NEXT:    mulsd %xmm1, %xmm0
240 ; SSE-X64-NEXT:    retq
242 ; AVX-X86-LABEL: fmul_f64:
243 ; AVX-X86:       # %bb.0:
244 ; AVX-X86-NEXT:    pushl %ebp
245 ; AVX-X86-NEXT:    movl %esp, %ebp
246 ; AVX-X86-NEXT:    andl $-8, %esp
247 ; AVX-X86-NEXT:    subl $8, %esp
248 ; AVX-X86-NEXT:    vmovsd {{.*#+}} xmm0 = mem[0],zero
249 ; AVX-X86-NEXT:    vmulsd 16(%ebp), %xmm0, %xmm0
250 ; AVX-X86-NEXT:    vmovsd %xmm0, (%esp)
251 ; AVX-X86-NEXT:    fldl (%esp)
252 ; AVX-X86-NEXT:    wait
253 ; AVX-X86-NEXT:    movl %ebp, %esp
254 ; AVX-X86-NEXT:    popl %ebp
255 ; AVX-X86-NEXT:    retl
257 ; AVX-X64-LABEL: fmul_f64:
258 ; AVX-X64:       # %bb.0:
259 ; AVX-X64-NEXT:    vmulsd %xmm1, %xmm0, %xmm0
260 ; AVX-X64-NEXT:    retq
262 ; X87-LABEL: fmul_f64:
263 ; X87:       # %bb.0:
264 ; X87-NEXT:    fldl {{[0-9]+}}(%esp)
265 ; X87-NEXT:    fmull {{[0-9]+}}(%esp)
266 ; X87-NEXT:    wait
267 ; X87-NEXT:    retl
268   %ret = call double @llvm.experimental.constrained.fmul.f64(double %a, double %b,
269                                                              metadata !"round.dynamic",
270                                                              metadata !"fpexcept.strict") #0
271   ret double %ret
274 define float @fmul_f32(float %a, float %b) nounwind strictfp {
275 ; SSE-X86-LABEL: fmul_f32:
276 ; SSE-X86:       # %bb.0:
277 ; SSE-X86-NEXT:    pushl %eax
278 ; SSE-X86-NEXT:    movss {{.*#+}} xmm0 = mem[0],zero,zero,zero
279 ; SSE-X86-NEXT:    mulss {{[0-9]+}}(%esp), %xmm0
280 ; SSE-X86-NEXT:    movss %xmm0, (%esp)
281 ; SSE-X86-NEXT:    flds (%esp)
282 ; SSE-X86-NEXT:    wait
283 ; SSE-X86-NEXT:    popl %eax
284 ; SSE-X86-NEXT:    retl
286 ; SSE-X64-LABEL: fmul_f32:
287 ; SSE-X64:       # %bb.0:
288 ; SSE-X64-NEXT:    mulss %xmm1, %xmm0
289 ; SSE-X64-NEXT:    retq
291 ; AVX-X86-LABEL: fmul_f32:
292 ; AVX-X86:       # %bb.0:
293 ; AVX-X86-NEXT:    pushl %eax
294 ; AVX-X86-NEXT:    vmovss {{.*#+}} xmm0 = mem[0],zero,zero,zero
295 ; AVX-X86-NEXT:    vmulss {{[0-9]+}}(%esp), %xmm0, %xmm0
296 ; AVX-X86-NEXT:    vmovss %xmm0, (%esp)
297 ; AVX-X86-NEXT:    flds (%esp)
298 ; AVX-X86-NEXT:    wait
299 ; AVX-X86-NEXT:    popl %eax
300 ; AVX-X86-NEXT:    retl
302 ; AVX-X64-LABEL: fmul_f32:
303 ; AVX-X64:       # %bb.0:
304 ; AVX-X64-NEXT:    vmulss %xmm1, %xmm0, %xmm0
305 ; AVX-X64-NEXT:    retq
307 ; X87-LABEL: fmul_f32:
308 ; X87:       # %bb.0:
309 ; X87-NEXT:    flds {{[0-9]+}}(%esp)
310 ; X87-NEXT:    fmuls {{[0-9]+}}(%esp)
311 ; X87-NEXT:    wait
312 ; X87-NEXT:    retl
313   %ret = call float @llvm.experimental.constrained.fmul.f32(float %a, float %b,
314                                                             metadata !"round.dynamic",
315                                                             metadata !"fpexcept.strict") #0
316   ret float %ret
319 define double @fdiv_f64(double %a, double %b) nounwind strictfp {
320 ; SSE-X86-LABEL: fdiv_f64:
321 ; SSE-X86:       # %bb.0:
322 ; SSE-X86-NEXT:    pushl %ebp
323 ; SSE-X86-NEXT:    movl %esp, %ebp
324 ; SSE-X86-NEXT:    andl $-8, %esp
325 ; SSE-X86-NEXT:    subl $8, %esp
326 ; SSE-X86-NEXT:    movsd {{.*#+}} xmm0 = mem[0],zero
327 ; SSE-X86-NEXT:    divsd 16(%ebp), %xmm0
328 ; SSE-X86-NEXT:    movsd %xmm0, (%esp)
329 ; SSE-X86-NEXT:    fldl (%esp)
330 ; SSE-X86-NEXT:    wait
331 ; SSE-X86-NEXT:    movl %ebp, %esp
332 ; SSE-X86-NEXT:    popl %ebp
333 ; SSE-X86-NEXT:    retl
335 ; SSE-X64-LABEL: fdiv_f64:
336 ; SSE-X64:       # %bb.0:
337 ; SSE-X64-NEXT:    divsd %xmm1, %xmm0
338 ; SSE-X64-NEXT:    retq
340 ; AVX-X86-LABEL: fdiv_f64:
341 ; AVX-X86:       # %bb.0:
342 ; AVX-X86-NEXT:    pushl %ebp
343 ; AVX-X86-NEXT:    movl %esp, %ebp
344 ; AVX-X86-NEXT:    andl $-8, %esp
345 ; AVX-X86-NEXT:    subl $8, %esp
346 ; AVX-X86-NEXT:    vmovsd {{.*#+}} xmm0 = mem[0],zero
347 ; AVX-X86-NEXT:    vdivsd 16(%ebp), %xmm0, %xmm0
348 ; AVX-X86-NEXT:    vmovsd %xmm0, (%esp)
349 ; AVX-X86-NEXT:    fldl (%esp)
350 ; AVX-X86-NEXT:    wait
351 ; AVX-X86-NEXT:    movl %ebp, %esp
352 ; AVX-X86-NEXT:    popl %ebp
353 ; AVX-X86-NEXT:    retl
355 ; AVX-X64-LABEL: fdiv_f64:
356 ; AVX-X64:       # %bb.0:
357 ; AVX-X64-NEXT:    vdivsd %xmm1, %xmm0, %xmm0
358 ; AVX-X64-NEXT:    retq
360 ; X87-LABEL: fdiv_f64:
361 ; X87:       # %bb.0:
362 ; X87-NEXT:    fldl {{[0-9]+}}(%esp)
363 ; X87-NEXT:    fdivl {{[0-9]+}}(%esp)
364 ; X87-NEXT:    wait
365 ; X87-NEXT:    retl
366   %ret = call double @llvm.experimental.constrained.fdiv.f64(double %a, double %b,
367                                                              metadata !"round.dynamic",
368                                                              metadata !"fpexcept.strict") #0
369   ret double %ret
372 define float @fdiv_f32(float %a, float %b) nounwind strictfp {
373 ; SSE-X86-LABEL: fdiv_f32:
374 ; SSE-X86:       # %bb.0:
375 ; SSE-X86-NEXT:    pushl %eax
376 ; SSE-X86-NEXT:    movss {{.*#+}} xmm0 = mem[0],zero,zero,zero
377 ; SSE-X86-NEXT:    divss {{[0-9]+}}(%esp), %xmm0
378 ; SSE-X86-NEXT:    movss %xmm0, (%esp)
379 ; SSE-X86-NEXT:    flds (%esp)
380 ; SSE-X86-NEXT:    wait
381 ; SSE-X86-NEXT:    popl %eax
382 ; SSE-X86-NEXT:    retl
384 ; SSE-X64-LABEL: fdiv_f32:
385 ; SSE-X64:       # %bb.0:
386 ; SSE-X64-NEXT:    divss %xmm1, %xmm0
387 ; SSE-X64-NEXT:    retq
389 ; AVX-X86-LABEL: fdiv_f32:
390 ; AVX-X86:       # %bb.0:
391 ; AVX-X86-NEXT:    pushl %eax
392 ; AVX-X86-NEXT:    vmovss {{.*#+}} xmm0 = mem[0],zero,zero,zero
393 ; AVX-X86-NEXT:    vdivss {{[0-9]+}}(%esp), %xmm0, %xmm0
394 ; AVX-X86-NEXT:    vmovss %xmm0, (%esp)
395 ; AVX-X86-NEXT:    flds (%esp)
396 ; AVX-X86-NEXT:    wait
397 ; AVX-X86-NEXT:    popl %eax
398 ; AVX-X86-NEXT:    retl
400 ; AVX-X64-LABEL: fdiv_f32:
401 ; AVX-X64:       # %bb.0:
402 ; AVX-X64-NEXT:    vdivss %xmm1, %xmm0, %xmm0
403 ; AVX-X64-NEXT:    retq
405 ; X87-LABEL: fdiv_f32:
406 ; X87:       # %bb.0:
407 ; X87-NEXT:    flds {{[0-9]+}}(%esp)
408 ; X87-NEXT:    fdivs {{[0-9]+}}(%esp)
409 ; X87-NEXT:    wait
410 ; X87-NEXT:    retl
411   %ret = call float @llvm.experimental.constrained.fdiv.f32(float %a, float %b,
412                                                             metadata !"round.dynamic",
413                                                             metadata !"fpexcept.strict") #0
414   ret float %ret
417 define void @fpext_f32_to_f64(ptr %val, ptr %ret) nounwind strictfp {
418 ; SSE-X86-LABEL: fpext_f32_to_f64:
419 ; SSE-X86:       # %bb.0:
420 ; SSE-X86-NEXT:    movl {{[0-9]+}}(%esp), %eax
421 ; SSE-X86-NEXT:    movl {{[0-9]+}}(%esp), %ecx
422 ; SSE-X86-NEXT:    movss {{.*#+}} xmm0 = mem[0],zero,zero,zero
423 ; SSE-X86-NEXT:    cvtss2sd %xmm0, %xmm0
424 ; SSE-X86-NEXT:    movsd %xmm0, (%eax)
425 ; SSE-X86-NEXT:    retl
427 ; SSE-X64-LABEL: fpext_f32_to_f64:
428 ; SSE-X64:       # %bb.0:
429 ; SSE-X64-NEXT:    movss {{.*#+}} xmm0 = mem[0],zero,zero,zero
430 ; SSE-X64-NEXT:    cvtss2sd %xmm0, %xmm0
431 ; SSE-X64-NEXT:    movsd %xmm0, (%rsi)
432 ; SSE-X64-NEXT:    retq
434 ; AVX-X86-LABEL: fpext_f32_to_f64:
435 ; AVX-X86:       # %bb.0:
436 ; AVX-X86-NEXT:    movl {{[0-9]+}}(%esp), %eax
437 ; AVX-X86-NEXT:    movl {{[0-9]+}}(%esp), %ecx
438 ; AVX-X86-NEXT:    vmovss {{.*#+}} xmm0 = mem[0],zero,zero,zero
439 ; AVX-X86-NEXT:    vcvtss2sd %xmm0, %xmm0, %xmm0
440 ; AVX-X86-NEXT:    vmovsd %xmm0, (%eax)
441 ; AVX-X86-NEXT:    retl
443 ; AVX-X64-LABEL: fpext_f32_to_f64:
444 ; AVX-X64:       # %bb.0:
445 ; AVX-X64-NEXT:    vmovss {{.*#+}} xmm0 = mem[0],zero,zero,zero
446 ; AVX-X64-NEXT:    vcvtss2sd %xmm0, %xmm0, %xmm0
447 ; AVX-X64-NEXT:    vmovsd %xmm0, (%rsi)
448 ; AVX-X64-NEXT:    retq
450 ; X87-LABEL: fpext_f32_to_f64:
451 ; X87:       # %bb.0:
452 ; X87-NEXT:    movl {{[0-9]+}}(%esp), %eax
453 ; X87-NEXT:    movl {{[0-9]+}}(%esp), %ecx
454 ; X87-NEXT:    flds (%ecx)
455 ; X87-NEXT:    fstpl (%eax)
456 ; X87-NEXT:    wait
457 ; X87-NEXT:    retl
458   %1 = load float, ptr %val, align 4
459   %res = call double @llvm.experimental.constrained.fpext.f64.f32(float %1,
460                                                                   metadata !"fpexcept.strict") #0
461   store double %res, ptr %ret, align 8
462   ret void
465 define void @fptrunc_double_to_f32(ptr %val, ptr%ret) nounwind strictfp {
466 ; SSE-X86-LABEL: fptrunc_double_to_f32:
467 ; SSE-X86:       # %bb.0:
468 ; SSE-X86-NEXT:    movl {{[0-9]+}}(%esp), %eax
469 ; SSE-X86-NEXT:    movl {{[0-9]+}}(%esp), %ecx
470 ; SSE-X86-NEXT:    movsd {{.*#+}} xmm0 = mem[0],zero
471 ; SSE-X86-NEXT:    cvtsd2ss %xmm0, %xmm0
472 ; SSE-X86-NEXT:    movss %xmm0, (%eax)
473 ; SSE-X86-NEXT:    retl
475 ; SSE-X64-LABEL: fptrunc_double_to_f32:
476 ; SSE-X64:       # %bb.0:
477 ; SSE-X64-NEXT:    movsd {{.*#+}} xmm0 = mem[0],zero
478 ; SSE-X64-NEXT:    cvtsd2ss %xmm0, %xmm0
479 ; SSE-X64-NEXT:    movss %xmm0, (%rsi)
480 ; SSE-X64-NEXT:    retq
482 ; AVX-X86-LABEL: fptrunc_double_to_f32:
483 ; AVX-X86:       # %bb.0:
484 ; AVX-X86-NEXT:    movl {{[0-9]+}}(%esp), %eax
485 ; AVX-X86-NEXT:    movl {{[0-9]+}}(%esp), %ecx
486 ; AVX-X86-NEXT:    vmovsd {{.*#+}} xmm0 = mem[0],zero
487 ; AVX-X86-NEXT:    vcvtsd2ss %xmm0, %xmm0, %xmm0
488 ; AVX-X86-NEXT:    vmovss %xmm0, (%eax)
489 ; AVX-X86-NEXT:    retl
491 ; AVX-X64-LABEL: fptrunc_double_to_f32:
492 ; AVX-X64:       # %bb.0:
493 ; AVX-X64-NEXT:    vmovsd {{.*#+}} xmm0 = mem[0],zero
494 ; AVX-X64-NEXT:    vcvtsd2ss %xmm0, %xmm0, %xmm0
495 ; AVX-X64-NEXT:    vmovss %xmm0, (%rsi)
496 ; AVX-X64-NEXT:    retq
498 ; X87-LABEL: fptrunc_double_to_f32:
499 ; X87:       # %bb.0:
500 ; X87-NEXT:    pushl %eax
501 ; X87-NEXT:    movl {{[0-9]+}}(%esp), %eax
502 ; X87-NEXT:    movl {{[0-9]+}}(%esp), %ecx
503 ; X87-NEXT:    fldl (%ecx)
504 ; X87-NEXT:    fstps (%esp)
505 ; X87-NEXT:    flds (%esp)
506 ; X87-NEXT:    fstps (%eax)
507 ; X87-NEXT:    wait
508 ; X87-NEXT:    popl %eax
509 ; X87-NEXT:    retl
510   %1 = load double, ptr %val, align 8
511   %res = call float @llvm.experimental.constrained.fptrunc.f32.f64(double %1,
512                                                                    metadata !"round.dynamic",
513                                                                    metadata !"fpexcept.strict") #0
514   store float %res, ptr %ret, align 4
515   ret void
518 define void @fsqrt_f64(ptr %a) nounwind strictfp {
519 ; SSE-X86-LABEL: fsqrt_f64:
520 ; SSE-X86:       # %bb.0:
521 ; SSE-X86-NEXT:    movl {{[0-9]+}}(%esp), %eax
522 ; SSE-X86-NEXT:    movsd {{.*#+}} xmm0 = mem[0],zero
523 ; SSE-X86-NEXT:    sqrtsd %xmm0, %xmm0
524 ; SSE-X86-NEXT:    movsd %xmm0, (%eax)
525 ; SSE-X86-NEXT:    retl
527 ; SSE-X64-LABEL: fsqrt_f64:
528 ; SSE-X64:       # %bb.0:
529 ; SSE-X64-NEXT:    movsd {{.*#+}} xmm0 = mem[0],zero
530 ; SSE-X64-NEXT:    sqrtsd %xmm0, %xmm0
531 ; SSE-X64-NEXT:    movsd %xmm0, (%rdi)
532 ; SSE-X64-NEXT:    retq
534 ; AVX-X86-LABEL: fsqrt_f64:
535 ; AVX-X86:       # %bb.0:
536 ; AVX-X86-NEXT:    movl {{[0-9]+}}(%esp), %eax
537 ; AVX-X86-NEXT:    vmovsd {{.*#+}} xmm0 = mem[0],zero
538 ; AVX-X86-NEXT:    vsqrtsd %xmm0, %xmm0, %xmm0
539 ; AVX-X86-NEXT:    vmovsd %xmm0, (%eax)
540 ; AVX-X86-NEXT:    retl
542 ; AVX-X64-LABEL: fsqrt_f64:
543 ; AVX-X64:       # %bb.0:
544 ; AVX-X64-NEXT:    vmovsd {{.*#+}} xmm0 = mem[0],zero
545 ; AVX-X64-NEXT:    vsqrtsd %xmm0, %xmm0, %xmm0
546 ; AVX-X64-NEXT:    vmovsd %xmm0, (%rdi)
547 ; AVX-X64-NEXT:    retq
549 ; X87-LABEL: fsqrt_f64:
550 ; X87:       # %bb.0:
551 ; X87-NEXT:    movl {{[0-9]+}}(%esp), %eax
552 ; X87-NEXT:    fldl (%eax)
553 ; X87-NEXT:    fsqrt
554 ; X87-NEXT:    fstpl (%eax)
555 ; X87-NEXT:    wait
556 ; X87-NEXT:    retl
557   %1 = load double, ptr %a, align 8
558   %res = call double @llvm.experimental.constrained.sqrt.f64(double %1,
559                                                              metadata !"round.dynamic",
560                                                              metadata !"fpexcept.strict") #0
561   store double %res, ptr %a, align 8
562   ret void
565 define void @fsqrt_f32(ptr %a) nounwind strictfp {
566 ; SSE-X86-LABEL: fsqrt_f32:
567 ; SSE-X86:       # %bb.0:
568 ; SSE-X86-NEXT:    movl {{[0-9]+}}(%esp), %eax
569 ; SSE-X86-NEXT:    movss {{.*#+}} xmm0 = mem[0],zero,zero,zero
570 ; SSE-X86-NEXT:    sqrtss %xmm0, %xmm0
571 ; SSE-X86-NEXT:    movss %xmm0, (%eax)
572 ; SSE-X86-NEXT:    retl
574 ; SSE-X64-LABEL: fsqrt_f32:
575 ; SSE-X64:       # %bb.0:
576 ; SSE-X64-NEXT:    movss {{.*#+}} xmm0 = mem[0],zero,zero,zero
577 ; SSE-X64-NEXT:    sqrtss %xmm0, %xmm0
578 ; SSE-X64-NEXT:    movss %xmm0, (%rdi)
579 ; SSE-X64-NEXT:    retq
581 ; AVX-X86-LABEL: fsqrt_f32:
582 ; AVX-X86:       # %bb.0:
583 ; AVX-X86-NEXT:    movl {{[0-9]+}}(%esp), %eax
584 ; AVX-X86-NEXT:    vmovss {{.*#+}} xmm0 = mem[0],zero,zero,zero
585 ; AVX-X86-NEXT:    vsqrtss %xmm0, %xmm0, %xmm0
586 ; AVX-X86-NEXT:    vmovss %xmm0, (%eax)
587 ; AVX-X86-NEXT:    retl
589 ; AVX-X64-LABEL: fsqrt_f32:
590 ; AVX-X64:       # %bb.0:
591 ; AVX-X64-NEXT:    vmovss {{.*#+}} xmm0 = mem[0],zero,zero,zero
592 ; AVX-X64-NEXT:    vsqrtss %xmm0, %xmm0, %xmm0
593 ; AVX-X64-NEXT:    vmovss %xmm0, (%rdi)
594 ; AVX-X64-NEXT:    retq
596 ; X87-LABEL: fsqrt_f32:
597 ; X87:       # %bb.0:
598 ; X87-NEXT:    movl {{[0-9]+}}(%esp), %eax
599 ; X87-NEXT:    flds (%eax)
600 ; X87-NEXT:    fsqrt
601 ; X87-NEXT:    fstps (%eax)
602 ; X87-NEXT:    wait
603 ; X87-NEXT:    retl
604   %1 = load float, ptr %a, align 4
605   %res = call float @llvm.experimental.constrained.sqrt.f32(float %1,
606                                                             metadata !"round.dynamic",
607                                                             metadata !"fpexcept.strict") #0
608   store float %res, ptr %a, align 4
609   ret void
612 define double @fma_f64(double %a, double %b, double %c) nounwind strictfp {
613 ; SSE-X86-LABEL: fma_f64:
614 ; SSE-X86:       # %bb.0:
615 ; SSE-X86-NEXT:    subl $24, %esp
616 ; SSE-X86-NEXT:    movsd {{.*#+}} xmm0 = mem[0],zero
617 ; SSE-X86-NEXT:    movsd {{.*#+}} xmm1 = mem[0],zero
618 ; SSE-X86-NEXT:    movsd {{.*#+}} xmm2 = mem[0],zero
619 ; SSE-X86-NEXT:    movsd %xmm2, {{[0-9]+}}(%esp)
620 ; SSE-X86-NEXT:    movsd %xmm1, {{[0-9]+}}(%esp)
621 ; SSE-X86-NEXT:    movsd %xmm0, (%esp)
622 ; SSE-X86-NEXT:    calll fma
623 ; SSE-X86-NEXT:    addl $24, %esp
624 ; SSE-X86-NEXT:    retl
626 ; SSE-X64-LABEL: fma_f64:
627 ; SSE-X64:       # %bb.0:
628 ; SSE-X64-NEXT:    pushq %rax
629 ; SSE-X64-NEXT:    callq fma@PLT
630 ; SSE-X64-NEXT:    popq %rax
631 ; SSE-X64-NEXT:    retq
633 ; AVX-X86-LABEL: fma_f64:
634 ; AVX-X86:       # %bb.0:
635 ; AVX-X86-NEXT:    pushl %ebp
636 ; AVX-X86-NEXT:    movl %esp, %ebp
637 ; AVX-X86-NEXT:    andl $-8, %esp
638 ; AVX-X86-NEXT:    subl $8, %esp
639 ; AVX-X86-NEXT:    vmovsd {{.*#+}} xmm0 = mem[0],zero
640 ; AVX-X86-NEXT:    vmovsd {{.*#+}} xmm1 = mem[0],zero
641 ; AVX-X86-NEXT:    vfmadd213sd {{.*#+}} xmm1 = (xmm0 * xmm1) + mem
642 ; AVX-X86-NEXT:    vmovsd %xmm1, (%esp)
643 ; AVX-X86-NEXT:    fldl (%esp)
644 ; AVX-X86-NEXT:    wait
645 ; AVX-X86-NEXT:    movl %ebp, %esp
646 ; AVX-X86-NEXT:    popl %ebp
647 ; AVX-X86-NEXT:    retl
649 ; AVX-X64-LABEL: fma_f64:
650 ; AVX-X64:       # %bb.0:
651 ; AVX-X64-NEXT:    vfmadd213sd {{.*#+}} xmm0 = (xmm1 * xmm0) + xmm2
652 ; AVX-X64-NEXT:    retq
654 ; X87-LABEL: fma_f64:
655 ; X87:       # %bb.0:
656 ; X87-NEXT:    subl $24, %esp
657 ; X87-NEXT:    fldl {{[0-9]+}}(%esp)
658 ; X87-NEXT:    fldl {{[0-9]+}}(%esp)
659 ; X87-NEXT:    fldl {{[0-9]+}}(%esp)
660 ; X87-NEXT:    fstpl {{[0-9]+}}(%esp)
661 ; X87-NEXT:    fstpl {{[0-9]+}}(%esp)
662 ; X87-NEXT:    fstpl (%esp)
663 ; X87-NEXT:    wait
664 ; X87-NEXT:    calll fma
665 ; X87-NEXT:    addl $24, %esp
666 ; X87-NEXT:    retl
667   %res = call double @llvm.experimental.constrained.fma.f64(double %a, double %b, double %c,
668                                                             metadata !"round.dynamic",
669                                                             metadata !"fpexcept.strict") #0
670   ret double %res
673 define float @fma_f32(float %a, float %b, float %c) nounwind strictfp {
674 ; SSE-X86-LABEL: fma_f32:
675 ; SSE-X86:       # %bb.0:
676 ; SSE-X86-NEXT:    subl $12, %esp
677 ; SSE-X86-NEXT:    movss {{.*#+}} xmm0 = mem[0],zero,zero,zero
678 ; SSE-X86-NEXT:    movss {{.*#+}} xmm1 = mem[0],zero,zero,zero
679 ; SSE-X86-NEXT:    movss {{.*#+}} xmm2 = mem[0],zero,zero,zero
680 ; SSE-X86-NEXT:    movss %xmm2, {{[0-9]+}}(%esp)
681 ; SSE-X86-NEXT:    movss %xmm1, {{[0-9]+}}(%esp)
682 ; SSE-X86-NEXT:    movss %xmm0, (%esp)
683 ; SSE-X86-NEXT:    calll fmaf
684 ; SSE-X86-NEXT:    addl $12, %esp
685 ; SSE-X86-NEXT:    retl
687 ; SSE-X64-LABEL: fma_f32:
688 ; SSE-X64:       # %bb.0:
689 ; SSE-X64-NEXT:    pushq %rax
690 ; SSE-X64-NEXT:    callq fmaf@PLT
691 ; SSE-X64-NEXT:    popq %rax
692 ; SSE-X64-NEXT:    retq
694 ; AVX-X86-LABEL: fma_f32:
695 ; AVX-X86:       # %bb.0:
696 ; AVX-X86-NEXT:    pushl %eax
697 ; AVX-X86-NEXT:    vmovss {{.*#+}} xmm0 = mem[0],zero,zero,zero
698 ; AVX-X86-NEXT:    vmovss {{.*#+}} xmm1 = mem[0],zero,zero,zero
699 ; AVX-X86-NEXT:    vfmadd213ss {{.*#+}} xmm1 = (xmm0 * xmm1) + mem
700 ; AVX-X86-NEXT:    vmovss %xmm1, (%esp)
701 ; AVX-X86-NEXT:    flds (%esp)
702 ; AVX-X86-NEXT:    wait
703 ; AVX-X86-NEXT:    popl %eax
704 ; AVX-X86-NEXT:    retl
706 ; AVX-X64-LABEL: fma_f32:
707 ; AVX-X64:       # %bb.0:
708 ; AVX-X64-NEXT:    vfmadd213ss {{.*#+}} xmm0 = (xmm1 * xmm0) + xmm2
709 ; AVX-X64-NEXT:    retq
711 ; X87-LABEL: fma_f32:
712 ; X87:       # %bb.0:
713 ; X87-NEXT:    subl $12, %esp
714 ; X87-NEXT:    flds {{[0-9]+}}(%esp)
715 ; X87-NEXT:    flds {{[0-9]+}}(%esp)
716 ; X87-NEXT:    flds {{[0-9]+}}(%esp)
717 ; X87-NEXT:    fstps {{[0-9]+}}(%esp)
718 ; X87-NEXT:    fstps {{[0-9]+}}(%esp)
719 ; X87-NEXT:    fstps (%esp)
720 ; X87-NEXT:    wait
721 ; X87-NEXT:    calll fmaf
722 ; X87-NEXT:    addl $12, %esp
723 ; X87-NEXT:    retl
724   %res = call float @llvm.experimental.constrained.fma.f32(float %a, float %b, float %c,
725                                                            metadata !"round.dynamic",
726                                                            metadata !"fpexcept.strict") #0
727   ret float %res
730 attributes #0 = { strictfp }