Run DCE after a LoopFlatten test to reduce spurious output [nfc]
[llvm-project.git] / llvm / test / CodeGen / X86 / x86-64-veccallcc.ll
bloba733b8959ec288d22a5e62cf405ea43c262cf412
1 ; RUN: llc -mtriple=x86_64-pc-windows-msvc < %s | FileCheck %s
3 ; Test 1st and 2nd arguments passed in XMM0 and XMM1.
4 ; Test 7nd argument passed by reference in stack: 56(%rsp).
5 define x86_vectorcallcc <4 x float> @test_m128_7(<4 x float> %a, <4 x float> %b, <4 x float> %c, <4 x float> %d, <4 x float> %e, <4 x float> %f, <4 x float> %g) #0 {
6   ; CHECK-LABEL: test_m128_7@@112:
7   ; CHECK: movq 56(%rsp), %rax
8   ; CHECK: vaddps %xmm1, %xmm0, %xmm0
9   ; CHECK: vsubps (%rax), %xmm0, %xmm0
10   %add.i = fadd <4 x float> %a, %b
11   %sub.i = fsub <4 x float> %add.i, %g
12   ret <4 x float> %sub.i
15 ; Test 1st and 2nd arguments passed in YMM0 and YMM1.
16 ; Test 7nd argument passed by reference in stack: 56(%rsp).
17 define x86_vectorcallcc <8 x float> @test_m256_7(<8 x float> %a, <8 x float> %b, <8 x float> %c, <8 x float> %d, <8 x float> %e, <8 x float> %f, <8 x float> %g) #0 {
18   ; CHECK-LABEL: test_m256_7@@224:
19   ; CHECK: movq 56(%rsp), %rax
20   ; CHECK: vaddps %ymm1, %ymm0, %ymm0
21   ; CHECK: vsubps (%rax), %ymm0, %ymm0
22   %add.i = fadd <8 x float> %a, %b
23   %sub.i = fsub <8 x float> %add.i, %g
24   ret <8 x float> %sub.i
27 attributes #0 = { nounwind "target-cpu"="core-avx2" }