[ARM] Cortex-M4 schedule additions
[llvm-complete.git] / test / CodeGen / X86 / x86-32-vector-calling-conv.ll
blobe87f2b065d3a3e071fb139082ed23a4d1f308026
1 ; RUN: llc < %s -mtriple=i686-apple-darwin -mattr=+avx512f | FileCheck %s --check-prefix=DARWIN
2 ; RUN: llc < %s -mtriple=i686-pc-linux -mattr=+avx512f | FileCheck %s --check-prefix=LINUX
4 ; CHECK-LABEL: test_sse:
5 ; DARWIN: vpaddd  %xmm3, %xmm2, %xmm2
6 ; DARWIN: vpaddd  %xmm2, %xmm1, %xmm1
7 ; DARWIN: vpaddd  %xmm1, %xmm0, %xmm0
8 ; LINUX:  vpaddd  {{[0-9]+}}(%e{{s|b}}p), %xmm2, %xmm2
9 ; LINUX:  vpaddd  %xmm2, %xmm1, %xmm1
10 ; LINUX:  vpaddd  %xmm1, %xmm0, %xmm0
11 define <4 x i32> @test_sse(<4 x i32> %a, <4 x i32> %b, <4 x i32> %c, <4 x i32> %d) nounwind {
12   %r0 = add <4 x i32> %a, %b
13   %r1 = add <4 x i32> %c, %d
14   %ret = add <4 x i32> %r0, %r1
15   ret <4 x i32> %ret
18 ; CHECK-LABEL: test_avx:
19 ; DARWIN: vpaddd  %ymm3, %ymm2, %ymm2
20 ; DARWIN: vpaddd  %ymm2, %ymm1, %ymm1
21 ; DARWIN: vpaddd  %ymm1, %ymm0, %ymm0
22 ; LINUX:  vpaddd  {{[0-9]+}}(%e{{s|b}}p), %ymm2, %ymm2
23 ; LINUX:  vpaddd  %ymm2, %ymm1, %ymm1
24 ; LINUX:  vpaddd  %ymm1, %ymm0, %ymm0
25 define <8 x i32> @test_avx(<8 x i32> %a, <8 x i32> %b, <8 x i32> %c, <8 x i32> %d) nounwind {
26   %r0 = add <8 x i32> %a, %b
27   %r1 = add <8 x i32> %c, %d
28   %ret = add <8 x i32> %r0, %r1
29   ret <8 x i32> %ret
32 ; CHECK-LABEL: test_avx512:
33 ; DARWIN: vpaddd  %zmm3, %zmm2, %zmm2
34 ; DARWIN: vpaddd  %zmm2, %zmm1, %zmm1
35 ; DARWIN: vpaddd  %zmm1, %zmm0, %zmm0
36 ; LINUX:  vpaddd  {{[0-9]+}}(%e{{s|b}}p), %zmm2, %zmm2
37 ; LINUX:  vpaddd  %zmm2, %zmm1, %zmm1
38 ; LINUX:  vpaddd  %zmm1, %zmm0, %zmm0
39 define <16 x i32> @test_avx512(<16 x i32> %a, <16 x i32> %b, <16 x i32> %c, <16 x i32> %d) nounwind {
40   %r0 = add <16 x i32> %a, %b
41   %r1 = add <16 x i32> %c, %d
42   %ret = add <16 x i32> %r0, %r1
43   ret <16 x i32> %ret