Run DCE after a LoopFlatten test to reduce spurious output [nfc]
[llvm-project.git] / llvm / test / CodeGen / ARM / vpminmax.ll
blob22c8d69da9e794cbf3302fefc51c26a927bf297c
1 ; RUN: llc -mtriple=arm-eabi -mattr=+neon %s -o - | FileCheck %s
3 define <8 x i8> @vpmins8(ptr %A, ptr %B) nounwind {
4 ;CHECK-LABEL: vpmins8:
5 ;CHECK: vpmin.s8
6         %tmp1 = load <8 x i8>, ptr %A
7         %tmp2 = load <8 x i8>, ptr %B
8         %tmp3 = call <8 x i8> @llvm.arm.neon.vpmins.v8i8(<8 x i8> %tmp1, <8 x i8> %tmp2)
9         ret <8 x i8> %tmp3
12 define <4 x i16> @vpmins16(ptr %A, ptr %B) nounwind {
13 ;CHECK-LABEL: vpmins16:
14 ;CHECK: vpmin.s16
15         %tmp1 = load <4 x i16>, ptr %A
16         %tmp2 = load <4 x i16>, ptr %B
17         %tmp3 = call <4 x i16> @llvm.arm.neon.vpmins.v4i16(<4 x i16> %tmp1, <4 x i16> %tmp2)
18         ret <4 x i16> %tmp3
21 define <2 x i32> @vpmins32(ptr %A, ptr %B) nounwind {
22 ;CHECK-LABEL: vpmins32:
23 ;CHECK: vpmin.s32
24         %tmp1 = load <2 x i32>, ptr %A
25         %tmp2 = load <2 x i32>, ptr %B
26         %tmp3 = call <2 x i32> @llvm.arm.neon.vpmins.v2i32(<2 x i32> %tmp1, <2 x i32> %tmp2)
27         ret <2 x i32> %tmp3
30 define <8 x i8> @vpminu8(ptr %A, ptr %B) nounwind {
31 ;CHECK-LABEL: vpminu8:
32 ;CHECK: vpmin.u8
33         %tmp1 = load <8 x i8>, ptr %A
34         %tmp2 = load <8 x i8>, ptr %B
35         %tmp3 = call <8 x i8> @llvm.arm.neon.vpminu.v8i8(<8 x i8> %tmp1, <8 x i8> %tmp2)
36         ret <8 x i8> %tmp3
39 define <4 x i16> @vpminu16(ptr %A, ptr %B) nounwind {
40 ;CHECK-LABEL: vpminu16:
41 ;CHECK: vpmin.u16
42         %tmp1 = load <4 x i16>, ptr %A
43         %tmp2 = load <4 x i16>, ptr %B
44         %tmp3 = call <4 x i16> @llvm.arm.neon.vpminu.v4i16(<4 x i16> %tmp1, <4 x i16> %tmp2)
45         ret <4 x i16> %tmp3
48 define <2 x i32> @vpminu32(ptr %A, ptr %B) nounwind {
49 ;CHECK-LABEL: vpminu32:
50 ;CHECK: vpmin.u32
51         %tmp1 = load <2 x i32>, ptr %A
52         %tmp2 = load <2 x i32>, ptr %B
53         %tmp3 = call <2 x i32> @llvm.arm.neon.vpminu.v2i32(<2 x i32> %tmp1, <2 x i32> %tmp2)
54         ret <2 x i32> %tmp3
57 define <2 x float> @vpminf32(ptr %A, ptr %B) nounwind {
58 ;CHECK-LABEL: vpminf32:
59 ;CHECK: vpmin.f32
60         %tmp1 = load <2 x float>, ptr %A
61         %tmp2 = load <2 x float>, ptr %B
62         %tmp3 = call <2 x float> @llvm.arm.neon.vpmins.v2f32(<2 x float> %tmp1, <2 x float> %tmp2)
63         ret <2 x float> %tmp3
66 declare <8 x i8>  @llvm.arm.neon.vpmins.v8i8(<8 x i8>, <8 x i8>) nounwind readnone
67 declare <4 x i16> @llvm.arm.neon.vpmins.v4i16(<4 x i16>, <4 x i16>) nounwind readnone
68 declare <2 x i32> @llvm.arm.neon.vpmins.v2i32(<2 x i32>, <2 x i32>) nounwind readnone
70 declare <8 x i8>  @llvm.arm.neon.vpminu.v8i8(<8 x i8>, <8 x i8>) nounwind readnone
71 declare <4 x i16> @llvm.arm.neon.vpminu.v4i16(<4 x i16>, <4 x i16>) nounwind readnone
72 declare <2 x i32> @llvm.arm.neon.vpminu.v2i32(<2 x i32>, <2 x i32>) nounwind readnone
74 declare <2 x float> @llvm.arm.neon.vpmins.v2f32(<2 x float>, <2 x float>) nounwind readnone
76 define <8 x i8> @vpmaxs8(ptr %A, ptr %B) nounwind {
77 ;CHECK-LABEL: vpmaxs8:
78 ;CHECK: vpmax.s8
79         %tmp1 = load <8 x i8>, ptr %A
80         %tmp2 = load <8 x i8>, ptr %B
81         %tmp3 = call <8 x i8> @llvm.arm.neon.vpmaxs.v8i8(<8 x i8> %tmp1, <8 x i8> %tmp2)
82         ret <8 x i8> %tmp3
85 define <4 x i16> @vpmaxs16(ptr %A, ptr %B) nounwind {
86 ;CHECK-LABEL: vpmaxs16:
87 ;CHECK: vpmax.s16
88         %tmp1 = load <4 x i16>, ptr %A
89         %tmp2 = load <4 x i16>, ptr %B
90         %tmp3 = call <4 x i16> @llvm.arm.neon.vpmaxs.v4i16(<4 x i16> %tmp1, <4 x i16> %tmp2)
91         ret <4 x i16> %tmp3
94 define <2 x i32> @vpmaxs32(ptr %A, ptr %B) nounwind {
95 ;CHECK-LABEL: vpmaxs32:
96 ;CHECK: vpmax.s32
97         %tmp1 = load <2 x i32>, ptr %A
98         %tmp2 = load <2 x i32>, ptr %B
99         %tmp3 = call <2 x i32> @llvm.arm.neon.vpmaxs.v2i32(<2 x i32> %tmp1, <2 x i32> %tmp2)
100         ret <2 x i32> %tmp3
103 define <8 x i8> @vpmaxu8(ptr %A, ptr %B) nounwind {
104 ;CHECK-LABEL: vpmaxu8:
105 ;CHECK: vpmax.u8
106         %tmp1 = load <8 x i8>, ptr %A
107         %tmp2 = load <8 x i8>, ptr %B
108         %tmp3 = call <8 x i8> @llvm.arm.neon.vpmaxu.v8i8(<8 x i8> %tmp1, <8 x i8> %tmp2)
109         ret <8 x i8> %tmp3
112 define <4 x i16> @vpmaxu16(ptr %A, ptr %B) nounwind {
113 ;CHECK-LABEL: vpmaxu16:
114 ;CHECK: vpmax.u16
115         %tmp1 = load <4 x i16>, ptr %A
116         %tmp2 = load <4 x i16>, ptr %B
117         %tmp3 = call <4 x i16> @llvm.arm.neon.vpmaxu.v4i16(<4 x i16> %tmp1, <4 x i16> %tmp2)
118         ret <4 x i16> %tmp3
121 define <2 x i32> @vpmaxu32(ptr %A, ptr %B) nounwind {
122 ;CHECK-LABEL: vpmaxu32:
123 ;CHECK: vpmax.u32
124         %tmp1 = load <2 x i32>, ptr %A
125         %tmp2 = load <2 x i32>, ptr %B
126         %tmp3 = call <2 x i32> @llvm.arm.neon.vpmaxu.v2i32(<2 x i32> %tmp1, <2 x i32> %tmp2)
127         ret <2 x i32> %tmp3
130 define <2 x float> @vpmaxf32(ptr %A, ptr %B) nounwind {
131 ;CHECK-LABEL: vpmaxf32:
132 ;CHECK: vpmax.f32
133         %tmp1 = load <2 x float>, ptr %A
134         %tmp2 = load <2 x float>, ptr %B
135         %tmp3 = call <2 x float> @llvm.arm.neon.vpmaxs.v2f32(<2 x float> %tmp1, <2 x float> %tmp2)
136         ret <2 x float> %tmp3
139 declare <8 x i8>  @llvm.arm.neon.vpmaxs.v8i8(<8 x i8>, <8 x i8>) nounwind readnone
140 declare <4 x i16> @llvm.arm.neon.vpmaxs.v4i16(<4 x i16>, <4 x i16>) nounwind readnone
141 declare <2 x i32> @llvm.arm.neon.vpmaxs.v2i32(<2 x i32>, <2 x i32>) nounwind readnone
143 declare <8 x i8>  @llvm.arm.neon.vpmaxu.v8i8(<8 x i8>, <8 x i8>) nounwind readnone
144 declare <4 x i16> @llvm.arm.neon.vpmaxu.v4i16(<4 x i16>, <4 x i16>) nounwind readnone
145 declare <2 x i32> @llvm.arm.neon.vpmaxu.v2i32(<2 x i32>, <2 x i32>) nounwind readnone
147 declare <2 x float> @llvm.arm.neon.vpmaxs.v2f32(<2 x float>, <2 x float>) nounwind readnone