Run DCE after a LoopFlatten test to reduce spurious output [nfc]
[llvm-project.git] / llvm / test / CodeGen / X86 / vector-compare-combines.ll
blobddc07f996fbdeac7061b2aa5a37f98198af128ba
1 ; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
2 ; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+sse4.2 | FileCheck %s --check-prefix=SSE
3 ; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+avx | FileCheck %s --check-prefix=AVX
5 ; Ensure we match legal min/max intrinsics and the expanded compare+select equivalents.
7 declare <4 x i32> @llvm.smax.v4i32(<4 x i32>, <4 x i32>)
9 define <4 x i32> @PR27924_cmpeq(<4 x i32> %a, <4 x i32> %b) {
10 ; SSE-LABEL: PR27924_cmpeq:
11 ; SSE:       # %bb.0:
12 ; SSE-NEXT:    pcmpeqd %xmm0, %xmm0
13 ; SSE-NEXT:    retq
15 ; AVX-LABEL: PR27924_cmpeq:
16 ; AVX:       # %bb.0:
17 ; AVX-NEXT:    vpcmpeqd %xmm0, %xmm0, %xmm0
18 ; AVX-NEXT:    retq
19   %cmp = icmp sgt <4 x i32> %a, %b
20   %max = select <4 x i1> %cmp, <4 x i32> %a, <4 x i32> %b
21   %sse_max = tail call <4 x i32> @llvm.smax.v4i32(<4 x i32> %a, <4 x i32> %b)
22   %truth = icmp eq <4 x i32> %max, %sse_max
23   %ret = sext <4 x i1> %truth to <4 x i32>
24   ret <4 x i32> %ret
27 define <4 x i32> @PR27924_cmpgt(<4 x i32> %a, <4 x i32> %b) {
28 ; SSE-LABEL: PR27924_cmpgt:
29 ; SSE:       # %bb.0:
30 ; SSE-NEXT:    xorps %xmm0, %xmm0
31 ; SSE-NEXT:    retq
33 ; AVX-LABEL: PR27924_cmpgt:
34 ; AVX:       # %bb.0:
35 ; AVX-NEXT:    vxorps %xmm0, %xmm0, %xmm0
36 ; AVX-NEXT:    retq
37   %cmp = icmp sgt <4 x i32> %a, %b
38   %max = select <4 x i1> %cmp, <4 x i32> %a, <4 x i32> %b
39   %sse_max = tail call <4 x i32> @llvm.smax.v4i32(<4 x i32> %a, <4 x i32> %b)
40   %untruth = icmp sgt <4 x i32> %max, %sse_max
41   %ret = sext <4 x i1> %untruth to <4 x i32>
42   ret <4 x i32> %ret