Run DCE after a LoopFlatten test to reduce spurious output [nfc]
[llvm-project.git] / llvm / test / CodeGen / X86 / pr52567.ll
blobd2815286f86749300ef35593df9861243dce09b0
1 ; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
2 ; RUN: llc < %s -mtriple=x86_64-unknown-linux-gnu | FileCheck %s
4 ; The and in the test below discards half the bits from vector icmp result.
5 ; We use a testb after a pmovmskb to examine only 8 bits.
7 define i32 @foo(<4 x float> %arg) {
8 ; CHECK-LABEL: foo:
9 ; CHECK:       # %bb.0: # %bb
10 ; CHECK-NEXT:    movaps {{.*#+}} xmm1 = [1.00000005E-3,1.00000005E-3,1.00000005E-3,1.00000005E-3]
11 ; CHECK-NEXT:    cmpltps %xmm0, %xmm1
12 ; CHECK-NEXT:    pmovmskb %xmm1, %ecx
13 ; CHECK-NEXT:    xorl %eax, %eax
14 ; CHECK-NEXT:    testb %cl, %cl
15 ; CHECK-NEXT:    sete %al
16 ; CHECK-NEXT:    retq
17 bb:
18   %tmp = fcmp ogt <4 x float> %arg, <float 0x3F50624DE0000000, float 0x3F50624DE0000000, float 0x3F50624DE0000000, float 0x3F50624DE0000000>
19   %tmp1 = sext <4 x i1> %tmp to <4 x i32>
20   %tmp2 = bitcast <4 x i32> %tmp1 to <16 x i8>
21   %tmp3 = icmp slt <16 x i8> %tmp2, zeroinitializer
22   %tmp4 = bitcast <16 x i1> %tmp3 to i16
23   %tmp5 = and i16 %tmp4, 255
24   %tmp6 = icmp eq i16 %tmp5, 0
25   %tmp7 = zext i1 %tmp6 to i32
26   ret i32 %tmp7