Run DCE after a LoopFlatten test to reduce spurious output [nfc]
[llvm-project.git] / llvm / test / CodeGen / X86 / 2011-12-28-vselecti8.ll
blobb725941d870306556a6683a901fdf703c1ff1c7f
1 ; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
2 ; RUN: llc < %s -mtriple=x86_64-apple-darwin  -mcpu=corei7 | FileCheck %s
3 ; ModuleID = '<stdin>'
5 target datalayout = "e-p:64:64:64-i1:8:8-i8:8:8-i16:16:16-i32:32:32-i64:64:64-f32:32:32-f64:64:64-v64:64:64-v128:128:128-a0:0:64-s0:64:64-f80:128:128-n8:16:32:64-S128"
6 target triple = "x86_64-apple-darwin11.2.0"
8 ; During legalization, the vselect mask is 'type legalized' into a
9 ; wider BUILD_VECTOR. This causes the introduction of a new
10 ; sign_extend_inreg in the DAG.
12 ; A sign_extend_inreg of a vector of ConstantSDNode or undef can be
13 ; always folded into a simple build_vector.
15 ; Make sure that the sign_extend_inreg is simplified and that we
16 ; don't generate psll, psraw and pblendvb from the vselect.
18 define void @foo8(ptr nocapture %RET) nounwind {
19 ; CHECK-LABEL: foo8:
20 ; CHECK:       ## %bb.0: ## %allocas
21 ; CHECK-NEXT:    movaps {{.*#+}} xmm0 = [1.0E+2,2.0E+0,1.0E+2,4.0E+0]
22 ; CHECK-NEXT:    movaps {{.*#+}} xmm1 = [1.0E+2,6.0E+0,1.0E+2,8.0E+0]
23 ; CHECK-NEXT:    movups %xmm1, 16(%rdi)
24 ; CHECK-NEXT:    movups %xmm0, (%rdi)
25 ; CHECK-NEXT:    retq
26 allocas:
27   %resultvec.i = select <8 x i1> <i1 false, i1 true, i1 false, i1 true, i1 false, i1 true, i1 false, i1 true>, <8 x i8> <i8 1, i8 2, i8 3, i8 4, i8 5, i8 6, i8 7, i8 8>, <8 x i8> <i8 100, i8 100, i8 100, i8 100, i8 100, i8 100, i8 100, i8 100>
28   %uint2float = uitofp <8 x i8> %resultvec.i to <8 x float>
29   store <8 x float> %uint2float, ptr %RET, align 4
30   ret void