[x86] fix assert with horizontal math + broadcast of vector (PR43402)
[llvm-core.git] / test / CodeGen / X86 / 2011-12-28-vselecti8.ll
blobcb2cf269e34cdc7bad70e7a1c985622384fc7925
1 ; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
2 ; RUN: llc < %s -mtriple=x86_64-apple-darwin  -mcpu=corei7 | FileCheck %s
3 ; ModuleID = '<stdin>'
5 target datalayout = "e-p:64:64:64-i1:8:8-i8:8:8-i16:16:16-i32:32:32-i64:64:64-f32:32:32-f64:64:64-v64:64:64-v128:128:128-a0:0:64-s0:64:64-f80:128:128-n8:16:32:64-S128"
6 target triple = "x86_64-apple-darwin11.2.0"
8 ; During legalization, the vselect mask is 'type legalized' into a
9 ; wider BUILD_VECTOR. This causes the introduction of a new
10 ; sign_extend_inreg in the DAG.
12 ; A sign_extend_inreg of a vector of ConstantSDNode or undef can be
13 ; always folded into a simple build_vector.
15 ; Make sure that the sign_extend_inreg is simplified and that we
16 ; don't generate psll, psraw and pblendvb from the vselect.
18 define void @foo8(float* nocapture %RET) nounwind {
19 ; CHECK-LABEL: foo8:
20 ; CHECK:       ## %bb.0: ## %allocas
21 ; CHECK-NEXT:    pmovzxbd {{.*#+}} xmm0 = mem[0],zero,zero,zero,mem[1],zero,zero,zero,mem[2],zero,zero,zero,mem[3],zero,zero,zero
22 ; CHECK-NEXT:    cvtdq2ps %xmm0, %xmm0
23 ; CHECK-NEXT:    movaps {{.*#+}} xmm1 = [1.0E+2,2.0E+0,1.0E+2,4.0E+0]
24 ; CHECK-NEXT:    movups %xmm1, (%rdi)
25 ; CHECK-NEXT:    movups %xmm0, 16(%rdi)
26 ; CHECK-NEXT:    retq
27 allocas:
28   %resultvec.i = select <8 x i1> <i1 false, i1 true, i1 false, i1 true, i1 false, i1 true, i1 false, i1 true>, <8 x i8> <i8 1, i8 2, i8 3, i8 4, i8 5, i8 6, i8 7, i8 8>, <8 x i8> <i8 100, i8 100, i8 100, i8 100, i8 100, i8 100, i8 100, i8 100>
29   %uint2float = uitofp <8 x i8> %resultvec.i to <8 x float>
30   %ptr = bitcast float * %RET to <8 x float> *
31   store <8 x float> %uint2float, <8 x float>* %ptr, align 4
32   ret void