[ARM] Adjust how NEON shifts are lowered
[llvm-core.git] / test / CodeGen / X86 / extract-concat.ll
blob029c69a34cb67be9e60b25d442d3f90e80452fc4
1 ; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
2 ; RUN: llc < %s -mcpu=corei7 -mtriple=x86_64-unknown-linux-gnu | FileCheck %s
4 define void @foo(<4 x float> %in, <4 x i8>* %out) {
5 ; CHECK-LABEL: foo:
6 ; CHECK:       # %bb.0:
7 ; CHECK-NEXT:    cvttps2dq %xmm0, %xmm0
8 ; CHECK-NEXT:    movl $255, %eax
9 ; CHECK-NEXT:    pinsrd $3, %eax, %xmm0
10 ; CHECK-NEXT:    pshufb {{.*#+}} xmm0 = xmm0[0,4,8,12,u,u,u,u,u,u,u,u,u,u,u,u]
11 ; CHECK-NEXT:    movd %xmm0, (%rdi)
12 ; CHECK-NEXT:    retq
13   %t0 = fptosi <4 x float> %in to <4 x i32>
14   %t1 = trunc <4 x i32> %t0 to <4 x i16>
15   %t2 = shufflevector <4 x i16> %t1, <4 x i16> undef, <8 x i32> <i32 0, i32 1, i32 2, i32 3, i32 4, i32 5, i32 6, i32 7>
16   %t3 = trunc <8 x i16> %t2 to <8 x i8>
17   %t4 = shufflevector <8 x i8> %t3, <8 x i8> undef, <4 x i32> <i32 0, i32 1, i32 2, i32 3>
18   %t5 = insertelement <4 x i8> %t4, i8 -1, i32 3
19   store <4 x i8> %t5, <4 x i8>* %out
20   ret void