[ARM] Adjust how NEON shifts are lowered
[llvm-core.git] / test / CodeGen / X86 / 2011-12-8-bitcastintprom.ll
blob7b5b205ac5c257df9eae9dde23292bfd0aa2318a
1 ; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
2 ; RUN: llc < %s -mtriple=x86_64-apple-darwin -mattr=+sse2 | FileCheck %s --check-prefix=CHECK --check-prefix=SSE2
3 ; RUN: llc < %s -mtriple=x86_64-apple-darwin -mattr=+sse4.1 | FileCheck %s --check-prefix=CHECK --check-prefix=SSE41
5 ; Make sure that the conversion between v4i8 to v2i16 is not a simple bitcast.
6 define void @prom_bug(<4 x i8> %t, i16* %p) {
7 ; SSE2-LABEL: prom_bug:
8 ; SSE2:       ## %bb.0:
9 ; SSE2-NEXT:    pand {{.*}}(%rip), %xmm0
10 ; SSE2-NEXT:    packuswb %xmm0, %xmm0
11 ; SSE2-NEXT:    packuswb %xmm0, %xmm0
12 ; SSE2-NEXT:    pextrw $0, %xmm0, %eax
13 ; SSE2-NEXT:    movw %ax, (%rdi)
14 ; SSE2-NEXT:    retq
16 ; SSE41-LABEL: prom_bug:
17 ; SSE41:       ## %bb.0:
18 ; SSE41-NEXT:    pshufb {{.*#+}} xmm0 = xmm0[0,4,8,12,u,u,u,u,u,u,u,u,u,u,u,u]
19 ; SSE41-NEXT:    pextrw $0, %xmm0, (%rdi)
20 ; SSE41-NEXT:    retq
21   %r = bitcast <4 x i8> %t to <2 x i16>
22   %o = extractelement <2 x i16> %r, i32 0
23   store i16 %o, i16* %p
24   ret void