Run DCE after a LoopFlatten test to reduce spurious output [nfc]
[llvm-project.git] / llvm / test / CodeGen / X86 / 2007-05-17-ShuffleISelBug.ll
blobd173ef226f9c10902ff200f8535e85b85adfe2f8
1 ; RUN: llc < %s -mtriple=i686-- -mattr=+sse2 | FileCheck %s
3 ; CHECK-NOT: punpckhwd
5 declare <16 x i8> @llvm.x86.sse2.packuswb.128(<8 x i16>, <8 x i16>)
7 declare <8 x i16> @llvm.x86.sse2.psrl.w(<8 x i16>, <8 x i16>)
9 define fastcc void @test(ptr %src, i32 %sbpr, ptr %dst, i32 %dbpr, i32 %w, i32 %h, i32 %dstalpha, i32 %mask) {
10         %tmp633 = shufflevector <8 x i16> zeroinitializer, <8 x i16> undef, <8 x i32> < i32 4, i32 4, i32 5, i32 5, i32 6, i32 6, i32 7, i32 7 >
11         %tmp715 = mul <8 x i16> zeroinitializer, %tmp633
12         %tmp776 = bitcast <8 x i16> %tmp715 to <4 x i32>
13         %tmp777 = add <4 x i32> %tmp776, shufflevector (<4 x i32> < i32 65537, i32 0, i32 0, i32 0 >, <4 x i32> < i32 65537, i32 0, i32 0, i32 0 >, <4 x i32> zeroinitializer)
14         %tmp805 = add <4 x i32> %tmp777, zeroinitializer
15         %tmp832 = bitcast <4 x i32> %tmp805 to <8 x i16>
16         %tmp838 = tail call <8 x i16> @llvm.x86.sse2.psrl.w( <8 x i16> %tmp832, <8 x i16> < i16 8, i16 undef, i16 undef, i16 undef, i16 undef, i16 undef, i16 undef, i16 undef > )
17         %tmp1020 = tail call <16 x i8> @llvm.x86.sse2.packuswb.128( <8 x i16> zeroinitializer, <8 x i16> %tmp838 )
18         %tmp1030 = bitcast <16 x i8> %tmp1020 to <4 x i32>
19         %tmp1033 = add <4 x i32> zeroinitializer, %tmp1030
20         %tmp1048 = bitcast <4 x i32> %tmp1033 to <2 x i64>
21         %tmp1049 = or <2 x i64> %tmp1048, zeroinitializer
22         store <2 x i64> %tmp1049, ptr null
23         ret void