Run DCE after a LoopFlatten test to reduce spurious output [nfc]
[llvm-project.git] / llvm / test / CodeGen / X86 / opt-shuff-tstore.ll
blob0a2d4e9ba9fe83e061decc0242d790a61f29a6a1
1 ; RUN: llc -mcpu=corei7 -mtriple=x86_64-linux < %s  -mattr=+sse2,+sse4.1 | FileCheck %s
3 ; CHECK: func_4_8
4 ; A single memory write
5 ; CHECK: movd
6 ; CHECK-NEXT: ret
7 define void @func_4_8(<4 x i8> %param, ptr %p) {
8   %r = add <4 x i8> %param, <i8 1, i8 2, i8 3, i8 4>
9   store <4 x i8> %r, ptr %p
10   ret void
13 ; CHECK: func_4_16
14 ; CHECK: movq
15 ; CHECK-NEXT: ret
16 define void @func_4_16(<4 x i16> %param, ptr %p) {
17   %r = add <4 x i16> %param, <i16 1, i16 2, i16 3, i16 4>
18   store <4 x i16> %r, ptr %p
19   ret void
22 ; CHECK: func_8_8
23 ; CHECK: movq
24 ; CHECK-NEXT: ret
25 define void @func_8_8(<8 x i8> %param, ptr %p) {
26   %r = add <8 x i8> %param, <i8 1, i8 2, i8 3, i8 4, i8 1, i8 2, i8 3, i8 4>
27   store <8 x i8> %r, ptr %p
28   ret void
31 ; CHECK: func_2_32
32 ; CHECK: movq
33 ; CHECK-NEXT: ret
34 define void @func_2_32(<2 x i32> %param, ptr %p) {
35   %r = add <2 x i32> %param, <i32 1, i32 2>
36   store <2 x i32> %r, ptr %p
37   ret void