Run DCE after a LoopFlatten test to reduce spurious output [nfc]
[llvm-project.git] / llvm / test / CodeGen / X86 / vec_insert-2.ll
blobbd1608588f3f379d317d4694d970ea12816f3fb9
1 ; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
2 ; RUN: llc < %s -mtriple=i686-unknown -mattr=+sse2,-sse4.1 | FileCheck %s --check-prefix=X86
3 ; RUN: llc < %s -mtriple=x86_64-unknown -mattr=+sse2,-sse4.1 | FileCheck %s --check-prefix=X64
5 define <4 x float> @t1(float %s, <4 x float> %tmp) nounwind {
6 ; X86-LABEL: t1:
7 ; X86:       # %bb.0:
8 ; X86-NEXT:    movss {{.*#+}} xmm1 = mem[0],zero,zero,zero
9 ; X86-NEXT:    shufps {{.*#+}} xmm1 = xmm1[0,1],xmm0[2,3]
10 ; X86-NEXT:    shufps {{.*#+}} xmm0 = xmm0[0,1],xmm1[2,0]
11 ; X86-NEXT:    retl
13 ; X64-LABEL: t1:
14 ; X64:       # %bb.0:
15 ; X64-NEXT:    shufps {{.*#+}} xmm0 = xmm0[0,1],xmm1[2,3]
16 ; X64-NEXT:    shufps {{.*#+}} xmm1 = xmm1[0,1],xmm0[2,0]
17 ; X64-NEXT:    movaps %xmm1, %xmm0
18 ; X64-NEXT:    retq
19   %tmp1 = insertelement <4 x float> %tmp, float %s, i32 3
20   ret <4 x float> %tmp1
23 define <4 x i32> @t2(i32 %s, <4 x i32> %tmp) nounwind {
24 ; X86-LABEL: t2:
25 ; X86:       # %bb.0:
26 ; X86-NEXT:    movss {{.*#+}} xmm1 = mem[0],zero,zero,zero
27 ; X86-NEXT:    shufps {{.*#+}} xmm1 = xmm1[0,1],xmm0[2,3]
28 ; X86-NEXT:    shufps {{.*#+}} xmm0 = xmm0[0,1],xmm1[2,0]
29 ; X86-NEXT:    retl
31 ; X64-LABEL: t2:
32 ; X64:       # %bb.0:
33 ; X64-NEXT:    movd %edi, %xmm1
34 ; X64-NEXT:    shufps {{.*#+}} xmm1 = xmm1[0,1],xmm0[2,3]
35 ; X64-NEXT:    shufps {{.*#+}} xmm0 = xmm0[0,1],xmm1[2,0]
36 ; X64-NEXT:    retq
37   %tmp1 = insertelement <4 x i32> %tmp, i32 %s, i32 3
38   ret <4 x i32> %tmp1
41 define <2 x double> @t3(double %s, <2 x double> %tmp) nounwind {
42 ; X86-LABEL: t3:
43 ; X86:       # %bb.0:
44 ; X86-NEXT:    movhps {{.*#+}} xmm0 = xmm0[0,1],mem[0,1]
45 ; X86-NEXT:    retl
47 ; X64-LABEL: t3:
48 ; X64:       # %bb.0:
49 ; X64-NEXT:    movlhps {{.*#+}} xmm1 = xmm1[0],xmm0[0]
50 ; X64-NEXT:    movaps %xmm1, %xmm0
51 ; X64-NEXT:    retq
52   %tmp1 = insertelement <2 x double> %tmp, double %s, i32 1
53   ret <2 x double> %tmp1
56 define <8 x i16> @t4(i16 %s, <8 x i16> %tmp) nounwind {
57 ; X86-LABEL: t4:
58 ; X86:       # %bb.0:
59 ; X86-NEXT:    pinsrw $5, {{[0-9]+}}(%esp), %xmm0
60 ; X86-NEXT:    retl
62 ; X64-LABEL: t4:
63 ; X64:       # %bb.0:
64 ; X64-NEXT:    pinsrw $5, %edi, %xmm0
65 ; X64-NEXT:    retq
66   %tmp1 = insertelement <8 x i16> %tmp, i16 %s, i32 5
67   ret <8 x i16> %tmp1