Run DCE after a LoopFlatten test to reduce spurious output [nfc]
[llvm-project.git] / llvm / test / CodeGen / X86 / vec_set-3.ll
blob14f1587a6d46ea10ab749318936b232975945307
1 ; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
2 ; RUN: llc < %s -mtriple=i386-unknown -mattr=+sse2,+sse4.1 | FileCheck %s --check-prefix=X86
3 ; RUN: llc < %s -mtriple=x86_64-unknown -mattr=+sse2,+sse4.1 | FileCheck %s --check-prefix=X64
5 define <4 x float> @test(float %a) {
6 ; X86-LABEL: test:
7 ; X86:       # %bb.0:
8 ; X86-NEXT:    insertps {{.*#+}} xmm0 = zero,mem[0],zero,zero
9 ; X86-NEXT:    retl
11 ; X64-LABEL: test:
12 ; X64:       # %bb.0:
13 ; X64-NEXT:    insertps {{.*#+}} xmm0 = zero,xmm0[0],zero,zero
14 ; X64-NEXT:    retq
15   %tmp = insertelement <4 x float> zeroinitializer, float %a, i32 1
16   %tmp5 = insertelement <4 x float> %tmp, float 0.000000e+00, i32 2
17   %tmp6 = insertelement <4 x float> %tmp5, float 0.000000e+00, i32 3
18   ret <4 x float> %tmp6
21 define <2 x i64> @test2(i32 %a) {
22 ; X86-LABEL: test2:
23 ; X86:       # %bb.0:
24 ; X86-NEXT:    movd {{.*#+}} xmm0 = mem[0],zero,zero,zero
25 ; X86-NEXT:    pshufd {{.*#+}} xmm0 = xmm0[1,1,0,1]
26 ; X86-NEXT:    retl
28 ; X64-LABEL: test2:
29 ; X64:       # %bb.0:
30 ; X64-NEXT:    movd %edi, %xmm0
31 ; X64-NEXT:    pshufd {{.*#+}} xmm0 = xmm0[1,1,0,1]
32 ; X64-NEXT:    retq
33   %tmp7 = insertelement <4 x i32> zeroinitializer, i32 %a, i32 2
34   %tmp9 = insertelement <4 x i32> %tmp7, i32 0, i32 3
35   %tmp10 = bitcast <4 x i32> %tmp9 to <2 x i64>
36   ret <2 x i64> %tmp10
39 define <4 x float> @test3(<4 x float> %A) {
40 ; X86-LABEL: test3:
41 ; X86:       # %bb.0:
42 ; X86-NEXT:    insertps {{.*#+}} xmm0 = zero,xmm0[0],zero,zero
43 ; X86-NEXT:    retl
45 ; X64-LABEL: test3:
46 ; X64:       # %bb.0:
47 ; X64-NEXT:    insertps {{.*#+}} xmm0 = zero,xmm0[0],zero,zero
48 ; X64-NEXT:    retq
49   %tmp0 = extractelement <4 x float> %A, i32 0
50   %tmp1 = insertelement <4 x float> <float 0.000000e+00, float undef, float undef, float undef >, float %tmp0, i32 1
51   %tmp2 = insertelement <4 x float> %tmp1, float 0.000000e+00, i32 2
52   ret <4 x float> %tmp2