Run DCE after a LoopFlatten test to reduce spurious output [nfc]
[llvm-project.git] / llvm / test / CodeGen / X86 / movddup-load-fold.ll
blob79a744f65a00a34b11ade550843dbdc4203e5bf0
1 ; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
2 ; RUN: llc < %s -mtriple=i686-- -mattr=+sse4.1   | FileCheck %s --check-prefix=SSE
3 ; RUN: llc < %s -mtriple=i686-- -mattr=+avx      | FileCheck %s --check-prefix=AVX
4 ; RUN: llc < %s -mtriple=i686-- -mattr=+avx2     | FileCheck %s --check-prefix=AVX
5 ; RUN: llc < %s -mtriple=i686-- -mattr=+avx512vl | FileCheck %s --check-prefix=AVX
7 ; Test an isel pattern for a splatted VZLOAD.
9 define <4 x float> @movddup_load_fold(float %x, float %y) {
10 ; SSE-LABEL: movddup_load_fold:
11 ; SSE:       # %bb.0:
12 ; SSE-NEXT:    movddup {{.*#+}} xmm0 = mem[0,0]
13 ; SSE-NEXT:    retl
15 ; AVX-LABEL: movddup_load_fold:
16 ; AVX:       # %bb.0:
17 ; AVX-NEXT:    vmovddup {{.*#+}} xmm0 = mem[0,0]
18 ; AVX-NEXT:    retl
19   %i0 = insertelement <4 x float> zeroinitializer, float %x, i32 0
20   %i1 = insertelement <4 x float> %i0, float %y, i32 1
21   %dup = shufflevector <4 x float> %i1, <4 x float> undef, <4 x i32> <i32 0, i32 1, i32 0, i32 1>
22   ret <4 x float> %dup