Run DCE after a LoopFlatten test to reduce spurious output [nfc]
[llvm-project.git] / llvm / test / CodeGen / X86 / 2012-07-15-broadcastfold.ll
blobecd93d7e87700c24469485b260d4a2ab77ca7f86
1 ; RUN: llc < %s -mtriple=i686-- -mcpu=corei7 -mattr=+avx2 | FileCheck %s
3 declare x86_fastcallcc i64 @barrier()
5 ;CHECK-LABEL: bcast_fold:
6 ;CHECK: vmov{{[au]}}ps %xmm{{[0-9]+}}, [[SPILLED:[^\)]+\)]]
7 ;CHECK: barrier
8 ;CHECK: vbroadcastss [[SPILLED]], %ymm0
9 ;CHECK: ret
10 define <8 x float> @bcast_fold( ptr %A) {
11 BB:
12   %A0 = load float, ptr %A
13   %tt3 = call x86_fastcallcc i64 @barrier()
14   br i1 undef, label %work, label %exit
16 work:
17   %A1 = insertelement <8 x float> undef, float %A0, i32 0
18   %A2 = shufflevector <8 x float> %A1, <8 x float> undef, <8 x i32> <i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0>
19   ret <8 x float> %A2
21 exit:
22   ret <8 x float> undef