Run DCE after a LoopFlatten test to reduce spurious output [nfc]
[llvm-project.git] / llvm / test / CodeGen / X86 / pr51281.ll
blob3812f3fb448cd19ee9002b9ba7a2c73d61b87239
1 ; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py UTC_ARGS: --no_x86_scrub_mem_shuffle
2 ; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+avx | FileCheck %s
4 ; CHECK: .LCPI0_0:
5 ; CHECK-NEXT: .long   0x00000000
6 ; CHECK-NEXT: .zero   4
7 ; CHECK-NEXT: .long   0x3eb5dbc6
8 ; CHECK-NEXT: .long   0x3eb5dbc6
9 ; CHECK-NEXT: .zero   4
10 ; CHECK-NEXT: .long   0x3eb5dbc6
11 ; CHECK-NEXT: .long   0x3eb5dbc6
12 ; CHECK-NEXT: .long   0x3eb5dbc6
14 ; CHECK: .LCPI0_1:
15 ; CHECK-NEXT: .long   3
16 ; CHECK-NEXT: .long   3
17 ; CHECK-NEXT: .long   1
18 ; CHECK-NEXT: .long   1
19 ; CHECK-NEXT: .long   6
20 ; CHECK-NEXT: .long   7
21 ; CHECK-NEXT: .long   6
22 ; CHECK-NEXT: .long   4
24 define <16 x float> @PR51281(<8 x float> %a0) {
25 ; CHECK-LABEL: PR51281:
26 ; CHECK:       # %bb.0:
27 ; CHECK-NEXT:    vextractf128 $1, %ymm0, %xmm1
28 ; CHECK-NEXT:    vshufps {{.*#+}} xmm2 = xmm0[1,0],xmm1[3,0]
29 ; CHECK-NEXT:    vshufps {{.*#+}} xmm1 = xmm2[2,0],xmm1[1,3]
30 ; CHECK-NEXT:    vmovsldup {{.*#+}} xmm2 = xmm0[0,0,2,2]
31 ; CHECK-NEXT:    vinsertf128 $1, %xmm1, %ymm2, %ymm1
32 ; CHECK-NEXT:    vblendps $141, {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %ymm1, %ymm1 # ymm1 = mem[0],ymm1[1],mem[2,3],ymm1[4,5,6],mem[7]
33 ; CHECK-NEXT:    vperm2f128 {{.*#+}} ymm2 = ymm0[2,3,0,1]
34 ; CHECK-NEXT:    vblendps {{.*#+}} ymm0 = ymm2[0],ymm0[1],ymm2[2,3,4,5],ymm0[6],ymm2[7]
35 ; CHECK-NEXT:    vpermilps {{.*#+}} ymm0 = ymm0[3,3,1,1,6,7,6,4]
36 ; CHECK-NEXT:    retq
37   %shuffle = shufflevector <8 x float> %a0, <8 x float> <float poison, float 0x3FD6BB78C0000000, float poison, float poison, float poison, float poison, float 0.000000e+00, float poison>, <16 x i32> <i32 7, i32 7, i32 1, i32 1, i32 6, i32 3, i32 6, i32 0, i32 14, i32 0, i32 9, i32 9, i32 7, i32 1, i32 5, i32 9>
38   ret <16 x float> %shuffle