Run DCE after a LoopFlatten test to reduce spurious output [nfc]
[llvm-project.git] / llvm / test / CodeGen / X86 / pr34592.ll
blob9887dac76e20b40a1ad52454d265c2f60a2d81fd
1 ; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
2 ; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=avx2 -O0 | FileCheck %s
4 define <16 x i64> @pluto(<16 x i64> %arg, <16 x i64> %arg1, <16 x i64> %arg2, <16 x i64> %arg3, <16 x i64> %arg4) {
5 ; CHECK-LABEL: pluto:
6 ; CHECK:       # %bb.0: # %bb
7 ; CHECK-NEXT:    pushq %rbp
8 ; CHECK-NEXT:    .cfi_def_cfa_offset 16
9 ; CHECK-NEXT:    .cfi_offset %rbp, -16
10 ; CHECK-NEXT:    movq %rsp, %rbp
11 ; CHECK-NEXT:    .cfi_def_cfa_register %rbp
12 ; CHECK-NEXT:    andq $-32, %rsp
13 ; CHECK-NEXT:    subq $32, %rsp
14 ; CHECK-NEXT:    vmovaps %ymm4, %ymm10
15 ; CHECK-NEXT:    vmovaps %ymm3, %ymm9
16 ; CHECK-NEXT:    vmovaps %ymm1, %ymm8
17 ; CHECK-NEXT:    vmovaps 240(%rbp), %ymm4
18 ; CHECK-NEXT:    vmovaps 208(%rbp), %ymm3
19 ; CHECK-NEXT:    vmovaps 176(%rbp), %ymm1
20 ; CHECK-NEXT:    vmovaps 144(%rbp), %ymm1
21 ; CHECK-NEXT:    vmovaps 112(%rbp), %ymm11
22 ; CHECK-NEXT:    vmovaps 80(%rbp), %ymm11
23 ; CHECK-NEXT:    vmovaps 48(%rbp), %ymm11
24 ; CHECK-NEXT:    vmovaps 16(%rbp), %ymm11
25 ; CHECK-NEXT:    vpblendd {{.*#+}} ymm0 = ymm6[0,1,2,3,4,5],ymm2[6,7]
26 ; CHECK-NEXT:    vpunpcklqdq {{.*#+}} ymm1 = ymm1[0],ymm3[0],ymm1[2],ymm3[2]
27 ; CHECK-NEXT:    vpermq {{.*#+}} ymm1 = ymm1[0,2,1,3]
28 ; CHECK-NEXT:    vpermq {{.*#+}} ymm0 = ymm0[3,1,2,1]
29 ; CHECK-NEXT:    vpblendd {{.*#+}} ymm0 = ymm0[0,1],ymm1[2,3,4,5],ymm0[6,7]
30 ; CHECK-NEXT:    vperm2i128 {{.*#+}} ymm1 = ymm7[2,3],ymm6[0,1]
31 ; CHECK-NEXT:    vxorps %xmm2, %xmm2, %xmm2
32 ; CHECK-NEXT:    vpblendd {{.*#+}} ymm2 = ymm1[0,1],ymm2[2,3],ymm1[4,5,6,7]
33 ; CHECK-NEXT:    vpunpcklqdq {{.*#+}} ymm1 = ymm7[0],ymm5[0],ymm7[2],ymm5[2]
34 ; CHECK-NEXT:    vpermq {{.*#+}} ymm1 = ymm1[2,1,2,3]
35 ; CHECK-NEXT:    vpermq {{.*#+}} ymm4 = ymm4[1,1,1,1]
36 ; CHECK-NEXT:    vpblendd {{.*#+}} ymm1 = ymm1[0,1],ymm4[2,3,4,5],ymm1[6,7]
37 ; CHECK-NEXT:    vmovaps %xmm3, %xmm4
38 ; CHECK-NEXT:    vmovaps %xmm7, %xmm3
39 ; CHECK-NEXT:    vpblendd {{.*#+}} xmm4 = xmm3[0,1],xmm4[2,3]
40 ; CHECK-NEXT:    # implicit-def: $ymm3
41 ; CHECK-NEXT:    vmovaps %xmm4, %xmm3
42 ; CHECK-NEXT:    vpermq {{.*#+}} ymm4 = ymm3[0,0,1,3]
43 ; CHECK-NEXT:    vpslldq {{.*#+}} ymm3 = zero,zero,zero,zero,zero,zero,zero,zero,ymm5[0,1,2,3,4,5,6,7],zero,zero,zero,zero,zero,zero,zero,zero,ymm5[16,17,18,19,20,21,22,23]
44 ; CHECK-NEXT:    vpblendd {{.*#+}} ymm3 = ymm3[0,1],ymm4[2,3,4,5],ymm3[6,7]
45 ; CHECK-NEXT:    movq %rbp, %rsp
46 ; CHECK-NEXT:    popq %rbp
47 ; CHECK-NEXT:    .cfi_def_cfa %rsp, 8
48 ; CHECK-NEXT:    retq
49 bb:
50   %tmp = select <16 x i1> <i1 false, i1 false, i1 false, i1 false, i1 false, i1 false, i1 false, i1 false, i1 false, i1 false, i1 true, i1 true, i1 false, i1 false, i1 false, i1 false>, <16 x i64> %arg, <16 x i64> %arg1
51   %tmp5 = select <16 x i1> <i1 true, i1 false, i1 false, i1 true, i1 true, i1 false, i1 false, i1 true, i1 false, i1 true, i1 false, i1 false, i1 false, i1 false, i1 false, i1 false>, <16 x i64> %arg2, <16 x i64> zeroinitializer
52   %tmp6 = select <16 x i1> <i1 false, i1 true, i1 true, i1 true, i1 false, i1 false, i1 false, i1 false, i1 true, i1 true, i1 false, i1 false, i1 false, i1 true, i1 true, i1 true>, <16 x i64> %arg3, <16 x i64> %tmp5
53   %tmp7 = shufflevector <16 x i64> %tmp, <16 x i64> %tmp6, <16 x i32> <i32 11, i32 18, i32 24, i32 9, i32 14, i32 29, i32 29, i32 6, i32 14, i32 28, i32 8, i32 9, i32 22, i32 12, i32 25, i32 6>
54   ret <16 x i64> %tmp7