Run DCE after a LoopFlatten test to reduce spurious output [nfc]
[llvm-project.git] / llvm / test / CodeGen / PowerPC / p10-splatImm32-undef.ll
blobad6a576fbf50ef25be833c7d7d6d1bba7195790f
1 ; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
2 ; RUN: llc -verify-machineinstrs -mtriple=powerpc64le-unknown-linux-gnu \
3 ; RUN:     -ppc-asm-full-reg-names -mcpu=pwr10 < %s | \
4 ; RUN:     FileCheck %s --check-prefix=CHECK-LINUX
5 ; RUN: llc -verify-machineinstrs -mtriple=powerpc64-unknown-linux-gnu \
6 ; RUN:     -ppc-asm-full-reg-names -mcpu=pwr10 < %s | \
7 ; RUN:     FileCheck %s --check-prefix=CHECK-LINUX-BE
8 ; RUN: llc -verify-machineinstrs -mtriple=powerpc64-ibm-aix-xcoff \
9 ; RUN:     -ppc-asm-full-reg-names -mcpu=pwr10 < %s | \
10 ; RUN:     FileCheck %s --check-prefix=CHECK-AIX
11 ; RUN: llc -verify-machineinstrs -mtriple=powerpc-unknown-linux-gnu \
12 ; RUN:     -ppc-asm-full-reg-names -mcpu=pwr10 < %s | \
13 ; RUN:     FileCheck %s --check-prefix=CHECK-LINUX-32
14 ; RUN: llc -verify-machineinstrs -mtriple=powerpc-ibm-aix-xcoff \
15 ; RUN:     -ppc-asm-full-reg-names -mcpu=pwr10 < %s | \
16 ; RUN:     FileCheck %s --check-prefix=CHECK-AIX-32
18 declare hidden i32 @call1()
19 define hidden void @function1() {
20 ; CHECK-LINUX-LABEL: function1:
21 ; CHECK-LINUX:       # %bb.0: # %entry
22 ; CHECK-LINUX-NEXT:    mflr r0
23 ; CHECK-LINUX-NEXT:    std r0, 16(r1)
24 ; CHECK-LINUX-NEXT:    stdu r1, -32(r1)
25 ; CHECK-LINUX-NEXT:    .cfi_def_cfa_offset 32
26 ; CHECK-LINUX-NEXT:    .cfi_offset lr, 16
27 ; CHECK-LINUX-NEXT:    bl call1@notoc
28 ; CHECK-LINUX-NEXT:    addi r1, r1, 32
29 ; CHECK-LINUX-NEXT:    ld r0, 16(r1)
30 ; CHECK-LINUX-NEXT:    mtlr r0
31 ; CHECK-LINUX-NEXT:    blr
33 ; CHECK-LINUX-BE-LABEL: function1:
34 ; CHECK-LINUX-BE:       # %bb.0: # %entry
35 ; CHECK-LINUX-BE-NEXT:    mflr r0
36 ; CHECK-LINUX-BE-NEXT:    std r0, 16(r1)
37 ; CHECK-LINUX-BE-NEXT:    stdu r1, -112(r1)
38 ; CHECK-LINUX-BE-NEXT:    .cfi_def_cfa_offset 112
39 ; CHECK-LINUX-BE-NEXT:    .cfi_offset lr, 16
40 ; CHECK-LINUX-BE-NEXT:    bl call1
41 ; CHECK-LINUX-BE-NEXT:    nop
42 ; CHECK-LINUX-BE-NEXT:    addi r1, r1, 112
43 ; CHECK-LINUX-BE-NEXT:    ld r0, 16(r1)
44 ; CHECK-LINUX-BE-NEXT:    mtlr r0
45 ; CHECK-LINUX-BE-NEXT:    blr
47 ; CHECK-AIX-LABEL: function1:
48 ; CHECK-AIX:       # %bb.0: # %entry
49 ; CHECK-AIX-NEXT:    mflr r0
50 ; CHECK-AIX-NEXT:    std r0, 16(r1)
51 ; CHECK-AIX-NEXT:    stdu r1, -112(r1)
52 ; CHECK-AIX-NEXT:    bl .call1[PR]
53 ; CHECK-AIX-NEXT:    nop
54 ; CHECK-AIX-NEXT:    addi r1, r1, 112
55 ; CHECK-AIX-NEXT:    ld r0, 16(r1)
56 ; CHECK-AIX-NEXT:    mtlr r0
57 ; CHECK-AIX-NEXT:    blr
59 ; CHECK-LINUX-32-LABEL: function1:
60 ; CHECK-LINUX-32:       # %bb.0: # %entry
61 ; CHECK-LINUX-32-NEXT:    mflr r0
62 ; CHECK-LINUX-32-NEXT:    stw r0, 4(r1)
63 ; CHECK-LINUX-32-NEXT:    stwu r1, -48(r1)
64 ; CHECK-LINUX-32-NEXT:    .cfi_def_cfa_offset 48
65 ; CHECK-LINUX-32-NEXT:    .cfi_offset lr, 4
66 ; CHECK-LINUX-32-NEXT:    bl call1
67 ; CHECK-LINUX-32-NEXT:    li r4, 0
68 ; CHECK-LINUX-32-NEXT:    stw r3, 16(r1)
69 ; CHECK-LINUX-32-NEXT:    stw r4, 32(r1)
70 ; CHECK-LINUX-32-NEXT:    lwz r0, 52(r1)
71 ; CHECK-LINUX-32-NEXT:    addi r1, r1, 48
72 ; CHECK-LINUX-32-NEXT:    mtlr r0
73 ; CHECK-LINUX-32-NEXT:    blr
75 ; CHECK-AIX-32-LABEL: function1:
76 ; CHECK-AIX-32:       # %bb.0: # %entry
77 ; CHECK-AIX-32-NEXT:    mflr r0
78 ; CHECK-AIX-32-NEXT:    stw r0, 8(r1)
79 ; CHECK-AIX-32-NEXT:    stwu r1, -96(r1)
80 ; CHECK-AIX-32-NEXT:    bl .call1[PR]
81 ; CHECK-AIX-32-NEXT:    nop
82 ; CHECK-AIX-32-NEXT:    li r4, 0
83 ; CHECK-AIX-32-NEXT:    stw r3, 64(r1)
84 ; CHECK-AIX-32-NEXT:    stw r4, 80(r1)
85 ; CHECK-AIX-32-NEXT:    addi r1, r1, 96
86 ; CHECK-AIX-32-NEXT:    lwz r0, 8(r1)
87 ; CHECK-AIX-32-NEXT:    mtlr r0
88 ; CHECK-AIX-32-NEXT:    blr
89 entry:
90   %tailcall1 = tail call i32 @call1()
91   %0 = insertelement <4 x i32> poison, i32 %tailcall1, i64 1
92   %1 = insertelement <4 x i32> %0, i32 0, i64 2
93   %2 = insertelement <4 x i32> %1, i32 0, i64 3
94   %3 = trunc <4 x i32> %2 to <4 x i8>
95   %4 = icmp eq <4 x i8> %3, zeroinitializer
96   %5 = shufflevector <4 x i1> %4, <4 x i1> poison, <2 x i32> <i32 3, i32 undef>
97   %6 = shufflevector <4 x i1> %4, <4 x i1> poison, <2 x i32> <i32 2, i32 undef>
98   %7 = xor <2 x i1> %5, <i1 true, i1 poison>
99   %8 = shufflevector <2 x i1> %7, <2 x i1> poison, <2 x i32> zeroinitializer
100   %9 = zext <2 x i1> %8 to <2 x i64>
101   %10 = xor <2 x i1> %6, <i1 true, i1 poison>
102   %11 = shufflevector <2 x i1> %10, <2 x i1> poison, <2 x i32> zeroinitializer
103   %12 = zext <2 x i1> %11 to <2 x i64>
104   br label %next_block
106 next_block:
107   %13 = add <2 x i64> zeroinitializer, %9
108   %14 = add <2 x i64> zeroinitializer, %12
109   %shift704 = shufflevector <2 x i64> %13, <2 x i64> poison, <2 x i32> <i32 1, i32 undef>
110   %15 = add <2 x i64> %shift704, %13
111   %shift705 = shufflevector <2 x i64> %14, <2 x i64> poison, <2 x i32> <i32 1, i32 undef>
112   %16 = add <2 x i64> %shift705, %14
113   ret void