Run DCE after a LoopFlatten test to reduce spurious output [nfc]
[llvm-project.git] / llvm / test / CodeGen / PowerPC / vec_buildvector_loadstore.ll
blob880f4baeb88546ab08093909d9b112efa9ff7c06
1 ; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
2 ; RUN: llc -verify-machineinstrs < %s -mtriple=powerpc-unknown-linux-gnu -mattr=+altivec -disable-ppc-ilp-pref  | FileCheck %s
3 ; Formerly this did byte loads and word stores.
4 @a = external global <16 x i8>
5 @b = external global <16 x i8>
6 @c = external global <16 x i8>
8 define void @foo() nounwind ssp {
9 ; CHECK-LABEL: foo:
10 ; CHECK:       # %bb.0: # %entry
11 ; CHECK-NEXT:    li 3, a@l
12 ; CHECK-NEXT:    lis 4, a@ha
13 ; CHECK-NEXT:    lvx 2, 4, 3
14 ; CHECK-NEXT:    li 3, .LCPI0_0@l
15 ; CHECK-NEXT:    lis 4, .LCPI0_0@ha
16 ; CHECK-NEXT:    lvx 3, 4, 3
17 ; CHECK-NEXT:    vxor 4, 4, 4
18 ; CHECK-NEXT:    li 3, c@l
19 ; CHECK-NEXT:    lis 4, c@ha
20 ; CHECK-NEXT:    vperm 2, 4, 2, 3
21 ; CHECK-NEXT:    stvx 2, 4, 3
22 ; CHECK-NEXT:    blr
23 entry:
24     %tmp0 = load <16 x i8>, ptr @a, align 16
25   %tmp180.i = extractelement <16 x i8> %tmp0, i32 0 ; <i8> [#uses=1]
26   %tmp181.i = insertelement <16 x i8> <i8 0, i8 0, i8 undef, i8 undef, i8 undef, i8 undef, i8 undef, i8 undef, i8 undef, i8 undef, i8 undef, i8 undef, i8 undef, i8 undef, i8 undef, i8 undef>, i8 %tmp180.i, i32 2 ; <<16 x i8>> [#uses=1]
27   %tmp182.i = extractelement <16 x i8> %tmp0, i32 1 ; <i8> [#uses=1]
28   %tmp183.i = insertelement <16 x i8> %tmp181.i, i8 %tmp182.i, i32 3 ; <<16 x i8>> [#uses=1]
29   %tmp184.i = insertelement <16 x i8> %tmp183.i, i8 0, i32 4 ; <<16 x i8>> [#uses=1]
30   %tmp185.i = insertelement <16 x i8> %tmp184.i, i8 0, i32 5 ; <<16 x i8>> [#uses=1]
31   %tmp186.i = extractelement <16 x i8> %tmp0, i32 4 ; <i8> [#uses=1]
32   %tmp187.i = insertelement <16 x i8> %tmp185.i, i8 %tmp186.i, i32 6 ; <<16 x i8>> [#uses=1]
33   %tmp188.i = extractelement <16 x i8> %tmp0, i32 5 ; <i8> [#uses=1]
34   %tmp189.i = insertelement <16 x i8> %tmp187.i, i8 %tmp188.i, i32 7 ; <<16 x i8>> [#uses=1]
35   %tmp190.i = insertelement <16 x i8> %tmp189.i, i8 0, i32 8 ; <<16 x i8>> [#uses=1]
36   %tmp191.i = insertelement <16 x i8> %tmp190.i, i8 0, i32 9 ; <<16 x i8>> [#uses=1]
37   %tmp192.i = extractelement <16 x i8> %tmp0, i32 8 ; <i8> [#uses=1]
38   %tmp193.i = insertelement <16 x i8> %tmp191.i, i8 %tmp192.i, i32 10 ; <<16 x i8>> [#uses=1]
39   %tmp194.i = extractelement <16 x i8> %tmp0, i32 9 ; <i8> [#uses=1]
40   %tmp195.i = insertelement <16 x i8> %tmp193.i, i8 %tmp194.i, i32 11 ; <<16 x i8>> [#uses=1]
41   %tmp196.i = insertelement <16 x i8> %tmp195.i, i8 0, i32 12 ; <<16 x i8>> [#uses=1]
42   %tmp197.i = insertelement <16 x i8> %tmp196.i, i8 0, i32 13 ; <<16 x i8>> [#uses=1]
43 %tmp201 = shufflevector <16 x i8> %tmp197.i, <16 x i8> %tmp0, <16 x i32> <i32 0, i32 1, i32 2, i32 3, i32 4, i32 5, i32 6, i32 7, i32 8, i32 9, i32 10, i32 11, i32 12, i32 13, i32 28, i32 29>; ModuleID = 'try.c'
44     store <16 x i8> %tmp201, ptr @c, align 16
45     br label %return
47 return:         ; preds = %bb2
48         ret void