Run DCE after a LoopFlatten test to reduce spurious output [nfc]
[llvm-project.git] / llvm / test / CodeGen / PowerPC / vsx-p8.ll
bloba0cd7991b6938eac4a6cf0eadafe1dedc05a8b6d
1 ; RUN: llc -verify-machineinstrs -mcpu=pwr8 -mattr=+power8-vector < %s | FileCheck %s
2 ; RUN: llc -verify-machineinstrs -mcpu=pwr8 -mattr=+power8-vector < %s | FileCheck -check-prefix=CHECK-REG %s
3 ; RUN: llc -verify-machineinstrs -mcpu=pwr8 -mattr=+power8-vector -fast-isel -O0 < %s | FileCheck %s
4 ; RUN: llc -verify-machineinstrs -mcpu=pwr8 -mattr=+power8-vector -fast-isel -O0 < %s | FileCheck -check-prefix=CHECK-FISL %s
5 target datalayout = "E-m:e-i64:64-n32:64"
6 target triple = "powerpc64-unknown-linux-gnu"
8 ; Unaligned loads/stores on P8 and later should use VSX where possible.
10 define <2 x double> @test28u(ptr %a) {
11   %v = load <2 x double>, ptr %a, align 8
12   ret <2 x double> %v
14 ; CHECK-LABEL: @test28u
15 ; CHECK: lxvd2x 34, 0, 3
16 ; CHECK: blr
19 define void @test29u(ptr %a, <2 x double> %b) {
20   store <2 x double> %b, ptr %a, align 8
21   ret void
23 ; CHECK-LABEL: @test29u
24 ; CHECK: stxvd2x 34, 0, 3
25 ; CHECK: blr
28 define <4 x float> @test32u(ptr %a) {
29   %v = load <4 x float>, ptr %a, align 8
30   ret <4 x float> %v
32 ; CHECK-REG-LABEL: @test32u
33 ; CHECK-REG: lxvw4x 34, 0, 3
34 ; CHECK-REG: blr
36 ; CHECK-FISL-LABEL: @test32u
37 ; CHECK-FISL: lxvw4x 34, 0, 3
38 ; CHECK-FISL: blr
41 define void @test33u(ptr %a, <4 x float> %b) {
42   store <4 x float> %b, ptr %a, align 8
43   ret void
45 ; CHECK-REG-LABEL: @test33u
46 ; CHECK-REG: stxvw4x 34, 0, 3
47 ; CHECK-REG: blr
49 ; CHECK-FISL-LABEL: @test33u
50 ; CHECK-FISL: stxvw4x 34, 0, 3
51 ; CHECK-FISL: blr