[X86] combineTargetShuffle - commute VPERMV3 shuffles so any load is on the RHS
[llvm-project.git] / llvm / test / CodeGen / SystemZ / vec-mul-04.ll
blobad48d0446e871b082b8e2eaf16c41ceeade2fdd0
1 ; Test vector multiply-and-add on z14.
3 ; RUN: llc < %s -mtriple=s390x-linux-gnu -mcpu=z14 | FileCheck %s
5 declare <4 x float> @llvm.fma.v4f32(<4 x float>, <4 x float>, <4 x float>)
7 ; Test a v4f32 multiply-and-add.
8 define <4 x float> @f1(<4 x float> %dummy, <4 x float> %val1,
9                        <4 x float> %val2, <4 x float> %val3) {
10 ; CHECK-LABEL: f1:
11 ; CHECK: vfmasb %v24, %v26, %v28, %v30
12 ; CHECK: br %r14
13   %ret = call <4 x float> @llvm.fma.v4f32 (<4 x float> %val1,
14                                            <4 x float> %val2,
15                                            <4 x float> %val3)
16   ret <4 x float> %ret
19 ; Test a v4f32 multiply-and-subtract.
20 define <4 x float> @f2(<4 x float> %dummy, <4 x float> %val1,
21                        <4 x float> %val2, <4 x float> %val3) {
22 ; CHECK-LABEL: f2:
23 ; CHECK: vfmssb %v24, %v26, %v28, %v30
24 ; CHECK: br %r14
25   %negval3 = fneg <4 x float> %val3
26   %ret = call <4 x float> @llvm.fma.v4f32 (<4 x float> %val1,
27                                            <4 x float> %val2,
28                                            <4 x float> %negval3)
29   ret <4 x float> %ret