[X86] combineTargetShuffle - commute VPERMV3 shuffles so any load is on the RHS
[llvm-project.git] / llvm / test / CodeGen / SystemZ / vec-strict-mul-03.ll
bloba05ed27d4c65ae10786a10d306f12eb3663cfaab
1 ; Test strict vector multiplication on z14.
3 ; RUN: llc < %s -mtriple=s390x-linux-gnu -mcpu=z14 | FileCheck %s
5 declare float @llvm.experimental.constrained.fmul.f32(float, float, metadata, metadata)
6 declare <4 x float> @llvm.experimental.constrained.fmul.v4f32(<4 x float>, <4 x float>, metadata, metadata)
8 ; Test a v4f32 multiplication.
9 define <4 x float> @f1(<4 x float> %dummy, <4 x float> %val1,
10                        <4 x float> %val2) #0 {
11 ; CHECK-LABEL: f1:
12 ; CHECK: vfmsb %v24, %v26, %v28
13 ; CHECK: br %r14
14   %ret = call <4 x float> @llvm.experimental.constrained.fmul.v4f32(
15                         <4 x float> %val1, <4 x float> %val2,
16                         metadata !"round.dynamic",
17                         metadata !"fpexcept.strict") #0
18   ret <4 x float> %ret
21 ; Test an f32 multiplication that uses vector registers.
22 define float @f2(<4 x float> %val1, <4 x float> %val2) #0 {
23 ; CHECK-LABEL: f2:
24 ; CHECK: wfmsb %f0, %v24, %v26
25 ; CHECK: br %r14
26   %scalar1 = extractelement <4 x float> %val1, i32 0
27   %scalar2 = extractelement <4 x float> %val2, i32 0
28   %ret = call float @llvm.experimental.constrained.fmul.f32(
29                         float %scalar1, float %scalar2,
30                         metadata !"round.dynamic",
31                         metadata !"fpexcept.strict") #0
32   ret float %ret
35 attributes #0 = { strictfp }