[X86] combineTargetShuffle - commute VPERMV3 shuffles so any load is on the RHS
[llvm-project.git] / llvm / test / CodeGen / SystemZ / fp-mul-08.ll
blob543ab9555169076bed0a60a859a0fc7f0efe3f4a
1 ; RUN: llc < %s -mtriple=s390x-linux-gnu -mcpu=z10 \
2 ; RUN:   | FileCheck -check-prefix=CHECK -check-prefix=CHECK-SCALAR %s
3 ; RUN: llc < %s -mtriple=s390x-linux-gnu -mcpu=z14 \
4 ; RUN:   | FileCheck -check-prefix=CHECK -check-prefix=CHECK-VECTOR %s
6 declare float @llvm.fma.f32(float %f1, float %f2, float %f3)
8 define float @f1(float %f1, float %f2, float %acc) {
9 ; CHECK-LABEL: f1:
10 ; CHECK-SCALAR: msebr %f4, %f0, %f2
11 ; CHECK-SCALAR: ler %f0, %f4
12 ; CHECK-VECTOR: wfmssb %f0, %f0, %f2, %f4
13 ; CHECK: br %r14
14   %negacc = fneg float %acc
15   %res = call float @llvm.fma.f32 (float %f1, float %f2, float %negacc)
16   ret float %res
19 define float @f2(float %f1, ptr %ptr, float %acc) {
20 ; CHECK-LABEL: f2:
21 ; CHECK: mseb %f2, %f0, 0(%r2)
22 ; CHECK-SCALAR: ler %f0, %f2
23 ; CHECK-VECTOR: ldr %f0, %f2
24 ; CHECK: br %r14
25   %f2 = load float, ptr %ptr
26   %negacc = fneg float %acc
27   %res = call float @llvm.fma.f32 (float %f1, float %f2, float %negacc)
28   ret float %res
31 define float @f3(float %f1, ptr %base, float %acc) {
32 ; CHECK-LABEL: f3:
33 ; CHECK: mseb %f2, %f0, 4092(%r2)
34 ; CHECK-SCALAR: ler %f0, %f2
35 ; CHECK-VECTOR: ldr %f0, %f2
36 ; CHECK: br %r14
37   %ptr = getelementptr float, ptr %base, i64 1023
38   %f2 = load float, ptr %ptr
39   %negacc = fneg float %acc
40   %res = call float @llvm.fma.f32 (float %f1, float %f2, float %negacc)
41   ret float %res
44 define float @f4(float %f1, ptr %base, float %acc) {
45 ; The important thing here is that we don't generate an out-of-range
46 ; displacement.  Other sequences besides this one would be OK.
48 ; CHECK-LABEL: f4:
49 ; CHECK: aghi %r2, 4096
50 ; CHECK: mseb %f2, %f0, 0(%r2)
51 ; CHECK-SCALAR: ler %f0, %f2
52 ; CHECK-VECTOR: ldr %f0, %f2
53 ; CHECK: br %r14
54   %ptr = getelementptr float, ptr %base, i64 1024
55   %f2 = load float, ptr %ptr
56   %negacc = fneg float %acc
57   %res = call float @llvm.fma.f32 (float %f1, float %f2, float %negacc)
58   ret float %res
61 define float @f5(float %f1, ptr %base, float %acc) {
62 ; Here too the important thing is that we don't generate an out-of-range
63 ; displacement.  Other sequences besides this one would be OK.
65 ; CHECK-LABEL: f5:
66 ; CHECK: aghi %r2, -4
67 ; CHECK: mseb %f2, %f0, 0(%r2)
68 ; CHECK-SCALAR: ler %f0, %f2
69 ; CHECK-VECTOR: ldr %f0, %f2
70 ; CHECK: br %r14
71   %ptr = getelementptr float, ptr %base, i64 -1
72   %f2 = load float, ptr %ptr
73   %negacc = fneg float %acc
74   %res = call float @llvm.fma.f32 (float %f1, float %f2, float %negacc)
75   ret float %res
78 define float @f6(float %f1, ptr %base, i64 %index, float %acc) {
79 ; CHECK-LABEL: f6:
80 ; CHECK: sllg %r1, %r3, 2
81 ; CHECK: mseb %f2, %f0, 0(%r1,%r2)
82 ; CHECK-SCALAR: ler %f0, %f2
83 ; CHECK-VECTOR: ldr %f0, %f2
84 ; CHECK: br %r14
85   %ptr = getelementptr float, ptr %base, i64 %index
86   %f2 = load float, ptr %ptr
87   %negacc = fneg float %acc
88   %res = call float @llvm.fma.f32 (float %f1, float %f2, float %negacc)
89   ret float %res
92 define float @f7(float %f1, ptr %base, i64 %index, float %acc) {
93 ; CHECK-LABEL: f7:
94 ; CHECK: sllg %r1, %r3, 2
95 ; CHECK: mseb %f2, %f0, 4092({{%r1,%r2|%r2,%r1}})
96 ; CHECK-SCALAR: ler %f0, %f2
97 ; CHECK-VECTOR: ldr %f0, %f2
98 ; CHECK: br %r14
99   %index2 = add i64 %index, 1023
100   %ptr = getelementptr float, ptr %base, i64 %index2
101   %f2 = load float, ptr %ptr
102   %negacc = fneg float %acc
103   %res = call float @llvm.fma.f32 (float %f1, float %f2, float %negacc)
104   ret float %res
107 define float @f8(float %f1, ptr %base, i64 %index, float %acc) {
108 ; CHECK-LABEL: f8:
109 ; CHECK: sllg %r1, %r3, 2
110 ; CHECK: lay %r1, 4096({{%r1,%r2|%r2,%r1}})
111 ; CHECK: mseb %f2, %f0, 0(%r1)
112 ; CHECK-SCALAR: ler %f0, %f2
113 ; CHECK-VECTOR: ldr %f0, %f2
114 ; CHECK: br %r14
115   %index2 = add i64 %index, 1024
116   %ptr = getelementptr float, ptr %base, i64 %index2
117   %f2 = load float, ptr %ptr
118   %negacc = fneg float %acc
119   %res = call float @llvm.fma.f32 (float %f1, float %f2, float %negacc)
120   ret float %res