Run DCE after a LoopFlatten test to reduce spurious output [nfc]
[llvm-project.git] / llvm / test / CodeGen / VE / VELIntrinsics / vfsub.ll
blob31a65010f0eb1dd294fe1e272a7475d297a64506
1 ; RUN: llc < %s -mtriple=ve -mattr=+vpu | FileCheck %s
3 ;;; Test vector floating subtract intrinsic instructions
4 ;;;
5 ;;; Note:
6 ;;;   We test VFSUB*vvl, VFSUB*vvl_v, VFSUB*rvl, VFSUB*rvl_v, VFSUB*vvml_v,
7 ;;;   VFSUB*rvml_v, PVFSUB*vvl, PVFSUB*vvl_v, PVFSUB*rvl, PVFSUB*rvl_v,
8 ;;;   PVFSUB*vvml_v, and PVFSUB*rvml_v instructions.
10 ; Function Attrs: nounwind readnone
11 define fastcc <256 x double> @vfsubd_vvvl(<256 x double> %0, <256 x double> %1) {
12 ; CHECK-LABEL: vfsubd_vvvl:
13 ; CHECK:       # %bb.0:
14 ; CHECK-NEXT:    lea %s0, 256
15 ; CHECK-NEXT:    lvl %s0
16 ; CHECK-NEXT:    vfsub.d %v0, %v0, %v1
17 ; CHECK-NEXT:    b.l.t (, %s10)
18   %3 = tail call fast <256 x double> @llvm.ve.vl.vfsubd.vvvl(<256 x double> %0, <256 x double> %1, i32 256)
19   ret <256 x double> %3
22 ; Function Attrs: nounwind readnone
23 declare <256 x double> @llvm.ve.vl.vfsubd.vvvl(<256 x double>, <256 x double>, i32)
25 ; Function Attrs: nounwind readnone
26 define fastcc <256 x double> @vfsubd_vvvvl(<256 x double> %0, <256 x double> %1, <256 x double> %2) {
27 ; CHECK-LABEL: vfsubd_vvvvl:
28 ; CHECK:       # %bb.0:
29 ; CHECK-NEXT:    lea %s0, 128
30 ; CHECK-NEXT:    lvl %s0
31 ; CHECK-NEXT:    vfsub.d %v2, %v0, %v1
32 ; CHECK-NEXT:    lea %s16, 256
33 ; CHECK-NEXT:    lvl %s16
34 ; CHECK-NEXT:    vor %v0, (0)1, %v2
35 ; CHECK-NEXT:    b.l.t (, %s10)
36   %4 = tail call fast <256 x double> @llvm.ve.vl.vfsubd.vvvvl(<256 x double> %0, <256 x double> %1, <256 x double> %2, i32 128)
37   ret <256 x double> %4
40 ; Function Attrs: nounwind readnone
41 declare <256 x double> @llvm.ve.vl.vfsubd.vvvvl(<256 x double>, <256 x double>, <256 x double>, i32)
43 ; Function Attrs: nounwind readnone
44 define fastcc <256 x double> @vfsubd_vsvl(double %0, <256 x double> %1) {
45 ; CHECK-LABEL: vfsubd_vsvl:
46 ; CHECK:       # %bb.0:
47 ; CHECK-NEXT:    lea %s1, 256
48 ; CHECK-NEXT:    lvl %s1
49 ; CHECK-NEXT:    vfsub.d %v0, %s0, %v0
50 ; CHECK-NEXT:    b.l.t (, %s10)
51   %3 = tail call fast <256 x double> @llvm.ve.vl.vfsubd.vsvl(double %0, <256 x double> %1, i32 256)
52   ret <256 x double> %3
55 ; Function Attrs: nounwind readnone
56 declare <256 x double> @llvm.ve.vl.vfsubd.vsvl(double, <256 x double>, i32)
58 ; Function Attrs: nounwind readnone
59 define fastcc <256 x double> @vfsubd_vsvvl(double %0, <256 x double> %1, <256 x double> %2) {
60 ; CHECK-LABEL: vfsubd_vsvvl:
61 ; CHECK:       # %bb.0:
62 ; CHECK-NEXT:    lea %s1, 128
63 ; CHECK-NEXT:    lvl %s1
64 ; CHECK-NEXT:    vfsub.d %v1, %s0, %v0
65 ; CHECK-NEXT:    lea %s16, 256
66 ; CHECK-NEXT:    lvl %s16
67 ; CHECK-NEXT:    vor %v0, (0)1, %v1
68 ; CHECK-NEXT:    b.l.t (, %s10)
69   %4 = tail call fast <256 x double> @llvm.ve.vl.vfsubd.vsvvl(double %0, <256 x double> %1, <256 x double> %2, i32 128)
70   ret <256 x double> %4
73 ; Function Attrs: nounwind readnone
74 declare <256 x double> @llvm.ve.vl.vfsubd.vsvvl(double, <256 x double>, <256 x double>, i32)
76 ; Function Attrs: nounwind readnone
77 define fastcc <256 x double> @vfsubd_vvvmvl(<256 x double> %0, <256 x double> %1, <256 x i1> %2, <256 x double> %3) {
78 ; CHECK-LABEL: vfsubd_vvvmvl:
79 ; CHECK:       # %bb.0:
80 ; CHECK-NEXT:    lea %s0, 128
81 ; CHECK-NEXT:    lvl %s0
82 ; CHECK-NEXT:    vfsub.d %v2, %v0, %v1, %vm1
83 ; CHECK-NEXT:    lea %s16, 256
84 ; CHECK-NEXT:    lvl %s16
85 ; CHECK-NEXT:    vor %v0, (0)1, %v2
86 ; CHECK-NEXT:    b.l.t (, %s10)
87   %5 = tail call fast <256 x double> @llvm.ve.vl.vfsubd.vvvmvl(<256 x double> %0, <256 x double> %1, <256 x i1> %2, <256 x double> %3, i32 128)
88   ret <256 x double> %5
91 ; Function Attrs: nounwind readnone
92 declare <256 x double> @llvm.ve.vl.vfsubd.vvvmvl(<256 x double>, <256 x double>, <256 x i1>, <256 x double>, i32)
94 ; Function Attrs: nounwind readnone
95 define fastcc <256 x double> @vfsubd_vsvmvl(double %0, <256 x double> %1, <256 x i1> %2, <256 x double> %3) {
96 ; CHECK-LABEL: vfsubd_vsvmvl:
97 ; CHECK:       # %bb.0:
98 ; CHECK-NEXT:    lea %s1, 128
99 ; CHECK-NEXT:    lvl %s1
100 ; CHECK-NEXT:    vfsub.d %v1, %s0, %v0, %vm1
101 ; CHECK-NEXT:    lea %s16, 256
102 ; CHECK-NEXT:    lvl %s16
103 ; CHECK-NEXT:    vor %v0, (0)1, %v1
104 ; CHECK-NEXT:    b.l.t (, %s10)
105   %5 = tail call fast <256 x double> @llvm.ve.vl.vfsubd.vsvmvl(double %0, <256 x double> %1, <256 x i1> %2, <256 x double> %3, i32 128)
106   ret <256 x double> %5
109 ; Function Attrs: nounwind readnone
110 declare <256 x double> @llvm.ve.vl.vfsubd.vsvmvl(double, <256 x double>, <256 x i1>, <256 x double>, i32)
112 ; Function Attrs: nounwind readnone
113 define fastcc <256 x double> @vfsubs_vvvl(<256 x double> %0, <256 x double> %1) {
114 ; CHECK-LABEL: vfsubs_vvvl:
115 ; CHECK:       # %bb.0:
116 ; CHECK-NEXT:    lea %s0, 256
117 ; CHECK-NEXT:    lvl %s0
118 ; CHECK-NEXT:    vfsub.s %v0, %v0, %v1
119 ; CHECK-NEXT:    b.l.t (, %s10)
120   %3 = tail call fast <256 x double> @llvm.ve.vl.vfsubs.vvvl(<256 x double> %0, <256 x double> %1, i32 256)
121   ret <256 x double> %3
124 ; Function Attrs: nounwind readnone
125 declare <256 x double> @llvm.ve.vl.vfsubs.vvvl(<256 x double>, <256 x double>, i32)
127 ; Function Attrs: nounwind readnone
128 define fastcc <256 x double> @vfsubs_vvvvl(<256 x double> %0, <256 x double> %1, <256 x double> %2) {
129 ; CHECK-LABEL: vfsubs_vvvvl:
130 ; CHECK:       # %bb.0:
131 ; CHECK-NEXT:    lea %s0, 128
132 ; CHECK-NEXT:    lvl %s0
133 ; CHECK-NEXT:    vfsub.s %v2, %v0, %v1
134 ; CHECK-NEXT:    lea %s16, 256
135 ; CHECK-NEXT:    lvl %s16
136 ; CHECK-NEXT:    vor %v0, (0)1, %v2
137 ; CHECK-NEXT:    b.l.t (, %s10)
138   %4 = tail call fast <256 x double> @llvm.ve.vl.vfsubs.vvvvl(<256 x double> %0, <256 x double> %1, <256 x double> %2, i32 128)
139   ret <256 x double> %4
142 ; Function Attrs: nounwind readnone
143 declare <256 x double> @llvm.ve.vl.vfsubs.vvvvl(<256 x double>, <256 x double>, <256 x double>, i32)
145 ; Function Attrs: nounwind readnone
146 define fastcc <256 x double> @vfsubs_vsvl(float %0, <256 x double> %1) {
147 ; CHECK-LABEL: vfsubs_vsvl:
148 ; CHECK:       # %bb.0:
149 ; CHECK-NEXT:    lea %s1, 256
150 ; CHECK-NEXT:    lvl %s1
151 ; CHECK-NEXT:    vfsub.s %v0, %s0, %v0
152 ; CHECK-NEXT:    b.l.t (, %s10)
153   %3 = tail call fast <256 x double> @llvm.ve.vl.vfsubs.vsvl(float %0, <256 x double> %1, i32 256)
154   ret <256 x double> %3
157 ; Function Attrs: nounwind readnone
158 declare <256 x double> @llvm.ve.vl.vfsubs.vsvl(float, <256 x double>, i32)
160 ; Function Attrs: nounwind readnone
161 define fastcc <256 x double> @vfsubs_vsvvl(float %0, <256 x double> %1, <256 x double> %2) {
162 ; CHECK-LABEL: vfsubs_vsvvl:
163 ; CHECK:       # %bb.0:
164 ; CHECK-NEXT:    lea %s1, 128
165 ; CHECK-NEXT:    lvl %s1
166 ; CHECK-NEXT:    vfsub.s %v1, %s0, %v0
167 ; CHECK-NEXT:    lea %s16, 256
168 ; CHECK-NEXT:    lvl %s16
169 ; CHECK-NEXT:    vor %v0, (0)1, %v1
170 ; CHECK-NEXT:    b.l.t (, %s10)
171   %4 = tail call fast <256 x double> @llvm.ve.vl.vfsubs.vsvvl(float %0, <256 x double> %1, <256 x double> %2, i32 128)
172   ret <256 x double> %4
175 ; Function Attrs: nounwind readnone
176 declare <256 x double> @llvm.ve.vl.vfsubs.vsvvl(float, <256 x double>, <256 x double>, i32)
178 ; Function Attrs: nounwind readnone
179 define fastcc <256 x double> @vfsubs_vvvmvl(<256 x double> %0, <256 x double> %1, <256 x i1> %2, <256 x double> %3) {
180 ; CHECK-LABEL: vfsubs_vvvmvl:
181 ; CHECK:       # %bb.0:
182 ; CHECK-NEXT:    lea %s0, 128
183 ; CHECK-NEXT:    lvl %s0
184 ; CHECK-NEXT:    vfsub.s %v2, %v0, %v1, %vm1
185 ; CHECK-NEXT:    lea %s16, 256
186 ; CHECK-NEXT:    lvl %s16
187 ; CHECK-NEXT:    vor %v0, (0)1, %v2
188 ; CHECK-NEXT:    b.l.t (, %s10)
189   %5 = tail call fast <256 x double> @llvm.ve.vl.vfsubs.vvvmvl(<256 x double> %0, <256 x double> %1, <256 x i1> %2, <256 x double> %3, i32 128)
190   ret <256 x double> %5
193 ; Function Attrs: nounwind readnone
194 declare <256 x double> @llvm.ve.vl.vfsubs.vvvmvl(<256 x double>, <256 x double>, <256 x i1>, <256 x double>, i32)
196 ; Function Attrs: nounwind readnone
197 define fastcc <256 x double> @vfsubs_vsvmvl(float %0, <256 x double> %1, <256 x i1> %2, <256 x double> %3) {
198 ; CHECK-LABEL: vfsubs_vsvmvl:
199 ; CHECK:       # %bb.0:
200 ; CHECK-NEXT:    lea %s1, 128
201 ; CHECK-NEXT:    lvl %s1
202 ; CHECK-NEXT:    vfsub.s %v1, %s0, %v0, %vm1
203 ; CHECK-NEXT:    lea %s16, 256
204 ; CHECK-NEXT:    lvl %s16
205 ; CHECK-NEXT:    vor %v0, (0)1, %v1
206 ; CHECK-NEXT:    b.l.t (, %s10)
207   %5 = tail call fast <256 x double> @llvm.ve.vl.vfsubs.vsvmvl(float %0, <256 x double> %1, <256 x i1> %2, <256 x double> %3, i32 128)
208   ret <256 x double> %5
211 ; Function Attrs: nounwind readnone
212 declare <256 x double> @llvm.ve.vl.vfsubs.vsvmvl(float, <256 x double>, <256 x i1>, <256 x double>, i32)
214 ; Function Attrs: nounwind readnone
215 define fastcc <256 x double> @pvfsub_vvvl(<256 x double> %0, <256 x double> %1) {
216 ; CHECK-LABEL: pvfsub_vvvl:
217 ; CHECK:       # %bb.0:
218 ; CHECK-NEXT:    lea %s0, 256
219 ; CHECK-NEXT:    lvl %s0
220 ; CHECK-NEXT:    pvfsub %v0, %v0, %v1
221 ; CHECK-NEXT:    b.l.t (, %s10)
222   %3 = tail call fast <256 x double> @llvm.ve.vl.pvfsub.vvvl(<256 x double> %0, <256 x double> %1, i32 256)
223   ret <256 x double> %3
226 ; Function Attrs: nounwind readnone
227 declare <256 x double> @llvm.ve.vl.pvfsub.vvvl(<256 x double>, <256 x double>, i32)
229 ; Function Attrs: nounwind readnone
230 define fastcc <256 x double> @pvfsub_vvvvl(<256 x double> %0, <256 x double> %1, <256 x double> %2) {
231 ; CHECK-LABEL: pvfsub_vvvvl:
232 ; CHECK:       # %bb.0:
233 ; CHECK-NEXT:    lea %s0, 128
234 ; CHECK-NEXT:    lvl %s0
235 ; CHECK-NEXT:    pvfsub %v2, %v0, %v1
236 ; CHECK-NEXT:    lea %s16, 256
237 ; CHECK-NEXT:    lvl %s16
238 ; CHECK-NEXT:    vor %v0, (0)1, %v2
239 ; CHECK-NEXT:    b.l.t (, %s10)
240   %4 = tail call fast <256 x double> @llvm.ve.vl.pvfsub.vvvvl(<256 x double> %0, <256 x double> %1, <256 x double> %2, i32 128)
241   ret <256 x double> %4
244 ; Function Attrs: nounwind readnone
245 declare <256 x double> @llvm.ve.vl.pvfsub.vvvvl(<256 x double>, <256 x double>, <256 x double>, i32)
247 ; Function Attrs: nounwind readnone
248 define fastcc <256 x double> @pvfsub_vsvl(i64 %0, <256 x double> %1) {
249 ; CHECK-LABEL: pvfsub_vsvl:
250 ; CHECK:       # %bb.0:
251 ; CHECK-NEXT:    lea %s1, 256
252 ; CHECK-NEXT:    lvl %s1
253 ; CHECK-NEXT:    pvfsub %v0, %s0, %v0
254 ; CHECK-NEXT:    b.l.t (, %s10)
255   %3 = tail call fast <256 x double> @llvm.ve.vl.pvfsub.vsvl(i64 %0, <256 x double> %1, i32 256)
256   ret <256 x double> %3
259 ; Function Attrs: nounwind readnone
260 declare <256 x double> @llvm.ve.vl.pvfsub.vsvl(i64, <256 x double>, i32)
262 ; Function Attrs: nounwind readnone
263 define fastcc <256 x double> @pvfsub_vsvvl(i64 %0, <256 x double> %1, <256 x double> %2) {
264 ; CHECK-LABEL: pvfsub_vsvvl:
265 ; CHECK:       # %bb.0:
266 ; CHECK-NEXT:    lea %s1, 128
267 ; CHECK-NEXT:    lvl %s1
268 ; CHECK-NEXT:    pvfsub %v1, %s0, %v0
269 ; CHECK-NEXT:    lea %s16, 256
270 ; CHECK-NEXT:    lvl %s16
271 ; CHECK-NEXT:    vor %v0, (0)1, %v1
272 ; CHECK-NEXT:    b.l.t (, %s10)
273   %4 = tail call fast <256 x double> @llvm.ve.vl.pvfsub.vsvvl(i64 %0, <256 x double> %1, <256 x double> %2, i32 128)
274   ret <256 x double> %4
277 ; Function Attrs: nounwind readnone
278 declare <256 x double> @llvm.ve.vl.pvfsub.vsvvl(i64, <256 x double>, <256 x double>, i32)
280 ; Function Attrs: nounwind readnone
281 define fastcc <256 x double> @pvfsub_vvvMvl(<256 x double> %0, <256 x double> %1, <512 x i1> %2, <256 x double> %3) {
282 ; CHECK-LABEL: pvfsub_vvvMvl:
283 ; CHECK:       # %bb.0:
284 ; CHECK-NEXT:    lea %s0, 128
285 ; CHECK-NEXT:    lvl %s0
286 ; CHECK-NEXT:    pvfsub %v2, %v0, %v1, %vm2
287 ; CHECK-NEXT:    lea %s16, 256
288 ; CHECK-NEXT:    lvl %s16
289 ; CHECK-NEXT:    vor %v0, (0)1, %v2
290 ; CHECK-NEXT:    b.l.t (, %s10)
291   %5 = tail call fast <256 x double> @llvm.ve.vl.pvfsub.vvvMvl(<256 x double> %0, <256 x double> %1, <512 x i1> %2, <256 x double> %3, i32 128)
292   ret <256 x double> %5
295 ; Function Attrs: nounwind readnone
296 declare <256 x double> @llvm.ve.vl.pvfsub.vvvMvl(<256 x double>, <256 x double>, <512 x i1>, <256 x double>, i32)
298 ; Function Attrs: nounwind readnone
299 define fastcc <256 x double> @pvfsub_vsvMvl(i64 %0, <256 x double> %1, <512 x i1> %2, <256 x double> %3) {
300 ; CHECK-LABEL: pvfsub_vsvMvl:
301 ; CHECK:       # %bb.0:
302 ; CHECK-NEXT:    lea %s1, 128
303 ; CHECK-NEXT:    lvl %s1
304 ; CHECK-NEXT:    pvfsub %v1, %s0, %v0, %vm2
305 ; CHECK-NEXT:    lea %s16, 256
306 ; CHECK-NEXT:    lvl %s16
307 ; CHECK-NEXT:    vor %v0, (0)1, %v1
308 ; CHECK-NEXT:    b.l.t (, %s10)
309   %5 = tail call fast <256 x double> @llvm.ve.vl.pvfsub.vsvMvl(i64 %0, <256 x double> %1, <512 x i1> %2, <256 x double> %3, i32 128)
310   ret <256 x double> %5
313 ; Function Attrs: nounwind readnone
314 declare <256 x double> @llvm.ve.vl.pvfsub.vsvMvl(i64, <256 x double>, <512 x i1>, <256 x double>, i32)