Run DCE after a LoopFlatten test to reduce spurious output [nfc]
[llvm-project.git] / llvm / test / CodeGen / RISCV / rvv / fixed-vectors-vremu-vp.ll
bloba329e73e5e86ef5b4a0da8f82c0e2dfbedb14f0e
1 ; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
2 ; RUN: llc -mtriple=riscv32 -mattr=+v -verify-machineinstrs < %s \
3 ; RUN:   | FileCheck %s --check-prefixes=CHECK,RV32
4 ; RUN: llc -mtriple=riscv64 -mattr=+v -verify-machineinstrs < %s \
5 ; RUN:   | FileCheck %s --check-prefixes=CHECK,RV64
7 declare <8 x i7> @llvm.vp.urem.v8i7(<8 x i7>, <8 x i7>, <8 x i1>, i32)
9 define <8 x i7> @vremu_vv_v8i7(<8 x i7> %va, <8 x i7> %b, <8 x i1> %m, i32 zeroext %evl) {
10 ; CHECK-LABEL: vremu_vv_v8i7:
11 ; CHECK:       # %bb.0:
12 ; CHECK-NEXT:    li a1, 127
13 ; CHECK-NEXT:    vsetivli zero, 8, e8, mf2, ta, ma
14 ; CHECK-NEXT:    vand.vx v9, v9, a1
15 ; CHECK-NEXT:    vand.vx v8, v8, a1
16 ; CHECK-NEXT:    vsetvli zero, a0, e8, mf2, ta, ma
17 ; CHECK-NEXT:    vremu.vv v8, v8, v9, v0.t
18 ; CHECK-NEXT:    ret
19   %v = call <8 x i7> @llvm.vp.urem.v8i7(<8 x i7> %va, <8 x i7> %b, <8 x i1> %m, i32 %evl)
20   ret <8 x i7> %v
23 declare <2 x i8> @llvm.vp.urem.v2i8(<2 x i8>, <2 x i8>, <2 x i1>, i32)
25 define <2 x i8> @vremu_vv_v2i8(<2 x i8> %va, <2 x i8> %b, <2 x i1> %m, i32 zeroext %evl) {
26 ; CHECK-LABEL: vremu_vv_v2i8:
27 ; CHECK:       # %bb.0:
28 ; CHECK-NEXT:    vsetvli zero, a0, e8, mf8, ta, ma
29 ; CHECK-NEXT:    vremu.vv v8, v8, v9, v0.t
30 ; CHECK-NEXT:    ret
31   %v = call <2 x i8> @llvm.vp.urem.v2i8(<2 x i8> %va, <2 x i8> %b, <2 x i1> %m, i32 %evl)
32   ret <2 x i8> %v
35 define <2 x i8> @vremu_vv_v2i8_unmasked(<2 x i8> %va, <2 x i8> %b, i32 zeroext %evl) {
36 ; CHECK-LABEL: vremu_vv_v2i8_unmasked:
37 ; CHECK:       # %bb.0:
38 ; CHECK-NEXT:    vsetvli zero, a0, e8, mf8, ta, ma
39 ; CHECK-NEXT:    vremu.vv v8, v8, v9
40 ; CHECK-NEXT:    ret
41   %head = insertelement <2 x i1> poison, i1 true, i32 0
42   %m = shufflevector <2 x i1> %head, <2 x i1> poison, <2 x i32> zeroinitializer
43   %v = call <2 x i8> @llvm.vp.urem.v2i8(<2 x i8> %va, <2 x i8> %b, <2 x i1> %m, i32 %evl)
44   ret <2 x i8> %v
47 define <2 x i8> @vremu_vx_v2i8(<2 x i8> %va, i8 %b, <2 x i1> %m, i32 zeroext %evl) {
48 ; CHECK-LABEL: vremu_vx_v2i8:
49 ; CHECK:       # %bb.0:
50 ; CHECK-NEXT:    vsetvli zero, a1, e8, mf8, ta, ma
51 ; CHECK-NEXT:    vremu.vx v8, v8, a0, v0.t
52 ; CHECK-NEXT:    ret
53   %elt.head = insertelement <2 x i8> poison, i8 %b, i32 0
54   %vb = shufflevector <2 x i8> %elt.head, <2 x i8> poison, <2 x i32> zeroinitializer
55   %v = call <2 x i8> @llvm.vp.urem.v2i8(<2 x i8> %va, <2 x i8> %vb, <2 x i1> %m, i32 %evl)
56   ret <2 x i8> %v
59 define <2 x i8> @vremu_vx_v2i8_unmasked(<2 x i8> %va, i8 %b, i32 zeroext %evl) {
60 ; CHECK-LABEL: vremu_vx_v2i8_unmasked:
61 ; CHECK:       # %bb.0:
62 ; CHECK-NEXT:    vsetvli zero, a1, e8, mf8, ta, ma
63 ; CHECK-NEXT:    vremu.vx v8, v8, a0
64 ; CHECK-NEXT:    ret
65   %elt.head = insertelement <2 x i8> poison, i8 %b, i32 0
66   %vb = shufflevector <2 x i8> %elt.head, <2 x i8> poison, <2 x i32> zeroinitializer
67   %head = insertelement <2 x i1> poison, i1 true, i32 0
68   %m = shufflevector <2 x i1> %head, <2 x i1> poison, <2 x i32> zeroinitializer
69   %v = call <2 x i8> @llvm.vp.urem.v2i8(<2 x i8> %va, <2 x i8> %vb, <2 x i1> %m, i32 %evl)
70   ret <2 x i8> %v
73 declare <4 x i8> @llvm.vp.urem.v4i8(<4 x i8>, <4 x i8>, <4 x i1>, i32)
75 define <4 x i8> @vremu_vv_v4i8(<4 x i8> %va, <4 x i8> %b, <4 x i1> %m, i32 zeroext %evl) {
76 ; CHECK-LABEL: vremu_vv_v4i8:
77 ; CHECK:       # %bb.0:
78 ; CHECK-NEXT:    vsetvli zero, a0, e8, mf4, ta, ma
79 ; CHECK-NEXT:    vremu.vv v8, v8, v9, v0.t
80 ; CHECK-NEXT:    ret
81   %v = call <4 x i8> @llvm.vp.urem.v4i8(<4 x i8> %va, <4 x i8> %b, <4 x i1> %m, i32 %evl)
82   ret <4 x i8> %v
85 define <4 x i8> @vremu_vv_v4i8_unmasked(<4 x i8> %va, <4 x i8> %b, i32 zeroext %evl) {
86 ; CHECK-LABEL: vremu_vv_v4i8_unmasked:
87 ; CHECK:       # %bb.0:
88 ; CHECK-NEXT:    vsetvli zero, a0, e8, mf4, ta, ma
89 ; CHECK-NEXT:    vremu.vv v8, v8, v9
90 ; CHECK-NEXT:    ret
91   %head = insertelement <4 x i1> poison, i1 true, i32 0
92   %m = shufflevector <4 x i1> %head, <4 x i1> poison, <4 x i32> zeroinitializer
93   %v = call <4 x i8> @llvm.vp.urem.v4i8(<4 x i8> %va, <4 x i8> %b, <4 x i1> %m, i32 %evl)
94   ret <4 x i8> %v
97 define <4 x i8> @vremu_vx_v4i8(<4 x i8> %va, i8 %b, <4 x i1> %m, i32 zeroext %evl) {
98 ; CHECK-LABEL: vremu_vx_v4i8:
99 ; CHECK:       # %bb.0:
100 ; CHECK-NEXT:    vsetvli zero, a1, e8, mf4, ta, ma
101 ; CHECK-NEXT:    vremu.vx v8, v8, a0, v0.t
102 ; CHECK-NEXT:    ret
103   %elt.head = insertelement <4 x i8> poison, i8 %b, i32 0
104   %vb = shufflevector <4 x i8> %elt.head, <4 x i8> poison, <4 x i32> zeroinitializer
105   %v = call <4 x i8> @llvm.vp.urem.v4i8(<4 x i8> %va, <4 x i8> %vb, <4 x i1> %m, i32 %evl)
106   ret <4 x i8> %v
109 define <4 x i8> @vremu_vx_v4i8_unmasked(<4 x i8> %va, i8 %b, i32 zeroext %evl) {
110 ; CHECK-LABEL: vremu_vx_v4i8_unmasked:
111 ; CHECK:       # %bb.0:
112 ; CHECK-NEXT:    vsetvli zero, a1, e8, mf4, ta, ma
113 ; CHECK-NEXT:    vremu.vx v8, v8, a0
114 ; CHECK-NEXT:    ret
115   %elt.head = insertelement <4 x i8> poison, i8 %b, i32 0
116   %vb = shufflevector <4 x i8> %elt.head, <4 x i8> poison, <4 x i32> zeroinitializer
117   %head = insertelement <4 x i1> poison, i1 true, i32 0
118   %m = shufflevector <4 x i1> %head, <4 x i1> poison, <4 x i32> zeroinitializer
119   %v = call <4 x i8> @llvm.vp.urem.v4i8(<4 x i8> %va, <4 x i8> %vb, <4 x i1> %m, i32 %evl)
120   ret <4 x i8> %v
123 declare <6 x i8> @llvm.vp.urem.v6i8(<6 x i8>, <6 x i8>, <6 x i1>, i32)
125 define <6 x i8> @vremu_vv_v6i8(<6 x i8> %va, <6 x i8> %b, <6 x i1> %m, i32 zeroext %evl) {
126 ; CHECK-LABEL: vremu_vv_v6i8:
127 ; CHECK:       # %bb.0:
128 ; CHECK-NEXT:    vsetvli zero, a0, e8, mf2, ta, ma
129 ; CHECK-NEXT:    vremu.vv v8, v8, v9, v0.t
130 ; CHECK-NEXT:    ret
131   %v = call <6 x i8> @llvm.vp.urem.v6i8(<6 x i8> %va, <6 x i8> %b, <6 x i1> %m, i32 %evl)
132   ret <6 x i8> %v
135 declare <8 x i8> @llvm.vp.urem.v8i8(<8 x i8>, <8 x i8>, <8 x i1>, i32)
137 define <8 x i8> @vremu_vv_v8i8(<8 x i8> %va, <8 x i8> %b, <8 x i1> %m, i32 zeroext %evl) {
138 ; CHECK-LABEL: vremu_vv_v8i8:
139 ; CHECK:       # %bb.0:
140 ; CHECK-NEXT:    vsetvli zero, a0, e8, mf2, ta, ma
141 ; CHECK-NEXT:    vremu.vv v8, v8, v9, v0.t
142 ; CHECK-NEXT:    ret
143   %v = call <8 x i8> @llvm.vp.urem.v8i8(<8 x i8> %va, <8 x i8> %b, <8 x i1> %m, i32 %evl)
144   ret <8 x i8> %v
147 define <8 x i8> @vremu_vv_v8i8_unmasked(<8 x i8> %va, <8 x i8> %b, i32 zeroext %evl) {
148 ; CHECK-LABEL: vremu_vv_v8i8_unmasked:
149 ; CHECK:       # %bb.0:
150 ; CHECK-NEXT:    vsetvli zero, a0, e8, mf2, ta, ma
151 ; CHECK-NEXT:    vremu.vv v8, v8, v9
152 ; CHECK-NEXT:    ret
153   %head = insertelement <8 x i1> poison, i1 true, i32 0
154   %m = shufflevector <8 x i1> %head, <8 x i1> poison, <8 x i32> zeroinitializer
155   %v = call <8 x i8> @llvm.vp.urem.v8i8(<8 x i8> %va, <8 x i8> %b, <8 x i1> %m, i32 %evl)
156   ret <8 x i8> %v
159 define <8 x i8> @vremu_vx_v8i8(<8 x i8> %va, i8 %b, <8 x i1> %m, i32 zeroext %evl) {
160 ; CHECK-LABEL: vremu_vx_v8i8:
161 ; CHECK:       # %bb.0:
162 ; CHECK-NEXT:    vsetvli zero, a1, e8, mf2, ta, ma
163 ; CHECK-NEXT:    vremu.vx v8, v8, a0, v0.t
164 ; CHECK-NEXT:    ret
165   %elt.head = insertelement <8 x i8> poison, i8 %b, i32 0
166   %vb = shufflevector <8 x i8> %elt.head, <8 x i8> poison, <8 x i32> zeroinitializer
167   %v = call <8 x i8> @llvm.vp.urem.v8i8(<8 x i8> %va, <8 x i8> %vb, <8 x i1> %m, i32 %evl)
168   ret <8 x i8> %v
171 define <8 x i8> @vremu_vx_v8i8_unmasked(<8 x i8> %va, i8 %b, i32 zeroext %evl) {
172 ; CHECK-LABEL: vremu_vx_v8i8_unmasked:
173 ; CHECK:       # %bb.0:
174 ; CHECK-NEXT:    vsetvli zero, a1, e8, mf2, ta, ma
175 ; CHECK-NEXT:    vremu.vx v8, v8, a0
176 ; CHECK-NEXT:    ret
177   %elt.head = insertelement <8 x i8> poison, i8 %b, i32 0
178   %vb = shufflevector <8 x i8> %elt.head, <8 x i8> poison, <8 x i32> zeroinitializer
179   %head = insertelement <8 x i1> poison, i1 true, i32 0
180   %m = shufflevector <8 x i1> %head, <8 x i1> poison, <8 x i32> zeroinitializer
181   %v = call <8 x i8> @llvm.vp.urem.v8i8(<8 x i8> %va, <8 x i8> %vb, <8 x i1> %m, i32 %evl)
182   ret <8 x i8> %v
185 declare <16 x i8> @llvm.vp.urem.v16i8(<16 x i8>, <16 x i8>, <16 x i1>, i32)
187 define <16 x i8> @vremu_vv_v16i8(<16 x i8> %va, <16 x i8> %b, <16 x i1> %m, i32 zeroext %evl) {
188 ; CHECK-LABEL: vremu_vv_v16i8:
189 ; CHECK:       # %bb.0:
190 ; CHECK-NEXT:    vsetvli zero, a0, e8, m1, ta, ma
191 ; CHECK-NEXT:    vremu.vv v8, v8, v9, v0.t
192 ; CHECK-NEXT:    ret
193   %v = call <16 x i8> @llvm.vp.urem.v16i8(<16 x i8> %va, <16 x i8> %b, <16 x i1> %m, i32 %evl)
194   ret <16 x i8> %v
197 define <16 x i8> @vremu_vv_v16i8_unmasked(<16 x i8> %va, <16 x i8> %b, i32 zeroext %evl) {
198 ; CHECK-LABEL: vremu_vv_v16i8_unmasked:
199 ; CHECK:       # %bb.0:
200 ; CHECK-NEXT:    vsetvli zero, a0, e8, m1, ta, ma
201 ; CHECK-NEXT:    vremu.vv v8, v8, v9
202 ; CHECK-NEXT:    ret
203   %head = insertelement <16 x i1> poison, i1 true, i32 0
204   %m = shufflevector <16 x i1> %head, <16 x i1> poison, <16 x i32> zeroinitializer
205   %v = call <16 x i8> @llvm.vp.urem.v16i8(<16 x i8> %va, <16 x i8> %b, <16 x i1> %m, i32 %evl)
206   ret <16 x i8> %v
209 define <16 x i8> @vremu_vx_v16i8(<16 x i8> %va, i8 %b, <16 x i1> %m, i32 zeroext %evl) {
210 ; CHECK-LABEL: vremu_vx_v16i8:
211 ; CHECK:       # %bb.0:
212 ; CHECK-NEXT:    vsetvli zero, a1, e8, m1, ta, ma
213 ; CHECK-NEXT:    vremu.vx v8, v8, a0, v0.t
214 ; CHECK-NEXT:    ret
215   %elt.head = insertelement <16 x i8> poison, i8 %b, i32 0
216   %vb = shufflevector <16 x i8> %elt.head, <16 x i8> poison, <16 x i32> zeroinitializer
217   %v = call <16 x i8> @llvm.vp.urem.v16i8(<16 x i8> %va, <16 x i8> %vb, <16 x i1> %m, i32 %evl)
218   ret <16 x i8> %v
221 define <16 x i8> @vremu_vx_v16i8_unmasked(<16 x i8> %va, i8 %b, i32 zeroext %evl) {
222 ; CHECK-LABEL: vremu_vx_v16i8_unmasked:
223 ; CHECK:       # %bb.0:
224 ; CHECK-NEXT:    vsetvli zero, a1, e8, m1, ta, ma
225 ; CHECK-NEXT:    vremu.vx v8, v8, a0
226 ; CHECK-NEXT:    ret
227   %elt.head = insertelement <16 x i8> poison, i8 %b, i32 0
228   %vb = shufflevector <16 x i8> %elt.head, <16 x i8> poison, <16 x i32> zeroinitializer
229   %head = insertelement <16 x i1> poison, i1 true, i32 0
230   %m = shufflevector <16 x i1> %head, <16 x i1> poison, <16 x i32> zeroinitializer
231   %v = call <16 x i8> @llvm.vp.urem.v16i8(<16 x i8> %va, <16 x i8> %vb, <16 x i1> %m, i32 %evl)
232   ret <16 x i8> %v
235 declare <2 x i16> @llvm.vp.urem.v2i16(<2 x i16>, <2 x i16>, <2 x i1>, i32)
237 define <2 x i16> @vremu_vv_v2i16(<2 x i16> %va, <2 x i16> %b, <2 x i1> %m, i32 zeroext %evl) {
238 ; CHECK-LABEL: vremu_vv_v2i16:
239 ; CHECK:       # %bb.0:
240 ; CHECK-NEXT:    vsetvli zero, a0, e16, mf4, ta, ma
241 ; CHECK-NEXT:    vremu.vv v8, v8, v9, v0.t
242 ; CHECK-NEXT:    ret
243   %v = call <2 x i16> @llvm.vp.urem.v2i16(<2 x i16> %va, <2 x i16> %b, <2 x i1> %m, i32 %evl)
244   ret <2 x i16> %v
247 define <2 x i16> @vremu_vv_v2i16_unmasked(<2 x i16> %va, <2 x i16> %b, i32 zeroext %evl) {
248 ; CHECK-LABEL: vremu_vv_v2i16_unmasked:
249 ; CHECK:       # %bb.0:
250 ; CHECK-NEXT:    vsetvli zero, a0, e16, mf4, ta, ma
251 ; CHECK-NEXT:    vremu.vv v8, v8, v9
252 ; CHECK-NEXT:    ret
253   %head = insertelement <2 x i1> poison, i1 true, i32 0
254   %m = shufflevector <2 x i1> %head, <2 x i1> poison, <2 x i32> zeroinitializer
255   %v = call <2 x i16> @llvm.vp.urem.v2i16(<2 x i16> %va, <2 x i16> %b, <2 x i1> %m, i32 %evl)
256   ret <2 x i16> %v
259 define <2 x i16> @vremu_vx_v2i16(<2 x i16> %va, i16 %b, <2 x i1> %m, i32 zeroext %evl) {
260 ; CHECK-LABEL: vremu_vx_v2i16:
261 ; CHECK:       # %bb.0:
262 ; CHECK-NEXT:    vsetvli zero, a1, e16, mf4, ta, ma
263 ; CHECK-NEXT:    vremu.vx v8, v8, a0, v0.t
264 ; CHECK-NEXT:    ret
265   %elt.head = insertelement <2 x i16> poison, i16 %b, i32 0
266   %vb = shufflevector <2 x i16> %elt.head, <2 x i16> poison, <2 x i32> zeroinitializer
267   %v = call <2 x i16> @llvm.vp.urem.v2i16(<2 x i16> %va, <2 x i16> %vb, <2 x i1> %m, i32 %evl)
268   ret <2 x i16> %v
271 define <2 x i16> @vremu_vx_v2i16_unmasked(<2 x i16> %va, i16 %b, i32 zeroext %evl) {
272 ; CHECK-LABEL: vremu_vx_v2i16_unmasked:
273 ; CHECK:       # %bb.0:
274 ; CHECK-NEXT:    vsetvli zero, a1, e16, mf4, ta, ma
275 ; CHECK-NEXT:    vremu.vx v8, v8, a0
276 ; CHECK-NEXT:    ret
277   %elt.head = insertelement <2 x i16> poison, i16 %b, i32 0
278   %vb = shufflevector <2 x i16> %elt.head, <2 x i16> poison, <2 x i32> zeroinitializer
279   %head = insertelement <2 x i1> poison, i1 true, i32 0
280   %m = shufflevector <2 x i1> %head, <2 x i1> poison, <2 x i32> zeroinitializer
281   %v = call <2 x i16> @llvm.vp.urem.v2i16(<2 x i16> %va, <2 x i16> %vb, <2 x i1> %m, i32 %evl)
282   ret <2 x i16> %v
285 declare <4 x i16> @llvm.vp.urem.v4i16(<4 x i16>, <4 x i16>, <4 x i1>, i32)
287 define <4 x i16> @vremu_vv_v4i16(<4 x i16> %va, <4 x i16> %b, <4 x i1> %m, i32 zeroext %evl) {
288 ; CHECK-LABEL: vremu_vv_v4i16:
289 ; CHECK:       # %bb.0:
290 ; CHECK-NEXT:    vsetvli zero, a0, e16, mf2, ta, ma
291 ; CHECK-NEXT:    vremu.vv v8, v8, v9, v0.t
292 ; CHECK-NEXT:    ret
293   %v = call <4 x i16> @llvm.vp.urem.v4i16(<4 x i16> %va, <4 x i16> %b, <4 x i1> %m, i32 %evl)
294   ret <4 x i16> %v
297 define <4 x i16> @vremu_vv_v4i16_unmasked(<4 x i16> %va, <4 x i16> %b, i32 zeroext %evl) {
298 ; CHECK-LABEL: vremu_vv_v4i16_unmasked:
299 ; CHECK:       # %bb.0:
300 ; CHECK-NEXT:    vsetvli zero, a0, e16, mf2, ta, ma
301 ; CHECK-NEXT:    vremu.vv v8, v8, v9
302 ; CHECK-NEXT:    ret
303   %head = insertelement <4 x i1> poison, i1 true, i32 0
304   %m = shufflevector <4 x i1> %head, <4 x i1> poison, <4 x i32> zeroinitializer
305   %v = call <4 x i16> @llvm.vp.urem.v4i16(<4 x i16> %va, <4 x i16> %b, <4 x i1> %m, i32 %evl)
306   ret <4 x i16> %v
309 define <4 x i16> @vremu_vx_v4i16(<4 x i16> %va, i16 %b, <4 x i1> %m, i32 zeroext %evl) {
310 ; CHECK-LABEL: vremu_vx_v4i16:
311 ; CHECK:       # %bb.0:
312 ; CHECK-NEXT:    vsetvli zero, a1, e16, mf2, ta, ma
313 ; CHECK-NEXT:    vremu.vx v8, v8, a0, v0.t
314 ; CHECK-NEXT:    ret
315   %elt.head = insertelement <4 x i16> poison, i16 %b, i32 0
316   %vb = shufflevector <4 x i16> %elt.head, <4 x i16> poison, <4 x i32> zeroinitializer
317   %v = call <4 x i16> @llvm.vp.urem.v4i16(<4 x i16> %va, <4 x i16> %vb, <4 x i1> %m, i32 %evl)
318   ret <4 x i16> %v
321 define <4 x i16> @vremu_vx_v4i16_unmasked(<4 x i16> %va, i16 %b, i32 zeroext %evl) {
322 ; CHECK-LABEL: vremu_vx_v4i16_unmasked:
323 ; CHECK:       # %bb.0:
324 ; CHECK-NEXT:    vsetvli zero, a1, e16, mf2, ta, ma
325 ; CHECK-NEXT:    vremu.vx v8, v8, a0
326 ; CHECK-NEXT:    ret
327   %elt.head = insertelement <4 x i16> poison, i16 %b, i32 0
328   %vb = shufflevector <4 x i16> %elt.head, <4 x i16> poison, <4 x i32> zeroinitializer
329   %head = insertelement <4 x i1> poison, i1 true, i32 0
330   %m = shufflevector <4 x i1> %head, <4 x i1> poison, <4 x i32> zeroinitializer
331   %v = call <4 x i16> @llvm.vp.urem.v4i16(<4 x i16> %va, <4 x i16> %vb, <4 x i1> %m, i32 %evl)
332   ret <4 x i16> %v
335 declare <8 x i16> @llvm.vp.urem.v8i16(<8 x i16>, <8 x i16>, <8 x i1>, i32)
337 define <8 x i16> @vremu_vv_v8i16(<8 x i16> %va, <8 x i16> %b, <8 x i1> %m, i32 zeroext %evl) {
338 ; CHECK-LABEL: vremu_vv_v8i16:
339 ; CHECK:       # %bb.0:
340 ; CHECK-NEXT:    vsetvli zero, a0, e16, m1, ta, ma
341 ; CHECK-NEXT:    vremu.vv v8, v8, v9, v0.t
342 ; CHECK-NEXT:    ret
343   %v = call <8 x i16> @llvm.vp.urem.v8i16(<8 x i16> %va, <8 x i16> %b, <8 x i1> %m, i32 %evl)
344   ret <8 x i16> %v
347 define <8 x i16> @vremu_vv_v8i16_unmasked(<8 x i16> %va, <8 x i16> %b, i32 zeroext %evl) {
348 ; CHECK-LABEL: vremu_vv_v8i16_unmasked:
349 ; CHECK:       # %bb.0:
350 ; CHECK-NEXT:    vsetvli zero, a0, e16, m1, ta, ma
351 ; CHECK-NEXT:    vremu.vv v8, v8, v9
352 ; CHECK-NEXT:    ret
353   %head = insertelement <8 x i1> poison, i1 true, i32 0
354   %m = shufflevector <8 x i1> %head, <8 x i1> poison, <8 x i32> zeroinitializer
355   %v = call <8 x i16> @llvm.vp.urem.v8i16(<8 x i16> %va, <8 x i16> %b, <8 x i1> %m, i32 %evl)
356   ret <8 x i16> %v
359 define <8 x i16> @vremu_vx_v8i16(<8 x i16> %va, i16 %b, <8 x i1> %m, i32 zeroext %evl) {
360 ; CHECK-LABEL: vremu_vx_v8i16:
361 ; CHECK:       # %bb.0:
362 ; CHECK-NEXT:    vsetvli zero, a1, e16, m1, ta, ma
363 ; CHECK-NEXT:    vremu.vx v8, v8, a0, v0.t
364 ; CHECK-NEXT:    ret
365   %elt.head = insertelement <8 x i16> poison, i16 %b, i32 0
366   %vb = shufflevector <8 x i16> %elt.head, <8 x i16> poison, <8 x i32> zeroinitializer
367   %v = call <8 x i16> @llvm.vp.urem.v8i16(<8 x i16> %va, <8 x i16> %vb, <8 x i1> %m, i32 %evl)
368   ret <8 x i16> %v
371 define <8 x i16> @vremu_vx_v8i16_unmasked(<8 x i16> %va, i16 %b, i32 zeroext %evl) {
372 ; CHECK-LABEL: vremu_vx_v8i16_unmasked:
373 ; CHECK:       # %bb.0:
374 ; CHECK-NEXT:    vsetvli zero, a1, e16, m1, ta, ma
375 ; CHECK-NEXT:    vremu.vx v8, v8, a0
376 ; CHECK-NEXT:    ret
377   %elt.head = insertelement <8 x i16> poison, i16 %b, i32 0
378   %vb = shufflevector <8 x i16> %elt.head, <8 x i16> poison, <8 x i32> zeroinitializer
379   %head = insertelement <8 x i1> poison, i1 true, i32 0
380   %m = shufflevector <8 x i1> %head, <8 x i1> poison, <8 x i32> zeroinitializer
381   %v = call <8 x i16> @llvm.vp.urem.v8i16(<8 x i16> %va, <8 x i16> %vb, <8 x i1> %m, i32 %evl)
382   ret <8 x i16> %v
385 declare <16 x i16> @llvm.vp.urem.v16i16(<16 x i16>, <16 x i16>, <16 x i1>, i32)
387 define <16 x i16> @vremu_vv_v16i16(<16 x i16> %va, <16 x i16> %b, <16 x i1> %m, i32 zeroext %evl) {
388 ; CHECK-LABEL: vremu_vv_v16i16:
389 ; CHECK:       # %bb.0:
390 ; CHECK-NEXT:    vsetvli zero, a0, e16, m2, ta, ma
391 ; CHECK-NEXT:    vremu.vv v8, v8, v10, v0.t
392 ; CHECK-NEXT:    ret
393   %v = call <16 x i16> @llvm.vp.urem.v16i16(<16 x i16> %va, <16 x i16> %b, <16 x i1> %m, i32 %evl)
394   ret <16 x i16> %v
397 define <16 x i16> @vremu_vv_v16i16_unmasked(<16 x i16> %va, <16 x i16> %b, i32 zeroext %evl) {
398 ; CHECK-LABEL: vremu_vv_v16i16_unmasked:
399 ; CHECK:       # %bb.0:
400 ; CHECK-NEXT:    vsetvli zero, a0, e16, m2, ta, ma
401 ; CHECK-NEXT:    vremu.vv v8, v8, v10
402 ; CHECK-NEXT:    ret
403   %head = insertelement <16 x i1> poison, i1 true, i32 0
404   %m = shufflevector <16 x i1> %head, <16 x i1> poison, <16 x i32> zeroinitializer
405   %v = call <16 x i16> @llvm.vp.urem.v16i16(<16 x i16> %va, <16 x i16> %b, <16 x i1> %m, i32 %evl)
406   ret <16 x i16> %v
409 define <16 x i16> @vremu_vx_v16i16(<16 x i16> %va, i16 %b, <16 x i1> %m, i32 zeroext %evl) {
410 ; CHECK-LABEL: vremu_vx_v16i16:
411 ; CHECK:       # %bb.0:
412 ; CHECK-NEXT:    vsetvli zero, a1, e16, m2, ta, ma
413 ; CHECK-NEXT:    vremu.vx v8, v8, a0, v0.t
414 ; CHECK-NEXT:    ret
415   %elt.head = insertelement <16 x i16> poison, i16 %b, i32 0
416   %vb = shufflevector <16 x i16> %elt.head, <16 x i16> poison, <16 x i32> zeroinitializer
417   %v = call <16 x i16> @llvm.vp.urem.v16i16(<16 x i16> %va, <16 x i16> %vb, <16 x i1> %m, i32 %evl)
418   ret <16 x i16> %v
421 define <16 x i16> @vremu_vx_v16i16_unmasked(<16 x i16> %va, i16 %b, i32 zeroext %evl) {
422 ; CHECK-LABEL: vremu_vx_v16i16_unmasked:
423 ; CHECK:       # %bb.0:
424 ; CHECK-NEXT:    vsetvli zero, a1, e16, m2, ta, ma
425 ; CHECK-NEXT:    vremu.vx v8, v8, a0
426 ; CHECK-NEXT:    ret
427   %elt.head = insertelement <16 x i16> poison, i16 %b, i32 0
428   %vb = shufflevector <16 x i16> %elt.head, <16 x i16> poison, <16 x i32> zeroinitializer
429   %head = insertelement <16 x i1> poison, i1 true, i32 0
430   %m = shufflevector <16 x i1> %head, <16 x i1> poison, <16 x i32> zeroinitializer
431   %v = call <16 x i16> @llvm.vp.urem.v16i16(<16 x i16> %va, <16 x i16> %vb, <16 x i1> %m, i32 %evl)
432   ret <16 x i16> %v
435 declare <2 x i32> @llvm.vp.urem.v2i32(<2 x i32>, <2 x i32>, <2 x i1>, i32)
437 define <2 x i32> @vremu_vv_v2i32(<2 x i32> %va, <2 x i32> %b, <2 x i1> %m, i32 zeroext %evl) {
438 ; CHECK-LABEL: vremu_vv_v2i32:
439 ; CHECK:       # %bb.0:
440 ; CHECK-NEXT:    vsetvli zero, a0, e32, mf2, ta, ma
441 ; CHECK-NEXT:    vremu.vv v8, v8, v9, v0.t
442 ; CHECK-NEXT:    ret
443   %v = call <2 x i32> @llvm.vp.urem.v2i32(<2 x i32> %va, <2 x i32> %b, <2 x i1> %m, i32 %evl)
444   ret <2 x i32> %v
447 define <2 x i32> @vremu_vv_v2i32_unmasked(<2 x i32> %va, <2 x i32> %b, i32 zeroext %evl) {
448 ; CHECK-LABEL: vremu_vv_v2i32_unmasked:
449 ; CHECK:       # %bb.0:
450 ; CHECK-NEXT:    vsetvli zero, a0, e32, mf2, ta, ma
451 ; CHECK-NEXT:    vremu.vv v8, v8, v9
452 ; CHECK-NEXT:    ret
453   %head = insertelement <2 x i1> poison, i1 true, i32 0
454   %m = shufflevector <2 x i1> %head, <2 x i1> poison, <2 x i32> zeroinitializer
455   %v = call <2 x i32> @llvm.vp.urem.v2i32(<2 x i32> %va, <2 x i32> %b, <2 x i1> %m, i32 %evl)
456   ret <2 x i32> %v
459 define <2 x i32> @vremu_vx_v2i32(<2 x i32> %va, i32 %b, <2 x i1> %m, i32 zeroext %evl) {
460 ; CHECK-LABEL: vremu_vx_v2i32:
461 ; CHECK:       # %bb.0:
462 ; CHECK-NEXT:    vsetvli zero, a1, e32, mf2, ta, ma
463 ; CHECK-NEXT:    vremu.vx v8, v8, a0, v0.t
464 ; CHECK-NEXT:    ret
465   %elt.head = insertelement <2 x i32> poison, i32 %b, i32 0
466   %vb = shufflevector <2 x i32> %elt.head, <2 x i32> poison, <2 x i32> zeroinitializer
467   %v = call <2 x i32> @llvm.vp.urem.v2i32(<2 x i32> %va, <2 x i32> %vb, <2 x i1> %m, i32 %evl)
468   ret <2 x i32> %v
471 define <2 x i32> @vremu_vx_v2i32_unmasked(<2 x i32> %va, i32 %b, i32 zeroext %evl) {
472 ; CHECK-LABEL: vremu_vx_v2i32_unmasked:
473 ; CHECK:       # %bb.0:
474 ; CHECK-NEXT:    vsetvli zero, a1, e32, mf2, ta, ma
475 ; CHECK-NEXT:    vremu.vx v8, v8, a0
476 ; CHECK-NEXT:    ret
477   %elt.head = insertelement <2 x i32> poison, i32 %b, i32 0
478   %vb = shufflevector <2 x i32> %elt.head, <2 x i32> poison, <2 x i32> zeroinitializer
479   %head = insertelement <2 x i1> poison, i1 true, i32 0
480   %m = shufflevector <2 x i1> %head, <2 x i1> poison, <2 x i32> zeroinitializer
481   %v = call <2 x i32> @llvm.vp.urem.v2i32(<2 x i32> %va, <2 x i32> %vb, <2 x i1> %m, i32 %evl)
482   ret <2 x i32> %v
485 declare <4 x i32> @llvm.vp.urem.v4i32(<4 x i32>, <4 x i32>, <4 x i1>, i32)
487 define <4 x i32> @vremu_vv_v4i32(<4 x i32> %va, <4 x i32> %b, <4 x i1> %m, i32 zeroext %evl) {
488 ; CHECK-LABEL: vremu_vv_v4i32:
489 ; CHECK:       # %bb.0:
490 ; CHECK-NEXT:    vsetvli zero, a0, e32, m1, ta, ma
491 ; CHECK-NEXT:    vremu.vv v8, v8, v9, v0.t
492 ; CHECK-NEXT:    ret
493   %v = call <4 x i32> @llvm.vp.urem.v4i32(<4 x i32> %va, <4 x i32> %b, <4 x i1> %m, i32 %evl)
494   ret <4 x i32> %v
497 define <4 x i32> @vremu_vv_v4i32_unmasked(<4 x i32> %va, <4 x i32> %b, i32 zeroext %evl) {
498 ; CHECK-LABEL: vremu_vv_v4i32_unmasked:
499 ; CHECK:       # %bb.0:
500 ; CHECK-NEXT:    vsetvli zero, a0, e32, m1, ta, ma
501 ; CHECK-NEXT:    vremu.vv v8, v8, v9
502 ; CHECK-NEXT:    ret
503   %head = insertelement <4 x i1> poison, i1 true, i32 0
504   %m = shufflevector <4 x i1> %head, <4 x i1> poison, <4 x i32> zeroinitializer
505   %v = call <4 x i32> @llvm.vp.urem.v4i32(<4 x i32> %va, <4 x i32> %b, <4 x i1> %m, i32 %evl)
506   ret <4 x i32> %v
509 define <4 x i32> @vremu_vx_v4i32(<4 x i32> %va, i32 %b, <4 x i1> %m, i32 zeroext %evl) {
510 ; CHECK-LABEL: vremu_vx_v4i32:
511 ; CHECK:       # %bb.0:
512 ; CHECK-NEXT:    vsetvli zero, a1, e32, m1, ta, ma
513 ; CHECK-NEXT:    vremu.vx v8, v8, a0, v0.t
514 ; CHECK-NEXT:    ret
515   %elt.head = insertelement <4 x i32> poison, i32 %b, i32 0
516   %vb = shufflevector <4 x i32> %elt.head, <4 x i32> poison, <4 x i32> zeroinitializer
517   %v = call <4 x i32> @llvm.vp.urem.v4i32(<4 x i32> %va, <4 x i32> %vb, <4 x i1> %m, i32 %evl)
518   ret <4 x i32> %v
521 define <4 x i32> @vremu_vx_v4i32_unmasked(<4 x i32> %va, i32 %b, i32 zeroext %evl) {
522 ; CHECK-LABEL: vremu_vx_v4i32_unmasked:
523 ; CHECK:       # %bb.0:
524 ; CHECK-NEXT:    vsetvli zero, a1, e32, m1, ta, ma
525 ; CHECK-NEXT:    vremu.vx v8, v8, a0
526 ; CHECK-NEXT:    ret
527   %elt.head = insertelement <4 x i32> poison, i32 %b, i32 0
528   %vb = shufflevector <4 x i32> %elt.head, <4 x i32> poison, <4 x i32> zeroinitializer
529   %head = insertelement <4 x i1> poison, i1 true, i32 0
530   %m = shufflevector <4 x i1> %head, <4 x i1> poison, <4 x i32> zeroinitializer
531   %v = call <4 x i32> @llvm.vp.urem.v4i32(<4 x i32> %va, <4 x i32> %vb, <4 x i1> %m, i32 %evl)
532   ret <4 x i32> %v
535 declare <8 x i32> @llvm.vp.urem.v8i32(<8 x i32>, <8 x i32>, <8 x i1>, i32)
537 define <8 x i32> @vremu_vv_v8i32(<8 x i32> %va, <8 x i32> %b, <8 x i1> %m, i32 zeroext %evl) {
538 ; CHECK-LABEL: vremu_vv_v8i32:
539 ; CHECK:       # %bb.0:
540 ; CHECK-NEXT:    vsetvli zero, a0, e32, m2, ta, ma
541 ; CHECK-NEXT:    vremu.vv v8, v8, v10, v0.t
542 ; CHECK-NEXT:    ret
543   %v = call <8 x i32> @llvm.vp.urem.v8i32(<8 x i32> %va, <8 x i32> %b, <8 x i1> %m, i32 %evl)
544   ret <8 x i32> %v
547 define <8 x i32> @vremu_vv_v8i32_unmasked(<8 x i32> %va, <8 x i32> %b, i32 zeroext %evl) {
548 ; CHECK-LABEL: vremu_vv_v8i32_unmasked:
549 ; CHECK:       # %bb.0:
550 ; CHECK-NEXT:    vsetvli zero, a0, e32, m2, ta, ma
551 ; CHECK-NEXT:    vremu.vv v8, v8, v10
552 ; CHECK-NEXT:    ret
553   %head = insertelement <8 x i1> poison, i1 true, i32 0
554   %m = shufflevector <8 x i1> %head, <8 x i1> poison, <8 x i32> zeroinitializer
555   %v = call <8 x i32> @llvm.vp.urem.v8i32(<8 x i32> %va, <8 x i32> %b, <8 x i1> %m, i32 %evl)
556   ret <8 x i32> %v
559 define <8 x i32> @vremu_vx_v8i32(<8 x i32> %va, i32 %b, <8 x i1> %m, i32 zeroext %evl) {
560 ; CHECK-LABEL: vremu_vx_v8i32:
561 ; CHECK:       # %bb.0:
562 ; CHECK-NEXT:    vsetvli zero, a1, e32, m2, ta, ma
563 ; CHECK-NEXT:    vremu.vx v8, v8, a0, v0.t
564 ; CHECK-NEXT:    ret
565   %elt.head = insertelement <8 x i32> poison, i32 %b, i32 0
566   %vb = shufflevector <8 x i32> %elt.head, <8 x i32> poison, <8 x i32> zeroinitializer
567   %v = call <8 x i32> @llvm.vp.urem.v8i32(<8 x i32> %va, <8 x i32> %vb, <8 x i1> %m, i32 %evl)
568   ret <8 x i32> %v
571 define <8 x i32> @vremu_vx_v8i32_unmasked(<8 x i32> %va, i32 %b, i32 zeroext %evl) {
572 ; CHECK-LABEL: vremu_vx_v8i32_unmasked:
573 ; CHECK:       # %bb.0:
574 ; CHECK-NEXT:    vsetvli zero, a1, e32, m2, ta, ma
575 ; CHECK-NEXT:    vremu.vx v8, v8, a0
576 ; CHECK-NEXT:    ret
577   %elt.head = insertelement <8 x i32> poison, i32 %b, i32 0
578   %vb = shufflevector <8 x i32> %elt.head, <8 x i32> poison, <8 x i32> zeroinitializer
579   %head = insertelement <8 x i1> poison, i1 true, i32 0
580   %m = shufflevector <8 x i1> %head, <8 x i1> poison, <8 x i32> zeroinitializer
581   %v = call <8 x i32> @llvm.vp.urem.v8i32(<8 x i32> %va, <8 x i32> %vb, <8 x i1> %m, i32 %evl)
582   ret <8 x i32> %v
585 declare <16 x i32> @llvm.vp.urem.v16i32(<16 x i32>, <16 x i32>, <16 x i1>, i32)
587 define <16 x i32> @vremu_vv_v16i32(<16 x i32> %va, <16 x i32> %b, <16 x i1> %m, i32 zeroext %evl) {
588 ; CHECK-LABEL: vremu_vv_v16i32:
589 ; CHECK:       # %bb.0:
590 ; CHECK-NEXT:    vsetvli zero, a0, e32, m4, ta, ma
591 ; CHECK-NEXT:    vremu.vv v8, v8, v12, v0.t
592 ; CHECK-NEXT:    ret
593   %v = call <16 x i32> @llvm.vp.urem.v16i32(<16 x i32> %va, <16 x i32> %b, <16 x i1> %m, i32 %evl)
594   ret <16 x i32> %v
597 define <16 x i32> @vremu_vv_v16i32_unmasked(<16 x i32> %va, <16 x i32> %b, i32 zeroext %evl) {
598 ; CHECK-LABEL: vremu_vv_v16i32_unmasked:
599 ; CHECK:       # %bb.0:
600 ; CHECK-NEXT:    vsetvli zero, a0, e32, m4, ta, ma
601 ; CHECK-NEXT:    vremu.vv v8, v8, v12
602 ; CHECK-NEXT:    ret
603   %head = insertelement <16 x i1> poison, i1 true, i32 0
604   %m = shufflevector <16 x i1> %head, <16 x i1> poison, <16 x i32> zeroinitializer
605   %v = call <16 x i32> @llvm.vp.urem.v16i32(<16 x i32> %va, <16 x i32> %b, <16 x i1> %m, i32 %evl)
606   ret <16 x i32> %v
609 define <16 x i32> @vremu_vx_v16i32(<16 x i32> %va, i32 %b, <16 x i1> %m, i32 zeroext %evl) {
610 ; CHECK-LABEL: vremu_vx_v16i32:
611 ; CHECK:       # %bb.0:
612 ; CHECK-NEXT:    vsetvli zero, a1, e32, m4, ta, ma
613 ; CHECK-NEXT:    vremu.vx v8, v8, a0, v0.t
614 ; CHECK-NEXT:    ret
615   %elt.head = insertelement <16 x i32> poison, i32 %b, i32 0
616   %vb = shufflevector <16 x i32> %elt.head, <16 x i32> poison, <16 x i32> zeroinitializer
617   %v = call <16 x i32> @llvm.vp.urem.v16i32(<16 x i32> %va, <16 x i32> %vb, <16 x i1> %m, i32 %evl)
618   ret <16 x i32> %v
621 define <16 x i32> @vremu_vx_v16i32_unmasked(<16 x i32> %va, i32 %b, i32 zeroext %evl) {
622 ; CHECK-LABEL: vremu_vx_v16i32_unmasked:
623 ; CHECK:       # %bb.0:
624 ; CHECK-NEXT:    vsetvli zero, a1, e32, m4, ta, ma
625 ; CHECK-NEXT:    vremu.vx v8, v8, a0
626 ; CHECK-NEXT:    ret
627   %elt.head = insertelement <16 x i32> poison, i32 %b, i32 0
628   %vb = shufflevector <16 x i32> %elt.head, <16 x i32> poison, <16 x i32> zeroinitializer
629   %head = insertelement <16 x i1> poison, i1 true, i32 0
630   %m = shufflevector <16 x i1> %head, <16 x i1> poison, <16 x i32> zeroinitializer
631   %v = call <16 x i32> @llvm.vp.urem.v16i32(<16 x i32> %va, <16 x i32> %vb, <16 x i1> %m, i32 %evl)
632   ret <16 x i32> %v
635 declare <2 x i64> @llvm.vp.urem.v2i64(<2 x i64>, <2 x i64>, <2 x i1>, i32)
637 define <2 x i64> @vremu_vv_v2i64(<2 x i64> %va, <2 x i64> %b, <2 x i1> %m, i32 zeroext %evl) {
638 ; CHECK-LABEL: vremu_vv_v2i64:
639 ; CHECK:       # %bb.0:
640 ; CHECK-NEXT:    vsetvli zero, a0, e64, m1, ta, ma
641 ; CHECK-NEXT:    vremu.vv v8, v8, v9, v0.t
642 ; CHECK-NEXT:    ret
643   %v = call <2 x i64> @llvm.vp.urem.v2i64(<2 x i64> %va, <2 x i64> %b, <2 x i1> %m, i32 %evl)
644   ret <2 x i64> %v
647 define <2 x i64> @vremu_vv_v2i64_unmasked(<2 x i64> %va, <2 x i64> %b, i32 zeroext %evl) {
648 ; CHECK-LABEL: vremu_vv_v2i64_unmasked:
649 ; CHECK:       # %bb.0:
650 ; CHECK-NEXT:    vsetvli zero, a0, e64, m1, ta, ma
651 ; CHECK-NEXT:    vremu.vv v8, v8, v9
652 ; CHECK-NEXT:    ret
653   %head = insertelement <2 x i1> poison, i1 true, i32 0
654   %m = shufflevector <2 x i1> %head, <2 x i1> poison, <2 x i32> zeroinitializer
655   %v = call <2 x i64> @llvm.vp.urem.v2i64(<2 x i64> %va, <2 x i64> %b, <2 x i1> %m, i32 %evl)
656   ret <2 x i64> %v
659 define <2 x i64> @vremu_vx_v2i64(<2 x i64> %va, i64 %b, <2 x i1> %m, i32 zeroext %evl) {
660 ; RV32-LABEL: vremu_vx_v2i64:
661 ; RV32:       # %bb.0:
662 ; RV32-NEXT:    addi sp, sp, -16
663 ; RV32-NEXT:    .cfi_def_cfa_offset 16
664 ; RV32-NEXT:    sw a1, 12(sp)
665 ; RV32-NEXT:    sw a0, 8(sp)
666 ; RV32-NEXT:    addi a0, sp, 8
667 ; RV32-NEXT:    vsetivli zero, 2, e64, m1, ta, ma
668 ; RV32-NEXT:    vlse64.v v9, (a0), zero
669 ; RV32-NEXT:    vsetvli zero, a2, e64, m1, ta, ma
670 ; RV32-NEXT:    vremu.vv v8, v8, v9, v0.t
671 ; RV32-NEXT:    addi sp, sp, 16
672 ; RV32-NEXT:    ret
674 ; RV64-LABEL: vremu_vx_v2i64:
675 ; RV64:       # %bb.0:
676 ; RV64-NEXT:    vsetvli zero, a1, e64, m1, ta, ma
677 ; RV64-NEXT:    vremu.vx v8, v8, a0, v0.t
678 ; RV64-NEXT:    ret
679   %elt.head = insertelement <2 x i64> poison, i64 %b, i32 0
680   %vb = shufflevector <2 x i64> %elt.head, <2 x i64> poison, <2 x i32> zeroinitializer
681   %v = call <2 x i64> @llvm.vp.urem.v2i64(<2 x i64> %va, <2 x i64> %vb, <2 x i1> %m, i32 %evl)
682   ret <2 x i64> %v
685 define <2 x i64> @vremu_vx_v2i64_unmasked(<2 x i64> %va, i64 %b, i32 zeroext %evl) {
686 ; RV32-LABEL: vremu_vx_v2i64_unmasked:
687 ; RV32:       # %bb.0:
688 ; RV32-NEXT:    addi sp, sp, -16
689 ; RV32-NEXT:    .cfi_def_cfa_offset 16
690 ; RV32-NEXT:    sw a1, 12(sp)
691 ; RV32-NEXT:    sw a0, 8(sp)
692 ; RV32-NEXT:    addi a0, sp, 8
693 ; RV32-NEXT:    vsetivli zero, 2, e64, m1, ta, ma
694 ; RV32-NEXT:    vlse64.v v9, (a0), zero
695 ; RV32-NEXT:    vsetvli zero, a2, e64, m1, ta, ma
696 ; RV32-NEXT:    vremu.vv v8, v8, v9
697 ; RV32-NEXT:    addi sp, sp, 16
698 ; RV32-NEXT:    ret
700 ; RV64-LABEL: vremu_vx_v2i64_unmasked:
701 ; RV64:       # %bb.0:
702 ; RV64-NEXT:    vsetvli zero, a1, e64, m1, ta, ma
703 ; RV64-NEXT:    vremu.vx v8, v8, a0
704 ; RV64-NEXT:    ret
705   %elt.head = insertelement <2 x i64> poison, i64 %b, i32 0
706   %vb = shufflevector <2 x i64> %elt.head, <2 x i64> poison, <2 x i32> zeroinitializer
707   %head = insertelement <2 x i1> poison, i1 true, i32 0
708   %m = shufflevector <2 x i1> %head, <2 x i1> poison, <2 x i32> zeroinitializer
709   %v = call <2 x i64> @llvm.vp.urem.v2i64(<2 x i64> %va, <2 x i64> %vb, <2 x i1> %m, i32 %evl)
710   ret <2 x i64> %v
713 declare <4 x i64> @llvm.vp.urem.v4i64(<4 x i64>, <4 x i64>, <4 x i1>, i32)
715 define <4 x i64> @vremu_vv_v4i64(<4 x i64> %va, <4 x i64> %b, <4 x i1> %m, i32 zeroext %evl) {
716 ; CHECK-LABEL: vremu_vv_v4i64:
717 ; CHECK:       # %bb.0:
718 ; CHECK-NEXT:    vsetvli zero, a0, e64, m2, ta, ma
719 ; CHECK-NEXT:    vremu.vv v8, v8, v10, v0.t
720 ; CHECK-NEXT:    ret
721   %v = call <4 x i64> @llvm.vp.urem.v4i64(<4 x i64> %va, <4 x i64> %b, <4 x i1> %m, i32 %evl)
722   ret <4 x i64> %v
725 define <4 x i64> @vremu_vv_v4i64_unmasked(<4 x i64> %va, <4 x i64> %b, i32 zeroext %evl) {
726 ; CHECK-LABEL: vremu_vv_v4i64_unmasked:
727 ; CHECK:       # %bb.0:
728 ; CHECK-NEXT:    vsetvli zero, a0, e64, m2, ta, ma
729 ; CHECK-NEXT:    vremu.vv v8, v8, v10
730 ; CHECK-NEXT:    ret
731   %head = insertelement <4 x i1> poison, i1 true, i32 0
732   %m = shufflevector <4 x i1> %head, <4 x i1> poison, <4 x i32> zeroinitializer
733   %v = call <4 x i64> @llvm.vp.urem.v4i64(<4 x i64> %va, <4 x i64> %b, <4 x i1> %m, i32 %evl)
734   ret <4 x i64> %v
737 define <4 x i64> @vremu_vx_v4i64(<4 x i64> %va, i64 %b, <4 x i1> %m, i32 zeroext %evl) {
738 ; RV32-LABEL: vremu_vx_v4i64:
739 ; RV32:       # %bb.0:
740 ; RV32-NEXT:    addi sp, sp, -16
741 ; RV32-NEXT:    .cfi_def_cfa_offset 16
742 ; RV32-NEXT:    sw a1, 12(sp)
743 ; RV32-NEXT:    sw a0, 8(sp)
744 ; RV32-NEXT:    addi a0, sp, 8
745 ; RV32-NEXT:    vsetivli zero, 4, e64, m2, ta, ma
746 ; RV32-NEXT:    vlse64.v v10, (a0), zero
747 ; RV32-NEXT:    vsetvli zero, a2, e64, m2, ta, ma
748 ; RV32-NEXT:    vremu.vv v8, v8, v10, v0.t
749 ; RV32-NEXT:    addi sp, sp, 16
750 ; RV32-NEXT:    ret
752 ; RV64-LABEL: vremu_vx_v4i64:
753 ; RV64:       # %bb.0:
754 ; RV64-NEXT:    vsetvli zero, a1, e64, m2, ta, ma
755 ; RV64-NEXT:    vremu.vx v8, v8, a0, v0.t
756 ; RV64-NEXT:    ret
757   %elt.head = insertelement <4 x i64> poison, i64 %b, i32 0
758   %vb = shufflevector <4 x i64> %elt.head, <4 x i64> poison, <4 x i32> zeroinitializer
759   %v = call <4 x i64> @llvm.vp.urem.v4i64(<4 x i64> %va, <4 x i64> %vb, <4 x i1> %m, i32 %evl)
760   ret <4 x i64> %v
763 define <4 x i64> @vremu_vx_v4i64_unmasked(<4 x i64> %va, i64 %b, i32 zeroext %evl) {
764 ; RV32-LABEL: vremu_vx_v4i64_unmasked:
765 ; RV32:       # %bb.0:
766 ; RV32-NEXT:    addi sp, sp, -16
767 ; RV32-NEXT:    .cfi_def_cfa_offset 16
768 ; RV32-NEXT:    sw a1, 12(sp)
769 ; RV32-NEXT:    sw a0, 8(sp)
770 ; RV32-NEXT:    addi a0, sp, 8
771 ; RV32-NEXT:    vsetivli zero, 4, e64, m2, ta, ma
772 ; RV32-NEXT:    vlse64.v v10, (a0), zero
773 ; RV32-NEXT:    vsetvli zero, a2, e64, m2, ta, ma
774 ; RV32-NEXT:    vremu.vv v8, v8, v10
775 ; RV32-NEXT:    addi sp, sp, 16
776 ; RV32-NEXT:    ret
778 ; RV64-LABEL: vremu_vx_v4i64_unmasked:
779 ; RV64:       # %bb.0:
780 ; RV64-NEXT:    vsetvli zero, a1, e64, m2, ta, ma
781 ; RV64-NEXT:    vremu.vx v8, v8, a0
782 ; RV64-NEXT:    ret
783   %elt.head = insertelement <4 x i64> poison, i64 %b, i32 0
784   %vb = shufflevector <4 x i64> %elt.head, <4 x i64> poison, <4 x i32> zeroinitializer
785   %head = insertelement <4 x i1> poison, i1 true, i32 0
786   %m = shufflevector <4 x i1> %head, <4 x i1> poison, <4 x i32> zeroinitializer
787   %v = call <4 x i64> @llvm.vp.urem.v4i64(<4 x i64> %va, <4 x i64> %vb, <4 x i1> %m, i32 %evl)
788   ret <4 x i64> %v
791 declare <8 x i64> @llvm.vp.urem.v8i64(<8 x i64>, <8 x i64>, <8 x i1>, i32)
793 define <8 x i64> @vremu_vv_v8i64(<8 x i64> %va, <8 x i64> %b, <8 x i1> %m, i32 zeroext %evl) {
794 ; CHECK-LABEL: vremu_vv_v8i64:
795 ; CHECK:       # %bb.0:
796 ; CHECK-NEXT:    vsetvli zero, a0, e64, m4, ta, ma
797 ; CHECK-NEXT:    vremu.vv v8, v8, v12, v0.t
798 ; CHECK-NEXT:    ret
799   %v = call <8 x i64> @llvm.vp.urem.v8i64(<8 x i64> %va, <8 x i64> %b, <8 x i1> %m, i32 %evl)
800   ret <8 x i64> %v
803 define <8 x i64> @vremu_vv_v8i64_unmasked(<8 x i64> %va, <8 x i64> %b, i32 zeroext %evl) {
804 ; CHECK-LABEL: vremu_vv_v8i64_unmasked:
805 ; CHECK:       # %bb.0:
806 ; CHECK-NEXT:    vsetvli zero, a0, e64, m4, ta, ma
807 ; CHECK-NEXT:    vremu.vv v8, v8, v12
808 ; CHECK-NEXT:    ret
809   %head = insertelement <8 x i1> poison, i1 true, i32 0
810   %m = shufflevector <8 x i1> %head, <8 x i1> poison, <8 x i32> zeroinitializer
811   %v = call <8 x i64> @llvm.vp.urem.v8i64(<8 x i64> %va, <8 x i64> %b, <8 x i1> %m, i32 %evl)
812   ret <8 x i64> %v
815 define <8 x i64> @vremu_vx_v8i64(<8 x i64> %va, i64 %b, <8 x i1> %m, i32 zeroext %evl) {
816 ; RV32-LABEL: vremu_vx_v8i64:
817 ; RV32:       # %bb.0:
818 ; RV32-NEXT:    addi sp, sp, -16
819 ; RV32-NEXT:    .cfi_def_cfa_offset 16
820 ; RV32-NEXT:    sw a1, 12(sp)
821 ; RV32-NEXT:    sw a0, 8(sp)
822 ; RV32-NEXT:    addi a0, sp, 8
823 ; RV32-NEXT:    vsetivli zero, 8, e64, m4, ta, ma
824 ; RV32-NEXT:    vlse64.v v12, (a0), zero
825 ; RV32-NEXT:    vsetvli zero, a2, e64, m4, ta, ma
826 ; RV32-NEXT:    vremu.vv v8, v8, v12, v0.t
827 ; RV32-NEXT:    addi sp, sp, 16
828 ; RV32-NEXT:    ret
830 ; RV64-LABEL: vremu_vx_v8i64:
831 ; RV64:       # %bb.0:
832 ; RV64-NEXT:    vsetvli zero, a1, e64, m4, ta, ma
833 ; RV64-NEXT:    vremu.vx v8, v8, a0, v0.t
834 ; RV64-NEXT:    ret
835   %elt.head = insertelement <8 x i64> poison, i64 %b, i32 0
836   %vb = shufflevector <8 x i64> %elt.head, <8 x i64> poison, <8 x i32> zeroinitializer
837   %v = call <8 x i64> @llvm.vp.urem.v8i64(<8 x i64> %va, <8 x i64> %vb, <8 x i1> %m, i32 %evl)
838   ret <8 x i64> %v
841 define <8 x i64> @vremu_vx_v8i64_unmasked(<8 x i64> %va, i64 %b, i32 zeroext %evl) {
842 ; RV32-LABEL: vremu_vx_v8i64_unmasked:
843 ; RV32:       # %bb.0:
844 ; RV32-NEXT:    addi sp, sp, -16
845 ; RV32-NEXT:    .cfi_def_cfa_offset 16
846 ; RV32-NEXT:    sw a1, 12(sp)
847 ; RV32-NEXT:    sw a0, 8(sp)
848 ; RV32-NEXT:    addi a0, sp, 8
849 ; RV32-NEXT:    vsetivli zero, 8, e64, m4, ta, ma
850 ; RV32-NEXT:    vlse64.v v12, (a0), zero
851 ; RV32-NEXT:    vsetvli zero, a2, e64, m4, ta, ma
852 ; RV32-NEXT:    vremu.vv v8, v8, v12
853 ; RV32-NEXT:    addi sp, sp, 16
854 ; RV32-NEXT:    ret
856 ; RV64-LABEL: vremu_vx_v8i64_unmasked:
857 ; RV64:       # %bb.0:
858 ; RV64-NEXT:    vsetvli zero, a1, e64, m4, ta, ma
859 ; RV64-NEXT:    vremu.vx v8, v8, a0
860 ; RV64-NEXT:    ret
861   %elt.head = insertelement <8 x i64> poison, i64 %b, i32 0
862   %vb = shufflevector <8 x i64> %elt.head, <8 x i64> poison, <8 x i32> zeroinitializer
863   %head = insertelement <8 x i1> poison, i1 true, i32 0
864   %m = shufflevector <8 x i1> %head, <8 x i1> poison, <8 x i32> zeroinitializer
865   %v = call <8 x i64> @llvm.vp.urem.v8i64(<8 x i64> %va, <8 x i64> %vb, <8 x i1> %m, i32 %evl)
866   ret <8 x i64> %v
869 declare <16 x i64> @llvm.vp.urem.v16i64(<16 x i64>, <16 x i64>, <16 x i1>, i32)
871 define <16 x i64> @vremu_vv_v16i64(<16 x i64> %va, <16 x i64> %b, <16 x i1> %m, i32 zeroext %evl) {
872 ; CHECK-LABEL: vremu_vv_v16i64:
873 ; CHECK:       # %bb.0:
874 ; CHECK-NEXT:    vsetvli zero, a0, e64, m8, ta, ma
875 ; CHECK-NEXT:    vremu.vv v8, v8, v16, v0.t
876 ; CHECK-NEXT:    ret
877   %v = call <16 x i64> @llvm.vp.urem.v16i64(<16 x i64> %va, <16 x i64> %b, <16 x i1> %m, i32 %evl)
878   ret <16 x i64> %v
881 define <16 x i64> @vremu_vv_v16i64_unmasked(<16 x i64> %va, <16 x i64> %b, i32 zeroext %evl) {
882 ; CHECK-LABEL: vremu_vv_v16i64_unmasked:
883 ; CHECK:       # %bb.0:
884 ; CHECK-NEXT:    vsetvli zero, a0, e64, m8, ta, ma
885 ; CHECK-NEXT:    vremu.vv v8, v8, v16
886 ; CHECK-NEXT:    ret
887   %head = insertelement <16 x i1> poison, i1 true, i32 0
888   %m = shufflevector <16 x i1> %head, <16 x i1> poison, <16 x i32> zeroinitializer
889   %v = call <16 x i64> @llvm.vp.urem.v16i64(<16 x i64> %va, <16 x i64> %b, <16 x i1> %m, i32 %evl)
890   ret <16 x i64> %v
893 define <16 x i64> @vremu_vx_v16i64(<16 x i64> %va, i64 %b, <16 x i1> %m, i32 zeroext %evl) {
894 ; RV32-LABEL: vremu_vx_v16i64:
895 ; RV32:       # %bb.0:
896 ; RV32-NEXT:    addi sp, sp, -16
897 ; RV32-NEXT:    .cfi_def_cfa_offset 16
898 ; RV32-NEXT:    sw a1, 12(sp)
899 ; RV32-NEXT:    sw a0, 8(sp)
900 ; RV32-NEXT:    addi a0, sp, 8
901 ; RV32-NEXT:    vsetivli zero, 16, e64, m8, ta, ma
902 ; RV32-NEXT:    vlse64.v v16, (a0), zero
903 ; RV32-NEXT:    vsetvli zero, a2, e64, m8, ta, ma
904 ; RV32-NEXT:    vremu.vv v8, v8, v16, v0.t
905 ; RV32-NEXT:    addi sp, sp, 16
906 ; RV32-NEXT:    ret
908 ; RV64-LABEL: vremu_vx_v16i64:
909 ; RV64:       # %bb.0:
910 ; RV64-NEXT:    vsetvli zero, a1, e64, m8, ta, ma
911 ; RV64-NEXT:    vremu.vx v8, v8, a0, v0.t
912 ; RV64-NEXT:    ret
913   %elt.head = insertelement <16 x i64> poison, i64 %b, i32 0
914   %vb = shufflevector <16 x i64> %elt.head, <16 x i64> poison, <16 x i32> zeroinitializer
915   %v = call <16 x i64> @llvm.vp.urem.v16i64(<16 x i64> %va, <16 x i64> %vb, <16 x i1> %m, i32 %evl)
916   ret <16 x i64> %v
919 define <16 x i64> @vremu_vx_v16i64_unmasked(<16 x i64> %va, i64 %b, i32 zeroext %evl) {
920 ; RV32-LABEL: vremu_vx_v16i64_unmasked:
921 ; RV32:       # %bb.0:
922 ; RV32-NEXT:    addi sp, sp, -16
923 ; RV32-NEXT:    .cfi_def_cfa_offset 16
924 ; RV32-NEXT:    sw a1, 12(sp)
925 ; RV32-NEXT:    sw a0, 8(sp)
926 ; RV32-NEXT:    addi a0, sp, 8
927 ; RV32-NEXT:    vsetivli zero, 16, e64, m8, ta, ma
928 ; RV32-NEXT:    vlse64.v v16, (a0), zero
929 ; RV32-NEXT:    vsetvli zero, a2, e64, m8, ta, ma
930 ; RV32-NEXT:    vremu.vv v8, v8, v16
931 ; RV32-NEXT:    addi sp, sp, 16
932 ; RV32-NEXT:    ret
934 ; RV64-LABEL: vremu_vx_v16i64_unmasked:
935 ; RV64:       # %bb.0:
936 ; RV64-NEXT:    vsetvli zero, a1, e64, m8, ta, ma
937 ; RV64-NEXT:    vremu.vx v8, v8, a0
938 ; RV64-NEXT:    ret
939   %elt.head = insertelement <16 x i64> poison, i64 %b, i32 0
940   %vb = shufflevector <16 x i64> %elt.head, <16 x i64> poison, <16 x i32> zeroinitializer
941   %head = insertelement <16 x i1> poison, i1 true, i32 0
942   %m = shufflevector <16 x i1> %head, <16 x i1> poison, <16 x i32> zeroinitializer
943   %v = call <16 x i64> @llvm.vp.urem.v16i64(<16 x i64> %va, <16 x i64> %vb, <16 x i1> %m, i32 %evl)
944   ret <16 x i64> %v