Bump version to 19.1.0-rc3
[llvm-project.git] / llvm / test / CodeGen / RISCV / rvv / shuffle-reverse.ll
blob368f454fa5fda1fb34e8417985542695b8f7b832
1 ; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
2 ; RUN: llc < %s -mtriple=riscv32 -mattr=+v,+f,+zfh,+zvfh,+d -verify-machineinstrs | FileCheck %s --check-prefixes=CHECK,RV32
3 ; RUN: llc < %s -mtriple=riscv64 -mattr=+v,+f,+zfh,+zvfh,+d -verify-machineinstrs | FileCheck %s --check-prefixes=CHECK,RV64
5 define <2 x i8> @v2i8(<2 x i8> %a) {
6 ; CHECK-LABEL: v2i8:
7 ; CHECK:       # %bb.0:
8 ; CHECK-NEXT:    vsetivli zero, 2, e8, mf8, ta, ma
9 ; CHECK-NEXT:    vslidedown.vi v9, v8, 1
10 ; CHECK-NEXT:    vslideup.vi v9, v8, 1
11 ; CHECK-NEXT:    vmv1r.v v8, v9
12 ; CHECK-NEXT:    ret
13   %v2i8 = shufflevector <2 x i8> %a, <2 x i8> undef, <2 x i32> <i32 1, i32 0>
14   ret <2 x i8> %v2i8
17 define <4 x i8> @v2i8_2(<2 x i8> %a, <2 x i8> %b) {
18 ; CHECK-LABEL: v2i8_2:
19 ; CHECK:       # %bb.0:
20 ; CHECK-NEXT:    vsetivli zero, 2, e8, mf8, ta, ma
21 ; CHECK-NEXT:    vslidedown.vi v10, v8, 1
22 ; CHECK-NEXT:    vslideup.vi v10, v8, 1
23 ; CHECK-NEXT:    vslidedown.vi v8, v9, 1
24 ; CHECK-NEXT:    vslideup.vi v8, v9, 1
25 ; CHECK-NEXT:    vsetivli zero, 4, e8, mf4, ta, ma
26 ; CHECK-NEXT:    vslideup.vi v8, v10, 2
27 ; CHECK-NEXT:    ret
28   %v4i8 = shufflevector <2 x i8> %a, <2 x i8> %b, <4 x i32> <i32 3, i32 2, i32 1, i32 0>
29   ret <4 x i8> %v4i8
32 define <4 x i8> @v4i8(<4 x i8> %a) {
33 ; CHECK-LABEL: v4i8:
34 ; CHECK:       # %bb.0:
35 ; CHECK-NEXT:    vsetivli zero, 4, e8, mf4, ta, ma
36 ; CHECK-NEXT:    vid.v v9
37 ; CHECK-NEXT:    vrsub.vi v10, v9, 3
38 ; CHECK-NEXT:    vrgather.vv v9, v8, v10
39 ; CHECK-NEXT:    vmv1r.v v8, v9
40 ; CHECK-NEXT:    ret
41   %v4i8 = shufflevector <4 x i8> %a, <4 x i8> undef, <4 x i32> <i32 3, i32 2, i32 1, i32 0>
42   ret <4 x i8> %v4i8
45 define <8 x i8> @v4i8_2(<4 x i8> %a, <4 x i8> %b) {
46 ; CHECK-LABEL: v4i8_2:
47 ; CHECK:       # %bb.0:
48 ; CHECK-NEXT:    vsetivli zero, 8, e8, mf2, ta, mu
49 ; CHECK-NEXT:    vid.v v11
50 ; CHECK-NEXT:    vrsub.vi v12, v11, 7
51 ; CHECK-NEXT:    vrgather.vv v10, v8, v12
52 ; CHECK-NEXT:    vmv.v.i v0, 15
53 ; CHECK-NEXT:    vrsub.vi v8, v11, 3
54 ; CHECK-NEXT:    vrgather.vv v10, v9, v8, v0.t
55 ; CHECK-NEXT:    vmv1r.v v8, v10
56 ; CHECK-NEXT:    ret
57   %v8i8 = shufflevector <4 x i8> %a, <4 x i8> %b, <8 x i32> <i32 7, i32 6, i32 5, i32 4, i32 3, i32 2, i32 1, i32 0>
58   ret <8 x i8> %v8i8
61 define <8 x i8> @v8i8(<8 x i8> %a) {
62 ; CHECK-LABEL: v8i8:
63 ; CHECK:       # %bb.0:
64 ; CHECK-NEXT:    vsetivli zero, 8, e8, mf2, ta, ma
65 ; CHECK-NEXT:    vid.v v9
66 ; CHECK-NEXT:    vrsub.vi v10, v9, 7
67 ; CHECK-NEXT:    vrgather.vv v9, v8, v10
68 ; CHECK-NEXT:    vmv1r.v v8, v9
69 ; CHECK-NEXT:    ret
70   %v8i8 = shufflevector <8 x i8> %a, <8 x i8> undef, <8 x i32> <i32 7, i32 6, i32 5, i32 4, i32 3, i32 2, i32 1, i32 0>
71   ret <8 x i8> %v8i8
74 define <16 x i8> @v8i8_2(<8 x i8> %a, <8 x i8> %b) {
75 ; CHECK-LABEL: v8i8_2:
76 ; CHECK:       # %bb.0:
77 ; CHECK-NEXT:    vsetivli zero, 16, e8, m1, ta, ma
78 ; CHECK-NEXT:    vid.v v11
79 ; CHECK-NEXT:    vrsub.vi v12, v11, 15
80 ; CHECK-NEXT:    vrgather.vv v10, v8, v12
81 ; CHECK-NEXT:    li a0, 255
82 ; CHECK-NEXT:    vsetvli zero, zero, e16, m2, ta, ma
83 ; CHECK-NEXT:    vmv.s.x v0, a0
84 ; CHECK-NEXT:    vsetvli zero, zero, e8, m1, ta, mu
85 ; CHECK-NEXT:    vrsub.vi v8, v11, 7
86 ; CHECK-NEXT:    vrgather.vv v10, v9, v8, v0.t
87 ; CHECK-NEXT:    vmv.v.v v8, v10
88 ; CHECK-NEXT:    ret
89   %v16i8 = shufflevector <8 x i8> %a, <8 x i8> %b, <16 x i32> <i32 15, i32 14, i32 13, i32 12, i32 11, i32 10, i32 9, i32 8, i32 7, i32 6, i32 5, i32 4, i32 3, i32 2, i32 1, i32 0>
90   ret <16 x i8> %v16i8
93 define <16 x i8> @v16i8(<16 x i8> %a) {
94 ; CHECK-LABEL: v16i8:
95 ; CHECK:       # %bb.0:
96 ; CHECK-NEXT:    vsetivli zero, 16, e8, m1, ta, ma
97 ; CHECK-NEXT:    vid.v v9
98 ; CHECK-NEXT:    vrsub.vi v10, v9, 15
99 ; CHECK-NEXT:    vrgather.vv v9, v8, v10
100 ; CHECK-NEXT:    vmv.v.v v8, v9
101 ; CHECK-NEXT:    ret
102   %v16i8 = shufflevector <16 x i8> %a, <16 x i8> undef, <16 x i32> <i32 15, i32 14, i32 13, i32 12, i32 11, i32 10, i32 9, i32 8, i32 7, i32 6, i32 5, i32 4, i32 3, i32 2, i32 1, i32 0>
103   ret <16 x i8> %v16i8
106 define <32 x i8> @v16i8_2(<16 x i8> %a, <16 x i8> %b) {
107 ; CHECK-LABEL: v16i8_2:
108 ; CHECK:       # %bb.0:
109 ; CHECK-NEXT:    li a0, 32
110 ; CHECK-NEXT:    lui a1, %hi(.LCPI7_0)
111 ; CHECK-NEXT:    addi a1, a1, %lo(.LCPI7_0)
112 ; CHECK-NEXT:    vsetvli zero, a0, e8, m2, ta, ma
113 ; CHECK-NEXT:    vle8.v v12, (a1)
114 ; CHECK-NEXT:    vmv1r.v v14, v9
115 ; CHECK-NEXT:    vrgather.vv v10, v8, v12
116 ; CHECK-NEXT:    vid.v v8
117 ; CHECK-NEXT:    vrsub.vi v8, v8, 15
118 ; CHECK-NEXT:    lui a0, 16
119 ; CHECK-NEXT:    addi a0, a0, -1
120 ; CHECK-NEXT:    vsetvli zero, zero, e32, m8, ta, ma
121 ; CHECK-NEXT:    vmv.s.x v0, a0
122 ; CHECK-NEXT:    vsetvli zero, zero, e8, m2, ta, mu
123 ; CHECK-NEXT:    vrgather.vv v10, v14, v8, v0.t
124 ; CHECK-NEXT:    vmv.v.v v8, v10
125 ; CHECK-NEXT:    ret
126   %v32i8 = shufflevector <16 x i8> %a, <16 x i8> %b,  <32 x i32> <i32 31, i32 30, i32 29, i32 28, i32 27, i32 26, i32 25, i32 24, i32 23, i32 22, i32 21, i32 20, i32 19, i32 18, i32 17, i32 16, i32 15, i32 14, i32 13, i32 12, i32 11, i32 10, i32 9, i32 8, i32 7, i32 6, i32 5, i32 4, i32 3, i32 2, i32 1, i32 0>
127   ret <32 x i8> %v32i8
130 define <2 x i16> @v2i16(<2 x i16> %a) {
131 ; CHECK-LABEL: v2i16:
132 ; CHECK:       # %bb.0:
133 ; CHECK-NEXT:    vsetivli zero, 2, e16, mf4, ta, ma
134 ; CHECK-NEXT:    vslidedown.vi v9, v8, 1
135 ; CHECK-NEXT:    vslideup.vi v9, v8, 1
136 ; CHECK-NEXT:    vmv1r.v v8, v9
137 ; CHECK-NEXT:    ret
138   %v2i16 = shufflevector <2 x i16> %a, <2 x i16> undef, <2 x i32> <i32 1, i32 0>
139   ret <2 x i16> %v2i16
142 define <4 x i16> @v2i16_2(<2 x i16> %a, <2 x i16> %b) {
143 ; CHECK-LABEL: v2i16_2:
144 ; CHECK:       # %bb.0:
145 ; CHECK-NEXT:    vsetivli zero, 2, e16, mf4, ta, ma
146 ; CHECK-NEXT:    vslidedown.vi v10, v8, 1
147 ; CHECK-NEXT:    vslideup.vi v10, v8, 1
148 ; CHECK-NEXT:    vslidedown.vi v8, v9, 1
149 ; CHECK-NEXT:    vslideup.vi v8, v9, 1
150 ; CHECK-NEXT:    vsetivli zero, 4, e16, mf2, ta, ma
151 ; CHECK-NEXT:    vslideup.vi v8, v10, 2
152 ; CHECK-NEXT:    ret
153   %v4i16 = shufflevector <2 x i16> %a, <2 x i16> %b, <4 x i32> <i32 3, i32 2, i32 1, i32 0>
154   ret <4 x i16> %v4i16
157 define <4 x i16> @v4i16(<4 x i16> %a) {
158 ; CHECK-LABEL: v4i16:
159 ; CHECK:       # %bb.0:
160 ; CHECK-NEXT:    vsetivli zero, 4, e16, mf2, ta, ma
161 ; CHECK-NEXT:    vid.v v9
162 ; CHECK-NEXT:    vrsub.vi v10, v9, 3
163 ; CHECK-NEXT:    vrgather.vv v9, v8, v10
164 ; CHECK-NEXT:    vmv1r.v v8, v9
165 ; CHECK-NEXT:    ret
166   %v4i16 = shufflevector <4 x i16> %a, <4 x i16> undef, <4 x i32> <i32 3, i32 2, i32 1, i32 0>
167   ret <4 x i16> %v4i16
170 define <8 x i16> @v4i16_2(<4 x i16> %a, <4 x i16> %b) {
171 ; CHECK-LABEL: v4i16_2:
172 ; CHECK:       # %bb.0:
173 ; CHECK-NEXT:    vsetivli zero, 8, e16, m1, ta, mu
174 ; CHECK-NEXT:    vid.v v11
175 ; CHECK-NEXT:    vrsub.vi v12, v11, 7
176 ; CHECK-NEXT:    vrgather.vv v10, v8, v12
177 ; CHECK-NEXT:    vmv.v.i v0, 15
178 ; CHECK-NEXT:    vrsub.vi v8, v11, 3
179 ; CHECK-NEXT:    vrgather.vv v10, v9, v8, v0.t
180 ; CHECK-NEXT:    vmv.v.v v8, v10
181 ; CHECK-NEXT:    ret
182   %v8i16 = shufflevector <4 x i16> %a, <4 x i16> %b, <8 x i32> <i32 7, i32 6, i32 5, i32 4, i32 3, i32 2, i32 1, i32 0>
183   ret <8 x i16> %v8i16
186 define <8 x i16> @v8i16(<8 x i16> %a) {
187 ; CHECK-LABEL: v8i16:
188 ; CHECK:       # %bb.0:
189 ; CHECK-NEXT:    vsetivli zero, 8, e16, m1, ta, ma
190 ; CHECK-NEXT:    vid.v v9
191 ; CHECK-NEXT:    vrsub.vi v10, v9, 7
192 ; CHECK-NEXT:    vrgather.vv v9, v8, v10
193 ; CHECK-NEXT:    vmv.v.v v8, v9
194 ; CHECK-NEXT:    ret
195   %v8i16 = shufflevector <8 x i16> %a, <8 x i16> undef, <8 x i32> <i32 7, i32 6, i32 5, i32 4, i32 3, i32 2, i32 1, i32 0>
196   ret <8 x i16> %v8i16
199 define <16 x i16> @v8i16_2(<8 x i16> %a, <8 x i16> %b) {
200 ; CHECK-LABEL: v8i16_2:
201 ; CHECK:       # %bb.0:
202 ; CHECK-NEXT:    vmv1r.v v12, v9
203 ; CHECK-NEXT:    vsetivli zero, 16, e16, m2, ta, mu
204 ; CHECK-NEXT:    vid.v v14
205 ; CHECK-NEXT:    vrsub.vi v16, v14, 15
206 ; CHECK-NEXT:    vrgather.vv v10, v8, v16
207 ; CHECK-NEXT:    vrsub.vi v8, v14, 7
208 ; CHECK-NEXT:    li a0, 255
209 ; CHECK-NEXT:    vmv.s.x v0, a0
210 ; CHECK-NEXT:    vrgather.vv v10, v12, v8, v0.t
211 ; CHECK-NEXT:    vmv.v.v v8, v10
212 ; CHECK-NEXT:    ret
213   %v16i16 = shufflevector <8 x i16> %a, <8 x i16> %b,  <16 x i32> <i32 15, i32 14, i32 13, i32 12, i32 11, i32 10, i32 9, i32 8, i32 7, i32 6, i32 5, i32 4, i32 3, i32 2, i32 1, i32 0>
214   ret <16 x i16> %v16i16
217 define <16 x i16> @v16i16(<16 x i16> %a) {
218 ; CHECK-LABEL: v16i16:
219 ; CHECK:       # %bb.0:
220 ; CHECK-NEXT:    vsetivli zero, 16, e16, m2, ta, ma
221 ; CHECK-NEXT:    vid.v v10
222 ; CHECK-NEXT:    vrsub.vi v12, v10, 15
223 ; CHECK-NEXT:    vrgather.vv v10, v8, v12
224 ; CHECK-NEXT:    vmv.v.v v8, v10
225 ; CHECK-NEXT:    ret
226   %v16i16 = shufflevector <16 x i16> %a, <16 x i16> undef,  <16 x i32> <i32 15, i32 14, i32 13, i32 12, i32 11, i32 10, i32 9, i32 8, i32 7, i32 6, i32 5, i32 4, i32 3, i32 2, i32 1, i32 0>
227   ret <16 x i16> %v16i16
230 define <32 x i16> @v16i16_2(<16 x i16> %a, <16 x i16> %b) {
231 ; CHECK-LABEL: v16i16_2:
232 ; CHECK:       # %bb.0:
233 ; CHECK-NEXT:    li a0, 32
234 ; CHECK-NEXT:    lui a1, %hi(.LCPI15_0)
235 ; CHECK-NEXT:    addi a1, a1, %lo(.LCPI15_0)
236 ; CHECK-NEXT:    vsetvli zero, a0, e16, m4, ta, ma
237 ; CHECK-NEXT:    vle16.v v16, (a1)
238 ; CHECK-NEXT:    vmv2r.v v20, v10
239 ; CHECK-NEXT:    vmv2r.v v12, v8
240 ; CHECK-NEXT:    vrgather.vv v8, v12, v16
241 ; CHECK-NEXT:    vid.v v12
242 ; CHECK-NEXT:    vrsub.vi v12, v12, 15
243 ; CHECK-NEXT:    lui a0, 16
244 ; CHECK-NEXT:    addi a0, a0, -1
245 ; CHECK-NEXT:    vsetvli zero, zero, e32, m8, ta, ma
246 ; CHECK-NEXT:    vmv.s.x v0, a0
247 ; CHECK-NEXT:    vsetvli zero, zero, e16, m4, ta, mu
248 ; CHECK-NEXT:    vrgather.vv v8, v20, v12, v0.t
249 ; CHECK-NEXT:    ret
250   %v32i16 = shufflevector <16 x i16> %a, <16 x i16> %b,  <32 x i32> <i32 31, i32 30, i32 29, i32 28, i32 27, i32 26, i32 25, i32 24, i32 23, i32 22, i32 21, i32 20, i32 19, i32 18, i32 17, i32 16, i32 15, i32 14, i32 13, i32 12, i32 11, i32 10, i32 9, i32 8, i32 7, i32 6, i32 5, i32 4, i32 3, i32 2, i32 1, i32 0>
251   ret <32 x i16> %v32i16
254 define <2 x i32> @v2i32(<2 x i32> %a) {
255 ; CHECK-LABEL: v2i32:
256 ; CHECK:       # %bb.0:
257 ; CHECK-NEXT:    vsetivli zero, 2, e32, mf2, ta, ma
258 ; CHECK-NEXT:    vslidedown.vi v9, v8, 1
259 ; CHECK-NEXT:    vslideup.vi v9, v8, 1
260 ; CHECK-NEXT:    vmv1r.v v8, v9
261 ; CHECK-NEXT:    ret
262   %v2i32 = shufflevector <2 x i32> %a, <2 x i32> undef, <2 x i32> <i32 1, i32 0>
263   ret <2 x i32> %v2i32
266 define <4 x i32> @v2i32_2(<2 x i32> %a, < 2 x i32> %b) {
267 ; CHECK-LABEL: v2i32_2:
268 ; CHECK:       # %bb.0:
269 ; CHECK-NEXT:    vsetivli zero, 2, e32, mf2, ta, ma
270 ; CHECK-NEXT:    vslidedown.vi v10, v8, 1
271 ; CHECK-NEXT:    vslideup.vi v10, v8, 1
272 ; CHECK-NEXT:    vslidedown.vi v8, v9, 1
273 ; CHECK-NEXT:    vslideup.vi v8, v9, 1
274 ; CHECK-NEXT:    vsetivli zero, 4, e32, m1, ta, ma
275 ; CHECK-NEXT:    vslideup.vi v8, v10, 2
276 ; CHECK-NEXT:    ret
277   %v4i32 = shufflevector <2 x i32> %a, <2 x i32> %b, <4 x i32> <i32 3, i32 2, i32 1, i32 0>
278   ret <4 x i32> %v4i32
281 define <4 x i32> @v4i32(<4 x i32> %a) {
282 ; CHECK-LABEL: v4i32:
283 ; CHECK:       # %bb.0:
284 ; CHECK-NEXT:    vsetivli zero, 4, e32, m1, ta, ma
285 ; CHECK-NEXT:    vid.v v9
286 ; CHECK-NEXT:    vrsub.vi v10, v9, 3
287 ; CHECK-NEXT:    vrgather.vv v9, v8, v10
288 ; CHECK-NEXT:    vmv.v.v v8, v9
289 ; CHECK-NEXT:    ret
290   %v4i32 = shufflevector <4 x i32> %a, <4 x i32> undef, <4 x i32> <i32 3, i32 2, i32 1, i32 0>
291   ret <4 x i32> %v4i32
294 define <8 x i32> @v4i32_2(<4 x i32> %a, <4 x i32> %b) {
295 ; CHECK-LABEL: v4i32_2:
296 ; CHECK:       # %bb.0:
297 ; CHECK-NEXT:    vmv1r.v v12, v9
298 ; CHECK-NEXT:    vsetivli zero, 8, e16, m1, ta, ma
299 ; CHECK-NEXT:    vid.v v9
300 ; CHECK-NEXT:    vrsub.vi v13, v9, 7
301 ; CHECK-NEXT:    vsetvli zero, zero, e32, m2, ta, ma
302 ; CHECK-NEXT:    vrgatherei16.vv v10, v8, v13
303 ; CHECK-NEXT:    vsetvli zero, zero, e16, m1, ta, ma
304 ; CHECK-NEXT:    vrsub.vi v8, v9, 3
305 ; CHECK-NEXT:    vmv.v.i v0, 15
306 ; CHECK-NEXT:    vsetvli zero, zero, e32, m2, ta, mu
307 ; CHECK-NEXT:    vrgatherei16.vv v10, v12, v8, v0.t
308 ; CHECK-NEXT:    vmv.v.v v8, v10
309 ; CHECK-NEXT:    ret
310   %v8i32 = shufflevector <4 x i32> %a, <4 x i32> %b, <8 x i32> <i32 7, i32 6, i32 5, i32 4, i32 3, i32 2, i32 1, i32 0>
311   ret <8 x i32> %v8i32
314 define <8 x i32> @v8i32(<8 x i32> %a) {
315 ; CHECK-LABEL: v8i32:
316 ; CHECK:       # %bb.0:
317 ; CHECK-NEXT:    vsetivli zero, 8, e16, m1, ta, ma
318 ; CHECK-NEXT:    vid.v v10
319 ; CHECK-NEXT:    vrsub.vi v12, v10, 7
320 ; CHECK-NEXT:    vsetvli zero, zero, e32, m2, ta, ma
321 ; CHECK-NEXT:    vrgatherei16.vv v10, v8, v12
322 ; CHECK-NEXT:    vmv.v.v v8, v10
323 ; CHECK-NEXT:    ret
324   %v8i32 = shufflevector <8 x i32> %a, <8 x i32> undef, <8 x i32> <i32 7, i32 6, i32 5, i32 4, i32 3, i32 2, i32 1, i32 0>
325   ret <8 x i32> %v8i32
328 define <16 x i32> @v8i32_2(<8 x i32> %a, <8 x i32> %b) {
329 ; CHECK-LABEL: v8i32_2:
330 ; CHECK:       # %bb.0:
331 ; CHECK-NEXT:    vmv2r.v v16, v10
332 ; CHECK-NEXT:    vsetivli zero, 16, e16, m2, ta, ma
333 ; CHECK-NEXT:    vid.v v10
334 ; CHECK-NEXT:    vrsub.vi v18, v10, 15
335 ; CHECK-NEXT:    vsetvli zero, zero, e32, m4, ta, ma
336 ; CHECK-NEXT:    vrgatherei16.vv v12, v8, v18
337 ; CHECK-NEXT:    vsetvli zero, zero, e16, m2, ta, ma
338 ; CHECK-NEXT:    vrsub.vi v8, v10, 7
339 ; CHECK-NEXT:    li a0, 255
340 ; CHECK-NEXT:    vmv.s.x v0, a0
341 ; CHECK-NEXT:    vsetvli zero, zero, e32, m4, ta, mu
342 ; CHECK-NEXT:    vrgatherei16.vv v12, v16, v8, v0.t
343 ; CHECK-NEXT:    vmv.v.v v8, v12
344 ; CHECK-NEXT:    ret
345   %v16i32 = shufflevector <8 x i32> %a, <8 x i32> %b,  <16 x i32> <i32 15, i32 14, i32 13, i32 12, i32 11, i32 10, i32 9, i32 8, i32 7, i32 6, i32 5, i32 4, i32 3, i32 2, i32 1, i32 0>
346   ret <16 x i32> %v16i32
349 define <16 x i32> @v16i32(<16 x i32> %a) {
350 ; CHECK-LABEL: v16i32:
351 ; CHECK:       # %bb.0:
352 ; CHECK-NEXT:    vsetivli zero, 16, e16, m2, ta, ma
353 ; CHECK-NEXT:    vid.v v12
354 ; CHECK-NEXT:    vrsub.vi v16, v12, 15
355 ; CHECK-NEXT:    vsetvli zero, zero, e32, m4, ta, ma
356 ; CHECK-NEXT:    vrgatherei16.vv v12, v8, v16
357 ; CHECK-NEXT:    vmv.v.v v8, v12
358 ; CHECK-NEXT:    ret
359   %v16i32 = shufflevector <16 x i32> %a, <16 x i32> undef,  <16 x i32> <i32 15, i32 14, i32 13, i32 12, i32 11, i32 10, i32 9, i32 8, i32 7, i32 6, i32 5, i32 4, i32 3, i32 2, i32 1, i32 0>
360   ret <16 x i32> %v16i32
363 define <32 x i32> @v16i32_2(<16 x i32> %a, <16 x i32> %b) {
364 ; CHECK-LABEL: v16i32_2:
365 ; CHECK:       # %bb.0:
366 ; CHECK-NEXT:    li a0, 32
367 ; CHECK-NEXT:    lui a1, %hi(.LCPI23_0)
368 ; CHECK-NEXT:    addi a1, a1, %lo(.LCPI23_0)
369 ; CHECK-NEXT:    vsetvli zero, a0, e32, m8, ta, ma
370 ; CHECK-NEXT:    vle16.v v20, (a1)
371 ; CHECK-NEXT:    vmv4r.v v24, v12
372 ; CHECK-NEXT:    vmv4r.v v16, v8
373 ; CHECK-NEXT:    vrgatherei16.vv v8, v16, v20
374 ; CHECK-NEXT:    vsetvli zero, zero, e16, m4, ta, ma
375 ; CHECK-NEXT:    vid.v v16
376 ; CHECK-NEXT:    vrsub.vi v16, v16, 15
377 ; CHECK-NEXT:    lui a0, 16
378 ; CHECK-NEXT:    addi a0, a0, -1
379 ; CHECK-NEXT:    vsetvli zero, zero, e32, m8, ta, mu
380 ; CHECK-NEXT:    vmv.s.x v0, a0
381 ; CHECK-NEXT:    vrgatherei16.vv v8, v24, v16, v0.t
382 ; CHECK-NEXT:    ret
383   %v32i32 = shufflevector <16 x i32> %a, <16 x i32> %b,  <32 x i32> <i32 31, i32 30, i32 29, i32 28, i32 27, i32 26, i32 25, i32 24, i32 23, i32 22, i32 21, i32 20, i32 19, i32 18, i32 17, i32 16, i32 15, i32 14, i32 13, i32 12, i32 11, i32 10, i32 9, i32 8, i32 7, i32 6, i32 5, i32 4, i32 3, i32 2, i32 1, i32 0>
384   ret <32 x i32> %v32i32
387 define <2 x i64> @v2i64(<2 x i64> %a) {
388 ; CHECK-LABEL: v2i64:
389 ; CHECK:       # %bb.0:
390 ; CHECK-NEXT:    vsetivli zero, 2, e64, m1, ta, ma
391 ; CHECK-NEXT:    vslidedown.vi v9, v8, 1
392 ; CHECK-NEXT:    vslideup.vi v9, v8, 1
393 ; CHECK-NEXT:    vmv.v.v v8, v9
394 ; CHECK-NEXT:    ret
395   %v2i64 = shufflevector <2 x i64> %a, <2 x i64> undef, <2 x i32> <i32 1, i32 0>
396   ret <2 x i64> %v2i64
399 define <4 x i64> @v2i64_2(<2 x i64> %a, < 2 x i64> %b) {
400 ; CHECK-LABEL: v2i64_2:
401 ; CHECK:       # %bb.0:
402 ; CHECK-NEXT:    vsetivli zero, 2, e64, m1, ta, ma
403 ; CHECK-NEXT:    vslidedown.vi v10, v8, 1
404 ; CHECK-NEXT:    vslideup.vi v10, v8, 1
405 ; CHECK-NEXT:    vslidedown.vi v8, v9, 1
406 ; CHECK-NEXT:    vslideup.vi v8, v9, 1
407 ; CHECK-NEXT:    vsetivli zero, 4, e64, m2, ta, ma
408 ; CHECK-NEXT:    vslideup.vi v8, v10, 2
409 ; CHECK-NEXT:    ret
410   %v4i64 = shufflevector <2 x i64> %a, <2 x i64> %b, <4 x i32> <i32 3, i32 2, i32 1, i32 0>
411   ret <4 x i64> %v4i64
414 define <4 x i64> @v4i64(<4 x i64> %a) {
415 ; CHECK-LABEL: v4i64:
416 ; CHECK:       # %bb.0:
417 ; CHECK-NEXT:    vsetivli zero, 4, e16, mf2, ta, ma
418 ; CHECK-NEXT:    vid.v v10
419 ; CHECK-NEXT:    vrsub.vi v12, v10, 3
420 ; CHECK-NEXT:    vsetvli zero, zero, e64, m2, ta, ma
421 ; CHECK-NEXT:    vrgatherei16.vv v10, v8, v12
422 ; CHECK-NEXT:    vmv.v.v v8, v10
423 ; CHECK-NEXT:    ret
424   %v4i64 = shufflevector <4 x i64> %a, <4 x i64> undef, <4 x i32> <i32 3, i32 2, i32 1, i32 0>
425   ret <4 x i64> %v4i64
428 define <8 x i64> @v4i64_2(<4 x i64> %a, <4 x i64> %b) {
429 ; CHECK-LABEL: v4i64_2:
430 ; CHECK:       # %bb.0:
431 ; CHECK-NEXT:    vmv2r.v v16, v10
432 ; CHECK-NEXT:    vsetivli zero, 8, e16, m1, ta, ma
433 ; CHECK-NEXT:    vid.v v10
434 ; CHECK-NEXT:    vrsub.vi v11, v10, 7
435 ; CHECK-NEXT:    vsetvli zero, zero, e64, m4, ta, ma
436 ; CHECK-NEXT:    vrgatherei16.vv v12, v8, v11
437 ; CHECK-NEXT:    vsetvli zero, zero, e16, m1, ta, ma
438 ; CHECK-NEXT:    vrsub.vi v8, v10, 3
439 ; CHECK-NEXT:    vmv.v.i v0, 15
440 ; CHECK-NEXT:    vsetvli zero, zero, e64, m4, ta, mu
441 ; CHECK-NEXT:    vrgatherei16.vv v12, v16, v8, v0.t
442 ; CHECK-NEXT:    vmv.v.v v8, v12
443 ; CHECK-NEXT:    ret
444   %v8i64 = shufflevector <4 x i64> %a, <4 x i64> %b, <8 x i32> <i32 7, i32 6, i32 5, i32 4, i32 3, i32 2, i32 1, i32 0>
445   ret <8 x i64> %v8i64
448 define <2 x half> @v2f16(<2 x half> %a) {
449 ; CHECK-LABEL: v2f16:
450 ; CHECK:       # %bb.0:
451 ; CHECK-NEXT:    vsetivli zero, 2, e16, mf4, ta, ma
452 ; CHECK-NEXT:    vslidedown.vi v9, v8, 1
453 ; CHECK-NEXT:    vslideup.vi v9, v8, 1
454 ; CHECK-NEXT:    vmv1r.v v8, v9
455 ; CHECK-NEXT:    ret
456   %v2f16 = shufflevector <2 x half> %a, <2 x half> undef, <2 x i32> <i32 1, i32 0>
457   ret <2 x half> %v2f16
460 define <4 x half> @v2f16_2(<2 x half> %a, <2 x half> %b) {
461 ; CHECK-LABEL: v2f16_2:
462 ; CHECK:       # %bb.0:
463 ; CHECK-NEXT:    vsetivli zero, 2, e16, mf4, ta, ma
464 ; CHECK-NEXT:    vslidedown.vi v10, v8, 1
465 ; CHECK-NEXT:    vslideup.vi v10, v8, 1
466 ; CHECK-NEXT:    vslidedown.vi v8, v9, 1
467 ; CHECK-NEXT:    vslideup.vi v8, v9, 1
468 ; CHECK-NEXT:    vsetivli zero, 4, e16, mf2, ta, ma
469 ; CHECK-NEXT:    vslideup.vi v8, v10, 2
470 ; CHECK-NEXT:    ret
471   %v4f16 = shufflevector <2 x half> %a, <2 x half> %b, <4 x i32> <i32 3, i32 2, i32 1, i32 0>
472   ret <4 x half> %v4f16
475 define <4 x half> @v4f16(<4 x half> %a) {
476 ; CHECK-LABEL: v4f16:
477 ; CHECK:       # %bb.0:
478 ; CHECK-NEXT:    vsetivli zero, 4, e16, mf2, ta, ma
479 ; CHECK-NEXT:    vid.v v9
480 ; CHECK-NEXT:    vrsub.vi v10, v9, 3
481 ; CHECK-NEXT:    vrgather.vv v9, v8, v10
482 ; CHECK-NEXT:    vmv1r.v v8, v9
483 ; CHECK-NEXT:    ret
484   %v4f16 = shufflevector <4 x half> %a, <4 x half> undef, <4 x i32> <i32 3, i32 2, i32 1, i32 0>
485   ret <4 x half> %v4f16
488 define <8 x half> @v4f16_2(<4 x half> %a, <4 x half> %b) {
489 ; CHECK-LABEL: v4f16_2:
490 ; CHECK:       # %bb.0:
491 ; CHECK-NEXT:    vsetivli zero, 8, e16, m1, ta, mu
492 ; CHECK-NEXT:    vid.v v11
493 ; CHECK-NEXT:    vrsub.vi v12, v11, 7
494 ; CHECK-NEXT:    vrgather.vv v10, v8, v12
495 ; CHECK-NEXT:    vmv.v.i v0, 15
496 ; CHECK-NEXT:    vrsub.vi v8, v11, 3
497 ; CHECK-NEXT:    vrgather.vv v10, v9, v8, v0.t
498 ; CHECK-NEXT:    vmv.v.v v8, v10
499 ; CHECK-NEXT:    ret
500   %v8f16 = shufflevector <4 x half> %a, <4 x half> %b, <8 x i32> <i32 7, i32 6, i32 5, i32 4, i32 3, i32 2, i32 1, i32 0>
501   ret <8 x half> %v8f16
504 define <8 x half> @v8f16(<8 x half> %a) {
505 ; CHECK-LABEL: v8f16:
506 ; CHECK:       # %bb.0:
507 ; CHECK-NEXT:    vsetivli zero, 8, e16, m1, ta, ma
508 ; CHECK-NEXT:    vid.v v9
509 ; CHECK-NEXT:    vrsub.vi v10, v9, 7
510 ; CHECK-NEXT:    vrgather.vv v9, v8, v10
511 ; CHECK-NEXT:    vmv.v.v v8, v9
512 ; CHECK-NEXT:    ret
513   %v8f16 = shufflevector <8 x half> %a, <8 x half> undef, <8 x i32> <i32 7, i32 6, i32 5, i32 4, i32 3, i32 2, i32 1, i32 0>
514   ret <8 x half> %v8f16
517 define <16 x half> @v8f16_2(<8 x half> %a, <8 x half> %b) {
518 ; CHECK-LABEL: v8f16_2:
519 ; CHECK:       # %bb.0:
520 ; CHECK-NEXT:    vmv1r.v v12, v9
521 ; CHECK-NEXT:    vsetivli zero, 16, e16, m2, ta, mu
522 ; CHECK-NEXT:    vid.v v14
523 ; CHECK-NEXT:    vrsub.vi v16, v14, 15
524 ; CHECK-NEXT:    vrgather.vv v10, v8, v16
525 ; CHECK-NEXT:    vrsub.vi v8, v14, 7
526 ; CHECK-NEXT:    li a0, 255
527 ; CHECK-NEXT:    vmv.s.x v0, a0
528 ; CHECK-NEXT:    vrgather.vv v10, v12, v8, v0.t
529 ; CHECK-NEXT:    vmv.v.v v8, v10
530 ; CHECK-NEXT:    ret
531   %v16f16 = shufflevector <8 x half> %a, <8 x half> %b,  <16 x i32> <i32 15, i32 14, i32 13, i32 12, i32 11, i32 10, i32 9, i32 8, i32 7, i32 6, i32 5, i32 4, i32 3, i32 2, i32 1, i32 0>
532   ret <16 x half> %v16f16
535 define <16 x half> @v16f16(<16 x half> %a) {
536 ; CHECK-LABEL: v16f16:
537 ; CHECK:       # %bb.0:
538 ; CHECK-NEXT:    vsetivli zero, 16, e16, m2, ta, ma
539 ; CHECK-NEXT:    vid.v v10
540 ; CHECK-NEXT:    vrsub.vi v12, v10, 15
541 ; CHECK-NEXT:    vrgather.vv v10, v8, v12
542 ; CHECK-NEXT:    vmv.v.v v8, v10
543 ; CHECK-NEXT:    ret
544   %v16f16 = shufflevector <16 x half> %a, <16 x half> undef,  <16 x i32> <i32 15, i32 14, i32 13, i32 12, i32 11, i32 10, i32 9, i32 8, i32 7, i32 6, i32 5, i32 4, i32 3, i32 2, i32 1, i32 0>
545   ret <16 x half> %v16f16
548 define <32 x half> @v16f16_2(<16 x half> %a) {
549 ; CHECK-LABEL: v16f16_2:
550 ; CHECK:       # %bb.0:
551 ; CHECK-NEXT:    li a0, 32
552 ; CHECK-NEXT:    lui a1, %hi(.LCPI35_0)
553 ; CHECK-NEXT:    addi a1, a1, %lo(.LCPI35_0)
554 ; CHECK-NEXT:    vsetvli zero, a0, e16, m4, ta, ma
555 ; CHECK-NEXT:    vle16.v v16, (a1)
556 ; CHECK-NEXT:    vrgather.vv v12, v8, v16
557 ; CHECK-NEXT:    vmv.v.v v8, v12
558 ; CHECK-NEXT:    ret
559   %v32f16 = shufflevector <16 x half> %a, <16 x half> undef,  <32 x i32> <i32 31, i32 30, i32 29, i32 28, i32 27, i32 26, i32 25, i32 24, i32 23, i32 22, i32 21, i32 20, i32 19, i32 18, i32 17, i32 16, i32 15, i32 14, i32 13, i32 12, i32 11, i32 10, i32 9, i32 8, i32 7, i32 6, i32 5, i32 4, i32 3, i32 2, i32 1, i32 0>
560   ret <32 x half> %v32f16
563 define <2 x float> @v2f32(<2 x float> %a) {
564 ; CHECK-LABEL: v2f32:
565 ; CHECK:       # %bb.0:
566 ; CHECK-NEXT:    vsetivli zero, 2, e32, mf2, ta, ma
567 ; CHECK-NEXT:    vslidedown.vi v9, v8, 1
568 ; CHECK-NEXT:    vslideup.vi v9, v8, 1
569 ; CHECK-NEXT:    vmv1r.v v8, v9
570 ; CHECK-NEXT:    ret
571   %v2f32 = shufflevector <2 x float> %a, <2 x float> undef, <2 x i32> <i32 1, i32 0>
572   ret <2 x float> %v2f32
575 define <4 x float> @v2f32_2(<2 x float> %a, <2 x float> %b) {
576 ; CHECK-LABEL: v2f32_2:
577 ; CHECK:       # %bb.0:
578 ; CHECK-NEXT:    vsetivli zero, 2, e32, mf2, ta, ma
579 ; CHECK-NEXT:    vslidedown.vi v10, v8, 1
580 ; CHECK-NEXT:    vslideup.vi v10, v8, 1
581 ; CHECK-NEXT:    vslidedown.vi v8, v9, 1
582 ; CHECK-NEXT:    vslideup.vi v8, v9, 1
583 ; CHECK-NEXT:    vsetivli zero, 4, e32, m1, ta, ma
584 ; CHECK-NEXT:    vslideup.vi v8, v10, 2
585 ; CHECK-NEXT:    ret
586   %v4f32 = shufflevector <2 x float> %a, <2 x float> %b, <4 x i32> <i32 3, i32 2, i32 1, i32 0>
587   ret <4 x float> %v4f32
590 define <4 x float> @v4f32(<4 x float> %a) {
591 ; CHECK-LABEL: v4f32:
592 ; CHECK:       # %bb.0:
593 ; CHECK-NEXT:    vsetivli zero, 4, e32, m1, ta, ma
594 ; CHECK-NEXT:    vid.v v9
595 ; CHECK-NEXT:    vrsub.vi v10, v9, 3
596 ; CHECK-NEXT:    vrgather.vv v9, v8, v10
597 ; CHECK-NEXT:    vmv.v.v v8, v9
598 ; CHECK-NEXT:    ret
599   %v4f32 = shufflevector <4 x float> %a, <4 x float> undef, <4 x i32> <i32 3, i32 2, i32 1, i32 0>
600   ret <4 x float> %v4f32
603 define <8 x float> @v4f32_2(<4 x float> %a, <4 x float> %b) {
604 ; CHECK-LABEL: v4f32_2:
605 ; CHECK:       # %bb.0:
606 ; CHECK-NEXT:    vmv1r.v v12, v9
607 ; CHECK-NEXT:    vsetivli zero, 8, e16, m1, ta, ma
608 ; CHECK-NEXT:    vid.v v9
609 ; CHECK-NEXT:    vrsub.vi v13, v9, 7
610 ; CHECK-NEXT:    vsetvli zero, zero, e32, m2, ta, ma
611 ; CHECK-NEXT:    vrgatherei16.vv v10, v8, v13
612 ; CHECK-NEXT:    vsetvli zero, zero, e16, m1, ta, ma
613 ; CHECK-NEXT:    vrsub.vi v8, v9, 3
614 ; CHECK-NEXT:    vmv.v.i v0, 15
615 ; CHECK-NEXT:    vsetvli zero, zero, e32, m2, ta, mu
616 ; CHECK-NEXT:    vrgatherei16.vv v10, v12, v8, v0.t
617 ; CHECK-NEXT:    vmv.v.v v8, v10
618 ; CHECK-NEXT:    ret
619   %v8f32 = shufflevector <4 x float> %a, <4 x float> %b, <8 x i32> <i32 7, i32 6, i32 5, i32 4, i32 3, i32 2, i32 1, i32 0>
620   ret <8 x float> %v8f32
623 define <8 x float> @v8f32(<8 x float> %a) {
624 ; CHECK-LABEL: v8f32:
625 ; CHECK:       # %bb.0:
626 ; CHECK-NEXT:    vsetivli zero, 8, e16, m1, ta, ma
627 ; CHECK-NEXT:    vid.v v10
628 ; CHECK-NEXT:    vrsub.vi v12, v10, 7
629 ; CHECK-NEXT:    vsetvli zero, zero, e32, m2, ta, ma
630 ; CHECK-NEXT:    vrgatherei16.vv v10, v8, v12
631 ; CHECK-NEXT:    vmv.v.v v8, v10
632 ; CHECK-NEXT:    ret
633   %v8f32 = shufflevector <8 x float> %a, <8 x float> undef, <8 x i32> <i32 7, i32 6, i32 5, i32 4, i32 3, i32 2, i32 1, i32 0>
634   ret <8 x float> %v8f32
637 define <16 x float> @v8f32_2(<8 x float> %a, <8 x float> %b) {
638 ; CHECK-LABEL: v8f32_2:
639 ; CHECK:       # %bb.0:
640 ; CHECK-NEXT:    vmv2r.v v16, v10
641 ; CHECK-NEXT:    vsetivli zero, 16, e16, m2, ta, ma
642 ; CHECK-NEXT:    vid.v v10
643 ; CHECK-NEXT:    vrsub.vi v18, v10, 15
644 ; CHECK-NEXT:    vsetvli zero, zero, e32, m4, ta, ma
645 ; CHECK-NEXT:    vrgatherei16.vv v12, v8, v18
646 ; CHECK-NEXT:    vsetvli zero, zero, e16, m2, ta, ma
647 ; CHECK-NEXT:    vrsub.vi v8, v10, 7
648 ; CHECK-NEXT:    li a0, 255
649 ; CHECK-NEXT:    vmv.s.x v0, a0
650 ; CHECK-NEXT:    vsetvli zero, zero, e32, m4, ta, mu
651 ; CHECK-NEXT:    vrgatherei16.vv v12, v16, v8, v0.t
652 ; CHECK-NEXT:    vmv.v.v v8, v12
653 ; CHECK-NEXT:    ret
654   %v16f32 = shufflevector <8 x float> %a, <8 x float> %b, <16 x i32> <i32 15, i32 14, i32 13, i32 12, i32 11, i32 10, i32 9, i32 8, i32 7, i32 6, i32 5, i32 4, i32 3, i32 2, i32 1, i32 0>
655   ret <16 x float> %v16f32
658 define <2 x double> @v2f64(<2 x double> %a) {
659 ; CHECK-LABEL: v2f64:
660 ; CHECK:       # %bb.0:
661 ; CHECK-NEXT:    vsetivli zero, 2, e64, m1, ta, ma
662 ; CHECK-NEXT:    vslidedown.vi v9, v8, 1
663 ; CHECK-NEXT:    vslideup.vi v9, v8, 1
664 ; CHECK-NEXT:    vmv.v.v v8, v9
665 ; CHECK-NEXT:    ret
666   %v2f64 = shufflevector <2 x double> %a, <2 x double> undef, <2 x i32> <i32 1, i32 0>
667   ret <2 x double> %v2f64
670 define <4 x double> @v2f64_2(<2 x double> %a, < 2 x double> %b) {
671 ; CHECK-LABEL: v2f64_2:
672 ; CHECK:       # %bb.0:
673 ; CHECK-NEXT:    vsetivli zero, 2, e64, m1, ta, ma
674 ; CHECK-NEXT:    vslidedown.vi v10, v8, 1
675 ; CHECK-NEXT:    vslideup.vi v10, v8, 1
676 ; CHECK-NEXT:    vslidedown.vi v8, v9, 1
677 ; CHECK-NEXT:    vslideup.vi v8, v9, 1
678 ; CHECK-NEXT:    vsetivli zero, 4, e64, m2, ta, ma
679 ; CHECK-NEXT:    vslideup.vi v8, v10, 2
680 ; CHECK-NEXT:    ret
681   %v4f64 = shufflevector <2 x double> %a, <2 x double> %b, <4 x i32> <i32 3, i32 2, i32 1, i32 0>
682   ret <4 x double> %v4f64
685 define <4 x double> @v4f64(<4 x double> %a) {
686 ; CHECK-LABEL: v4f64:
687 ; CHECK:       # %bb.0:
688 ; CHECK-NEXT:    vsetivli zero, 4, e16, mf2, ta, ma
689 ; CHECK-NEXT:    vid.v v10
690 ; CHECK-NEXT:    vrsub.vi v12, v10, 3
691 ; CHECK-NEXT:    vsetvli zero, zero, e64, m2, ta, ma
692 ; CHECK-NEXT:    vrgatherei16.vv v10, v8, v12
693 ; CHECK-NEXT:    vmv.v.v v8, v10
694 ; CHECK-NEXT:    ret
695   %v4f64 = shufflevector <4 x double> %a, <4 x double> undef, <4 x i32> <i32 3, i32 2, i32 1, i32 0>
696   ret <4 x double> %v4f64
699 define <8 x double> @v4f64_2(<4 x double> %a, <4 x double> %b) {
700 ; CHECK-LABEL: v4f64_2:
701 ; CHECK:       # %bb.0:
702 ; CHECK-NEXT:    vmv2r.v v16, v10
703 ; CHECK-NEXT:    vsetivli zero, 8, e16, m1, ta, ma
704 ; CHECK-NEXT:    vid.v v10
705 ; CHECK-NEXT:    vrsub.vi v11, v10, 7
706 ; CHECK-NEXT:    vsetvli zero, zero, e64, m4, ta, ma
707 ; CHECK-NEXT:    vrgatherei16.vv v12, v8, v11
708 ; CHECK-NEXT:    vsetvli zero, zero, e16, m1, ta, ma
709 ; CHECK-NEXT:    vrsub.vi v8, v10, 3
710 ; CHECK-NEXT:    vmv.v.i v0, 15
711 ; CHECK-NEXT:    vsetvli zero, zero, e64, m4, ta, mu
712 ; CHECK-NEXT:    vrgatherei16.vv v12, v16, v8, v0.t
713 ; CHECK-NEXT:    vmv.v.v v8, v12
714 ; CHECK-NEXT:    ret
715   %v8f64 = shufflevector <4 x double> %a, <4 x double> %b, <8 x i32> <i32 7, i32 6, i32 5, i32 4, i32 3, i32 2, i32 1, i32 0>
716   ret <8 x double> %v8f64
719 define <32 x i8> @v32i8(<32 x i8> %a) {
720 ; CHECK-LABEL: v32i8:
721 ; CHECK:       # %bb.0:
722 ; CHECK-NEXT:    li a0, 32
723 ; CHECK-NEXT:    lui a1, %hi(.LCPI46_0)
724 ; CHECK-NEXT:    addi a1, a1, %lo(.LCPI46_0)
725 ; CHECK-NEXT:    vsetvli zero, a0, e8, m2, ta, ma
726 ; CHECK-NEXT:    vle8.v v12, (a1)
727 ; CHECK-NEXT:    vrgather.vv v10, v8, v12
728 ; CHECK-NEXT:    vmv.v.v v8, v10
729 ; CHECK-NEXT:    ret
730   %v32i8 = shufflevector <32 x i8> %a, <32 x i8> undef, <32 x i32> <i32 31, i32 30, i32 29, i32 28, i32 27, i32 26, i32 25, i32 24, i32 23, i32 22, i32 21, i32 20, i32 19, i32 18, i32 17, i32 16, i32 15, i32 14, i32 13, i32 12, i32 11, i32 10, i32 9, i32 8, i32 7, i32 6, i32 5, i32 4, i32 3, i32 2, i32 1, i32 0>
731   ret <32 x i8> %v32i8
734 ;; NOTE: These prefixes are unused and the list is autogenerated. Do not add tests below this line:
735 ; RV32: {{.*}}
736 ; RV64: {{.*}}