Run DCE after a LoopFlatten test to reduce spurious output [nfc]
[llvm-project.git] / llvm / test / CodeGen / AArch64 / sve-intrinsics-gather-loads-32bit-unscaled-offsets.ll
blobbe64d5fc7d43f5b968edec51f6d9ada8bf7ac623
1 ; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
2 ; RUN: llc -mtriple=aarch64-linux-gnu -mattr=+sve < %s | FileCheck %s
5 ; LD1B, LD1W, LD1H, LD1D: base + 32-bit unscaled offset, sign (sxtw) or zero
6 ; (uxtw) extended to 64 bits.
7 ;   e.g. ld1h { z0.d }, p0/z, [x0, z0.d, uxtw]
10 ; LD1B
11 define <vscale x 4 x i32> @gld1b_s_uxtw(<vscale x 4 x i1> %pg, ptr %base, <vscale x 4 x i32> %b) {
12 ; CHECK-LABEL: gld1b_s_uxtw:
13 ; CHECK:       // %bb.0:
14 ; CHECK-NEXT:    ld1b { z0.s }, p0/z, [x0, z0.s, uxtw]
15 ; CHECK-NEXT:    ret
16   %load = call <vscale x 4 x i8> @llvm.aarch64.sve.ld1.gather.uxtw.nxv4i8(<vscale x 4 x i1> %pg,
17                                                                           ptr %base,
18                                                                           <vscale x 4 x i32> %b)
19   %res = zext <vscale x 4 x i8> %load to <vscale x 4 x i32>
20   ret <vscale x 4 x i32> %res
23 define <vscale x 4 x i32> @gld1b_s_sxtw(<vscale x 4 x i1> %pg, ptr %base, <vscale x 4 x i32> %b) {
24 ; CHECK-LABEL: gld1b_s_sxtw:
25 ; CHECK:       // %bb.0:
26 ; CHECK-NEXT:    ld1b { z0.s }, p0/z, [x0, z0.s, sxtw]
27 ; CHECK-NEXT:    ret
28   %load = call <vscale x 4 x i8> @llvm.aarch64.sve.ld1.gather.sxtw.nxv4i8(<vscale x 4 x i1> %pg,
29                                                                           ptr %base,
30                                                                           <vscale x 4 x i32> %b)
31   %res = zext <vscale x 4 x i8> %load to <vscale x 4 x i32>
32   ret <vscale x 4 x i32> %res
35 define <vscale x 2 x i64> @gld1b_d_uxtw(<vscale x 2 x i1> %pg, ptr %base, <vscale x 2 x i32> %b) {
36 ; CHECK-LABEL: gld1b_d_uxtw:
37 ; CHECK:       // %bb.0:
38 ; CHECK-NEXT:    ld1b { z0.d }, p0/z, [x0, z0.d, uxtw]
39 ; CHECK-NEXT:    ret
40   %load = call <vscale x 2 x i8> @llvm.aarch64.sve.ld1.gather.uxtw.nxv2i8(<vscale x 2 x i1> %pg,
41                                                                           ptr %base,
42                                                                           <vscale x 2 x i32> %b)
43   %res = zext <vscale x 2 x i8> %load to <vscale x 2 x i64>
44   ret <vscale x 2 x i64> %res
47 define <vscale x 2 x i64> @gld1b_d_sxtw(<vscale x 2 x i1> %pg, ptr %base, <vscale x 2 x i32> %b) {
48 ; CHECK-LABEL: gld1b_d_sxtw:
49 ; CHECK:       // %bb.0:
50 ; CHECK-NEXT:    ld1b { z0.d }, p0/z, [x0, z0.d, sxtw]
51 ; CHECK-NEXT:    ret
52   %load = call <vscale x 2 x i8> @llvm.aarch64.sve.ld1.gather.sxtw.nxv2i8(<vscale x 2 x i1> %pg,
53                                                                           ptr %base,
54                                                                           <vscale x 2 x i32> %b)
55   %res = zext <vscale x 2 x i8> %load to <vscale x 2 x i64>
56   ret <vscale x 2 x i64> %res
59 ; LD1H
60 define <vscale x 4 x i32> @gld1h_s_uxtw(<vscale x 4 x i1> %pg, ptr %base, <vscale x 4 x i32> %b) {
61 ; CHECK-LABEL: gld1h_s_uxtw:
62 ; CHECK:       // %bb.0:
63 ; CHECK-NEXT:    ld1h { z0.s }, p0/z, [x0, z0.s, uxtw]
64 ; CHECK-NEXT:    ret
65   %load = call <vscale x 4 x i16> @llvm.aarch64.sve.ld1.gather.uxtw.nxv4i16(<vscale x 4 x i1> %pg,
66                                                                             ptr %base,
67                                                                             <vscale x 4 x i32> %b)
68   %res = zext <vscale x 4 x i16> %load to <vscale x 4 x i32>
69   ret <vscale x 4 x i32> %res
72 define <vscale x 4 x i32> @gld1h_s_sxtw(<vscale x 4 x i1> %pg, ptr %base, <vscale x 4 x i32> %b) {
73 ; CHECK-LABEL: gld1h_s_sxtw:
74 ; CHECK:       // %bb.0:
75 ; CHECK-NEXT:    ld1h { z0.s }, p0/z, [x0, z0.s, sxtw]
76 ; CHECK-NEXT:    ret
77   %load = call <vscale x 4 x i16> @llvm.aarch64.sve.ld1.gather.sxtw.nxv4i16(<vscale x 4 x i1> %pg,
78                                                                             ptr %base,
79                                                                             <vscale x 4 x i32> %b)
80   %res = zext <vscale x 4 x i16> %load to <vscale x 4 x i32>
81   ret <vscale x 4 x i32> %res
84 define <vscale x 2 x i64> @gld1h_d_uxtw(<vscale x 2 x i1> %pg, ptr %base, <vscale x 2 x i32> %b) {
85 ; CHECK-LABEL: gld1h_d_uxtw:
86 ; CHECK:       // %bb.0:
87 ; CHECK-NEXT:    ld1h { z0.d }, p0/z, [x0, z0.d, uxtw]
88 ; CHECK-NEXT:    ret
89   %load = call <vscale x 2 x i16> @llvm.aarch64.sve.ld1.gather.uxtw.nxv2i16(<vscale x 2 x i1> %pg,
90                                                                             ptr %base,
91                                                                             <vscale x 2 x i32> %b)
92   %res = zext <vscale x 2 x i16> %load to <vscale x 2 x i64>
93   ret <vscale x 2 x i64> %res
96 define <vscale x 2 x i64> @gld1h_d_sxtw(<vscale x 2 x i1> %pg, ptr %base, <vscale x 2 x i32> %b) {
97 ; CHECK-LABEL: gld1h_d_sxtw:
98 ; CHECK:       // %bb.0:
99 ; CHECK-NEXT:    ld1h { z0.d }, p0/z, [x0, z0.d, sxtw]
100 ; CHECK-NEXT:    ret
101   %load = call <vscale x 2 x i16> @llvm.aarch64.sve.ld1.gather.sxtw.nxv2i16(<vscale x 2 x i1> %pg,
102                                                                             ptr %base,
103                                                                             <vscale x 2 x i32> %b)
104   %res = zext <vscale x 2 x i16> %load to <vscale x 2 x i64>
105   ret <vscale x 2 x i64> %res
108 ; LD1W
109 define <vscale x 4 x i32> @gld1w_s_uxtw(<vscale x 4 x i1> %pg, ptr %base, <vscale x 4 x i32> %b) {
110 ; CHECK-LABEL: gld1w_s_uxtw:
111 ; CHECK:       // %bb.0:
112 ; CHECK-NEXT:    ld1w { z0.s }, p0/z, [x0, z0.s, uxtw]
113 ; CHECK-NEXT:    ret
114   %load = call <vscale x 4 x i32> @llvm.aarch64.sve.ld1.gather.uxtw.nxv4i32(<vscale x 4 x i1> %pg,
115                                                                             ptr %base,
116                                                                             <vscale x 4 x i32> %b)
117   ret <vscale x 4 x i32> %load
120 define <vscale x 4 x i32> @gld1w_s_sxtw(<vscale x 4 x i1> %pg, ptr %base, <vscale x 4 x i32> %b) {
121 ; CHECK-LABEL: gld1w_s_sxtw:
122 ; CHECK:       // %bb.0:
123 ; CHECK-NEXT:    ld1w { z0.s }, p0/z, [x0, z0.s, sxtw]
124 ; CHECK-NEXT:    ret
125   %load = call <vscale x 4 x i32> @llvm.aarch64.sve.ld1.gather.sxtw.nxv4i32(<vscale x 4 x i1> %pg,
126                                                                             ptr %base,
127                                                                             <vscale x 4 x i32> %b)
128   ret <vscale x 4 x i32> %load
131 define <vscale x 2 x i64> @gld1w_d_uxtw(<vscale x 2 x i1> %pg, ptr %base, <vscale x 2 x i32> %b) {
132 ; CHECK-LABEL: gld1w_d_uxtw:
133 ; CHECK:       // %bb.0:
134 ; CHECK-NEXT:    ld1w { z0.d }, p0/z, [x0, z0.d, uxtw]
135 ; CHECK-NEXT:    ret
136   %load = call <vscale x 2 x i32> @llvm.aarch64.sve.ld1.gather.uxtw.nxv2i32(<vscale x 2 x i1> %pg,
137                                                                             ptr %base,
138                                                                             <vscale x 2 x i32> %b)
139   %res = zext <vscale x 2 x i32> %load to <vscale x 2 x i64>
140   ret <vscale x 2 x i64> %res
143 define <vscale x 2 x i64> @gld1w_d_sxtw(<vscale x 2 x i1> %pg, ptr %base, <vscale x 2 x i32> %b) {
144 ; CHECK-LABEL: gld1w_d_sxtw:
145 ; CHECK:       // %bb.0:
146 ; CHECK-NEXT:    ld1w { z0.d }, p0/z, [x0, z0.d, sxtw]
147 ; CHECK-NEXT:    ret
148   %load = call <vscale x 2 x i32> @llvm.aarch64.sve.ld1.gather.sxtw.nxv2i32(<vscale x 2 x i1> %pg,
149                                                                             ptr %base,
150                                                                             <vscale x 2 x i32> %b)
151   %res = zext <vscale x 2 x i32> %load to <vscale x 2 x i64>
152   ret <vscale x 2 x i64> %res
155 define <vscale x 4 x float> @gld1w_s_uxtw_float(<vscale x 4 x i1> %pg, ptr %base, <vscale x 4 x i32> %b) {
156 ; CHECK-LABEL: gld1w_s_uxtw_float:
157 ; CHECK:       // %bb.0:
158 ; CHECK-NEXT:    ld1w { z0.s }, p0/z, [x0, z0.s, uxtw]
159 ; CHECK-NEXT:    ret
160   %load = call <vscale x 4 x float> @llvm.aarch64.sve.ld1.gather.uxtw.nxv4f32(<vscale x 4 x i1> %pg,
161                                                                               ptr %base,
162                                                                               <vscale x 4 x i32> %b)
163   ret <vscale x 4 x float> %load
166 define <vscale x 4 x float> @gld1w_s_sxtw_float(<vscale x 4 x i1> %pg, ptr %base, <vscale x 4 x i32> %b) {
167 ; CHECK-LABEL: gld1w_s_sxtw_float:
168 ; CHECK:       // %bb.0:
169 ; CHECK-NEXT:    ld1w { z0.s }, p0/z, [x0, z0.s, sxtw]
170 ; CHECK-NEXT:    ret
171   %load = call <vscale x 4 x float> @llvm.aarch64.sve.ld1.gather.sxtw.nxv4f32(<vscale x 4 x i1> %pg,
172                                                                               ptr %base,
173                                                                               <vscale x 4 x i32> %b)
174   ret <vscale x 4 x float> %load
177 ; LD1D
178 define <vscale x 2 x i64> @gld1d_d_uxtw(<vscale x 2 x i1> %pg, ptr %base, <vscale x 2 x i32> %b) {
179 ; CHECK-LABEL: gld1d_d_uxtw:
180 ; CHECK:       // %bb.0:
181 ; CHECK-NEXT:    ld1d { z0.d }, p0/z, [x0, z0.d, uxtw]
182 ; CHECK-NEXT:    ret
183   %load = call <vscale x 2 x i64> @llvm.aarch64.sve.ld1.gather.uxtw.nxv2i64(<vscale x 2 x i1> %pg,
184                                                                             ptr %base,
185                                                                             <vscale x 2 x i32> %b)
186   ret <vscale x 2 x i64> %load
189 define <vscale x 2 x i64> @gld1d_d_sxtw(<vscale x 2 x i1> %pg, ptr %base, <vscale x 2 x i32> %b) {
190 ; CHECK-LABEL: gld1d_d_sxtw:
191 ; CHECK:       // %bb.0:
192 ; CHECK-NEXT:    ld1d { z0.d }, p0/z, [x0, z0.d, sxtw]
193 ; CHECK-NEXT:    ret
194   %load = call <vscale x 2 x i64> @llvm.aarch64.sve.ld1.gather.sxtw.nxv2i64(<vscale x 2 x i1> %pg,
195                                                                             ptr %base,
196                                                                             <vscale x 2 x i32> %b)
197   ret <vscale x 2 x i64> %load
200 define <vscale x 2 x double> @gld1d_d_uxtw_double(<vscale x 2 x i1> %pg, ptr %base, <vscale x 2 x i32> %b) {
201 ; CHECK-LABEL: gld1d_d_uxtw_double:
202 ; CHECK:       // %bb.0:
203 ; CHECK-NEXT:    ld1d { z0.d }, p0/z, [x0, z0.d, uxtw]
204 ; CHECK-NEXT:    ret
205   %load = call <vscale x 2 x double> @llvm.aarch64.sve.ld1.gather.uxtw.nxv2f64(<vscale x 2 x i1> %pg,
206                                                                                ptr %base,
207                                                                                <vscale x 2 x i32> %b)
208   ret <vscale x 2 x double> %load
211 define <vscale x 2 x double> @gld1d_d_sxtw_double(<vscale x 2 x i1> %pg, ptr %base, <vscale x 2 x i32> %b) {
212 ; CHECK-LABEL: gld1d_d_sxtw_double:
213 ; CHECK:       // %bb.0:
214 ; CHECK-NEXT:    ld1d { z0.d }, p0/z, [x0, z0.d, sxtw]
215 ; CHECK-NEXT:    ret
216   %load = call <vscale x 2 x double> @llvm.aarch64.sve.ld1.gather.sxtw.nxv2f64(<vscale x 2 x i1> %pg,
217                                                                                ptr %base,
218                                                                                <vscale x 2 x i32> %b)
219   ret <vscale x 2 x double> %load
223 ; LD1SB, LD1SW, LD1SH: base + 32-bit unscaled offset, sign (sxtw) or zero
224 ; (uxtw) extended to 64 bits.
225 ;   e.g. ld1sh { z0.d }, p0/z, [x0, z0.d, uxtw]
228 ; LD1SB
229 define <vscale x 4 x i32> @gld1sb_s_uxtw(<vscale x 4 x i1> %pg, ptr %base, <vscale x 4 x i32> %b) {
230 ; CHECK-LABEL: gld1sb_s_uxtw:
231 ; CHECK:       // %bb.0:
232 ; CHECK-NEXT:    ld1sb { z0.s }, p0/z, [x0, z0.s, uxtw]
233 ; CHECK-NEXT:    ret
234   %load = call <vscale x 4 x i8> @llvm.aarch64.sve.ld1.gather.uxtw.nxv4i8(<vscale x 4 x i1> %pg,
235                                                                           ptr %base,
236                                                                           <vscale x 4 x i32> %b)
237   %res = sext <vscale x 4 x i8> %load to <vscale x 4 x i32>
238   ret <vscale x 4 x i32> %res
241 define <vscale x 4 x i32> @gld1sb_s_sxtw(<vscale x 4 x i1> %pg, ptr %base, <vscale x 4 x i32> %b) {
242 ; CHECK-LABEL: gld1sb_s_sxtw:
243 ; CHECK:       // %bb.0:
244 ; CHECK-NEXT:    ld1sb { z0.s }, p0/z, [x0, z0.s, sxtw]
245 ; CHECK-NEXT:    ret
246   %load = call <vscale x 4 x i8> @llvm.aarch64.sve.ld1.gather.sxtw.nxv4i8(<vscale x 4 x i1> %pg,
247                                                                           ptr %base,
248                                                                           <vscale x 4 x i32> %b)
249   %res = sext <vscale x 4 x i8> %load to <vscale x 4 x i32>
250   ret <vscale x 4 x i32> %res
253 define <vscale x 2 x i64> @gld1sb_d_uxtw(<vscale x 2 x i1> %pg, ptr %base, <vscale x 2 x i32> %b) {
254 ; CHECK-LABEL: gld1sb_d_uxtw:
255 ; CHECK:       // %bb.0:
256 ; CHECK-NEXT:    ld1sb { z0.d }, p0/z, [x0, z0.d, uxtw]
257 ; CHECK-NEXT:    ret
258   %load = call <vscale x 2 x i8> @llvm.aarch64.sve.ld1.gather.uxtw.nxv2i8(<vscale x 2 x i1> %pg,
259                                                                           ptr %base,
260                                                                           <vscale x 2 x i32> %b)
261   %res = sext <vscale x 2 x i8> %load to <vscale x 2 x i64>
262   ret <vscale x 2 x i64> %res
265 define <vscale x 2 x i64> @gld1sb_d_sxtw(<vscale x 2 x i1> %pg, ptr %base, <vscale x 2 x i32> %b) {
266 ; CHECK-LABEL: gld1sb_d_sxtw:
267 ; CHECK:       // %bb.0:
268 ; CHECK-NEXT:    ld1sb { z0.d }, p0/z, [x0, z0.d, sxtw]
269 ; CHECK-NEXT:    ret
270   %load = call <vscale x 2 x i8> @llvm.aarch64.sve.ld1.gather.sxtw.nxv2i8(<vscale x 2 x i1> %pg,
271                                                                           ptr %base,
272                                                                           <vscale x 2 x i32> %b)
273   %res = sext <vscale x 2 x i8> %load to <vscale x 2 x i64>
274   ret <vscale x 2 x i64> %res
277 ; LD1SH
278 define <vscale x 4 x i32> @gld1sh_s_uxtw(<vscale x 4 x i1> %pg, ptr %base, <vscale x 4 x i32> %b) {
279 ; CHECK-LABEL: gld1sh_s_uxtw:
280 ; CHECK:       // %bb.0:
281 ; CHECK-NEXT:    ld1sh { z0.s }, p0/z, [x0, z0.s, uxtw]
282 ; CHECK-NEXT:    ret
283   %load = call <vscale x 4 x i16> @llvm.aarch64.sve.ld1.gather.uxtw.nxv4i16(<vscale x 4 x i1> %pg,
284                                                                             ptr %base,
285                                                                             <vscale x 4 x i32> %b)
286   %res = sext <vscale x 4 x i16> %load to <vscale x 4 x i32>
287   ret <vscale x 4 x i32> %res
290 define <vscale x 4 x i32> @gld1sh_s_sxtw(<vscale x 4 x i1> %pg, ptr %base, <vscale x 4 x i32> %b) {
291 ; CHECK-LABEL: gld1sh_s_sxtw:
292 ; CHECK:       // %bb.0:
293 ; CHECK-NEXT:    ld1sh { z0.s }, p0/z, [x0, z0.s, sxtw]
294 ; CHECK-NEXT:    ret
295   %load = call <vscale x 4 x i16> @llvm.aarch64.sve.ld1.gather.sxtw.nxv4i16(<vscale x 4 x i1> %pg,
296                                                                             ptr %base,
297                                                                             <vscale x 4 x i32> %b)
298   %res = sext <vscale x 4 x i16> %load to <vscale x 4 x i32>
299   ret <vscale x 4 x i32> %res
302 define <vscale x 2 x i64> @gld1sh_d_uxtw(<vscale x 2 x i1> %pg, ptr %base, <vscale x 2 x i32> %b) {
303 ; CHECK-LABEL: gld1sh_d_uxtw:
304 ; CHECK:       // %bb.0:
305 ; CHECK-NEXT:    ld1sh { z0.d }, p0/z, [x0, z0.d, uxtw]
306 ; CHECK-NEXT:    ret
307   %load = call <vscale x 2 x i16> @llvm.aarch64.sve.ld1.gather.uxtw.nxv2i16(<vscale x 2 x i1> %pg,
308                                                                             ptr %base,
309                                                                             <vscale x 2 x i32> %b)
310   %res = sext <vscale x 2 x i16> %load to <vscale x 2 x i64>
311   ret <vscale x 2 x i64> %res
314 define <vscale x 2 x i64> @gld1sh_d_sxtw(<vscale x 2 x i1> %pg, ptr %base, <vscale x 2 x i32> %b) {
315 ; CHECK-LABEL: gld1sh_d_sxtw:
316 ; CHECK:       // %bb.0:
317 ; CHECK-NEXT:    ld1sh { z0.d }, p0/z, [x0, z0.d, sxtw]
318 ; CHECK-NEXT:    ret
319   %load = call <vscale x 2 x i16> @llvm.aarch64.sve.ld1.gather.sxtw.nxv2i16(<vscale x 2 x i1> %pg,
320                                                                             ptr %base,
321                                                                             <vscale x 2 x i32> %b)
322   %res = sext <vscale x 2 x i16> %load to <vscale x 2 x i64>
323   ret <vscale x 2 x i64> %res
326 ; LD1SW
327 define <vscale x 2 x i64> @gld1sw_d_uxtw(<vscale x 2 x i1> %pg, ptr %base, <vscale x 2 x i32> %b) {
328 ; CHECK-LABEL: gld1sw_d_uxtw:
329 ; CHECK:       // %bb.0:
330 ; CHECK-NEXT:    ld1sw { z0.d }, p0/z, [x0, z0.d, uxtw]
331 ; CHECK-NEXT:    ret
332   %load = call <vscale x 2 x i32> @llvm.aarch64.sve.ld1.gather.uxtw.nxv2i32(<vscale x 2 x i1> %pg,
333                                                                             ptr %base,
334                                                                             <vscale x 2 x i32> %b)
335   %res = sext <vscale x 2 x i32> %load to <vscale x 2 x i64>
336   ret <vscale x 2 x i64> %res
339 define <vscale x 2 x i64> @gld1sw_d_sxtw(<vscale x 2 x i1> %pg, ptr %base, <vscale x 2 x i32> %b) {
340 ; CHECK-LABEL: gld1sw_d_sxtw:
341 ; CHECK:       // %bb.0:
342 ; CHECK-NEXT:    ld1sw { z0.d }, p0/z, [x0, z0.d, sxtw]
343 ; CHECK-NEXT:    ret
344   %load = call <vscale x 2 x i32> @llvm.aarch64.sve.ld1.gather.sxtw.nxv2i32(<vscale x 2 x i1> %pg,
345                                                                             ptr %base,
346                                                                             <vscale x 2 x i32> %b)
347   %res = sext <vscale x 2 x i32> %load to <vscale x 2 x i64>
348   ret <vscale x 2 x i64> %res
351 ; LD1B/LD1SB
352 declare <vscale x 4 x i8> @llvm.aarch64.sve.ld1.gather.uxtw.nxv4i8(<vscale x 4 x i1>, ptr, <vscale x 4 x i32>)
353 declare <vscale x 2 x i8> @llvm.aarch64.sve.ld1.gather.uxtw.nxv2i8(<vscale x 2 x i1>, ptr, <vscale x 2 x i32>)
354 declare <vscale x 4 x i8> @llvm.aarch64.sve.ld1.gather.sxtw.nxv4i8(<vscale x 4 x i1>, ptr, <vscale x 4 x i32>)
355 declare <vscale x 2 x i8> @llvm.aarch64.sve.ld1.gather.sxtw.nxv2i8(<vscale x 2 x i1>, ptr, <vscale x 2 x i32>)
357 ; LD1H/LD1SH
358 declare <vscale x 4 x i16> @llvm.aarch64.sve.ld1.gather.sxtw.nxv4i16(<vscale x 4 x i1>, ptr, <vscale x 4 x i32>)
359 declare <vscale x 2 x i16> @llvm.aarch64.sve.ld1.gather.sxtw.nxv2i16(<vscale x 2 x i1>, ptr, <vscale x 2 x i32>)
360 declare <vscale x 4 x i16> @llvm.aarch64.sve.ld1.gather.uxtw.nxv4i16(<vscale x 4 x i1>, ptr, <vscale x 4 x i32>)
361 declare <vscale x 2 x i16> @llvm.aarch64.sve.ld1.gather.uxtw.nxv2i16(<vscale x 2 x i1>, ptr, <vscale x 2 x i32>)
363 ; LD1W/LD1SW
364 declare <vscale x 4 x i32> @llvm.aarch64.sve.ld1.gather.sxtw.nxv4i32(<vscale x 4 x i1>, ptr, <vscale x 4 x i32>)
365 declare <vscale x 2 x i32> @llvm.aarch64.sve.ld1.gather.sxtw.nxv2i32(<vscale x 2 x i1>, ptr, <vscale x 2 x i32>)
366 declare <vscale x 4 x i32> @llvm.aarch64.sve.ld1.gather.uxtw.nxv4i32(<vscale x 4 x i1>, ptr, <vscale x 4 x i32>)
367 declare <vscale x 2 x i32> @llvm.aarch64.sve.ld1.gather.uxtw.nxv2i32(<vscale x 2 x i1>, ptr, <vscale x 2 x i32>)
369 declare <vscale x 4 x float> @llvm.aarch64.sve.ld1.gather.sxtw.nxv4f32(<vscale x 4 x i1>, ptr, <vscale x 4 x i32>)
370 declare <vscale x 4 x float> @llvm.aarch64.sve.ld1.gather.uxtw.nxv4f32(<vscale x 4 x i1>, ptr, <vscale x 4 x i32>)
372 ; LD1D
373 declare <vscale x 2 x i64> @llvm.aarch64.sve.ld1.gather.sxtw.nxv2i64(<vscale x 2 x i1>, ptr, <vscale x 2 x i32>)
374 declare <vscale x 2 x i64> @llvm.aarch64.sve.ld1.gather.uxtw.nxv2i64(<vscale x 2 x i1>, ptr, <vscale x 2 x i32>)
376 declare <vscale x 2 x double> @llvm.aarch64.sve.ld1.gather.sxtw.nxv2f64(<vscale x 2 x i1>, ptr, <vscale x 2 x i32>)
377 declare <vscale x 2 x double> @llvm.aarch64.sve.ld1.gather.uxtw.nxv2f64(<vscale x 2 x i1>, ptr, <vscale x 2 x i32>)