Re-land [openmp] Fix warnings when building on Windows with latest MSVC or Clang...
[llvm-project.git] / llvm / test / CodeGen / RISCV / rv64-legal-i32 / rv64xtheadbb.ll
blob4ec7f2660b2a35896e0af6f03ffd00cb1ed423de
1 ; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
2 ; RUN: llc -mtriple=riscv64 -verify-machineinstrs < %s \
3 ; RUN:   -riscv-experimental-rv64-legal-i32 | FileCheck %s -check-prefix=RV64I
4 ; RUN: llc -mtriple=riscv64 -mattr=+xtheadbb -verify-machineinstrs < %s \
5 ; RUN:   -riscv-experimental-rv64-legal-i32 | FileCheck %s -check-prefix=RV64XTHEADBB
7 declare i32 @llvm.ctlz.i32(i32, i1)
9 define signext i32 @ctlz_i32(i32 signext %a) nounwind {
10 ; RV64I-LABEL: ctlz_i32:
11 ; RV64I:       # %bb.0:
12 ; RV64I-NEXT:    beqz a0, .LBB0_2
13 ; RV64I-NEXT:  # %bb.1: # %cond.false
14 ; RV64I-NEXT:    addi sp, sp, -16
15 ; RV64I-NEXT:    sd ra, 8(sp) # 8-byte Folded Spill
16 ; RV64I-NEXT:    srliw a1, a0, 1
17 ; RV64I-NEXT:    or a0, a0, a1
18 ; RV64I-NEXT:    srliw a1, a0, 2
19 ; RV64I-NEXT:    or a0, a0, a1
20 ; RV64I-NEXT:    srliw a1, a0, 4
21 ; RV64I-NEXT:    or a0, a0, a1
22 ; RV64I-NEXT:    srliw a1, a0, 8
23 ; RV64I-NEXT:    or a0, a0, a1
24 ; RV64I-NEXT:    srliw a1, a0, 16
25 ; RV64I-NEXT:    or a0, a0, a1
26 ; RV64I-NEXT:    not a0, a0
27 ; RV64I-NEXT:    srliw a1, a0, 1
28 ; RV64I-NEXT:    lui a2, 349525
29 ; RV64I-NEXT:    addi a2, a2, 1365
30 ; RV64I-NEXT:    and a1, a1, a2
31 ; RV64I-NEXT:    subw a0, a0, a1
32 ; RV64I-NEXT:    lui a1, 209715
33 ; RV64I-NEXT:    addi a1, a1, 819
34 ; RV64I-NEXT:    and a2, a0, a1
35 ; RV64I-NEXT:    srliw a0, a0, 2
36 ; RV64I-NEXT:    and a0, a0, a1
37 ; RV64I-NEXT:    add a0, a2, a0
38 ; RV64I-NEXT:    srliw a1, a0, 4
39 ; RV64I-NEXT:    addw a0, a0, a1
40 ; RV64I-NEXT:    lui a1, 61681
41 ; RV64I-NEXT:    addiw a1, a1, -241
42 ; RV64I-NEXT:    and a0, a0, a1
43 ; RV64I-NEXT:    lui a1, 4112
44 ; RV64I-NEXT:    addiw a1, a1, 257
45 ; RV64I-NEXT:    call __muldi3
46 ; RV64I-NEXT:    srliw a0, a0, 24
47 ; RV64I-NEXT:    ld ra, 8(sp) # 8-byte Folded Reload
48 ; RV64I-NEXT:    addi sp, sp, 16
49 ; RV64I-NEXT:    ret
50 ; RV64I-NEXT:  .LBB0_2:
51 ; RV64I-NEXT:    li a0, 32
52 ; RV64I-NEXT:    ret
54 ; RV64XTHEADBB-LABEL: ctlz_i32:
55 ; RV64XTHEADBB:       # %bb.0:
56 ; RV64XTHEADBB-NEXT:    th.extu a0, a0, 31, 0
57 ; RV64XTHEADBB-NEXT:    th.ff1 a0, a0
58 ; RV64XTHEADBB-NEXT:    addi a0, a0, -32
59 ; RV64XTHEADBB-NEXT:    ret
60   %1 = call i32 @llvm.ctlz.i32(i32 %a, i1 false)
61   ret i32 %1
64 define signext i32 @log2_i32(i32 signext %a) nounwind {
65 ; RV64I-LABEL: log2_i32:
66 ; RV64I:       # %bb.0:
67 ; RV64I-NEXT:    beqz a0, .LBB1_2
68 ; RV64I-NEXT:  # %bb.1: # %cond.false
69 ; RV64I-NEXT:    addi sp, sp, -16
70 ; RV64I-NEXT:    sd ra, 8(sp) # 8-byte Folded Spill
71 ; RV64I-NEXT:    srliw a1, a0, 1
72 ; RV64I-NEXT:    or a0, a0, a1
73 ; RV64I-NEXT:    srliw a1, a0, 2
74 ; RV64I-NEXT:    or a0, a0, a1
75 ; RV64I-NEXT:    srliw a1, a0, 4
76 ; RV64I-NEXT:    or a0, a0, a1
77 ; RV64I-NEXT:    srliw a1, a0, 8
78 ; RV64I-NEXT:    or a0, a0, a1
79 ; RV64I-NEXT:    srliw a1, a0, 16
80 ; RV64I-NEXT:    or a0, a0, a1
81 ; RV64I-NEXT:    not a0, a0
82 ; RV64I-NEXT:    srliw a1, a0, 1
83 ; RV64I-NEXT:    lui a2, 349525
84 ; RV64I-NEXT:    addi a2, a2, 1365
85 ; RV64I-NEXT:    and a1, a1, a2
86 ; RV64I-NEXT:    subw a0, a0, a1
87 ; RV64I-NEXT:    lui a1, 209715
88 ; RV64I-NEXT:    addi a1, a1, 819
89 ; RV64I-NEXT:    and a2, a0, a1
90 ; RV64I-NEXT:    srliw a0, a0, 2
91 ; RV64I-NEXT:    and a0, a0, a1
92 ; RV64I-NEXT:    add a0, a2, a0
93 ; RV64I-NEXT:    srliw a1, a0, 4
94 ; RV64I-NEXT:    addw a0, a0, a1
95 ; RV64I-NEXT:    lui a1, 61681
96 ; RV64I-NEXT:    addiw a1, a1, -241
97 ; RV64I-NEXT:    and a0, a0, a1
98 ; RV64I-NEXT:    lui a1, 4112
99 ; RV64I-NEXT:    addiw a1, a1, 257
100 ; RV64I-NEXT:    call __muldi3
101 ; RV64I-NEXT:    srliw a0, a0, 24
102 ; RV64I-NEXT:    ld ra, 8(sp) # 8-byte Folded Reload
103 ; RV64I-NEXT:    addi sp, sp, 16
104 ; RV64I-NEXT:    j .LBB1_3
105 ; RV64I-NEXT:  .LBB1_2:
106 ; RV64I-NEXT:    li a0, 32
107 ; RV64I-NEXT:  .LBB1_3: # %cond.end
108 ; RV64I-NEXT:    li a1, 31
109 ; RV64I-NEXT:    subw a0, a1, a0
110 ; RV64I-NEXT:    ret
112 ; RV64XTHEADBB-LABEL: log2_i32:
113 ; RV64XTHEADBB:       # %bb.0:
114 ; RV64XTHEADBB-NEXT:    th.extu a0, a0, 31, 0
115 ; RV64XTHEADBB-NEXT:    th.ff1 a0, a0
116 ; RV64XTHEADBB-NEXT:    addi a0, a0, -32
117 ; RV64XTHEADBB-NEXT:    li a1, 31
118 ; RV64XTHEADBB-NEXT:    subw a0, a1, a0
119 ; RV64XTHEADBB-NEXT:    ret
120   %1 = call i32 @llvm.ctlz.i32(i32 %a, i1 false)
121   %2 = sub i32 31, %1
122   ret i32 %2
125 define signext i32 @log2_ceil_i32(i32 signext %a) nounwind {
126 ; RV64I-LABEL: log2_ceil_i32:
127 ; RV64I:       # %bb.0:
128 ; RV64I-NEXT:    addi sp, sp, -16
129 ; RV64I-NEXT:    sd ra, 8(sp) # 8-byte Folded Spill
130 ; RV64I-NEXT:    sd s0, 0(sp) # 8-byte Folded Spill
131 ; RV64I-NEXT:    addiw a0, a0, -1
132 ; RV64I-NEXT:    li s0, 32
133 ; RV64I-NEXT:    li a1, 32
134 ; RV64I-NEXT:    beqz a0, .LBB2_2
135 ; RV64I-NEXT:  # %bb.1: # %cond.false
136 ; RV64I-NEXT:    srliw a1, a0, 1
137 ; RV64I-NEXT:    or a0, a0, a1
138 ; RV64I-NEXT:    srliw a1, a0, 2
139 ; RV64I-NEXT:    or a0, a0, a1
140 ; RV64I-NEXT:    srliw a1, a0, 4
141 ; RV64I-NEXT:    or a0, a0, a1
142 ; RV64I-NEXT:    srliw a1, a0, 8
143 ; RV64I-NEXT:    or a0, a0, a1
144 ; RV64I-NEXT:    srliw a1, a0, 16
145 ; RV64I-NEXT:    or a0, a0, a1
146 ; RV64I-NEXT:    not a0, a0
147 ; RV64I-NEXT:    srliw a1, a0, 1
148 ; RV64I-NEXT:    lui a2, 349525
149 ; RV64I-NEXT:    addi a2, a2, 1365
150 ; RV64I-NEXT:    and a1, a1, a2
151 ; RV64I-NEXT:    subw a0, a0, a1
152 ; RV64I-NEXT:    lui a1, 209715
153 ; RV64I-NEXT:    addi a1, a1, 819
154 ; RV64I-NEXT:    and a2, a0, a1
155 ; RV64I-NEXT:    srliw a0, a0, 2
156 ; RV64I-NEXT:    and a0, a0, a1
157 ; RV64I-NEXT:    add a0, a2, a0
158 ; RV64I-NEXT:    srliw a1, a0, 4
159 ; RV64I-NEXT:    addw a0, a0, a1
160 ; RV64I-NEXT:    lui a1, 61681
161 ; RV64I-NEXT:    addiw a1, a1, -241
162 ; RV64I-NEXT:    and a0, a0, a1
163 ; RV64I-NEXT:    lui a1, 4112
164 ; RV64I-NEXT:    addiw a1, a1, 257
165 ; RV64I-NEXT:    call __muldi3
166 ; RV64I-NEXT:    srliw a1, a0, 24
167 ; RV64I-NEXT:  .LBB2_2: # %cond.end
168 ; RV64I-NEXT:    subw a0, s0, a1
169 ; RV64I-NEXT:    ld ra, 8(sp) # 8-byte Folded Reload
170 ; RV64I-NEXT:    ld s0, 0(sp) # 8-byte Folded Reload
171 ; RV64I-NEXT:    addi sp, sp, 16
172 ; RV64I-NEXT:    ret
174 ; RV64XTHEADBB-LABEL: log2_ceil_i32:
175 ; RV64XTHEADBB:       # %bb.0:
176 ; RV64XTHEADBB-NEXT:    addi a0, a0, -1
177 ; RV64XTHEADBB-NEXT:    slli a0, a0, 32
178 ; RV64XTHEADBB-NEXT:    srli a0, a0, 32
179 ; RV64XTHEADBB-NEXT:    th.ff1 a0, a0
180 ; RV64XTHEADBB-NEXT:    addi a0, a0, -32
181 ; RV64XTHEADBB-NEXT:    li a1, 32
182 ; RV64XTHEADBB-NEXT:    subw a0, a1, a0
183 ; RV64XTHEADBB-NEXT:    ret
184   %1 = sub i32 %a, 1
185   %2 = call i32 @llvm.ctlz.i32(i32 %1, i1 false)
186   %3 = sub i32 32, %2
187   ret i32 %3
190 define signext i32 @findLastSet_i32(i32 signext %a) nounwind {
191 ; RV64I-LABEL: findLastSet_i32:
192 ; RV64I:       # %bb.0:
193 ; RV64I-NEXT:    addi sp, sp, -16
194 ; RV64I-NEXT:    sd ra, 8(sp) # 8-byte Folded Spill
195 ; RV64I-NEXT:    sd s0, 0(sp) # 8-byte Folded Spill
196 ; RV64I-NEXT:    mv s0, a0
197 ; RV64I-NEXT:    srliw a0, a0, 1
198 ; RV64I-NEXT:    or a0, s0, a0
199 ; RV64I-NEXT:    srliw a1, a0, 2
200 ; RV64I-NEXT:    or a0, a0, a1
201 ; RV64I-NEXT:    srliw a1, a0, 4
202 ; RV64I-NEXT:    or a0, a0, a1
203 ; RV64I-NEXT:    srliw a1, a0, 8
204 ; RV64I-NEXT:    or a0, a0, a1
205 ; RV64I-NEXT:    srliw a1, a0, 16
206 ; RV64I-NEXT:    or a0, a0, a1
207 ; RV64I-NEXT:    not a0, a0
208 ; RV64I-NEXT:    srliw a1, a0, 1
209 ; RV64I-NEXT:    lui a2, 349525
210 ; RV64I-NEXT:    addi a2, a2, 1365
211 ; RV64I-NEXT:    and a1, a1, a2
212 ; RV64I-NEXT:    subw a0, a0, a1
213 ; RV64I-NEXT:    lui a1, 209715
214 ; RV64I-NEXT:    addi a1, a1, 819
215 ; RV64I-NEXT:    and a2, a0, a1
216 ; RV64I-NEXT:    srliw a0, a0, 2
217 ; RV64I-NEXT:    and a0, a0, a1
218 ; RV64I-NEXT:    add a0, a2, a0
219 ; RV64I-NEXT:    srliw a1, a0, 4
220 ; RV64I-NEXT:    addw a0, a0, a1
221 ; RV64I-NEXT:    lui a1, 61681
222 ; RV64I-NEXT:    addiw a1, a1, -241
223 ; RV64I-NEXT:    and a0, a0, a1
224 ; RV64I-NEXT:    lui a1, 4112
225 ; RV64I-NEXT:    addiw a1, a1, 257
226 ; RV64I-NEXT:    call __muldi3
227 ; RV64I-NEXT:    srliw a0, a0, 24
228 ; RV64I-NEXT:    xori a0, a0, 31
229 ; RV64I-NEXT:    snez a1, s0
230 ; RV64I-NEXT:    addiw a1, a1, -1
231 ; RV64I-NEXT:    or a0, a1, a0
232 ; RV64I-NEXT:    ld ra, 8(sp) # 8-byte Folded Reload
233 ; RV64I-NEXT:    ld s0, 0(sp) # 8-byte Folded Reload
234 ; RV64I-NEXT:    addi sp, sp, 16
235 ; RV64I-NEXT:    ret
237 ; RV64XTHEADBB-LABEL: findLastSet_i32:
238 ; RV64XTHEADBB:       # %bb.0:
239 ; RV64XTHEADBB-NEXT:    th.extu a1, a0, 31, 0
240 ; RV64XTHEADBB-NEXT:    th.ff1 a1, a1
241 ; RV64XTHEADBB-NEXT:    addiw a1, a1, -32
242 ; RV64XTHEADBB-NEXT:    xori a1, a1, 31
243 ; RV64XTHEADBB-NEXT:    snez a0, a0
244 ; RV64XTHEADBB-NEXT:    addiw a0, a0, -1
245 ; RV64XTHEADBB-NEXT:    or a0, a0, a1
246 ; RV64XTHEADBB-NEXT:    ret
247   %1 = call i32 @llvm.ctlz.i32(i32 %a, i1 true)
248   %2 = xor i32 31, %1
249   %3 = icmp eq i32 %a, 0
250   %4 = select i1 %3, i32 -1, i32 %2
251   ret i32 %4
254 define i32 @ctlz_lshr_i32(i32 signext %a) {
255 ; RV64I-LABEL: ctlz_lshr_i32:
256 ; RV64I:       # %bb.0:
257 ; RV64I-NEXT:    srliw a0, a0, 1
258 ; RV64I-NEXT:    beqz a0, .LBB4_2
259 ; RV64I-NEXT:  # %bb.1: # %cond.false
260 ; RV64I-NEXT:    addi sp, sp, -16
261 ; RV64I-NEXT:    .cfi_def_cfa_offset 16
262 ; RV64I-NEXT:    sd ra, 8(sp) # 8-byte Folded Spill
263 ; RV64I-NEXT:    .cfi_offset ra, -8
264 ; RV64I-NEXT:    srliw a1, a0, 1
265 ; RV64I-NEXT:    or a0, a0, a1
266 ; RV64I-NEXT:    srliw a1, a0, 2
267 ; RV64I-NEXT:    or a0, a0, a1
268 ; RV64I-NEXT:    srliw a1, a0, 4
269 ; RV64I-NEXT:    or a0, a0, a1
270 ; RV64I-NEXT:    srliw a1, a0, 8
271 ; RV64I-NEXT:    or a0, a0, a1
272 ; RV64I-NEXT:    srliw a1, a0, 16
273 ; RV64I-NEXT:    or a0, a0, a1
274 ; RV64I-NEXT:    not a0, a0
275 ; RV64I-NEXT:    srliw a1, a0, 1
276 ; RV64I-NEXT:    lui a2, 349525
277 ; RV64I-NEXT:    addi a2, a2, 1365
278 ; RV64I-NEXT:    and a1, a1, a2
279 ; RV64I-NEXT:    subw a0, a0, a1
280 ; RV64I-NEXT:    lui a1, 209715
281 ; RV64I-NEXT:    addi a1, a1, 819
282 ; RV64I-NEXT:    and a2, a0, a1
283 ; RV64I-NEXT:    srliw a0, a0, 2
284 ; RV64I-NEXT:    and a0, a0, a1
285 ; RV64I-NEXT:    add a0, a2, a0
286 ; RV64I-NEXT:    srliw a1, a0, 4
287 ; RV64I-NEXT:    addw a0, a0, a1
288 ; RV64I-NEXT:    lui a1, 61681
289 ; RV64I-NEXT:    addiw a1, a1, -241
290 ; RV64I-NEXT:    and a0, a0, a1
291 ; RV64I-NEXT:    lui a1, 4112
292 ; RV64I-NEXT:    addiw a1, a1, 257
293 ; RV64I-NEXT:    call __muldi3
294 ; RV64I-NEXT:    srliw a0, a0, 24
295 ; RV64I-NEXT:    ld ra, 8(sp) # 8-byte Folded Reload
296 ; RV64I-NEXT:    addi sp, sp, 16
297 ; RV64I-NEXT:    ret
298 ; RV64I-NEXT:  .LBB4_2:
299 ; RV64I-NEXT:    li a0, 32
300 ; RV64I-NEXT:    ret
302 ; RV64XTHEADBB-LABEL: ctlz_lshr_i32:
303 ; RV64XTHEADBB:       # %bb.0:
304 ; RV64XTHEADBB-NEXT:    srliw a0, a0, 1
305 ; RV64XTHEADBB-NEXT:    th.ff1 a0, a0
306 ; RV64XTHEADBB-NEXT:    addi a0, a0, -32
307 ; RV64XTHEADBB-NEXT:    ret
308   %1 = lshr i32 %a, 1
309   %2 = call i32 @llvm.ctlz.i32(i32 %1, i1 false)
310   ret i32 %2
313 declare i64 @llvm.ctlz.i64(i64, i1)
315 define i64 @ctlz_i64(i64 %a) nounwind {
316 ; RV64I-LABEL: ctlz_i64:
317 ; RV64I:       # %bb.0:
318 ; RV64I-NEXT:    beqz a0, .LBB5_2
319 ; RV64I-NEXT:  # %bb.1: # %cond.false
320 ; RV64I-NEXT:    addi sp, sp, -16
321 ; RV64I-NEXT:    sd ra, 8(sp) # 8-byte Folded Spill
322 ; RV64I-NEXT:    srli a1, a0, 1
323 ; RV64I-NEXT:    or a0, a0, a1
324 ; RV64I-NEXT:    srli a1, a0, 2
325 ; RV64I-NEXT:    or a0, a0, a1
326 ; RV64I-NEXT:    srli a1, a0, 4
327 ; RV64I-NEXT:    or a0, a0, a1
328 ; RV64I-NEXT:    srli a1, a0, 8
329 ; RV64I-NEXT:    or a0, a0, a1
330 ; RV64I-NEXT:    srli a1, a0, 16
331 ; RV64I-NEXT:    or a0, a0, a1
332 ; RV64I-NEXT:    srli a1, a0, 32
333 ; RV64I-NEXT:    or a0, a0, a1
334 ; RV64I-NEXT:    not a0, a0
335 ; RV64I-NEXT:    srli a1, a0, 1
336 ; RV64I-NEXT:    lui a2, 349525
337 ; RV64I-NEXT:    addiw a2, a2, 1365
338 ; RV64I-NEXT:    slli a3, a2, 32
339 ; RV64I-NEXT:    add a2, a2, a3
340 ; RV64I-NEXT:    and a1, a1, a2
341 ; RV64I-NEXT:    sub a0, a0, a1
342 ; RV64I-NEXT:    lui a1, 209715
343 ; RV64I-NEXT:    addiw a1, a1, 819
344 ; RV64I-NEXT:    slli a2, a1, 32
345 ; RV64I-NEXT:    add a1, a1, a2
346 ; RV64I-NEXT:    and a2, a0, a1
347 ; RV64I-NEXT:    srli a0, a0, 2
348 ; RV64I-NEXT:    and a0, a0, a1
349 ; RV64I-NEXT:    add a0, a2, a0
350 ; RV64I-NEXT:    srli a1, a0, 4
351 ; RV64I-NEXT:    add a0, a0, a1
352 ; RV64I-NEXT:    lui a1, 61681
353 ; RV64I-NEXT:    addiw a1, a1, -241
354 ; RV64I-NEXT:    slli a2, a1, 32
355 ; RV64I-NEXT:    add a1, a1, a2
356 ; RV64I-NEXT:    and a0, a0, a1
357 ; RV64I-NEXT:    lui a1, 4112
358 ; RV64I-NEXT:    addiw a1, a1, 257
359 ; RV64I-NEXT:    slli a2, a1, 32
360 ; RV64I-NEXT:    add a1, a1, a2
361 ; RV64I-NEXT:    call __muldi3
362 ; RV64I-NEXT:    srli a0, a0, 56
363 ; RV64I-NEXT:    ld ra, 8(sp) # 8-byte Folded Reload
364 ; RV64I-NEXT:    addi sp, sp, 16
365 ; RV64I-NEXT:    ret
366 ; RV64I-NEXT:  .LBB5_2:
367 ; RV64I-NEXT:    li a0, 64
368 ; RV64I-NEXT:    ret
370 ; RV64XTHEADBB-LABEL: ctlz_i64:
371 ; RV64XTHEADBB:       # %bb.0:
372 ; RV64XTHEADBB-NEXT:    th.ff1 a0, a0
373 ; RV64XTHEADBB-NEXT:    ret
374   %1 = call i64 @llvm.ctlz.i64(i64 %a, i1 false)
375   ret i64 %1
378 declare i32 @llvm.cttz.i32(i32, i1)
380 define signext i32 @cttz_i32(i32 signext %a) nounwind {
381 ; RV64I-LABEL: cttz_i32:
382 ; RV64I:       # %bb.0:
383 ; RV64I-NEXT:    beqz a0, .LBB6_2
384 ; RV64I-NEXT:  # %bb.1: # %cond.false
385 ; RV64I-NEXT:    addi sp, sp, -16
386 ; RV64I-NEXT:    sd ra, 8(sp) # 8-byte Folded Spill
387 ; RV64I-NEXT:    negw a1, a0
388 ; RV64I-NEXT:    and a0, a0, a1
389 ; RV64I-NEXT:    lui a1, 30667
390 ; RV64I-NEXT:    addiw a1, a1, 1329
391 ; RV64I-NEXT:    call __muldi3
392 ; RV64I-NEXT:    srliw a0, a0, 27
393 ; RV64I-NEXT:    lui a1, %hi(.LCPI6_0)
394 ; RV64I-NEXT:    addi a1, a1, %lo(.LCPI6_0)
395 ; RV64I-NEXT:    add a0, a1, a0
396 ; RV64I-NEXT:    lbu a0, 0(a0)
397 ; RV64I-NEXT:    ld ra, 8(sp) # 8-byte Folded Reload
398 ; RV64I-NEXT:    addi sp, sp, 16
399 ; RV64I-NEXT:    ret
400 ; RV64I-NEXT:  .LBB6_2:
401 ; RV64I-NEXT:    li a0, 32
402 ; RV64I-NEXT:    ret
404 ; RV64XTHEADBB-LABEL: cttz_i32:
405 ; RV64XTHEADBB:       # %bb.0:
406 ; RV64XTHEADBB-NEXT:    beqz a0, .LBB6_2
407 ; RV64XTHEADBB-NEXT:  # %bb.1: # %cond.false
408 ; RV64XTHEADBB-NEXT:    addi sp, sp, -16
409 ; RV64XTHEADBB-NEXT:    sd ra, 8(sp) # 8-byte Folded Spill
410 ; RV64XTHEADBB-NEXT:    negw a1, a0
411 ; RV64XTHEADBB-NEXT:    and a0, a0, a1
412 ; RV64XTHEADBB-NEXT:    lui a1, 30667
413 ; RV64XTHEADBB-NEXT:    addiw a1, a1, 1329
414 ; RV64XTHEADBB-NEXT:    call __muldi3
415 ; RV64XTHEADBB-NEXT:    srliw a0, a0, 27
416 ; RV64XTHEADBB-NEXT:    lui a1, %hi(.LCPI6_0)
417 ; RV64XTHEADBB-NEXT:    addi a1, a1, %lo(.LCPI6_0)
418 ; RV64XTHEADBB-NEXT:    add a0, a1, a0
419 ; RV64XTHEADBB-NEXT:    lbu a0, 0(a0)
420 ; RV64XTHEADBB-NEXT:    ld ra, 8(sp) # 8-byte Folded Reload
421 ; RV64XTHEADBB-NEXT:    addi sp, sp, 16
422 ; RV64XTHEADBB-NEXT:    ret
423 ; RV64XTHEADBB-NEXT:  .LBB6_2:
424 ; RV64XTHEADBB-NEXT:    li a0, 32
425 ; RV64XTHEADBB-NEXT:    ret
426 ; RV64ZBB-LABEL: cttz_i32:
427 ; RV64ZBB:       # %bb.0:
428 ; RV64ZBB-NEXT:    ctzw a0, a0
429 ; RV64ZBB-NEXT:    ret
430   %1 = call i32 @llvm.cttz.i32(i32 %a, i1 false)
431   ret i32 %1
434 define signext i32 @cttz_zero_undef_i32(i32 signext %a) nounwind {
435 ; RV64I-LABEL: cttz_zero_undef_i32:
436 ; RV64I:       # %bb.0:
437 ; RV64I-NEXT:    addi sp, sp, -16
438 ; RV64I-NEXT:    sd ra, 8(sp) # 8-byte Folded Spill
439 ; RV64I-NEXT:    negw a1, a0
440 ; RV64I-NEXT:    and a0, a0, a1
441 ; RV64I-NEXT:    lui a1, 30667
442 ; RV64I-NEXT:    addiw a1, a1, 1329
443 ; RV64I-NEXT:    call __muldi3
444 ; RV64I-NEXT:    srliw a0, a0, 27
445 ; RV64I-NEXT:    lui a1, %hi(.LCPI7_0)
446 ; RV64I-NEXT:    addi a1, a1, %lo(.LCPI7_0)
447 ; RV64I-NEXT:    add a0, a1, a0
448 ; RV64I-NEXT:    lbu a0, 0(a0)
449 ; RV64I-NEXT:    ld ra, 8(sp) # 8-byte Folded Reload
450 ; RV64I-NEXT:    addi sp, sp, 16
451 ; RV64I-NEXT:    ret
453 ; RV64XTHEADBB-LABEL: cttz_zero_undef_i32:
454 ; RV64XTHEADBB:       # %bb.0:
455 ; RV64XTHEADBB-NEXT:    addi sp, sp, -16
456 ; RV64XTHEADBB-NEXT:    sd ra, 8(sp) # 8-byte Folded Spill
457 ; RV64XTHEADBB-NEXT:    negw a1, a0
458 ; RV64XTHEADBB-NEXT:    and a0, a0, a1
459 ; RV64XTHEADBB-NEXT:    lui a1, 30667
460 ; RV64XTHEADBB-NEXT:    addiw a1, a1, 1329
461 ; RV64XTHEADBB-NEXT:    call __muldi3
462 ; RV64XTHEADBB-NEXT:    srliw a0, a0, 27
463 ; RV64XTHEADBB-NEXT:    lui a1, %hi(.LCPI7_0)
464 ; RV64XTHEADBB-NEXT:    addi a1, a1, %lo(.LCPI7_0)
465 ; RV64XTHEADBB-NEXT:    add a0, a1, a0
466 ; RV64XTHEADBB-NEXT:    lbu a0, 0(a0)
467 ; RV64XTHEADBB-NEXT:    ld ra, 8(sp) # 8-byte Folded Reload
468 ; RV64XTHEADBB-NEXT:    addi sp, sp, 16
469 ; RV64XTHEADBB-NEXT:    ret
470   %1 = call i32 @llvm.cttz.i32(i32 %a, i1 true)
471   ret i32 %1
474 define signext i32 @findFirstSet_i32(i32 signext %a) nounwind {
475 ; RV64I-LABEL: findFirstSet_i32:
476 ; RV64I:       # %bb.0:
477 ; RV64I-NEXT:    addi sp, sp, -16
478 ; RV64I-NEXT:    sd ra, 8(sp) # 8-byte Folded Spill
479 ; RV64I-NEXT:    sd s0, 0(sp) # 8-byte Folded Spill
480 ; RV64I-NEXT:    mv s0, a0
481 ; RV64I-NEXT:    negw a0, a0
482 ; RV64I-NEXT:    and a0, s0, a0
483 ; RV64I-NEXT:    lui a1, 30667
484 ; RV64I-NEXT:    addiw a1, a1, 1329
485 ; RV64I-NEXT:    call __muldi3
486 ; RV64I-NEXT:    srliw a0, a0, 27
487 ; RV64I-NEXT:    lui a1, %hi(.LCPI8_0)
488 ; RV64I-NEXT:    addi a1, a1, %lo(.LCPI8_0)
489 ; RV64I-NEXT:    add a0, a1, a0
490 ; RV64I-NEXT:    lbu a0, 0(a0)
491 ; RV64I-NEXT:    snez a1, s0
492 ; RV64I-NEXT:    addi a1, a1, -1
493 ; RV64I-NEXT:    or a0, a1, a0
494 ; RV64I-NEXT:    ld ra, 8(sp) # 8-byte Folded Reload
495 ; RV64I-NEXT:    ld s0, 0(sp) # 8-byte Folded Reload
496 ; RV64I-NEXT:    addi sp, sp, 16
497 ; RV64I-NEXT:    ret
499 ; RV64XTHEADBB-LABEL: findFirstSet_i32:
500 ; RV64XTHEADBB:       # %bb.0:
501 ; RV64XTHEADBB-NEXT:    addi sp, sp, -16
502 ; RV64XTHEADBB-NEXT:    sd ra, 8(sp) # 8-byte Folded Spill
503 ; RV64XTHEADBB-NEXT:    sd s0, 0(sp) # 8-byte Folded Spill
504 ; RV64XTHEADBB-NEXT:    mv s0, a0
505 ; RV64XTHEADBB-NEXT:    negw a0, a0
506 ; RV64XTHEADBB-NEXT:    and a0, s0, a0
507 ; RV64XTHEADBB-NEXT:    lui a1, 30667
508 ; RV64XTHEADBB-NEXT:    addiw a1, a1, 1329
509 ; RV64XTHEADBB-NEXT:    call __muldi3
510 ; RV64XTHEADBB-NEXT:    srliw a0, a0, 27
511 ; RV64XTHEADBB-NEXT:    lui a1, %hi(.LCPI8_0)
512 ; RV64XTHEADBB-NEXT:    addi a1, a1, %lo(.LCPI8_0)
513 ; RV64XTHEADBB-NEXT:    add a0, a1, a0
514 ; RV64XTHEADBB-NEXT:    lbu a0, 0(a0)
515 ; RV64XTHEADBB-NEXT:    snez a1, s0
516 ; RV64XTHEADBB-NEXT:    addi a1, a1, -1
517 ; RV64XTHEADBB-NEXT:    or a0, a1, a0
518 ; RV64XTHEADBB-NEXT:    ld ra, 8(sp) # 8-byte Folded Reload
519 ; RV64XTHEADBB-NEXT:    ld s0, 0(sp) # 8-byte Folded Reload
520 ; RV64XTHEADBB-NEXT:    addi sp, sp, 16
521 ; RV64XTHEADBB-NEXT:    ret
522   %1 = call i32 @llvm.cttz.i32(i32 %a, i1 true)
523   %2 = icmp eq i32 %a, 0
524   %3 = select i1 %2, i32 -1, i32 %1
525   ret i32 %3
528 define signext i32 @ffs_i32(i32 signext %a) nounwind {
529 ; RV64I-LABEL: ffs_i32:
530 ; RV64I:       # %bb.0:
531 ; RV64I-NEXT:    addi sp, sp, -16
532 ; RV64I-NEXT:    sd ra, 8(sp) # 8-byte Folded Spill
533 ; RV64I-NEXT:    sd s0, 0(sp) # 8-byte Folded Spill
534 ; RV64I-NEXT:    mv s0, a0
535 ; RV64I-NEXT:    negw a0, a0
536 ; RV64I-NEXT:    and a0, s0, a0
537 ; RV64I-NEXT:    lui a1, 30667
538 ; RV64I-NEXT:    addiw a1, a1, 1329
539 ; RV64I-NEXT:    call __muldi3
540 ; RV64I-NEXT:    srliw a0, a0, 27
541 ; RV64I-NEXT:    lui a1, %hi(.LCPI9_0)
542 ; RV64I-NEXT:    addi a1, a1, %lo(.LCPI9_0)
543 ; RV64I-NEXT:    add a0, a1, a0
544 ; RV64I-NEXT:    lbu a0, 0(a0)
545 ; RV64I-NEXT:    addi a0, a0, 1
546 ; RV64I-NEXT:    seqz a1, s0
547 ; RV64I-NEXT:    addi a1, a1, -1
548 ; RV64I-NEXT:    and a0, a1, a0
549 ; RV64I-NEXT:    slli a0, a0, 32
550 ; RV64I-NEXT:    srli a0, a0, 32
551 ; RV64I-NEXT:    ld ra, 8(sp) # 8-byte Folded Reload
552 ; RV64I-NEXT:    ld s0, 0(sp) # 8-byte Folded Reload
553 ; RV64I-NEXT:    addi sp, sp, 16
554 ; RV64I-NEXT:    ret
556 ; RV64XTHEADBB-LABEL: ffs_i32:
557 ; RV64XTHEADBB:       # %bb.0:
558 ; RV64XTHEADBB-NEXT:    addi sp, sp, -16
559 ; RV64XTHEADBB-NEXT:    sd ra, 8(sp) # 8-byte Folded Spill
560 ; RV64XTHEADBB-NEXT:    sd s0, 0(sp) # 8-byte Folded Spill
561 ; RV64XTHEADBB-NEXT:    mv s0, a0
562 ; RV64XTHEADBB-NEXT:    negw a0, a0
563 ; RV64XTHEADBB-NEXT:    and a0, s0, a0
564 ; RV64XTHEADBB-NEXT:    lui a1, 30667
565 ; RV64XTHEADBB-NEXT:    addiw a1, a1, 1329
566 ; RV64XTHEADBB-NEXT:    call __muldi3
567 ; RV64XTHEADBB-NEXT:    srliw a0, a0, 27
568 ; RV64XTHEADBB-NEXT:    lui a1, %hi(.LCPI9_0)
569 ; RV64XTHEADBB-NEXT:    addi a1, a1, %lo(.LCPI9_0)
570 ; RV64XTHEADBB-NEXT:    add a0, a1, a0
571 ; RV64XTHEADBB-NEXT:    lbu a0, 0(a0)
572 ; RV64XTHEADBB-NEXT:    addi a0, a0, 1
573 ; RV64XTHEADBB-NEXT:    seqz a1, s0
574 ; RV64XTHEADBB-NEXT:    addi a1, a1, -1
575 ; RV64XTHEADBB-NEXT:    and a0, a1, a0
576 ; RV64XTHEADBB-NEXT:    slli a0, a0, 32
577 ; RV64XTHEADBB-NEXT:    srli a0, a0, 32
578 ; RV64XTHEADBB-NEXT:    ld ra, 8(sp) # 8-byte Folded Reload
579 ; RV64XTHEADBB-NEXT:    ld s0, 0(sp) # 8-byte Folded Reload
580 ; RV64XTHEADBB-NEXT:    addi sp, sp, 16
581 ; RV64XTHEADBB-NEXT:    ret
582   %1 = call i32 @llvm.cttz.i32(i32 %a, i1 true)
583   %2 = add i32 %1, 1
584   %3 = icmp eq i32 %a, 0
585   %4 = select i1 %3, i32 0, i32 %2
586   ret i32 %4
589 declare i64 @llvm.cttz.i64(i64, i1)
591 define i64 @cttz_i64(i64 %a) nounwind {
592 ; RV64I-LABEL: cttz_i64:
593 ; RV64I:       # %bb.0:
594 ; RV64I-NEXT:    beqz a0, .LBB10_2
595 ; RV64I-NEXT:  # %bb.1: # %cond.false
596 ; RV64I-NEXT:    addi sp, sp, -16
597 ; RV64I-NEXT:    sd ra, 8(sp) # 8-byte Folded Spill
598 ; RV64I-NEXT:    neg a1, a0
599 ; RV64I-NEXT:    and a0, a0, a1
600 ; RV64I-NEXT:    lui a1, %hi(.LCPI10_0)
601 ; RV64I-NEXT:    ld a1, %lo(.LCPI10_0)(a1)
602 ; RV64I-NEXT:    call __muldi3
603 ; RV64I-NEXT:    srli a0, a0, 58
604 ; RV64I-NEXT:    lui a1, %hi(.LCPI10_1)
605 ; RV64I-NEXT:    addi a1, a1, %lo(.LCPI10_1)
606 ; RV64I-NEXT:    add a0, a1, a0
607 ; RV64I-NEXT:    lbu a0, 0(a0)
608 ; RV64I-NEXT:    ld ra, 8(sp) # 8-byte Folded Reload
609 ; RV64I-NEXT:    addi sp, sp, 16
610 ; RV64I-NEXT:    ret
611 ; RV64I-NEXT:  .LBB10_2:
612 ; RV64I-NEXT:    li a0, 64
613 ; RV64I-NEXT:    ret
615 ; RV64XTHEADBB-LABEL: cttz_i64:
616 ; RV64XTHEADBB:       # %bb.0:
617 ; RV64XTHEADBB-NEXT:    beqz a0, .LBB10_2
618 ; RV64XTHEADBB-NEXT:  # %bb.1: # %cond.false
619 ; RV64XTHEADBB-NEXT:    addi a1, a0, -1
620 ; RV64XTHEADBB-NEXT:    not a0, a0
621 ; RV64XTHEADBB-NEXT:    and a0, a0, a1
622 ; RV64XTHEADBB-NEXT:    th.ff1 a0, a0
623 ; RV64XTHEADBB-NEXT:    li a1, 64
624 ; RV64XTHEADBB-NEXT:    sub a0, a1, a0
625 ; RV64XTHEADBB-NEXT:    ret
626 ; RV64XTHEADBB-NEXT:  .LBB10_2:
627 ; RV64XTHEADBB-NEXT:    li a0, 64
628 ; RV64XTHEADBB-NEXT:    ret
629   %1 = call i64 @llvm.cttz.i64(i64 %a, i1 false)
630   ret i64 %1
633 define signext i32 @sextb_i32(i32 signext %a) nounwind {
634 ; RV64I-LABEL: sextb_i32:
635 ; RV64I:       # %bb.0:
636 ; RV64I-NEXT:    slli a0, a0, 56
637 ; RV64I-NEXT:    srai a0, a0, 56
638 ; RV64I-NEXT:    ret
640 ; RV64XTHEADBB-LABEL: sextb_i32:
641 ; RV64XTHEADBB:       # %bb.0:
642 ; RV64XTHEADBB-NEXT:    th.ext a0, a0, 7, 0
643 ; RV64XTHEADBB-NEXT:    ret
644   %shl = shl i32 %a, 24
645   %shr = ashr exact i32 %shl, 24
646   ret i32 %shr
649 define i64 @sextb_i64(i64 %a) nounwind {
650 ; RV64I-LABEL: sextb_i64:
651 ; RV64I:       # %bb.0:
652 ; RV64I-NEXT:    slli a0, a0, 56
653 ; RV64I-NEXT:    srai a0, a0, 56
654 ; RV64I-NEXT:    ret
656 ; RV64XTHEADBB-LABEL: sextb_i64:
657 ; RV64XTHEADBB:       # %bb.0:
658 ; RV64XTHEADBB-NEXT:    th.ext a0, a0, 7, 0
659 ; RV64XTHEADBB-NEXT:    ret
660   %shl = shl i64 %a, 56
661   %shr = ashr exact i64 %shl, 56
662   ret i64 %shr
665 define signext i32 @sexth_i32(i32 signext %a) nounwind {
666 ; RV64I-LABEL: sexth_i32:
667 ; RV64I:       # %bb.0:
668 ; RV64I-NEXT:    slli a0, a0, 48
669 ; RV64I-NEXT:    srai a0, a0, 48
670 ; RV64I-NEXT:    ret
672 ; RV64XTHEADBB-LABEL: sexth_i32:
673 ; RV64XTHEADBB:       # %bb.0:
674 ; RV64XTHEADBB-NEXT:    th.ext a0, a0, 15, 0
675 ; RV64XTHEADBB-NEXT:    ret
676   %shl = shl i32 %a, 16
677   %shr = ashr exact i32 %shl, 16
678   ret i32 %shr
681 define signext i32 @no_sexth_i32(i32 signext %a) nounwind {
682 ; RV64I-LABEL: no_sexth_i32:
683 ; RV64I:       # %bb.0:
684 ; RV64I-NEXT:    slli a0, a0, 17
685 ; RV64I-NEXT:    sraiw a0, a0, 16
686 ; RV64I-NEXT:    ret
688 ; RV64XTHEADBB-LABEL: no_sexth_i32:
689 ; RV64XTHEADBB:       # %bb.0:
690 ; RV64XTHEADBB-NEXT:    slli a0, a0, 17
691 ; RV64XTHEADBB-NEXT:    sraiw a0, a0, 16
692 ; RV64XTHEADBB-NEXT:    ret
693   %shl = shl i32 %a, 17
694   %shr = ashr exact i32 %shl, 16
695   ret i32 %shr
698 define i64 @sexth_i64(i64 %a) nounwind {
699 ; RV64I-LABEL: sexth_i64:
700 ; RV64I:       # %bb.0:
701 ; RV64I-NEXT:    slli a0, a0, 48
702 ; RV64I-NEXT:    srai a0, a0, 48
703 ; RV64I-NEXT:    ret
705 ; RV64XTHEADBB-LABEL: sexth_i64:
706 ; RV64XTHEADBB:       # %bb.0:
707 ; RV64XTHEADBB-NEXT:    th.ext a0, a0, 15, 0
708 ; RV64XTHEADBB-NEXT:    ret
709   %shl = shl i64 %a, 48
710   %shr = ashr exact i64 %shl, 48
711   ret i64 %shr
714 define i64 @no_sexth_i64(i64 %a) nounwind {
715 ; RV64I-LABEL: no_sexth_i64:
716 ; RV64I:       # %bb.0:
717 ; RV64I-NEXT:    slli a0, a0, 49
718 ; RV64I-NEXT:    srai a0, a0, 48
719 ; RV64I-NEXT:    ret
721 ; RV64XTHEADBB-LABEL: no_sexth_i64:
722 ; RV64XTHEADBB:       # %bb.0:
723 ; RV64XTHEADBB-NEXT:    slli a0, a0, 49
724 ; RV64XTHEADBB-NEXT:    srai a0, a0, 48
725 ; RV64XTHEADBB-NEXT:    ret
726   %shl = shl i64 %a, 49
727   %shr = ashr exact i64 %shl, 48
728   ret i64 %shr
731 define i32 @zexth_i32(i32 %a) nounwind {
732 ; RV64I-LABEL: zexth_i32:
733 ; RV64I:       # %bb.0:
734 ; RV64I-NEXT:    slli a0, a0, 48
735 ; RV64I-NEXT:    srli a0, a0, 48
736 ; RV64I-NEXT:    ret
738 ; RV64XTHEADBB-LABEL: zexth_i32:
739 ; RV64XTHEADBB:       # %bb.0:
740 ; RV64XTHEADBB-NEXT:    th.extu a0, a0, 15, 0
741 ; RV64XTHEADBB-NEXT:    ret
742   %and = and i32 %a, 65535
743   ret i32 %and
746 define i64 @zexth_i64(i64 %a) nounwind {
747 ; RV64I-LABEL: zexth_i64:
748 ; RV64I:       # %bb.0:
749 ; RV64I-NEXT:    slli a0, a0, 48
750 ; RV64I-NEXT:    srli a0, a0, 48
751 ; RV64I-NEXT:    ret
753 ; RV64XTHEADBB-LABEL: zexth_i64:
754 ; RV64XTHEADBB:       # %bb.0:
755 ; RV64XTHEADBB-NEXT:    th.extu a0, a0, 15, 0
756 ; RV64XTHEADBB-NEXT:    ret
757   %and = and i64 %a, 65535
758   ret i64 %and
761 define i64 @zext_bf_i64(i64 %a) nounwind {
762 ; RV64I-LABEL: zext_bf_i64:
763 ; RV64I:       # %bb.0:
764 ; RV64I-NEXT:    slli a0, a0, 47
765 ; RV64I-NEXT:    srli a0, a0, 48
766 ; RV64I-NEXT:    ret
768 ; RV64XTHEADBB-LABEL: zext_bf_i64:
769 ; RV64XTHEADBB:       # %bb.0:
770 ; RV64XTHEADBB-NEXT:    th.extu a0, a0, 16, 1
771 ; RV64XTHEADBB-NEXT:    ret
772   %1 = lshr i64 %a, 1
773   %and = and i64 %1, 65535
774   ret i64 %and
777 define i64 @zext_i64_srliw(i64 %a) nounwind {
778 ; RV64I-LABEL: zext_i64_srliw:
779 ; RV64I:       # %bb.0:
780 ; RV64I-NEXT:    srliw a0, a0, 16
781 ; RV64I-NEXT:    ret
783 ; RV64XTHEADBB-LABEL: zext_i64_srliw:
784 ; RV64XTHEADBB:       # %bb.0:
785 ; RV64XTHEADBB-NEXT:    srliw a0, a0, 16
786 ; RV64XTHEADBB-NEXT:    ret
787   %1 = lshr i64 %a, 16
788   %and = and i64 %1, 65535
789   ret i64 %and
792 declare i32 @llvm.bswap.i32(i32)
794 define signext i32 @bswap_i32(i32 signext %a) nounwind {
795 ; RV64I-LABEL: bswap_i32:
796 ; RV64I:       # %bb.0:
797 ; RV64I-NEXT:    srliw a1, a0, 8
798 ; RV64I-NEXT:    lui a2, 16
799 ; RV64I-NEXT:    addiw a2, a2, -256
800 ; RV64I-NEXT:    and a1, a1, a2
801 ; RV64I-NEXT:    srliw a3, a0, 24
802 ; RV64I-NEXT:    or a1, a1, a3
803 ; RV64I-NEXT:    and a2, a0, a2
804 ; RV64I-NEXT:    slliw a2, a2, 8
805 ; RV64I-NEXT:    slliw a0, a0, 24
806 ; RV64I-NEXT:    or a0, a0, a2
807 ; RV64I-NEXT:    or a0, a0, a1
808 ; RV64I-NEXT:    ret
810 ; RV64XTHEADBB-LABEL: bswap_i32:
811 ; RV64XTHEADBB:       # %bb.0:
812 ; RV64XTHEADBB-NEXT:    th.revw a0, a0
813 ; RV64XTHEADBB-NEXT:    ret
814   %1 = tail call i32 @llvm.bswap.i32(i32 %a)
815   ret i32 %1
818 ; Similar to bswap_i32 but the result is not sign extended.
819 define void @bswap_i32_nosext(i32 signext %a, ptr %x) nounwind {
820 ; RV64I-LABEL: bswap_i32_nosext:
821 ; RV64I:       # %bb.0:
822 ; RV64I-NEXT:    srliw a2, a0, 8
823 ; RV64I-NEXT:    lui a3, 16
824 ; RV64I-NEXT:    addi a3, a3, -256
825 ; RV64I-NEXT:    and a2, a2, a3
826 ; RV64I-NEXT:    srliw a4, a0, 24
827 ; RV64I-NEXT:    or a2, a2, a4
828 ; RV64I-NEXT:    and a3, a0, a3
829 ; RV64I-NEXT:    slli a3, a3, 8
830 ; RV64I-NEXT:    slli a0, a0, 24
831 ; RV64I-NEXT:    or a0, a0, a3
832 ; RV64I-NEXT:    or a0, a0, a2
833 ; RV64I-NEXT:    sw a0, 0(a1)
834 ; RV64I-NEXT:    ret
836 ; RV64XTHEADBB-LABEL: bswap_i32_nosext:
837 ; RV64XTHEADBB:       # %bb.0:
838 ; RV64XTHEADBB-NEXT:    th.revw a0, a0
839 ; RV64XTHEADBB-NEXT:    sw a0, 0(a1)
840 ; RV64XTHEADBB-NEXT:    ret
841   %1 = tail call i32 @llvm.bswap.i32(i32 %a)
842   store i32 %1, ptr %x
843   ret void
846 declare i64 @llvm.bswap.i64(i64)
848 define i64 @bswap_i64(i64 %a) {
849 ; RV64I-LABEL: bswap_i64:
850 ; RV64I:       # %bb.0:
851 ; RV64I-NEXT:    srli a1, a0, 40
852 ; RV64I-NEXT:    lui a2, 16
853 ; RV64I-NEXT:    addiw a2, a2, -256
854 ; RV64I-NEXT:    and a1, a1, a2
855 ; RV64I-NEXT:    srli a3, a0, 56
856 ; RV64I-NEXT:    or a1, a1, a3
857 ; RV64I-NEXT:    srli a3, a0, 24
858 ; RV64I-NEXT:    lui a4, 4080
859 ; RV64I-NEXT:    and a3, a3, a4
860 ; RV64I-NEXT:    srli a5, a0, 8
861 ; RV64I-NEXT:    srliw a5, a5, 24
862 ; RV64I-NEXT:    slli a5, a5, 24
863 ; RV64I-NEXT:    or a3, a5, a3
864 ; RV64I-NEXT:    or a1, a3, a1
865 ; RV64I-NEXT:    and a4, a0, a4
866 ; RV64I-NEXT:    slli a4, a4, 24
867 ; RV64I-NEXT:    srliw a3, a0, 24
868 ; RV64I-NEXT:    slli a3, a3, 32
869 ; RV64I-NEXT:    or a3, a4, a3
870 ; RV64I-NEXT:    and a2, a0, a2
871 ; RV64I-NEXT:    slli a2, a2, 40
872 ; RV64I-NEXT:    slli a0, a0, 56
873 ; RV64I-NEXT:    or a0, a0, a2
874 ; RV64I-NEXT:    or a0, a0, a3
875 ; RV64I-NEXT:    or a0, a0, a1
876 ; RV64I-NEXT:    ret
878 ; RV64XTHEADBB-LABEL: bswap_i64:
879 ; RV64XTHEADBB:       # %bb.0:
880 ; RV64XTHEADBB-NEXT:    th.rev a0, a0
881 ; RV64XTHEADBB-NEXT:    ret
882   %1 = call i64 @llvm.bswap.i64(i64 %a)
883   ret i64 %1