Run DCE after a LoopFlatten test to reduce spurious output [nfc]
[llvm-project.git] / llvm / test / CodeGen / AArch64 / swap-compare-operands.ll
blobb106e15c23e30a2fcf5ab3226bffb626cd1b7061
1 ; RUN: llc < %s -mtriple=arm64 | FileCheck %s
3 define i1 @testSwapCmpWithLSL64_1(i64 %a, i64 %b) {
4 ; CHECK-LABEL: testSwapCmpWithLSL64_1:
5 ; CHECK:      cmp     x1, x0, lsl #1
6 ; CHECK-NEXT: cset    w0, gt
7 entry:
8   %shl = shl i64 %a, 1
9   %cmp = icmp slt i64 %shl, %b
10   ret i1 %cmp
13 define i1 @testSwapCmpWithLSL64_63(i64 %a, i64 %b) {
14 ; CHECK-LABEL: testSwapCmpWithLSL64_63:
15 ; CHECK:      cmp     x1, x0, lsl #63
16 ; CHECK-NEXT: cset    w0, gt
17 entry:
18   %shl = shl i64 %a, 63
19   %cmp = icmp slt i64 %shl, %b
20   ret i1 %cmp
23 define i1 @testSwapCmpWithLSL32_1(i32 %a, i32 %b) {
24 ; CHECK-LABEL: testSwapCmpWithLSL32_1:
25 ; CHECK:      cmp     w1, w0, lsl #1
26 ; CHECK-NEXT: cset    w0, gt
27 entry:
28   %shl = shl i32 %a, 1
29   %cmp = icmp slt i32 %shl, %b
30   ret i1 %cmp
33 define i1 @testSwapCmpWithLSL32_31(i32 %a, i32 %b) {
34 ; CHECK-LABEL: testSwapCmpWithLSL32_31:
35 ; CHECK:      cmp     w1, w0, lsl #31
36 ; CHECK-NEXT: cset    w0, gt
37 entry:
38   %shl = shl i32 %a, 31
39   %cmp = icmp slt i32 %shl, %b
40   ret i1 %cmp
43 define i1 @testSwapCmpWithLSR64_1(i64 %a, i64 %b) {
44 ; CHECK-LABEL: testSwapCmpWithLSR64_1:
45 ; CHECK:      cmp     x1, x0, lsr #1
46 ; CHECK-NEXT: cset    w0, gt
47 entry:
48   %lshr = lshr i64 %a, 1
49   %cmp = icmp slt i64 %lshr, %b
50   ret i1 %cmp
53 define i1 @testSwapCmpWithLSR64_63(i64 %a, i64 %b) {
54 ; CHECK-LABEL: testSwapCmpWithLSR64_63:
55 ; CHECK:      cmp     x1, x0, lsr #63
56 ; CHECK-NEXT: cset    w0, gt
57 entry:
58   %lshr = lshr i64 %a, 63
59   %cmp = icmp slt i64 %lshr, %b
60   ret i1 %cmp
63 define i1 @testSwapCmpWithLSR32_1(i32 %a, i32 %b) {
64 ; CHECK-LABEL: testSwapCmpWithLSR32_1:
65 ; CHECK:      cmp     w1, w0, lsr #1
66 ; CHECK-NEXT: cset    w0, gt
67 entry:
68   %lshr = lshr i32 %a, 1
69   %cmp = icmp slt i32 %lshr, %b
70   ret i1 %cmp
73 define i1 @testSwapCmpWithLSR32_31(i32 %a, i32 %b) {
74 ; CHECK-LABEL: testSwapCmpWithLSR32_31:
75 ; CHECK:      cmp     w1, w0, lsr #31
76 ; CHECK-NEXT: cset    w0, gt
77 entry:
78   %lshr = lshr i32 %a, 31
79   %cmp = icmp slt i32 %lshr, %b
80   ret i1 %cmp
83 define i1 @testSwapCmpWithASR64_1(i64 %a, i64 %b) {
84 ; CHECK-LABEL: testSwapCmpWithASR64_1:
85 ; CHECK:      cmp     x1, x0, asr #1
86 ; CHECK-NEXT: cset    w0, gt
87 entry:
88   %ashr = ashr i64 %a, 1
89   %cmp = icmp slt i64 %ashr, %b
90   ret i1 %cmp
93 define i1 @testSwapCmpWithASR64_63(i64 %a, i64 %b) {
94 ; CHECK-LABEL: testSwapCmpWithASR64_63:
95 ; CHECK:      cmp     x1, x0, asr #63
96 ; CHECK-NEXT: cset    w0, gt
97 entry:
98   %ashr = ashr i64 %a, 63
99   %cmp = icmp slt i64 %ashr, %b
100   ret i1 %cmp
103 define i1 @testSwapCmpWithASR32_1(i32 %a, i32 %b) {
104 ; CHECK-LABEL: testSwapCmpWithASR32_1:
105 ; CHECK:      cmp     w1, w0, asr #1
106 ; CHECK-NEXT: cset    w0, gt
107 entry:
108   %ashr = ashr i32 %a, 1
109   %cmp = icmp slt i32 %ashr, %b
110   ret i1 %cmp
113 define i1 @testSwapCmpWithASR32_31(i32 %a, i32 %b) {
114 ; CHECK-LABEL: testSwapCmpWithASR32_31:
115 ; CHECK:      cmp     w1, w0, asr #31
116 ; CHECK-NEXT: cset    w0, gt
117 entry:
118   %ashr = ashr i32 %a, 31
119   %cmp = icmp slt i32 %ashr, %b
120   ret i1 %cmp
123 define i1 @testSwapCmpWithShiftedZeroExtend32_64(i32 %a, i64 %b) {
124 ; CHECK-LABEL: testSwapCmpWithShiftedZeroExtend32_64
125 ; CHECK:      cmp    x1, w0, uxtw #2
126 ; CHECK-NEXT: cset   w0, lo
127 entry:
128   %a64 = zext i32 %a to i64
129   %shl.0 = shl i64 %a64, 2
130   %cmp = icmp ugt i64 %shl.0, %b
131   ret i1 %cmp
134 define i1 @testSwapCmpWithShiftedZeroExtend16_64(i16 %a, i64 %b) {
135 ; CHECK-LABEL: testSwapCmpWithShiftedZeroExtend16_64
136 ; CHECK:      cmp    x1, w0, uxth #2
137 ; CHECK-NEXT: cset   w0, lo
138 entry:
139   %a64 = zext i16 %a to i64
140   %shl.0 = shl i64 %a64, 2
141   %cmp = icmp ugt i64 %shl.0, %b
142   ret i1 %cmp
145 define i1 @testSwapCmpWithShiftedZeroExtend8_64(i8 %a, i64 %b) {
146 ; CHECK-LABEL: testSwapCmpWithShiftedZeroExtend8_64
147 ; CHECK:      cmp    x1, w0, uxtb #4
148 ; CHECK-NEXT: cset    w0, lo
149 entry:
150   %a64 = zext i8 %a to i64
151   %shl.2 = shl i64 %a64, 4
152   %cmp = icmp ugt i64 %shl.2, %b
153   ret i1 %cmp
156 define i1 @testSwapCmpWithShiftedZeroExtend16_32(i16 %a, i32 %b) {
157 ; CHECK-LABEL: testSwapCmpWithShiftedZeroExtend16_32
158 ; CHECK:      cmp    w1, w0, uxth #3
159 ; CHECK-NEXT: cset    w0, lo
160 entry:
161   %a32 = zext i16 %a to i32
162   %shl = shl i32 %a32, 3
163   %cmp = icmp ugt i32 %shl, %b
164   ret i1 %cmp
167 define i1 @testSwapCmpWithShiftedZeroExtend8_32(i8 %a, i32 %b) {
168 ; CHECK-LABEL: testSwapCmpWithShiftedZeroExtend8_32
169 ; CHECK:      cmp    w1, w0, uxtb #4
170 ; CHECK-NEXT: cset    w0, lo
171 entry:
172   %a32 = zext i8 %a to i32
173   %shl = shl i32 %a32, 4
174   %cmp = icmp ugt i32 %shl, %b
175   ret i1 %cmp
178 define i1 @testSwapCmpWithTooLargeShiftedZeroExtend8_32(i8 %a, i32 %b) {
179 ; CHECK-LABEL: testSwapCmpWithTooLargeShiftedZeroExtend8_32
180 ; CHECK:      and    [[REG:w[0-9]+]], w0, #0xff
181 ; CHECK:      cmp    w1, [[REG]], lsl #5
182 ; CHECK-NEXT: cset   w0, lo
183 entry:
184   %a32 = zext i8 %a to i32
185   %shl = shl i32 %a32, 5
186   %cmp = icmp ugt i32 %shl, %b
187   ret i1 %cmp
190 define i1 @testSwapCmpWithZeroExtend8_32(i8 %a, i32 %b) {
191 ; CHECK-LABEL: testSwapCmpWithZeroExtend8_32
192 ; CHECK:      cmp    w1, w0, uxtb
193 ; CHECK-NEXT: cset   w0, lo
194 entry:
195   %a32 = zext i8 %a to i32
196   %cmp = icmp ugt i32 %a32, %b
197   ret i1 %cmp
200 define i1 @testSwapCmpWithShiftedSignExtend32_64(i32 %a, i64 %b) {
201 ; CHECK-LABEL: testSwapCmpWithShiftedSignExtend32_64
202 ; CHECK:      cmp    x1, w0, sxtw #2
203 ; CHECK-NEXT: cset   w0, lo
204 entry:
205   %a64 = sext i32 %a to i64
206   %shl.0 = shl i64 %a64, 2
207   %cmp = icmp ugt i64 %shl.0, %b
208   ret i1 %cmp
211 define i1 @testSwapCmpWithShiftedSignExtend16_64(i16 %a, i64 %b) {
212 ; CHECK-LABEL: testSwapCmpWithShiftedSignExtend16_64
213 ; CHECK:      cmp    x1, w0, sxth #2
214 ; CHECK-NEXT: cset   w0, lo
215 entry:
216   %a64 = sext i16 %a to i64
217   %shl.0 = shl i64 %a64, 2
218   %cmp = icmp ugt i64 %shl.0, %b
219   ret i1 %cmp
222 define i1 @testSwapCmpWithShiftedSignExtend8_64(i8 %a, i64 %b) {
223 ; CHECK-LABEL: testSwapCmpWithShiftedSignExtend8_64
224 ; CHECK:      cmp    x1, w0, sxtb #4
225 ; CHECK-NEXT: cset    w0, lo
226 entry:
227   %a64 = sext i8 %a to i64
228   %shl.2 = shl i64 %a64, 4
229   %cmp = icmp ugt i64 %shl.2, %b
230   ret i1 %cmp
233 define i1 @testSwapCmpWithShiftedSignExtend16_32(i16 %a, i32 %b) {
234 ; CHECK-LABEL: testSwapCmpWithShiftedSignExtend16_32
235 ; CHECK:      cmp    w1, w0, sxth #3
236 ; CHECK-NEXT: cset    w0, lo
237 entry:
238   %a32 = sext i16 %a to i32
239   %shl = shl i32 %a32, 3
240   %cmp = icmp ugt i32 %shl, %b
241   ret i1 %cmp
244 define i1 @testSwapCmpWithShiftedSignExtend8_32(i8 %a, i32 %b) {
245 ; CHECK-LABEL: testSwapCmpWithShiftedSignExtend8_32
246 ; CHECK:      cmp    w1, w0, sxtb #4
247 ; CHECK-NEXT: cset   w0, lo
248 entry:
249   %a32 = sext i8 %a to i32
250   %shl = shl i32 %a32, 4
251   %cmp = icmp ugt i32 %shl, %b
252   ret i1 %cmp
255 define i1 @testSwapCmpWithTooLargeShiftedSignExtend8_32(i8 %a, i32 %b) {
256 ; CHECK-LABEL: testSwapCmpWithTooLargeShiftedSignExtend8_32
257 ; CHECK:      sxtb   [[REG:w[0-9]+]], w0
258 ; CHECK-NEXT: cmp    w1, [[REG]], lsl #5
259 ; CHECK-NEXT: cset   w0, lo
260 entry:
261   %a32 = sext i8 %a to i32
262   %shl = shl i32 %a32, 5
263   %cmp = icmp ugt i32 %shl, %b
264   ret i1 %cmp
267 define i1 @testSwapCmpWithSignExtend8_32(i8 %a, i32 %b) {
268 ; CHECK-LABEL: testSwapCmpWithSignExtend8_32
269 ; CHECK:      cmp    w1, w0, sxtb
270 ; CHECK-NEXT: cset   w0, lo
271 entry:
272   %a32 = sext i8 %a to i32
273   %cmp = icmp ugt i32 %a32, %b
274   ret i1 %cmp
277 define i1 @testSwapCmnWithLSL64_1(i64 %a, i64 %b) {
278 ; CHECK-LABEL: testSwapCmnWithLSL64_1:
279 ; CHECK:      cmn    x1, x0, lsl #1
280 ; CHECK-NEXT: cset   w0, ne
281 entry:
282   %shl = shl i64 %a, 1
283   %na = sub i64 0, %shl
284   %cmp = icmp ne i64 %na, %b
285   ret i1 %cmp
288 ; Note: testing with a 62 bits shift as 63 has another optimization kicking in.
289 define i1 @testSwapCmnWithLSL64_62(i64 %a, i64 %b) {
290 ; CHECK-LABEL: testSwapCmnWithLSL64_62:
291 ; CHECK:      cmn    x1, x0, lsl #62
292 ; CHECK-NEXT: cset   w0, ne
293 entry:
294   %shl = shl i64 %a, 62
295   %na = sub i64 0, %shl
296   %cmp = icmp ne i64 %na, %b
297   ret i1 %cmp
300 ; Note: the 63 bits shift triggers a different optimization path, which leads
301 ; to a similar result in terms of performances. We try to catch here any change
302 ; so that this test can be adapted should the optimization be done with the
303 ; operand swap.
304 define i1 @testSwapCmnWithLSL64_63(i64 %a, i64 %b) {
305 ; CHECK-LABEL: testSwapCmnWithLSL64_63:
306 ; CHECK:      cmp    x1, x0, lsl #63
307 ; CHECK-NEXT: cset   w0, ne
308 entry:
309   %shl = shl i64 %a, 63
310   %na = sub i64 0, %shl
311   %cmp = icmp ne i64 %na, %b
312   ret i1 %cmp
315 define i1 @testSwapCmnWithLSL32_1(i32 %a, i32 %b) {
316 ; CHECK-LABEL: testSwapCmnWithLSL32_1:
317 ; CHECK:      cmn    w1, w0, lsl #1
318 ; CHECK-NEXT: cset   w0, ne
319 entry:
320   %shl = shl i32 %a, 1
321   %na = sub i32 0, %shl
322   %cmp = icmp ne i32 %na, %b
323   ret i1 %cmp
326 ; Note: testing with a 30 bits shift as 30 has another optimization kicking in.
327 define i1 @testSwapCmnWithLSL32_30(i32 %a, i32 %b) {
328 ; CHECK-LABEL: testSwapCmnWithLSL32_30:
329 ; CHECK:      cmn    w1, w0, lsl #30
330 ; CHECK-NEXT: cset   w0, ne
331 entry:
332   %shl = shl i32 %a, 30
333   %na = sub i32 0, %shl
334   %cmp = icmp ne i32 %na, %b
335   ret i1 %cmp
338 ; Note: the 31 bits shift triggers a different optimization path, which leads
339 ; to a similar result in terms of performances. We try to catch here any change
340 ; so that this test can be adapted should the optimization be done with the
341 ; operand swap.
342 define i1 @testSwapCmnWithLSL32_31(i32 %a, i32 %b) {
343 ; CHECK-LABEL: testSwapCmnWithLSL32_31:
344 ; CHECK:      cmp    w1, w0, lsl #31
345 ; CHECK-NEXT: cset   w0, ne
346 entry:
347   %shl = shl i32 %a, 31
348   %na = sub i32 0, %shl
349   %cmp = icmp ne i32 %na, %b
350   ret i1 %cmp
353 define i1 @testSwapCmnWithLSR64_1(i64 %a, i64 %b) {
354 ; CHECK-LABEL: testSwapCmnWithLSR64_1:
355 ; CHECK:      cmn    x1, x0, lsr #1
356 ; CHECK-NEXT: cset   w0, ne
357 entry:
358   %lshr = lshr i64 %a, 1
359   %na = sub i64 0, %lshr
360   %cmp = icmp ne i64 %na, %b
361   ret i1 %cmp
364 ; Note: testing with a 62 bits shift as 63 has another optimization kicking in.
365 define i1 @testSwapCmnWithLSR64_62(i64 %a, i64 %b) {
366 ; CHECK-LABEL: testSwapCmnWithLSR64_62:
367 ; CHECK:      cmn    x1, x0, lsr #62
368 ; CHECK-NEXT: cset   w0, ne
369 entry:
370   %lshr = lshr i64 %a, 62
371   %na = sub i64 0, %lshr
372   %cmp = icmp ne i64 %na, %b
373   ret i1 %cmp
376 ; Note: the 63 bits shift triggers a different optimization path, which leads
377 ; to a similar result in terms of performances. We try to catch here any change
378 ; so that this test can be adapted should the optimization be done with the
379 ; operand swap.
380 define i1 @testSwapCmnWithLSR64_63(i64 %a, i64 %b) {
381 ; CHECK-LABEL: testSwapCmnWithLSR64_63:
382 ; CHECK:      cmp    x1, x0, asr #63
383 ; CHECK-NEXT: cset   w0, ne
384 entry:
385   %lshr = lshr i64 %a, 63
386   %na = sub i64 0, %lshr
387   %cmp = icmp ne i64 %na, %b
388   ret i1 %cmp
391 define i1 @testSwapCmnWithLSR32_1(i32 %a, i32 %b) {
392 ; CHECK-LABEL: testSwapCmnWithLSR32_1:
393 ; CHECK:      cmn    w1, w0, lsr #1
394 ; CHECK-NEXT: cset   w0, ne
395 entry:
396   %lshr = lshr i32 %a, 1
397   %na = sub i32 0, %lshr
398   %cmp = icmp ne i32 %na, %b
399   ret i1 %cmp
402 ; Note: testing with a 30 bits shift as 31 has another optimization kicking in.
403 define i1 @testSwapCmnWithLSR32_30(i32 %a, i32 %b) {
404 ; CHECK-LABEL: testSwapCmnWithLSR32_30:
405 ; CHECK:      cmn    w1, w0, lsr #30
406 ; CHECK-NEXT: cset   w0, ne
407 entry:
408   %lshr = lshr i32 %a, 30
409   %na = sub i32 0, %lshr
410   %cmp = icmp ne i32 %na, %b
411   ret i1 %cmp
414 ; Note: the 31 bits shift triggers a different optimization path, which leads
415 ; to a similar result in terms of performances. We try to catch here any change
416 ; so that this test can be adapted should the optimization be done with the
417 ; operand swap.
418 define i1 @testSwapCmnWithLSR32_31(i32 %a, i32 %b) {
419 ; CHECK-LABEL: testSwapCmnWithLSR32_31:
420 ; CHECK:      cmp    w1, w0, asr #31
421 ; CHECK-NEXT: cset   w0, ne
422 entry:
423   %lshr = lshr i32 %a, 31
424   %na = sub i32 0, %lshr
425   %cmp = icmp ne i32 %na, %b
426   ret i1 %cmp
429 define i1 @testSwapCmnWithASR64_1(i64 %a, i64 %b) {
430 ; CHECK-LABEL: testSwapCmnWithASR64_1:
431 ; CHECK:      cmn    x1, x0, asr #3
432 ; CHECK-NEXT: cset   w0, ne
433 entry:
434   %lshr = ashr i64 %a, 3
435   %na = sub i64 0, %lshr
436   %cmp = icmp ne i64 %na, %b
437   ret i1 %cmp
440 ; Note: testing with a 62 bits shift as 63 has another optimization kicking in.
441 define i1 @testSwapCmnWithASR64_62(i64 %a, i64 %b) {
442 ; CHECK-LABEL: testSwapCmnWithASR64_62:
443 ; CHECK:      cmn    x1, x0, asr #62
444 ; CHECK-NEXT: cset   w0, ne
445 entry:
446   %lshr = ashr i64 %a, 62
447   %na = sub i64 0, %lshr
448   %cmp = icmp ne i64 %na, %b
449   ret i1 %cmp
452 ; Note: the 63 bits shift triggers a different optimization path, which leads
453 ; to a similar result in terms of performances. We try to catch here any change
454 ; so that this test can be adapted should the optimization be done with the
455 ; operand swap.
456 define i1 @testSwapCmnWithASR64_63(i64 %a, i64 %b) {
457 ; CHECK-LABEL: testSwapCmnWithASR64_63:
458 ; CHECK:      cmp    x1, x0, lsr #63
459 ; CHECK-NEXT: cset   w0, ne
460 entry:
461   %lshr = ashr i64 %a, 63
462   %na = sub i64 0, %lshr
463   %cmp = icmp ne i64 %na, %b
464   ret i1 %cmp
467 define i1 @testSwapCmnWithASR32_1(i32 %a, i32 %b) {
468 ; CHECK-LABEL: testSwapCmnWithASR32_1:
469 ; CHECK:      cmn    w1, w0, asr #1
470 ; CHECK-NEXT: cset   w0, eq
471 entry:
472   %lshr = ashr i32 %a, 1
473   %na = sub i32 0, %lshr
474   %cmp = icmp eq i32 %na, %b
475   ret i1 %cmp
478 ; Note: testing with a 30 bits shift as 31 has another optimization kicking in.
479 define i1 @testSwapCmnWithASR32_30(i32 %a, i32 %b) {
480 ; CHECK-LABEL: testSwapCmnWithASR32_30:
481 ; CHECK:      cmn    w1, w0, asr #30
482 ; CHECK-NEXT: cset   w0, ne
483 entry:
484   %lshr = ashr i32 %a, 30
485   %na = sub i32 0, %lshr
486   %cmp = icmp ne i32 %na, %b
487   ret i1 %cmp
490 ; Note: the 31 bits shift triggers a different optimization path, which leads
491 ; to a similar result in terms of performances. We try to catch here any change
492 ; so that this test can be adapted should the optimization be done with the
493 ; operand swap.
494 define i1 @testSwapCmnWithASR32_31(i32 %a, i32 %b) {
495 ; CHECK-LABEL: testSwapCmnWithASR32_31:
496 ; CHECK:      cmp    w1, w0, lsr #31
497 ; CHECK-NEXT: cset   w0, ne
498 entry:
499   %lshr = ashr i32 %a, 31
500   %na = sub i32 0, %lshr
501   %cmp = icmp ne i32 %na, %b
502   ret i1 %cmp
505 define i64 @testSwapCmpToCmnWithZeroExtend(i32 %a32, i16 %a16, i8 %a8, i64 %b64, i32 %b32) {
506 ; CHECK-LABEL: testSwapCmpToCmnWithZeroExtend:
508   %conv0 = zext i32 %a32 to i64
509   %shl0 = shl i64 %conv0, 1
510   %na0 = sub i64 0, %shl0
511   %cmp0 = icmp ne i64 %na0, %b64
512 ; CHECK: cmn    x3, w0, uxtw #1
513   br i1 %cmp0, label %t1, label %end
516   %conv1 = zext i16 %a16 to i64
517   %shl1 = shl i64 %conv1, 4
518   %na1 = sub i64 0, %shl1
519   %cmp1 = icmp ne i64 %na1, %b64
520 ; CHECK: cmn    x3, w1, uxth #4
521   br i1 %cmp1, label %t2, label %end
524   %conv2 = zext i8 %a8 to i64
525   %shl2 = shl i64 %conv2, 3
526   %na2 = sub i64 0, %shl2
527   %cmp2 = icmp ne i64 %na2, %b64
528 ; CHECK: cmn    x3, w2, uxtb #3
529   br i1 %cmp2, label %t3, label %end
532   %conv3 = zext i16 %a16 to i32
533   %shl3 = shl i32 %conv3, 2
534   %na3 = sub i32 0, %shl3
535   %cmp3 = icmp ne i32 %na3, %b32
536 ; CHECK: cmn    w4, w1, uxth #2
537   br i1 %cmp3, label %t4, label %end
540   %conv4 = zext i8 %a8 to i32
541   %shl4 = shl i32 %conv4, 1
542   %na4 = sub i32 0, %shl4
543   %cmp4 = icmp ne i32 %na4, %b32
544 ; CHECK: cmn    w4, w2, uxtb #1
545   br i1 %cmp4, label %t5, label %end
548   %conv5 = zext i8 %a8 to i32
549   %shl5 = shl i32 %conv5, 5
550   %na5 = sub i32 0, %shl5
551   %cmp5 = icmp ne i32 %na5, %b32
552 ; CHECK: and    [[REG:w[0-9]+]], w2, #0xff
553 ; CHECK: cmn    w4, [[REG]], lsl #5
554   br i1 %cmp5, label %t6, label %end
557   %conv6 = zext i8 %a8 to i32
558   %na6 = sub i32 0, %conv6
559   %cmp6 = icmp ne i32 %na6, %b32
560 ; CHECK: cmn    w4, w2, uxtb
561   br i1 %cmp6, label %t7, label %end
564   ret i64 0
566 end:
567   ret i64 1
569 define i64 @testSwapCmpToCmnWithSignExtend(i32 %a32, i16 %a16, i8 %a8, i64 %b64, i32 %b32) {
570 ; CHECK-LABEL: testSwapCmpToCmnWithSignExtend:
572   %conv0 = sext i32 %a32 to i64
573   %shl0 = shl i64 %conv0, 1
574   %na0 = sub i64 0, %shl0
575   %cmp0 = icmp ne i64 %na0, %b64
576 ; CHECK: cmn     x3, w0, sxtw #1
577   br i1 %cmp0, label %t1, label %end
580   %conv1 = sext i16 %a16 to i64
581   %shl1 = shl i64 %conv1, 4
582   %na1 = sub i64 0, %shl1
583   %cmp1 = icmp ne i64 %na1, %b64
584 ; CHECK: cmn     x3, w1, sxth #4
585   br i1 %cmp1, label %t2, label %end
588   %conv2 = sext i8 %a8 to i64
589   %shl2 = shl i64 %conv2, 3
590   %na2 = sub i64 0, %shl2
591   %cmp2 = icmp ne i64 %na2, %b64
592 ; CHECK: cmn     x3, w2, sxtb #3
593   br i1 %cmp2, label %t3, label %end
596   %conv3 = sext i16 %a16 to i32
597   %shl3 = shl i32 %conv3, 2
598   %na3 = sub i32 0, %shl3
599   %cmp3 = icmp ne i32 %na3, %b32
600 ; CHECK: cmn     w4, w1, sxth #2
601   br i1 %cmp3, label %t4, label %end
604   %conv4 = sext i8 %a8 to i32
605   %shl4 = shl i32 %conv4, 1
606   %na4 = sub i32 0, %shl4
607   %cmp4 = icmp ne i32 %na4, %b32
608 ; CHECK: cmn     w4, w2, sxtb #1
609   br i1 %cmp4, label %t5, label %end
612   %conv5 = sext i8 %a8 to i32
613   %shl5 = shl i32 %conv5, 5
614   %na5 = sub i32 0, %shl5
615   %cmp5 = icmp ne i32 %na5, %b32
616 ; CHECK: sxtb    [[REG:w[0-9]+]], w2
617 ; CHECK: cmn     w4, [[REG]], lsl #5
618   br i1 %cmp5, label %t6, label %end
621   %conv6 = sext i8 %a8 to i32
622   %na6 = sub i32 0, %conv6
623   %cmp6 = icmp ne i32 %na6, %b32
624 ; CHECK: cmn     w4, w2, sxtb
625   br i1 %cmp6, label %t7, label %end
628   ret i64 0
630 end:
631   ret i64 1