[ARM] Adjust how NEON shifts are lowered
[llvm-core.git] / test / CodeGen / ARM / CGP / arm-cgp-casts.ll
blobe269aacad28c87d2e660d021e1d242b120834a9c
1 ; RUN: llc -mtriple=thumbv8.main -mcpu=cortex-m33 %s -arm-disable-cgp=false -o - | FileCheck %s --check-prefix=CHECK --check-prefix=CHECK-NODSP
2 ; RUN: llc -mtriple=thumbv7-linux-android %s -arm-disable-cgp=false -o - | FileCheck %s --check-prefix=CHECK --check-prefix=CHECK-NODSP
3 ; RUN: llc -mtriple=thumbv7em -mcpu=cortex-m7 %s -arm-disable-cgp=false -arm-enable-scalar-dsp=true -o - | FileCheck %s --check-prefix=CHECK --check-prefix=CHECK-DSP
4 ; RUN: llc -mtriple=thumbv8 %s -arm-disable-cgp=false -arm-enable-scalar-dsp=true -arm-enable-scalar-dsp-imms=true -o - | FileCheck %s --check-prefix=CHECK --check-prefix=CHECK-DSP-IMM
6 ; Transform will fail because the trunc is not a sink.
7 ; CHECK-LABEL: dsp_trunc
8 ; CHECK:   add   [[ADD:[^ ]+]],
9 ; CHECK-DSP-NEXT: ldrh  r1, [r3]
10 ; CHECK-DSP-NEXT: ldrh  r2, [r2]
11 ; CHECK-DSP-NEXT: subs  r1, r1, [[ADD]]
12 ; CHECK-DSP-NEXT: add   r0, r2
13 ; CHECK-DSP-NEXT: uxth  r3, r1
14 ; CHECK-DSP-NEXT: uxth  r2, r0
15 ; CHECK-DSP-NEXT: cmp   r2, r3
17 ; CHECK-DSP-IMM: usub16
18 ; CHECK-DSP-IMM: usub16
19 ; CHECK-DSP-IMM: uadd16
20 ; CHECK-DSP-IMM: cmp
21 define i16 @dsp_trunc(i32 %arg0, i32 %arg1, i16* %gep0, i16* %gep1) {
22 entry:
23   %add0 = add i32 %arg0, %arg1
24   %conv0 = trunc i32 %add0 to i16
25   %sub0 = sub i16 0, %conv0
26   %load0 = load i16, i16* %gep0, align 2
27   %load1 = load i16, i16* %gep1, align 2
28   %sub1 = sub i16 %load0, %sub0
29   %add1 = add i16 %load1, %sub0
30   %cmp = icmp ult i16 %sub1, %add1
31   %res = select i1 %cmp, i16 %add1, i16 %sub1
32   ret i16 %res
35 ; CHECK-LABEL: trunc_i16_i8
36 ; CHECK: ldrh
37 ; CHECK: uxtb
38 ; CHECK: cmp
39 define i8 @trunc_i16_i8(i16* %ptr, i16 zeroext %arg0, i8 zeroext %arg1) {
40 entry:
41   %0 = load i16, i16* %ptr
42   %1 = add i16 %0, %arg0
43   %2 = trunc i16 %1 to i8
44   %3 = icmp ugt i8 %2, %arg1
45   %4 = select i1 %3, i8 %2, i8 %arg1
46   ret i8 %4
49 ; The pass perform the transform, but a uxtb will still be inserted to handle
50 ; the zext to the icmp.
51 ; CHECK-LABEL: icmp_i32_zext:
52 ; CHECK: sub
53 ; CHECK: uxtb
54 ; CHECK: cmp
55 define i8 @icmp_i32_zext(i8* %ptr) {
56 entry:
57   %gep = getelementptr inbounds i8, i8* %ptr, i32 0
58   %0 = load i8, i8* %gep, align 1
59   %1 = sub nuw nsw i8 %0, 1
60   %conv44 = zext i8 %0 to i32
61   br label %preheader
63 preheader:
64   br label %body
66 body:
67   %2 = phi i8 [ %1, %preheader ], [ %3, %if.end ]
68   %si.0274 = phi i32 [ %conv44, %preheader ], [ %inc, %if.end ]
69   %conv51266 = zext i8 %2 to i32
70   %cmp52267 = icmp eq i32 %si.0274, %conv51266
71   br i1 %cmp52267, label %if.end, label %exit
73 if.end:
74   %inc = add i32 %si.0274, 1
75   %gep1 = getelementptr inbounds i8, i8* %ptr, i32 %inc
76   %3 = load i8, i8* %gep1, align 1
77   br label %body
79 exit:
80   ret i8 %2
83 ; Won't don't handle sext
84 ; CHECK-LABEL: icmp_sext_zext_store_i8_i16
85 ; CHECK: ldrb
86 ; CHECK: ldrsh
87 define i32 @icmp_sext_zext_store_i8_i16() {
88 entry:
89   %0 = load i8, i8* getelementptr inbounds ([16 x i8], [16 x i8]* @d_uch, i32 0, i32 2), align 1
90   %conv = zext i8 %0 to i16
91   store i16 %conv, i16* @sh1, align 2
92   %conv1 = zext i8 %0 to i32
93   %1 = load i16, i16* getelementptr inbounds ([16 x i16], [16 x i16]* @d_sh, i32 0, i32 2), align 2
94   %conv2 = sext i16 %1 to i32
95   %cmp = icmp eq i32 %conv1, %conv2
96   %conv3 = zext i1 %cmp to i32
97   ret i32 %conv3
100 ; CHECK-LABEL: or_icmp_ugt:
101 ; CHECK:     ldrb
102 ; CHECK:     subs.w
103 ; CHECK-NOT: uxt
104 ; CHECK:     cmp
105 define i1 @or_icmp_ugt(i32 %arg, i8* %ptr) {
106 entry:
107   %0 = load i8, i8* %ptr
108   %1 = zext i8 %0 to i32
109   %mul = shl nuw nsw i32 %1, 1
110   %add0 = add nuw nsw i32 %mul, 6
111   %cmp0 = icmp ne i32 %arg, %add0
112   %add1 = add i8 %0, -1
113   %cmp1 = icmp ugt i8 %add1, 3
114   %or = or i1 %cmp0, %cmp1
115   ret i1 %or
118 ; We currently only handle truncs as sinks, so a uxt will still be needed for
119 ; the icmp ugt instruction.
120 ; CHECK-LABEL: urem_trunc_icmps
121 ; CHECK: cmp
122 ; CHECK: uxt
123 ; CHECK: cmp
124 define void @urem_trunc_icmps(i16** %in, i32* %g, i32* %k) {
125 entry:
126   %ptr = load i16*, i16** %in, align 4
127   %ld = load i16, i16* %ptr, align 2
128   %cmp.i = icmp eq i16 %ld, 0
129   br i1 %cmp.i, label %exit, label %cond.false.i
131 cond.false.i:
132   %rem = urem i16 5, %ld
133   %extract.t = trunc i16 %rem to i8
134   br label %body
136 body:
137   %cond.in.i.off0 = phi i8 [ %extract.t, %cond.false.i ], [ %add, %for.inc ]
138   %cmp = icmp ugt i8 %cond.in.i.off0, 7
139   %conv5 = zext i1 %cmp to i32
140   store i32 %conv5, i32* %g, align 4
141   %.pr = load i32, i32* %k, align 4
142   %tobool13150 = icmp eq i32 %.pr, 0
143   br i1 %tobool13150, label %for.inc, label %exit
145 for.inc:
146   %add = add nuw i8 %cond.in.i.off0, 1
147   br label %body
149 exit:
150   ret void
153 ; Check that %exp requires uxth in all cases, and will also be required to
154 ; promote %1 for the call - unless we can generate a uadd16.
155 ; CHECK-LABEL: zext_load_sink_call:
156 ; CHECK: uxt
157 ; CHECK-DSP-IMM: uadd16
158 ; CHECK: cmp
159 ; CHECK-NODSP: uxt
160 ; CHECK-DSP-IMM-NOT: uxt
161 define i32 @zext_load_sink_call(i16* %ptr, i16 %exp) {
162 entry:
163   %0 = load i16, i16* %ptr, align 4
164   %1 = add i16 %exp, 3
165   %cmp = icmp eq i16 %0, %exp
166   br i1 %cmp, label %exit, label %if.then
168 if.then:
169   %conv0 = zext i16 %0 to i32
170   %conv1 = zext i16 %1 to i32
171   %call = tail call arm_aapcs_vfpcc i32 @dummy(i32 %conv0, i32 %conv1)
172   br label %exit
174 exit:
175   %exitval = phi i32 [ %call, %if.then ], [ 0, %entry  ]
176   ret i32 %exitval
179 ; CHECK-LABEL: bitcast_i16
180 ; CHECK-NOT: uxt
181 define i16 @bitcast_i16(i16 zeroext %arg0, i16 zeroext %arg1) {
182 entry:
183   %cast = bitcast i16 12345 to i16
184   %add = add nuw i16 %arg0, 1
185   %cmp = icmp ule i16 %add, %cast
186   %res = select i1 %cmp, i16 %arg1, i16 32657
187   ret i16 %res
190 ; CHECK-LABEL: bitcast_i8
191 ; CHECK-NOT: uxt
192 define i8 @bitcast_i8(i8 zeroext %arg0, i8 zeroext %arg1) {
193 entry:
194   %cast = bitcast i8 127 to i8
195   %mul = shl nuw i8 %arg0, 1
196   %cmp = icmp uge i8 %mul, %arg1
197   %res = select i1 %cmp, i8 %cast, i8 128
198   ret i8 %res
201 ; CHECK-LABEL: bitcast_i16_minus
202 ; CHECK-NOT: uxt
203 define i16 @bitcast_i16_minus(i16 zeroext %arg0, i16 zeroext %arg1) {
204 entry:
205   %cast = bitcast i16 -12345 to i16
206   %xor = xor i16 %arg0, 7
207   %cmp = icmp eq i16 %xor, %arg1
208   %res = select i1 %cmp, i16 %cast, i16 32657
209   ret i16 %res
212 ; CHECK-LABEL: bitcast_i8_minus
213 ; CHECK-NOT: uxt
214 define i8 @bitcast_i8_minus(i8 zeroext %arg0, i8 zeroext %arg1) {
215 entry:
216   %cast = bitcast i8 -127 to i8
217   %and = and i8 %arg0, 3
218   %cmp = icmp ne i8 %and, %arg1
219   %res = select i1 %cmp, i8 %cast, i8 128
220   ret i8 %res
223 declare i32 @dummy(i32, i32)
225 @d_uch = hidden local_unnamed_addr global [16 x i8] zeroinitializer, align 1
226 @sh1 = hidden local_unnamed_addr global i16 0, align 2
227 @d_sh = hidden local_unnamed_addr global [16 x i16] zeroinitializer, align 2
229 ; CHECK-LABEL: two_stage_zext_trunc_mix
230 ; CHECK-NOT: uxt
231 define i8* @two_stage_zext_trunc_mix(i32* %this, i32 %__pos1, i32 %__n1, i32** %__str, i32 %__pos2, i32 %__n2) {
232 entry:
233   %__size_.i.i.i.i = bitcast i32** %__str to i8*
234   %0 = load i8, i8* %__size_.i.i.i.i, align 4
235   %1 = and i8 %0, 1
236   %tobool.i.i.i.i = icmp eq i8 %1, 0
237   %__size_.i5.i.i = getelementptr inbounds i32*, i32** %__str, i32 %__n1
238   %cast = bitcast i32** %__size_.i5.i.i to i32*
239   %2 = load i32, i32* %cast, align 4
240   %3 = lshr i8 %0, 1
241   %4 = zext i8 %3 to i32
242   %cond.i.i = select i1 %tobool.i.i.i.i, i32 %4, i32 %2
243   %__size_.i.i.i.i.i = bitcast i32* %this to i8*
244   %5 = load i8, i8* %__size_.i.i.i.i.i, align 4
245   %6 = and i8 %5, 1
246   %tobool.i.i.i.i.i = icmp eq i8 %6, 0
247   %7 = getelementptr inbounds i8, i8* %__size_.i.i.i.i, i32 %__pos1
248   %8 = getelementptr inbounds i8, i8* %__size_.i.i.i.i, i32 %__pos2
249   %res = select i1 %tobool.i.i.i.i.i,  i8* %7, i8* %8
250   ret i8* %res
253 ; CHECK-LABEL: search_through_zext_1
254 ; CHECK-NOT: uxt
255 define i8 @search_through_zext_1(i8 zeroext %a, i8 zeroext %b, i16 zeroext %c) {
256 entry:
257   %add = add nuw i8 %a, %b
258   %conv = zext i8 %add to i16
259   %cmp = icmp ult i16 %conv, %c
260   br i1 %cmp, label %if.then, label %if.end
262 if.then:
263   %sub = sub nuw i8 %b, %a
264   %conv2 = zext i8 %sub to i16
265   %cmp2 = icmp ugt i16 %conv2, %c
266   %res = select i1 %cmp2, i8 %a, i8 %b
267   br label %if.end
269 if.end:
270   %retval = phi i8 [ 0, %entry ], [ %res, %if.then ]
271   ret i8 %retval
274 ; TODO: We should be able to remove the uxtb here. The transform fails because
275 ; the icmp ugt uses an i32, which is too large... but this doesn't matter
276 ; because it won't be writing a large value to a register as a result.
277 ; CHECK-LABEL: search_through_zext_2
278 ; CHECK: uxtb
279 ; CHECK: uxtb
280 define i8 @search_through_zext_2(i8 zeroext %a, i8 zeroext %b, i16 zeroext %c, i32 %d) {
281 entry:
282   %add = add nuw i8 %a, %b
283   %conv = zext i8 %add to i16
284   %cmp = icmp ult i16 %conv, %c
285   br i1 %cmp, label %if.then, label %if.end
287 if.then:
288   %sub = sub nuw i8 %b, %a
289   %conv2 = zext i8 %sub to i32
290   %cmp2 = icmp ugt i32 %conv2, %d
291   %res = select i1 %cmp2, i8 %a, i8 %b
292   br label %if.end
294 if.end:
295   %retval = phi i8 [ 0, %entry ], [ %res, %if.then ]
296   ret i8 %retval
299 ; TODO: We should be able to remove the uxtb here as all the calculations are
300 ; performed on i8s. The promotion of i8 to i16 and then the later truncation
301 ; results in the uxtb.
302 ; CHECK-LABEL: search_through_zext_3
303 ; CHECK: uxtb
304 ; CHECK: uxtb
305 define i8 @search_through_zext_3(i8 zeroext %a, i8 zeroext %b, i16 zeroext %c, i32 %d) {
306 entry:
307   %add = add nuw i8 %a, %b
308   %conv = zext i8 %add to i16
309   %cmp = icmp ult i16 %conv, %c
310   br i1 %cmp, label %if.then, label %if.end
312 if.then:
313   %trunc = trunc i16 %conv to i8
314   %sub = sub nuw i8 %b, %trunc
315   %conv2 = zext i8 %sub to i32
316   %cmp2 = icmp ugt i32 %conv2, %d
317   %res = select i1 %cmp2, i8 %a, i8 %b
318   br label %if.end
320 if.end:
321   %retval = phi i8 [ 0, %entry ], [ %res, %if.then ]
322   ret i8 %retval
325 ; TODO: We should be able to remove the uxt that gets introduced for %conv2
326 ; CHECK-LABEL: search_through_zext_cmp
327 ; CHECK: uxt
328 define i8 @search_through_zext_cmp(i8 zeroext %a, i8 zeroext %b, i16 zeroext %c) {
329 entry:
330   %cmp = icmp ne i8 %a, %b
331   %conv = zext i1 %cmp to i16
332   %cmp1 = icmp ult i16 %conv, %c
333   br i1 %cmp1, label %if.then, label %if.end
335 if.then:
336   %sub = sub nuw i8 %b, %a
337   %conv2 = zext i8 %sub to i16
338   %cmp3 = icmp ugt i16 %conv2, %c
339   %res = select i1 %cmp3, i8 %a, i8 %b
340   br label %if.end
342 if.end:
343   %retval = phi i8 [ 0, %entry ], [ %res, %if.then ]
344   ret i8 %retval
347 ; CHECK-LABEL: search_through_zext_load
348 ; CHECK-NOT: uxt
349 define i8 @search_through_zext_load(i8* %a, i8 zeroext %b, i16 zeroext %c) {
350 entry:
351   %load = load i8, i8* %a
352   %conv = zext i8 %load to i16
353   %cmp1 = icmp ult i16 %conv, %c
354   br i1 %cmp1, label %if.then, label %if.end
356 if.then:
357   %sub = sub nuw i8 %b, %load
358   %conv2 = zext i8 %sub to i16
359   %cmp3 = icmp ugt i16 %conv2, %c
360   %res = select i1 %cmp3, i8 %load, i8 %b
361   br label %if.end
363 if.end:
364   %retval = phi i8 [ 0, %entry ], [ %res, %if.then ]
365   ret i8 %retval
368 ; CHECK-LABEL: trunc_sink_less_than
369 ; CHECK-NOT: uxth
370 ; CHECK: cmp
371 ; CHECK: uxtb
372 define i16 @trunc_sink_less_than_cmp(i16 zeroext %a, i16 zeroext %b, i16 zeroext %c, i8 zeroext %d) {
373 entry:
374   %sub = sub nuw i16 %b, %a
375   %cmp = icmp ult i16 %sub, %c
376   br i1 %cmp, label %if.then, label %if.end
378 if.then:
379   %trunc = trunc i16 %sub to i8
380   %add = add nuw i8 %d, 1
381   %cmp2 = icmp ugt i8 %trunc, %add
382   %res = select i1 %cmp2, i16 %a, i16 %b
383   br label %if.end
385 if.end:
386   %retval = phi i16 [ 0, %entry ], [ %res, %if.then ]
387   ret i16 %retval
390 ; TODO: We should be able to remove the uxth introduced to handle %sub
391 ; CHECK-LABEL: trunc_sink_less_than_arith
392 ; CHECK: uxth
393 ; CHECK: cmp
394 ; CHECK: uxtb
395 define i16 @trunc_sink_less_than_arith(i16 zeroext %a, i16 zeroext %b, i16 zeroext %c, i8 zeroext %d, i8 zeroext %e) {
396 entry:
397   %sub = sub nuw i16 %b, %a
398   %cmp = icmp ult i16 %sub, %c
399   br i1 %cmp, label %if.then, label %if.end
401 if.then:
402   %trunc = trunc i16 %sub to i8
403   %add = add nuw i8 %d, %trunc
404   %cmp2 = icmp ugt i8 %e, %add
405   %res = select i1 %cmp2, i16 %a, i16 %b
406   br label %if.end
408 if.end:
409   %retval = phi i16 [ 0, %entry ], [ %res, %if.then ]
410   ret i16 %retval
413 ; CHECK-LABEL: trunc_sink_less_than_store
414 ; CHECK-NOT: uxt
415 ; CHECK: cmp
416 ; CHECK-NOT: uxt
417 define i16 @trunc_sink_less_than_store(i16 zeroext %a, i16 zeroext %b, i16 zeroext %c, i8 zeroext %d, i8* %e) {
418 entry:
419   %sub = sub nuw i16 %b, %a
420   %cmp = icmp ult i16 %sub, %c
421   br i1 %cmp, label %if.then, label %if.end
423 if.then:
424   %trunc = trunc i16 %sub to i8
425   %add = add nuw i8 %d, %trunc
426   store i8 %add, i8* %e
427   br label %if.end
429 if.end:
430   %retval = phi i16 [ 0, %entry ], [ %sub, %if.then ]
431   ret i16 %retval
434 ; CHECK-LABEL: trunc_sink_less_than_ret
435 ; CHECK: uxt{{.*}}b
436 define i8 @trunc_sink_less_than_ret(i16 zeroext %a, i16 zeroext %b, i16 zeroext %c, i8 zeroext %d, i8 zeroext %e) {
437 entry:
438   %sub = sub nuw i16 %b, %a
439   %cmp = icmp ult i16 %sub, %c
440   br i1 %cmp, label %if.then, label %if.end
442 if.then:
443   %trunc = trunc i16 %sub to i8
444   %add = add nuw i8 %d, %trunc
445   br label %if.end
447 if.end:
448   %retval = phi i8 [ 0, %entry ], [ %add, %if.then ]
449   ret i8 %retval
452 ; CHECK-LABEL: trunc_sink_less_than_zext_ret
453 ; CHECK-NOT: uxth
454 ; CHECK: sub
455 ; CHECK: uxtb
456 define zeroext i8 @trunc_sink_less_than_zext_ret(i16 zeroext %a, i16 zeroext %b, i16 zeroext %c, i8 zeroext %d, i8 zeroext %e) {
457 entry:
458   %sub = sub nuw i16 %b, %a
459   %cmp = icmp ult i16 %sub, %c
460   br i1 %cmp, label %if.then, label %if.end
462 if.then:
463   %trunc = trunc i16 %sub to i8
464   %add = add nuw i8 %d, %trunc
465   br label %if.end
467 if.end:
468   %retval = phi i8 [ 0, %entry ], [ %add, %if.then ]
469   ret i8 %retval
472 ; CHECK-LABEL: bitcast_i1
473 ; CHECK-NOT: uxt
474 define i32 @bitcast_i1(i16 zeroext %a, i32 %b, i32 %c) {
475 entry:
476   %0 = bitcast i1 1 to i1
477   %1 = trunc i16 %a to i1
478   %cmp = icmp eq i1 %1, %0
479   br i1 %cmp, label %if.then, label %exit
481 if.then:
482   %conv = zext i1 %0 to i16
483   %conv1 = zext i1 %1 to i16
484   %cmp1 = icmp uge i16 %conv, %conv1
485   %select = select i1 %cmp1, i32 %b, i32 %c
486   br label %exit
488 exit:
489   %retval = phi i32 [ %select, %if.then ], [ 0, %entry ]
490   ret i32 %retval
493 ; CHECK-LABEL: search_back_through_trunc
494 ; CHECK-NOT: uxt
495 ; CHECK: cmp
496 ; CHECK: strb
497 ; CHECK: strb
498 define void @search_back_through_trunc(i8* %a, i8* %b, i8* %c, i8* %d, i16* %e) {
499 entry:
500   %0 = load i8, i8* %a, align 1
501   %conv106 = zext i8 %0 to i16
502   %shl = shl nuw i16 %conv106, 8
503   %1 = load i8, i8* %b, align 1
504   %conv108 = zext i8 %1 to i16
505   %or109 = or i16 %shl, %conv108
506   %2 = load i8, i8* %c, align 1
507   %conv119 = zext i8 %2 to i16
508   %shl120 = shl nuw i16 %conv119, 8
509   %3 = load i8, i8* %d, align 1
510   %conv122 = zext i8 %3 to i16
511   %or123 = or i16 %shl120, %conv122
512   %cmp133 = icmp eq i16 %or109, %or123
513   br i1 %cmp133, label %if.end183, label %if.else136
515 if.else136:
516   %4 = load i16, i16* %e, align 2
517   %extract.t854 = trunc i16 %4 to i8
518   %extract856 = lshr i16 %4, 8
519   %extract.t857 = trunc i16 %extract856 to i8
520   br label %if.end183
522 if.end183:
523   %w.0.off0 = phi i8 [ %extract.t854, %if.else136 ], [ %1, %entry ]
524   %w.0.off8 = phi i8 [ %extract.t857, %if.else136 ], [ %2, %entry ]
525   store i8 %w.0.off8, i8* %c, align 1
526   store i8 %w.0.off0, i8* %d, align 1
527   ret void
530 @c = common dso_local local_unnamed_addr global i16 0, align 2
531 @b = common dso_local local_unnamed_addr global i16 0, align 2
532 @f = common dso_local local_unnamed_addr global i32 0, align 4
533 @e = common dso_local local_unnamed_addr global i8 0, align 1
534 @a = common dso_local local_unnamed_addr global i8 0, align 1
535 @d = common dso_local local_unnamed_addr global i32 0, align 4
537 ; CHECK-LABEL: and_trunc
538 ; CHECK: ldrh
539 ; CHECK: sxth
540 ; CHECK: uxtb
541 define void @and_trunc_two_zext() {
542 entry:
543   %0 = load i16, i16* @c, align 2
544   %1 = load i16, i16* @b, align 2
545   %conv = sext i16 %1 to i32
546   store i32 %conv, i32* @f, align 4
547   %2 = trunc i16 %1 to i8
548   %conv1 = and i8 %2, 1
549   store i8 %conv1, i8* @e, align 1
550   %3 = load i8, i8* @a, align 1
551   %narrow = mul nuw i8 %3, %conv1
552   %mul = zext i8 %narrow to i32
553   store i32 %mul, i32* @d, align 4
554   %4 = zext i8 %narrow to i16
555   %conv5 = or i16 %0, %4
556   %tobool = icmp eq i16 %conv5, 0
557   br i1 %tobool, label %if.end, label %for.cond
559 for.cond:
560   br label %for.cond
562 if.end:
563   ret void
566 ; CHECK-LABEL: zext_urem_trunc
567 ; CHECK-NOT: uxt
568 define void @zext_urem_trunc() {
569 entry:
570   %0 = load i16, i16* @c, align 2
571   %cmp = icmp eq i16 %0, 0
572   %1 = load i8, i8* @e, align 1
573   br i1 %cmp, label %cond.end, label %cond.false
575 cond.false:
576   %rem.lhs.trunc = zext i8 %1 to i16
577   %rem7 = urem i16 %rem.lhs.trunc, %0
578   %rem.zext = trunc i16 %rem7 to i8
579   br label %cond.end
581 cond.end:
582   %cond = phi i8 [ %rem.zext, %cond.false ], [ %1, %entry ]
583   store i8 %cond, i8* @a, align 1
584   ret void
587 ; CHECK-LABEL: dont_replace_trunc_1
588 ; CHECK: sxth
589 ; CHECK: uxtb
590 ; CHECK: uxth
591 define i1 @dont_replace_trunc_1(i8* %a, i16* %b, i16* %c, i32* %d, i8* %e, i32* %f) {
592 entry:
593   %0 = load i16, i16* %c, align 2
594   %1 = load i16, i16* %b, align 2
595   %conv = sext i16 %1 to i32
596   store i32 %conv, i32* %f, align 4
597   %2 = trunc i16 %1 to i8
598   %conv1 = and i8 %2, 1
599   store i8 %conv1, i8* %e, align 1
600   %3 = load i8, i8* %a, align 1
601   %narrow = mul nuw i8 %3, %conv1
602   %mul = zext i8 %narrow to i32
603   store i32 %mul, i32* %d, align 4
604   %4 = zext i8 %narrow to i16
605   %conv5 = or i16 %0, %4
606   %tobool = icmp eq i16 %conv5, 0
607   ret i1 %tobool
610 ; CHECK-LABEL: dont_replace_trunc_2
611 ; CHECK: cmp
612 ; CHECK: uxtb
613 define i32 @dont_replace_trunc_2(i16* %a, i8* %b) {
614 entry:
615   %0 = load i16, i16* %a, align 2
616   %cmp = icmp ugt i16 %0, 8
617   %narrow = select i1 %cmp, i16 %0, i16 0
618   %cond = trunc i16 %narrow to i8
619   %1 = load i8, i8* %b, align 1
620   %or = or i8 %1, %cond
621   store i8 %or, i8* %b, align 1
622   %conv5 = zext i8 %or to i32
623   ret i32 %conv5
626 ; CHECK-LABEL: replace_trunk_with_mask
627 ; CHECK: div
628 ; CHECK: uxtb
629 define i32 @replace_trunk_with_mask(i16* %a) {
630 entry:
631   %0 = load i16, i16* %a
632   %cmp = icmp eq i16 %0, 0
633   br i1 %cmp, label %cond.end, label %cond.false
635 cond.false:
636   %1 = urem i16 535, %0
637   %.lhs.trunc = trunc i16 %1 to i8
638   %2 = udiv i8 %.lhs.trunc, 3
639   %phitmp = zext i8 %2 to i32
640   br label %cond.end
642 cond.end:
643   %cond = phi i32 [ %phitmp, %cond.false ], [ 0, %entry ]
644   ret i32 %cond
647 ; CHECK-LABEL: test_i8_sitofp
648 ; CHECK: uxtb [[UXT:r[0-9]+]], r1
649 ; CHECK: sxtb [[SXT:r[0-9]+]], r1
650 ; CHECK: vmov [[VMOV:s[0-9]+]], [[SXT]]
651 ; CHECK: vcvt.f32.s32 [[CVT:s[0-9]+]], [[VMOV]]
652 define float @test_i8_sitofp(i8* %ptr, i8 %arg) {
653 entry:
654   %0 = load i8, i8* %ptr, align 1
655    %cmp = icmp eq i8 %0, %arg
656    br i1 %cmp, label %exit, label %if.end
658 if.end:
659   %conv = sitofp i8 %arg to float
660   %div = fdiv float %conv, 2.000000e+01
661   br label %exit
663 exit:
664   %res = phi float [ 0.0, %entry ], [ %div, %if.end ]
665   ret float %res
668 ; CHECK-LABEL: test_i16_sitofp
669 ; CHECK: uxth [[UXT:r[0-9]+]], r1
670 ; CHECK: sxth [[SXT:r[0-9]+]], r1
671 ; CHECK: vmov [[VMOV:s[0-9]+]], [[SXT]]
672 ; CHECK: vcvt.f32.s32 [[CVT:s[0-9]+]], [[VMOV]]
673 define float @test_i16_sitofp(i16* %ptr, i16 %arg) {
674 entry:
675   %0 = load i16, i16* %ptr, align 1
676    %cmp = icmp eq i16 %0, %arg
677    br i1 %cmp, label %exit, label %if.end
679 if.end:
680   %conv = sitofp i16 %arg to float
681   %div = fdiv float %conv, 2.000000e+01
682   br label %exit
684 exit:
685   %res = phi float [ 0.0, %entry ], [ %div, %if.end ]
686   ret float %res