[DAGCombiner] Add target hook function to decide folding (mul (add x, c1), c2)
[llvm-project.git] / llvm / test / Transforms / AggressiveInstCombine / rotate.ll
blob0abc6c574603c2677512ef23fdd3e54a078614e0
1 ; NOTE: Assertions have been autogenerated by utils/update_test_checks.py
2 ; RUN: opt < %s -aggressive-instcombine -S | FileCheck %s
4 ; https://bugs.llvm.org/show_bug.cgi?id=34924
6 define i32 @rotl(i32 %a, i32 %b) {
7 ; CHECK-LABEL: @rotl(
8 ; CHECK-NEXT:  entry:
9 ; CHECK-NEXT:    [[CMP:%.*]] = icmp eq i32 [[B:%.*]], 0
10 ; CHECK-NEXT:    br i1 [[CMP]], label [[END:%.*]], label [[ROTBB:%.*]]
11 ; CHECK:       rotbb:
12 ; CHECK-NEXT:    br label [[END]]
13 ; CHECK:       end:
14 ; CHECK-NEXT:    [[TMP0:%.*]] = call i32 @llvm.fshl.i32(i32 [[A:%.*]], i32 [[A]], i32 [[B]])
15 ; CHECK-NEXT:    ret i32 [[TMP0]]
17 entry:
18   %cmp = icmp eq i32 %b, 0
19   br i1 %cmp, label %end, label %rotbb
21 rotbb:
22   %sub = sub i32 32, %b
23   %shr = lshr i32 %a, %sub
24   %shl = shl i32 %a, %b
25   %or = or i32 %shr, %shl
26   br label %end
28 end:
29   %cond = phi i32 [ %or, %rotbb ], [ %a, %entry ]
30   ret i32 %cond
33 define i32 @rotl_commute_phi(i32 %a, i32 %b) {
34 ; CHECK-LABEL: @rotl_commute_phi(
35 ; CHECK-NEXT:  entry:
36 ; CHECK-NEXT:    [[CMP:%.*]] = icmp eq i32 [[B:%.*]], 0
37 ; CHECK-NEXT:    br i1 [[CMP]], label [[END:%.*]], label [[ROTBB:%.*]]
38 ; CHECK:       rotbb:
39 ; CHECK-NEXT:    br label [[END]]
40 ; CHECK:       end:
41 ; CHECK-NEXT:    [[TMP0:%.*]] = call i32 @llvm.fshl.i32(i32 [[A:%.*]], i32 [[A]], i32 [[B]])
42 ; CHECK-NEXT:    ret i32 [[TMP0]]
44 entry:
45   %cmp = icmp eq i32 %b, 0
46   br i1 %cmp, label %end, label %rotbb
48 rotbb:
49   %sub = sub i32 32, %b
50   %shr = lshr i32 %a, %sub
51   %shl = shl i32 %a, %b
52   %or = or i32 %shr, %shl
53   br label %end
55 end:
56   %cond = phi i32 [ %a, %entry ], [ %or, %rotbb ]
57   ret i32 %cond
60 define i32 @rotl_commute_or(i32 %a, i32 %b) {
61 ; CHECK-LABEL: @rotl_commute_or(
62 ; CHECK-NEXT:  entry:
63 ; CHECK-NEXT:    [[CMP:%.*]] = icmp eq i32 [[B:%.*]], 0
64 ; CHECK-NEXT:    br i1 [[CMP]], label [[END:%.*]], label [[ROTBB:%.*]]
65 ; CHECK:       rotbb:
66 ; CHECK-NEXT:    br label [[END]]
67 ; CHECK:       end:
68 ; CHECK-NEXT:    [[TMP0:%.*]] = call i32 @llvm.fshl.i32(i32 [[A:%.*]], i32 [[A]], i32 [[B]])
69 ; CHECK-NEXT:    ret i32 [[TMP0]]
71 entry:
72   %cmp = icmp eq i32 %b, 0
73   br i1 %cmp, label %end, label %rotbb
75 rotbb:
76   %sub = sub i32 32, %b
77   %shr = lshr i32 %a, %sub
78   %shl = shl i32 %a, %b
79   %or = or i32 %shl, %shr
80   br label %end
82 end:
83   %cond = phi i32 [ %a, %entry ], [ %or, %rotbb ]
84   ret i32 %cond
87 ; Verify that the intrinsic is inserted into a valid position.
89 define i32 @rotl_insert_valid_location(i32 %a, i32 %b) {
90 ; CHECK-LABEL: @rotl_insert_valid_location(
91 ; CHECK-NEXT:  entry:
92 ; CHECK-NEXT:    [[CMP:%.*]] = icmp eq i32 [[B:%.*]], 0
93 ; CHECK-NEXT:    br i1 [[CMP]], label [[END:%.*]], label [[ROTBB:%.*]]
94 ; CHECK:       rotbb:
95 ; CHECK-NEXT:    br label [[END]]
96 ; CHECK:       end:
97 ; CHECK-NEXT:    [[OTHER:%.*]] = phi i32 [ 1, [[ROTBB]] ], [ 2, [[ENTRY:%.*]] ]
98 ; CHECK-NEXT:    [[TMP0:%.*]] = call i32 @llvm.fshl.i32(i32 [[A:%.*]], i32 [[A]], i32 [[B]])
99 ; CHECK-NEXT:    [[RES:%.*]] = or i32 [[TMP0]], [[OTHER]]
100 ; CHECK-NEXT:    ret i32 [[RES]]
102 entry:
103   %cmp = icmp eq i32 %b, 0
104   br i1 %cmp, label %end, label %rotbb
106 rotbb:
107   %sub = sub i32 32, %b
108   %shr = lshr i32 %a, %sub
109   %shl = shl i32 %a, %b
110   %or = or i32 %shr, %shl
111   br label %end
113 end:
114   %cond = phi i32 [ %or, %rotbb ], [ %a, %entry ]
115   %other = phi i32 [ 1, %rotbb ], [ 2, %entry ]
116   %res = or i32 %cond, %other
117   ret i32 %res
120 define i32 @rotr(i32 %a, i32 %b) {
121 ; CHECK-LABEL: @rotr(
122 ; CHECK-NEXT:  entry:
123 ; CHECK-NEXT:    [[CMP:%.*]] = icmp eq i32 [[B:%.*]], 0
124 ; CHECK-NEXT:    br i1 [[CMP]], label [[END:%.*]], label [[ROTBB:%.*]]
125 ; CHECK:       rotbb:
126 ; CHECK-NEXT:    br label [[END]]
127 ; CHECK:       end:
128 ; CHECK-NEXT:    [[TMP0:%.*]] = call i32 @llvm.fshr.i32(i32 [[A:%.*]], i32 [[A]], i32 [[B]])
129 ; CHECK-NEXT:    ret i32 [[TMP0]]
131 entry:
132   %cmp = icmp eq i32 %b, 0
133   br i1 %cmp, label %end, label %rotbb
135 rotbb:
136   %sub = sub i32 32, %b
137   %shl = shl i32 %a, %sub
138   %shr = lshr i32 %a, %b
139   %or = or i32 %shr, %shl
140   br label %end
142 end:
143   %cond = phi i32 [ %or, %rotbb ], [ %a, %entry ]
144   ret i32 %cond
147 define i32 @rotr_commute_phi(i32 %a, i32 %b) {
148 ; CHECK-LABEL: @rotr_commute_phi(
149 ; CHECK-NEXT:  entry:
150 ; CHECK-NEXT:    [[CMP:%.*]] = icmp eq i32 [[B:%.*]], 0
151 ; CHECK-NEXT:    br i1 [[CMP]], label [[END:%.*]], label [[ROTBB:%.*]]
152 ; CHECK:       rotbb:
153 ; CHECK-NEXT:    br label [[END]]
154 ; CHECK:       end:
155 ; CHECK-NEXT:    [[TMP0:%.*]] = call i32 @llvm.fshr.i32(i32 [[A:%.*]], i32 [[A]], i32 [[B]])
156 ; CHECK-NEXT:    ret i32 [[TMP0]]
158 entry:
159   %cmp = icmp eq i32 %b, 0
160   br i1 %cmp, label %end, label %rotbb
162 rotbb:
163   %sub = sub i32 32, %b
164   %shl = shl i32 %a, %sub
165   %shr = lshr i32 %a, %b
166   %or = or i32 %shr, %shl
167   br label %end
169 end:
170   %cond = phi i32 [ %a, %entry ], [ %or, %rotbb ]
171   ret i32 %cond
174 define i32 @rotr_commute_or(i32 %a, i32 %b) {
175 ; CHECK-LABEL: @rotr_commute_or(
176 ; CHECK-NEXT:  entry:
177 ; CHECK-NEXT:    [[CMP:%.*]] = icmp eq i32 [[B:%.*]], 0
178 ; CHECK-NEXT:    br i1 [[CMP]], label [[END:%.*]], label [[ROTBB:%.*]]
179 ; CHECK:       rotbb:
180 ; CHECK-NEXT:    br label [[END]]
181 ; CHECK:       end:
182 ; CHECK-NEXT:    [[TMP0:%.*]] = call i32 @llvm.fshr.i32(i32 [[A:%.*]], i32 [[A]], i32 [[B]])
183 ; CHECK-NEXT:    ret i32 [[TMP0]]
185 entry:
186   %cmp = icmp eq i32 %b, 0
187   br i1 %cmp, label %end, label %rotbb
189 rotbb:
190   %sub = sub i32 32, %b
191   %shl = shl i32 %a, %sub
192   %shr = lshr i32 %a, %b
193   %or = or i32 %shl, %shr
194   br label %end
196 end:
197   %cond = phi i32 [ %a, %entry ], [ %or, %rotbb ]
198   ret i32 %cond
201 ; Negative test - non-power-of-2 might require urem expansion in the backend.
203 define i12 @could_be_rotr_weird_type(i12 %a, i12 %b) {
204 ; CHECK-LABEL: @could_be_rotr_weird_type(
205 ; CHECK-NEXT:  entry:
206 ; CHECK-NEXT:    [[CMP:%.*]] = icmp eq i12 [[B:%.*]], 0
207 ; CHECK-NEXT:    br i1 [[CMP]], label [[END:%.*]], label [[ROTBB:%.*]]
208 ; CHECK:       rotbb:
209 ; CHECK-NEXT:    [[SUB:%.*]] = sub i12 12, [[B]]
210 ; CHECK-NEXT:    [[SHL:%.*]] = shl i12 [[A:%.*]], [[SUB]]
211 ; CHECK-NEXT:    [[SHR:%.*]] = lshr i12 [[A]], [[B]]
212 ; CHECK-NEXT:    [[OR:%.*]] = or i12 [[SHL]], [[SHR]]
213 ; CHECK-NEXT:    br label [[END]]
214 ; CHECK:       end:
215 ; CHECK-NEXT:    [[COND:%.*]] = phi i12 [ [[A]], [[ENTRY:%.*]] ], [ [[OR]], [[ROTBB]] ]
216 ; CHECK-NEXT:    ret i12 [[COND]]
218 entry:
219   %cmp = icmp eq i12 %b, 0
220   br i1 %cmp, label %end, label %rotbb
222 rotbb:
223   %sub = sub i12 12, %b
224   %shl = shl i12 %a, %sub
225   %shr = lshr i12 %a, %b
226   %or = or i12 %shl, %shr
227   br label %end
229 end:
230   %cond = phi i12 [ %a, %entry ], [ %or, %rotbb ]
231   ret i12 %cond
234 ; Negative test - wrong phi ops.
236 define i32 @not_rotr_1(i32 %a, i32 %b) {
237 ; CHECK-LABEL: @not_rotr_1(
238 ; CHECK-NEXT:  entry:
239 ; CHECK-NEXT:    [[CMP:%.*]] = icmp eq i32 [[B:%.*]], 0
240 ; CHECK-NEXT:    br i1 [[CMP]], label [[END:%.*]], label [[ROTBB:%.*]]
241 ; CHECK:       rotbb:
242 ; CHECK-NEXT:    [[SUB:%.*]] = sub i32 32, [[B]]
243 ; CHECK-NEXT:    [[SHL:%.*]] = shl i32 [[A:%.*]], [[SUB]]
244 ; CHECK-NEXT:    [[SHR:%.*]] = lshr i32 [[A]], [[B]]
245 ; CHECK-NEXT:    [[OR:%.*]] = or i32 [[SHL]], [[SHR]]
246 ; CHECK-NEXT:    br label [[END]]
247 ; CHECK:       end:
248 ; CHECK-NEXT:    [[COND:%.*]] = phi i32 [ [[B]], [[ENTRY:%.*]] ], [ [[OR]], [[ROTBB]] ]
249 ; CHECK-NEXT:    ret i32 [[COND]]
251 entry:
252   %cmp = icmp eq i32 %b, 0
253   br i1 %cmp, label %end, label %rotbb
255 rotbb:
256   %sub = sub i32 32, %b
257   %shl = shl i32 %a, %sub
258   %shr = lshr i32 %a, %b
259   %or = or i32 %shl, %shr
260   br label %end
262 end:
263   %cond = phi i32 [ %b, %entry ], [ %or, %rotbb ]
264   ret i32 %cond
267 ; Negative test - too many phi ops.
269 define i32 @not_rotr_2(i32 %a, i32 %b, i32 %c) {
270 ; CHECK-LABEL: @not_rotr_2(
271 ; CHECK-NEXT:  entry:
272 ; CHECK-NEXT:    [[CMP:%.*]] = icmp eq i32 [[B:%.*]], 0
273 ; CHECK-NEXT:    br i1 [[CMP]], label [[END:%.*]], label [[ROTBB:%.*]]
274 ; CHECK:       rotbb:
275 ; CHECK-NEXT:    [[SUB:%.*]] = sub i32 32, [[B]]
276 ; CHECK-NEXT:    [[SHL:%.*]] = shl i32 [[A:%.*]], [[SUB]]
277 ; CHECK-NEXT:    [[SHR:%.*]] = lshr i32 [[A]], [[B]]
278 ; CHECK-NEXT:    [[OR:%.*]] = or i32 [[SHL]], [[SHR]]
279 ; CHECK-NEXT:    [[CMP42:%.*]] = icmp ugt i32 [[OR]], 42
280 ; CHECK-NEXT:    br i1 [[CMP42]], label [[END]], label [[BOGUS:%.*]]
281 ; CHECK:       bogus:
282 ; CHECK-NEXT:    br label [[END]]
283 ; CHECK:       end:
284 ; CHECK-NEXT:    [[COND:%.*]] = phi i32 [ [[A]], [[ENTRY:%.*]] ], [ [[OR]], [[ROTBB]] ], [ [[C:%.*]], [[BOGUS]] ]
285 ; CHECK-NEXT:    ret i32 [[COND]]
287 entry:
288   %cmp = icmp eq i32 %b, 0
289   br i1 %cmp, label %end, label %rotbb
291 rotbb:
292   %sub = sub i32 32, %b
293   %shl = shl i32 %a, %sub
294   %shr = lshr i32 %a, %b
295   %or = or i32 %shl, %shr
296   %cmp42 = icmp ugt i32 %or, 42
297   br i1 %cmp42, label %end, label %bogus
299 bogus:
300   br label %end
302 end:
303   %cond = phi i32 [ %a, %entry ], [ %or, %rotbb ], [ %c, %bogus ]
304   ret i32 %cond
307 ; Negative test - wrong cmp (but this should match?).
309 define i32 @not_rotr_3(i32 %a, i32 %b) {
310 ; CHECK-LABEL: @not_rotr_3(
311 ; CHECK-NEXT:  entry:
312 ; CHECK-NEXT:    [[CMP:%.*]] = icmp sle i32 [[B:%.*]], 0
313 ; CHECK-NEXT:    br i1 [[CMP]], label [[END:%.*]], label [[ROTBB:%.*]]
314 ; CHECK:       rotbb:
315 ; CHECK-NEXT:    [[SUB:%.*]] = sub i32 32, [[B]]
316 ; CHECK-NEXT:    [[SHL:%.*]] = shl i32 [[A:%.*]], [[SUB]]
317 ; CHECK-NEXT:    [[SHR:%.*]] = lshr i32 [[A]], [[B]]
318 ; CHECK-NEXT:    [[OR:%.*]] = or i32 [[SHL]], [[SHR]]
319 ; CHECK-NEXT:    br label [[END]]
320 ; CHECK:       end:
321 ; CHECK-NEXT:    [[COND:%.*]] = phi i32 [ [[A]], [[ENTRY:%.*]] ], [ [[OR]], [[ROTBB]] ]
322 ; CHECK-NEXT:    ret i32 [[COND]]
324 entry:
325   %cmp = icmp sle i32 %b, 0
326   br i1 %cmp, label %end, label %rotbb
328 rotbb:
329   %sub = sub i32 32, %b
330   %shl = shl i32 %a, %sub
331   %shr = lshr i32 %a, %b
332   %or = or i32 %shl, %shr
333   br label %end
335 end:
336   %cond = phi i32 [ %a, %entry ], [ %or, %rotbb ]
337   ret i32 %cond
340 ; Negative test - wrong shift.
342 define i32 @not_rotr_4(i32 %a, i32 %b) {
343 ; CHECK-LABEL: @not_rotr_4(
344 ; CHECK-NEXT:  entry:
345 ; CHECK-NEXT:    [[CMP:%.*]] = icmp eq i32 [[B:%.*]], 0
346 ; CHECK-NEXT:    br i1 [[CMP]], label [[END:%.*]], label [[ROTBB:%.*]]
347 ; CHECK:       rotbb:
348 ; CHECK-NEXT:    [[SUB:%.*]] = sub i32 32, [[B]]
349 ; CHECK-NEXT:    [[SHL:%.*]] = shl i32 [[A:%.*]], [[SUB]]
350 ; CHECK-NEXT:    [[SHR:%.*]] = ashr i32 [[A]], [[B]]
351 ; CHECK-NEXT:    [[OR:%.*]] = or i32 [[SHL]], [[SHR]]
352 ; CHECK-NEXT:    br label [[END]]
353 ; CHECK:       end:
354 ; CHECK-NEXT:    [[COND:%.*]] = phi i32 [ [[A]], [[ENTRY:%.*]] ], [ [[OR]], [[ROTBB]] ]
355 ; CHECK-NEXT:    ret i32 [[COND]]
357 entry:
358   %cmp = icmp eq i32 %b, 0
359   br i1 %cmp, label %end, label %rotbb
361 rotbb:
362   %sub = sub i32 32, %b
363   %shl = shl i32 %a, %sub
364   %shr = ashr i32 %a, %b
365   %or = or i32 %shl, %shr
366   br label %end
368 end:
369   %cond = phi i32 [ %a, %entry ], [ %or, %rotbb ]
370   ret i32 %cond
373 ; Negative test - wrong shift for rotate (but can be folded to a generic funnel shift).
375 define i32 @not_rotr_5(i32 %a, i32 %b) {
376 ; CHECK-LABEL: @not_rotr_5(
377 ; CHECK-NEXT:  entry:
378 ; CHECK-NEXT:    [[CMP:%.*]] = icmp eq i32 [[B:%.*]], 0
379 ; CHECK-NEXT:    br i1 [[CMP]], label [[END:%.*]], label [[ROTBB:%.*]]
380 ; CHECK:       rotbb:
381 ; CHECK-NEXT:    br label [[END]]
382 ; CHECK:       end:
383 ; CHECK-NEXT:    [[TMP0:%.*]] = freeze i32 [[B]]
384 ; CHECK-NEXT:    [[TMP1:%.*]] = call i32 @llvm.fshr.i32(i32 [[TMP0]], i32 [[A:%.*]], i32 [[B]])
385 ; CHECK-NEXT:    ret i32 [[TMP1]]
387 entry:
388   %cmp = icmp eq i32 %b, 0
389   br i1 %cmp, label %end, label %rotbb
391 rotbb:
392   %sub = sub i32 32, %b
393   %shl = shl i32 %b, %sub
394   %shr = lshr i32 %a, %b
395   %or = or i32 %shl, %shr
396   br label %end
398 end:
399   %cond = phi i32 [ %a, %entry ], [ %or, %rotbb ]
400   ret i32 %cond
403 ; Negative test - wrong sub.
405 define i32 @not_rotr_6(i32 %a, i32 %b) {
406 ; CHECK-LABEL: @not_rotr_6(
407 ; CHECK-NEXT:  entry:
408 ; CHECK-NEXT:    [[CMP:%.*]] = icmp eq i32 [[B:%.*]], 0
409 ; CHECK-NEXT:    br i1 [[CMP]], label [[END:%.*]], label [[ROTBB:%.*]]
410 ; CHECK:       rotbb:
411 ; CHECK-NEXT:    [[SUB:%.*]] = sub i32 8, [[B]]
412 ; CHECK-NEXT:    [[SHL:%.*]] = shl i32 [[A:%.*]], [[SUB]]
413 ; CHECK-NEXT:    [[SHR:%.*]] = lshr i32 [[A]], [[B]]
414 ; CHECK-NEXT:    [[OR:%.*]] = or i32 [[SHL]], [[SHR]]
415 ; CHECK-NEXT:    br label [[END]]
416 ; CHECK:       end:
417 ; CHECK-NEXT:    [[COND:%.*]] = phi i32 [ [[A]], [[ENTRY:%.*]] ], [ [[OR]], [[ROTBB]] ]
418 ; CHECK-NEXT:    ret i32 [[COND]]
420 entry:
421   %cmp = icmp eq i32 %b, 0
422   br i1 %cmp, label %end, label %rotbb
424 rotbb:
425   %sub = sub i32 8, %b
426   %shl = shl i32 %a, %sub
427   %shr = lshr i32 %a, %b
428   %or = or i32 %shl, %shr
429   br label %end
431 end:
432   %cond = phi i32 [ %a, %entry ], [ %or, %rotbb ]
433   ret i32 %cond
436 ; Negative test - extra use. Technically, we could transform this
437 ; because it doesn't increase the instruction count, but we're
438 ; being cautious not to cause a potential perf pessimization for
439 ; targets that do not have a rotate instruction.
441 define i32 @could_be_rotr(i32 %a, i32 %b, i32* %p) {
442 ; CHECK-LABEL: @could_be_rotr(
443 ; CHECK-NEXT:  entry:
444 ; CHECK-NEXT:    [[CMP:%.*]] = icmp eq i32 [[B:%.*]], 0
445 ; CHECK-NEXT:    br i1 [[CMP]], label [[END:%.*]], label [[ROTBB:%.*]]
446 ; CHECK:       rotbb:
447 ; CHECK-NEXT:    [[SUB:%.*]] = sub i32 32, [[B]]
448 ; CHECK-NEXT:    [[SHL:%.*]] = shl i32 [[A:%.*]], [[SUB]]
449 ; CHECK-NEXT:    [[SHR:%.*]] = lshr i32 [[A]], [[B]]
450 ; CHECK-NEXT:    [[OR:%.*]] = or i32 [[SHL]], [[SHR]]
451 ; CHECK-NEXT:    store i32 [[OR]], i32* [[P:%.*]], align 4
452 ; CHECK-NEXT:    br label [[END]]
453 ; CHECK:       end:
454 ; CHECK-NEXT:    [[COND:%.*]] = phi i32 [ [[A]], [[ENTRY:%.*]] ], [ [[OR]], [[ROTBB]] ]
455 ; CHECK-NEXT:    ret i32 [[COND]]
457 entry:
458   %cmp = icmp eq i32 %b, 0
459   br i1 %cmp, label %end, label %rotbb
461 rotbb:
462   %sub = sub i32 32, %b
463   %shl = shl i32 %a, %sub
464   %shr = lshr i32 %a, %b
465   %or = or i32 %shl, %shr
466   store i32 %or, i32* %p
467   br label %end
469 end:
470   %cond = phi i32 [ %a, %entry ], [ %or, %rotbb ]
471   ret i32 %cond