[DAGCombiner] Add target hook function to decide folding (mul (add x, c1), c2)
[llvm-project.git] / llvm / test / Transforms / Coroutines / coro-retcon-resume-values.ll
blob1981f75ed5460deedd8c1db37a17005bd3ae2452
1 ; NOTE: Assertions have been autogenerated by utils/update_test_checks.py
2 ; RUN: opt < %s -enable-coroutines -passes='default<O2>' -aa-pipeline=default -S | FileCheck %s
4 define i8* @f(i8* %buffer, i32 %n) {
5 ; CHECK-LABEL: @f(
6 ; CHECK-NEXT:  coro.return:
7 ; CHECK-NEXT:    [[TMP0:%.*]] = tail call i8* @allocate(i32 12)
8 ; CHECK-NEXT:    [[TMP1:%.*]] = bitcast i8* [[BUFFER:%.*]] to i8**
9 ; CHECK-NEXT:    store i8* [[TMP0]], i8** [[TMP1]], align 8
10 ; CHECK-NEXT:    [[N_SPILL_ADDR:%.*]] = bitcast i8* [[TMP0]] to i32*
11 ; CHECK-NEXT:    store i32 [[N:%.*]], i32* [[N_SPILL_ADDR]], align 4
12 ; CHECK-NEXT:    ret i8* bitcast (i8* (i8*, i32, i1)* @f.resume.0 to i8*)
14 entry:
15   %id = call token @llvm.coro.id.retcon(i32 8, i32 4, i8* %buffer, i8* bitcast (i8* (i8*, i32, i1)* @prototype to i8*), i8* bitcast (i8* (i32)* @allocate to i8*), i8* bitcast (void (i8*)* @deallocate to i8*))
16   %hdl = call i8* @llvm.coro.begin(token %id, i8* null)
17   br label %loop
19 loop:
20   %n.val = phi i32 [ %n, %entry ], [ %sum, %resume ]
21   %values = call { i32, i1 } (...) @llvm.coro.suspend.retcon.sl_i32i1s()
22   %finished = extractvalue { i32, i1 } %values, 1
23   br i1 %finished, label %cleanup, label %resume
25 resume:
26   %input = extractvalue { i32, i1 } %values, 0
27   %sum = add i32 %n.val, %input
28   br label %loop
30 cleanup:
31   call void @print(i32 %n.val)
32   call i1 @llvm.coro.end(i8* %hdl, i1 0)
33   unreachable
38 define i32 @main() {
39 ; CHECK-LABEL: @main(
40 ; CHECK-NEXT:  entry:
41 ; CHECK-NEXT:    [[TMP0:%.*]] = alloca i8*, align 8
42 ; CHECK-NEXT:    [[DOTSUB:%.*]] = bitcast i8** [[TMP0]] to i8*
43 ; CHECK-NEXT:    [[TMP1:%.*]] = tail call i8* @allocate(i32 12)
44 ; CHECK-NEXT:    store i8* [[TMP1]], i8** [[TMP0]], align 8
45 ; CHECK-NEXT:    [[N_SPILL_ADDR_I:%.*]] = bitcast i8* [[TMP1]] to i32*
46 ; CHECK-NEXT:    store i32 1, i32* [[N_SPILL_ADDR_I]], align 4
47 ; CHECK-NEXT:    call void @llvm.experimental.noalias.scope.decl(metadata [[META0:![0-9]+]])
48 ; CHECK-NEXT:    [[TMP2:%.*]] = bitcast i8** [[TMP0]] to %f.Frame**
49 ; CHECK-NEXT:    [[FRAMEPTR_I:%.*]] = load %f.Frame*, %f.Frame** [[TMP2]], align 8, !alias.scope !0
50 ; CHECK-NEXT:    [[N_RELOAD_ADDR9_I:%.*]] = getelementptr inbounds [[F_FRAME:%.*]], %f.Frame* [[FRAMEPTR_I]], i64 0, i32 0
51 ; CHECK-NEXT:    [[N_RELOAD10_I:%.*]] = load i32, i32* [[N_RELOAD_ADDR9_I]], align 4, !noalias !0
52 ; CHECK-NEXT:    [[N_VAL3_SPILL_ADDR_I:%.*]] = getelementptr inbounds [[F_FRAME]], %f.Frame* [[FRAMEPTR_I]], i64 0, i32 1
53 ; CHECK-NEXT:    store i32 [[N_RELOAD10_I]], i32* [[N_VAL3_SPILL_ADDR_I]], align 4, !noalias !0
54 ; CHECK-NEXT:    [[INPUT_SPILL_ADDR_I:%.*]] = getelementptr inbounds [[F_FRAME]], %f.Frame* [[FRAMEPTR_I]], i64 0, i32 2
55 ; CHECK-NEXT:    store i32 2, i32* [[INPUT_SPILL_ADDR_I]], align 4, !noalias !0
56 ; CHECK-NEXT:    call void @llvm.experimental.noalias.scope.decl(metadata [[META3:![0-9]+]])
57 ; CHECK-NEXT:    [[FRAMEPTR_I1:%.*]] = load %f.Frame*, %f.Frame** [[TMP2]], align 8, !alias.scope !3
58 ; CHECK-NEXT:    [[INPUT_RELOAD_ADDR_I:%.*]] = getelementptr inbounds [[F_FRAME]], %f.Frame* [[FRAMEPTR_I1]], i64 0, i32 2
59 ; CHECK-NEXT:    [[INPUT_RELOAD_I:%.*]] = load i32, i32* [[INPUT_RELOAD_ADDR_I]], align 4, !noalias !3
60 ; CHECK-NEXT:    [[N_VAL3_RELOAD_ADDR_I:%.*]] = getelementptr inbounds [[F_FRAME]], %f.Frame* [[FRAMEPTR_I1]], i64 0, i32 1
61 ; CHECK-NEXT:    [[N_VAL3_RELOAD_I:%.*]] = load i32, i32* [[N_VAL3_RELOAD_ADDR_I]], align 4, !noalias !3
62 ; CHECK-NEXT:    [[SUM8_I:%.*]] = add i32 [[N_VAL3_RELOAD_I]], [[INPUT_RELOAD_I]]
63 ; CHECK-NEXT:    store i32 [[SUM8_I]], i32* [[N_VAL3_RELOAD_ADDR_I]], align 4, !noalias !3
64 ; CHECK-NEXT:    store i32 4, i32* [[INPUT_RELOAD_ADDR_I]], align 4, !noalias !3
65 ; CHECK-NEXT:    call void @llvm.experimental.noalias.scope.decl(metadata [[META6:![0-9]+]])
66 ; CHECK-NEXT:    [[FRAMEPTR_I4:%.*]] = load %f.Frame*, %f.Frame** [[TMP2]], align 8, !alias.scope !6
67 ; CHECK-NEXT:    [[INPUT_RELOAD_ADDR13_I:%.*]] = getelementptr inbounds [[F_FRAME]], %f.Frame* [[FRAMEPTR_I4]], i64 0, i32 2
68 ; CHECK-NEXT:    [[INPUT_RELOAD14_I:%.*]] = load i32, i32* [[INPUT_RELOAD_ADDR13_I]], align 4, !noalias !6
69 ; CHECK-NEXT:    [[N_VAL3_RELOAD_ADDR11_I:%.*]] = getelementptr inbounds [[F_FRAME]], %f.Frame* [[FRAMEPTR_I4]], i64 0, i32 1
70 ; CHECK-NEXT:    [[N_VAL3_RELOAD12_I:%.*]] = load i32, i32* [[N_VAL3_RELOAD_ADDR11_I]], align 4, !noalias !6
71 ; CHECK-NEXT:    [[SUM7_I:%.*]] = add i32 [[N_VAL3_RELOAD12_I]], [[INPUT_RELOAD14_I]]
72 ; CHECK-NEXT:    call void @print(i32 [[SUM7_I]]), !noalias !6
73 ; CHECK-NEXT:    [[TMP3:%.*]] = bitcast %f.Frame* [[FRAMEPTR_I4]] to i8*
74 ; CHECK-NEXT:    call void @deallocate(i8* [[TMP3]]), !noalias !6
75 ; CHECK-NEXT:    ret i32 0
77 entry:
78   %0 = alloca [8 x i8], align 4
79   %buffer = bitcast [8 x i8]* %0 to i8*
80   %prepare = call i8* @llvm.coro.prepare.retcon(i8* bitcast (i8* (i8*, i32)* @f to i8*))
81   %f = bitcast i8* %prepare to i8* (i8*, i32)*
82   %cont0 = call i8* %f(i8* %buffer, i32 1)
83   %cont0.cast = bitcast i8* %cont0 to i8* (i8*, i32, i1)*
84   %cont1 = call i8* %cont0.cast(i8* %buffer, i32 2, i1 zeroext false)
85   %cont1.cast = bitcast i8* %cont1 to i8* (i8*, i32, i1)*
86   %cont2 = call i8* %cont1.cast(i8* %buffer, i32 4, i1 zeroext false)
87   %cont2.cast = bitcast i8* %cont2 to i8* (i8*, i32, i1)*
88   call i8* %cont2.cast(i8* %buffer, i32 100, i1 zeroext true)
89   ret i32 0
92 ;   Unfortunately, we don't seem to fully optimize this right now due
93 ;   to some sort of phase-ordering thing.
95 declare token @llvm.coro.id.retcon(i32, i32, i8*, i8*, i8*, i8*)
96 declare i8* @llvm.coro.begin(token, i8*)
97 declare { i32, i1 } @llvm.coro.suspend.retcon.sl_i32i1s(...)
98 declare i1 @llvm.coro.end(i8*, i1)
99 declare i8* @llvm.coro.prepare.retcon(i8*)
101 declare i8* @prototype(i8*, i32, i1 zeroext)
103 declare noalias i8* @allocate(i32 %size)
104 declare void @deallocate(i8* %ptr)
106 declare void @print(i32)