1 ; RUN: opt -S -loop-fusion < %s | FileCheck %s
3 @A = common global [1024 x i32] zeroinitializer, align 16
4 @B = common global [1024 x i32] zeroinitializer, align 16
5 @C = common global [1024 x i32] zeroinitializer, align 16
6 @D = common global [1024 x i32] zeroinitializer, align 16
8 ; CHECK: void @dep_free
10 ; CHECK-NEXT: br label %[[LOOP1HEADER:bb[0-9]+]]
11 ; CHECK: [[LOOP1HEADER]]
12 ; CHECK: br label %[[LOOP2BODY:bb[0-9]+]]
13 ; CHECK: [[LOOP2BODY]]
14 ; CHECK: br label %[[LOOP3BODY:bb[0-9]+]]
15 ; CHECK: [[LOOP3BODY]]
16 ; CHECK: br label %[[LOOP4BODY:bb[0-9]+]]
17 ; CHECK: [[LOOP4BODY]]
18 ; CHECK: br label %[[LOOP1LATCH:bb[0-9]+]]
19 ; CHECK: [[LOOP1LATCH]]
20 ; CHECK: br i1 %{{.*}}, label %[[LOOP1HEADER]], label %[[LOOPEXIT:bb[0-9]+]]
22 define void @dep_free() {
26 bb25.preheader: ; preds = %bb22
29 bb15: ; preds = %bb, %bb22
30 %.08 = phi i32 [ 0, %bb ], [ %tmp23, %bb22 ]
31 %indvars.iv107 = phi i64 [ 0, %bb ], [ %indvars.iv.next11, %bb22 ]
32 %tmp = add nsw i32 %.08, -3
33 %tmp16 = add nuw nsw i64 %indvars.iv107, 3
34 %tmp17 = trunc i64 %tmp16 to i32
35 %tmp18 = mul nsw i32 %tmp, %tmp17
36 %tmp19 = trunc i64 %indvars.iv107 to i32
37 %tmp20 = srem i32 %tmp18, %tmp19
38 %tmp21 = getelementptr inbounds [1024 x i32], [1024 x i32]* @A, i64 0, i64 %indvars.iv107
39 store i32 %tmp20, i32* %tmp21, align 4
43 %indvars.iv.next11 = add nuw nsw i64 %indvars.iv107, 1
44 %tmp23 = add nuw nsw i32 %.08, 1
45 %exitcond12 = icmp ne i64 %indvars.iv.next11, 100
46 br i1 %exitcond12, label %bb15, label %bb25.preheader
48 bb38.preheader: ; preds = %bb35
51 bb27: ; preds = %bb25.preheader, %bb35
52 %.016 = phi i32 [ 0, %bb25.preheader ], [ %tmp36, %bb35 ]
53 %indvars.iv75 = phi i64 [ 0, %bb25.preheader ], [ %indvars.iv.next8, %bb35 ]
54 %tmp28 = add nsw i32 %.016, -3
55 %tmp29 = add nuw nsw i64 %indvars.iv75, 3
56 %tmp30 = trunc i64 %tmp29 to i32
57 %tmp31 = mul nsw i32 %tmp28, %tmp30
58 %tmp32 = trunc i64 %indvars.iv75 to i32
59 %tmp33 = srem i32 %tmp31, %tmp32
60 %tmp34 = getelementptr inbounds [1024 x i32], [1024 x i32]* @B, i64 0, i64 %indvars.iv75
61 store i32 %tmp33, i32* %tmp34, align 4
65 %indvars.iv.next8 = add nuw nsw i64 %indvars.iv75, 1
66 %tmp36 = add nuw nsw i32 %.016, 1
67 %exitcond9 = icmp ne i64 %indvars.iv.next8, 100
68 br i1 %exitcond9, label %bb27, label %bb38.preheader
70 bb51.preheader: ; preds = %bb48
73 bb40: ; preds = %bb38.preheader, %bb48
74 %.024 = phi i32 [ 0, %bb38.preheader ], [ %tmp49, %bb48 ]
75 %indvars.iv43 = phi i64 [ 0, %bb38.preheader ], [ %indvars.iv.next5, %bb48 ]
76 %tmp41 = add nsw i32 %.024, -3
77 %tmp42 = add nuw nsw i64 %indvars.iv43, 3
78 %tmp43 = trunc i64 %tmp42 to i32
79 %tmp44 = mul nsw i32 %tmp41, %tmp43
80 %tmp45 = trunc i64 %indvars.iv43 to i32
81 %tmp46 = srem i32 %tmp44, %tmp45
82 %tmp47 = getelementptr inbounds [1024 x i32], [1024 x i32]* @C, i64 0, i64 %indvars.iv43
83 store i32 %tmp46, i32* %tmp47, align 4
87 %indvars.iv.next5 = add nuw nsw i64 %indvars.iv43, 1
88 %tmp49 = add nuw nsw i32 %.024, 1
89 %exitcond6 = icmp ne i64 %indvars.iv.next5, 100
90 br i1 %exitcond6, label %bb40, label %bb51.preheader
95 bb53: ; preds = %bb51.preheader, %bb61
96 %.032 = phi i32 [ 0, %bb51.preheader ], [ %tmp62, %bb61 ]
97 %indvars.iv1 = phi i64 [ 0, %bb51.preheader ], [ %indvars.iv.next, %bb61 ]
98 %tmp54 = add nsw i32 %.032, -3
99 %tmp55 = add nuw nsw i64 %indvars.iv1, 3
100 %tmp56 = trunc i64 %tmp55 to i32
101 %tmp57 = mul nsw i32 %tmp54, %tmp56
102 %tmp58 = trunc i64 %indvars.iv1 to i32
103 %tmp59 = srem i32 %tmp57, %tmp58
104 %tmp60 = getelementptr inbounds [1024 x i32], [1024 x i32]* @D, i64 0, i64 %indvars.iv1
105 store i32 %tmp59, i32* %tmp60, align 4
108 bb61: ; preds = %bb53
109 %indvars.iv.next = add nuw nsw i64 %indvars.iv1, 1
110 %tmp62 = add nuw nsw i32 %.032, 1
111 %exitcond = icmp ne i64 %indvars.iv.next, 100
112 br i1 %exitcond, label %bb53, label %bb52
114 bb63: ; preds = %bb52