test/Transforms/LoopFusion/four_loops.ll

   1 ; RUN: opt -S -loop-fusion < %s | FileCheck %s
   2
   3 @A = common global [1024 x i32] zeroinitializer, align 16
   4 @B = common global [1024 x i32] zeroinitializer, align 16
   5 @C = common global [1024 x i32] zeroinitializer, align 16
   6 @D = common global [1024 x i32] zeroinitializer, align 16
   7
   8 ; CHECK: void @dep_free
   9 ; CHECK-NEXT: bb:
  10 ; CHECK-NEXT: br label %[[LOOP1HEADER:bb[0-9]+]]
  11 ; CHECK: [[LOOP1HEADER]]
  12 ; CHECK: br i1 %exitcond12, label %[[LOOP1BODY:bb[0-9]+]], label %[[LOOP2PREHEADER:bb[0-9]+]]
  13 ; CHECK: [[LOOP1BODY]]
  14 ; CHECK: br label %[[LOOP1LATCH:bb[0-9]+]]
  15 ; CHECK: [[LOOP1LATCH]]
  16 ; CHECK: br label %[[LOOP2PREHEADER]]
  17 ; CHECK: [[LOOP2PREHEADER]]
  18 ; CHECK: br i1 %exitcond9, label %[[LOOP2HEADER:bb[0-9]+]], label %[[LOOP3PREHEADER:bb[0-9]+]]
  19 ; CHECK: [[LOOP2HEADER]]
  20 ; CHECK: br label %[[LOOP2LATCH:bb[0-9]+]]
  21 ; CHECK: [[LOOP2LATCH]]
  22 ; CHECK: br label %[[LOOP3PREHEADER]]
  23 ; CHECK: [[LOOP3PREHEADER]]
  24 ; CHECK: br i1 %exitcond6, label %[[LOOP3HEADER:bb[0-9]+]], label %[[LOOP4PREHEADER:bb[0-9]+]]
  25 ; CHECK: [[LOOP3HEADER]]
  26 ; CHECK: br label %[[LOOP3LATCH:bb[0-9]+]]
  27 ; CHECK: [[LOOP3LATCH]]
  28 ; CHECK: br label %[[LOOP4PREHEADER]]
  29 ; CHECK: [[LOOP4PREHEADER]]
  30 ; CHECK: br i1 %exitcond, label %[[LOOP4HEADER:bb[0-9]+]], label %[[LOOP4EXIT:bb[0-9]+]]
  31 ; CHECK: [[LOOP4EXIT]]
  32 ; CHECK: br label %[[FUNCEXIT:bb[0-9]+]]
  33 ; CHECK: [[LOOP4HEADER]]
  34 ; CHECK: br label %[[LOOP4LATCH:bb[0-9]+]]
  35 ; CHECK: [[LOOP4LATCH]]
  36 ; CHECK: br label %[[LOOP1HEADER]]
  37 ; CHECK: [[FUNCEXIT]]
  38 ; CHECK: ret void
  39 define void @dep_free() {
  40 bb:
  41   br label %bb13
  42
  43 bb13:                                             ; preds = %bb22, %bb
  44   %indvars.iv10 = phi i64 [ %indvars.iv.next11, %bb22 ], [ 0, %bb ]
  45   %.0 = phi i32 [ 0, %bb ], [ %tmp23, %bb22 ]
  46   %exitcond12 = icmp ne i64 %indvars.iv10, 100
  47   br i1 %exitcond12, label %bb15, label %bb25
  48
  49 bb15:                                             ; preds = %bb13
  50   %tmp = add nsw i32 %.0, -3
  51   %tmp16 = add nuw nsw i64 %indvars.iv10, 3
  52   %tmp17 = trunc i64 %tmp16 to i32
  53   %tmp18 = mul nsw i32 %tmp, %tmp17
  54   %tmp19 = trunc i64 %indvars.iv10 to i32
  55   %tmp20 = srem i32 %tmp18, %tmp19
  56   %tmp21 = getelementptr inbounds [1024 x i32], [1024 x i32]* @A, i64 0, i64 %indvars.iv10
  57   store i32 %tmp20, i32* %tmp21, align 4
  58   br label %bb22
  59
  60 bb22:                                             ; preds = %bb15
  61   %indvars.iv.next11 = add nuw nsw i64 %indvars.iv10, 1
  62   %tmp23 = add nuw nsw i32 %.0, 1
  63   br label %bb13
  64
  65 bb25:                                             ; preds = %bb35, %bb13
  66   %indvars.iv7 = phi i64 [ %indvars.iv.next8, %bb35 ], [ 0, %bb13 ]
  67   %.01 = phi i32 [ 0, %bb13 ], [ %tmp36, %bb35 ]
  68   %exitcond9 = icmp ne i64 %indvars.iv7, 100
  69   br i1 %exitcond9, label %bb27, label %bb38
  70
  71 bb27:                                             ; preds = %bb25
  72   %tmp28 = add nsw i32 %.01, -3
  73   %tmp29 = add nuw nsw i64 %indvars.iv7, 3
  74   %tmp30 = trunc i64 %tmp29 to i32
  75   %tmp31 = mul nsw i32 %tmp28, %tmp30
  76   %tmp32 = trunc i64 %indvars.iv7 to i32
  77   %tmp33 = srem i32 %tmp31, %tmp32
  78   %tmp34 = getelementptr inbounds [1024 x i32], [1024 x i32]* @B, i64 0, i64 %indvars.iv7
  79   store i32 %tmp33, i32* %tmp34, align 4
  80   br label %bb35
  81
  82 bb35:                                             ; preds = %bb27
  83   %indvars.iv.next8 = add nuw nsw i64 %indvars.iv7, 1
  84   %tmp36 = add nuw nsw i32 %.01, 1
  85   br label %bb25
  86
  87 bb38:                                             ; preds = %bb48, %bb25
  88   %indvars.iv4 = phi i64 [ %indvars.iv.next5, %bb48 ], [ 0, %bb25 ]
  89   %.02 = phi i32 [ 0, %bb25 ], [ %tmp49, %bb48 ]
  90   %exitcond6 = icmp ne i64 %indvars.iv4, 100
  91   br i1 %exitcond6, label %bb40, label %bb51
  92
  93 bb40:                                             ; preds = %bb38
  94   %tmp41 = add nsw i32 %.02, -3
  95   %tmp42 = add nuw nsw i64 %indvars.iv4, 3
  96   %tmp43 = trunc i64 %tmp42 to i32
  97   %tmp44 = mul nsw i32 %tmp41, %tmp43
  98   %tmp45 = trunc i64 %indvars.iv4 to i32
  99   %tmp46 = srem i32 %tmp44, %tmp45
 100   %tmp47 = getelementptr inbounds [1024 x i32], [1024 x i32]* @C, i64 0, i64 %indvars.iv4
 101   store i32 %tmp46, i32* %tmp47, align 4
 102   br label %bb48
 103
 104 bb48:                                             ; preds = %bb40
 105   %indvars.iv.next5 = add nuw nsw i64 %indvars.iv4, 1
 106   %tmp49 = add nuw nsw i32 %.02, 1
 107   br label %bb38
 108
 109 bb51:                                             ; preds = %bb61, %bb38
 110   %indvars.iv = phi i64 [ %indvars.iv.next, %bb61 ], [ 0, %bb38 ]
 111   %.03 = phi i32 [ 0, %bb38 ], [ %tmp62, %bb61 ]
 112   %exitcond = icmp ne i64 %indvars.iv, 100
 113   br i1 %exitcond, label %bb53, label %bb52
 114
 115 bb52:                                             ; preds = %bb51
 116   br label %bb63
 117
 118 bb53:                                             ; preds = %bb51
 119   %tmp54 = add nsw i32 %.03, -3
 120   %tmp55 = add nuw nsw i64 %indvars.iv, 3
 121   %tmp56 = trunc i64 %tmp55 to i32
 122   %tmp57 = mul nsw i32 %tmp54, %tmp56
 123   %tmp58 = trunc i64 %indvars.iv to i32
 124   %tmp59 = srem i32 %tmp57, %tmp58
 125   %tmp60 = getelementptr inbounds [1024 x i32], [1024 x i32]* @D, i64 0, i64 %indvars.iv
 126   store i32 %tmp59, i32* %tmp60, align 4
 127   br label %bb61
 128
 129 bb61:                                             ; preds = %bb53
 130   %indvars.iv.next = add nuw nsw i64 %indvars.iv, 1
 131   %tmp62 = add nuw nsw i32 %.03, 1
 132   br label %bb51
 133
 134 bb63:                                             ; preds = %bb52
 135   ret void
 136 }