llvm/test/Transforms/IROutliner/outlining-different-output-blocks.ll

   1 ; NOTE: Assertions have been autogenerated by utils/update_test_checks.py
   2 ; RUN: opt -S -iroutliner -ir-outlining-no-cost < %s | FileCheck %s
   3
   4 ; These functions are constructed slightly differently so that they require
   5 ; different output blocks for the values used outside of the region. We are
   6 ; checking that two output blocks are created with different values.
   7
   8 define void @outline_outputs1() #0 {
   9 ; CHECK-LABEL: @outline_outputs1(
  10 ; CHECK-NEXT:  entry:
  11 ; CHECK-NEXT:    [[DOTLOC:%.*]] = alloca i32, align 4
  12 ; CHECK-NEXT:    [[ADD_LOC:%.*]] = alloca i32, align 4
  13 ; CHECK-NEXT:    [[A:%.*]] = alloca i32, align 4
  14 ; CHECK-NEXT:    [[B:%.*]] = alloca i32, align 4
  15 ; CHECK-NEXT:    [[OUTPUT:%.*]] = alloca i32, align 4
  16 ; CHECK-NEXT:    [[RESULT:%.*]] = alloca i32, align 4
  17 ; CHECK-NEXT:    [[LT_CAST:%.*]] = bitcast i32* [[ADD_LOC]] to i8*
  18 ; CHECK-NEXT:    call void @llvm.lifetime.start.p0i8(i64 -1, i8* [[LT_CAST]])
  19 ; CHECK-NEXT:    [[LT_CAST1:%.*]] = bitcast i32* [[DOTLOC]] to i8*
  20 ; CHECK-NEXT:    call void @llvm.lifetime.start.p0i8(i64 -1, i8* [[LT_CAST1]])
  21 ; CHECK-NEXT:    call void @outlined_ir_func_0(i32* [[A]], i32* [[B]], i32* [[OUTPUT]], i32* [[ADD_LOC]], i32* [[DOTLOC]], i32 0)
  22 ; CHECK-NEXT:    [[ADD_RELOAD:%.*]] = load i32, i32* [[ADD_LOC]], align 4
  23 ; CHECK-NEXT:    [[DOTRELOAD:%.*]] = load i32, i32* [[DOTLOC]], align 4
  24 ; CHECK-NEXT:    call void @llvm.lifetime.end.p0i8(i64 -1, i8* [[LT_CAST]])
  25 ; CHECK-NEXT:    call void @llvm.lifetime.end.p0i8(i64 -1, i8* [[LT_CAST1]])
  26 ; CHECK-NEXT:    [[TMP0:%.*]] = load i32, i32* [[OUTPUT]], align 4
  27 ; CHECK-NEXT:    call void @outlined_ir_func_1(i32 [[DOTRELOAD]], i32 [[ADD_RELOAD]], i32* [[RESULT]])
  28 ; CHECK-NEXT:    ret void
  29 ;
  30 entry:
  31   %a = alloca i32, align 4
  32   %b = alloca i32, align 4
  33   %output = alloca i32, align 4
  34   %result = alloca i32, align 4
  35   store i32 2, i32* %a, align 4
  36   store i32 3, i32* %b, align 4
  37   %0 = load i32, i32* %a, align 4
  38   %1 = load i32, i32* %b, align 4
  39   %add = add i32 %0, %1
  40   %sub = sub i32 %0, %1
  41   store i32 %add, i32* %output, align 4
  42   %2 = load i32, i32* %output, align 4
  43   %3 = load i32, i32* %output, align 4
  44   %mul = mul i32 %2, %add
  45   store i32 %mul, i32* %result, align 4
  46   ret void
  47 }
  48
  49 define void @outline_outputs2() #0 {
  50 ; CHECK-LABEL: @outline_outputs2(
  51 ; CHECK-NEXT:  entry:
  52 ; CHECK-NEXT:    [[DOTLOC:%.*]] = alloca i32, align 4
  53 ; CHECK-NEXT:    [[SUB_LOC:%.*]] = alloca i32, align 4
  54 ; CHECK-NEXT:    [[A:%.*]] = alloca i32, align 4
  55 ; CHECK-NEXT:    [[B:%.*]] = alloca i32, align 4
  56 ; CHECK-NEXT:    [[OUTPUT:%.*]] = alloca i32, align 4
  57 ; CHECK-NEXT:    [[RESULT:%.*]] = alloca i32, align 4
  58 ; CHECK-NEXT:    [[LT_CAST:%.*]] = bitcast i32* [[SUB_LOC]] to i8*
  59 ; CHECK-NEXT:    call void @llvm.lifetime.start.p0i8(i64 -1, i8* [[LT_CAST]])
  60 ; CHECK-NEXT:    [[LT_CAST1:%.*]] = bitcast i32* [[DOTLOC]] to i8*
  61 ; CHECK-NEXT:    call void @llvm.lifetime.start.p0i8(i64 -1, i8* [[LT_CAST1]])
  62 ; CHECK-NEXT:    call void @outlined_ir_func_0(i32* [[A]], i32* [[B]], i32* [[OUTPUT]], i32* [[SUB_LOC]], i32* [[DOTLOC]], i32 1)
  63 ; CHECK-NEXT:    [[SUB_RELOAD:%.*]] = load i32, i32* [[SUB_LOC]], align 4
  64 ; CHECK-NEXT:    [[DOTRELOAD:%.*]] = load i32, i32* [[DOTLOC]], align 4
  65 ; CHECK-NEXT:    call void @llvm.lifetime.end.p0i8(i64 -1, i8* [[LT_CAST]])
  66 ; CHECK-NEXT:    call void @llvm.lifetime.end.p0i8(i64 -1, i8* [[LT_CAST1]])
  67 ; CHECK-NEXT:    call void @outlined_ir_func_1(i32 [[DOTRELOAD]], i32 [[SUB_RELOAD]], i32* [[RESULT]])
  68 ; CHECK-NEXT:    ret void
  69 ;
  70 entry:
  71   %a = alloca i32, align 4
  72   %b = alloca i32, align 4
  73   %output = alloca i32, align 4
  74   %result = alloca i32, align 4
  75   store i32 2, i32* %a, align 4
  76   store i32 3, i32* %b, align 4
  77   %0 = load i32, i32* %a, align 4
  78   %1 = load i32, i32* %b, align 4
  79   %add = add i32 %0, %1
  80   %sub = sub i32 %0, %1
  81   store i32 %add, i32* %output, align 4
  82   %2 = load i32, i32* %output, align 4
  83   %mul = mul i32 %2, %sub
  84   store i32 %mul, i32* %result, align 4
  85   ret void
  86 }
  87
  88 ; CHECK: define internal void @outlined_ir_func_0(i32* [[ARG0:%.*]], i32* [[ARG1:%.*]], i32* [[ARG2:%.*]], i32* [[ARG3:%.*]], i32* [[ARG4:%.*]], i32 [[ARG5:%.*]]) #1 {
  89 ; CHECK: _after_outline.exitStub:
  90 ; CHECK-NEXT:    switch i32 [[ARG5]], label [[BLOCK:%.*]] [
  91 ; CHECK-NEXT:      i32 0, label %[[BLOCK_0:.*]]
  92 ; CHECK-NEXT:      i32 1, label %[[BLOCK_1:.*]]
  93
  94 ; CHECK: entry_to_outline:
  95 ; CHECK-NEXT:    store i32 2, i32* [[ARG0]], align 4
  96 ; CHECK-NEXT:    store i32 3, i32* [[ARG1]], align 4
  97 ; CHECK-NEXT:    [[TMP0:%.*]] = load i32, i32* [[ARG0]], align 4
  98 ; CHECK-NEXT:    [[TMP1:%.*]] = load i32, i32* [[ARG1]], align 4
  99 ; CHECK-NEXT:    [[ADD:%.*]] = add i32 [[TMP0]], [[TMP1]]
 100 ; CHECK-NEXT:    [[SUB:%.*]] = sub i32 [[TMP0]], [[TMP1]]
 101 ; CHECK-NEXT:    store i32 [[ADD]], i32* [[ARG2]], align 4
 102 ; CHECK-NEXT:    [[TMP2:%.*]] = load i32, i32* [[ARG2]], align 4
 103
 104 ; CHECK: [[BLOCK_0]]:
 105 ; CHECK-NEXT:    store i32 [[ADD]], i32* [[ARG3]], align 4
 106 ; CHECK-NEXT:    store i32 [[TMP2]], i32* [[ARG4]], align 4
 107
 108 ; CHECK: [[BLOCK_1]]:
 109 ; CHECK-NEXT:    store i32 [[SUB]], i32* [[ARG3]], align 4
 110 ; CHECK-NEXT:    store i32 [[TMP2]], i32* [[ARG4]], align 4