fast-math-vect-reduc-5.ll

   1 ; RUN: opt %loadPolly %defaultOpts -polly-codegen -enable-polly-vector -dce -S %s | FileCheck %s
   2 ; Obtained from C source as:
   3 ; clang -S -emit-llvm -O0 fast-math-vect-reduc-5.c
   4 ; opt -correlated-propagation -mem2reg -instcombine -loop-simplify -indvars -instnamer fast-math-vect-reduc-5.s > fast-math-vect-reduc-5.ll
   5 ;
   6 ; ModuleID = 'fast-math-vect-reduc-5.s'
   7 target datalayout = "e-p:64:64:64-i1:8:8-i8:8:8-i16:16:16-i32:32:32-i64:64:64-f32:32:32-f64:64:64-v64:64:64-v128:128:128-a0:0:64-s0:64:64-f80:128:128-n8:16:32:64"
   8 target triple = "x86_64-unknown-linux-gnu"
   9
  10 @b = global [16 x float] [float 0.000000e+00, float 3.000000e+00, float 6.000000e+00, float 9.000000e+00, float 1.200000e+01, float 1.500000e+01, float 1.800000e+01, float 2.100000e+01, float 2.400000e+01, float 2.700000e+01, float 3.000000e+01, float 3.300000e+01, float 3.600000e+01, float 3.900000e+01, float 4.200000e+01, float 4.500000e+01], align 16
  11 @c = global [16 x float] [float 0.000000e+00, float 1.000000e+00, float 2.000000e+00, float 3.000000e+00, float 4.000000e+00, float 5.000000e+00, float 6.000000e+00, float 7.000000e+00, float 8.000000e+00, float 9.000000e+00, float 1.000000e+01, float 1.100000e+01, float 1.200000e+01, float 1.300000e+01, float 1.400000e+01, float 1.500000e+01], align 16
  12
  13 define i32 @main1(float %x, float %max_result) nounwind uwtable {
  14 entry:
  15   br label %for.cond
  16
  17 for.cond:                                         ; preds = %for.inc, %entry
  18   %indvar4 = phi i64 [ %indvar.next5, %for.inc ], [ 0, %entry ]
  19   %diff.0 = phi float [ 2.000000e+00, %entry ], [ %add, %for.inc ]
  20   %arrayidx7 = getelementptr [16 x float]* @c, i64 0, i64 %indvar4
  21   %arrayidx = getelementptr [16 x float]* @b, i64 0, i64 %indvar4
  22   %exitcond6 = icmp ne i64 %indvar4, 16
  23   br i1 %exitcond6, label %for.body, label %for.end
  24
  25 for.body:                                         ; preds = %for.cond
  26   br label %for.inc
  27
  28 for.inc:                                          ; preds = %for.body
  29   %tmp8 = load float* %arrayidx7, align 4
  30   %tmp4 = load float* %arrayidx, align 4
  31   %sub = fsub float %tmp4, %tmp8
  32   %add = fadd float %diff.0, %sub
  33   %indvar.next5 = add i64 %indvar4, 1
  34   br label %for.cond
  35
  36 for.end:                                          ; preds = %for.cond
  37   %diff.0.lcssa = phi float [ %diff.0, %for.cond ]
  38   br label %for.cond11
  39
  40 for.cond11:                                       ; preds = %for.inc26, %for.end
  41   %indvar1 = phi i64 [ %indvar.next2, %for.inc26 ], [ 0, %for.end ]
  42   %max.0 = phi float [ %x, %for.end ], [ %cond, %for.inc26 ]
  43   %arrayidx18 = getelementptr [16 x float]* @c, i64 0, i64 %indvar1
  44   %exitcond3 = icmp ne i64 %indvar1, 16
  45   br i1 %exitcond3, label %for.body14, label %for.end29
  46
  47 for.body14:                                       ; preds = %for.cond11
  48   %tmp19 = load float* %arrayidx18, align 4
  49   %cmp20 = fcmp olt float %max.0, %tmp19
  50   br i1 %cmp20, label %cond.true, label %cond.false
  51
  52 cond.true:                                        ; preds = %for.body14
  53   %tmp24 = load float* %arrayidx18, align 4
  54   br label %cond.end
  55
  56 cond.false:                                       ; preds = %for.body14
  57   br label %cond.end
  58
  59 cond.end:                                         ; preds = %cond.false, %cond.true
  60   %cond = phi float [ %tmp24, %cond.true ], [ %max.0, %cond.false ]
  61   br label %for.inc26
  62
  63 for.inc26:                                        ; preds = %cond.end
  64   %indvar.next2 = add i64 %indvar1, 1
  65   br label %for.cond11
  66
  67 for.end29:                                        ; preds = %for.cond11
  68   %max.0.lcssa = phi float [ %max.0, %for.cond11 ]
  69   br label %for.cond30
  70
  71 for.cond30:                                       ; preds = %for.inc49, %for.end29
  72   %indvar = phi i64 [ %indvar.next, %for.inc49 ], [ 0, %for.end29 ]
  73   %min.0 = phi float [ 1.000000e+01, %for.end29 ], [ %cond48, %for.inc49 ]
  74   %arrayidx37 = getelementptr [16 x float]* @c, i64 0, i64 %indvar
  75   %exitcond = icmp ne i64 %indvar, 16
  76   br i1 %exitcond, label %for.body33, label %for.end52
  77
  78 for.body33:                                       ; preds = %for.cond30
  79   %tmp38 = load float* %arrayidx37, align 4
  80   %cmp39 = fcmp ogt float %min.0, %tmp38
  81   br i1 %cmp39, label %cond.true40, label %cond.false45
  82
  83 cond.true40:                                      ; preds = %for.body33
  84   %tmp44 = load float* %arrayidx37, align 4
  85   br label %cond.end47
  86
  87 cond.false45:                                     ; preds = %for.body33
  88   br label %cond.end47
  89
  90 cond.end47:                                       ; preds = %cond.false45, %cond.true40
  91   %cond48 = phi float [ %tmp44, %cond.true40 ], [ %min.0, %cond.false45 ]
  92   br label %for.inc49
  93
  94 for.inc49:                                        ; preds = %cond.end47
  95   %indvar.next = add i64 %indvar, 1
  96   br label %for.cond30
  97
  98 for.end52:                                        ; preds = %for.cond30
  99   %min.0.lcssa = phi float [ %min.0, %for.cond30 ]
 100   %cmp54 = fcmp une float %diff.0.lcssa, 2.420000e+02
 101   br i1 %cmp54, label %if.then, label %if.end
 102
 103 if.then:                                          ; preds = %for.end52
 104   call void @abort() noreturn nounwind
 105   unreachable
 106
 107 if.end:                                           ; preds = %for.end52
 108   %cmp57 = fcmp une float %max.0.lcssa, %max_result
 109   br i1 %cmp57, label %if.then58, label %if.end59
 110
 111 if.then58:                                        ; preds = %if.end
 112   call void @abort() noreturn nounwind
 113   unreachable
 114
 115 if.end59:                                         ; preds = %if.end
 116   %cmp61 = fcmp une float %min.0.lcssa, 0.000000e+00
 117   br i1 %cmp61, label %if.then62, label %if.end63
 118
 119 if.then62:                                        ; preds = %if.end59
 120   call void @abort() noreturn nounwind
 121   unreachable
 122
 123 if.end63:                                         ; preds = %if.end59
 124   ret i32 0
 125 }
 126
 127 declare void @abort() noreturn
 128
 129 define i32 @main() nounwind uwtable {
 130 entry:
 131   call void @check_vect()
 132   %call = call i32 @main1(float 1.000000e+02, float 1.000000e+02)
 133   %call1 = call i32 @main1(float 0.000000e+00, float 1.500000e+01)
 134   ret i32 0
 135 }
 136
 137 define internal void @check_vect() nounwind uwtable noinline {
 138 entry:
 139   %a = alloca i32, align 4
 140   %b = alloca i32, align 4
 141   %c = alloca i32, align 4
 142   %d = alloca i32, align 4
 143   %call = call void (i32)* (i32, void (i32)*)* @signal(i32 4, void (i32)* @sig_ill_handler) nounwind
 144   %call1 = call i32 @__get_cpuid(i32 1, i32* %a, i32* %b, i32* %c, i32* %d)
 145   %tobool = icmp eq i32 %call1, 0
 146   br i1 %tobool, label %if.then, label %lor.lhs.false
 147
 148 lor.lhs.false:                                    ; preds = %entry
 149   %tmp4 = load i32* %d, align 4
 150   %and6 = and i32 %tmp4, 67108864
 151   %cmp = icmp eq i32 %and6, 0
 152   br i1 %cmp, label %if.then, label %if.end
 153
 154 if.then:                                          ; preds = %entry, %lor.lhs.false
 155   call void @exit(i32 0) noreturn nounwind
 156   unreachable
 157
 158 if.end:                                           ; preds = %lor.lhs.false
 159   %call7 = call void (i32)* (i32, void (i32)*)* @signal(i32 4, void (i32)* null) nounwind
 160   ret void
 161 }
 162
 163 declare void (i32)* @signal(i32, void (i32)*) nounwind
 164
 165 define internal void @sig_ill_handler(i32 %sig) nounwind uwtable {
 166 entry:
 167   call void @exit(i32 0) noreturn nounwind
 168   unreachable
 169
 170 return:                                           ; No predecessors!
 171   ret void
 172 }
 173
 174 define internal i32 @__get_cpuid(i32 %__level, i32* %__eax, i32* %__ebx, i32* %__ecx, i32* %__edx) nounwind uwtable inlinehint {
 175 entry:
 176   %and = and i32 %__level, -2147483648
 177   %call = call i32 @__get_cpuid_max(i32 %and, i32* null)
 178   %cmp = icmp ult i32 %call, %__level
 179   br i1 %cmp, label %if.then, label %if.end
 180
 181 if.then:                                          ; preds = %entry
 182   br label %return
 183
 184 if.end:                                           ; preds = %entry
 185   %tmp = call { i32, i32, i32, i32 } asm "cpuid\0A\09", "={ax},={bx},={cx},={dx},0,~{dirflag},~{fpsr},~{flags}"(i32 %__level) nounwind, !srcloc !0
 186   %asmresult = extractvalue { i32, i32, i32, i32 } %tmp, 0
 187   %asmresult8 = extractvalue { i32, i32, i32, i32 } %tmp, 1
 188   %asmresult9 = extractvalue { i32, i32, i32, i32 } %tmp, 2
 189   %asmresult10 = extractvalue { i32, i32, i32, i32 } %tmp, 3
 190   store i32 %asmresult, i32* %__eax, align 4
 191   store i32 %asmresult8, i32* %__ebx, align 4
 192   store i32 %asmresult9, i32* %__ecx, align 4
 193   store i32 %asmresult10, i32* %__edx, align 4
 194   br label %return
 195
 196 return:                                           ; preds = %if.end, %if.then
 197   %retval.0 = phi i32 [ 0, %if.then ], [ 1, %if.end ]
 198   ret i32 %retval.0
 199 }
 200
 201 declare void @exit(i32) noreturn
 202
 203 define internal i32 @__get_cpuid_max(i32 %__ext, i32* %__sig) nounwind uwtable inlinehint {
 204 entry:
 205   %tmp = call { i32, i32, i32, i32 } asm "cpuid\0A\09", "={ax},={bx},={cx},={dx},0,~{dirflag},~{fpsr},~{flags}"(i32 %__ext) nounwind, !srcloc !1
 206   %asmresult = extractvalue { i32, i32, i32, i32 } %tmp, 0
 207   %tobool = icmp eq i32* %__sig, null
 208   br i1 %tobool, label %if.end, label %if.then
 209
 210 if.then:                                          ; preds = %entry
 211   %asmresult1 = extractvalue { i32, i32, i32, i32 } %tmp, 1
 212   store i32 %asmresult1, i32* %__sig, align 4
 213   br label %if.end
 214
 215 if.end:                                           ; preds = %entry, %if.then
 216   ret i32 %asmresult
 217 }
 218
 219 !0 = metadata !{i32 -2147343298, i32 -2147343290}
 220 !1 = metadata !{i32 -2147343421, i32 -2147343413}
 221 ; CHECK: define