[MLIR][NVVM] Add Op for TMA Store with reduction (#118853)
[llvm-project.git] / polly / test / DependenceInfo / reduction_multiple_loops_array_sum_2.ll
blob91bd35deebd06475e055ac5922737f8aa328cddc
1 ; RUN: opt %loadNPMPolly '-passes=print<polly-dependences>' -aa-pipeline=basic-aa -disable-output < %s | FileCheck %s
3 ; CHECK:      RAW dependences:
4 ; CHECK-NEXT:     {  }
5 ; CHECK-NEXT: WAR dependences:
6 ; CHECK-NEXT:     {  }
7 ; CHECK-NEXT: WAW dependences:
8 ; CHECK-NEXT:     {  }
9 ; CHECK-NEXT: Reduction dependences:
10 ; CHECK-NEXT:     { Stmt_for_body3[i0, i1] -> Stmt_for_body3[i0, 1 + i1] : 0 <= i0 <= 99 and 0 <= i1 <= 98; Stmt_for_body3[i0, 99] -> Stmt_for_body3[1 + i0, 0] : 0 <= i0 <= 98 }
12 ; int f(int * restrict A, int * restrict sum) {
13 ;   int i, j, k;
14 ;   for (i = 0; i < 100; i++) {
15 ;     for (j = 0; j < 100; j++) {
16 ;       sum += A[i+j];
17 ;       for (k = 0; k< 100; k++) {}
18 ;     }
19 ;   }
20 ;   return sum;
21 ; }
22 target datalayout = "e-m:e-p:32:32-i64:64-v128:64:128-n32-S64"
24 define void @f(ptr noalias %A, ptr noalias %sum) {
25 entry:
26   br label %for.cond
28 for.cond:                                         ; preds = %for.inc11, %entry
29   %i.0 = phi i32 [ 0, %entry ], [ %inc12, %for.inc11 ]
30   %exitcond2 = icmp ne i32 %i.0, 100
31   br i1 %exitcond2, label %for.body, label %for.end13
33 for.body:                                         ; preds = %for.cond
34   br label %for.cond1
36 for.cond1:                                        ; preds = %for.inc8, %for.body
37   %j.0 = phi i32 [ 0, %for.body ], [ %inc9, %for.inc8 ]
38   %exitcond1 = icmp ne i32 %j.0, 100
39   br i1 %exitcond1, label %for.body3, label %for.end10
41 for.body3:                                        ; preds = %for.cond1
42   %add = add nsw i32 %i.0, %j.0
43   %arrayidx = getelementptr inbounds i32, ptr %A, i32 %add
44   %tmp3 = load i32, ptr %arrayidx, align 4
45   %tmp4 = load i32, ptr %sum, align 4
46   %add4 = add nsw i32 %tmp4, %tmp3
47   store i32 %add4, ptr %sum, align 4
48   br label %for.cond5
50 for.cond5:                                        ; preds = %for.inc, %for.body3
51   %k.0 = phi i32 [ 0, %for.body3 ], [ %inc, %for.inc ]
52   %exitcond = icmp ne i32 %k.0, 100
53   br i1 %exitcond, label %for.body7, label %for.end
55 for.body7:                                        ; preds = %for.cond5
56   br label %for.inc
58 for.inc:                                          ; preds = %for.body7
59   %inc = add nsw i32 %k.0, 1
60   br label %for.cond5
62 for.end:                                          ; preds = %for.cond5
63   br label %for.inc8
65 for.inc8:                                         ; preds = %for.end
66   %inc9 = add nsw i32 %j.0, 1
67   br label %for.cond1
69 for.end10:                                        ; preds = %for.cond1
70   br label %for.inc11
72 for.inc11:                                        ; preds = %for.end10
73   %inc12 = add nsw i32 %i.0, 1
74   br label %for.cond
76 for.end13:                                        ; preds = %for.cond
77   ret void