[RISCV] Fix mgather -> riscv.masked.strided.load combine not extending indices (...
[llvm-project.git] / polly / test / ScheduleOptimizer / rectangular-tiling.ll
blobb527255ab5f7b21300a77dd2f4a08184176b30e1
1 ; RUN: opt %loadPolly -polly-tile-sizes=256,16                                                                                                                                        -polly-opt-isl -polly-print-ast -disable-output < %s | FileCheck %s
2 ; RUN: opt %loadPolly -polly-tile-sizes=256,16 -polly-tiling=false                                                                                                                    -polly-opt-isl -polly-print-ast -disable-output < %s | FileCheck %s --check-prefix=NOTILING
3 ; RUN: opt %loadPolly -polly-tile-sizes=256,16 -polly-2nd-level-tiling -polly-2nd-level-tile-sizes=16,8                                                                               -polly-opt-isl -polly-print-ast -disable-output < %s | FileCheck %s --check-prefix=TWOLEVEL
4 ; RUN: opt %loadPolly -polly-tile-sizes=256,16 -polly-2nd-level-tiling -polly-2nd-level-tile-sizes=16,8 -polly-register-tiling                                                        -polly-opt-isl -polly-print-ast -disable-output < %s | FileCheck %s --check-prefix=TWO-PLUS-REGISTER
6 ; CHECK: // 1st level tiling - Tiles
7 ; CHECK: for (int c0 = 0; c0 <= 3; c0 += 1)
8 ; CHECK:   for (int c1 = 0; c1 <= 31; c1 += 1)
9 ; CHECK:     // 1st level tiling - Points
10 ; CHECK:     for (int c2 = 0; c2 <= 255; c2 += 1)
11 ; CHECK:       for (int c3 = 0; c3 <= 15; c3 += 1)
12 ; CHECK:         Stmt_for_body3(256 * c0 + c2, 16 * c1 + c3);
14 ; NOTILING: for (int c0 = 0; c0 <= 1023; c0 += 1)
15 ; NOTILING:   for (int c1 = 0; c1 <= 511; c1 += 1)
16 ; NOTILING:     Stmt_for_body3(c0, c1);
19 ; TWOLEVEL: // 1st level tiling - Tiles
20 ; TWOLEVEL: for (int c0 = 0; c0 <= 3; c0 += 1)
21 ; TWOLEVEL:   for (int c1 = 0; c1 <= 31; c1 += 1)
22 ; TWOLEVEL:     // 1st level tiling - Points
23 ; TWOLEVEL:     // 2nd level tiling - Tiles
24 ; TWOLEVEL:     for (int c2 = 0; c2 <= 15; c2 += 1)
25 ; TWOLEVEL:       for (int c3 = 0; c3 <= 1; c3 += 1)
26 ; TWOLEVEL:         // 2nd level tiling - Points
27 ; TWOLEVEL:         for (int c4 = 0; c4 <= 15; c4 += 1)
28 ; TWOLEVEL:           for (int c5 = 0; c5 <= 7; c5 += 1)
29 ; TWOLEVEL:             Stmt_for_body3(256 * c0 + 16 * c2 + c4, 16 * c1 + 8 * c3 + c5);
32 ; TWO-PLUS-REGISTER: // 1st level tiling - Tiles
33 ; TWO-PLUS-REGISTER: for (int c0 = 0; c0 <= 3; c0 += 1)
34 ; TWO-PLUS-REGISTER:   for (int c1 = 0; c1 <= 31; c1 += 1)
35 ; TWO-PLUS-REGISTER:     // 1st level tiling - Points
36 ; TWO-PLUS-REGISTER:     // 2nd level tiling - Tiles
37 ; TWO-PLUS-REGISTER:     for (int c2 = 0; c2 <= 15; c2 += 1)
38 ; TWO-PLUS-REGISTER:       for (int c3 = 0; c3 <= 1; c3 += 1)
39 ; TWO-PLUS-REGISTER:         // 2nd level tiling - Points
40 ; TWO-PLUS-REGISTER:         // Register tiling - Tiles
41 ; TWO-PLUS-REGISTER:         for (int c4 = 0; c4 <= 7; c4 += 1)
42 ; TWO-PLUS-REGISTER:           for (int c5 = 0; c5 <= 3; c5 += 1)
43 ; TWO-PLUS-REGISTER:             // Register tiling - Points
44 ; TWO-PLUS-REGISTER:             {
45 ; TWO-PLUS-REGISTER:               Stmt_for_body3(256 * c0 + 16 * c2 + 2 * c4, 16 * c1 + 8 * c3 + 2 * c5);
46 ; TWO-PLUS-REGISTER:               Stmt_for_body3(256 * c0 + 16 * c2 + 2 * c4, 16 * c1 + 8 * c3 + 2 * c5 + 1);
47 ; TWO-PLUS-REGISTER:               Stmt_for_body3(256 * c0 + 16 * c2 + 2 * c4 + 1, 16 * c1 + 8 * c3 + 2 * c5);
48 ; TWO-PLUS-REGISTER:               Stmt_for_body3(256 * c0 + 16 * c2 + 2 * c4 + 1, 16 * c1 + 8 * c3 + 2 * c5 + 1);
49 ; TWO-PLUS-REGISTER:             }
51 target datalayout = "e-m:e-p:32:32-i64:64-v128:64:128-n32-S64"
53 ; Function Attrs: nounwind
54 define void @rect(ptr %A) {
55 entry:
56   br label %entry.split
58 entry.split:                                      ; preds = %entry
59   br label %for.body3.lr.ph
61 for.body3.lr.ph:                                  ; preds = %for.inc5, %entry.split
62   %i.0 = phi i32 [ 0, %entry.split ], [ %inc6, %for.inc5 ]
63   br label %for.body3
65 for.body3:                                        ; preds = %for.body3.lr.ph, %for.body3
66   %j.0 = phi i32 [ 0, %for.body3.lr.ph ], [ %inc, %for.body3 ]
67   %mul = mul nsw i32 %j.0, %i.0
68   %rem = srem i32 %mul, 42
69   %arrayidx4 = getelementptr inbounds [512 x i32], ptr %A, i32 %i.0, i32 %j.0
70   store i32 %rem, ptr %arrayidx4, align 4
71   %inc = add nsw i32 %j.0, 1
72   %cmp2 = icmp slt i32 %inc, 512
73   br i1 %cmp2, label %for.body3, label %for.inc5
75 for.inc5:                                         ; preds = %for.body3
76   %inc6 = add nsw i32 %i.0, 1
77   %cmp = icmp slt i32 %inc6, 1024
78   br i1 %cmp, label %for.body3.lr.ph, label %for.end7
80 for.end7:                                         ; preds = %for.inc5
81   ret void