[AMDGPU] Add True16 register classes.
[llvm-project.git] / llvm / test / Transforms / LoopLoadElim / def-store-before-load.ll
blobf5ee01bfe74ca902ac5df104694a352ddfd2fd01
1 ; RUN: opt -passes=loop-load-elim -S < %s | FileCheck %s
3 ;  No loop-carried forwarding: The intervening store to A[i] kills the stored
4 ;  value from the previous iteration.
6 ;   for (unsigned i = 0; i < 100; i++) {
7 ;     A[i] = 1;
8 ;     A[i+1] = A[i] + B[i];
9 ;   }
11 target datalayout = "e-m:o-i64:64-f80:128-n8:16:32:64-S128"
13 define void @f(ptr noalias nocapture %A, ptr noalias nocapture readonly %B, i64 %N) {
14 entry:
15   br label %for.body
17 for.body:                                         ; preds = %for.body, %entry
18 ; CHECK-NOT: %store_forwarded
19   %indvars.iv = phi i64 [ 0, %entry ], [ %indvars.iv.next, %for.body ]
20   %arrayidx = getelementptr inbounds i32, ptr %A, i64 %indvars.iv
21   store i32 1, ptr %arrayidx, align 4
22   %a = load i32, ptr %arrayidx, align 4
23   %arrayidxB = getelementptr inbounds i32, ptr %B, i64 %indvars.iv
24   %b = load i32, ptr %arrayidxB, align 4
25 ; CHECK: %add = add i32 %b, %a
26   %add = add i32 %b, %a
27   %indvars.iv.next = add nuw nsw i64 %indvars.iv, 1
28   %arrayidx_next = getelementptr inbounds i32, ptr %A, i64 %indvars.iv.next
29   store i32 %add, ptr %arrayidx_next, align 4
30   %exitcond = icmp eq i64 %indvars.iv.next, %N
31   br i1 %exitcond, label %for.end, label %for.body
33 for.end:                                          ; preds = %for.body
34   ret void