[mlir][scf]: Add value bound between scf for loop yield and result (#123200)
[llvm-project.git] / llvm / test / CodeGen / NVPTX / dynamic-stackalloc-regression.ll
blob5d46c74157abd07f42a3097a85dca06d7cd84bfe
1 ; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py UTC_ARGS: --version 5
2 ; RUN: llc < %s -mtriple=nvptx64 -mattr=+ptx73 -mcpu=sm_52 | FileCheck %s
4 target triple = "nvptx64-nvidia-cuda"
6 define void @foo(i64 %a, ptr %p0, ptr %p1) {
7 ; CHECK-LABEL: foo(
8 ; CHECK:       {
9 ; CHECK-NEXT:    .reg .b64 %rd<8>;
10 ; CHECK-EMPTY:
11 ; CHECK-NEXT:  // %bb.0:
12 ; CHECK-NEXT:    ld.param.u64 %rd1, [foo_param_0];
13 ; CHECK-NEXT:    add.s64 %rd2, %rd1, 7;
14 ; CHECK-NEXT:    and.b64 %rd3, %rd2, -8;
15 ; CHECK-NEXT:    alloca.u64 %rd4, %rd3, 16;
16 ; CHECK-NEXT:    cvta.local.u64 %rd4, %rd4;
17 ; CHECK-NEXT:    ld.param.u64 %rd5, [foo_param_1];
18 ; CHECK-NEXT:    alloca.u64 %rd6, %rd3, 16;
19 ; CHECK-NEXT:    cvta.local.u64 %rd6, %rd6;
20 ; CHECK-NEXT:    ld.param.u64 %rd7, [foo_param_2];
21 ; CHECK-NEXT:    st.u64 [%rd5], %rd4;
22 ; CHECK-NEXT:    st.u64 [%rd7], %rd6;
23 ; CHECK-NEXT:    ret;
24   %b = alloca i8, i64 %a, align 16
25   %c = alloca i8, i64 %a, align 16
26   store ptr %b, ptr %p0, align 8
27   store ptr %c, ptr %p1, align 8
28   ret void