Run DCE after a LoopFlatten test to reduce spurious output [nfc]
[llvm-project.git] / llvm / test / CodeGen / AMDGPU / r600.private-memory.ll
blob1650185a9f07440ef2bce1c02918bf6caee56246
1 ; RUN: llc -march=r600 -mcpu=cypress < %s | FileCheck %s -check-prefix=R600 -check-prefix=FUNC
3 declare i32 @llvm.r600.read.tidig.x() nounwind readnone
6 ; Make sure we don't overwrite workitem information with private memory
8 ; FUNC-LABEL: {{^}}work_item_info:
9 ; R600-NOT: MOV T0.X
10 ; Additional check in case the move ends up in the last slot
11 ; R600-NOT: MOV * TO.X
13 define amdgpu_kernel void @work_item_info(ptr addrspace(1) %out, i32 %in) {
14 entry:
15   %0 = alloca [2 x i32], addrspace(5)
16   %1 = getelementptr [2 x i32], ptr addrspace(5) %0, i32 0, i32 1
17   store i32 0, ptr addrspace(5) %0
18   store i32 1, ptr addrspace(5) %1
19   %2 = getelementptr [2 x i32], ptr addrspace(5) %0, i32 0, i32 %in
20   %3 = load i32, ptr addrspace(5) %2
21   %4 = call i32 @llvm.r600.read.tidig.x()
22   %5 = add i32 %3, %4
23   store i32 %5, ptr addrspace(1) %out
24   ret void