Run DCE after a LoopFlatten test to reduce spurious output [nfc]
[llvm-project.git] / llvm / test / CodeGen / AMDGPU / preload-kernarg-header.ll
blob75feac35dacd847298ec0b4930c03afb8acaf854
1 ; RUN: llc -mtriple=amdgcn-amd-amdhsa -mcpu=gfx940 -amdgpu-kernarg-preload-count=1 -asm-verbose=0 < %s | FileCheck -check-prefixes=GCN %s
2 ; RUN: llc -mtriple=amdgcn-amd-amdhsa -mcpu=gfx940 -amdgpu-kernarg-preload-count=1 -filetype=obj < %s | llvm-objdump --arch=amdgcn --mcpu=gfx940 --disassemble - | FileCheck -check-prefixes=GCN %s
4 ; GCN: preload_kernarg_header
5 ; GCN-COUNT-64: s_nop 0
6 define amdgpu_kernel void @preload_kernarg_header(ptr %arg) {
7     store ptr %arg, ptr %arg
8     ret void
11 ; GCN: non_kernel_function
12 ; GCN-NOT: s_nop 0
13 ; GCN: flat_store
14 define void @non_kernel_function(ptr %arg) {
15     store ptr %arg, ptr %arg
16     ret void