Run DCE after a LoopFlatten test to reduce spurious output [nfc]
[llvm-project.git] / llvm / test / CodeGen / AMDGPU / extra-lds-size.ll
blobe376c3df1ac937adfd90bda7ca98a9679f721ec3
1 ; RUN: llc -mtriple=amdgcn-amd-amdpal -mcpu=gfx1010 < %s | FileCheck -check-prefix=GFX10-PAL %s
2 ; RUN: llc -mtriple=amdgcn-mesa-mesa3d -mcpu=gfx1010 < %s | FileCheck -check-prefix=GFX10-MESA %s
3 ; RUN: llc -mtriple=amdgcn-amd-amdpal -mcpu=gfx1100 < %s | FileCheck -check-prefix=GFX11-PAL %s
4 ; RUN: llc -mtriple=amdgcn-mesa-mesa3d -mcpu=gfx1100 < %s | FileCheck -check-prefix=GFX11-MESA %s
6 ; Check EXTRA_LDS_SIZE in SPI_SHADER_PGM_RSRC2_PS.
8 ; GFX10-PAL: 0x2c0b (SPI_SHADER_PGM_RSRC2_PS): 0x800
10 ; GFX10-MESA: .long 45100
11 ; GFX10-MESA-NEXT: .long 2048
13 ; GFX11-PAL: 0x2c0b (SPI_SHADER_PGM_RSRC2_PS): 0x400
15 ; GFX11-MESA: .long 45100
16 ; GFX11-MESA-NEXT: .long 1024
18 @lds = internal addrspace(3) global [4096 x i8] undef
20 define amdgpu_ps void @global_store_saddr_uniform_ptr_in_vgprs(i32 %voffset) {
21   %ptr = getelementptr [4096 x i8], ptr addrspace(3) @lds, i32 0, i32 %voffset
22   store i8 0, ptr addrspace(3) %ptr
23   ret void