Run DCE after a LoopFlatten test to reduce spurious output [nfc]
[llvm-project.git] / llvm / test / CodeGen / AMDGPU / sopk-no-literal.ll
blobec8e18a246b75758f2f1523ff01a20f681ff4fc7
1 ; REQUIRES: asserts
2 ; RUN: llc -O0 -mtriple=amdgcn-amd-amdhsa -mcpu=gfx1100 -debug-only=branch-relaxation -verify-machineinstrs < %s 2>&1 | FileCheck --check-prefix=GFX10 %s
4 ; GFX10: Basic blocks after relaxation
5 ; GFX10: %bb.0  offset=00000000 size=0x1c
7 ; Each instruction in the following kernel is 4 bytes in size,
8 ; except s_load_b32 which is 8 bytes in size. Hence, 0x1c bytes in total.
9 define amdgpu_kernel void @test_sopk_size(i32 %var.mode) {
10 ; GFX10-LABEL: test_sopk_size:
11 ; GFX10:  ; %bb.0:
12 ; GFX10:    s_load_b32 s0, s[4:5], 0x0
13 ; GFX10:    s_mov_b32 s1, 3
14 ; GFX10:    s_setreg_b32 hwreg(HW_REG_MODE, 0, 2), s1
15 ; GFX10:    s_waitcnt lgkmcnt(0)
16 ; GFX10:    s_setreg_b32 hwreg(HW_REG_MODE, 0, 3), s0
17 ; GFX10:    s_endpgm
18   call void @llvm.amdgcn.s.setreg(i32 2049, i32 3)
19   call void @llvm.amdgcn.s.setreg(i32 4097, i32 %var.mode)
20   call void asm sideeffect "", ""()
21   ret void
24 declare void @llvm.amdgcn.s.setreg(i32 immarg, i32)