Run DCE after a LoopFlatten test to reduce spurious output [nfc]
[llvm-project.git] / llvm / test / CodeGen / AMDGPU / indirect-call-known-callees.ll
blobfe7323eeadf8ab233304b9f614bf52312b189e88
1 ; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
2 ; RUN: llc -mtriple=amdgcn-amd-amdhsa -mcpu=gfx900 < %s | FileCheck %s
4 ; We have an indirect call with a known set of callees, which are
5 ; known to not need any special inputs. The ABI still needs to use the
6 ; register
8 ; FIXME: Passing real values for workitem ID, and 0s that can be undef
10 define amdgpu_kernel void @indirect_call_known_no_special_inputs() {
11 ; CHECK-LABEL: indirect_call_known_no_special_inputs:
12 ; CHECK:       ; %bb.0: ; %bb
13 ; CHECK-NEXT:    s_add_u32 flat_scratch_lo, s4, s7
14 ; CHECK-NEXT:    s_addc_u32 flat_scratch_hi, s5, 0
15 ; CHECK-NEXT:    s_add_u32 s0, s0, s7
16 ; CHECK-NEXT:    s_addc_u32 s1, s1, 0
17 ; CHECK-NEXT:    s_mov_b64 s[4:5], 0
18 ; CHECK-NEXT:    s_load_dword s7, s[4:5], 0x0
19 ; CHECK-NEXT:    s_getpc_b64 s[4:5]
20 ; CHECK-NEXT:    s_add_u32 s4, s4, wobble@gotpcrel32@lo+4
21 ; CHECK-NEXT:    s_addc_u32 s5, s5, wobble@gotpcrel32@hi+12
22 ; CHECK-NEXT:    s_getpc_b64 s[8:9]
23 ; CHECK-NEXT:    s_add_u32 s8, s8, snork@gotpcrel32@lo+4
24 ; CHECK-NEXT:    s_addc_u32 s9, s9, snork@gotpcrel32@hi+12
25 ; CHECK-NEXT:    s_load_dwordx2 s[10:11], s[8:9], 0x0
26 ; CHECK-NEXT:    s_load_dwordx2 s[12:13], s[4:5], 0x0
27 ; CHECK-NEXT:    s_mov_b64 s[8:9], 0
28 ; CHECK-NEXT:    s_waitcnt lgkmcnt(0)
29 ; CHECK-NEXT:    s_and_b32 s4, 1, s7
30 ; CHECK-NEXT:    s_cmp_eq_u32 s4, 1
31 ; CHECK-NEXT:    v_mov_b32_e32 v31, v0
32 ; CHECK-NEXT:    s_cselect_b32 s5, s13, s11
33 ; CHECK-NEXT:    s_cselect_b32 s4, s12, s10
34 ; CHECK-NEXT:    s_mov_b32 s12, s6
35 ; CHECK-NEXT:    v_mov_b32_e32 v1, 0
36 ; CHECK-NEXT:    v_mov_b32_e32 v4, 0
37 ; CHECK-NEXT:    s_mov_b32 s32, 0
38 ; CHECK-NEXT:    s_swappc_b64 s[30:31], s[4:5]
39 ; CHECK-NEXT:    s_endpgm
41 bb:
42   %cond = load i1, ptr addrspace(4) null
43   %tmp = select i1 %cond, ptr @wobble, ptr @snork
44   call void %tmp(ptr undef, i32 undef, ptr undef)
45   ret void
48 define void @wobble() {
49 ; CHECK-LABEL: wobble:
50 ; CHECK:       ; %bb.0: ; %bb
51 ; CHECK-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
52 ; CHECK-NEXT:    s_setpc_b64 s[30:31]
53 bb:
54   ret void
57 define void @snork() {
58 ; CHECK-LABEL: snork:
59 ; CHECK:       ; %bb.0: ; %bb
60 ; CHECK-NEXT:    s_waitcnt vmcnt(0) expcnt(0) lgkmcnt(0)
61 ; CHECK-NEXT:    s_setpc_b64 s[30:31]
62 bb:
63   ret void