Run DCE after a LoopFlatten test to reduce spurious output [nfc]
[llvm-project.git] / llvm / test / CodeGen / AMDGPU / ipra.ll
blob07693371278701c5198730734c515275c6629541
1 ; RUN: llc -mtriple=amdgcn-amd-amdhsa -verify-machineinstrs -enable-ipra < %s | FileCheck -check-prefix=GCN %s
2 ; RUN: llc -mtriple=amdgcn-amd-amdhsa -verify-machineinstrs < %s | FileCheck -check-prefix=GCN %s
4 ; Kernels are not called, so there is no call preserved mask.
5 ; GCN-LABEL: {{^}}kernel:
6 ; GCN: flat_store_dword
7 define amdgpu_kernel void @kernel(ptr addrspace(1) %out) #0 {
8 entry:
9   store i32 0, ptr addrspace(1) %out
10   ret void
13 ; GCN-LABEL: {{^}}func:
14 ; GCN: ; NumVgprs: 8
15 define hidden void @func() #1 {
16   call void asm sideeffect "", "~{v0},~{v1},~{v2},~{v3},~{v4},~{v5},~{v6},~{v7}"() #0
17   ret void
20 ; GCN-LABEL: {{^}}kernel_call:
21 ; GCN-NOT: buffer_store
22 ; GCN-NOT: buffer_load
23 ; GCN-NOT: readlane
24 ; GCN-NOT: writelane
25 ; GCN: flat_load_dword v8
26 ; GCN: s_swappc_b64
27 ; GCN-NOT: buffer_store
28 ; GCN-NOT: buffer_load
29 ; GCN-NOT: readlane
30 ; GCN-NOT: writelane
31 ; GCN: flat_store_dword v{{\[[0-9]+:[0-9]+\]}}, v8
33 ; GCN: ; NumSgprs: 37
34 ; GCN: ; NumVgprs: 9
35 define amdgpu_kernel void @kernel_call() #0 {
36   %vgpr = load volatile i32, ptr addrspace(1) undef
37   tail call void @func()
38   store volatile i32 %vgpr, ptr addrspace(1) undef
39   ret void
42 ; GCN-LABEL: {{^}}func_regular_call:
43 ; GCN-NOT: buffer_load
44 ; GCN-NOT: readlane
45 ; GCN: flat_load_dword v9
46 ; GCN: s_swappc_b64
47 ; GCN-NOT: buffer_load
48 ; GCN-NOT: readlane
49 ; GCN: flat_store_dword v{{\[[0-9]+:[0-9]+\]}}, v9
51 ; GCN: ; NumSgprs: 34
52 ; GCN: ; NumVgprs: 10
53 define void @func_regular_call() #1 {
54   %vgpr = load volatile i32, ptr addrspace(1) undef
55   tail call void @func()
56   store volatile i32 %vgpr, ptr addrspace(1) undef
57   ret void
60 ; GCN-LABEL: {{^}}func_tail_call:
61 ; GCN: s_waitcnt
62 ; GCN-NEXT: s_getpc_b64 s[4:5]
63 ; GCN-NEXT: s_add_u32 s4,
64 ; GCN-NEXT: s_addc_u32 s5,
65 ; GCN-NEXT: s_setpc_b64 s[4:5]
67 ; GCN: ; NumSgprs: 32
68 ; GCN: ; NumVgprs: 8
69 define void @func_tail_call() #1 {
70   tail call void @func()
71   ret void
74 ; GCN-LABEL: {{^}}func_call_tail_call:
75 ; GCN: flat_load_dword v9
76 ; GCN: s_swappc_b64
77 ; GCN: flat_store_dword v{{\[[0-9]+:[0-9]+\]}}, v9
78 ; GCN: s_setpc_b64
80 ; GCN: ; NumSgprs: 34
81 ; GCN: ; NumVgprs: 10
82 define void @func_call_tail_call() #1 {
83   %vgpr = load volatile i32, ptr addrspace(1) undef
84   tail call void @func()
85   store volatile i32 %vgpr, ptr addrspace(1) undef
86   tail call void @func()
87   ret void
90 ; GCN-LABEL: {{^}}void_func_void:
91 define void @void_func_void() noinline {
92   ret void
95 ; Make sure we don't get save/restore of FP between calls.
96 ; GCN-LABEL: {{^}}test_funcx2:
97 ; GCN: s_getpc_b64
98 ; GCN-NOT: s32
99 ; GCN: s_swappc_b64
100 ; GCN-NOT: s32
101 ; GCN: s_swappc_b64
102 define void @test_funcx2() #0 {
103   call void @void_func_void()
104   call void @void_func_void()
105   ret void
108 ; GCN-LABEL: {{^}}wombat:
109 define weak amdgpu_kernel void @wombat(ptr %arg, ptr %arg2) {
111   call void @hoge() #0
112   ret void
115 ; Make sure we save/restore the return address around the call.
116 ; Function Attrs: norecurse
117 define internal void @hoge() #2 {
119 ; GCN-LABEL: {{^}}hoge:
120 ; GCN-DAG: v_writelane_b32 [[CSR_VGPR:v[0-9]+]], s30,
121 ; GCN-DAG: v_writelane_b32 [[CSR_VGPR]], s31,
122 ; GCN: s_swappc_b64 s[30:31]
123 ; GCN-DAG: v_readlane_b32 s30, [[CSR_VGPR]],
124 ; GCN-DAG: v_readlane_b32 s31, [[CSR_VGPR]],
125 ; GCN: s_waitcnt vmcnt(0)
126 ; GCN: s_setpc_b64 s[30:31]
127   call void @eggs()
128   ret void
131 declare dso_local void @eggs()
134 attributes #0 = { nounwind }
135 attributes #1 = { nounwind noinline "amdgpu-no-workitem-id-x" "amdgpu-no-workitem-id-y" "amdgpu-no-workitem-id-z" }
136 attributes #2 = { norecurse }