Run DCE after a LoopFlatten test to reduce spurious output [nfc]
[llvm-project.git] / llvm / test / CodeGen / AMDGPU / call-skip.ll
blobea2bba1673a0b0f525afccc4b17e37b502b936f5
1 ; RUN: llc -mtriple=amdgcn-amd-amdhsa -mcpu=hawaii < %s | FileCheck -enable-var-scope -check-prefix=GCN %s
3 ; A call should be skipped if all lanes are zero, since we don't know
4 ; what side effects should be avoided inside the call.
5 define hidden void @func() #1 {
6   ret void
9 ; GCN-LABEL: {{^}}if_call:
10 ; GCN: s_and_saveexec_b64
11 ; GCN-NEXT: s_cbranch_execz [[END:.LBB[0-9]+_[0-9]+]]
12 ; GCN: s_swappc_b64
13 ; GCN: [[END]]:
14 define void @if_call(i32 %flag) #0 {
15   %cc = icmp eq i32 %flag, 0
16   br i1 %cc, label %call, label %end
18 call:
19   call void @func()
20   br label %end
22 end:
23   ret void
26 ; GCN-LABEL: {{^}}if_asm:
27 ; GCN: s_and_saveexec_b64
28 ; GCN-NEXT: s_cbranch_execz [[END:.LBB[0-9]+_[0-9]+]]
29 ; GCN: ; sample asm
30 ; GCN: [[END]]:
31 define void @if_asm(i32 %flag) #0 {
32   %cc = icmp eq i32 %flag, 0
33   br i1 %cc, label %call, label %end
35 call:
36   call void asm sideeffect "; sample asm", ""()
37   br label %end
39 end:
40   ret void
43 ; GCN-LABEL: {{^}}if_call_kernel:
44 ; GCN: s_and_saveexec_b64
45 ; GCN-NEXT: s_cbranch_execz .LBB3_2
46 ; GCN: s_swappc_b64
47 define amdgpu_kernel void @if_call_kernel() #0 {
48   %id = call i32 @llvm.amdgcn.workitem.id.x()
49   %cc = icmp eq i32 %id, 0
50   br i1 %cc, label %call, label %end
52 call:
53   call void @func()
54   br label %end
56 end:
57   ret void
60 declare i32 @llvm.amdgcn.workitem.id.x() #2
62 attributes #0 = { nounwind }
63 attributes #1 = { nounwind noinline }
64 attributes #2 = { nounwind readnone speculatable }