Run DCE after a LoopFlatten test to reduce spurious output [nfc]
[llvm-project.git] / llvm / test / CodeGen / AMDGPU / barrier-elimination.ll
blob84b17f08bc3b16dc92c6fa373bf4e4fe27f08fee
1 ; RUN: llc -march=amdgcn < %s | FileCheck %s
2 ; RUN: llc -march=amdgcn < %s -global-isel | FileCheck %s
4 ; CHECK-LABEL: {{^}}unknown_wgs:
5 ; CHECK: s_barrier
6 define amdgpu_kernel void @unknown_wgs() {
7   tail call void @llvm.amdgcn.s.barrier() #0
8   ret void
11 ; CHECK-LABEL: {{^}}flat_wgs_attr_32_128:
12 ; CHECK: s_barrier
13 define amdgpu_kernel void @flat_wgs_attr_32_128() #1 {
14   tail call void @llvm.amdgcn.s.barrier() #0
15   ret void
18 ; CHECK-LABEL: {{^}}flat_wgs_attr_32_64:
19 ; CHECK: :
20 ; CHECK-NEXT: ; wave barrier
21 ; CHECK-NEXT: s_endpgm
22 define amdgpu_kernel void @flat_wgs_attr_32_64() #2 {
23   tail call void @llvm.amdgcn.s.barrier() #0
24   ret void
27 declare void @llvm.amdgcn.s.barrier() #0
29 attributes #0 = { convergent nounwind }
30 attributes #1 = { nounwind "amdgpu-flat-work-group-size"="32,128" }
31 attributes #2 = { nounwind "amdgpu-flat-work-group-size"="32,64" }