Run DCE after a LoopFlatten test to reduce spurious output [nfc]
[llvm-project.git] / llvm / test / CodeGen / NVPTX / barrier.ll
bloba25d77d62911c6923ccc451e81392a459a1ffd7d
1 ; RUN: llc < %s -march=nvptx64 -mcpu=sm_30 -mattr=+ptx60 | FileCheck %s
2 ; RUN: %if ptxas %{ llc < %s -march=nvptx64 -mcpu=sm_30 -mattr=+ptx60 | %ptxas-verify %}
4 declare void @llvm.nvvm.bar.warp.sync(i32)
5 declare void @llvm.nvvm.barrier.sync(i32)
6 declare void @llvm.nvvm.barrier.sync.cnt(i32, i32)
8 ; CHECK-LABEL: .func{{.*}}barrier_sync
9 define void @barrier_sync(i32 %id, i32 %cnt) {
10   ; CHECK: ld.param.u32         [[ID:%r[0-9]+]], [barrier_sync_param_0];
11   ; CHECK: ld.param.u32         [[CNT:%r[0-9]+]], [barrier_sync_param_1];
13   ; CHECK:  barrier.sync [[ID]], [[CNT]];
14   call void @llvm.nvvm.barrier.sync.cnt(i32 %id, i32 %cnt)
15   ; CHECK:  barrier.sync [[ID]], 32;
16   call void @llvm.nvvm.barrier.sync.cnt(i32 %id, i32 32)
17   ; CHECK:  barrier.sync 3, [[CNT]];
18   call void @llvm.nvvm.barrier.sync.cnt(i32 3, i32 %cnt)
19   ; CHECK:  barrier.sync 4, 64;
20   call void @llvm.nvvm.barrier.sync.cnt(i32 4, i32 64)
22   ; CHECK: barrier.sync [[ID]];
23   call void @llvm.nvvm.barrier.sync(i32 %id)
24   ; CHECK: barrier.sync 1;
25   call void @llvm.nvvm.barrier.sync(i32 1)
27   ; CHECK: bar.warp.sync [[ID]];
28   call void @llvm.nvvm.bar.warp.sync(i32 %id)
29   ; CHECK: bar.warp.sync 6;
30   call void @llvm.nvvm.bar.warp.sync(i32 6)
31   ret void;