[ORC] Add std::tuple support to SimplePackedSerialization.
[llvm-project.git] / llvm / test / CodeGen / NVPTX / mbarrier.ll
blob160c4030d26ca90904c7e4f99514b199d76efe07
1 ; RUN: llc < %s -march=nvptx -mcpu=sm_80 | FileCheck %s -check-prefix=CHECK_PTX32
2 ; RUN: llc < %s -march=nvptx64 -mcpu=sm_80 | FileCheck %s -check-prefix=CHECK_PTX64
4 declare void @llvm.nvvm.mbarrier.init(i64* %a, i32 %b)
5 declare void @llvm.nvvm.mbarrier.init.shared(i64 addrspace(3)* %a, i32 %b)
7 ; CHECK-LABEL: barrierinit
8 define void @barrierinit(i64* %a, i32 %b) {
9 ; CHECK_PTX32: mbarrier.init.b64 [%r{{[0-9]+}}], %r{{[0-9]+}};
10 ; CHECK_PTX64: mbarrier.init.b64 [%rd{{[0-9]+}}], %r{{[0-9]+}};
11   tail call void @llvm.nvvm.mbarrier.init(i64* %a, i32 %b)
12   ret void
15 ; CHECK-LABEL: barrierinitshared
16 define void @barrierinitshared(i64 addrspace(3)* %a, i32 %b) {
17 ; CHECK_PTX32: mbarrier.init.shared.b64 [%r{{[0-9]+}}], %r{{[0-9]+}};
18 ; CHECK_PTX64: mbarrier.init.shared.b64 [%rd{{[0-9]+}}], %r{{[0-9]+}};
19   tail call void @llvm.nvvm.mbarrier.init.shared(i64 addrspace(3)* %a, i32 %b)
20   ret void
23 declare void @llvm.nvvm.mbarrier.inval(i64* %a)
24 declare void @llvm.nvvm.mbarrier.inval.shared(i64 addrspace(3)* %a)
26 ; CHECK-LABEL: barrierinval
27 define void @barrierinval(i64* %a) {
28 ; CHECK_PTX32: mbarrier.inval.b64 [%r{{[0-1]+}}];
29 ; CHECK_PTX64: mbarrier.inval.b64 [%rd{{[0-1]+}}];
30   tail call void @llvm.nvvm.mbarrier.inval(i64* %a)
31   ret void
34 ; CHECK-LABEL: barrierinvalshared
35 define void @barrierinvalshared(i64 addrspace(3)* %a) {
36 ; CHECK_PTX32: mbarrier.inval.shared.b64 [%r{{[0-1]+}}];
37 ; CHECK_PTX64: mbarrier.inval.shared.b64 [%rd{{[0-1]+}}];
38   tail call void @llvm.nvvm.mbarrier.inval.shared(i64 addrspace(3)* %a)
39   ret void
42 declare i64 @llvm.nvvm.mbarrier.arrive(i64* %a)
43 declare i64 @llvm.nvvm.mbarrier.arrive.shared(i64 addrspace(3)* %a)
45 ; CHECK-LABEL: barrierarrive
46 define void @barrierarrive(i64* %a) {
47 ; CHECK_PTX32: mbarrier.arrive.b64 %rd{{[0-9]+}}, [%r{{[0-9]+}}];
48 ; CHECK_PTX64: mbarrier.arrive.b64 %rd{{[0-9]+}}, [%rd{{[0-9]+}}];
49   %ret = tail call i64 @llvm.nvvm.mbarrier.arrive(i64* %a)
50   ret void
53 ; CHECK-LABEL: barrierarriveshared
54 define void @barrierarriveshared(i64 addrspace(3)* %a) {
55 ; CHECK_PTX32: mbarrier.arrive.shared.b64 %rd{{[0-9]+}}, [%r{{[0-9]+}}];
56 ; CHECK_PTX64: mbarrier.arrive.shared.b64 %rd{{[0-9]+}}, [%rd{{[0-9]+}}];
57   %ret = tail call i64 @llvm.nvvm.mbarrier.arrive.shared(i64 addrspace(3)* %a)
58   ret void
61 declare i64 @llvm.nvvm.mbarrier.arrive.noComplete(i64* %a, i32 %b)
62 declare i64 @llvm.nvvm.mbarrier.arrive.noComplete.shared(i64 addrspace(3)* %a, i32 %b)
64 ; CHECK-LABEL: barrierarrivenoComplete
65 define void @barrierarrivenoComplete(i64* %a, i32 %b) {
66 ; CHECK_PTX32: mbarrier.arrive.noComplete.b64 %rd{{[0-9]+}}, [%r{{[0-9]+}}], %r{{[0-9]+}};
67 ; CHECK_PTX64: mbarrier.arrive.noComplete.b64 %rd{{[0-9]+}}, [%rd{{[0-9]+}}], %r{{[0-9]+}};
68   %ret = tail call i64 @llvm.nvvm.mbarrier.arrive.noComplete(i64* %a, i32 %b)
69   ret void
72 ; CHECK-LABEL: barrierarrivenoCompleteshared
73 define void @barrierarrivenoCompleteshared(i64 addrspace(3)* %a, i32 %b) {
74 ; CHECK_PTX32: mbarrier.arrive.noComplete.shared.b64 %rd{{[0-9]+}}, [%r{{[0-9]+}}], %r{{[0-9]+}};
75 ; CHECK_PTX64: mbarrier.arrive.noComplete.shared.b64 %rd{{[0-9]+}}, [%rd{{[0-9]+}}], %r{{[0-9]+}};
76   %ret = tail call i64 @llvm.nvvm.mbarrier.arrive.noComplete.shared(i64 addrspace(3)* %a, i32 %b)
77   ret void
80 declare i64 @llvm.nvvm.mbarrier.arrive.drop(i64* %a)
81 declare i64 @llvm.nvvm.mbarrier.arrive.drop.shared(i64 addrspace(3)* %a)
83 ; CHECK-LABEL: barrierarrivedrop
84 define void @barrierarrivedrop(i64* %a) {
85 ; CHECK_PTX32: mbarrier.arrive_drop.b64 %rd{{[0-9]+}}, [%r{{[0-9]+}}];
86 ; CHECK_PTX64: mbarrier.arrive_drop.b64 %rd{{[0-9]+}}, [%rd{{[0-9]+}}];
87   %ret = tail call i64 @llvm.nvvm.mbarrier.arrive.drop(i64* %a)
88   ret void
91 ; CHECK-LABEL: barrierarrivedropshared
92 define void @barrierarrivedropshared(i64 addrspace(3)* %a) {
93 ; CHECK_PTX32: mbarrier.arrive_drop.shared.b64 %rd{{[0-9]+}}, [%r{{[0-9]+}}];
94 ; CHECK_PTX64: mbarrier.arrive_drop.shared.b64 %rd{{[0-9]+}}, [%rd{{[0-9]+}}];
95   %ret = tail call i64 @llvm.nvvm.mbarrier.arrive.drop.shared(i64 addrspace(3)* %a)
96   ret void
99 declare i64 @llvm.nvvm.mbarrier.arrive.drop.noComplete(i64* %a, i32 %b)
100 declare i64 @llvm.nvvm.mbarrier.arrive.drop.noComplete.shared(i64 addrspace(3)* %a, i32 %b)
102 ; CHECK-LABEL: barrierarrivedropnoComplete
103 define void @barrierarrivedropnoComplete(i64* %a, i32 %b) {
104 ; CHECK_PTX32: mbarrier.arrive_drop.noComplete.b64 %rd{{[0-9]+}}, [%r{{[0-9]+}}], %r{{[0-9]+}};
105 ; CHECK_PTX64: mbarrier.arrive_drop.noComplete.b64 %rd{{[0-9]+}}, [%rd{{[0-9]+}}], %r{{[0-9]+}};
106   %ret = tail call i64 @llvm.nvvm.mbarrier.arrive.drop.noComplete(i64* %a, i32 %b)
107   ret void
110 ; CHECK-LABEL: barrierarrivedropnoCompleteshared
111 define void @barrierarrivedropnoCompleteshared(i64 addrspace(3)* %a, i32 %b) {
112 ; CHECK_PTX32: mbarrier.arrive_drop.noComplete.shared.b64 %rd{{[0-9]+}}, [%r{{[0-9]+}}], %r{{[0-9]+}};
113 ; CHECK_PTX64: mbarrier.arrive_drop.noComplete.shared.b64 %rd{{[0-9]+}}, [%rd{{[0-9]+}}], %r{{[0-9]+}};
114   %ret = tail call i64 @llvm.nvvm.mbarrier.arrive.drop.noComplete.shared(i64 addrspace(3)* %a, i32 %b)
115   ret void
118 declare i1 @llvm.nvvm.mbarrier.test.wait(i64* %a, i64 %b)
119 declare i1 @llvm.nvvm.mbarrier.test.wait.shared(i64 addrspace(3)* %a, i64 %b)
121 ; CHECK-LABEL: barriertestwait
122 define void @barriertestwait(i64* %a, i64 %b) {
123 ; CHECK_PTX32: mbarrier.test_wait.b64 %p{{[0-9]+}}, [%r{{[0-9]+}}], %rd{{[0-9]+}};
124 ; CHECK_PTX64: mbarrier.test_wait.b64 %p{{[0-9]+}}, [%rd{{[0-9]+}}], %rd{{[0-9]+}};
125   %ret = tail call i1 @llvm.nvvm.mbarrier.test.wait(i64* %a, i64 %b)
126   ret void
129 ; CHECK-LABEL: barriertestwaitshared
130 define void @barriertestwaitshared(i64 addrspace(3)* %a, i64 %b) {
131 ; CHECK_PTX32: mbarrier.test_wait.shared.b64 %p{{[0-9]+}}, [%r{{[0-9]+}}], %rd{{[0-9]+}};
132 ; CHECK_PTX64: mbarrier.test_wait.shared.b64 %p{{[0-9]+}}, [%rd{{[0-9]+}}], %rd{{[0-9]+}};
133   %ret = tail call i1 @llvm.nvvm.mbarrier.test.wait.shared(i64 addrspace(3)* %a, i64 %b)
134   ret void
137 declare i32 @llvm.nvvm.mbarrier.pending.count(i64 %b)
139 ; CHECK-LABEL: barrierpendingcount
140 define i32 @barrierpendingcount(i64* %a, i64 %b) {
141 ; CHECK_PTX32: mbarrier.pending_count.b64 %r{{[0-9]+}}, %rd{{[0-9]+}};
142 ; CHECK_PTX64: mbarrier.pending_count.b64 %r{{[0-9]+}}, %rd{{[0-9]+}};
143   %ret = tail call i32 @llvm.nvvm.mbarrier.pending.count(i64 %b)
144   ret i32 %ret