1 ; RUN: llc < %s -mtriple=nvptx -mcpu=sm_20 | FileCheck %s --check-prefixes=ALL,G32,LS32
2 ; RUN: llc < %s -mtriple=nvptx64 -mcpu=sm_20 | FileCheck %s --check-prefixes=ALL,G64,LS64
3 ; RUN: llc < %s -mtriple=nvptx64 -mcpu=sm_20 --nvptx-short-ptr | FileCheck %s --check-prefixes=G64,LS32
4 ; RUN: %if ptxas && !ptxas-12.0 %{ llc < %s -mtriple=nvptx -mcpu=sm_20 | %ptxas-verify %}
5 ; RUN: %if ptxas %{ llc < %s -mtriple=nvptx64 -mcpu=sm_20 | %ptxas-verify %}
6 ; RUN: %if ptxas %{ llc < %s -mtriple=nvptx64 -mcpu=sm_20 --nvptx-short-ptr | %ptxas-verify %}
9 ; ALL-LABEL: st_global_i8
10 define void @st_global_i8(ptr addrspace(1) %ptr, i8 %a) {
11 ; G32: st.global.u8 [%r{{[0-9]+}}], %rs{{[0-9]+}}
12 ; G64: st.global.u8 [%rd{{[0-9]+}}], %rs{{[0-9]+}}
14 store i8 %a, ptr addrspace(1) %ptr
17 ; ALL-LABEL: st_shared_i8
18 define void @st_shared_i8(ptr addrspace(3) %ptr, i8 %a) {
19 ; LS32: st.shared.u8 [%r{{[0-9]+}}], %rs{{[0-9]+}}
20 ; LS64: st.shared.u8 [%rd{{[0-9]+}}], %rs{{[0-9]+}}
22 store i8 %a, ptr addrspace(3) %ptr
25 ; ALL-LABEL: st_local_i8
26 define void @st_local_i8(ptr addrspace(5) %ptr, i8 %a) {
27 ; LS32: st.local.u8 [%r{{[0-9]+}}], %rs{{[0-9]+}}
28 ; LS64: st.local.u8 [%rd{{[0-9]+}}], %rs{{[0-9]+}}
30 store i8 %a, ptr addrspace(5) %ptr
35 ; ALL-LABEL: st_global_i16
36 define void @st_global_i16(ptr addrspace(1) %ptr, i16 %a) {
37 ; G32: st.global.u16 [%r{{[0-9]+}}], %rs{{[0-9]+}}
38 ; G64: st.global.u16 [%rd{{[0-9]+}}], %rs{{[0-9]+}}
40 store i16 %a, ptr addrspace(1) %ptr
43 ; ALL-LABEL: st_shared_i16
44 define void @st_shared_i16(ptr addrspace(3) %ptr, i16 %a) {
45 ; LS32: st.shared.u16 [%r{{[0-9]+}}], %rs{{[0-9]+}}
46 ; LS64: st.shared.u16 [%rd{{[0-9]+}}], %rs{{[0-9]+}}
48 store i16 %a, ptr addrspace(3) %ptr
51 ; ALL-LABEL: st_local_i16
52 define void @st_local_i16(ptr addrspace(5) %ptr, i16 %a) {
53 ; LS32: st.local.u16 [%r{{[0-9]+}}], %rs{{[0-9]+}}
54 ; LS64: st.local.u16 [%rd{{[0-9]+}}], %rs{{[0-9]+}}
56 store i16 %a, ptr addrspace(5) %ptr
61 ; ALL-LABEL: st_global_i32
62 define void @st_global_i32(ptr addrspace(1) %ptr, i32 %a) {
63 ; G32: st.global.u32 [%r{{[0-9]+}}], %r{{[0-9]+}}
64 ; G64: st.global.u32 [%rd{{[0-9]+}}], %r{{[0-9]+}}
66 store i32 %a, ptr addrspace(1) %ptr
69 ; ALL-LABEL: st_shared_i32
70 define void @st_shared_i32(ptr addrspace(3) %ptr, i32 %a) {
71 ; LS32: st.shared.u32 [%r{{[0-9]+}}], %r{{[0-9]+}}
72 ; LS64: st.shared.u32 [%rd{{[0-9]+}}], %r{{[0-9]+}}
74 store i32 %a, ptr addrspace(3) %ptr
77 ; ALL-LABEL: st_local_i32
78 define void @st_local_i32(ptr addrspace(5) %ptr, i32 %a) {
79 ; LS32: st.local.u32 [%r{{[0-9]+}}], %r{{[0-9]+}}
80 ; LS64: st.local.u32 [%rd{{[0-9]+}}], %r{{[0-9]+}}
82 store i32 %a, ptr addrspace(5) %ptr
87 ; ALL-LABEL: st_global_i64
88 define void @st_global_i64(ptr addrspace(1) %ptr, i64 %a) {
89 ; G32: st.global.u64 [%r{{[0-9]+}}], %rd{{[0-9]+}}
90 ; G64: st.global.u64 [%rd{{[0-9]+}}], %rd{{[0-9]+}}
92 store i64 %a, ptr addrspace(1) %ptr
95 ; ALL-LABEL: st_shared_i64
96 define void @st_shared_i64(ptr addrspace(3) %ptr, i64 %a) {
97 ; LS32: st.shared.u64 [%r{{[0-9]+}}], %rd{{[0-9]+}}
98 ; LS64: st.shared.u64 [%rd{{[0-9]+}}], %rd{{[0-9]+}}
100 store i64 %a, ptr addrspace(3) %ptr
103 ; ALL-LABEL: st_local_i64
104 define void @st_local_i64(ptr addrspace(5) %ptr, i64 %a) {
105 ; LS32: st.local.u64 [%r{{[0-9]+}}], %rd{{[0-9]+}}
106 ; LS64: st.local.u64 [%rd{{[0-9]+}}], %rd{{[0-9]+}}
108 store i64 %a, ptr addrspace(5) %ptr
113 ; ALL-LABEL: st_global_f32
114 define void @st_global_f32(ptr addrspace(1) %ptr, float %a) {
115 ; G32: st.global.f32 [%r{{[0-9]+}}], %f{{[0-9]+}}
116 ; G64: st.global.f32 [%rd{{[0-9]+}}], %f{{[0-9]+}}
118 store float %a, ptr addrspace(1) %ptr
121 ; ALL-LABEL: st_shared_f32
122 define void @st_shared_f32(ptr addrspace(3) %ptr, float %a) {
123 ; LS32: st.shared.f32 [%r{{[0-9]+}}], %f{{[0-9]+}}
124 ; LS64: st.shared.f32 [%rd{{[0-9]+}}], %f{{[0-9]+}}
126 store float %a, ptr addrspace(3) %ptr
129 ; ALL-LABEL: st_local_f32
130 define void @st_local_f32(ptr addrspace(5) %ptr, float %a) {
131 ; LS32: st.local.f32 [%r{{[0-9]+}}], %f{{[0-9]+}}
132 ; LS64: st.local.f32 [%rd{{[0-9]+}}], %f{{[0-9]+}}
134 store float %a, ptr addrspace(5) %ptr
139 ; ALL-LABEL: st_global_f64
140 define void @st_global_f64(ptr addrspace(1) %ptr, double %a) {
141 ; G32: st.global.f64 [%r{{[0-9]+}}], %fd{{[0-9]+}}
142 ; G64: st.global.f64 [%rd{{[0-9]+}}], %fd{{[0-9]+}}
144 store double %a, ptr addrspace(1) %ptr
147 ; ALL-LABEL: st_shared_f64
148 define void @st_shared_f64(ptr addrspace(3) %ptr, double %a) {
149 ; LS32: st.shared.f64 [%r{{[0-9]+}}], %fd{{[0-9]+}}
150 ; LS64: st.shared.f64 [%rd{{[0-9]+}}], %fd{{[0-9]+}}
152 store double %a, ptr addrspace(3) %ptr
155 ; ALL-LABEL: st_local_f64
156 define void @st_local_f64(ptr addrspace(5) %ptr, double %a) {
157 ; LS32: st.local.f64 [%r{{[0-9]+}}], %fd{{[0-9]+}}
158 ; LS64: st.local.f64 [%rd{{[0-9]+}}], %fd{{[0-9]+}}
160 store double %a, ptr addrspace(5) %ptr