Run DCE after a LoopFlatten test to reduce spurious output [nfc]
[llvm-project.git] / llvm / test / CodeGen / AMDGPU / GlobalISel / inst-select-atomic-cmpxchg-region.mir
blobc69abab500ab816d76532342d32ad522e33d537d
1 # NOTE: Assertions have been autogenerated by utils/update_mir_test_checks.py
2 # RUN: llc -march=amdgcn -mcpu=tahiti -run-pass=instruction-select -verify-machineinstrs  -global-isel-abort=0 -o - %s | FileCheck -check-prefix=GFX6 %s
3 # RUN: llc -march=amdgcn -mcpu=hawaii -run-pass=instruction-select -verify-machineinstrs  -global-isel-abort=0 -o - %s | FileCheck -check-prefix=GFX7 %s
4 # RUN: llc -march=amdgcn -mcpu=fiji -run-pass=instruction-select -verify-machineinstrs  -global-isel-abort=0 -o - %s | FileCheck -check-prefix=GFX7 %s
5 # RUN: llc -march=amdgcn -mcpu=gfx900 -run-pass=instruction-select -verify-machineinstrs -global-isel-abort=0 -o - %s | FileCheck -check-prefix=GFX9 %s
6 # RUN: llc -march=amdgcn -mcpu=gfx1010 -run-pass=instruction-select -verify-machineinstrs -global-isel-abort=0 -o - %s | FileCheck -check-prefix=GFX9 %s
7 # RUN: llc -march=amdgcn -mcpu=gfx1100 -run-pass=instruction-select -verify-machineinstrs -global-isel-abort=0 -o - %s | FileCheck -check-prefix=GFX11 %s
10 ---
11 name:            atomic_cmpxchg_s32_region
12 legalized:       true
13 regBankSelected: true
14 tracksRegLiveness: true
15 body:             |
16   bb.0:
17     liveins: $vgpr0, $vgpr1, $vgpr2
19     ; GFX6-LABEL: name: atomic_cmpxchg_s32_region
20     ; GFX6: liveins: $vgpr0, $vgpr1, $vgpr2
21     ; GFX6-NEXT: {{  $}}
22     ; GFX6-NEXT: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
23     ; GFX6-NEXT: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr1
24     ; GFX6-NEXT: [[COPY2:%[0-9]+]]:vgpr_32 = COPY $vgpr2
25     ; GFX6-NEXT: $m0 = S_MOV_B32 -1
26     ; GFX6-NEXT: [[DS_CMPST_RTN_B32_:%[0-9]+]]:vgpr_32 = DS_CMPST_RTN_B32 [[COPY]], [[COPY1]], [[COPY2]], 0, 1, implicit $m0, implicit $exec :: (load store seq_cst (s32), addrspace 2)
27     ; GFX6-NEXT: $vgpr0 = COPY [[DS_CMPST_RTN_B32_]]
28     ; GFX7-LABEL: name: atomic_cmpxchg_s32_region
29     ; GFX7: liveins: $vgpr0, $vgpr1, $vgpr2
30     ; GFX7-NEXT: {{  $}}
31     ; GFX7-NEXT: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
32     ; GFX7-NEXT: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr1
33     ; GFX7-NEXT: [[COPY2:%[0-9]+]]:vgpr_32 = COPY $vgpr2
34     ; GFX7-NEXT: $m0 = S_MOV_B32 -1
35     ; GFX7-NEXT: [[DS_CMPST_RTN_B32_:%[0-9]+]]:vgpr_32 = DS_CMPST_RTN_B32 [[COPY]], [[COPY1]], [[COPY2]], 0, 1, implicit $m0, implicit $exec :: (load store seq_cst (s32), addrspace 2)
36     ; GFX7-NEXT: $vgpr0 = COPY [[DS_CMPST_RTN_B32_]]
37     ; GFX9-LABEL: name: atomic_cmpxchg_s32_region
38     ; GFX9: liveins: $vgpr0, $vgpr1, $vgpr2
39     ; GFX9-NEXT: {{  $}}
40     ; GFX9-NEXT: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
41     ; GFX9-NEXT: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr1
42     ; GFX9-NEXT: [[COPY2:%[0-9]+]]:vgpr_32 = COPY $vgpr2
43     ; GFX9-NEXT: [[DS_CMPST_RTN_B32_:%[0-9]+]]:vgpr_32 = DS_CMPST_RTN_B32 [[COPY]], [[COPY1]], [[COPY2]], 0, 1, implicit $m0, implicit $exec :: (load store seq_cst (s32), addrspace 2)
44     ; GFX9-NEXT: $vgpr0 = COPY [[DS_CMPST_RTN_B32_]]
45     ; GFX11-LABEL: name: atomic_cmpxchg_s32_region
46     ; GFX11: liveins: $vgpr0, $vgpr1, $vgpr2
47     ; GFX11-NEXT: {{  $}}
48     ; GFX11-NEXT: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
49     ; GFX11-NEXT: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr1
50     ; GFX11-NEXT: [[COPY2:%[0-9]+]]:vgpr_32 = COPY $vgpr2
51     ; GFX11-NEXT: [[DS_CMPSTORE_RTN_B32_:%[0-9]+]]:vgpr_32 = DS_CMPSTORE_RTN_B32 [[COPY]], [[COPY2]], [[COPY1]], 0, 1, implicit $m0, implicit $exec :: (load store seq_cst (s32), addrspace 2)
52     ; GFX11-NEXT: $vgpr0 = COPY [[DS_CMPSTORE_RTN_B32_]]
53     %0:vgpr(p2) = COPY $vgpr0
54     %1:vgpr(s32) = COPY $vgpr1
55     %2:vgpr(s32) = COPY $vgpr2
56     %3:vgpr(s32) = G_ATOMIC_CMPXCHG %0, %1, %2 :: (load store seq_cst (s32), addrspace 2)
57     $vgpr0 = COPY %3
59 ...
61 ---
62 name:            atomic_cmpxchg_s32_region_gep4
63 legalized:       true
64 regBankSelected: true
65 tracksRegLiveness: true
66 body:             |
67   bb.0:
68     liveins: $vgpr0, $vgpr1, $vgpr2
70     ; GFX6-LABEL: name: atomic_cmpxchg_s32_region_gep4
71     ; GFX6: liveins: $vgpr0, $vgpr1, $vgpr2
72     ; GFX6-NEXT: {{  $}}
73     ; GFX6-NEXT: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
74     ; GFX6-NEXT: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr1
75     ; GFX6-NEXT: [[COPY2:%[0-9]+]]:vgpr_32 = COPY $vgpr2
76     ; GFX6-NEXT: [[V_MOV_B32_e32_:%[0-9]+]]:vgpr_32 = V_MOV_B32_e32 4, implicit $exec
77     ; GFX6-NEXT: %4:vgpr_32, dead %6:sreg_64_xexec = V_ADD_CO_U32_e64 [[COPY]], [[V_MOV_B32_e32_]], 0, implicit $exec
78     ; GFX6-NEXT: $m0 = S_MOV_B32 -1
79     ; GFX6-NEXT: [[DS_CMPST_RTN_B32_:%[0-9]+]]:vgpr_32 = DS_CMPST_RTN_B32 %4, [[COPY1]], [[COPY2]], 0, 1, implicit $m0, implicit $exec :: (load store seq_cst (s32), addrspace 2)
80     ; GFX6-NEXT: $vgpr0 = COPY [[DS_CMPST_RTN_B32_]]
81     ; GFX7-LABEL: name: atomic_cmpxchg_s32_region_gep4
82     ; GFX7: liveins: $vgpr0, $vgpr1, $vgpr2
83     ; GFX7-NEXT: {{  $}}
84     ; GFX7-NEXT: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
85     ; GFX7-NEXT: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr1
86     ; GFX7-NEXT: [[COPY2:%[0-9]+]]:vgpr_32 = COPY $vgpr2
87     ; GFX7-NEXT: $m0 = S_MOV_B32 -1
88     ; GFX7-NEXT: [[DS_CMPST_RTN_B32_:%[0-9]+]]:vgpr_32 = DS_CMPST_RTN_B32 [[COPY]], [[COPY1]], [[COPY2]], 4, 1, implicit $m0, implicit $exec :: (load store seq_cst (s32), addrspace 2)
89     ; GFX7-NEXT: $vgpr0 = COPY [[DS_CMPST_RTN_B32_]]
90     ; GFX9-LABEL: name: atomic_cmpxchg_s32_region_gep4
91     ; GFX9: liveins: $vgpr0, $vgpr1, $vgpr2
92     ; GFX9-NEXT: {{  $}}
93     ; GFX9-NEXT: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
94     ; GFX9-NEXT: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr1
95     ; GFX9-NEXT: [[COPY2:%[0-9]+]]:vgpr_32 = COPY $vgpr2
96     ; GFX9-NEXT: [[DS_CMPST_RTN_B32_:%[0-9]+]]:vgpr_32 = DS_CMPST_RTN_B32 [[COPY]], [[COPY1]], [[COPY2]], 4, 1, implicit $m0, implicit $exec :: (load store seq_cst (s32), addrspace 2)
97     ; GFX9-NEXT: $vgpr0 = COPY [[DS_CMPST_RTN_B32_]]
98     ; GFX11-LABEL: name: atomic_cmpxchg_s32_region_gep4
99     ; GFX11: liveins: $vgpr0, $vgpr1, $vgpr2
100     ; GFX11-NEXT: {{  $}}
101     ; GFX11-NEXT: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
102     ; GFX11-NEXT: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr1
103     ; GFX11-NEXT: [[COPY2:%[0-9]+]]:vgpr_32 = COPY $vgpr2
104     ; GFX11-NEXT: [[DS_CMPSTORE_RTN_B32_:%[0-9]+]]:vgpr_32 = DS_CMPSTORE_RTN_B32 [[COPY]], [[COPY2]], [[COPY1]], 4, 1, implicit $m0, implicit $exec :: (load store seq_cst (s32), addrspace 2)
105     ; GFX11-NEXT: $vgpr0 = COPY [[DS_CMPSTORE_RTN_B32_]]
106     %0:vgpr(p2) = COPY $vgpr0
107     %1:vgpr(s32) = COPY $vgpr1
108     %2:vgpr(s32) = COPY $vgpr2
109     %3:vgpr(s32) = G_CONSTANT i32 4
110     %4:vgpr(p2) = G_PTR_ADD %0, %3
111     %5:vgpr(s32) = G_ATOMIC_CMPXCHG %4, %1, %2 :: (load store seq_cst (s32), addrspace 2)
112     $vgpr0 = COPY %5
117 name:            atomic_cmpxchg_s64_region
118 legalized:       true
119 regBankSelected: true
120 tracksRegLiveness: true
121 body:             |
122   bb.0:
123     liveins: $vgpr0, $vgpr1_vgpr2, $vgpr3_vgpr4
125     ; GFX6-LABEL: name: atomic_cmpxchg_s64_region
126     ; GFX6: liveins: $vgpr0, $vgpr1_vgpr2, $vgpr3_vgpr4
127     ; GFX6-NEXT: {{  $}}
128     ; GFX6-NEXT: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
129     ; GFX6-NEXT: [[COPY1:%[0-9]+]]:vreg_64 = COPY $vgpr1_vgpr2
130     ; GFX6-NEXT: [[COPY2:%[0-9]+]]:vreg_64 = COPY $vgpr3_vgpr4
131     ; GFX6-NEXT: $m0 = S_MOV_B32 -1
132     ; GFX6-NEXT: [[DS_CMPST_RTN_B64_:%[0-9]+]]:vreg_64 = DS_CMPST_RTN_B64 [[COPY]], [[COPY1]], [[COPY2]], 0, 1, implicit $m0, implicit $exec :: (load store seq_cst (s64), addrspace 2)
133     ; GFX6-NEXT: $vgpr0_vgpr1 = COPY [[DS_CMPST_RTN_B64_]]
134     ; GFX7-LABEL: name: atomic_cmpxchg_s64_region
135     ; GFX7: liveins: $vgpr0, $vgpr1_vgpr2, $vgpr3_vgpr4
136     ; GFX7-NEXT: {{  $}}
137     ; GFX7-NEXT: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
138     ; GFX7-NEXT: [[COPY1:%[0-9]+]]:vreg_64 = COPY $vgpr1_vgpr2
139     ; GFX7-NEXT: [[COPY2:%[0-9]+]]:vreg_64 = COPY $vgpr3_vgpr4
140     ; GFX7-NEXT: $m0 = S_MOV_B32 -1
141     ; GFX7-NEXT: [[DS_CMPST_RTN_B64_:%[0-9]+]]:vreg_64 = DS_CMPST_RTN_B64 [[COPY]], [[COPY1]], [[COPY2]], 0, 1, implicit $m0, implicit $exec :: (load store seq_cst (s64), addrspace 2)
142     ; GFX7-NEXT: $vgpr0_vgpr1 = COPY [[DS_CMPST_RTN_B64_]]
143     ; GFX9-LABEL: name: atomic_cmpxchg_s64_region
144     ; GFX9: liveins: $vgpr0, $vgpr1_vgpr2, $vgpr3_vgpr4
145     ; GFX9-NEXT: {{  $}}
146     ; GFX9-NEXT: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
147     ; GFX9-NEXT: [[COPY1:%[0-9]+]]:vreg_64 = COPY $vgpr1_vgpr2
148     ; GFX9-NEXT: [[COPY2:%[0-9]+]]:vreg_64 = COPY $vgpr3_vgpr4
149     ; GFX9-NEXT: [[DS_CMPST_RTN_B64_:%[0-9]+]]:vreg_64 = DS_CMPST_RTN_B64 [[COPY]], [[COPY1]], [[COPY2]], 0, 1, implicit $m0, implicit $exec :: (load store seq_cst (s64), addrspace 2)
150     ; GFX9-NEXT: $vgpr0_vgpr1 = COPY [[DS_CMPST_RTN_B64_]]
151     ; GFX11-LABEL: name: atomic_cmpxchg_s64_region
152     ; GFX11: liveins: $vgpr0, $vgpr1_vgpr2, $vgpr3_vgpr4
153     ; GFX11-NEXT: {{  $}}
154     ; GFX11-NEXT: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
155     ; GFX11-NEXT: [[COPY1:%[0-9]+]]:vreg_64 = COPY $vgpr1_vgpr2
156     ; GFX11-NEXT: [[COPY2:%[0-9]+]]:vreg_64 = COPY $vgpr3_vgpr4
157     ; GFX11-NEXT: [[DS_CMPSTORE_RTN_B64_:%[0-9]+]]:vreg_64 = DS_CMPSTORE_RTN_B64 [[COPY]], [[COPY2]], [[COPY1]], 0, 1, implicit $m0, implicit $exec :: (load store seq_cst (s64), addrspace 2)
158     ; GFX11-NEXT: $vgpr0_vgpr1 = COPY [[DS_CMPSTORE_RTN_B64_]]
159     %0:vgpr(p2) = COPY $vgpr0
160     %1:vgpr(s64) = COPY $vgpr1_vgpr2
161     %2:vgpr(s64) = COPY $vgpr3_vgpr4
162     %3:vgpr(s64) = G_ATOMIC_CMPXCHG %0, %1, %2 :: (load store seq_cst (s64), addrspace 2)
163     $vgpr0_vgpr1 = COPY %3
168 name:            atomic_cmpxchg_s64_region_gep4
169 legalized:       true
170 regBankSelected: true
171 tracksRegLiveness: true
172 body:             |
173   bb.0:
174     liveins: $vgpr0, $vgpr1_vgpr2, $vgpr3_vgpr4
176     ; GFX6-LABEL: name: atomic_cmpxchg_s64_region_gep4
177     ; GFX6: liveins: $vgpr0, $vgpr1_vgpr2, $vgpr3_vgpr4
178     ; GFX6-NEXT: {{  $}}
179     ; GFX6-NEXT: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
180     ; GFX6-NEXT: [[COPY1:%[0-9]+]]:vreg_64 = COPY $vgpr1_vgpr2
181     ; GFX6-NEXT: [[COPY2:%[0-9]+]]:vreg_64 = COPY $vgpr3_vgpr4
182     ; GFX6-NEXT: $m0 = S_MOV_B32 -1
183     ; GFX6-NEXT: [[DS_CMPST_RTN_B64_:%[0-9]+]]:vreg_64 = DS_CMPST_RTN_B64 [[COPY]], [[COPY1]], [[COPY2]], 0, 1, implicit $m0, implicit $exec :: (load store seq_cst (s64), addrspace 2)
184     ; GFX6-NEXT: $vgpr0_vgpr1 = COPY [[DS_CMPST_RTN_B64_]]
185     ; GFX7-LABEL: name: atomic_cmpxchg_s64_region_gep4
186     ; GFX7: liveins: $vgpr0, $vgpr1_vgpr2, $vgpr3_vgpr4
187     ; GFX7-NEXT: {{  $}}
188     ; GFX7-NEXT: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
189     ; GFX7-NEXT: [[COPY1:%[0-9]+]]:vreg_64 = COPY $vgpr1_vgpr2
190     ; GFX7-NEXT: [[COPY2:%[0-9]+]]:vreg_64 = COPY $vgpr3_vgpr4
191     ; GFX7-NEXT: $m0 = S_MOV_B32 -1
192     ; GFX7-NEXT: [[DS_CMPST_RTN_B64_:%[0-9]+]]:vreg_64 = DS_CMPST_RTN_B64 [[COPY]], [[COPY1]], [[COPY2]], 0, 1, implicit $m0, implicit $exec :: (load store seq_cst (s64), addrspace 2)
193     ; GFX7-NEXT: $vgpr0_vgpr1 = COPY [[DS_CMPST_RTN_B64_]]
194     ; GFX9-LABEL: name: atomic_cmpxchg_s64_region_gep4
195     ; GFX9: liveins: $vgpr0, $vgpr1_vgpr2, $vgpr3_vgpr4
196     ; GFX9-NEXT: {{  $}}
197     ; GFX9-NEXT: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
198     ; GFX9-NEXT: [[COPY1:%[0-9]+]]:vreg_64 = COPY $vgpr1_vgpr2
199     ; GFX9-NEXT: [[COPY2:%[0-9]+]]:vreg_64 = COPY $vgpr3_vgpr4
200     ; GFX9-NEXT: [[DS_CMPST_RTN_B64_:%[0-9]+]]:vreg_64 = DS_CMPST_RTN_B64 [[COPY]], [[COPY1]], [[COPY2]], 0, 1, implicit $m0, implicit $exec :: (load store seq_cst (s64), addrspace 2)
201     ; GFX9-NEXT: $vgpr0_vgpr1 = COPY [[DS_CMPST_RTN_B64_]]
202     ; GFX11-LABEL: name: atomic_cmpxchg_s64_region_gep4
203     ; GFX11: liveins: $vgpr0, $vgpr1_vgpr2, $vgpr3_vgpr4
204     ; GFX11-NEXT: {{  $}}
205     ; GFX11-NEXT: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
206     ; GFX11-NEXT: [[COPY1:%[0-9]+]]:vreg_64 = COPY $vgpr1_vgpr2
207     ; GFX11-NEXT: [[COPY2:%[0-9]+]]:vreg_64 = COPY $vgpr3_vgpr4
208     ; GFX11-NEXT: [[DS_CMPSTORE_RTN_B64_:%[0-9]+]]:vreg_64 = DS_CMPSTORE_RTN_B64 [[COPY]], [[COPY2]], [[COPY1]], 0, 1, implicit $m0, implicit $exec :: (load store seq_cst (s64), addrspace 2)
209     ; GFX11-NEXT: $vgpr0_vgpr1 = COPY [[DS_CMPSTORE_RTN_B64_]]
210     %0:vgpr(p2) = COPY $vgpr0
211     %1:vgpr(s64) = COPY $vgpr1_vgpr2
212     %2:vgpr(s64) = COPY $vgpr3_vgpr4
213     %3:vgpr(s32) = G_CONSTANT i32 4
214     %4:vgpr(p2) = G_PTR_ADD %0, %3
215     %5:vgpr(s64) = G_ATOMIC_CMPXCHG %0, %1, %2 :: (load store seq_cst (s64), addrspace 2)
216     $vgpr0_vgpr1 = COPY %5