[ARM] MVE compare vector splat combine
[llvm-complete.git] / test / Transforms / DeadStoreElimination / OverwriteStoreBegin.ll
blobba0d46ad062b3071a4c8d0a3ed89f4419512bd2d
1 ; NOTE: Assertions have been autogenerated by utils/update_test_checks.py
2 ; RUN: opt < %s -basicaa -dse -S | FileCheck %s
4 define void @write4to7(i32* nocapture %p) {
5 ; CHECK-LABEL: @write4to7(
6 ; CHECK-NEXT:  entry:
7 ; CHECK-NEXT:    [[ARRAYIDX0:%.*]] = getelementptr inbounds i32, i32* [[P:%.*]], i64 1
8 ; CHECK-NEXT:    [[P3:%.*]] = bitcast i32* [[ARRAYIDX0]] to i8*
9 ; CHECK-NEXT:    [[TMP0:%.*]] = getelementptr inbounds i8, i8* [[P3]], i64 4
10 ; CHECK-NEXT:    call void @llvm.memset.p0i8.i64(i8* align 4 [[TMP0]], i8 0, i64 24, i1 false)
11 ; CHECK-NEXT:    [[ARRAYIDX1:%.*]] = getelementptr inbounds i32, i32* [[P]], i64 1
12 ; CHECK-NEXT:    store i32 1, i32* [[ARRAYIDX1]], align 4
13 ; CHECK-NEXT:    ret void
15 entry:
16   %arrayidx0 = getelementptr inbounds i32, i32* %p, i64 1
17   %p3 = bitcast i32* %arrayidx0 to i8*
18   call void @llvm.memset.p0i8.i64(i8* align 4 %p3, i8 0, i64 28, i1 false)
19   %arrayidx1 = getelementptr inbounds i32, i32* %p, i64 1
20   store i32 1, i32* %arrayidx1, align 4
21   ret void
24 define void @write4to7_atomic(i32* nocapture %p) {
25 ; CHECK-LABEL: @write4to7_atomic(
26 ; CHECK-NEXT:  entry:
27 ; CHECK-NEXT:    [[ARRAYIDX0:%.*]] = getelementptr inbounds i32, i32* [[P:%.*]], i64 1
28 ; CHECK-NEXT:    [[P3:%.*]] = bitcast i32* [[ARRAYIDX0]] to i8*
29 ; CHECK-NEXT:    [[TMP0:%.*]] = getelementptr inbounds i8, i8* [[P3]], i64 4
30 ; CHECK-NEXT:    call void @llvm.memset.element.unordered.atomic.p0i8.i64(i8* align 4 [[TMP0]], i8 0, i64 24, i32 4)
31 ; CHECK-NEXT:    [[ARRAYIDX1:%.*]] = getelementptr inbounds i32, i32* [[P]], i64 1
32 ; CHECK-NEXT:    store atomic i32 1, i32* [[ARRAYIDX1]] unordered, align 4
33 ; CHECK-NEXT:    ret void
35 entry:
36   %arrayidx0 = getelementptr inbounds i32, i32* %p, i64 1
37   %p3 = bitcast i32* %arrayidx0 to i8*
38   call void @llvm.memset.element.unordered.atomic.p0i8.i64(i8* align 4 %p3, i8 0, i64 28, i32 4)
39   %arrayidx1 = getelementptr inbounds i32, i32* %p, i64 1
40   store atomic i32 1, i32* %arrayidx1 unordered, align 4
41   ret void
44 define void @write0to3(i32* nocapture %p) {
45 ; CHECK-LABEL: @write0to3(
46 ; CHECK-NEXT:  entry:
47 ; CHECK-NEXT:    [[P3:%.*]] = bitcast i32* [[P:%.*]] to i8*
48 ; CHECK-NEXT:    [[TMP0:%.*]] = getelementptr inbounds i8, i8* [[P3]], i64 4
49 ; CHECK-NEXT:    call void @llvm.memset.p0i8.i64(i8* align 4 [[TMP0]], i8 0, i64 24, i1 false)
50 ; CHECK-NEXT:    store i32 1, i32* [[P]], align 4
51 ; CHECK-NEXT:    ret void
53 entry:
54   %p3 = bitcast i32* %p to i8*
55   call void @llvm.memset.p0i8.i64(i8* align 4 %p3, i8 0, i64 28, i1 false)
56   store i32 1, i32* %p, align 4
57   ret void
60 define void @write0to3_atomic(i32* nocapture %p) {
61 ; CHECK-LABEL: @write0to3_atomic(
62 ; CHECK-NEXT:  entry:
63 ; CHECK-NEXT:    [[P3:%.*]] = bitcast i32* [[P:%.*]] to i8*
64 ; CHECK-NEXT:    [[TMP0:%.*]] = getelementptr inbounds i8, i8* [[P3]], i64 4
65 ; CHECK-NEXT:    call void @llvm.memset.element.unordered.atomic.p0i8.i64(i8* align 4 [[TMP0]], i8 0, i64 24, i32 4)
66 ; CHECK-NEXT:    store atomic i32 1, i32* [[P]] unordered, align 4
67 ; CHECK-NEXT:    ret void
69 entry:
70   %p3 = bitcast i32* %p to i8*
71   call void @llvm.memset.element.unordered.atomic.p0i8.i64(i8* align 4 %p3, i8 0, i64 28, i32 4)
72   store atomic i32 1, i32* %p unordered, align 4
73   ret void
76 ; Atomicity of the store is weaker from the memset
77 define void @write0to3_atomic_weaker(i32* nocapture %p) {
78 ; CHECK-LABEL: @write0to3_atomic_weaker(
79 ; CHECK-NEXT:  entry:
80 ; CHECK-NEXT:    [[P3:%.*]] = bitcast i32* [[P:%.*]] to i8*
81 ; CHECK-NEXT:    [[TMP0:%.*]] = getelementptr inbounds i8, i8* [[P3]], i64 4
82 ; CHECK-NEXT:    call void @llvm.memset.element.unordered.atomic.p0i8.i64(i8* align 4 [[TMP0]], i8 0, i64 24, i32 4)
83 ; CHECK-NEXT:    store i32 1, i32* [[P]], align 4
84 ; CHECK-NEXT:    ret void
86 entry:
87   %p3 = bitcast i32* %p to i8*
88   call void @llvm.memset.element.unordered.atomic.p0i8.i64(i8* align 4 %p3, i8 0, i64 28, i32 4)
89   store i32 1, i32* %p, align 4
90   ret void
93 define void @write0to7(i32* nocapture %p) {
94 ; CHECK-LABEL: @write0to7(
95 ; CHECK-NEXT:  entry:
96 ; CHECK-NEXT:    [[P3:%.*]] = bitcast i32* [[P:%.*]] to i8*
97 ; CHECK-NEXT:    [[TMP0:%.*]] = getelementptr inbounds i8, i8* [[P3]], i64 8
98 ; CHECK-NEXT:    call void @llvm.memset.p0i8.i64(i8* align 4 [[TMP0]], i8 0, i64 24, i1 false)
99 ; CHECK-NEXT:    [[P4:%.*]] = bitcast i32* [[P]] to i64*
100 ; CHECK-NEXT:    store i64 1, i64* [[P4]], align 8
101 ; CHECK-NEXT:    ret void
103 entry:
104   %p3 = bitcast i32* %p to i8*
105   call void @llvm.memset.p0i8.i64(i8* align 4 %p3, i8 0, i64 32, i1 false)
106   %p4 = bitcast i32* %p to i64*
107   store i64 1, i64* %p4, align 8
108   ret void
111 ; Changing the memset start and length is okay here because the
112 ; store is a multiple of the memset element size
113 define void @write0to7_atomic(i32* nocapture %p) {
114 ; CHECK-LABEL: @write0to7_atomic(
115 ; CHECK-NEXT:  entry:
116 ; CHECK-NEXT:    [[P3:%.*]] = bitcast i32* [[P:%.*]] to i8*
117 ; CHECK-NEXT:    [[TMP0:%.*]] = getelementptr inbounds i8, i8* [[P3]], i64 8
118 ; CHECK-NEXT:    call void @llvm.memset.element.unordered.atomic.p0i8.i64(i8* align 4 [[TMP0]], i8 0, i64 24, i32 4)
119 ; CHECK-NEXT:    [[P4:%.*]] = bitcast i32* [[P]] to i64*
120 ; CHECK-NEXT:    store atomic i64 1, i64* [[P4]] unordered, align 8
121 ; CHECK-NEXT:    ret void
123 entry:
124   %p3 = bitcast i32* %p to i8*
125   call void @llvm.memset.element.unordered.atomic.p0i8.i64(i8* align 4 %p3, i8 0, i64 32, i32 4)
126   %p4 = bitcast i32* %p to i64*
127   store atomic i64 1, i64* %p4 unordered, align 8
128   ret void
131 define void @write0to7_2(i32* nocapture %p) {
132 ; CHECK-LABEL: @write0to7_2(
133 ; CHECK-NEXT:  entry:
134 ; CHECK-NEXT:    [[ARRAYIDX0:%.*]] = getelementptr inbounds i32, i32* [[P:%.*]], i64 1
135 ; CHECK-NEXT:    [[P3:%.*]] = bitcast i32* [[ARRAYIDX0]] to i8*
136 ; CHECK-NEXT:    [[TMP0:%.*]] = getelementptr inbounds i8, i8* [[P3]], i64 4
137 ; CHECK-NEXT:    call void @llvm.memset.p0i8.i64(i8* align 4 [[TMP0]], i8 0, i64 24, i1 false)
138 ; CHECK-NEXT:    [[P4:%.*]] = bitcast i32* [[P]] to i64*
139 ; CHECK-NEXT:    store i64 1, i64* [[P4]], align 8
140 ; CHECK-NEXT:    ret void
142 entry:
143   %arrayidx0 = getelementptr inbounds i32, i32* %p, i64 1
144   %p3 = bitcast i32* %arrayidx0 to i8*
145   call void @llvm.memset.p0i8.i64(i8* align 4 %p3, i8 0, i64 28, i1 false)
146   %p4 = bitcast i32* %p to i64*
147   store i64 1, i64* %p4, align 8
148   ret void
151 define void @write0to7_2_atomic(i32* nocapture %p) {
152 ; CHECK-LABEL: @write0to7_2_atomic(
153 ; CHECK-NEXT:  entry:
154 ; CHECK-NEXT:    [[ARRAYIDX0:%.*]] = getelementptr inbounds i32, i32* [[P:%.*]], i64 1
155 ; CHECK-NEXT:    [[P3:%.*]] = bitcast i32* [[ARRAYIDX0]] to i8*
156 ; CHECK-NEXT:    [[TMP0:%.*]] = getelementptr inbounds i8, i8* [[P3]], i64 4
157 ; CHECK-NEXT:    call void @llvm.memset.element.unordered.atomic.p0i8.i64(i8* align 4 [[TMP0]], i8 0, i64 24, i32 4)
158 ; CHECK-NEXT:    [[P4:%.*]] = bitcast i32* [[P]] to i64*
159 ; CHECK-NEXT:    store atomic i64 1, i64* [[P4]] unordered, align 8
160 ; CHECK-NEXT:    ret void
162 entry:
163   %arrayidx0 = getelementptr inbounds i32, i32* %p, i64 1
164   %p3 = bitcast i32* %arrayidx0 to i8*
165   call void @llvm.memset.element.unordered.atomic.p0i8.i64(i8* align 4 %p3, i8 0, i64 28, i32 4)
166   %p4 = bitcast i32* %p to i64*
167   store atomic i64 1, i64* %p4 unordered, align 8
168   ret void
171 ; We do not trim the beginning of the eariler write if the alignment of the
172 ; start pointer is changed.
173 define void @dontwrite0to3_align8(i32* nocapture %p) {
174 ; CHECK-LABEL: @dontwrite0to3_align8(
175 ; CHECK-NEXT:  entry:
176 ; CHECK-NEXT:    [[P3:%.*]] = bitcast i32* [[P:%.*]] to i8*
177 ; CHECK-NEXT:    call void @llvm.memset.p0i8.i64(i8* align 8 [[P3]], i8 0, i64 32, i1 false)
178 ; CHECK-NEXT:    store i32 1, i32* [[P]], align 4
179 ; CHECK-NEXT:    ret void
181 entry:
182   %p3 = bitcast i32* %p to i8*
183   call void @llvm.memset.p0i8.i64(i8* align 8 %p3, i8 0, i64 32, i1 false)
184   store i32 1, i32* %p, align 4
185   ret void
188 define void @dontwrite0to3_align8_atomic(i32* nocapture %p) {
189 ; CHECK-LABEL: @dontwrite0to3_align8_atomic(
190 ; CHECK-NEXT:  entry:
191 ; CHECK-NEXT:    [[P3:%.*]] = bitcast i32* [[P:%.*]] to i8*
192 ; CHECK-NEXT:    call void @llvm.memset.element.unordered.atomic.p0i8.i64(i8* align 8 [[P3]], i8 0, i64 32, i32 4)
193 ; CHECK-NEXT:    store atomic i32 1, i32* [[P]] unordered, align 4
194 ; CHECK-NEXT:    ret void
196 entry:
197   %p3 = bitcast i32* %p to i8*
198   call void @llvm.memset.element.unordered.atomic.p0i8.i64(i8* align 8 %p3, i8 0, i64 32, i32 4)
199   store atomic i32 1, i32* %p unordered, align 4
200   ret void
203 define void @dontwrite0to1(i32* nocapture %p) {
204 ; CHECK-LABEL: @dontwrite0to1(
205 ; CHECK-NEXT:  entry:
206 ; CHECK-NEXT:    [[P3:%.*]] = bitcast i32* [[P:%.*]] to i8*
207 ; CHECK-NEXT:    call void @llvm.memset.p0i8.i64(i8* align 4 [[P3]], i8 0, i64 32, i1 false)
208 ; CHECK-NEXT:    [[P4:%.*]] = bitcast i32* [[P]] to i16*
209 ; CHECK-NEXT:    store i16 1, i16* [[P4]], align 4
210 ; CHECK-NEXT:    ret void
212 entry:
213   %p3 = bitcast i32* %p to i8*
214   call void @llvm.memset.p0i8.i64(i8* align 4 %p3, i8 0, i64 32, i1 false)
215   %p4 = bitcast i32* %p to i16*
216   store i16 1, i16* %p4, align 4
217   ret void
220 define void @dontwrite0to1_atomic(i32* nocapture %p) {
221 ; CHECK-LABEL: @dontwrite0to1_atomic(
222 ; CHECK-NEXT:  entry:
223 ; CHECK-NEXT:    [[P3:%.*]] = bitcast i32* [[P:%.*]] to i8*
224 ; CHECK-NEXT:    call void @llvm.memset.element.unordered.atomic.p0i8.i64(i8* align 4 [[P3]], i8 0, i64 32, i32 4)
225 ; CHECK-NEXT:    [[P4:%.*]] = bitcast i32* [[P]] to i16*
226 ; CHECK-NEXT:    store atomic i16 1, i16* [[P4]] unordered, align 4
227 ; CHECK-NEXT:    ret void
229 entry:
230   %p3 = bitcast i32* %p to i8*
231   call void @llvm.memset.element.unordered.atomic.p0i8.i64(i8* align 4 %p3, i8 0, i64 32, i32 4)
232   %p4 = bitcast i32* %p to i16*
233   store atomic i16 1, i16* %p4 unordered, align 4
234   ret void
237 define void @dontwrite2to9(i32* nocapture %p) {
238 ; CHECK-LABEL: @dontwrite2to9(
239 ; CHECK-NEXT:  entry:
240 ; CHECK-NEXT:    [[ARRAYIDX0:%.*]] = getelementptr inbounds i32, i32* [[P:%.*]], i64 1
241 ; CHECK-NEXT:    [[P3:%.*]] = bitcast i32* [[ARRAYIDX0]] to i8*
242 ; CHECK-NEXT:    call void @llvm.memset.p0i8.i64(i8* align 4 [[P3]], i8 0, i64 32, i1 false)
243 ; CHECK-NEXT:    [[P4:%.*]] = bitcast i32* [[P]] to i16*
244 ; CHECK-NEXT:    [[ARRAYIDX2:%.*]] = getelementptr inbounds i16, i16* [[P4]], i64 1
245 ; CHECK-NEXT:    [[P5:%.*]] = bitcast i16* [[ARRAYIDX2]] to i64*
246 ; CHECK-NEXT:    store i64 1, i64* [[P5]], align 8
247 ; CHECK-NEXT:    ret void
249 entry:
250   %arrayidx0 = getelementptr inbounds i32, i32* %p, i64 1
251   %p3 = bitcast i32* %arrayidx0 to i8*
252   call void @llvm.memset.p0i8.i64(i8* align 4 %p3, i8 0, i64 32, i1 false)
253   %p4 = bitcast i32* %p to i16*
254   %arrayidx2 = getelementptr inbounds i16, i16* %p4, i64 1
255   %p5 = bitcast i16* %arrayidx2 to i64*
256   store i64 1, i64* %p5, align 8
257   ret void
260 define void @dontwrite2to9_atomic(i32* nocapture %p) {
261 ; CHECK-LABEL: @dontwrite2to9_atomic(
262 ; CHECK-NEXT:  entry:
263 ; CHECK-NEXT:    [[ARRAYIDX0:%.*]] = getelementptr inbounds i32, i32* [[P:%.*]], i64 1
264 ; CHECK-NEXT:    [[P3:%.*]] = bitcast i32* [[ARRAYIDX0]] to i8*
265 ; CHECK-NEXT:    call void @llvm.memset.element.unordered.atomic.p0i8.i64(i8* align 4 [[P3]], i8 0, i64 32, i32 4)
266 ; CHECK-NEXT:    [[P4:%.*]] = bitcast i32* [[P]] to i16*
267 ; CHECK-NEXT:    [[ARRAYIDX2:%.*]] = getelementptr inbounds i16, i16* [[P4]], i64 1
268 ; CHECK-NEXT:    [[P5:%.*]] = bitcast i16* [[ARRAYIDX2]] to i64*
269 ; CHECK-NEXT:    store atomic i64 1, i64* [[P5]] unordered, align 8
270 ; CHECK-NEXT:    ret void
272 entry:
273   %arrayidx0 = getelementptr inbounds i32, i32* %p, i64 1
274   %p3 = bitcast i32* %arrayidx0 to i8*
275   call void @llvm.memset.element.unordered.atomic.p0i8.i64(i8* align 4 %p3, i8 0, i64 32, i32 4)
276   %p4 = bitcast i32* %p to i16*
277   %arrayidx2 = getelementptr inbounds i16, i16* %p4, i64 1
278   %p5 = bitcast i16* %arrayidx2 to i64*
279   store atomic i64 1, i64* %p5 unordered, align 8
280   ret void
283 define void @write8To15AndThen0To7(i64* nocapture %P) {
284 ; CHECK-LABEL: @write8To15AndThen0To7(
285 ; CHECK-NEXT:  entry:
286 ; CHECK-NEXT:    [[BASE0:%.*]] = bitcast i64* [[P:%.*]] to i8*
287 ; CHECK-NEXT:    [[MYBASE0:%.*]] = getelementptr inbounds i8, i8* [[BASE0]], i64 0
288 ; CHECK-NEXT:    [[TMP0:%.*]] = getelementptr inbounds i8, i8* [[MYBASE0]], i64 16
289 ; CHECK-NEXT:    tail call void @llvm.memset.p0i8.i64(i8* align 8 [[TMP0]], i8 0, i64 16, i1 false)
290 ; CHECK-NEXT:    [[BASE64_0:%.*]] = getelementptr inbounds i64, i64* [[P]], i64 0
291 ; CHECK-NEXT:    [[BASE64_1:%.*]] = getelementptr inbounds i64, i64* [[P]], i64 1
292 ; CHECK-NEXT:    store i64 1, i64* [[BASE64_1]]
293 ; CHECK-NEXT:    store i64 2, i64* [[BASE64_0]]
294 ; CHECK-NEXT:    ret void
296 entry:
298   %base0 = bitcast i64* %P to i8*
299   %mybase0 = getelementptr inbounds i8, i8* %base0, i64 0
300   tail call void @llvm.memset.p0i8.i64(i8* align 8 %mybase0, i8 0, i64 32, i1 false)
302   %base64_0 = getelementptr inbounds i64, i64* %P, i64 0
303   %base64_1 = getelementptr inbounds i64, i64* %P, i64 1
305   store i64 1, i64* %base64_1
306   store i64 2, i64* %base64_0
307   ret void
310 define void @write8To15AndThen0To7_atomic(i64* nocapture %P) {
311 ; CHECK-LABEL: @write8To15AndThen0To7_atomic(
312 ; CHECK-NEXT:  entry:
313 ; CHECK-NEXT:    [[BASE0:%.*]] = bitcast i64* [[P:%.*]] to i8*
314 ; CHECK-NEXT:    [[MYBASE0:%.*]] = getelementptr inbounds i8, i8* [[BASE0]], i64 0
315 ; CHECK-NEXT:    [[TMP0:%.*]] = getelementptr inbounds i8, i8* [[MYBASE0]], i64 16
316 ; CHECK-NEXT:    tail call void @llvm.memset.element.unordered.atomic.p0i8.i64(i8* align 8 [[TMP0]], i8 0, i64 16, i32 8)
317 ; CHECK-NEXT:    [[BASE64_0:%.*]] = getelementptr inbounds i64, i64* [[P]], i64 0
318 ; CHECK-NEXT:    [[BASE64_1:%.*]] = getelementptr inbounds i64, i64* [[P]], i64 1
319 ; CHECK-NEXT:    store atomic i64 1, i64* [[BASE64_1]] unordered, align 8
320 ; CHECK-NEXT:    store atomic i64 2, i64* [[BASE64_0]] unordered, align 8
321 ; CHECK-NEXT:    ret void
323 entry:
325   %base0 = bitcast i64* %P to i8*
326   %mybase0 = getelementptr inbounds i8, i8* %base0, i64 0
327   tail call void @llvm.memset.element.unordered.atomic.p0i8.i64(i8* align 8 %mybase0, i8 0, i64 32, i32 8)
329   %base64_0 = getelementptr inbounds i64, i64* %P, i64 0
330   %base64_1 = getelementptr inbounds i64, i64* %P, i64 1
332   store atomic i64 1, i64* %base64_1 unordered, align 8
333   store atomic i64 2, i64* %base64_0 unordered, align 8
334   ret void
337 define void @write8To15AndThen0To7_atomic_weaker(i64* nocapture %P) {
338 ; CHECK-LABEL: @write8To15AndThen0To7_atomic_weaker(
339 ; CHECK-NEXT:  entry:
340 ; CHECK-NEXT:    [[BASE0:%.*]] = bitcast i64* [[P:%.*]] to i8*
341 ; CHECK-NEXT:    [[MYBASE0:%.*]] = getelementptr inbounds i8, i8* [[BASE0]], i64 0
342 ; CHECK-NEXT:    [[TMP0:%.*]] = getelementptr inbounds i8, i8* [[MYBASE0]], i64 16
343 ; CHECK-NEXT:    tail call void @llvm.memset.element.unordered.atomic.p0i8.i64(i8* align 8 [[TMP0]], i8 0, i64 16, i32 8)
344 ; CHECK-NEXT:    [[BASE64_0:%.*]] = getelementptr inbounds i64, i64* [[P]], i64 0
345 ; CHECK-NEXT:    [[BASE64_1:%.*]] = getelementptr inbounds i64, i64* [[P]], i64 1
346 ; CHECK-NEXT:    store atomic i64 1, i64* [[BASE64_1]] unordered, align 8
347 ; CHECK-NEXT:    store i64 2, i64* [[BASE64_0]], align 8
348 ; CHECK-NEXT:    ret void
350 entry:
352   %base0 = bitcast i64* %P to i8*
353   %mybase0 = getelementptr inbounds i8, i8* %base0, i64 0
354   tail call void @llvm.memset.element.unordered.atomic.p0i8.i64(i8* align 8 %mybase0, i8 0, i64 32, i32 8)
356   %base64_0 = getelementptr inbounds i64, i64* %P, i64 0
357   %base64_1 = getelementptr inbounds i64, i64* %P, i64 1
359   store atomic i64 1, i64* %base64_1 unordered, align 8
360   store i64 2, i64* %base64_0, align 8
361   ret void
364 define void @write8To15AndThen0To7_atomic_weaker_2(i64* nocapture %P) {
365 ; CHECK-LABEL: @write8To15AndThen0To7_atomic_weaker_2(
366 ; CHECK-NEXT:  entry:
367 ; CHECK-NEXT:    [[BASE0:%.*]] = bitcast i64* [[P:%.*]] to i8*
368 ; CHECK-NEXT:    [[MYBASE0:%.*]] = getelementptr inbounds i8, i8* [[BASE0]], i64 0
369 ; CHECK-NEXT:    [[TMP0:%.*]] = getelementptr inbounds i8, i8* [[MYBASE0]], i64 16
370 ; CHECK-NEXT:    tail call void @llvm.memset.element.unordered.atomic.p0i8.i64(i8* align 8 [[TMP0]], i8 0, i64 16, i32 8)
371 ; CHECK-NEXT:    [[BASE64_0:%.*]] = getelementptr inbounds i64, i64* [[P]], i64 0
372 ; CHECK-NEXT:    [[BASE64_1:%.*]] = getelementptr inbounds i64, i64* [[P]], i64 1
373 ; CHECK-NEXT:    store i64 1, i64* [[BASE64_1]], align 8
374 ; CHECK-NEXT:    store atomic i64 2, i64* [[BASE64_0]] unordered, align 8
375 ; CHECK-NEXT:    ret void
377 entry:
379   %base0 = bitcast i64* %P to i8*
380   %mybase0 = getelementptr inbounds i8, i8* %base0, i64 0
381   tail call void @llvm.memset.element.unordered.atomic.p0i8.i64(i8* align 8 %mybase0, i8 0, i64 32, i32 8)
383   %base64_0 = getelementptr inbounds i64, i64* %P, i64 0
384   %base64_1 = getelementptr inbounds i64, i64* %P, i64 1
386   store i64 1, i64* %base64_1, align 8
387   store atomic i64 2, i64* %base64_0 unordered, align 8
388   ret void
391 declare void @llvm.memset.p0i8.i64(i8* nocapture, i8, i64, i1) nounwind
392 declare void @llvm.memset.element.unordered.atomic.p0i8.i64(i8* nocapture, i8, i64, i32) nounwind