[AMDGPU] Add llvm.amdgcn.global.load.lds intrinsic
[llvm-project.git] / llvm / test / CodeGen / ARM / prefetch.ll
blobf594be346aa7a4be67e85510f61994ee64aecb94
1 ; RUN: llc -mtriple=thumb-eabi -mattr=-thumb2 %s -o - | FileCheck %s -check-prefix CHECK-T1
2 ; RUN: llc -mtriple=thumb-eabi -mattr=+v7 %s -o - | FileCheck %s -check-prefix=THUMB2
3 ; RUN: llc -mtriple=thumb-eabi -mattr=+v7 -mattr=+mp %s -o - | FileCheck %s -check-prefix=THUMB2-MP
4 ; RUN: llc -mtriple=arm-eabi -mattr=+v7 %s -o - | FileCheck %s -check-prefix=ARM
5 ; RUN: llc -mtriple=arm-eabi -mcpu=cortex-a9 %s -o - | FileCheck %s -check-prefix=ARM-MP
6 ; rdar://8601536
8 ; CHECK-T1-NOT: pld
10 define void @t1(i8* %ptr) nounwind  {
11 entry:
12 ; ARM-LABEL: t1:
13 ; ARM-NOT: pldw [r0]
14 ; ARM: pld [r0]
16 ; ARM-MP-LABEL: t1:
17 ; ARM-MP: pldw [r0]
18 ; ARM-MP: pld [r0]
20 ; THUMB2-LABEL: t1:
21 ; THUMB2-NOT: pldw [r0]
22 ; THUMB2: pld [r0]
23   tail call void @llvm.prefetch( i8* %ptr, i32 1, i32 3, i32 1 )
24   tail call void @llvm.prefetch( i8* %ptr, i32 0, i32 3, i32 1 )
25   ret void
28 define void @t2(i8* %ptr) nounwind  {
29 entry:
30 ; ARM-LABEL: t2:
31 ; ARM: pld [r0, #1023]
33 ; THUMB2-LABEL: t2:
34 ; THUMB2: pld [r0, #1023]
35   %tmp = getelementptr i8, i8* %ptr, i32 1023
36   tail call void @llvm.prefetch( i8* %tmp, i32 0, i32 3, i32 1 )
37   ret void
40 define void @t3(i32 %base, i32 %offset) nounwind  {
41 entry:
42 ; ARM-LABEL: t3:
43 ; ARM: pld [r0, r1, lsr #2]
45 ; THUMB2-LABEL: t3:
46 ; THUMB2: lsrs r1, r1, #2
47 ; THUMB2: pld [r0, r1]
48   %tmp1 = lshr i32 %offset, 2
49   %tmp2 = add i32 %base, %tmp1
50   %tmp3 = inttoptr i32 %tmp2 to i8*
51   tail call void @llvm.prefetch( i8* %tmp3, i32 0, i32 3, i32 1 )
52   ret void
55 define void @t4(i32 %base, i32 %offset) nounwind  {
56 entry:
57 ; ARM-LABEL: t4:
58 ; ARM: pld [r0, r1, lsl #2]
60 ; THUMB2-LABEL: t4:
61 ; THUMB2: pld [r0, r1, lsl #2]
62   %tmp1 = shl i32 %offset, 2
63   %tmp2 = add i32 %base, %tmp1
64   %tmp3 = inttoptr i32 %tmp2 to i8*
65   tail call void @llvm.prefetch( i8* %tmp3, i32 0, i32 3, i32 1 )
66   ret void
69 declare void @llvm.prefetch(i8*, i32, i32, i32) nounwind
71 define void @t5(i8* %ptr) nounwind  {
72 entry:
73 ; ARM-LABEL: t5:
74 ; ARM: pli [r0]
76 ; THUMB2-LABEL: t5:
77 ; THUMB2: pli [r0]
78   tail call void @llvm.prefetch( i8* %ptr, i32 0, i32 3, i32 0 )
79   ret void
82 define void @t6() {
83 entry:
84 ;ARM-LABEL: t6:
85 ;ARM: pld [sp]
86 ;ARM: pld [sp, #50]
87 ;ARM: pld [sp, #-50]
89 ;THUMB2-LABEL: t6:
90 ;THUMB2: pld [sp]
91 ;THUMB2: pld [sp, #50]
92 ;THUMB2: pld [sp, #-50]
94 %red = alloca [100 x i8], align 1
95 %0 = getelementptr inbounds [100 x i8], [100 x i8]* %red, i32 0, i32 0
96 %1 = getelementptr inbounds [100 x i8], [100 x i8]* %red, i32 0, i32 50
97 %2 = getelementptr inbounds [100 x i8], [100 x i8]* %red, i32 0, i32 -50
98 call void @llvm.prefetch(i8* %0, i32 0, i32 3, i32 1)
99 call void @llvm.prefetch(i8* %1, i32 0, i32 3, i32 1)
100 call void @llvm.prefetch(i8* %2, i32 0, i32 3, i32 1)
101 ret void
104 define void @t7() {
105 entry:
106 ;ARM-LABEL: t7:
107 ;ARM-MP: pldw [sp]
108 ;ARM-MP: pldw [sp, #50]
109 ;ARM-MP: pldw [sp, #-50]
111 ;THUMB2-MP-LABEL: t7:
112 ;THUMB2-MP: pldw [sp]
113 ;THUMB2-MP: pldw [sp, #50]
114 ;THUMB2-MP: pldw [sp, #-50]
116 %red = alloca [100 x i8], align 1
117 %0 = getelementptr inbounds [100 x i8], [100 x i8]* %red, i32 0, i32 0
118 %1 = getelementptr inbounds [100 x i8], [100 x i8]* %red, i32 0, i32 50
119 %2 = getelementptr inbounds [100 x i8], [100 x i8]* %red, i32 0, i32 -50
120 call void @llvm.prefetch(i8* %0, i32 1, i32 3, i32 1)
121 call void @llvm.prefetch(i8* %1, i32 1, i32 3, i32 1)
122 call void @llvm.prefetch(i8* %2, i32 1, i32 3, i32 1)
123 ret void
126 define void @t8() {
127 entry:
128 ;ARM-LABEL: t8:
129 ;ARM: pli [sp]
130 ;ARM: pli [sp, #50]
131 ;ARM: pli [sp, #-50]
133 ;THUMB2-LABEL: t8:
134 ;THUMB2: pli [sp]
135 ;THUMB2: pli [sp, #50]
136 ;THUMB2: pli [sp, #-50]
138 %red = alloca [100 x i8], align 1
139 %0 = getelementptr inbounds [100 x i8], [100 x i8]* %red, i32 0, i32 0
140 %1 = getelementptr inbounds [100 x i8], [100 x i8]* %red, i32 0, i32 50
141 %2 = getelementptr inbounds [100 x i8], [100 x i8]* %red, i32 0, i32 -50
142 call void @llvm.prefetch(i8* %0, i32 0, i32 3, i32 0)
143 call void @llvm.prefetch(i8* %1, i32 0, i32 3, i32 0)
144 call void @llvm.prefetch(i8* %2, i32 0, i32 3, i32 0)
145 ret void