llvm/test/CodeGen/ARM/prefetch.ll

   1 ; RUN: llc -mtriple=thumb-eabi -mattr=-thumb2 %s -o - | FileCheck %s -check-prefix CHECK-T1
   2 ; RUN: llc -mtriple=thumb-eabi -mattr=+v7 %s -o - | FileCheck %s -check-prefix=THUMB2
   3 ; RUN: llc -mtriple=thumb-eabi -mattr=+v7 -mattr=+mp %s -o - | FileCheck %s -check-prefix=THUMB2-MP
   4 ; RUN: llc -mtriple=arm-eabi -mattr=+v7 %s -o - | FileCheck %s -check-prefix=ARM
   5 ; RUN: llc -mtriple=arm-eabi -mcpu=cortex-a9 %s -o - | FileCheck %s -check-prefix=ARM-MP
   6 ; rdar://8601536
   7
   8 ; CHECK-T1-NOT: pld
   9
  10 define void @t1(i8* %ptr) nounwind  {
  11 entry:
  12 ; ARM-LABEL: t1:
  13 ; ARM-NOT: pldw [r0]
  14 ; ARM: pld [r0]
  15
  16 ; ARM-MP-LABEL: t1:
  17 ; ARM-MP: pldw [r0]
  18 ; ARM-MP: pld [r0]
  19
  20 ; THUMB2-LABEL: t1:
  21 ; THUMB2-NOT: pldw [r0]
  22 ; THUMB2: pld [r0]
  23   tail call void @llvm.prefetch( i8* %ptr, i32 1, i32 3, i32 1 )
  24   tail call void @llvm.prefetch( i8* %ptr, i32 0, i32 3, i32 1 )
  25   ret void
  26 }
  27
  28 define void @t2(i8* %ptr) nounwind  {
  29 entry:
  30 ; ARM-LABEL: t2:
  31 ; ARM: pld [r0, #1023]
  32
  33 ; THUMB2-LABEL: t2:
  34 ; THUMB2: pld [r0, #1023]
  35   %tmp = getelementptr i8, i8* %ptr, i32 1023
  36   tail call void @llvm.prefetch( i8* %tmp, i32 0, i32 3, i32 1 )
  37   ret void
  38 }
  39
  40 define void @t3(i32 %base, i32 %offset) nounwind  {
  41 entry:
  42 ; ARM-LABEL: t3:
  43 ; ARM: pld [r0, r1, lsr #2]
  44
  45 ; THUMB2-LABEL: t3:
  46 ; THUMB2: lsrs r1, r1, #2
  47 ; THUMB2: pld [r0, r1]
  48   %tmp1 = lshr i32 %offset, 2
  49   %tmp2 = add i32 %base, %tmp1
  50   %tmp3 = inttoptr i32 %tmp2 to i8*
  51   tail call void @llvm.prefetch( i8* %tmp3, i32 0, i32 3, i32 1 )
  52   ret void
  53 }
  54
  55 define void @t4(i32 %base, i32 %offset) nounwind  {
  56 entry:
  57 ; ARM-LABEL: t4:
  58 ; ARM: pld [r0, r1, lsl #2]
  59
  60 ; THUMB2-LABEL: t4:
  61 ; THUMB2: pld [r0, r1, lsl #2]
  62   %tmp1 = shl i32 %offset, 2
  63   %tmp2 = add i32 %base, %tmp1
  64   %tmp3 = inttoptr i32 %tmp2 to i8*
  65   tail call void @llvm.prefetch( i8* %tmp3, i32 0, i32 3, i32 1 )
  66   ret void
  67 }
  68
  69 declare void @llvm.prefetch(i8*, i32, i32, i32) nounwind
  70
  71 define void @t5(i8* %ptr) nounwind  {
  72 entry:
  73 ; ARM-LABEL: t5:
  74 ; ARM: pli [r0]
  75
  76 ; THUMB2-LABEL: t5:
  77 ; THUMB2: pli [r0]
  78   tail call void @llvm.prefetch( i8* %ptr, i32 0, i32 3, i32 0 )
  79   ret void
  80 }
  81
  82 define void @t6() {
  83 entry:
  84 ;ARM-LABEL: t6:
  85 ;ARM: pld [sp]
  86 ;ARM: pld [sp, #50]
  87 ;ARM: pld [sp, #-50]
  88
  89 ;THUMB2-LABEL: t6:
  90 ;THUMB2: pld [sp]
  91 ;THUMB2: pld [sp, #50]
  92 ;THUMB2: pld [sp, #-50]
  93
  94 %red = alloca [100 x i8], align 1
  95 %0 = getelementptr inbounds [100 x i8], [100 x i8]* %red, i32 0, i32 0
  96 %1 = getelementptr inbounds [100 x i8], [100 x i8]* %red, i32 0, i32 50
  97 %2 = getelementptr inbounds [100 x i8], [100 x i8]* %red, i32 0, i32 -50
  98 call void @llvm.prefetch(i8* %0, i32 0, i32 3, i32 1)
  99 call void @llvm.prefetch(i8* %1, i32 0, i32 3, i32 1)
 100 call void @llvm.prefetch(i8* %2, i32 0, i32 3, i32 1)
 101 ret void
 102 }
 103
 104 define void @t7() {
 105 entry:
 106 ;ARM-LABEL: t7:
 107 ;ARM-MP: pldw [sp]
 108 ;ARM-MP: pldw [sp, #50]
 109 ;ARM-MP: pldw [sp, #-50]
 110
 111 ;THUMB2-MP-LABEL: t7:
 112 ;THUMB2-MP: pldw [sp]
 113 ;THUMB2-MP: pldw [sp, #50]
 114 ;THUMB2-MP: pldw [sp, #-50]
 115
 116 %red = alloca [100 x i8], align 1
 117 %0 = getelementptr inbounds [100 x i8], [100 x i8]* %red, i32 0, i32 0
 118 %1 = getelementptr inbounds [100 x i8], [100 x i8]* %red, i32 0, i32 50
 119 %2 = getelementptr inbounds [100 x i8], [100 x i8]* %red, i32 0, i32 -50
 120 call void @llvm.prefetch(i8* %0, i32 1, i32 3, i32 1)
 121 call void @llvm.prefetch(i8* %1, i32 1, i32 3, i32 1)
 122 call void @llvm.prefetch(i8* %2, i32 1, i32 3, i32 1)
 123 ret void
 124 }
 125
 126 define void @t8() {
 127 entry:
 128 ;ARM-LABEL: t8:
 129 ;ARM: pli [sp]
 130 ;ARM: pli [sp, #50]
 131 ;ARM: pli [sp, #-50]
 132
 133 ;THUMB2-LABEL: t8:
 134 ;THUMB2: pli [sp]
 135 ;THUMB2: pli [sp, #50]
 136 ;THUMB2: pli [sp, #-50]
 137
 138 %red = alloca [100 x i8], align 1
 139 %0 = getelementptr inbounds [100 x i8], [100 x i8]* %red, i32 0, i32 0
 140 %1 = getelementptr inbounds [100 x i8], [100 x i8]* %red, i32 0, i32 50
 141 %2 = getelementptr inbounds [100 x i8], [100 x i8]* %red, i32 0, i32 -50
 142 call void @llvm.prefetch(i8* %0, i32 0, i32 3, i32 0)
 143 call void @llvm.prefetch(i8* %1, i32 0, i32 3, i32 0)
 144 call void @llvm.prefetch(i8* %2, i32 0, i32 3, i32 0)
 145 ret void
 146 }