test/CodeGen/NVPTX/math-intrins.ll

   1 ; RUN: llc < %s | FileCheck %s
   2 target triple = "nvptx64-nvidia-cuda"
   3
   4 ; Checks that llvm intrinsics for math functions are correctly lowered to PTX.
   5
   6 declare float @llvm.ceil.f32(float) #0
   7 declare double @llvm.ceil.f64(double) #0
   8 declare float @llvm.floor.f32(float) #0
   9 declare double @llvm.floor.f64(double) #0
  10 declare float @llvm.round.f32(float) #0
  11 declare double @llvm.round.f64(double) #0
  12 declare float @llvm.nearbyint.f32(float) #0
  13 declare double @llvm.nearbyint.f64(double) #0
  14 declare float @llvm.rint.f32(float) #0
  15 declare double @llvm.rint.f64(double) #0
  16 declare float @llvm.trunc.f32(float) #0
  17 declare double @llvm.trunc.f64(double) #0
  18 declare float @llvm.fabs.f32(float) #0
  19 declare double @llvm.fabs.f64(double) #0
  20 declare float @llvm.minnum.f32(float, float) #0
  21 declare double @llvm.minnum.f64(double, double) #0
  22 declare float @llvm.maxnum.f32(float, float) #0
  23 declare double @llvm.maxnum.f64(double, double) #0
  24 declare float @llvm.fma.f32(float, float, float) #0
  25 declare double @llvm.fma.f64(double, double, double) #0
  26
  27 ; ---- ceil ----
  28
  29 ; CHECK-LABEL: ceil_float
  30 define float @ceil_float(float %a) {
  31   ; CHECK: cvt.rpi.f32.f32
  32   %b = call float @llvm.ceil.f32(float %a)
  33   ret float %b
  34 }
  35
  36 ; CHECK-LABEL: ceil_float_ftz
  37 define float @ceil_float_ftz(float %a) #1 {
  38   ; CHECK: cvt.rpi.ftz.f32.f32
  39   %b = call float @llvm.ceil.f32(float %a)
  40   ret float %b
  41 }
  42
  43 ; CHECK-LABEL: ceil_double
  44 define double @ceil_double(double %a) {
  45   ; CHECK: cvt.rpi.f64.f64
  46   %b = call double @llvm.ceil.f64(double %a)
  47   ret double %b
  48 }
  49
  50 ; ---- floor ----
  51
  52 ; CHECK-LABEL: floor_float
  53 define float @floor_float(float %a) {
  54   ; CHECK: cvt.rmi.f32.f32
  55   %b = call float @llvm.floor.f32(float %a)
  56   ret float %b
  57 }
  58
  59 ; CHECK-LABEL: floor_float_ftz
  60 define float @floor_float_ftz(float %a) #1 {
  61   ; CHECK: cvt.rmi.ftz.f32.f32
  62   %b = call float @llvm.floor.f32(float %a)
  63   ret float %b
  64 }
  65
  66 ; CHECK-LABEL: floor_double
  67 define double @floor_double(double %a) {
  68   ; CHECK: cvt.rmi.f64.f64
  69   %b = call double @llvm.floor.f64(double %a)
  70   ret double %b
  71 }
  72
  73 ; ---- round ----
  74
  75 ; CHECK-LABEL: round_float
  76 define float @round_float(float %a) {
  77 ; check the use of sign mask and 0.5 to implement round
  78 ; CHECK: and.b32 [[R1:%r[0-9]+]], {{.*}}, -2147483648;
  79 ; CHECK: or.b32 {{.*}}, [[R1]], 1056964608;
  80   %b = call float @llvm.round.f32(float %a)
  81   ret float %b
  82 }
  83
  84 ; CHECK-LABEL: round_float_ftz
  85 define float @round_float_ftz(float %a) #1 {
  86 ; check the use of sign mask and 0.5 to implement round
  87 ; CHECK: and.b32 [[R1:%r[0-9]+]], {{.*}}, -2147483648;
  88 ; CHECK: or.b32 {{.*}}, [[R1]], 1056964608;
  89   %b = call float @llvm.round.f32(float %a)
  90   ret float %b
  91 }
  92
  93 ; CHECK-LABEL: round_double
  94 define double @round_double(double %a) {
  95 ; check the use of 0.5 to implement round
  96 ; CHECK: setp.lt.f64 {{.*}}, [[R:%fd[0-9]+]], 0d3FE0000000000000;
  97 ; CHECK: add.rn.f64 {{.*}}, [[R]], 0d3FE0000000000000;
  98   %b = call double @llvm.round.f64(double %a)
  99   ret double %b
 100 }
 101
 102 ; ---- nearbyint ----
 103
 104 ; CHECK-LABEL: nearbyint_float
 105 define float @nearbyint_float(float %a) {
 106   ; CHECK: cvt.rni.f32.f32
 107   %b = call float @llvm.nearbyint.f32(float %a)
 108   ret float %b
 109 }
 110
 111 ; CHECK-LABEL: nearbyint_float_ftz
 112 define float @nearbyint_float_ftz(float %a) #1 {
 113   ; CHECK: cvt.rni.ftz.f32.f32
 114   %b = call float @llvm.nearbyint.f32(float %a)
 115   ret float %b
 116 }
 117
 118 ; CHECK-LABEL: nearbyint_double
 119 define double @nearbyint_double(double %a) {
 120   ; CHECK: cvt.rni.f64.f64
 121   %b = call double @llvm.nearbyint.f64(double %a)
 122   ret double %b
 123 }
 124
 125 ; ---- rint ----
 126
 127 ; CHECK-LABEL: rint_float
 128 define float @rint_float(float %a) {
 129   ; CHECK: cvt.rni.f32.f32
 130   %b = call float @llvm.rint.f32(float %a)
 131   ret float %b
 132 }
 133
 134 ; CHECK-LABEL: rint_float_ftz
 135 define float @rint_float_ftz(float %a) #1 {
 136   ; CHECK: cvt.rni.ftz.f32.f32
 137   %b = call float @llvm.rint.f32(float %a)
 138   ret float %b
 139 }
 140
 141 ; CHECK-LABEL: rint_double
 142 define double @rint_double(double %a) {
 143   ; CHECK: cvt.rni.f64.f64
 144   %b = call double @llvm.rint.f64(double %a)
 145   ret double %b
 146 }
 147
 148 ; ---- trunc ----
 149
 150 ; CHECK-LABEL: trunc_float
 151 define float @trunc_float(float %a) {
 152   ; CHECK: cvt.rzi.f32.f32
 153   %b = call float @llvm.trunc.f32(float %a)
 154   ret float %b
 155 }
 156
 157 ; CHECK-LABEL: trunc_float_ftz
 158 define float @trunc_float_ftz(float %a) #1 {
 159   ; CHECK: cvt.rzi.ftz.f32.f32
 160   %b = call float @llvm.trunc.f32(float %a)
 161   ret float %b
 162 }
 163
 164 ; CHECK-LABEL: trunc_double
 165 define double @trunc_double(double %a) {
 166   ; CHECK: cvt.rzi.f64.f64
 167   %b = call double @llvm.trunc.f64(double %a)
 168   ret double %b
 169 }
 170
 171 ; ---- abs ----
 172
 173 ; CHECK-LABEL: abs_float
 174 define float @abs_float(float %a) {
 175   ; CHECK: abs.f32
 176   %b = call float @llvm.fabs.f32(float %a)
 177   ret float %b
 178 }
 179
 180 ; CHECK-LABEL: abs_float_ftz
 181 define float @abs_float_ftz(float %a) #1 {
 182   ; CHECK: abs.ftz.f32
 183   %b = call float @llvm.fabs.f32(float %a)
 184   ret float %b
 185 }
 186
 187 ; CHECK-LABEL: abs_double
 188 define double @abs_double(double %a) {
 189   ; CHECK: abs.f64
 190   %b = call double @llvm.fabs.f64(double %a)
 191   ret double %b
 192 }
 193
 194 ; ---- min ----
 195
 196 ; CHECK-LABEL: min_float
 197 define float @min_float(float %a, float %b) {
 198   ; CHECK: min.f32
 199   %x = call float @llvm.minnum.f32(float %a, float %b)
 200   ret float %x
 201 }
 202
 203 ; CHECK-LABEL: min_imm1
 204 define float @min_imm1(float %a) {
 205   ; CHECK: min.f32
 206   %x = call float @llvm.minnum.f32(float %a, float 0.0)
 207   ret float %x
 208 }
 209
 210 ; CHECK-LABEL: min_imm2
 211 define float @min_imm2(float %a) {
 212   ; CHECK: min.f32
 213   %x = call float @llvm.minnum.f32(float 0.0, float %a)
 214   ret float %x
 215 }
 216
 217 ; CHECK-LABEL: min_float_ftz
 218 define float @min_float_ftz(float %a, float %b) #1 {
 219   ; CHECK: min.ftz.f32
 220   %x = call float @llvm.minnum.f32(float %a, float %b)
 221   ret float %x
 222 }
 223
 224 ; CHECK-LABEL: min_double
 225 define double @min_double(double %a, double %b) {
 226   ; CHECK: min.f64
 227   %x = call double @llvm.minnum.f64(double %a, double %b)
 228   ret double %x
 229 }
 230
 231 ; ---- max ----
 232
 233 ; CHECK-LABEL: max_imm1
 234 define float @max_imm1(float %a) {
 235   ; CHECK: max.f32
 236   %x = call float @llvm.maxnum.f32(float %a, float 0.0)
 237   ret float %x
 238 }
 239
 240 ; CHECK-LABEL: max_imm2
 241 define float @max_imm2(float %a) {
 242   ; CHECK: max.f32
 243   %x = call float @llvm.maxnum.f32(float 0.0, float %a)
 244   ret float %x
 245 }
 246
 247 ; CHECK-LABEL: max_float
 248 define float @max_float(float %a, float %b) {
 249   ; CHECK: max.f32
 250   %x = call float @llvm.maxnum.f32(float %a, float %b)
 251   ret float %x
 252 }
 253
 254 ; CHECK-LABEL: max_float_ftz
 255 define float @max_float_ftz(float %a, float %b) #1 {
 256   ; CHECK: max.ftz.f32
 257   %x = call float @llvm.maxnum.f32(float %a, float %b)
 258   ret float %x
 259 }
 260
 261 ; CHECK-LABEL: max_double
 262 define double @max_double(double %a, double %b) {
 263   ; CHECK: max.f64
 264   %x = call double @llvm.maxnum.f64(double %a, double %b)
 265   ret double %x
 266 }
 267
 268 ; ---- fma ----
 269
 270 ; CHECK-LABEL: @fma_float
 271 define float @fma_float(float %a, float %b, float %c) {
 272   ; CHECK: fma.rn.f32
 273   %x = call float @llvm.fma.f32(float %a, float %b, float %c)
 274   ret float %x
 275 }
 276
 277 ; CHECK-LABEL: @fma_float_ftz
 278 define float @fma_float_ftz(float %a, float %b, float %c) #1 {
 279   ; CHECK: fma.rn.ftz.f32
 280   %x = call float @llvm.fma.f32(float %a, float %b, float %c)
 281   ret float %x
 282 }
 283
 284 ; CHECK-LABEL: @fma_double
 285 define double @fma_double(double %a, double %b, double %c) {
 286   ; CHECK: fma.rn.f64
 287   %x = call double @llvm.fma.f64(double %a, double %b, double %c)
 288   ret double %x
 289 }
 290
 291 attributes #0 = { nounwind readnone }
 292 attributes #1 = { "nvptx-f32ftz" = "true" }