llvm/test/CodeGen/X86/sqrt-fastmath-tunecpu-attr.ll

   1 ; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
   2 ; RUN: llc -mtriple=x86_64-- < %s | FileCheck %s
   3
   4 define float @f32_tune_nhm(float %f) #0 {
   5 ; CHECK-LABEL: f32_tune_nhm:
   6 ; CHECK:       # %bb.0:
   7 ; CHECK-NEXT:    rsqrtss %xmm0, %xmm1
   8 ; CHECK-NEXT:    movaps %xmm0, %xmm2
   9 ; CHECK-NEXT:    mulss %xmm1, %xmm2
  10 ; CHECK-NEXT:    movss {{.*#+}} xmm3 = [-5.0E-1,0.0E+0,0.0E+0,0.0E+0]
  11 ; CHECK-NEXT:    mulss %xmm2, %xmm3
  12 ; CHECK-NEXT:    mulss %xmm1, %xmm2
  13 ; CHECK-NEXT:    addss {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm2
  14 ; CHECK-NEXT:    mulss %xmm3, %xmm2
  15 ; CHECK-NEXT:    andps {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0
  16 ; CHECK-NEXT:    cmpltss {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0
  17 ; CHECK-NEXT:    andnps %xmm2, %xmm0
  18 ; CHECK-NEXT:    retq
  19   %call = tail call fast float @llvm.sqrt.f32(float %f)
  20   ret float %call
  21 }
  22
  23 define float @f32_no_tune(float %f) #1 {
  24 ; CHECK-LABEL: f32_no_tune:
  25 ; CHECK:       # %bb.0:
  26 ; CHECK-NEXT:    sqrtss %xmm0, %xmm0
  27 ; CHECK-NEXT:    retq
  28   %call = tail call fast float @llvm.sqrt.f32(float %f)
  29   ret float %call
  30 }
  31
  32 define float @f32_tune_generic(float %f) #2 {
  33 ; CHECK-LABEL: f32_tune_generic:
  34 ; CHECK:       # %bb.0:
  35 ; CHECK-NEXT:    sqrtss %xmm0, %xmm0
  36 ; CHECK-NEXT:    retq
  37   %call = tail call fast float @llvm.sqrt.f32(float %f)
  38   ret float %call
  39 }
  40
  41 define float @f32_tune_x86_64(float %f) #3 {
  42 ; CHECK-LABEL: f32_tune_x86_64:
  43 ; CHECK:       # %bb.0:
  44 ; CHECK-NEXT:    rsqrtss %xmm0, %xmm1
  45 ; CHECK-NEXT:    movaps %xmm0, %xmm2
  46 ; CHECK-NEXT:    mulss %xmm1, %xmm2
  47 ; CHECK-NEXT:    movss {{.*#+}} xmm3 = [-5.0E-1,0.0E+0,0.0E+0,0.0E+0]
  48 ; CHECK-NEXT:    mulss %xmm2, %xmm3
  49 ; CHECK-NEXT:    mulss %xmm1, %xmm2
  50 ; CHECK-NEXT:    addss {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm2
  51 ; CHECK-NEXT:    mulss %xmm3, %xmm2
  52 ; CHECK-NEXT:    andps {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0
  53 ; CHECK-NEXT:    cmpltss {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0
  54 ; CHECK-NEXT:    andnps %xmm2, %xmm0
  55 ; CHECK-NEXT:    retq
  56   %call = tail call fast float @llvm.sqrt.f32(float %f)
  57   ret float %call
  58 }
  59
  60 define float @f32_tune_snb(float %f) #4 {
  61 ; CHECK-LABEL: f32_tune_snb:
  62 ; CHECK:       # %bb.0:
  63 ; CHECK-NEXT:    sqrtss %xmm0, %xmm0
  64 ; CHECK-NEXT:    retq
  65   %call = tail call fast float @llvm.sqrt.f32(float %f)
  66   ret float %call
  67 }
  68
  69 define float @f32_target_snb_tune_snb(float %f) #5 {
  70 ; CHECK-LABEL: f32_target_snb_tune_snb:
  71 ; CHECK:       # %bb.0:
  72 ; CHECK-NEXT:    vsqrtss %xmm0, %xmm0, %xmm0
  73 ; CHECK-NEXT:    retq
  74   %call = tail call fast float @llvm.sqrt.f32(float %f)
  75   ret float %call
  76 }
  77
  78 declare float @llvm.sqrt.f32(float)
  79
  80 attributes #0 = { "target-cpu"="x86-64" "tune-cpu"="nehalem" }
  81 attributes #1 = { "target-cpu"="x86-64" }
  82 attributes #2 = { "target-cpu"="x86-64" "tune-cpu"="generic" }
  83 attributes #3 = { "target-cpu"="x86-64" "tune-cpu"="x86-64" }
  84 attributes #4 = { "target-cpu"="x86-64" "tune-cpu"="sandybridge" }
  85 attributes #5 = { "target-cpu"="sandybridge" "tune-cpu"="sandybridge" }