test/CodeGen/X86/vec_fabs.ll

   1 ; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
   2 ; RUN: llc < %s -mtriple=i686-unknown-unknown -mattr=+avx | FileCheck %s --check-prefix=X32 --check-prefix=X32_AVX
   3 ; RUN: llc < %s -mtriple=i686-unknown-unknown -mattr=+avx512vl | FileCheck %s --check-prefix=X32 --check-prefix=X32_AVX512VL
   4 ; RUN: llc < %s -mtriple=i686-unknown-unknown -mattr=+avx512dq,+avx512vl | FileCheck %s --check-prefix=X32 --check-prefix=X32_AVX512VLDQ
   5 ; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+avx | FileCheck %s --check-prefix=X64 --check-prefix=X64_AVX
   6 ; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+avx512vl | FileCheck %s --check-prefix=X64 --check-prefix=X64_AVX512VL
   7 ; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+avx512dq,+avx512vl | FileCheck %s --check-prefix=X64 --check-prefix=X64_AVX512VLDQ
   8
   9 define <2 x double> @fabs_v2f64(<2 x double> %p) {
  10 ; X32-LABEL: fabs_v2f64:
  11 ; X32:       # %bb.0:
  12 ; X32-NEXT:    vandps {{\.LCPI.*}}, %xmm0, %xmm0
  13 ; X32-NEXT:    retl
  14 ;
  15 ; X64-LABEL: fabs_v2f64:
  16 ; X64:       # %bb.0:
  17 ; X64-NEXT:    vandps {{.*}}(%rip), %xmm0, %xmm0
  18 ; X64-NEXT:    retq
  19   %t = call <2 x double> @llvm.fabs.v2f64(<2 x double> %p)
  20   ret <2 x double> %t
  21 }
  22 declare <2 x double> @llvm.fabs.v2f64(<2 x double> %p)
  23
  24 define <4 x float> @fabs_v4f32(<4 x float> %p) {
  25 ; X32_AVX-LABEL: fabs_v4f32:
  26 ; X32_AVX:       # %bb.0:
  27 ; X32_AVX-NEXT:    vandps {{\.LCPI.*}}, %xmm0, %xmm0
  28 ; X32_AVX-NEXT:    retl
  29 ;
  30 ; X32_AVX512VL-LABEL: fabs_v4f32:
  31 ; X32_AVX512VL:       # %bb.0:
  32 ; X32_AVX512VL-NEXT:    vpandd {{\.LCPI.*}}{1to4}, %xmm0, %xmm0
  33 ; X32_AVX512VL-NEXT:    retl
  34 ;
  35 ; X32_AVX512VLDQ-LABEL: fabs_v4f32:
  36 ; X32_AVX512VLDQ:       # %bb.0:
  37 ; X32_AVX512VLDQ-NEXT:    vandps {{\.LCPI.*}}{1to4}, %xmm0, %xmm0
  38 ; X32_AVX512VLDQ-NEXT:    retl
  39 ;
  40 ; X64_AVX-LABEL: fabs_v4f32:
  41 ; X64_AVX:       # %bb.0:
  42 ; X64_AVX-NEXT:    vandps {{.*}}(%rip), %xmm0, %xmm0
  43 ; X64_AVX-NEXT:    retq
  44 ;
  45 ; X64_AVX512VL-LABEL: fabs_v4f32:
  46 ; X64_AVX512VL:       # %bb.0:
  47 ; X64_AVX512VL-NEXT:    vpandd {{.*}}(%rip){1to4}, %xmm0, %xmm0
  48 ; X64_AVX512VL-NEXT:    retq
  49 ;
  50 ; X64_AVX512VLDQ-LABEL: fabs_v4f32:
  51 ; X64_AVX512VLDQ:       # %bb.0:
  52 ; X64_AVX512VLDQ-NEXT:    vandps {{.*}}(%rip){1to4}, %xmm0, %xmm0
  53 ; X64_AVX512VLDQ-NEXT:    retq
  54   %t = call <4 x float> @llvm.fabs.v4f32(<4 x float> %p)
  55   ret <4 x float> %t
  56 }
  57 declare <4 x float> @llvm.fabs.v4f32(<4 x float> %p)
  58
  59 define <4 x double> @fabs_v4f64(<4 x double> %p) {
  60 ; X32_AVX-LABEL: fabs_v4f64:
  61 ; X32_AVX:       # %bb.0:
  62 ; X32_AVX-NEXT:    vandps {{\.LCPI.*}}, %ymm0, %ymm0
  63 ; X32_AVX-NEXT:    retl
  64 ;
  65 ; X32_AVX512VL-LABEL: fabs_v4f64:
  66 ; X32_AVX512VL:       # %bb.0:
  67 ; X32_AVX512VL-NEXT:    vpandq {{\.LCPI.*}}{1to4}, %ymm0, %ymm0
  68 ; X32_AVX512VL-NEXT:    retl
  69 ;
  70 ; X32_AVX512VLDQ-LABEL: fabs_v4f64:
  71 ; X32_AVX512VLDQ:       # %bb.0:
  72 ; X32_AVX512VLDQ-NEXT:    vandpd {{\.LCPI.*}}{1to4}, %ymm0, %ymm0
  73 ; X32_AVX512VLDQ-NEXT:    retl
  74 ;
  75 ; X64_AVX-LABEL: fabs_v4f64:
  76 ; X64_AVX:       # %bb.0:
  77 ; X64_AVX-NEXT:    vandps {{.*}}(%rip), %ymm0, %ymm0
  78 ; X64_AVX-NEXT:    retq
  79 ;
  80 ; X64_AVX512VL-LABEL: fabs_v4f64:
  81 ; X64_AVX512VL:       # %bb.0:
  82 ; X64_AVX512VL-NEXT:    vpandq {{.*}}(%rip){1to4}, %ymm0, %ymm0
  83 ; X64_AVX512VL-NEXT:    retq
  84 ;
  85 ; X64_AVX512VLDQ-LABEL: fabs_v4f64:
  86 ; X64_AVX512VLDQ:       # %bb.0:
  87 ; X64_AVX512VLDQ-NEXT:    vandpd {{.*}}(%rip){1to4}, %ymm0, %ymm0
  88 ; X64_AVX512VLDQ-NEXT:    retq
  89   %t = call <4 x double> @llvm.fabs.v4f64(<4 x double> %p)
  90   ret <4 x double> %t
  91 }
  92 declare <4 x double> @llvm.fabs.v4f64(<4 x double> %p)
  93
  94 define <8 x float> @fabs_v8f32(<8 x float> %p) {
  95 ; X32_AVX-LABEL: fabs_v8f32:
  96 ; X32_AVX:       # %bb.0:
  97 ; X32_AVX-NEXT:    vandps {{\.LCPI.*}}, %ymm0, %ymm0
  98 ; X32_AVX-NEXT:    retl
  99 ;
 100 ; X32_AVX512VL-LABEL: fabs_v8f32:
 101 ; X32_AVX512VL:       # %bb.0:
 102 ; X32_AVX512VL-NEXT:    vpandd {{\.LCPI.*}}{1to8}, %ymm0, %ymm0
 103 ; X32_AVX512VL-NEXT:    retl
 104 ;
 105 ; X32_AVX512VLDQ-LABEL: fabs_v8f32:
 106 ; X32_AVX512VLDQ:       # %bb.0:
 107 ; X32_AVX512VLDQ-NEXT:    vandps {{\.LCPI.*}}{1to8}, %ymm0, %ymm0
 108 ; X32_AVX512VLDQ-NEXT:    retl
 109 ;
 110 ; X64_AVX-LABEL: fabs_v8f32:
 111 ; X64_AVX:       # %bb.0:
 112 ; X64_AVX-NEXT:    vandps {{.*}}(%rip), %ymm0, %ymm0
 113 ; X64_AVX-NEXT:    retq
 114 ;
 115 ; X64_AVX512VL-LABEL: fabs_v8f32:
 116 ; X64_AVX512VL:       # %bb.0:
 117 ; X64_AVX512VL-NEXT:    vpandd {{.*}}(%rip){1to8}, %ymm0, %ymm0
 118 ; X64_AVX512VL-NEXT:    retq
 119 ;
 120 ; X64_AVX512VLDQ-LABEL: fabs_v8f32:
 121 ; X64_AVX512VLDQ:       # %bb.0:
 122 ; X64_AVX512VLDQ-NEXT:    vandps {{.*}}(%rip){1to8}, %ymm0, %ymm0
 123 ; X64_AVX512VLDQ-NEXT:    retq
 124   %t = call <8 x float> @llvm.fabs.v8f32(<8 x float> %p)
 125   ret <8 x float> %t
 126 }
 127 declare <8 x float> @llvm.fabs.v8f32(<8 x float> %p)
 128
 129 define <8 x double> @fabs_v8f64(<8 x double> %p) {
 130 ; X32_AVX-LABEL: fabs_v8f64:
 131 ; X32_AVX:       # %bb.0:
 132 ; X32_AVX-NEXT:    vmovaps {{.*#+}} ymm2 = [NaN,NaN,NaN,NaN]
 133 ; X32_AVX-NEXT:    vandps %ymm2, %ymm0, %ymm0
 134 ; X32_AVX-NEXT:    vandps %ymm2, %ymm1, %ymm1
 135 ; X32_AVX-NEXT:    retl
 136 ;
 137 ; X32_AVX512VL-LABEL: fabs_v8f64:
 138 ; X32_AVX512VL:       # %bb.0:
 139 ; X32_AVX512VL-NEXT:    vpandq {{\.LCPI.*}}{1to8}, %zmm0, %zmm0
 140 ; X32_AVX512VL-NEXT:    retl
 141 ;
 142 ; X32_AVX512VLDQ-LABEL: fabs_v8f64:
 143 ; X32_AVX512VLDQ:       # %bb.0:
 144 ; X32_AVX512VLDQ-NEXT:    vandpd {{\.LCPI.*}}{1to8}, %zmm0, %zmm0
 145 ; X32_AVX512VLDQ-NEXT:    retl
 146 ;
 147 ; X64_AVX-LABEL: fabs_v8f64:
 148 ; X64_AVX:       # %bb.0:
 149 ; X64_AVX-NEXT:    vmovaps {{.*#+}} ymm2 = [NaN,NaN,NaN,NaN]
 150 ; X64_AVX-NEXT:    vandps %ymm2, %ymm0, %ymm0
 151 ; X64_AVX-NEXT:    vandps %ymm2, %ymm1, %ymm1
 152 ; X64_AVX-NEXT:    retq
 153 ;
 154 ; X64_AVX512VL-LABEL: fabs_v8f64:
 155 ; X64_AVX512VL:       # %bb.0:
 156 ; X64_AVX512VL-NEXT:    vpandq {{.*}}(%rip){1to8}, %zmm0, %zmm0
 157 ; X64_AVX512VL-NEXT:    retq
 158 ;
 159 ; X64_AVX512VLDQ-LABEL: fabs_v8f64:
 160 ; X64_AVX512VLDQ:       # %bb.0:
 161 ; X64_AVX512VLDQ-NEXT:    vandpd {{.*}}(%rip){1to8}, %zmm0, %zmm0
 162 ; X64_AVX512VLDQ-NEXT:    retq
 163   %t = call <8 x double> @llvm.fabs.v8f64(<8 x double> %p)
 164   ret <8 x double> %t
 165 }
 166 declare <8 x double> @llvm.fabs.v8f64(<8 x double> %p)
 167
 168 define <16 x float> @fabs_v16f32(<16 x float> %p) {
 169 ; X32_AVX-LABEL: fabs_v16f32:
 170 ; X32_AVX:       # %bb.0:
 171 ; X32_AVX-NEXT:    vmovaps {{.*#+}} ymm2 = [NaN,NaN,NaN,NaN,NaN,NaN,NaN,NaN]
 172 ; X32_AVX-NEXT:    vandps %ymm2, %ymm0, %ymm0
 173 ; X32_AVX-NEXT:    vandps %ymm2, %ymm1, %ymm1
 174 ; X32_AVX-NEXT:    retl
 175 ;
 176 ; X32_AVX512VL-LABEL: fabs_v16f32:
 177 ; X32_AVX512VL:       # %bb.0:
 178 ; X32_AVX512VL-NEXT:    vpandd {{\.LCPI.*}}{1to16}, %zmm0, %zmm0
 179 ; X32_AVX512VL-NEXT:    retl
 180 ;
 181 ; X32_AVX512VLDQ-LABEL: fabs_v16f32:
 182 ; X32_AVX512VLDQ:       # %bb.0:
 183 ; X32_AVX512VLDQ-NEXT:    vandps {{\.LCPI.*}}{1to16}, %zmm0, %zmm0
 184 ; X32_AVX512VLDQ-NEXT:    retl
 185 ;
 186 ; X64_AVX-LABEL: fabs_v16f32:
 187 ; X64_AVX:       # %bb.0:
 188 ; X64_AVX-NEXT:    vmovaps {{.*#+}} ymm2 = [NaN,NaN,NaN,NaN,NaN,NaN,NaN,NaN]
 189 ; X64_AVX-NEXT:    vandps %ymm2, %ymm0, %ymm0
 190 ; X64_AVX-NEXT:    vandps %ymm2, %ymm1, %ymm1
 191 ; X64_AVX-NEXT:    retq
 192 ;
 193 ; X64_AVX512VL-LABEL: fabs_v16f32:
 194 ; X64_AVX512VL:       # %bb.0:
 195 ; X64_AVX512VL-NEXT:    vpandd {{.*}}(%rip){1to16}, %zmm0, %zmm0
 196 ; X64_AVX512VL-NEXT:    retq
 197 ;
 198 ; X64_AVX512VLDQ-LABEL: fabs_v16f32:
 199 ; X64_AVX512VLDQ:       # %bb.0:
 200 ; X64_AVX512VLDQ-NEXT:    vandps {{.*}}(%rip){1to16}, %zmm0, %zmm0
 201 ; X64_AVX512VLDQ-NEXT:    retq
 202   %t = call <16 x float> @llvm.fabs.v16f32(<16 x float> %p)
 203   ret <16 x float> %t
 204 }
 205 declare <16 x float> @llvm.fabs.v16f32(<16 x float> %p)
 206
 207 ; PR20354: when generating code for a vector fabs op,
 208 ; make sure that we're only turning off the sign bit of each float value.
 209 ; No constant pool loads or vector ops are needed for the fabs of a
 210 ; bitcasted integer constant; we should just return an integer constant
 211 ; that has the sign bits turned off.
 212 ;
 213 ; So instead of something like this:
 214 ;    movabsq (constant pool load of mask for sign bits)
 215 ;    vmovq   (move from integer register to vector/fp register)
 216 ;    vandps  (mask off sign bits)
 217 ;    vmovq   (move vector/fp register back to integer return register)
 218 ;
 219 ; We should generate:
 220 ;    mov     (put constant value in return register)
 221
 222 define i64 @fabs_v2f32_1() {
 223 ; X32-LABEL: fabs_v2f32_1:
 224 ; X32:       # %bb.0:
 225 ; X32-NEXT:    xorl %eax, %eax
 226 ; X32-NEXT:    movl $2147483647, %edx # imm = 0x7FFFFFFF
 227 ; X32-NEXT:    retl
 228 ;
 229 ; X64-LABEL: fabs_v2f32_1:
 230 ; X64:       # %bb.0:
 231 ; X64-NEXT:    movabsq $9223372032559808512, %rax # imm = 0x7FFFFFFF00000000
 232 ; X64-NEXT:    retq
 233  %bitcast = bitcast i64 18446744069414584320 to <2 x float> ; 0xFFFF_FFFF_0000_0000
 234  %fabs = call <2 x float> @llvm.fabs.v2f32(<2 x float> %bitcast)
 235  %ret = bitcast <2 x float> %fabs to i64
 236  ret i64 %ret
 237 }
 238
 239 define i64 @fabs_v2f32_2() {
 240 ; X32-LABEL: fabs_v2f32_2:
 241 ; X32:       # %bb.0:
 242 ; X32-NEXT:    movl $2147483647, %eax # imm = 0x7FFFFFFF
 243 ; X32-NEXT:    xorl %edx, %edx
 244 ; X32-NEXT:    retl
 245 ;
 246 ; X64-LABEL: fabs_v2f32_2:
 247 ; X64:       # %bb.0:
 248 ; X64-NEXT:    movl $2147483647, %eax # imm = 0x7FFFFFFF
 249 ; X64-NEXT:    retq
 250  %bitcast = bitcast i64 4294967295 to <2 x float> ; 0x0000_0000_FFFF_FFFF
 251  %fabs = call <2 x float> @llvm.fabs.v2f32(<2 x float> %bitcast)
 252  %ret = bitcast <2 x float> %fabs to i64
 253  ret i64 %ret
 254 }
 255
 256 declare <2 x float> @llvm.fabs.v2f32(<2 x float> %p)