Run DCE after a LoopFlatten test to reduce spurious output [nfc]
[llvm-project.git] / llvm / test / CodeGen / X86 / fptoui-may-overflow.ll
blobec53704289d1966a463523fdff7ddb8b2d0eb6ab
1 ; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
2 ; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=avx | FileCheck %s
4 ; @fptoui_zext is legal to optimize to a single vcvttps2dq: if one of the i8
5 ; results of fptoui is poisoned, the corresponding i32 result of the zext is
6 ; also poisoned. We currently don't implement this optimization.
8 define <16 x i8> @fptoui_zext(<4 x float> %arg) {
9 ; CHECK-LABEL: fptoui_zext:
10 ; CHECK:       # %bb.0:
11 ; CHECK-NEXT:    vcvttps2dq %xmm0, %xmm0
12 ; CHECK-NEXT:    vandps {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0
13 ; CHECK-NEXT:    retq
14   %f = fptoui <4 x float> %arg to <4 x i8>
15   %z = zext <4 x i8> %f to <4 x i32>
16   %b = bitcast <4 x i32> %z to <16 x i8>
17   ret <16 x i8> %b
20 ; In @fptoui_shuffle, we must preserve the vpand for correctnesss. Only the
21 ; i8 values extracted from %s are poison.  The values from the zeroinitializer
22 ; are not.
24 define <16 x i8> @fptoui_shuffle(<4 x float> %arg) {
25 ; CHECK-LABEL: fptoui_shuffle:
26 ; CHECK:       # %bb.0:
27 ; CHECK-NEXT:    vcvttps2dq %xmm0, %xmm0
28 ; CHECK-NEXT:    vandps {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0, %xmm0
29 ; CHECK-NEXT:    retq
30   %f = fptoui <4 x float> %arg to <4 x i8>
31   %s = shufflevector <4 x i8> %f, <4 x i8> undef, <16 x i32> <i32 0, i32 1, i32 2, i32 3, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef, i32 undef>
32   %ss = shufflevector <16 x i8> %s, <16 x i8> zeroinitializer, <16 x i32> <i32 0, i32 17, i32 18, i32 19, i32 1, i32 21, i32 22, i32 23, i32 2, i32 25, i32 26, i32 27, i32 3, i32 29, i32 30, i32 31>
33   ret <16 x i8> %ss