Run DCE after a LoopFlatten test to reduce spurious output [nfc]
[llvm-project.git] / llvm / test / CodeGen / X86 / compress-undef-float-passthrough.ll
blob47331db7261b3c10721468fbda5ef4eb1d8be2c3
1 ; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
2 ; RUN: llc < %s -mtriple=x86_64-- -mattr=avx512f,avx512vl | FileCheck %s --check-prefix=CHECK
4 define void @test_compress_undef_float_passthrough() {
5 ; CHECK-LABEL: test_compress_undef_float_passthrough:
6 ; CHECK:       # %bb.0: # %entry
7 ; CHECK-NEXT:    movb $5, %al
8 ; CHECK-NEXT:    kmovw %eax, %k1
9 ; CHECK-NEXT:    vcompresspd %ymm0, %ymm0 {%k1} {z}
10 ; CHECK-NEXT:    vscatterqpd %ymm0, (,%ymm0) {%k1}
11 ; CHECK-NEXT:    vzeroupper
12 ; CHECK-NEXT:    retq
13 entry:                                          ; preds = %loop.50
14   %0 = bitcast i4 undef to <4 x i1>
15   %1 = call <4 x double> @llvm.x86.avx512.mask.compress.v4f64(<4 x double> undef, <4 x double> undef, <4 x i1> <i1 1, i1 0, i1 1, i1 0>)
16   call void @llvm.masked.scatter.v4f64.v4p0(<4 x double> %1, <4 x ptr> undef, i32 0, <4 x i1> %0)
17   ret void
20 ; Function Attrs: nounwind readnone
21 declare <4 x double> @llvm.x86.avx512.mask.compress.v4f64(<4 x double>, <4 x double>, <4 x i1>)
23 ; Function Attrs: nocallback nofree nosync nounwind willreturn writeonly
24 declare void @llvm.masked.scatter.v4f64.v4p0(<4 x double>, <4 x ptr>, i32 immarg, <4 x i1>)