Run DCE after a LoopFlatten test to reduce spurious output [nfc]
[llvm-project.git] / llvm / test / CodeGen / X86 / replace_unsupported_masked_mem_intrin.ll
blob2299a931c80fb9f02d84dab1fafb01552eb61770
1 ; RUN: llc -O0 -mtriple=x86_64-unknown-linux-gnu -mattr=+sse,+sse2 < %s -o /dev/null
2 ; pr33001 - Check that llc doesn't crash when running with O0 option.
4 ; RUN: llc -O2 -opt-bisect-limit=0 -mtriple=x86_64-unknown-linux-gnu -mattr=+sse,+sse2 < %s -o /dev/null
5 ; Check that llc doesn't crash due to ScalarizeMaskedMemIntring not being run
6 ; because of opt-bisect-limit that in turn causes crash in instruction selection
7 ; for unsupported gather/scatter.
9 target datalayout = "e-m:e-i64:64-f80:128-n8:16:32:64-S128"
10 target triple = "x86_64-unknown-linux-gnu"
12 define <4 x i32> @test_masked_load(ptr %base, <4 x i1> %mask) {
13   %res = call <4 x i32> @llvm.masked.load.v4i32.p0(ptr %base, i32 4, <4 x i1> %mask, <4 x i32> zeroinitializer)
14   ret <4 x i32> %res
17 declare <4 x i32> @llvm.masked.load.v4i32.p0(ptr, i32, <4 x i1>, <4 x i32>)
20 define void @test_masked_store(ptr %base, <4 x i32> %value, <4 x i1> %mask) {
21   call void @llvm.masked.store.v4i32.p0(<4 x i32> %value, ptr %base, i32 4, <4 x i1> %mask)
22   ret void
25 declare void @llvm.masked.store.v4i32.p0(<4 x i32>, ptr, i32, <4 x i1>)
28 define <4 x i32> @llvm_masked_gather(<4 x ptr> %ptrs, <4 x i1> %mask) {
29   %res = call <4 x i32> @llvm.masked.gather.v4i32(<4 x ptr> %ptrs, i32 4, <4 x i1> %mask, <4 x i32> undef)
30   ret <4 x i32> %res
33 declare <4 x i32> @llvm.masked.gather.v4i32(<4 x ptr>, i32, <4 x i1>, <4 x i32>)
36 define void @llvm_masked_scatter(<4 x ptr> %ptrs, <4 x i32> %value, <4 x i1> %mask) {
37   call void @llvm.masked.scatter.v4i32(<4 x i32> %value, <4 x ptr> %ptrs, i32 4, <4 x i1> %mask)
38   ret void
41 declare void @llvm.masked.scatter.v4i32(<4 x i32>, <4 x ptr>, i32, <4 x i1>)