Run DCE after a LoopFlatten test to reduce spurious output [nfc]
[llvm-project.git] / llvm / test / CodeGen / AMDGPU / sink-image-sample.ll
blobe1273e1a4bcd083d18b304ef1e35ec38b8b0c2c2
1 ; RUN: llc -mtriple=amdgcn-mesa-mesa3d -mcpu=gfx900 -verify-machineinstrs < %s | FileCheck -check-prefixes=GCN %s
2 ; RUN: llc -mtriple=amdgcn-mesa-mesa3d -mcpu=gfx1010 -verify-machineinstrs < %s | FileCheck -check-prefixes=GCN %s
4 ; Test that image.sample instruction is sunk across the branch and not left in the first block. Since the kill may terminate the shader there might be no need for sampling the image.
6 ; GCN-LABEL: {{^}}sinking_img_sample:
7 ; GCN-NOT: image_sample
8 ; GCN: branch
9 ; GCN: image_sample
10 ; GCN: exp null
12 define amdgpu_ps float @sinking_img_sample() {
13 main_body:
14   %i = call <3 x float> @llvm.amdgcn.image.sample.2d.v3f32.f32(i32 7, float undef, float undef, <8 x i32> undef, <4 x i32> undef, i1 false, i32 0, i32 0)
15   br i1 undef, label %endif1, label %if1
17 if1:                                              ; preds = %main_body
18   call void @llvm.amdgcn.kill(i1 false) #4
19   br label %exit
21 endif1:                                           ; preds = %main_body
22   %i22 = extractelement <3 x float> %i, i32 2
23   %i23 = call nsz arcp contract float @llvm.fma.f32(float %i22, float 0.000000e+00, float 0.000000e+00) #1
24   br label %exit
26 exit:                                             ; preds = %endif1, %if1
27   %i24 = phi float [ undef, %if1 ], [ %i23, %endif1 ]
28   ret float %i24
30 ; Function Attrs: nounwind readonly willreturn
31 declare <3 x float> @llvm.amdgcn.image.sample.2d.v3f32.f32(i32 immarg, float, float, <8 x i32>, <4 x i32>, i1 immarg, i32 immarg, i32 immarg) #3
33 ; Function Attrs: nofree nosync nounwind readnone speculatable willreturn
34 declare float @llvm.fma.f32(float, float, float) #2
36 ; Function Attrs: nounwind
37 declare void @llvm.amdgcn.kill(i1) #4
39 attributes #1 = { nounwind readnone }
40 attributes #2 = { nofree nosync nounwind readnone speculatable willreturn }
41 attributes #3 = { nounwind readonly willreturn }
42 attributes #4 = { nounwind }