Run DCE after a LoopFlatten test to reduce spurious output [nfc]
[llvm-project.git] / llvm / test / CodeGen / AMDGPU / cse-phi-incoming-val.ll
blobc98da81264744340603db40fdfcae9e7ff5c1793
1 ; RUN: llc < %s -mtriple=amdgcn--amdpal -mcpu=gfx900 -verify-machineinstrs | FileCheck %s
3 ; Check that the redundant immediate MOV instruction
4 ; (by-product of handling phi nodes) is not found
5 ; in the generated code.
7 ; CHECK-LABEL: {{^}}mov_opt:
8 ; CHECK: s_mov_b32 [[SREG:s[0-9]+]], 1.0
9 ; CHECK: %bb.1:
10 ; CHECK-NOT: v_mov_b32_e32 {{v[0-9]+}}, 1.0
11 ; CHECK: BB0_3:
12 ; CHECK: v_mov_b32_e32 v{{[0-9]+}}, [[SREG]]
14 define amdgpu_ps void @mov_opt(i32 %arg, i32 inreg %arg1, i32 inreg %arg2) local_unnamed_addr #0 {
15 bb:
16   %tmp = icmp eq i32 %arg1, 0
17   br i1 %tmp, label %bb3, label %bb10
19 bb3:                                              ; preds = %bb
20   %tmp4 = icmp eq i32 %arg2, 0
21   br i1 %tmp4, label %bb5, label %bb10
23 bb5:                                              ; preds = %bb3
24   %tmp6 = getelementptr <{ [4294967295 x i32] }>, ptr addrspace(6) null, i32 0, i32 0, i32 %arg
25   %tmp7 = load i32, ptr addrspace(6) %tmp6
26   %tmp8 = icmp eq i32 %tmp7, 1
27   br i1 %tmp8, label %bb10, label %bb9
29 bb9:                                              ; preds = %bb5
30   br label %bb10
32 bb10:                                             ; preds = %bb9, %bb5, %bb3, %bb
33   %tmp11 = phi float [ 1.000000e+00, %bb3 ], [ 0.000000e+00, %bb9 ], [ 1.000000e+00, %bb ], [ undef, %bb5 ]
34   call void @llvm.amdgcn.exp.f32(i32 immarg 40, i32 immarg 15, float %tmp11, float undef, float undef, float undef, i1 immarg false, i1 immarg false) #0
35   ret void
38 ; Function Attrs: inaccessiblememonly nounwind
39 declare void @llvm.amdgcn.exp.f32(i32 immarg, i32 immarg, float, float, float, float, i1 immarg, i1 immarg) #1
41 attributes #0 = { nounwind }
42 attributes #1 = { inaccessiblememonly nounwind }