Run DCE after a LoopFlatten test to reduce spurious output [nfc]
[llvm-project.git] / llvm / test / CodeGen / AMDGPU / fcmp.ll
blob7846c02030988c887271140cc44ef99370dd04eb
1 ; RUN: llc < %s -march=r600 -mcpu=redwood | FileCheck %s
3 ; CHECK: {{^}}fcmp_sext:
4 ; CHECK: SETE_DX10  T{{[0-9]+\.[XYZW], T[0-9]+\.[XYZW], T[0-9]+\.[XYZW]}}
6 define amdgpu_kernel void @fcmp_sext(ptr addrspace(1) %out, ptr addrspace(1) %in) {
7 entry:
8   %0 = load float, ptr addrspace(1) %in
9   %arrayidx1 = getelementptr inbounds float, ptr addrspace(1) %in, i32 1
10   %1 = load float, ptr addrspace(1) %arrayidx1
11   %cmp = fcmp oeq float %0, %1
12   %sext = sext i1 %cmp to i32
13   store i32 %sext, ptr addrspace(1) %out
14   ret void
17 ; This test checks that a setcc node with f32 operands is lowered to a
18 ; SET*_DX10 instruction.  Previously we were lowering this to:
19 ; SET* + FP_TO_SINT
21 ; CHECK: {{^}}fcmp_br:
22 ; CHECK: SET{{[N]*}}E_DX10 * T{{[0-9]+\.[XYZW],}}
23 ; CHECK-NEXT: {{[0-9]+\(5.0}}
25 define amdgpu_kernel void @fcmp_br(ptr addrspace(1) %out, float %in) {
26 entry:
27   %0 = fcmp oeq float %in, 5.0
28   br i1 %0, label %IF, label %ENDIF
30 IF:
31   %1 = getelementptr i32, ptr addrspace(1) %out, i32 1
32   store i32 0, ptr addrspace(1) %1
33   br label %ENDIF
35 ENDIF:
36   store i32 0, ptr addrspace(1) %out
37   ret void