Run DCE after a LoopFlatten test to reduce spurious output [nfc]
[llvm-project.git] / llvm / test / CodeGen / AMDGPU / xor3-i1-const.ll
blob3b0592388a747768871151350a28abd368326f32
1 ; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
2 ; RUN: llc -march=amdgcn -mcpu=bonaire -verify-machineinstrs < %s | FileCheck -check-prefix=GCN %s
4 ; This test used to crash
5 define amdgpu_ps float @xor3_i1_const(float inreg %arg1, i32 inreg %arg2) {
6 ; GCN-LABEL: xor3_i1_const:
7 ; GCN:       ; %bb.0: ; %main_body
8 ; GCN-NEXT:    v_mov_b32_e32 v0, 0x42640000
9 ; GCN-NEXT:    v_cmp_lt_f32_e64 s[2:3], s0, 0
10 ; GCN-NEXT:    v_cmp_lt_f32_e32 vcc, s0, v0
11 ; GCN-NEXT:    s_and_b64 s[0:1], s[2:3], vcc
12 ; GCN-NEXT:    v_cndmask_b32_e64 v0, 1.0, 0, s[0:1]
13 ; GCN-NEXT:    ; return to shader part epilog
14 main_body:
15   %tmp26 = fcmp nsz olt float %arg1, 0.000000e+00
16   %tmp28 = call nsz float @llvm.amdgcn.interp.p2(float undef, float undef, i32 0, i32 0, i32 %arg2)
17   %tmp29 = fcmp nsz olt float %arg1, 5.700000e+01
18   %tmp31 = fcmp nsz olt float %tmp28, 0.000000e+00
19   %.demorgan = and i1 %tmp26, %tmp29
20   %tmp34 = xor i1 %.demorgan, true
21   %tmp35 = and i1 %tmp31, %tmp34
22   %tmp36 = xor i1 %tmp35, true
23   %tmp37 = xor i1 %.demorgan, %tmp36
24   %tmp42 = or i1 %tmp37, %tmp35
25   %tmp43 = select i1 %tmp42, float 1.000000e+00, float 0.000000e+00
26   ret float %tmp43
29 declare float @llvm.amdgcn.interp.p2(float, float, i32, i32, i32)