Run DCE after a LoopFlatten test to reduce spurious output [nfc]
[llvm-project.git] / llvm / test / CodeGen / NVPTX / vector-select.ll
blob12b43549f0a91254a9b812ab32f4d9d662cd6f66
1 ; RUN: llc < %s -march=nvptx -mcpu=sm_20 | FileCheck %s
2 ; RUN: llc < %s -march=nvptx64 -mcpu=sm_20 | FileCheck %s
3 ; RUN: %if ptxas && !ptxas-12.0 %{ llc < %s -march=nvptx -mcpu=sm_20 | %ptxas-verify %}
4 ; RUN: %if ptxas %{llc < %s -march=nvptx64 -mcpu=sm_20 | %ptxas-verify %}
6 ; This test makes sure that vector selects are scalarized by the type legalizer.
7 ; If not, type legalization will fail.
9 ; CHECK-LABEL: .visible .func foo(
10 define void @foo(ptr addrspace(1) %def_a, ptr addrspace(1) %def_b, ptr addrspace(1) %def_c) {
11 entry:
12 ; CHECK:  ld.global.v2.u32
13 ; CHECK:  ld.global.v2.u32
14 ; CHECK:  ld.global.v2.u32
15   %tmp4 = load <2 x i32>, ptr addrspace(1) %def_a
16   %tmp6 = load <2 x i32>, ptr addrspace(1) %def_c
17   %tmp8 = load <2 x i32>, ptr addrspace(1) %def_b
18 ; CHECK:  setp.gt.s32
19 ; CHECK:  setp.gt.s32
20   %0 = icmp sge <2 x i32> %tmp4, zeroinitializer
21 ; CHECK:  selp.b32
22 ; CHECK:  selp.b32
23   %cond = select <2 x i1> %0, <2 x i32> %tmp6, <2 x i32> %tmp8
24 ; CHECK:  st.global.v2.u32
25   store <2 x i32> %cond, ptr addrspace(1) %def_c
26   ret void