Run DCE after a LoopFlatten test to reduce spurious output [nfc]
[llvm-project.git] / llvm / test / CodeGen / NVPTX / simple-call.ll
blobd0b01336e940f5c35bbc5d1bc80855aab1eb9346
1 ; RUN: llc < %s -march=nvptx -mcpu=sm_20 -verify-machineinstrs | FileCheck %s
2 ; RUN: llc < %s -march=nvptx64 -mcpu=sm_20 -verify-machineinstrs | FileCheck %s
3 ; RUN: %if ptxas && !ptxas-12.0 %{ llc < %s -march=nvptx -mcpu=sm_20 -verify-machineinstrs | %ptxas-verify %}
4 ; RUN: %if ptxas %{ llc < %s -march=nvptx64 -mcpu=sm_20 -verify-machineinstrs | %ptxas-verify %}
6 ; CHECK: .func ({{.*}}) device_func
7 define float @device_func(float %a) noinline {
8   %ret = fmul float %a, %a
9   ret float %ret
12 ; CHECK: .entry kernel_func
13 define void @kernel_func(ptr %a) {
14   %val = load float, ptr %a
15 ; CHECK: call.uni (retval0),
16 ; CHECK: device_func,
17   %mul = call float @device_func(float %val)
18   store float %mul, ptr %a
19   ret void
24 !nvvm.annotations = !{!1}
26 !1 = !{ptr @kernel_func, !"kernel", i32 1}