Run DCE after a LoopFlatten test to reduce spurious output [nfc]
[llvm-project.git] / llvm / test / CodeGen / NVPTX / i128-retval.ll
blobdf173536c297f8e6ae657017fe6563a9e83cb520
1 ; RUN: llc < %s -O0 -march=nvptx64 -mcpu=sm_20 | FileCheck %s
2 ; RUN: %if ptxas %{ llc < %s -O0 -march=nvptx64 -mcpu=sm_20 | %ptxas-verify %}
4 ; CHECK-LABEL: .visible .func (.param .align 16 .b8 func_retval0[16]) callee(
5 define i128 @callee(i128) {
6   ; CHECK: ld.param.v2.u64 {%[[REG0:rd[0-9]+]], %[[REG1:rd[0-9]+]]}, [callee_param_0];
7   ; CHECK: st.param.v2.b64 [func_retval0+0], {%[[REG0]], %[[REG1]]}
8   ret i128 %0
11 ; CHECK-LABEL: .visible .func caller(
12 define void @caller(i128, ptr) {
13 start:
14   ; CHECK-DAG: ld.param.v2.u64 {%[[REG0:rd[0-9]+]], %[[REG1:rd[0-9]+]]}, [caller_param_0];
15   ; CHECK-DAG: ld.param.u64 %[[OUT:rd[0-9]+]],  [caller_param_1];
17   ; CHECK: { // callseq 0, 0
18         ; CHECK: .param .align 16 .b8 retval0[16];
19         ; CHECK: call.uni (retval0),
20   ; CHECK: ld.param.v2.b64 {%[[REG2:rd[0-9]+]], %[[REG3:rd[0-9]+]]}, [retval0+0];
21         ; CHECK: } // callseq 0
22   %a = call i128 @callee(i128 %0)
24         ; CHECK-DAG: st.u64 [%[[OUT]]], %[[REG2]];
25         ; CHECK-DAG: st.u64 [%[[OUT]]+8], %[[REG3]];
26   store i128 %a, ptr %1
28   ret void