Run DCE after a LoopFlatten test to reduce spurious output [nfc]
[llvm-project.git] / llvm / test / CodeGen / NVPTX / bypass-div.ll
blob5c41e603fd6353cd7bf712df1bc4254ed1c29704
1 ; RUN: llc < %s -march=nvptx64 -mcpu=sm_35 | FileCheck %s
2 ; RUN: %if ptxas %{ llc < %s -march=nvptx64 -mcpu=sm_35 | %ptxas-verify %}
4 ; 64-bit divides and rems should be split into a fast and slow path where
5 ; the fast path uses a 32-bit operation.
7 define void @sdiv64(i64 %a, i64 %b, ptr %retptr) {
8 ; CHECK-LABEL: sdiv64(
9 ; CHECK:        div.s64
10 ; CHECK:        div.u32
11 ; CHECK:        ret
12   %d = sdiv i64 %a, %b
13   store i64 %d, ptr %retptr
14   ret void
17 define void @udiv64(i64 %a, i64 %b, ptr %retptr) {
18 ; CHECK-LABEL: udiv64(
19 ; CHECK:        div.u64
20 ; CHECK:        div.u32
21 ; CHECK:        ret
22   %d = udiv i64 %a, %b
23   store i64 %d, ptr %retptr
24   ret void
27 define void @srem64(i64 %a, i64 %b, ptr %retptr) {
28 ; CHECK-LABEL: srem64(
29 ; CHECK:        rem.s64
30 ; CHECK:        rem.u32
31 ; CHECK:        ret
32   %d = srem i64 %a, %b
33   store i64 %d, ptr %retptr
34   ret void
37 define void @urem64(i64 %a, i64 %b, ptr %retptr) {
38 ; CHECK-LABEL: urem64(
39 ; CHECK:        rem.u64
40 ; CHECK:        rem.u32
41 ; CHECK:        ret
42   %d = urem i64 %a, %b
43   store i64 %d, ptr %retptr
44   ret void
47 define void @sdiv32(i32 %a, i32 %b, ptr %retptr) {
48 ; CHECK-LABEL: sdiv32(
49 ; CHECK: div.s32
50 ; CHECK-NOT: div.
51   %d = sdiv i32 %a, %b
52   store i32 %d, ptr %retptr
53   ret void
56 define void @udiv32(i32 %a, i32 %b, ptr %retptr) {
57 ; CHECK-LABEL: udiv32(
58 ; CHECK: div.u32
59 ; CHECK-NOT: div.
60   %d = udiv i32 %a, %b
61   store i32 %d, ptr %retptr
62   ret void
65 define void @srem32(i32 %a, i32 %b, ptr %retptr) {
66 ; CHECK-LABEL: srem32(
67 ; CHECK: rem.s32
68 ; CHECK-NOT: rem.
69   %d = srem i32 %a, %b
70   store i32 %d, ptr %retptr
71   ret void
74 define void @urem32(i32 %a, i32 %b, ptr %retptr) {
75 ; CHECK-LABEL: urem32(
76 ; CHECK: rem.u32
77 ; CHECK-NOT: rem.
78   %d = urem i32 %a, %b
79   store i32 %d, ptr %retptr
80   ret void