Run DCE after a LoopFlatten test to reduce spurious output [nfc]
[llvm-project.git] / llvm / test / CodeGen / LoongArch / lsx / intrinsic-ssub.ll
blobc594b426d65031c62e990924df66ac86bb165dd4
1 ; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
2 ; RUN: llc --mtriple=loongarch64 --mattr=+lsx < %s | FileCheck %s
4 declare <16 x i8> @llvm.loongarch.lsx.vssub.b(<16 x i8>, <16 x i8>)
6 define <16 x i8> @lsx_vssub_b(<16 x i8> %va, <16 x i8> %vb) nounwind {
7 ; CHECK-LABEL: lsx_vssub_b:
8 ; CHECK:       # %bb.0: # %entry
9 ; CHECK-NEXT:    vssub.b $vr0, $vr0, $vr1
10 ; CHECK-NEXT:    ret
11 entry:
12   %res = call <16 x i8> @llvm.loongarch.lsx.vssub.b(<16 x i8> %va, <16 x i8> %vb)
13   ret <16 x i8> %res
16 declare <8 x i16> @llvm.loongarch.lsx.vssub.h(<8 x i16>, <8 x i16>)
18 define <8 x i16> @lsx_vssub_h(<8 x i16> %va, <8 x i16> %vb) nounwind {
19 ; CHECK-LABEL: lsx_vssub_h:
20 ; CHECK:       # %bb.0: # %entry
21 ; CHECK-NEXT:    vssub.h $vr0, $vr0, $vr1
22 ; CHECK-NEXT:    ret
23 entry:
24   %res = call <8 x i16> @llvm.loongarch.lsx.vssub.h(<8 x i16> %va, <8 x i16> %vb)
25   ret <8 x i16> %res
28 declare <4 x i32> @llvm.loongarch.lsx.vssub.w(<4 x i32>, <4 x i32>)
30 define <4 x i32> @lsx_vssub_w(<4 x i32> %va, <4 x i32> %vb) nounwind {
31 ; CHECK-LABEL: lsx_vssub_w:
32 ; CHECK:       # %bb.0: # %entry
33 ; CHECK-NEXT:    vssub.w $vr0, $vr0, $vr1
34 ; CHECK-NEXT:    ret
35 entry:
36   %res = call <4 x i32> @llvm.loongarch.lsx.vssub.w(<4 x i32> %va, <4 x i32> %vb)
37   ret <4 x i32> %res
40 declare <2 x i64> @llvm.loongarch.lsx.vssub.d(<2 x i64>, <2 x i64>)
42 define <2 x i64> @lsx_vssub_d(<2 x i64> %va, <2 x i64> %vb) nounwind {
43 ; CHECK-LABEL: lsx_vssub_d:
44 ; CHECK:       # %bb.0: # %entry
45 ; CHECK-NEXT:    vssub.d $vr0, $vr0, $vr1
46 ; CHECK-NEXT:    ret
47 entry:
48   %res = call <2 x i64> @llvm.loongarch.lsx.vssub.d(<2 x i64> %va, <2 x i64> %vb)
49   ret <2 x i64> %res
52 declare <16 x i8> @llvm.loongarch.lsx.vssub.bu(<16 x i8>, <16 x i8>)
54 define <16 x i8> @lsx_vssub_bu(<16 x i8> %va, <16 x i8> %vb) nounwind {
55 ; CHECK-LABEL: lsx_vssub_bu:
56 ; CHECK:       # %bb.0: # %entry
57 ; CHECK-NEXT:    vssub.bu $vr0, $vr0, $vr1
58 ; CHECK-NEXT:    ret
59 entry:
60   %res = call <16 x i8> @llvm.loongarch.lsx.vssub.bu(<16 x i8> %va, <16 x i8> %vb)
61   ret <16 x i8> %res
64 declare <8 x i16> @llvm.loongarch.lsx.vssub.hu(<8 x i16>, <8 x i16>)
66 define <8 x i16> @lsx_vssub_hu(<8 x i16> %va, <8 x i16> %vb) nounwind {
67 ; CHECK-LABEL: lsx_vssub_hu:
68 ; CHECK:       # %bb.0: # %entry
69 ; CHECK-NEXT:    vssub.hu $vr0, $vr0, $vr1
70 ; CHECK-NEXT:    ret
71 entry:
72   %res = call <8 x i16> @llvm.loongarch.lsx.vssub.hu(<8 x i16> %va, <8 x i16> %vb)
73   ret <8 x i16> %res
76 declare <4 x i32> @llvm.loongarch.lsx.vssub.wu(<4 x i32>, <4 x i32>)
78 define <4 x i32> @lsx_vssub_wu(<4 x i32> %va, <4 x i32> %vb) nounwind {
79 ; CHECK-LABEL: lsx_vssub_wu:
80 ; CHECK:       # %bb.0: # %entry
81 ; CHECK-NEXT:    vssub.wu $vr0, $vr0, $vr1
82 ; CHECK-NEXT:    ret
83 entry:
84   %res = call <4 x i32> @llvm.loongarch.lsx.vssub.wu(<4 x i32> %va, <4 x i32> %vb)
85   ret <4 x i32> %res
88 declare <2 x i64> @llvm.loongarch.lsx.vssub.du(<2 x i64>, <2 x i64>)
90 define <2 x i64> @lsx_vssub_du(<2 x i64> %va, <2 x i64> %vb) nounwind {
91 ; CHECK-LABEL: lsx_vssub_du:
92 ; CHECK:       # %bb.0: # %entry
93 ; CHECK-NEXT:    vssub.du $vr0, $vr0, $vr1
94 ; CHECK-NEXT:    ret
95 entry:
96   %res = call <2 x i64> @llvm.loongarch.lsx.vssub.du(<2 x i64> %va, <2 x i64> %vb)
97   ret <2 x i64> %res