[SCFToGPU] Convert scf.parallel+scf.reduce to gpu.all_reduce (#122782)
[llvm-project.git] / llvm / test / CodeGen / LoongArch / lsx / intrinsic-sll.ll
blob7bc20af41f17a865962af4cec51e08235afca161
1 ; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
2 ; RUN: llc --mtriple=loongarch64 --mattr=+lsx < %s | FileCheck %s
4 declare <16 x i8> @llvm.loongarch.lsx.vsll.b(<16 x i8>, <16 x i8>)
6 define <16 x i8> @lsx_vsll_b(<16 x i8> %va, <16 x i8> %vb) nounwind {
7 ; CHECK-LABEL: lsx_vsll_b:
8 ; CHECK:       # %bb.0: # %entry
9 ; CHECK-NEXT:    vsll.b $vr0, $vr0, $vr1
10 ; CHECK-NEXT:    ret
11 entry:
12   %res = call <16 x i8> @llvm.loongarch.lsx.vsll.b(<16 x i8> %va, <16 x i8> %vb)
13   ret <16 x i8> %res
16 declare <8 x i16> @llvm.loongarch.lsx.vsll.h(<8 x i16>, <8 x i16>)
18 define <8 x i16> @lsx_vsll_h(<8 x i16> %va, <8 x i16> %vb) nounwind {
19 ; CHECK-LABEL: lsx_vsll_h:
20 ; CHECK:       # %bb.0: # %entry
21 ; CHECK-NEXT:    vsll.h $vr0, $vr0, $vr1
22 ; CHECK-NEXT:    ret
23 entry:
24   %res = call <8 x i16> @llvm.loongarch.lsx.vsll.h(<8 x i16> %va, <8 x i16> %vb)
25   ret <8 x i16> %res
28 declare <4 x i32> @llvm.loongarch.lsx.vsll.w(<4 x i32>, <4 x i32>)
30 define <4 x i32> @lsx_vsll_w(<4 x i32> %va, <4 x i32> %vb) nounwind {
31 ; CHECK-LABEL: lsx_vsll_w:
32 ; CHECK:       # %bb.0: # %entry
33 ; CHECK-NEXT:    vsll.w $vr0, $vr0, $vr1
34 ; CHECK-NEXT:    ret
35 entry:
36   %res = call <4 x i32> @llvm.loongarch.lsx.vsll.w(<4 x i32> %va, <4 x i32> %vb)
37   ret <4 x i32> %res
40 declare <2 x i64> @llvm.loongarch.lsx.vsll.d(<2 x i64>, <2 x i64>)
42 define <2 x i64> @lsx_vsll_d(<2 x i64> %va, <2 x i64> %vb) nounwind {
43 ; CHECK-LABEL: lsx_vsll_d:
44 ; CHECK:       # %bb.0: # %entry
45 ; CHECK-NEXT:    vsll.d $vr0, $vr0, $vr1
46 ; CHECK-NEXT:    ret
47 entry:
48   %res = call <2 x i64> @llvm.loongarch.lsx.vsll.d(<2 x i64> %va, <2 x i64> %vb)
49   ret <2 x i64> %res
52 declare <16 x i8> @llvm.loongarch.lsx.vslli.b(<16 x i8>, i32)
54 define <16 x i8> @lsx_vslli_b(<16 x i8> %va) nounwind {
55 ; CHECK-LABEL: lsx_vslli_b:
56 ; CHECK:       # %bb.0: # %entry
57 ; CHECK-NEXT:    vslli.b $vr0, $vr0, 7
58 ; CHECK-NEXT:    ret
59 entry:
60   %res = call <16 x i8> @llvm.loongarch.lsx.vslli.b(<16 x i8> %va, i32 7)
61   ret <16 x i8> %res
64 declare <8 x i16> @llvm.loongarch.lsx.vslli.h(<8 x i16>, i32)
66 define <8 x i16> @lsx_vslli_h(<8 x i16> %va) nounwind {
67 ; CHECK-LABEL: lsx_vslli_h:
68 ; CHECK:       # %bb.0: # %entry
69 ; CHECK-NEXT:    vslli.h $vr0, $vr0, 15
70 ; CHECK-NEXT:    ret
71 entry:
72   %res = call <8 x i16> @llvm.loongarch.lsx.vslli.h(<8 x i16> %va, i32 15)
73   ret <8 x i16> %res
76 declare <4 x i32> @llvm.loongarch.lsx.vslli.w(<4 x i32>, i32)
78 define <4 x i32> @lsx_vslli_w(<4 x i32> %va) nounwind {
79 ; CHECK-LABEL: lsx_vslli_w:
80 ; CHECK:       # %bb.0: # %entry
81 ; CHECK-NEXT:    vslli.w $vr0, $vr0, 31
82 ; CHECK-NEXT:    ret
83 entry:
84   %res = call <4 x i32> @llvm.loongarch.lsx.vslli.w(<4 x i32> %va, i32 31)
85   ret <4 x i32> %res
88 declare <2 x i64> @llvm.loongarch.lsx.vslli.d(<2 x i64>, i32)
90 define <2 x i64> @lsx_vslli_d(<2 x i64> %va) nounwind {
91 ; CHECK-LABEL: lsx_vslli_d:
92 ; CHECK:       # %bb.0: # %entry
93 ; CHECK-NEXT:    vslli.d $vr0, $vr0, 63
94 ; CHECK-NEXT:    ret
95 entry:
96   %res = call <2 x i64> @llvm.loongarch.lsx.vslli.d(<2 x i64> %va, i32 63)
97   ret <2 x i64> %res