[SCFToGPU] Convert scf.parallel+scf.reduce to gpu.all_reduce (#122782)
[llvm-project.git] / llvm / test / CodeGen / LoongArch / lsx / intrinsic-addw.ll
blob086e3bec12d2365b44bfb3cae2b45fa7933db946
1 ; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
2 ; RUN: llc --mtriple=loongarch64 --mattr=+lsx < %s | FileCheck %s
4 declare <8 x i16> @llvm.loongarch.lsx.vaddwev.h.b(<16 x i8>, <16 x i8>)
6 define <8 x i16> @lsx_vaddwev_h_b(<16 x i8> %va, <16 x i8> %vb) nounwind {
7 ; CHECK-LABEL: lsx_vaddwev_h_b:
8 ; CHECK:       # %bb.0: # %entry
9 ; CHECK-NEXT:    vaddwev.h.b $vr0, $vr0, $vr1
10 ; CHECK-NEXT:    ret
11 entry:
12   %res = call <8 x i16> @llvm.loongarch.lsx.vaddwev.h.b(<16 x i8> %va, <16 x i8> %vb)
13   ret <8 x i16> %res
16 declare <4 x i32> @llvm.loongarch.lsx.vaddwev.w.h(<8 x i16>, <8 x i16>)
18 define <4 x i32> @lsx_vaddwev_w_h(<8 x i16> %va, <8 x i16> %vb) nounwind {
19 ; CHECK-LABEL: lsx_vaddwev_w_h:
20 ; CHECK:       # %bb.0: # %entry
21 ; CHECK-NEXT:    vaddwev.w.h $vr0, $vr0, $vr1
22 ; CHECK-NEXT:    ret
23 entry:
24   %res = call <4 x i32> @llvm.loongarch.lsx.vaddwev.w.h(<8 x i16> %va, <8 x i16> %vb)
25   ret <4 x i32> %res
28 declare <2 x i64> @llvm.loongarch.lsx.vaddwev.d.w(<4 x i32>, <4 x i32>)
30 define <2 x i64> @lsx_vaddwev_d_w(<4 x i32> %va, <4 x i32> %vb) nounwind {
31 ; CHECK-LABEL: lsx_vaddwev_d_w:
32 ; CHECK:       # %bb.0: # %entry
33 ; CHECK-NEXT:    vaddwev.d.w $vr0, $vr0, $vr1
34 ; CHECK-NEXT:    ret
35 entry:
36   %res = call <2 x i64> @llvm.loongarch.lsx.vaddwev.d.w(<4 x i32> %va, <4 x i32> %vb)
37   ret <2 x i64> %res
40 declare <2 x i64> @llvm.loongarch.lsx.vaddwev.q.d(<2 x i64>, <2 x i64>)
42 define <2 x i64> @lsx_vaddwev_q_d(<2 x i64> %va, <2 x i64> %vb) nounwind {
43 ; CHECK-LABEL: lsx_vaddwev_q_d:
44 ; CHECK:       # %bb.0: # %entry
45 ; CHECK-NEXT:    vaddwev.q.d $vr0, $vr0, $vr1
46 ; CHECK-NEXT:    ret
47 entry:
48   %res = call <2 x i64> @llvm.loongarch.lsx.vaddwev.q.d(<2 x i64> %va, <2 x i64> %vb)
49   ret <2 x i64> %res
52 declare <8 x i16> @llvm.loongarch.lsx.vaddwev.h.bu(<16 x i8>, <16 x i8>)
54 define <8 x i16> @lsx_vaddwev_h_bu(<16 x i8> %va, <16 x i8> %vb) nounwind {
55 ; CHECK-LABEL: lsx_vaddwev_h_bu:
56 ; CHECK:       # %bb.0: # %entry
57 ; CHECK-NEXT:    vaddwev.h.bu $vr0, $vr0, $vr1
58 ; CHECK-NEXT:    ret
59 entry:
60   %res = call <8 x i16> @llvm.loongarch.lsx.vaddwev.h.bu(<16 x i8> %va, <16 x i8> %vb)
61   ret <8 x i16> %res
64 declare <4 x i32> @llvm.loongarch.lsx.vaddwev.w.hu(<8 x i16>, <8 x i16>)
66 define <4 x i32> @lsx_vaddwev_w_hu(<8 x i16> %va, <8 x i16> %vb) nounwind {
67 ; CHECK-LABEL: lsx_vaddwev_w_hu:
68 ; CHECK:       # %bb.0: # %entry
69 ; CHECK-NEXT:    vaddwev.w.hu $vr0, $vr0, $vr1
70 ; CHECK-NEXT:    ret
71 entry:
72   %res = call <4 x i32> @llvm.loongarch.lsx.vaddwev.w.hu(<8 x i16> %va, <8 x i16> %vb)
73   ret <4 x i32> %res
76 declare <2 x i64> @llvm.loongarch.lsx.vaddwev.d.wu(<4 x i32>, <4 x i32>)
78 define <2 x i64> @lsx_vaddwev_d_wu(<4 x i32> %va, <4 x i32> %vb) nounwind {
79 ; CHECK-LABEL: lsx_vaddwev_d_wu:
80 ; CHECK:       # %bb.0: # %entry
81 ; CHECK-NEXT:    vaddwev.d.wu $vr0, $vr0, $vr1
82 ; CHECK-NEXT:    ret
83 entry:
84   %res = call <2 x i64> @llvm.loongarch.lsx.vaddwev.d.wu(<4 x i32> %va, <4 x i32> %vb)
85   ret <2 x i64> %res
88 declare <2 x i64> @llvm.loongarch.lsx.vaddwev.q.du(<2 x i64>, <2 x i64>)
90 define <2 x i64> @lsx_vaddwev_q_du(<2 x i64> %va, <2 x i64> %vb) nounwind {
91 ; CHECK-LABEL: lsx_vaddwev_q_du:
92 ; CHECK:       # %bb.0: # %entry
93 ; CHECK-NEXT:    vaddwev.q.du $vr0, $vr0, $vr1
94 ; CHECK-NEXT:    ret
95 entry:
96   %res = call <2 x i64> @llvm.loongarch.lsx.vaddwev.q.du(<2 x i64> %va, <2 x i64> %vb)
97   ret <2 x i64> %res
100 declare <8 x i16> @llvm.loongarch.lsx.vaddwev.h.bu.b(<16 x i8>, <16 x i8>)
102 define <8 x i16> @lsx_vaddwev_h_bu_b(<16 x i8> %va, <16 x i8> %vb) nounwind {
103 ; CHECK-LABEL: lsx_vaddwev_h_bu_b:
104 ; CHECK:       # %bb.0: # %entry
105 ; CHECK-NEXT:    vaddwev.h.bu.b $vr0, $vr0, $vr1
106 ; CHECK-NEXT:    ret
107 entry:
108   %res = call <8 x i16> @llvm.loongarch.lsx.vaddwev.h.bu.b(<16 x i8> %va, <16 x i8> %vb)
109   ret <8 x i16> %res
112 declare <4 x i32> @llvm.loongarch.lsx.vaddwev.w.hu.h(<8 x i16>, <8 x i16>)
114 define <4 x i32> @lsx_vaddwev_w_hu_h(<8 x i16> %va, <8 x i16> %vb) nounwind {
115 ; CHECK-LABEL: lsx_vaddwev_w_hu_h:
116 ; CHECK:       # %bb.0: # %entry
117 ; CHECK-NEXT:    vaddwev.w.hu.h $vr0, $vr0, $vr1
118 ; CHECK-NEXT:    ret
119 entry:
120   %res = call <4 x i32> @llvm.loongarch.lsx.vaddwev.w.hu.h(<8 x i16> %va, <8 x i16> %vb)
121   ret <4 x i32> %res
124 declare <2 x i64> @llvm.loongarch.lsx.vaddwev.d.wu.w(<4 x i32>, <4 x i32>)
126 define <2 x i64> @lsx_vaddwev_d_wu_w(<4 x i32> %va, <4 x i32> %vb) nounwind {
127 ; CHECK-LABEL: lsx_vaddwev_d_wu_w:
128 ; CHECK:       # %bb.0: # %entry
129 ; CHECK-NEXT:    vaddwev.d.wu.w $vr0, $vr0, $vr1
130 ; CHECK-NEXT:    ret
131 entry:
132   %res = call <2 x i64> @llvm.loongarch.lsx.vaddwev.d.wu.w(<4 x i32> %va, <4 x i32> %vb)
133   ret <2 x i64> %res
136 declare <2 x i64> @llvm.loongarch.lsx.vaddwev.q.du.d(<2 x i64>, <2 x i64>)
138 define <2 x i64> @lsx_vaddwev_q_du_d(<2 x i64> %va, <2 x i64> %vb) nounwind {
139 ; CHECK-LABEL: lsx_vaddwev_q_du_d:
140 ; CHECK:       # %bb.0: # %entry
141 ; CHECK-NEXT:    vaddwev.q.du.d $vr0, $vr0, $vr1
142 ; CHECK-NEXT:    ret
143 entry:
144   %res = call <2 x i64> @llvm.loongarch.lsx.vaddwev.q.du.d(<2 x i64> %va, <2 x i64> %vb)
145   ret <2 x i64> %res
148 declare <8 x i16> @llvm.loongarch.lsx.vaddwod.h.b(<16 x i8>, <16 x i8>)
150 define <8 x i16> @lsx_vaddwod_h_b(<16 x i8> %va, <16 x i8> %vb) nounwind {
151 ; CHECK-LABEL: lsx_vaddwod_h_b:
152 ; CHECK:       # %bb.0: # %entry
153 ; CHECK-NEXT:    vaddwod.h.b $vr0, $vr0, $vr1
154 ; CHECK-NEXT:    ret
155 entry:
156   %res = call <8 x i16> @llvm.loongarch.lsx.vaddwod.h.b(<16 x i8> %va, <16 x i8> %vb)
157   ret <8 x i16> %res
160 declare <4 x i32> @llvm.loongarch.lsx.vaddwod.w.h(<8 x i16>, <8 x i16>)
162 define <4 x i32> @lsx_vaddwod_w_h(<8 x i16> %va, <8 x i16> %vb) nounwind {
163 ; CHECK-LABEL: lsx_vaddwod_w_h:
164 ; CHECK:       # %bb.0: # %entry
165 ; CHECK-NEXT:    vaddwod.w.h $vr0, $vr0, $vr1
166 ; CHECK-NEXT:    ret
167 entry:
168   %res = call <4 x i32> @llvm.loongarch.lsx.vaddwod.w.h(<8 x i16> %va, <8 x i16> %vb)
169   ret <4 x i32> %res
172 declare <2 x i64> @llvm.loongarch.lsx.vaddwod.d.w(<4 x i32>, <4 x i32>)
174 define <2 x i64> @lsx_vaddwod_d_w(<4 x i32> %va, <4 x i32> %vb) nounwind {
175 ; CHECK-LABEL: lsx_vaddwod_d_w:
176 ; CHECK:       # %bb.0: # %entry
177 ; CHECK-NEXT:    vaddwod.d.w $vr0, $vr0, $vr1
178 ; CHECK-NEXT:    ret
179 entry:
180   %res = call <2 x i64> @llvm.loongarch.lsx.vaddwod.d.w(<4 x i32> %va, <4 x i32> %vb)
181   ret <2 x i64> %res
184 declare <2 x i64> @llvm.loongarch.lsx.vaddwod.q.d(<2 x i64>, <2 x i64>)
186 define <2 x i64> @lsx_vaddwod_q_d(<2 x i64> %va, <2 x i64> %vb) nounwind {
187 ; CHECK-LABEL: lsx_vaddwod_q_d:
188 ; CHECK:       # %bb.0: # %entry
189 ; CHECK-NEXT:    vaddwod.q.d $vr0, $vr0, $vr1
190 ; CHECK-NEXT:    ret
191 entry:
192   %res = call <2 x i64> @llvm.loongarch.lsx.vaddwod.q.d(<2 x i64> %va, <2 x i64> %vb)
193   ret <2 x i64> %res
196 declare <8 x i16> @llvm.loongarch.lsx.vaddwod.h.bu(<16 x i8>, <16 x i8>)
198 define <8 x i16> @lsx_vaddwod_h_bu(<16 x i8> %va, <16 x i8> %vb) nounwind {
199 ; CHECK-LABEL: lsx_vaddwod_h_bu:
200 ; CHECK:       # %bb.0: # %entry
201 ; CHECK-NEXT:    vaddwod.h.bu $vr0, $vr0, $vr1
202 ; CHECK-NEXT:    ret
203 entry:
204   %res = call <8 x i16> @llvm.loongarch.lsx.vaddwod.h.bu(<16 x i8> %va, <16 x i8> %vb)
205   ret <8 x i16> %res
208 declare <4 x i32> @llvm.loongarch.lsx.vaddwod.w.hu(<8 x i16>, <8 x i16>)
210 define <4 x i32> @lsx_vaddwod_w_hu(<8 x i16> %va, <8 x i16> %vb) nounwind {
211 ; CHECK-LABEL: lsx_vaddwod_w_hu:
212 ; CHECK:       # %bb.0: # %entry
213 ; CHECK-NEXT:    vaddwod.w.hu $vr0, $vr0, $vr1
214 ; CHECK-NEXT:    ret
215 entry:
216   %res = call <4 x i32> @llvm.loongarch.lsx.vaddwod.w.hu(<8 x i16> %va, <8 x i16> %vb)
217   ret <4 x i32> %res
220 declare <2 x i64> @llvm.loongarch.lsx.vaddwod.d.wu(<4 x i32>, <4 x i32>)
222 define <2 x i64> @lsx_vaddwod_d_wu(<4 x i32> %va, <4 x i32> %vb) nounwind {
223 ; CHECK-LABEL: lsx_vaddwod_d_wu:
224 ; CHECK:       # %bb.0: # %entry
225 ; CHECK-NEXT:    vaddwod.d.wu $vr0, $vr0, $vr1
226 ; CHECK-NEXT:    ret
227 entry:
228   %res = call <2 x i64> @llvm.loongarch.lsx.vaddwod.d.wu(<4 x i32> %va, <4 x i32> %vb)
229   ret <2 x i64> %res
232 declare <2 x i64> @llvm.loongarch.lsx.vaddwod.q.du(<2 x i64>, <2 x i64>)
234 define <2 x i64> @lsx_vaddwod_q_du(<2 x i64> %va, <2 x i64> %vb) nounwind {
235 ; CHECK-LABEL: lsx_vaddwod_q_du:
236 ; CHECK:       # %bb.0: # %entry
237 ; CHECK-NEXT:    vaddwod.q.du $vr0, $vr0, $vr1
238 ; CHECK-NEXT:    ret
239 entry:
240   %res = call <2 x i64> @llvm.loongarch.lsx.vaddwod.q.du(<2 x i64> %va, <2 x i64> %vb)
241   ret <2 x i64> %res
244 declare <8 x i16> @llvm.loongarch.lsx.vaddwod.h.bu.b(<16 x i8>, <16 x i8>)
246 define <8 x i16> @lsx_vaddwod_h_bu_b(<16 x i8> %va, <16 x i8> %vb) nounwind {
247 ; CHECK-LABEL: lsx_vaddwod_h_bu_b:
248 ; CHECK:       # %bb.0: # %entry
249 ; CHECK-NEXT:    vaddwod.h.bu.b $vr0, $vr0, $vr1
250 ; CHECK-NEXT:    ret
251 entry:
252   %res = call <8 x i16> @llvm.loongarch.lsx.vaddwod.h.bu.b(<16 x i8> %va, <16 x i8> %vb)
253   ret <8 x i16> %res
256 declare <4 x i32> @llvm.loongarch.lsx.vaddwod.w.hu.h(<8 x i16>, <8 x i16>)
258 define <4 x i32> @lsx_vaddwod_w_hu_h(<8 x i16> %va, <8 x i16> %vb) nounwind {
259 ; CHECK-LABEL: lsx_vaddwod_w_hu_h:
260 ; CHECK:       # %bb.0: # %entry
261 ; CHECK-NEXT:    vaddwod.w.hu.h $vr0, $vr0, $vr1
262 ; CHECK-NEXT:    ret
263 entry:
264   %res = call <4 x i32> @llvm.loongarch.lsx.vaddwod.w.hu.h(<8 x i16> %va, <8 x i16> %vb)
265   ret <4 x i32> %res
268 declare <2 x i64> @llvm.loongarch.lsx.vaddwod.d.wu.w(<4 x i32>, <4 x i32>)
270 define <2 x i64> @lsx_vaddwod_d_wu_w(<4 x i32> %va, <4 x i32> %vb) nounwind {
271 ; CHECK-LABEL: lsx_vaddwod_d_wu_w:
272 ; CHECK:       # %bb.0: # %entry
273 ; CHECK-NEXT:    vaddwod.d.wu.w $vr0, $vr0, $vr1
274 ; CHECK-NEXT:    ret
275 entry:
276   %res = call <2 x i64> @llvm.loongarch.lsx.vaddwod.d.wu.w(<4 x i32> %va, <4 x i32> %vb)
277   ret <2 x i64> %res
280 declare <2 x i64> @llvm.loongarch.lsx.vaddwod.q.du.d(<2 x i64>, <2 x i64>)
282 define <2 x i64> @lsx_vaddwod_q_du_d(<2 x i64> %va, <2 x i64> %vb) nounwind {
283 ; CHECK-LABEL: lsx_vaddwod_q_du_d:
284 ; CHECK:       # %bb.0: # %entry
285 ; CHECK-NEXT:    vaddwod.q.du.d $vr0, $vr0, $vr1
286 ; CHECK-NEXT:    ret
287 entry:
288   %res = call <2 x i64> @llvm.loongarch.lsx.vaddwod.q.du.d(<2 x i64> %va, <2 x i64> %vb)
289   ret <2 x i64> %res