Run DCE after a LoopFlatten test to reduce spurious output [nfc]
[llvm-project.git] / llvm / test / CodeGen / SystemZ / vec-perm-03.ll
blobaa18923055575a9dbb004002405a4ebc1467f1cd
1 ; Test replications of a scalar memory value, represented as splats.
3 ; RUN: llc < %s -mtriple=s390x-linux-gnu -mcpu=z13 | FileCheck %s
5 ; Test a v16i8 replicating load with no offset.
6 define <16 x i8> @f1(ptr %ptr) {
7 ; CHECK-LABEL: f1:
8 ; CHECK: vlrepb %v24, 0(%r2)
9 ; CHECK: br %r14
10   %scalar = load i8, ptr %ptr
11   %val = insertelement <16 x i8> undef, i8 %scalar, i32 0
12   %ret = shufflevector <16 x i8> %val, <16 x i8> undef,
13                        <16 x i32> zeroinitializer
14   ret <16 x i8> %ret
17 ; Test a v16i8 replicating load with the maximum in-range offset.
18 define <16 x i8> @f2(ptr %base) {
19 ; CHECK-LABEL: f2:
20 ; CHECK: vlrepb %v24, 4095(%r2)
21 ; CHECK: br %r14
22   %ptr = getelementptr i8, ptr %base, i64 4095
23   %scalar = load i8, ptr %ptr
24   %val = insertelement <16 x i8> undef, i8 %scalar, i32 0
25   %ret = shufflevector <16 x i8> %val, <16 x i8> undef,
26                        <16 x i32> zeroinitializer
27   ret <16 x i8> %ret
30 ; Test a v16i8 replicating load with the first out-of-range offset.
31 define <16 x i8> @f3(ptr %base) {
32 ; CHECK-LABEL: f3:
33 ; CHECK: aghi %r2, 4096
34 ; CHECK: vlrepb %v24, 0(%r2)
35 ; CHECK: br %r14
36   %ptr = getelementptr i8, ptr %base, i64 4096
37   %scalar = load i8, ptr %ptr
38   %val = insertelement <16 x i8> undef, i8 %scalar, i32 0
39   %ret = shufflevector <16 x i8> %val, <16 x i8> undef,
40                        <16 x i32> zeroinitializer
41   ret <16 x i8> %ret
44 ; Test a v8i16 replicating load with no offset.
45 define <8 x i16> @f4(ptr %ptr) {
46 ; CHECK-LABEL: f4:
47 ; CHECK: vlreph %v24, 0(%r2)
48 ; CHECK: br %r14
49   %scalar = load i16, ptr %ptr
50   %val = insertelement <8 x i16> undef, i16 %scalar, i32 0
51   %ret = shufflevector <8 x i16> %val, <8 x i16> undef,
52                        <8 x i32> zeroinitializer
53   ret <8 x i16> %ret
56 ; Test a v8i16 replicating load with the maximum in-range offset.
57 define <8 x i16> @f5(ptr %base) {
58 ; CHECK-LABEL: f5:
59 ; CHECK: vlreph %v24, 4094(%r2)
60 ; CHECK: br %r14
61   %ptr = getelementptr i16, ptr %base, i64 2047
62   %scalar = load i16, ptr %ptr
63   %val = insertelement <8 x i16> undef, i16 %scalar, i32 0
64   %ret = shufflevector <8 x i16> %val, <8 x i16> undef,
65                        <8 x i32> zeroinitializer
66   ret <8 x i16> %ret
69 ; Test a v8i16 replicating load with the first out-of-range offset.
70 define <8 x i16> @f6(ptr %base) {
71 ; CHECK-LABEL: f6:
72 ; CHECK: aghi %r2, 4096
73 ; CHECK: vlreph %v24, 0(%r2)
74 ; CHECK: br %r14
75   %ptr = getelementptr i16, ptr %base, i64 2048
76   %scalar = load i16, ptr %ptr
77   %val = insertelement <8 x i16> undef, i16 %scalar, i32 0
78   %ret = shufflevector <8 x i16> %val, <8 x i16> undef,
79                        <8 x i32> zeroinitializer
80   ret <8 x i16> %ret
83 ; Test a v4i32 replicating load with no offset.
84 define <4 x i32> @f7(ptr %ptr) {
85 ; CHECK-LABEL: f7:
86 ; CHECK: vlrepf %v24, 0(%r2)
87 ; CHECK: br %r14
88   %scalar = load i32, ptr %ptr
89   %val = insertelement <4 x i32> undef, i32 %scalar, i32 0
90   %ret = shufflevector <4 x i32> %val, <4 x i32> undef,
91                        <4 x i32> zeroinitializer
92   ret <4 x i32> %ret
95 ; Test a v4i32 replicating load with the maximum in-range offset.
96 define <4 x i32> @f8(ptr %base) {
97 ; CHECK-LABEL: f8:
98 ; CHECK: vlrepf %v24, 4092(%r2)
99 ; CHECK: br %r14
100   %ptr = getelementptr i32, ptr %base, i64 1023
101   %scalar = load i32, ptr %ptr
102   %val = insertelement <4 x i32> undef, i32 %scalar, i32 0
103   %ret = shufflevector <4 x i32> %val, <4 x i32> undef,
104                        <4 x i32> zeroinitializer
105   ret <4 x i32> %ret
108 ; Test a v4i32 replicating load with the first out-of-range offset.
109 define <4 x i32> @f9(ptr %base) {
110 ; CHECK-LABEL: f9:
111 ; CHECK: aghi %r2, 4096
112 ; CHECK: vlrepf %v24, 0(%r2)
113 ; CHECK: br %r14
114   %ptr = getelementptr i32, ptr %base, i64 1024
115   %scalar = load i32, ptr %ptr
116   %val = insertelement <4 x i32> undef, i32 %scalar, i32 0
117   %ret = shufflevector <4 x i32> %val, <4 x i32> undef,
118                        <4 x i32> zeroinitializer
119   ret <4 x i32> %ret
122 ; Test a v2i64 replicating load with no offset.
123 define <2 x i64> @f10(ptr %ptr) {
124 ; CHECK-LABEL: f10:
125 ; CHECK: vlrepg %v24, 0(%r2)
126 ; CHECK: br %r14
127   %scalar = load i64, ptr %ptr
128   %val = insertelement <2 x i64> undef, i64 %scalar, i32 0
129   %ret = shufflevector <2 x i64> %val, <2 x i64> undef,
130                        <2 x i32> zeroinitializer
131   ret <2 x i64> %ret
134 ; Test a v2i64 replicating load with the maximum in-range offset.
135 define <2 x i64> @f11(ptr %base) {
136 ; CHECK-LABEL: f11:
137 ; CHECK: vlrepg %v24, 4088(%r2)
138 ; CHECK: br %r14
139   %ptr = getelementptr i64, ptr %base, i32 511
140   %scalar = load i64, ptr %ptr
141   %val = insertelement <2 x i64> undef, i64 %scalar, i32 0
142   %ret = shufflevector <2 x i64> %val, <2 x i64> undef,
143                        <2 x i32> zeroinitializer
144   ret <2 x i64> %ret
147 ; Test a v2i64 replicating load with the first out-of-range offset.
148 define <2 x i64> @f12(ptr %base) {
149 ; CHECK-LABEL: f12:
150 ; CHECK: aghi %r2, 4096
151 ; CHECK: vlrepg %v24, 0(%r2)
152 ; CHECK: br %r14
153   %ptr = getelementptr i64, ptr %base, i32 512
154   %scalar = load i64, ptr %ptr
155   %val = insertelement <2 x i64> undef, i64 %scalar, i32 0
156   %ret = shufflevector <2 x i64> %val, <2 x i64> undef,
157                        <2 x i32> zeroinitializer
158   ret <2 x i64> %ret
161 ; Test a v4f32 replicating load with no offset.
162 define <4 x float> @f13(ptr %ptr) {
163 ; CHECK-LABEL: f13:
164 ; CHECK: vlrepf %v24, 0(%r2)
165 ; CHECK: br %r14
166   %scalar = load float, ptr %ptr
167   %val = insertelement <4 x float> undef, float %scalar, i32 0
168   %ret = shufflevector <4 x float> %val, <4 x float> undef,
169                        <4 x i32> zeroinitializer
170   ret <4 x float> %ret
173 ; Test a v4f32 replicating load with the maximum in-range offset.
174 define <4 x float> @f14(ptr %base) {
175 ; CHECK-LABEL: f14:
176 ; CHECK: vlrepf %v24, 4092(%r2)
177 ; CHECK: br %r14
178   %ptr = getelementptr float, ptr %base, i64 1023
179   %scalar = load float, ptr %ptr
180   %val = insertelement <4 x float> undef, float %scalar, i32 0
181   %ret = shufflevector <4 x float> %val, <4 x float> undef,
182                        <4 x i32> zeroinitializer
183   ret <4 x float> %ret
186 ; Test a v4f32 replicating load with the first out-of-range offset.
187 define <4 x float> @f15(ptr %base) {
188 ; CHECK-LABEL: f15:
189 ; CHECK: aghi %r2, 4096
190 ; CHECK: vlrepf %v24, 0(%r2)
191 ; CHECK: br %r14
192   %ptr = getelementptr float, ptr %base, i64 1024
193   %scalar = load float, ptr %ptr
194   %val = insertelement <4 x float> undef, float %scalar, i32 0
195   %ret = shufflevector <4 x float> %val, <4 x float> undef,
196                        <4 x i32> zeroinitializer
197   ret <4 x float> %ret
200 ; Test a v2f64 replicating load with no offset.
201 define <2 x double> @f16(ptr %ptr) {
202 ; CHECK-LABEL: f16:
203 ; CHECK: vlrepg %v24, 0(%r2)
204 ; CHECK: br %r14
205   %scalar = load double, ptr %ptr
206   %val = insertelement <2 x double> undef, double %scalar, i32 0
207   %ret = shufflevector <2 x double> %val, <2 x double> undef,
208                        <2 x i32> zeroinitializer
209   ret <2 x double> %ret
212 ; Test a v2f64 replicating load with the maximum in-range offset.
213 define <2 x double> @f17(ptr %base) {
214 ; CHECK-LABEL: f17:
215 ; CHECK: vlrepg %v24, 4088(%r2)
216 ; CHECK: br %r14
217   %ptr = getelementptr double, ptr %base, i32 511
218   %scalar = load double, ptr %ptr
219   %val = insertelement <2 x double> undef, double %scalar, i32 0
220   %ret = shufflevector <2 x double> %val, <2 x double> undef,
221                        <2 x i32> zeroinitializer
222   ret <2 x double> %ret
225 ; Test a v2f64 replicating load with the first out-of-range offset.
226 define <2 x double> @f18(ptr %base) {
227 ; CHECK-LABEL: f18:
228 ; CHECK: aghi %r2, 4096
229 ; CHECK: vlrepg %v24, 0(%r2)
230 ; CHECK: br %r14
231   %ptr = getelementptr double, ptr %base, i32 512
232   %scalar = load double, ptr %ptr
233   %val = insertelement <2 x double> undef, double %scalar, i32 0
234   %ret = shufflevector <2 x double> %val, <2 x double> undef,
235                        <2 x i32> zeroinitializer
236   ret <2 x double> %ret
239 ; Test a v16i8 replicating load with an index.
240 define <16 x i8> @f19(ptr %base, i64 %index) {
241 ; CHECK-LABEL: f19:
242 ; CHECK: vlrepb %v24, 1023(%r3,%r2)
243 ; CHECK: br %r14
244   %ptr1 = getelementptr i8, ptr %base, i64 %index
245   %ptr = getelementptr i8, ptr %ptr1, i64 1023
246   %scalar = load i8, ptr %ptr
247   %val = insertelement <16 x i8> undef, i8 %scalar, i32 0
248   %ret = shufflevector <16 x i8> %val, <16 x i8> undef,
249                        <16 x i32> zeroinitializer
250   ret <16 x i8> %ret