Revert r354244 "[DAGCombiner] Eliminate dead stores to stack."
[llvm-complete.git] / test / CodeGen / X86 / vector-shift-lshr-512.ll
blob9a44fc31820efbf015479b277dd90319ab3fbaa5
1 ; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
2 ; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+avx512dq | FileCheck %s --check-prefix=ALL --check-prefix=AVX512 --check-prefix=AVX512DQ
3 ; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+avx512bw | FileCheck %s --check-prefix=ALL --check-prefix=AVX512 --check-prefix=AVX512BW
6 ; Variable Shifts
9 define <8 x i64> @var_shift_v8i64(<8 x i64> %a, <8 x i64> %b) nounwind {
10 ; ALL-LABEL: var_shift_v8i64:
11 ; ALL:       # %bb.0:
12 ; ALL-NEXT:    vpsrlvq %zmm1, %zmm0, %zmm0
13 ; ALL-NEXT:    retq
14   %shift = lshr <8 x i64> %a, %b
15   ret <8 x i64> %shift
18 define <16 x i32> @var_shift_v16i32(<16 x i32> %a, <16 x i32> %b) nounwind {
19 ; ALL-LABEL: var_shift_v16i32:
20 ; ALL:       # %bb.0:
21 ; ALL-NEXT:    vpsrlvd %zmm1, %zmm0, %zmm0
22 ; ALL-NEXT:    retq
23   %shift = lshr <16 x i32> %a, %b
24   ret <16 x i32> %shift
27 define <32 x i16> @var_shift_v32i16(<32 x i16> %a, <32 x i16> %b) nounwind {
28 ; AVX512DQ-LABEL: var_shift_v32i16:
29 ; AVX512DQ:       # %bb.0:
30 ; AVX512DQ-NEXT:    vpmovzxwd {{.*#+}} zmm2 = ymm2[0],zero,ymm2[1],zero,ymm2[2],zero,ymm2[3],zero,ymm2[4],zero,ymm2[5],zero,ymm2[6],zero,ymm2[7],zero,ymm2[8],zero,ymm2[9],zero,ymm2[10],zero,ymm2[11],zero,ymm2[12],zero,ymm2[13],zero,ymm2[14],zero,ymm2[15],zero
31 ; AVX512DQ-NEXT:    vpmovzxwd {{.*#+}} zmm0 = ymm0[0],zero,ymm0[1],zero,ymm0[2],zero,ymm0[3],zero,ymm0[4],zero,ymm0[5],zero,ymm0[6],zero,ymm0[7],zero,ymm0[8],zero,ymm0[9],zero,ymm0[10],zero,ymm0[11],zero,ymm0[12],zero,ymm0[13],zero,ymm0[14],zero,ymm0[15],zero
32 ; AVX512DQ-NEXT:    vpsrlvd %zmm2, %zmm0, %zmm0
33 ; AVX512DQ-NEXT:    vpmovdw %zmm0, %ymm0
34 ; AVX512DQ-NEXT:    vpmovzxwd {{.*#+}} zmm2 = ymm3[0],zero,ymm3[1],zero,ymm3[2],zero,ymm3[3],zero,ymm3[4],zero,ymm3[5],zero,ymm3[6],zero,ymm3[7],zero,ymm3[8],zero,ymm3[9],zero,ymm3[10],zero,ymm3[11],zero,ymm3[12],zero,ymm3[13],zero,ymm3[14],zero,ymm3[15],zero
35 ; AVX512DQ-NEXT:    vpmovzxwd {{.*#+}} zmm1 = ymm1[0],zero,ymm1[1],zero,ymm1[2],zero,ymm1[3],zero,ymm1[4],zero,ymm1[5],zero,ymm1[6],zero,ymm1[7],zero,ymm1[8],zero,ymm1[9],zero,ymm1[10],zero,ymm1[11],zero,ymm1[12],zero,ymm1[13],zero,ymm1[14],zero,ymm1[15],zero
36 ; AVX512DQ-NEXT:    vpsrlvd %zmm2, %zmm1, %zmm1
37 ; AVX512DQ-NEXT:    vpmovdw %zmm1, %ymm1
38 ; AVX512DQ-NEXT:    retq
40 ; AVX512BW-LABEL: var_shift_v32i16:
41 ; AVX512BW:       # %bb.0:
42 ; AVX512BW-NEXT:    vpsrlvw %zmm1, %zmm0, %zmm0
43 ; AVX512BW-NEXT:    retq
44   %shift = lshr <32 x i16> %a, %b
45   ret <32 x i16> %shift
48 define <64 x i8> @var_shift_v64i8(<64 x i8> %a, <64 x i8> %b) nounwind {
49 ; AVX512DQ-LABEL: var_shift_v64i8:
50 ; AVX512DQ:       # %bb.0:
51 ; AVX512DQ-NEXT:    vpsrlw $4, %ymm0, %ymm4
52 ; AVX512DQ-NEXT:    vmovdqa {{.*#+}} ymm5 = [15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15]
53 ; AVX512DQ-NEXT:    vpand %ymm5, %ymm4, %ymm4
54 ; AVX512DQ-NEXT:    vpsllw $5, %ymm2, %ymm2
55 ; AVX512DQ-NEXT:    vpblendvb %ymm2, %ymm4, %ymm0, %ymm0
56 ; AVX512DQ-NEXT:    vpsrlw $2, %ymm0, %ymm4
57 ; AVX512DQ-NEXT:    vmovdqa {{.*#+}} ymm6 = [63,63,63,63,63,63,63,63,63,63,63,63,63,63,63,63,63,63,63,63,63,63,63,63,63,63,63,63,63,63,63,63]
58 ; AVX512DQ-NEXT:    vpand %ymm6, %ymm4, %ymm4
59 ; AVX512DQ-NEXT:    vpaddb %ymm2, %ymm2, %ymm2
60 ; AVX512DQ-NEXT:    vpblendvb %ymm2, %ymm4, %ymm0, %ymm0
61 ; AVX512DQ-NEXT:    vpsrlw $1, %ymm0, %ymm4
62 ; AVX512DQ-NEXT:    vmovdqa {{.*#+}} ymm7 = [127,127,127,127,127,127,127,127,127,127,127,127,127,127,127,127,127,127,127,127,127,127,127,127,127,127,127,127,127,127,127,127]
63 ; AVX512DQ-NEXT:    vpand %ymm7, %ymm4, %ymm4
64 ; AVX512DQ-NEXT:    vpaddb %ymm2, %ymm2, %ymm2
65 ; AVX512DQ-NEXT:    vpblendvb %ymm2, %ymm4, %ymm0, %ymm0
66 ; AVX512DQ-NEXT:    vpsrlw $4, %ymm1, %ymm2
67 ; AVX512DQ-NEXT:    vpand %ymm5, %ymm2, %ymm2
68 ; AVX512DQ-NEXT:    vpsllw $5, %ymm3, %ymm3
69 ; AVX512DQ-NEXT:    vpblendvb %ymm3, %ymm2, %ymm1, %ymm1
70 ; AVX512DQ-NEXT:    vpsrlw $2, %ymm1, %ymm2
71 ; AVX512DQ-NEXT:    vpand %ymm6, %ymm2, %ymm2
72 ; AVX512DQ-NEXT:    vpaddb %ymm3, %ymm3, %ymm3
73 ; AVX512DQ-NEXT:    vpblendvb %ymm3, %ymm2, %ymm1, %ymm1
74 ; AVX512DQ-NEXT:    vpsrlw $1, %ymm1, %ymm2
75 ; AVX512DQ-NEXT:    vpand %ymm7, %ymm2, %ymm2
76 ; AVX512DQ-NEXT:    vpaddb %ymm3, %ymm3, %ymm3
77 ; AVX512DQ-NEXT:    vpblendvb %ymm3, %ymm2, %ymm1, %ymm1
78 ; AVX512DQ-NEXT:    retq
80 ; AVX512BW-LABEL: var_shift_v64i8:
81 ; AVX512BW:       # %bb.0:
82 ; AVX512BW-NEXT:    vpsrlw $4, %zmm0, %zmm2
83 ; AVX512BW-NEXT:    vpandq {{.*}}(%rip), %zmm2, %zmm2
84 ; AVX512BW-NEXT:    vpsllw $5, %zmm1, %zmm1
85 ; AVX512BW-NEXT:    vpmovb2m %zmm1, %k1
86 ; AVX512BW-NEXT:    vmovdqu8 %zmm2, %zmm0 {%k1}
87 ; AVX512BW-NEXT:    vpsrlw $2, %zmm0, %zmm2
88 ; AVX512BW-NEXT:    vpandq {{.*}}(%rip), %zmm2, %zmm2
89 ; AVX512BW-NEXT:    vpaddb %zmm1, %zmm1, %zmm1
90 ; AVX512BW-NEXT:    vpmovb2m %zmm1, %k1
91 ; AVX512BW-NEXT:    vmovdqu8 %zmm2, %zmm0 {%k1}
92 ; AVX512BW-NEXT:    vpsrlw $1, %zmm0, %zmm2
93 ; AVX512BW-NEXT:    vpandq {{.*}}(%rip), %zmm2, %zmm2
94 ; AVX512BW-NEXT:    vpaddb %zmm1, %zmm1, %zmm1
95 ; AVX512BW-NEXT:    vpmovb2m %zmm1, %k1
96 ; AVX512BW-NEXT:    vmovdqu8 %zmm2, %zmm0 {%k1}
97 ; AVX512BW-NEXT:    retq
98   %shift = lshr <64 x i8> %a, %b
99   ret <64 x i8> %shift
103 ; Uniform Variable Shifts
106 define <8 x i64> @splatvar_shift_v8i64(<8 x i64> %a, <8 x i64> %b) nounwind {
107 ; ALL-LABEL: splatvar_shift_v8i64:
108 ; ALL:       # %bb.0:
109 ; ALL-NEXT:    vpsrlq %xmm1, %zmm0, %zmm0
110 ; ALL-NEXT:    retq
111   %splat = shufflevector <8 x i64> %b, <8 x i64> undef, <8 x i32> zeroinitializer
112   %shift = lshr <8 x i64> %a, %splat
113   ret <8 x i64> %shift
116 define <16 x i32> @splatvar_shift_v16i32(<16 x i32> %a, <16 x i32> %b) nounwind {
117 ; ALL-LABEL: splatvar_shift_v16i32:
118 ; ALL:       # %bb.0:
119 ; ALL-NEXT:    vpmovzxdq {{.*#+}} xmm1 = xmm1[0],zero,xmm1[1],zero
120 ; ALL-NEXT:    vpsrld %xmm1, %zmm0, %zmm0
121 ; ALL-NEXT:    retq
122   %splat = shufflevector <16 x i32> %b, <16 x i32> undef, <16 x i32> zeroinitializer
123   %shift = lshr <16 x i32> %a, %splat
124   ret <16 x i32> %shift
127 define <32 x i16> @splatvar_shift_v32i16(<32 x i16> %a, <32 x i16> %b) nounwind {
128 ; AVX512DQ-LABEL: splatvar_shift_v32i16:
129 ; AVX512DQ:       # %bb.0:
130 ; AVX512DQ-NEXT:    vpmovzxwq {{.*#+}} xmm2 = xmm2[0],zero,zero,zero,xmm2[1],zero,zero,zero
131 ; AVX512DQ-NEXT:    vpsrlw %xmm2, %ymm0, %ymm0
132 ; AVX512DQ-NEXT:    vpsrlw %xmm2, %ymm1, %ymm1
133 ; AVX512DQ-NEXT:    retq
135 ; AVX512BW-LABEL: splatvar_shift_v32i16:
136 ; AVX512BW:       # %bb.0:
137 ; AVX512BW-NEXT:    vpmovzxwq {{.*#+}} xmm1 = xmm1[0],zero,zero,zero,xmm1[1],zero,zero,zero
138 ; AVX512BW-NEXT:    vpsrlw %xmm1, %zmm0, %zmm0
139 ; AVX512BW-NEXT:    retq
140   %splat = shufflevector <32 x i16> %b, <32 x i16> undef, <32 x i32> zeroinitializer
141   %shift = lshr <32 x i16> %a, %splat
142   ret <32 x i16> %shift
145 define <64 x i8> @splatvar_shift_v64i8(<64 x i8> %a, <64 x i8> %b) nounwind {
146 ; AVX512DQ-LABEL: splatvar_shift_v64i8:
147 ; AVX512DQ:       # %bb.0:
148 ; AVX512DQ-NEXT:    vpmovzxbq {{.*#+}} xmm2 = xmm2[0],zero,zero,zero,zero,zero,zero,zero,xmm2[1],zero,zero,zero,zero,zero,zero,zero
149 ; AVX512DQ-NEXT:    vpsrlw %xmm2, %ymm0, %ymm0
150 ; AVX512DQ-NEXT:    vpcmpeqd %ymm3, %ymm3, %ymm3
151 ; AVX512DQ-NEXT:    vpsrlw %xmm2, %ymm3, %ymm3
152 ; AVX512DQ-NEXT:    vpsrlw $8, %ymm3, %ymm3
153 ; AVX512DQ-NEXT:    vpbroadcastb %xmm3, %ymm3
154 ; AVX512DQ-NEXT:    vpand %ymm3, %ymm0, %ymm0
155 ; AVX512DQ-NEXT:    vpsrlw %xmm2, %ymm1, %ymm1
156 ; AVX512DQ-NEXT:    vpand %ymm3, %ymm1, %ymm1
157 ; AVX512DQ-NEXT:    retq
159 ; AVX512BW-LABEL: splatvar_shift_v64i8:
160 ; AVX512BW:       # %bb.0:
161 ; AVX512BW-NEXT:    vpmovzxbq {{.*#+}} xmm1 = xmm1[0],zero,zero,zero,zero,zero,zero,zero,xmm1[1],zero,zero,zero,zero,zero,zero,zero
162 ; AVX512BW-NEXT:    vpsrlw %xmm1, %zmm0, %zmm0
163 ; AVX512BW-NEXT:    vpternlogd $255, %zmm2, %zmm2, %zmm2
164 ; AVX512BW-NEXT:    vpsrlw %xmm1, %zmm2, %zmm1
165 ; AVX512BW-NEXT:    vpsrlw $8, %zmm1, %zmm1
166 ; AVX512BW-NEXT:    vpbroadcastb %xmm1, %zmm1
167 ; AVX512BW-NEXT:    vpandq %zmm1, %zmm0, %zmm0
168 ; AVX512BW-NEXT:    retq
169   %splat = shufflevector <64 x i8> %b, <64 x i8> undef, <64 x i32> zeroinitializer
170   %shift = lshr <64 x i8> %a, %splat
171   ret <64 x i8> %shift
175 ; Constant Shifts
178 define <8 x i64> @constant_shift_v8i64(<8 x i64> %a) nounwind {
179 ; ALL-LABEL: constant_shift_v8i64:
180 ; ALL:       # %bb.0:
181 ; ALL-NEXT:    vpsrlvq {{.*}}(%rip), %zmm0, %zmm0
182 ; ALL-NEXT:    retq
183   %shift = lshr <8 x i64> %a, <i64 1, i64 7, i64 31, i64 62, i64 1, i64 7, i64 31, i64 62>
184   ret <8 x i64> %shift
187 define <16 x i32> @constant_shift_v16i32(<16 x i32> %a) nounwind {
188 ; ALL-LABEL: constant_shift_v16i32:
189 ; ALL:       # %bb.0:
190 ; ALL-NEXT:    vpsrlvd {{.*}}(%rip), %zmm0, %zmm0
191 ; ALL-NEXT:    retq
192   %shift = lshr <16 x i32> %a, <i32 4, i32 5, i32 6, i32 7, i32 8, i32 9, i32 8, i32 7, i32 4, i32 5, i32 6, i32 7, i32 8, i32 9, i32 8, i32 7>
193   ret <16 x i32> %shift
196 define <32 x i16> @constant_shift_v32i16(<32 x i16> %a) nounwind {
197 ; AVX512DQ-LABEL: constant_shift_v32i16:
198 ; AVX512DQ:       # %bb.0:
199 ; AVX512DQ-NEXT:    vmovdqa {{.*#+}} ymm2 = <u,32768,16384,8192,4096,2048,1024,512,256,128,64,32,16,8,4,2>
200 ; AVX512DQ-NEXT:    vpmulhuw %ymm2, %ymm0, %ymm3
201 ; AVX512DQ-NEXT:    vpblendw {{.*#+}} ymm0 = ymm0[0],ymm3[1,2,3,4,5,6,7],ymm0[8],ymm3[9,10,11,12,13,14,15]
202 ; AVX512DQ-NEXT:    vpblendd {{.*#+}} ymm0 = ymm0[0,1,2,3],ymm3[4,5,6,7]
203 ; AVX512DQ-NEXT:    vpmulhuw %ymm2, %ymm1, %ymm2
204 ; AVX512DQ-NEXT:    vpblendw {{.*#+}} ymm1 = ymm1[0],ymm2[1,2,3,4,5,6,7],ymm1[8],ymm2[9,10,11,12,13,14,15]
205 ; AVX512DQ-NEXT:    vpblendd {{.*#+}} ymm1 = ymm1[0,1,2,3],ymm2[4,5,6,7]
206 ; AVX512DQ-NEXT:    retq
208 ; AVX512BW-LABEL: constant_shift_v32i16:
209 ; AVX512BW:       # %bb.0:
210 ; AVX512BW-NEXT:    vpsrlvw {{.*}}(%rip), %zmm0, %zmm0
211 ; AVX512BW-NEXT:    retq
212   %shift = lshr <32 x i16> %a, <i16 0, i16 1, i16 2, i16 3, i16 4, i16 5, i16 6, i16 7, i16 8, i16 9, i16 10, i16 11, i16 12, i16 13, i16 14, i16 15, i16 0, i16 1, i16 2, i16 3, i16 4, i16 5, i16 6, i16 7, i16 8, i16 9, i16 10, i16 11, i16 12, i16 13, i16 14, i16 15>
213   ret <32 x i16> %shift
216 define <64 x i8> @constant_shift_v64i8(<64 x i8> %a) nounwind {
217 ; AVX512DQ-LABEL: constant_shift_v64i8:
218 ; AVX512DQ:       # %bb.0:
219 ; AVX512DQ-NEXT:    vpxor %xmm2, %xmm2, %xmm2
220 ; AVX512DQ-NEXT:    vpunpckhbw {{.*#+}} ymm3 = ymm0[8],ymm2[8],ymm0[9],ymm2[9],ymm0[10],ymm2[10],ymm0[11],ymm2[11],ymm0[12],ymm2[12],ymm0[13],ymm2[13],ymm0[14],ymm2[14],ymm0[15],ymm2[15],ymm0[24],ymm2[24],ymm0[25],ymm2[25],ymm0[26],ymm2[26],ymm0[27],ymm2[27],ymm0[28],ymm2[28],ymm0[29],ymm2[29],ymm0[30],ymm2[30],ymm0[31],ymm2[31]
221 ; AVX512DQ-NEXT:    vbroadcasti128 {{.*#+}} ymm4 = [2,4,8,16,32,64,128,256,2,4,8,16,32,64,128,256]
222 ; AVX512DQ-NEXT:    # ymm4 = mem[0,1,0,1]
223 ; AVX512DQ-NEXT:    vpmullw %ymm4, %ymm3, %ymm3
224 ; AVX512DQ-NEXT:    vpsrlw $8, %ymm3, %ymm3
225 ; AVX512DQ-NEXT:    vpunpcklbw {{.*#+}} ymm0 = ymm0[0],ymm2[0],ymm0[1],ymm2[1],ymm0[2],ymm2[2],ymm0[3],ymm2[3],ymm0[4],ymm2[4],ymm0[5],ymm2[5],ymm0[6],ymm2[6],ymm0[7],ymm2[7],ymm0[16],ymm2[16],ymm0[17],ymm2[17],ymm0[18],ymm2[18],ymm0[19],ymm2[19],ymm0[20],ymm2[20],ymm0[21],ymm2[21],ymm0[22],ymm2[22],ymm0[23],ymm2[23]
226 ; AVX512DQ-NEXT:    vbroadcasti128 {{.*#+}} ymm5 = [256,128,64,32,16,8,4,2,256,128,64,32,16,8,4,2]
227 ; AVX512DQ-NEXT:    # ymm5 = mem[0,1,0,1]
228 ; AVX512DQ-NEXT:    vpmullw %ymm5, %ymm0, %ymm0
229 ; AVX512DQ-NEXT:    vpsrlw $8, %ymm0, %ymm0
230 ; AVX512DQ-NEXT:    vpackuswb %ymm3, %ymm0, %ymm0
231 ; AVX512DQ-NEXT:    vpunpckhbw {{.*#+}} ymm3 = ymm1[8],ymm2[8],ymm1[9],ymm2[9],ymm1[10],ymm2[10],ymm1[11],ymm2[11],ymm1[12],ymm2[12],ymm1[13],ymm2[13],ymm1[14],ymm2[14],ymm1[15],ymm2[15],ymm1[24],ymm2[24],ymm1[25],ymm2[25],ymm1[26],ymm2[26],ymm1[27],ymm2[27],ymm1[28],ymm2[28],ymm1[29],ymm2[29],ymm1[30],ymm2[30],ymm1[31],ymm2[31]
232 ; AVX512DQ-NEXT:    vpmullw %ymm4, %ymm3, %ymm3
233 ; AVX512DQ-NEXT:    vpsrlw $8, %ymm3, %ymm3
234 ; AVX512DQ-NEXT:    vpunpcklbw {{.*#+}} ymm1 = ymm1[0],ymm2[0],ymm1[1],ymm2[1],ymm1[2],ymm2[2],ymm1[3],ymm2[3],ymm1[4],ymm2[4],ymm1[5],ymm2[5],ymm1[6],ymm2[6],ymm1[7],ymm2[7],ymm1[16],ymm2[16],ymm1[17],ymm2[17],ymm1[18],ymm2[18],ymm1[19],ymm2[19],ymm1[20],ymm2[20],ymm1[21],ymm2[21],ymm1[22],ymm2[22],ymm1[23],ymm2[23]
235 ; AVX512DQ-NEXT:    vpmullw %ymm5, %ymm1, %ymm1
236 ; AVX512DQ-NEXT:    vpsrlw $8, %ymm1, %ymm1
237 ; AVX512DQ-NEXT:    vpackuswb %ymm3, %ymm1, %ymm1
238 ; AVX512DQ-NEXT:    retq
240 ; AVX512BW-LABEL: constant_shift_v64i8:
241 ; AVX512BW:       # %bb.0:
242 ; AVX512BW-NEXT:    vpunpckhbw {{.*#+}} zmm1 = zmm0[8,8,9,9,10,10,11,11,12,12,13,13,14,14,15,15,24,24,25,25,26,26,27,27,28,28,29,29,30,30,31,31,40,40,41,41,42,42,43,43,44,44,45,45,46,46,47,47,56,56,57,57,58,58,59,59,60,60,61,61,62,62,63,63]
243 ; AVX512BW-NEXT:    vpsrlw $8, %zmm1, %zmm1
244 ; AVX512BW-NEXT:    vpsllvw {{.*}}(%rip), %zmm1, %zmm1
245 ; AVX512BW-NEXT:    vpsrlw $8, %zmm1, %zmm1
246 ; AVX512BW-NEXT:    vpunpcklbw {{.*#+}} zmm0 = zmm0[0,0,1,1,2,2,3,3,4,4,5,5,6,6,7,7,16,16,17,17,18,18,19,19,20,20,21,21,22,22,23,23,32,32,33,33,34,34,35,35,36,36,37,37,38,38,39,39,48,48,49,49,50,50,51,51,52,52,53,53,54,54,55,55]
247 ; AVX512BW-NEXT:    vpsrlw $8, %zmm0, %zmm0
248 ; AVX512BW-NEXT:    vpsllvw {{.*}}(%rip), %zmm0, %zmm0
249 ; AVX512BW-NEXT:    vpsrlw $8, %zmm0, %zmm0
250 ; AVX512BW-NEXT:    vpackuswb %zmm1, %zmm0, %zmm0
251 ; AVX512BW-NEXT:    retq
252   %shift = lshr <64 x i8> %a, <i8 0, i8 1, i8 2, i8 3, i8 4, i8 5, i8 6, i8 7, i8 7, i8 6, i8 5, i8 4, i8 3, i8 2, i8 1, i8 0, i8 0, i8 1, i8 2, i8 3, i8 4, i8 5, i8 6, i8 7, i8 7, i8 6, i8 5, i8 4, i8 3, i8 2, i8 1, i8 0, i8 0, i8 1, i8 2, i8 3, i8 4, i8 5, i8 6, i8 7, i8 7, i8 6, i8 5, i8 4, i8 3, i8 2, i8 1, i8 0, i8 0, i8 1, i8 2, i8 3, i8 4, i8 5, i8 6, i8 7, i8 7, i8 6, i8 5, i8 4, i8 3, i8 2, i8 1, i8 0>
253   ret <64 x i8> %shift
257 ; Uniform Constant Shifts
260 define <8 x i64> @splatconstant_shift_v8i64(<8 x i64> %a) nounwind {
261 ; ALL-LABEL: splatconstant_shift_v8i64:
262 ; ALL:       # %bb.0:
263 ; ALL-NEXT:    vpsrlq $7, %zmm0, %zmm0
264 ; ALL-NEXT:    retq
265   %shift = lshr <8 x i64> %a, <i64 7, i64 7, i64 7, i64 7, i64 7, i64 7, i64 7, i64 7>
266   ret <8 x i64> %shift
269 define <16 x i32> @splatconstant_shift_v16i32(<16 x i32> %a) nounwind {
270 ; ALL-LABEL: splatconstant_shift_v16i32:
271 ; ALL:       # %bb.0:
272 ; ALL-NEXT:    vpsrld $5, %zmm0, %zmm0
273 ; ALL-NEXT:    retq
274   %shift = lshr <16 x i32> %a, <i32 5, i32 5, i32 5, i32 5, i32 5, i32 5, i32 5, i32 5, i32 5, i32 5, i32 5, i32 5, i32 5, i32 5, i32 5, i32 5>
275   ret <16 x i32> %shift
278 define <32 x i16> @splatconstant_shift_v32i16(<32 x i16> %a) nounwind {
279 ; AVX512DQ-LABEL: splatconstant_shift_v32i16:
280 ; AVX512DQ:       # %bb.0:
281 ; AVX512DQ-NEXT:    vpsrlw $3, %ymm0, %ymm0
282 ; AVX512DQ-NEXT:    vpsrlw $3, %ymm1, %ymm1
283 ; AVX512DQ-NEXT:    retq
285 ; AVX512BW-LABEL: splatconstant_shift_v32i16:
286 ; AVX512BW:       # %bb.0:
287 ; AVX512BW-NEXT:    vpsrlw $3, %zmm0, %zmm0
288 ; AVX512BW-NEXT:    retq
289   %shift = lshr <32 x i16> %a, <i16 3, i16 3, i16 3, i16 3, i16 3, i16 3, i16 3, i16 3, i16 3, i16 3, i16 3, i16 3, i16 3, i16 3, i16 3, i16 3, i16 3, i16 3, i16 3, i16 3, i16 3, i16 3, i16 3, i16 3, i16 3, i16 3, i16 3, i16 3, i16 3, i16 3, i16 3, i16 3>
290   ret <32 x i16> %shift
293 define <64 x i8> @splatconstant_shift_v64i8(<64 x i8> %a) nounwind {
294 ; AVX512DQ-LABEL: splatconstant_shift_v64i8:
295 ; AVX512DQ:       # %bb.0:
296 ; AVX512DQ-NEXT:    vpsrlw $3, %ymm0, %ymm0
297 ; AVX512DQ-NEXT:    vmovdqa {{.*#+}} ymm2 = [31,31,31,31,31,31,31,31,31,31,31,31,31,31,31,31,31,31,31,31,31,31,31,31,31,31,31,31,31,31,31,31]
298 ; AVX512DQ-NEXT:    vpand %ymm2, %ymm0, %ymm0
299 ; AVX512DQ-NEXT:    vpsrlw $3, %ymm1, %ymm1
300 ; AVX512DQ-NEXT:    vpand %ymm2, %ymm1, %ymm1
301 ; AVX512DQ-NEXT:    retq
303 ; AVX512BW-LABEL: splatconstant_shift_v64i8:
304 ; AVX512BW:       # %bb.0:
305 ; AVX512BW-NEXT:    vpsrlw $3, %zmm0, %zmm0
306 ; AVX512BW-NEXT:    vpandq {{.*}}(%rip), %zmm0, %zmm0
307 ; AVX512BW-NEXT:    retq
308   %shift = lshr <64 x i8> %a, <i8 3, i8 3, i8 3, i8 3, i8 3, i8 3, i8 3, i8 3, i8 3, i8 3, i8 3, i8 3, i8 3, i8 3, i8 3, i8 3, i8 3, i8 3, i8 3, i8 3, i8 3, i8 3, i8 3, i8 3, i8 3, i8 3, i8 3, i8 3, i8 3, i8 3, i8 3, i8 3, i8 3, i8 3, i8 3, i8 3, i8 3, i8 3, i8 3, i8 3, i8 3, i8 3, i8 3, i8 3, i8 3, i8 3, i8 3, i8 3, i8 3, i8 3, i8 3, i8 3, i8 3, i8 3, i8 3, i8 3, i8 3, i8 3, i8 3, i8 3, i8 3, i8 3, i8 3, i8 3>
309   ret <64 x i8> %shift