[x86] fix assert with horizontal math + broadcast of vector (PR43402)
[llvm-core.git] / test / CodeGen / X86 / dagcombine-select.ll
blob506234b25f27cd347c98b3c19efc57434d4da441
1 ; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
2 ; RUN: llc < %s -mtriple=x86_64-unknown-unknown -verify-machineinstrs | FileCheck %s --check-prefixes=CHECK,NOBMI -enable-var-scope
3 ; RUN: llc < %s -mtriple=x86_64-unknown-unknown -verify-machineinstrs -mattr=+bmi | FileCheck %s -check-prefixes=CHECK,BMI -enable-var-scope
5 define i32 @select_and1(i32 %x, i32 %y) {
6 ; CHECK-LABEL: select_and1:
7 ; CHECK:       # %bb.0:
8 ; CHECK-NEXT:    xorl %eax, %eax
9 ; CHECK-NEXT:    cmpl $11, %edi
10 ; CHECK-NEXT:    cmovgel %esi, %eax
11 ; CHECK-NEXT:    retq
12   %c = icmp slt i32 %x, 11
13   %s = select i1 %c, i32 0, i32 -1
14   %a = and i32 %y, %s
15   ret i32 %a
18 define i32 @select_and2(i32 %x, i32 %y) {
19 ; CHECK-LABEL: select_and2:
20 ; CHECK:       # %bb.0:
21 ; CHECK-NEXT:    xorl %eax, %eax
22 ; CHECK-NEXT:    cmpl $11, %edi
23 ; CHECK-NEXT:    cmovgel %esi, %eax
24 ; CHECK-NEXT:    retq
25   %c = icmp slt i32 %x, 11
26   %s = select i1 %c, i32 0, i32 -1
27   %a = and i32 %s, %y
28   ret i32 %a
31 define i32 @select_and3(i32 %x, i32 %y) {
32 ; CHECK-LABEL: select_and3:
33 ; CHECK:       # %bb.0:
34 ; CHECK-NEXT:    xorl %eax, %eax
35 ; CHECK-NEXT:    cmpl $11, %edi
36 ; CHECK-NEXT:    cmovll %esi, %eax
37 ; CHECK-NEXT:    retq
38   %c = icmp slt i32 %x, 11
39   %s = select i1 %c, i32 -1, i32 0
40   %a = and i32 %y, %s
41   ret i32 %a
44 define <4 x i32> @select_and_v4(i32 %x, <4 x i32> %y) {
45 ; CHECK-LABEL: select_and_v4:
46 ; CHECK:       # %bb.0:
47 ; CHECK-NEXT:    cmpl $11, %edi
48 ; CHECK-NEXT:    xorps %xmm1, %xmm1
49 ; CHECK-NEXT:    jl .LBB3_2
50 ; CHECK-NEXT:  # %bb.1:
51 ; CHECK-NEXT:    movaps %xmm0, %xmm1
52 ; CHECK-NEXT:  .LBB3_2:
53 ; CHECK-NEXT:    movaps %xmm1, %xmm0
54 ; CHECK-NEXT:    retq
55   %c = icmp slt i32 %x, 11
56   %s = select i1 %c, <4 x i32> zeroinitializer, <4 x i32><i32 -1, i32 -1, i32 -1, i32 -1>
57   %a = and <4 x i32> %s, %y
58   ret <4 x i32> %a
61 define i32 @select_or1(i32 %x, i32 %y) {
62 ; CHECK-LABEL: select_or1:
63 ; CHECK:       # %bb.0:
64 ; CHECK-NEXT:    cmpl $11, %edi
65 ; CHECK-NEXT:    movl $-1, %eax
66 ; CHECK-NEXT:    cmovll %esi, %eax
67 ; CHECK-NEXT:    retq
68   %c = icmp slt i32 %x, 11
69   %s = select i1 %c, i32 0, i32 -1
70   %a = or i32 %y, %s
71   ret i32 %a
74 define i32 @select_or2(i32 %x, i32 %y) {
75 ; CHECK-LABEL: select_or2:
76 ; CHECK:       # %bb.0:
77 ; CHECK-NEXT:    cmpl $11, %edi
78 ; CHECK-NEXT:    movl $-1, %eax
79 ; CHECK-NEXT:    cmovll %esi, %eax
80 ; CHECK-NEXT:    retq
81   %c = icmp slt i32 %x, 11
82   %s = select i1 %c, i32 0, i32 -1
83   %a = or i32 %s, %y
84   ret i32 %a
87 define i32 @select_or3(i32 %x, i32 %y) {
88 ; CHECK-LABEL: select_or3:
89 ; CHECK:       # %bb.0:
90 ; CHECK-NEXT:    cmpl $11, %edi
91 ; CHECK-NEXT:    movl $-1, %eax
92 ; CHECK-NEXT:    cmovgel %esi, %eax
93 ; CHECK-NEXT:    retq
94   %c = icmp slt i32 %x, 11
95   %s = select i1 %c, i32 -1, i32 0
96   %a = or i32 %y, %s
97   ret i32 %a
100 define <4 x i32> @select_or_v4(i32 %x, <4 x i32> %y) {
101 ; CHECK-LABEL: select_or_v4:
102 ; CHECK:       # %bb.0:
103 ; CHECK-NEXT:    cmpl $11, %edi
104 ; CHECK-NEXT:    jl .LBB7_2
105 ; CHECK-NEXT:  # %bb.1:
106 ; CHECK-NEXT:    pcmpeqd %xmm0, %xmm0
107 ; CHECK-NEXT:  .LBB7_2:
108 ; CHECK-NEXT:    retq
109   %c = icmp slt i32 %x, 11
110   %s = select i1 %c, <4 x i32> zeroinitializer, <4 x i32><i32 -1, i32 -1, i32 -1, i32 -1>
111   %a = or <4 x i32> %s, %y
112   ret <4 x i32> %a
115 define i32 @sel_constants_sub_constant_sel_constants(i1 %cond) {
116 ; CHECK-LABEL: sel_constants_sub_constant_sel_constants:
117 ; CHECK:       # %bb.0:
118 ; CHECK-NEXT:    testb $1, %dil
119 ; CHECK-NEXT:    movl $9, %ecx
120 ; CHECK-NEXT:    movl $2, %eax
121 ; CHECK-NEXT:    cmovnel %ecx, %eax
122 ; CHECK-NEXT:    retq
123   %sel = select i1 %cond, i32 -4, i32 3
124   %bo = sub i32 5, %sel
125   ret i32 %bo
128 define i32 @sdiv_constant_sel_constants(i1 %cond) {
129 ; CHECK-LABEL: sdiv_constant_sel_constants:
130 ; CHECK:       # %bb.0:
131 ; CHECK-NEXT:    notb %dil
132 ; CHECK-NEXT:    movzbl %dil, %eax
133 ; CHECK-NEXT:    andl $1, %eax
134 ; CHECK-NEXT:    leal (%rax,%rax,4), %eax
135 ; CHECK-NEXT:    retq
136   %sel = select i1 %cond, i32 121, i32 23
137   %bo = sdiv i32 120, %sel
138   ret i32 %bo
141 define i32 @udiv_constant_sel_constants(i1 %cond) {
142 ; CHECK-LABEL: udiv_constant_sel_constants:
143 ; CHECK:       # %bb.0:
144 ; CHECK-NEXT:    notb %dil
145 ; CHECK-NEXT:    movzbl %dil, %eax
146 ; CHECK-NEXT:    andl $1, %eax
147 ; CHECK-NEXT:    leal (%rax,%rax,4), %eax
148 ; CHECK-NEXT:    retq
149   %sel = select i1 %cond, i32 -4, i32 23
150   %bo = udiv i32 120, %sel
151   ret i32 %bo
154 define i32 @srem_constant_sel_constants(i1 %cond) {
155 ; CHECK-LABEL: srem_constant_sel_constants:
156 ; CHECK:       # %bb.0:
157 ; CHECK-NEXT:    testb $1, %dil
158 ; CHECK-NEXT:    movl $120, %ecx
159 ; CHECK-NEXT:    movl $5, %eax
160 ; CHECK-NEXT:    cmovnel %ecx, %eax
161 ; CHECK-NEXT:    retq
162   %sel = select i1 %cond, i32 121, i32 23
163   %bo = srem i32 120, %sel
164   ret i32 %bo
167 define i32 @urem_constant_sel_constants(i1 %cond) {
168 ; CHECK-LABEL: urem_constant_sel_constants:
169 ; CHECK:       # %bb.0:
170 ; CHECK-NEXT:    testb $1, %dil
171 ; CHECK-NEXT:    movl $120, %ecx
172 ; CHECK-NEXT:    movl $5, %eax
173 ; CHECK-NEXT:    cmovnel %ecx, %eax
174 ; CHECK-NEXT:    retq
175   %sel = select i1 %cond, i32 -4, i32 23
176   %bo = urem i32 120, %sel
177   ret i32 %bo
180 define i32 @sel_constants_shl_constant(i1 %cond) {
181 ; CHECK-LABEL: sel_constants_shl_constant:
182 ; CHECK:       # %bb.0:
183 ; CHECK-NEXT:    notb %dil
184 ; CHECK-NEXT:    movzbl %dil, %eax
185 ; CHECK-NEXT:    andl $1, %eax
186 ; CHECK-NEXT:    orl $2, %eax
187 ; CHECK-NEXT:    shll $8, %eax
188 ; CHECK-NEXT:    retq
189   %sel = select i1 %cond, i32 2, i32 3
190   %bo = shl i32 %sel, 8
191   ret i32 %bo
194 define i32 @shl_constant_sel_constants(i1 %cond) {
195 ; CHECK-LABEL: shl_constant_sel_constants:
196 ; CHECK:       # %bb.0:
197 ; CHECK-NEXT:    movl %edi, %ecx
198 ; CHECK-NEXT:    andb $1, %cl
199 ; CHECK-NEXT:    xorb $3, %cl
200 ; CHECK-NEXT:    movl $1, %eax
201 ; CHECK-NEXT:    # kill: def $cl killed $cl killed $ecx
202 ; CHECK-NEXT:    shll %cl, %eax
203 ; CHECK-NEXT:    retq
204   %sel = select i1 %cond, i32 2, i32 3
205   %bo = shl i32 1, %sel
206   ret i32 %bo
209 define i32 @lshr_constant_sel_constants(i1 %cond) {
210 ; CHECK-LABEL: lshr_constant_sel_constants:
211 ; CHECK:       # %bb.0:
212 ; CHECK-NEXT:    movl %edi, %ecx
213 ; CHECK-NEXT:    andb $1, %cl
214 ; CHECK-NEXT:    xorb $3, %cl
215 ; CHECK-NEXT:    movl $64, %eax
216 ; CHECK-NEXT:    # kill: def $cl killed $cl killed $ecx
217 ; CHECK-NEXT:    shrl %cl, %eax
218 ; CHECK-NEXT:    retq
219   %sel = select i1 %cond, i32 2, i32 3
220   %bo = lshr i32 64, %sel
221   ret i32 %bo
224 define i32 @ashr_constant_sel_constants(i1 %cond) {
225 ; CHECK-LABEL: ashr_constant_sel_constants:
226 ; CHECK:       # %bb.0:
227 ; CHECK-NEXT:    movl %edi, %ecx
228 ; CHECK-NEXT:    andb $1, %cl
229 ; CHECK-NEXT:    xorb $3, %cl
230 ; CHECK-NEXT:    movl $128, %eax
231 ; CHECK-NEXT:    # kill: def $cl killed $cl killed $ecx
232 ; CHECK-NEXT:    shrl %cl, %eax
233 ; CHECK-NEXT:    retq
234   %sel = select i1 %cond, i32 2, i32 3
235   %bo = ashr i32 128, %sel
236   ret i32 %bo
239 define double @fsub_constant_sel_constants(i1 %cond) {
240 ; CHECK-LABEL: fsub_constant_sel_constants:
241 ; CHECK:       # %bb.0:
242 ; CHECK-NEXT:    testb $1, %dil
243 ; CHECK-NEXT:    jne .LBB17_1
244 ; CHECK-NEXT:  # %bb.2:
245 ; CHECK-NEXT:    movsd {{.*#+}} xmm0 = mem[0],zero
246 ; CHECK-NEXT:    retq
247 ; CHECK-NEXT:  .LBB17_1:
248 ; CHECK-NEXT:    movsd {{.*#+}} xmm0 = mem[0],zero
249 ; CHECK-NEXT:    retq
250   %sel = select i1 %cond, double -4.0, double 23.3
251   %bo = fsub double 5.1, %sel
252   ret double %bo
255 define double @fdiv_constant_sel_constants(i1 %cond) {
256 ; CHECK-LABEL: fdiv_constant_sel_constants:
257 ; CHECK:       # %bb.0:
258 ; CHECK-NEXT:    testb $1, %dil
259 ; CHECK-NEXT:    jne .LBB18_1
260 ; CHECK-NEXT:  # %bb.2:
261 ; CHECK-NEXT:    movsd {{.*#+}} xmm0 = mem[0],zero
262 ; CHECK-NEXT:    retq
263 ; CHECK-NEXT:  .LBB18_1:
264 ; CHECK-NEXT:    movsd {{.*#+}} xmm0 = mem[0],zero
265 ; CHECK-NEXT:    retq
266   %sel = select i1 %cond, double -4.0, double 23.3
267   %bo = fdiv double 5.1, %sel
268   ret double %bo
271 define double @frem_constant_sel_constants(i1 %cond) {
272 ; CHECK-LABEL: frem_constant_sel_constants:
273 ; CHECK:       # %bb.0:
274 ; CHECK-NEXT:    testb $1, %dil
275 ; CHECK-NEXT:    jne .LBB19_1
276 ; CHECK-NEXT:  # %bb.2:
277 ; CHECK-NEXT:    movsd {{.*#+}} xmm0 = mem[0],zero
278 ; CHECK-NEXT:    retq
279 ; CHECK-NEXT:  .LBB19_1:
280 ; CHECK-NEXT:    movsd {{.*#+}} xmm0 = mem[0],zero
281 ; CHECK-NEXT:    retq
282   %sel = select i1 %cond, double -4.0, double 23.3
283   %bo = frem double 5.1, %sel
284   ret double %bo
287 declare i64 @llvm.cttz.i64(i64, i1)
288 define i64 @cttz_64_eq_select(i64 %v) nounwind {
289 ; NOBMI-LABEL: cttz_64_eq_select:
290 ; NOBMI:       # %bb.0:
291 ; NOBMI-NEXT:    bsfq %rdi, %rcx
292 ; NOBMI-NEXT:    movq $-1, %rax
293 ; NOBMI-NEXT:    cmovneq %rcx, %rax
294 ; NOBMI-NEXT:    addq $6, %rax
295 ; NOBMI-NEXT:    retq
297 ; BMI-LABEL: cttz_64_eq_select:
298 ; BMI:       # %bb.0:
299 ; BMI-NEXT:    tzcntq %rdi, %rcx
300 ; BMI-NEXT:    movq $-1, %rax
301 ; BMI-NEXT:    cmovaeq %rcx, %rax
302 ; BMI-NEXT:    addq $6, %rax
303 ; BMI-NEXT:    retq
305   %cnt = tail call i64 @llvm.cttz.i64(i64 %v, i1 true)
306   %tobool = icmp eq i64 %v, 0
307   %.op = add nuw nsw i64 %cnt, 6
308   %add = select i1 %tobool, i64 5, i64 %.op
309   ret i64 %add
312 define i64 @cttz_64_ne_select(i64 %v) nounwind {
313 ; NOBMI-LABEL: cttz_64_ne_select:
314 ; NOBMI:       # %bb.0:
315 ; NOBMI-NEXT:    bsfq %rdi, %rcx
316 ; NOBMI-NEXT:    movq $-1, %rax
317 ; NOBMI-NEXT:    cmovneq %rcx, %rax
318 ; NOBMI-NEXT:    addq $6, %rax
319 ; NOBMI-NEXT:    retq
321 ; BMI-LABEL: cttz_64_ne_select:
322 ; BMI:       # %bb.0:
323 ; BMI-NEXT:    tzcntq %rdi, %rcx
324 ; BMI-NEXT:    movq $-1, %rax
325 ; BMI-NEXT:    cmovaeq %rcx, %rax
326 ; BMI-NEXT:    addq $6, %rax
327 ; BMI-NEXT:    retq
329   %cnt = tail call i64 @llvm.cttz.i64(i64 %v, i1 true)
330   %tobool = icmp ne i64 %v, 0
331   %.op = add nuw nsw i64 %cnt, 6
332   %add = select i1 %tobool, i64 %.op, i64 5
333   ret i64 %add
336 declare i32 @llvm.cttz.i32(i32, i1)
337 define i32 @cttz_32_eq_select(i32 %v) nounwind {
338 ; NOBMI-LABEL: cttz_32_eq_select:
339 ; NOBMI:       # %bb.0:
340 ; NOBMI-NEXT:    bsfl %edi, %ecx
341 ; NOBMI-NEXT:    movl $-1, %eax
342 ; NOBMI-NEXT:    cmovnel %ecx, %eax
343 ; NOBMI-NEXT:    addl $6, %eax
344 ; NOBMI-NEXT:    retq
346 ; BMI-LABEL: cttz_32_eq_select:
347 ; BMI:       # %bb.0:
348 ; BMI-NEXT:    tzcntl %edi, %ecx
349 ; BMI-NEXT:    movl $-1, %eax
350 ; BMI-NEXT:    cmovael %ecx, %eax
351 ; BMI-NEXT:    addl $6, %eax
352 ; BMI-NEXT:    retq
354   %cnt = tail call i32 @llvm.cttz.i32(i32 %v, i1 true)
355   %tobool = icmp eq i32 %v, 0
356   %.op = add nuw nsw i32 %cnt, 6
357   %add = select i1 %tobool, i32 5, i32 %.op
358   ret i32 %add
361 define i32 @cttz_32_ne_select(i32 %v) nounwind {
362 ; NOBMI-LABEL: cttz_32_ne_select:
363 ; NOBMI:       # %bb.0:
364 ; NOBMI-NEXT:    bsfl %edi, %ecx
365 ; NOBMI-NEXT:    movl $-1, %eax
366 ; NOBMI-NEXT:    cmovnel %ecx, %eax
367 ; NOBMI-NEXT:    addl $6, %eax
368 ; NOBMI-NEXT:    retq
370 ; BMI-LABEL: cttz_32_ne_select:
371 ; BMI:       # %bb.0:
372 ; BMI-NEXT:    tzcntl %edi, %ecx
373 ; BMI-NEXT:    movl $-1, %eax
374 ; BMI-NEXT:    cmovael %ecx, %eax
375 ; BMI-NEXT:    addl $6, %eax
376 ; BMI-NEXT:    retq
378   %cnt = tail call i32 @llvm.cttz.i32(i32 %v, i1 true)
379   %tobool = icmp ne i32 %v, 0
380   %.op = add nuw nsw i32 %cnt, 6
381   %add = select i1 %tobool, i32 %.op, i32 5
382   ret i32 %add
385 ; This matches the pattern emitted for __builtin_ffs
386 define i32 @cttz_32_eq_select_ffs(i32 %v) nounwind {
387 ; NOBMI-LABEL: cttz_32_eq_select_ffs:
388 ; NOBMI:       # %bb.0:
389 ; NOBMI-NEXT:    bsfl %edi, %ecx
390 ; NOBMI-NEXT:    movl $-1, %eax
391 ; NOBMI-NEXT:    cmovnel %ecx, %eax
392 ; NOBMI-NEXT:    incl %eax
393 ; NOBMI-NEXT:    retq
395 ; BMI-LABEL: cttz_32_eq_select_ffs:
396 ; BMI:       # %bb.0:
397 ; BMI-NEXT:    tzcntl %edi, %ecx
398 ; BMI-NEXT:    movl $-1, %eax
399 ; BMI-NEXT:    cmovael %ecx, %eax
400 ; BMI-NEXT:    incl %eax
401 ; BMI-NEXT:    retq
403   %cnt = tail call i32 @llvm.cttz.i32(i32 %v, i1 true)
404   %tobool = icmp eq i32 %v, 0
405   %.op = add nuw nsw i32 %cnt, 1
406   %add = select i1 %tobool, i32 0, i32 %.op
407   ret i32 %add
410 define i32 @cttz_32_ne_select_ffs(i32 %v) nounwind {
411 ; NOBMI-LABEL: cttz_32_ne_select_ffs:
412 ; NOBMI:       # %bb.0:
413 ; NOBMI-NEXT:    bsfl %edi, %ecx
414 ; NOBMI-NEXT:    movl $-1, %eax
415 ; NOBMI-NEXT:    cmovnel %ecx, %eax
416 ; NOBMI-NEXT:    incl %eax
417 ; NOBMI-NEXT:    retq
419 ; BMI-LABEL: cttz_32_ne_select_ffs:
420 ; BMI:       # %bb.0:
421 ; BMI-NEXT:    tzcntl %edi, %ecx
422 ; BMI-NEXT:    movl $-1, %eax
423 ; BMI-NEXT:    cmovael %ecx, %eax
424 ; BMI-NEXT:    incl %eax
425 ; BMI-NEXT:    retq
427   %cnt = tail call i32 @llvm.cttz.i32(i32 %v, i1 true)
428   %tobool = icmp ne i32 %v, 0
429   %.op = add nuw nsw i32 %cnt, 1
430   %add = select i1 %tobool, i32 %.op, i32 0
431   ret i32 %add