[TTI] getTypeBasedIntrinsicInstrCost - add basic handling for strided load/store...
[llvm-project.git] / llvm / test / CodeGen / X86 / pr89877.ll
bloba40ad8f94127884cb68e543f6f6d3c5f35563a76
1 ; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py UTC_ARGS: --version 3
2 ; RUN: llc < %s -mtriple=i686-unknown-unknown -mattr=+sse2 | FileCheck %s --check-prefixes=X86
3 ; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+avx | FileCheck %s --check-prefixes=X64
5 define i32 @sext_known_nonzero(i16 %xx) {
6 ; X86-LABEL: sext_known_nonzero:
7 ; X86:       # %bb.0:
8 ; X86-NEXT:    movzbl {{[0-9]+}}(%esp), %ecx
9 ; X86-NEXT:    movl $256, %eax # imm = 0x100
10 ; X86-NEXT:    shll %cl, %eax
11 ; X86-NEXT:    cwtl
12 ; X86-NEXT:    bsfl %eax, %ecx
13 ; X86-NEXT:    movl $32, %eax
14 ; X86-NEXT:    cmovnel %ecx, %eax
15 ; X86-NEXT:    retl
17 ; X64-LABEL: sext_known_nonzero:
18 ; X64:       # %bb.0:
19 ; X64-NEXT:    movl %edi, %ecx
20 ; X64-NEXT:    movl $256, %eax # imm = 0x100
21 ; X64-NEXT:    # kill: def $cl killed $cl killed $ecx
22 ; X64-NEXT:    shll %cl, %eax
23 ; X64-NEXT:    movswl %ax, %ecx
24 ; X64-NEXT:    movl $32, %eax
25 ; X64-NEXT:    rep bsfl %ecx, %eax
26 ; X64-NEXT:    retq
27   %x = shl i16 256, %xx
28   %z = sext i16 %x to i32
29   %r = call i32 @llvm.cttz.i32(i32 %z, i1 false)
30   ret i32 %r
33 define i32 @sext_known_nonzero_nuw(i16 %xx) {
34 ; X86-LABEL: sext_known_nonzero_nuw:
35 ; X86:       # %bb.0:
36 ; X86-NEXT:    movzbl {{[0-9]+}}(%esp), %ecx
37 ; X86-NEXT:    movl $256, %eax # imm = 0x100
38 ; X86-NEXT:    shll %cl, %eax
39 ; X86-NEXT:    cwtl
40 ; X86-NEXT:    rep bsfl %eax, %eax
41 ; X86-NEXT:    retl
43 ; X64-LABEL: sext_known_nonzero_nuw:
44 ; X64:       # %bb.0:
45 ; X64-NEXT:    movl %edi, %ecx
46 ; X64-NEXT:    movl $256, %eax # imm = 0x100
47 ; X64-NEXT:    # kill: def $cl killed $cl killed $ecx
48 ; X64-NEXT:    shll %cl, %eax
49 ; X64-NEXT:    cwtl
50 ; X64-NEXT:    rep bsfl %eax, %eax
51 ; X64-NEXT:    retq
52   %x = shl nuw i16 256, %xx
53   %z = sext i16 %x to i32
54   %r = call i32 @llvm.cttz.i32(i32 %z, i1 false)
55   ret i32 %r
58 define i32 @sext_known_nonzero_nsw(i16 %xx) {
59 ; X86-LABEL: sext_known_nonzero_nsw:
60 ; X86:       # %bb.0:
61 ; X86-NEXT:    movzbl {{[0-9]+}}(%esp), %ecx
62 ; X86-NEXT:    movl $256, %eax # imm = 0x100
63 ; X86-NEXT:    shll %cl, %eax
64 ; X86-NEXT:    movzwl %ax, %eax
65 ; X86-NEXT:    rep bsfl %eax, %eax
66 ; X86-NEXT:    retl
68 ; X64-LABEL: sext_known_nonzero_nsw:
69 ; X64:       # %bb.0:
70 ; X64-NEXT:    movl %edi, %ecx
71 ; X64-NEXT:    movl $256, %eax # imm = 0x100
72 ; X64-NEXT:    # kill: def $cl killed $cl killed $ecx
73 ; X64-NEXT:    shll %cl, %eax
74 ; X64-NEXT:    movzwl %ax, %eax
75 ; X64-NEXT:    rep bsfl %eax, %eax
76 ; X64-NEXT:    retq
77   %x = shl nsw i16 256, %xx
78   %z = sext i16 %x to i32
79   %r = call i32 @llvm.cttz.i32(i32 %z, i1 false)
80   ret i32 %r
83 define i32 @sext_known_nonzero_nuw_nsw(i16 %xx) {
84 ; X86-LABEL: sext_known_nonzero_nuw_nsw:
85 ; X86:       # %bb.0:
86 ; X86-NEXT:    movzbl {{[0-9]+}}(%esp), %ecx
87 ; X86-NEXT:    movl $256, %eax # imm = 0x100
88 ; X86-NEXT:    shll %cl, %eax
89 ; X86-NEXT:    movzwl %ax, %eax
90 ; X86-NEXT:    rep bsfl %eax, %eax
91 ; X86-NEXT:    retl
93 ; X64-LABEL: sext_known_nonzero_nuw_nsw:
94 ; X64:       # %bb.0:
95 ; X64-NEXT:    movl %edi, %ecx
96 ; X64-NEXT:    movl $256, %eax # imm = 0x100
97 ; X64-NEXT:    # kill: def $cl killed $cl killed $ecx
98 ; X64-NEXT:    shll %cl, %eax
99 ; X64-NEXT:    movzwl %ax, %eax
100 ; X64-NEXT:    rep bsfl %eax, %eax
101 ; X64-NEXT:    retq
102   %x = shl nuw nsw i16 256, %xx
103   %z = sext i16 %x to i32
104   %r = call i32 @llvm.cttz.i32(i32 %z, i1 false)
105   ret i32 %r