[DAGCombiner] Eliminate dead stores to stack.
[llvm-complete.git] / test / CodeGen / X86 / extract-insert.ll
blobbe5f9ed24fbc987ddb95254b7121302d93a94cb2
1 ; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
2 ; RUN: llc < %s -mtriple=i686-unknown-unknown -mattr=+sse2 | FileCheck %s --check-prefix=CHECK --check-prefix=X86
3 ; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+sse2 | FileCheck %s --check-prefix=CHECK --check-prefix=X64
5 define i32 @extractelt_undef_insertelt(i32 %x, i32 %y) {
6 ; CHECK-LABEL: extractelt_undef_insertelt:
7 ; CHECK:       # %bb.0:
8 ; CHECK-NEXT:    ret{{[l|q]}}
9   %b = insertelement <4 x i32> zeroinitializer, i32 %x, i64 3
10   %c = icmp uge i32 %y, %y
11   %d = extractelement <4 x i32> %b, i1 %c
12   ret i32 %d
15 define i8 @extractelt_bitcast(i32 %x) nounwind {
16 ; X86-LABEL: extractelt_bitcast:
17 ; X86:       # %bb.0:
18 ; X86-NEXT:    movb {{[0-9]+}}(%esp), %al
19 ; X86-NEXT:    retl
21 ; X64-LABEL: extractelt_bitcast:
22 ; X64:       # %bb.0:
23 ; X64-NEXT:    movl %edi, %eax
24 ; X64-NEXT:    # kill: def $al killed $al killed $eax
25 ; X64-NEXT:    retq
26   %bc = bitcast i32 %x to <4 x i8>
27   %ext = extractelement <4 x i8> %bc, i32 0
28   ret i8 %ext
31 ; TODO: This should have folded to avoid vector ops, but the transform
32 ; is guarded by 'hasOneUse'. That limitation apparently makes some AMDGPU
33 ; codegen better.
35 define i8 @extractelt_bitcast_extra_use(i32 %x, <4 x i8>* %p) nounwind {
36 ; X86-LABEL: extractelt_bitcast_extra_use:
37 ; X86:       # %bb.0:
38 ; X86-NEXT:    pushl %eax
39 ; X86-NEXT:    movl {{[0-9]+}}(%esp), %eax
40 ; X86-NEXT:    movd %eax, %xmm0
41 ; X86-NEXT:    punpcklbw {{.*#+}} xmm0 = xmm0[0,0,1,1,2,2,3,3,4,4,5,5,6,6,7,7]
42 ; X86-NEXT:    movl {{[0-9]+}}(%esp), %ecx
43 ; X86-NEXT:    movl %eax, (%ecx)
44 ; X86-NEXT:    movd %xmm0, %eax
45 ; X86-NEXT:    # kill: def $al killed $al killed $eax
46 ; X86-NEXT:    popl %ecx
47 ; X86-NEXT:    retl
49 ; X64-LABEL: extractelt_bitcast_extra_use:
50 ; X64:       # %bb.0:
51 ; X64-NEXT:    movd %edi, %xmm0
52 ; X64-NEXT:    punpcklbw {{.*#+}} xmm0 = xmm0[0,0,1,1,2,2,3,3,4,4,5,5,6,6,7,7]
53 ; X64-NEXT:    movl %edi, (%rsi)
54 ; X64-NEXT:    movd %xmm0, %eax
55 ; X64-NEXT:    # kill: def $al killed $al killed $eax
56 ; X64-NEXT:    retq
57   %bc = bitcast i32 %x to <4 x i8>
58   store <4 x i8> %bc, <4 x i8>* %p
59   %ext = extractelement <4 x i8> %bc, i32 0
60   ret i8 %ext
63 define i32 @trunc_i64_to_i32_le(i64 %x) {
64 ; X86-LABEL: trunc_i64_to_i32_le:
65 ; X86:       # %bb.0:
66 ; X86-NEXT:    movl {{[0-9]+}}(%esp), %eax
67 ; X86-NEXT:    retl
69 ; X64-LABEL: trunc_i64_to_i32_le:
70 ; X64:       # %bb.0:
71 ; X64-NEXT:    movq %rdi, %rax
72 ; X64-NEXT:    # kill: def $eax killed $eax killed $rax
73 ; X64-NEXT:    retq
74   %ins = insertelement <2 x i64> undef, i64 %x, i32 0
75   %bc = bitcast <2 x i64> %ins to <4 x i32>
76   %ext = extractelement <4 x i32> %bc, i32 0
77   ret i32 %ext
80 define i16 @trunc_i64_to_i16_le(i64 %x) {
81 ; X86-LABEL: trunc_i64_to_i16_le:
82 ; X86:       # %bb.0:
83 ; X86-NEXT:    movl {{[0-9]+}}(%esp), %eax
84 ; X86-NEXT:    # kill: def $ax killed $ax killed $eax
85 ; X86-NEXT:    retl
87 ; X64-LABEL: trunc_i64_to_i16_le:
88 ; X64:       # %bb.0:
89 ; X64-NEXT:    movq %rdi, %rax
90 ; X64-NEXT:    # kill: def $ax killed $ax killed $rax
91 ; X64-NEXT:    retq
92   %ins = insertelement <2 x i64> undef, i64 %x, i32 0
93   %bc = bitcast <2 x i64> %ins to <8 x i16>
94   %ext = extractelement <8 x i16> %bc, i32 0
95   ret i16 %ext
98 define i8 @trunc_i32_to_i8_le(i32 %x) {
99 ; X86-LABEL: trunc_i32_to_i8_le:
100 ; X86:       # %bb.0:
101 ; X86-NEXT:    movb {{[0-9]+}}(%esp), %al
102 ; X86-NEXT:    retl
104 ; X64-LABEL: trunc_i32_to_i8_le:
105 ; X64:       # %bb.0:
106 ; X64-NEXT:    movl %edi, %eax
107 ; X64-NEXT:    # kill: def $al killed $al killed $eax
108 ; X64-NEXT:    retq
109   %ins = insertelement <4 x i32> undef, i32 %x, i32 0
110   %bc = bitcast <4 x i32> %ins to <16 x i8>
111   %ext = extractelement <16 x i8> %bc, i32 0
112   ret i8 %ext