Revert r354244 "[DAGCombiner] Eliminate dead stores to stack."
[llvm-complete.git] / test / CodeGen / X86 / sdiv-exact.ll
blobc19ae822d7173d21aefad6a1e5260928048afec5
1 ; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
2 ; RUN: llc < %s -mtriple=i686-unknown -mattr=+sse2 | FileCheck %s --check-prefix=X86
3 ; RUN: llc < %s -mtriple=x86_64-unknown -mattr=+avx2 | FileCheck %s --check-prefix=X64
5 define i32 @test1(i32 %x) {
6 ; X86-LABEL: test1:
7 ; X86:       # %bb.0:
8 ; X86-NEXT:    imull $-1030792151, {{[0-9]+}}(%esp), %eax # imm = 0xC28F5C29
9 ; X86-NEXT:    retl
11 ; X64-LABEL: test1:
12 ; X64:       # %bb.0:
13 ; X64-NEXT:    imull $-1030792151, %edi, %eax # imm = 0xC28F5C29
14 ; X64-NEXT:    retq
15   %div = sdiv exact i32 %x, 25
16   ret i32 %div
19 define i32 @test2(i32 %x) {
20 ; X86-LABEL: test2:
21 ; X86:       # %bb.0:
22 ; X86-NEXT:    movl {{[0-9]+}}(%esp), %eax
23 ; X86-NEXT:    sarl $3, %eax
24 ; X86-NEXT:    imull $-1431655765, %eax, %eax # imm = 0xAAAAAAAB
25 ; X86-NEXT:    retl
27 ; X64-LABEL: test2:
28 ; X64:       # %bb.0:
29 ; X64-NEXT:    sarl $3, %edi
30 ; X64-NEXT:    imull $-1431655765, %edi, %eax # imm = 0xAAAAAAAB
31 ; X64-NEXT:    retq
32   %div = sdiv exact i32 %x, 24
33   ret i32 %div
36 define <4 x i32> @test3(<4 x i32> %x) {
37 ; X86-LABEL: test3:
38 ; X86:       # %bb.0:
39 ; X86-NEXT:    psrad $3, %xmm0
40 ; X86-NEXT:    movdqa {{.*#+}} xmm1 = [2863311531,2863311531,2863311531,2863311531]
41 ; X86-NEXT:    pshufd {{.*#+}} xmm2 = xmm0[1,1,3,3]
42 ; X86-NEXT:    pmuludq %xmm1, %xmm0
43 ; X86-NEXT:    pshufd {{.*#+}} xmm0 = xmm0[0,2,2,3]
44 ; X86-NEXT:    pmuludq %xmm1, %xmm2
45 ; X86-NEXT:    pshufd {{.*#+}} xmm1 = xmm2[0,2,2,3]
46 ; X86-NEXT:    punpckldq {{.*#+}} xmm0 = xmm0[0],xmm1[0],xmm0[1],xmm1[1]
47 ; X86-NEXT:    retl
49 ; X64-LABEL: test3:
50 ; X64:       # %bb.0:
51 ; X64-NEXT:    vpsrad $3, %xmm0, %xmm0
52 ; X64-NEXT:    vpbroadcastd {{.*#+}} xmm1 = [2863311531,2863311531,2863311531,2863311531]
53 ; X64-NEXT:    vpmulld %xmm1, %xmm0, %xmm0
54 ; X64-NEXT:    retq
55   %div = sdiv exact <4 x i32> %x, <i32 24, i32 24, i32 24, i32 24>
56   ret <4 x i32> %div
59 define <4 x i32> @test4(<4 x i32> %x) {
60 ; X86-LABEL: test4:
61 ; X86:       # %bb.0:
62 ; X86-NEXT:    movdqa {{.*#+}} xmm1 = [3264175145,3264175145,3264175145,3264175145]
63 ; X86-NEXT:    pshufd {{.*#+}} xmm2 = xmm0[1,1,3,3]
64 ; X86-NEXT:    pmuludq %xmm1, %xmm0
65 ; X86-NEXT:    pshufd {{.*#+}} xmm0 = xmm0[0,2,2,3]
66 ; X86-NEXT:    pmuludq %xmm1, %xmm2
67 ; X86-NEXT:    pshufd {{.*#+}} xmm1 = xmm2[0,2,2,3]
68 ; X86-NEXT:    punpckldq {{.*#+}} xmm0 = xmm0[0],xmm1[0],xmm0[1],xmm1[1]
69 ; X86-NEXT:    retl
71 ; X64-LABEL: test4:
72 ; X64:       # %bb.0:
73 ; X64-NEXT:    vpbroadcastd {{.*#+}} xmm1 = [3264175145,3264175145,3264175145,3264175145]
74 ; X64-NEXT:    vpmulld %xmm1, %xmm0, %xmm0
75 ; X64-NEXT:    retq
76   %div = sdiv exact <4 x i32> %x, <i32 25, i32 25, i32 25, i32 25>
77   ret <4 x i32> %div
80 define <4 x i32> @test5(<4 x i32> %x) {
81 ; X86-LABEL: test5:
82 ; X86:       # %bb.0:
83 ; X86-NEXT:    movdqa %xmm0, %xmm1
84 ; X86-NEXT:    psrad $3, %xmm1
85 ; X86-NEXT:    movsd {{.*#+}} xmm0 = xmm1[0],xmm0[1]
86 ; X86-NEXT:    movdqa {{.*#+}} xmm2 = [2863311531,2863311531,3264175145,3264175145]
87 ; X86-NEXT:    movapd %xmm0, %xmm1
88 ; X86-NEXT:    pmuludq %xmm2, %xmm1
89 ; X86-NEXT:    pshufd {{.*#+}} xmm1 = xmm1[0,2,2,3]
90 ; X86-NEXT:    shufps {{.*#+}} xmm0 = xmm0[1,1,3,3]
91 ; X86-NEXT:    pshufd {{.*#+}} xmm2 = xmm2[1,1,3,3]
92 ; X86-NEXT:    pmuludq %xmm0, %xmm2
93 ; X86-NEXT:    pshufd {{.*#+}} xmm0 = xmm2[0,2,2,3]
94 ; X86-NEXT:    punpckldq {{.*#+}} xmm1 = xmm1[0],xmm0[0],xmm1[1],xmm0[1]
95 ; X86-NEXT:    movdqa %xmm1, %xmm0
96 ; X86-NEXT:    retl
98 ; X64-LABEL: test5:
99 ; X64:       # %bb.0:
100 ; X64-NEXT:    vpsravd {{.*}}(%rip), %xmm0, %xmm0
101 ; X64-NEXT:    vpmulld {{.*}}(%rip), %xmm0, %xmm0
102 ; X64-NEXT:    retq
103   %div = sdiv exact <4 x i32> %x, <i32 24, i32 24, i32 25, i32 25>
104   ret <4 x i32> %div
107 define <4 x i32> @test6(<4 x i32> %x) {
108 ; X86-LABEL: test6:
109 ; X86:       # %bb.0:
110 ; X86-NEXT:    movdqa %xmm0, %xmm1
111 ; X86-NEXT:    psrad $3, %xmm1
112 ; X86-NEXT:    psrad $1, %xmm0
113 ; X86-NEXT:    movsd {{.*#+}} xmm0 = xmm1[0],xmm0[1]
114 ; X86-NEXT:    movdqa {{.*#+}} xmm2 = [2863311531,2863311531,3303820997,3303820997]
115 ; X86-NEXT:    movapd %xmm0, %xmm1
116 ; X86-NEXT:    pmuludq %xmm2, %xmm1
117 ; X86-NEXT:    pshufd {{.*#+}} xmm1 = xmm1[0,2,2,3]
118 ; X86-NEXT:    shufps {{.*#+}} xmm0 = xmm0[1,1,3,3]
119 ; X86-NEXT:    pshufd {{.*#+}} xmm2 = xmm2[1,1,3,3]
120 ; X86-NEXT:    pmuludq %xmm0, %xmm2
121 ; X86-NEXT:    pshufd {{.*#+}} xmm0 = xmm2[0,2,2,3]
122 ; X86-NEXT:    punpckldq {{.*#+}} xmm1 = xmm1[0],xmm0[0],xmm1[1],xmm0[1]
123 ; X86-NEXT:    movdqa %xmm1, %xmm0
124 ; X86-NEXT:    retl
126 ; X64-LABEL: test6:
127 ; X64:       # %bb.0:
128 ; X64-NEXT:    vpsravd {{.*}}(%rip), %xmm0, %xmm0
129 ; X64-NEXT:    vpmulld {{.*}}(%rip), %xmm0, %xmm0
130 ; X64-NEXT:    retq
131   %div = sdiv exact <4 x i32> %x, <i32 24, i32 24, i32 26, i32 26>
132   ret <4 x i32> %div
135 define <4 x i32> @test7(<4 x i32> %x) {
136 ; X86-LABEL: test7:
137 ; X86:       # %bb.0:
138 ; X86-NEXT:    movdqa {{.*#+}} xmm1 = [3264175145,3264175145,1749801491,1749801491]
139 ; X86-NEXT:    pshufd {{.*#+}} xmm2 = xmm0[1,1,3,3]
140 ; X86-NEXT:    pmuludq %xmm1, %xmm0
141 ; X86-NEXT:    pshufd {{.*#+}} xmm0 = xmm0[0,2,2,3]
142 ; X86-NEXT:    pshufd {{.*#+}} xmm1 = xmm1[1,1,3,3]
143 ; X86-NEXT:    pmuludq %xmm2, %xmm1
144 ; X86-NEXT:    pshufd {{.*#+}} xmm1 = xmm1[0,2,2,3]
145 ; X86-NEXT:    punpckldq {{.*#+}} xmm0 = xmm0[0],xmm1[0],xmm0[1],xmm1[1]
146 ; X86-NEXT:    retl
148 ; X64-LABEL: test7:
149 ; X64:       # %bb.0:
150 ; X64-NEXT:    vpmulld {{.*}}(%rip), %xmm0, %xmm0
151 ; X64-NEXT:    retq
152   %div = sdiv exact <4 x i32> %x, <i32 25, i32 25, i32 27, i32 27>
153   ret <4 x i32> %div
156 define <4 x i32> @test8(<4 x i32> %x) {
157 ; X86-LABEL: test8:
158 ; X86:       # %bb.0:
159 ; X86-NEXT:    movdqa %xmm0, %xmm1
160 ; X86-NEXT:    psrad $3, %xmm1
161 ; X86-NEXT:    movsd {{.*#+}} xmm1 = xmm0[0],xmm1[1]
162 ; X86-NEXT:    movdqa {{.*#+}} xmm2 = [1,1,2863311531,2863311531]
163 ; X86-NEXT:    movapd %xmm1, %xmm0
164 ; X86-NEXT:    pmuludq %xmm2, %xmm0
165 ; X86-NEXT:    pshufd {{.*#+}} xmm0 = xmm0[0,2,2,3]
166 ; X86-NEXT:    shufps {{.*#+}} xmm1 = xmm1[1,1,3,3]
167 ; X86-NEXT:    pshufd {{.*#+}} xmm2 = xmm2[1,1,3,3]
168 ; X86-NEXT:    pmuludq %xmm1, %xmm2
169 ; X86-NEXT:    pshufd {{.*#+}} xmm1 = xmm2[0,2,2,3]
170 ; X86-NEXT:    punpckldq {{.*#+}} xmm0 = xmm0[0],xmm1[0],xmm0[1],xmm1[1]
171 ; X86-NEXT:    retl
173 ; X64-LABEL: test8:
174 ; X64:       # %bb.0:
175 ; X64-NEXT:    vpsravd {{.*}}(%rip), %xmm0, %xmm0
176 ; X64-NEXT:    vpmulld {{.*}}(%rip), %xmm0, %xmm0
177 ; X64-NEXT:    retq
178   %div = sdiv exact <4 x i32> %x, <i32 1, i32 1, i32 24, i32 24>
179   ret <4 x i32> %div