Run DCE after a LoopFlatten test to reduce spurious output [nfc]
[llvm-project.git] / llvm / test / CodeGen / X86 / commute-3dnow.ll
blobdc3910920365d50ec5e1da36e95a359d2c213c04
1 ; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
2 ; RUN: llc < %s -mtriple=i686-unknown-unknown -mattr=+mmx,+3dnow | FileCheck %s --check-prefix=X86
3 ; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+mmx,+3dnow | FileCheck %s --check-prefix=X64
5 define void @commute_m_pfadd(ptr%a0, ptr%a1, ptr%a2) nounwind {
6 ; X86-LABEL: commute_m_pfadd:
7 ; X86:       # %bb.0:
8 ; X86-NEXT:    movl {{[0-9]+}}(%esp), %eax
9 ; X86-NEXT:    movl {{[0-9]+}}(%esp), %ecx
10 ; X86-NEXT:    movl {{[0-9]+}}(%esp), %edx
11 ; X86-NEXT:    movq (%edx), %mm0
12 ; X86-NEXT:    pfadd (%eax), %mm0
13 ; X86-NEXT:    pfadd (%ecx), %mm0
14 ; X86-NEXT:    movq %mm0, (%ecx)
15 ; X86-NEXT:    retl
17 ; X64-LABEL: commute_m_pfadd:
18 ; X64:       # %bb.0:
19 ; X64-NEXT:    movq (%rdi), %mm0
20 ; X64-NEXT:    pfadd (%rsi), %mm0
21 ; X64-NEXT:    pfadd (%rdx), %mm0
22 ; X64-NEXT:    movq %mm0, (%rdx)
23 ; X64-NEXT:    retq
24   %1 = load x86_mmx, ptr %a0
25   %2 = load x86_mmx, ptr %a1
26   %3 = load x86_mmx, ptr %a2
27   %4 = tail call x86_mmx @llvm.x86.3dnow.pfadd(x86_mmx %1, x86_mmx %2)
28   %5 = tail call x86_mmx @llvm.x86.3dnow.pfadd(x86_mmx %3, x86_mmx %4)
29   store x86_mmx %5, ptr %a2
30   ret void
32 declare x86_mmx @llvm.x86.3dnow.pfadd(x86_mmx, x86_mmx)
34 define void @commute_m_pfsub(ptr%a0, ptr%a1, ptr%a2) nounwind {
35 ; X86-LABEL: commute_m_pfsub:
36 ; X86:       # %bb.0:
37 ; X86-NEXT:    movl {{[0-9]+}}(%esp), %eax
38 ; X86-NEXT:    movl {{[0-9]+}}(%esp), %ecx
39 ; X86-NEXT:    movl {{[0-9]+}}(%esp), %edx
40 ; X86-NEXT:    movq (%edx), %mm0
41 ; X86-NEXT:    pfsub (%eax), %mm0
42 ; X86-NEXT:    pfsubr (%ecx), %mm0
43 ; X86-NEXT:    movq %mm0, (%ecx)
44 ; X86-NEXT:    retl
46 ; X64-LABEL: commute_m_pfsub:
47 ; X64:       # %bb.0:
48 ; X64-NEXT:    movq (%rdi), %mm0
49 ; X64-NEXT:    pfsub (%rsi), %mm0
50 ; X64-NEXT:    pfsubr (%rdx), %mm0
51 ; X64-NEXT:    movq %mm0, (%rdx)
52 ; X64-NEXT:    retq
53   %1 = load x86_mmx, ptr %a0
54   %2 = load x86_mmx, ptr %a1
55   %3 = load x86_mmx, ptr %a2
56   %4 = tail call x86_mmx @llvm.x86.3dnow.pfsub(x86_mmx %1, x86_mmx %2)
57   %5 = tail call x86_mmx @llvm.x86.3dnow.pfsub(x86_mmx %3, x86_mmx %4)
58   store x86_mmx %5, ptr %a2
59   ret void
61 declare x86_mmx @llvm.x86.3dnow.pfsub(x86_mmx, x86_mmx)
63 define void @commute_m_pfsubr(ptr%a0, ptr%a1, ptr%a2) nounwind {
64 ; X86-LABEL: commute_m_pfsubr:
65 ; X86:       # %bb.0:
66 ; X86-NEXT:    movl {{[0-9]+}}(%esp), %eax
67 ; X86-NEXT:    movl {{[0-9]+}}(%esp), %ecx
68 ; X86-NEXT:    movl {{[0-9]+}}(%esp), %edx
69 ; X86-NEXT:    movq (%edx), %mm0
70 ; X86-NEXT:    pfsubr (%eax), %mm0
71 ; X86-NEXT:    pfsub (%ecx), %mm0
72 ; X86-NEXT:    movq %mm0, (%ecx)
73 ; X86-NEXT:    retl
75 ; X64-LABEL: commute_m_pfsubr:
76 ; X64:       # %bb.0:
77 ; X64-NEXT:    movq (%rdi), %mm0
78 ; X64-NEXT:    pfsubr (%rsi), %mm0
79 ; X64-NEXT:    pfsub (%rdx), %mm0
80 ; X64-NEXT:    movq %mm0, (%rdx)
81 ; X64-NEXT:    retq
82   %1 = load x86_mmx, ptr %a0
83   %2 = load x86_mmx, ptr %a1
84   %3 = load x86_mmx, ptr %a2
85   %4 = tail call x86_mmx @llvm.x86.3dnow.pfsubr(x86_mmx %1, x86_mmx %2)
86   %5 = tail call x86_mmx @llvm.x86.3dnow.pfsubr(x86_mmx %3, x86_mmx %4)
87   store x86_mmx %5, ptr %a2
88   ret void
90 declare x86_mmx @llvm.x86.3dnow.pfsubr(x86_mmx, x86_mmx)
92 define void @commute_m_pfmul(ptr%a0, ptr%a1, ptr%a2) nounwind {
93 ; X86-LABEL: commute_m_pfmul:
94 ; X86:       # %bb.0:
95 ; X86-NEXT:    movl {{[0-9]+}}(%esp), %eax
96 ; X86-NEXT:    movl {{[0-9]+}}(%esp), %ecx
97 ; X86-NEXT:    movl {{[0-9]+}}(%esp), %edx
98 ; X86-NEXT:    movq (%edx), %mm0
99 ; X86-NEXT:    pfmul (%eax), %mm0
100 ; X86-NEXT:    pfmul (%ecx), %mm0
101 ; X86-NEXT:    movq %mm0, (%ecx)
102 ; X86-NEXT:    retl
104 ; X64-LABEL: commute_m_pfmul:
105 ; X64:       # %bb.0:
106 ; X64-NEXT:    movq (%rdi), %mm0
107 ; X64-NEXT:    pfmul (%rsi), %mm0
108 ; X64-NEXT:    pfmul (%rdx), %mm0
109 ; X64-NEXT:    movq %mm0, (%rdx)
110 ; X64-NEXT:    retq
111   %1 = load x86_mmx, ptr %a0
112   %2 = load x86_mmx, ptr %a1
113   %3 = load x86_mmx, ptr %a2
114   %4 = tail call x86_mmx @llvm.x86.3dnow.pfmul(x86_mmx %1, x86_mmx %2)
115   %5 = tail call x86_mmx @llvm.x86.3dnow.pfmul(x86_mmx %3, x86_mmx %4)
116   store x86_mmx %5, ptr %a2
117   ret void
119 declare x86_mmx @llvm.x86.3dnow.pfmul(x86_mmx, x86_mmx)
121 ; PFMAX can't commute without fast-math.
122 define void @commute_m_pfmax(ptr%a0, ptr%a1, ptr%a2) nounwind {
123 ; X86-LABEL: commute_m_pfmax:
124 ; X86:       # %bb.0:
125 ; X86-NEXT:    movl {{[0-9]+}}(%esp), %eax
126 ; X86-NEXT:    movl {{[0-9]+}}(%esp), %ecx
127 ; X86-NEXT:    movl {{[0-9]+}}(%esp), %edx
128 ; X86-NEXT:    movq (%edx), %mm0
129 ; X86-NEXT:    movq (%ecx), %mm1
130 ; X86-NEXT:    pfmax (%eax), %mm0
131 ; X86-NEXT:    pfmax %mm0, %mm1
132 ; X86-NEXT:    movq %mm1, (%ecx)
133 ; X86-NEXT:    retl
135 ; X64-LABEL: commute_m_pfmax:
136 ; X64:       # %bb.0:
137 ; X64-NEXT:    movq (%rdi), %mm0
138 ; X64-NEXT:    movq (%rdx), %mm1
139 ; X64-NEXT:    pfmax (%rsi), %mm0
140 ; X64-NEXT:    pfmax %mm0, %mm1
141 ; X64-NEXT:    movq %mm1, (%rdx)
142 ; X64-NEXT:    retq
143   %1 = load x86_mmx, ptr %a0
144   %2 = load x86_mmx, ptr %a1
145   %3 = load x86_mmx, ptr %a2
146   %4 = tail call x86_mmx @llvm.x86.3dnow.pfmax(x86_mmx %1, x86_mmx %2)
147   %5 = tail call x86_mmx @llvm.x86.3dnow.pfmax(x86_mmx %3, x86_mmx %4)
148   store x86_mmx %5, ptr %a2
149   ret void
151 declare x86_mmx @llvm.x86.3dnow.pfmax(x86_mmx, x86_mmx)
153 ; PFMIN can't commute without fast-math.
154 define void @commute_m_pfmin(ptr%a0, ptr%a1, ptr%a2) nounwind {
155 ; X86-LABEL: commute_m_pfmin:
156 ; X86:       # %bb.0:
157 ; X86-NEXT:    movl {{[0-9]+}}(%esp), %eax
158 ; X86-NEXT:    movl {{[0-9]+}}(%esp), %ecx
159 ; X86-NEXT:    movl {{[0-9]+}}(%esp), %edx
160 ; X86-NEXT:    movq (%edx), %mm0
161 ; X86-NEXT:    movq (%ecx), %mm1
162 ; X86-NEXT:    pfmin (%eax), %mm0
163 ; X86-NEXT:    pfmin %mm0, %mm1
164 ; X86-NEXT:    movq %mm1, (%ecx)
165 ; X86-NEXT:    retl
167 ; X64-LABEL: commute_m_pfmin:
168 ; X64:       # %bb.0:
169 ; X64-NEXT:    movq (%rdi), %mm0
170 ; X64-NEXT:    movq (%rdx), %mm1
171 ; X64-NEXT:    pfmin (%rsi), %mm0
172 ; X64-NEXT:    pfmin %mm0, %mm1
173 ; X64-NEXT:    movq %mm1, (%rdx)
174 ; X64-NEXT:    retq
175   %1 = load x86_mmx, ptr %a0
176   %2 = load x86_mmx, ptr %a1
177   %3 = load x86_mmx, ptr %a2
178   %4 = tail call x86_mmx @llvm.x86.3dnow.pfmin(x86_mmx %1, x86_mmx %2)
179   %5 = tail call x86_mmx @llvm.x86.3dnow.pfmin(x86_mmx %3, x86_mmx %4)
180   store x86_mmx %5, ptr %a2
181   ret void
183 declare x86_mmx @llvm.x86.3dnow.pfmin(x86_mmx, x86_mmx)
185 define void @commute_m_pfcmpeq(ptr%a0, ptr%a1, ptr%a2) nounwind {
186 ; X86-LABEL: commute_m_pfcmpeq:
187 ; X86:       # %bb.0:
188 ; X86-NEXT:    movl {{[0-9]+}}(%esp), %eax
189 ; X86-NEXT:    movl {{[0-9]+}}(%esp), %ecx
190 ; X86-NEXT:    movl {{[0-9]+}}(%esp), %edx
191 ; X86-NEXT:    movq (%edx), %mm0
192 ; X86-NEXT:    pfcmpeq (%eax), %mm0
193 ; X86-NEXT:    pfcmpeq (%ecx), %mm0
194 ; X86-NEXT:    movq %mm0, (%ecx)
195 ; X86-NEXT:    retl
197 ; X64-LABEL: commute_m_pfcmpeq:
198 ; X64:       # %bb.0:
199 ; X64-NEXT:    movq (%rdi), %mm0
200 ; X64-NEXT:    pfcmpeq (%rsi), %mm0
201 ; X64-NEXT:    pfcmpeq (%rdx), %mm0
202 ; X64-NEXT:    movq %mm0, (%rdx)
203 ; X64-NEXT:    retq
204   %1 = load x86_mmx, ptr %a0
205   %2 = load x86_mmx, ptr %a1
206   %3 = load x86_mmx, ptr %a2
207   %4 = tail call x86_mmx @llvm.x86.3dnow.pfcmpeq(x86_mmx %1, x86_mmx %2)
208   %5 = tail call x86_mmx @llvm.x86.3dnow.pfcmpeq(x86_mmx %3, x86_mmx %4)
209   store x86_mmx %5, ptr %a2
210   ret void
212 declare x86_mmx @llvm.x86.3dnow.pfcmpeq(x86_mmx, x86_mmx)
214 define void @commute_m_pavgusb(ptr%a0, ptr%a1, ptr%a2) nounwind {
215 ; X86-LABEL: commute_m_pavgusb:
216 ; X86:       # %bb.0:
217 ; X86-NEXT:    movl {{[0-9]+}}(%esp), %eax
218 ; X86-NEXT:    movl {{[0-9]+}}(%esp), %ecx
219 ; X86-NEXT:    movl {{[0-9]+}}(%esp), %edx
220 ; X86-NEXT:    movq (%edx), %mm0
221 ; X86-NEXT:    pavgusb (%eax), %mm0
222 ; X86-NEXT:    pavgusb (%ecx), %mm0
223 ; X86-NEXT:    movq %mm0, (%ecx)
224 ; X86-NEXT:    retl
226 ; X64-LABEL: commute_m_pavgusb:
227 ; X64:       # %bb.0:
228 ; X64-NEXT:    movq (%rdi), %mm0
229 ; X64-NEXT:    pavgusb (%rsi), %mm0
230 ; X64-NEXT:    pavgusb (%rdx), %mm0
231 ; X64-NEXT:    movq %mm0, (%rdx)
232 ; X64-NEXT:    retq
233   %1 = load x86_mmx, ptr %a0
234   %2 = load x86_mmx, ptr %a1
235   %3 = load x86_mmx, ptr %a2
236   %4 = tail call x86_mmx @llvm.x86.3dnow.pavgusb(x86_mmx %1, x86_mmx %2)
237   %5 = tail call x86_mmx @llvm.x86.3dnow.pavgusb(x86_mmx %3, x86_mmx %4)
238   store x86_mmx %5, ptr %a2
239   ret void
241 declare x86_mmx @llvm.x86.3dnow.pavgusb(x86_mmx, x86_mmx)
243 define void @commute_m_pmulhrw(ptr%a0, ptr%a1, ptr%a2) nounwind {
244 ; X86-LABEL: commute_m_pmulhrw:
245 ; X86:       # %bb.0:
246 ; X86-NEXT:    movl {{[0-9]+}}(%esp), %eax
247 ; X86-NEXT:    movl {{[0-9]+}}(%esp), %ecx
248 ; X86-NEXT:    movl {{[0-9]+}}(%esp), %edx
249 ; X86-NEXT:    movq (%edx), %mm0
250 ; X86-NEXT:    pmulhrw (%eax), %mm0
251 ; X86-NEXT:    pmulhrw (%ecx), %mm0
252 ; X86-NEXT:    movq %mm0, (%ecx)
253 ; X86-NEXT:    retl
255 ; X64-LABEL: commute_m_pmulhrw:
256 ; X64:       # %bb.0:
257 ; X64-NEXT:    movq (%rdi), %mm0
258 ; X64-NEXT:    pmulhrw (%rsi), %mm0
259 ; X64-NEXT:    pmulhrw (%rdx), %mm0
260 ; X64-NEXT:    movq %mm0, (%rdx)
261 ; X64-NEXT:    retq
262   %1 = load x86_mmx, ptr %a0
263   %2 = load x86_mmx, ptr %a1
264   %3 = load x86_mmx, ptr %a2
265   %4 = tail call x86_mmx @llvm.x86.3dnow.pmulhrw(x86_mmx %1, x86_mmx %2)
266   %5 = tail call x86_mmx @llvm.x86.3dnow.pmulhrw(x86_mmx %3, x86_mmx %4)
267   store x86_mmx %5, ptr %a2
268   ret void
270 declare x86_mmx @llvm.x86.3dnow.pmulhrw(x86_mmx, x86_mmx)