Run DCE after a LoopFlatten test to reduce spurious output [nfc]
[llvm-project.git] / llvm / test / CodeGen / AArch64 / machine-combiner-instr-fmf.mir
blob4557c44a6ed88e9d98ce678f68131739a9d96aa8
1 # RUN: llc -run-pass=machine-combiner -o - -simplify-mir -mtriple=arm64-apple-iphoneos %s | FileCheck %s
3 # Can create FMADD, because both the fmul and fadd have all fast-math flags.
5 # CHECK-LABEL: name: scalar_fmadd_fast
6 # CHECK:        [[C:%.*]]:fpr32 = COPY $s2
7 # CHECK-NEXT:   [[B:%.*]]:fpr32 = COPY $s1
8 # CHECK-NEXT:   [[A:%.*]]:fpr32 = COPY $s0
9 # CHECK-NEXT:   :fpr32 = nnan ninf nsz arcp contract afn reassoc FMADDSrrr [[B]], [[A]], [[C]], implicit $fpcr
10 ---
11 name:            scalar_fmadd_fast
12 alignment:       4
13 tracksRegLiveness: true
14 registers:
15   - { id: 0, class: fpr32 }
16   - { id: 1, class: fpr32 }
17   - { id: 2, class: fpr32 }
18   - { id: 3, class: fpr32 }
19   - { id: 4, class: fpr32 }
20 liveins:
21   - { reg: '$s0', virtual-reg: '%0' }
22   - { reg: '$s1', virtual-reg: '%1' }
23   - { reg: '$s2', virtual-reg: '%2' }
24 frameInfo:
25   maxAlignment:    1
26   maxCallFrameSize: 0
27 machineFunctionInfo: {}
28 body:             |
29   bb.0.entry:
30     liveins: $s0, $s1, $s2
32     %2:fpr32 = COPY $s2
33     %1:fpr32 = COPY $s1
34     %0:fpr32 = COPY $s0
35     %3:fpr32 = nnan ninf nsz arcp contract afn reassoc FMULSrr %1, %0, implicit $fpcr
36     %4:fpr32 = nnan ninf nsz arcp contract afn reassoc FADDSrr killed %3, %2, implicit $fpcr
37     $s0 = COPY %4
38     RET_ReallyLR implicit $s0
40 ...
42 # Can create FMADD, because both the fmul and fadd have the contract fast-math flag.
44 # CHECK-LABEL: name: scalar_fmadd_contract
45 # CHECK:        [[C:%.*]]:fpr32 = COPY $s2
46 # CHECK-NEXT:   [[B:%.*]]:fpr32 = COPY $s1
47 # CHECK-NEXT:   [[A:%.*]]:fpr32 = COPY $s0
48 # CHECK-NEXT:   :fpr32 = contract FMADDSrrr [[B]], [[A]], [[C]], implicit $fpcr
50 ---
51 name:            scalar_fmadd_contract
52 alignment:       4
53 tracksRegLiveness: true
54 registers:
55   - { id: 0, class: fpr32 }
56   - { id: 1, class: fpr32 }
57   - { id: 2, class: fpr32 }
58   - { id: 3, class: fpr32 }
59   - { id: 4, class: fpr32 }
60 liveins:
61   - { reg: '$s0', virtual-reg: '%0' }
62   - { reg: '$s1', virtual-reg: '%1' }
63   - { reg: '$s2', virtual-reg: '%2' }
64 frameInfo:
65   maxAlignment:    1
66   maxCallFrameSize: 0
67 machineFunctionInfo: {}
68 body:             |
69   bb.0.entry:
70     liveins: $s0, $s1, $s2
72     %2:fpr32 = COPY $s2
73     %1:fpr32 = COPY $s1
74     %0:fpr32 = COPY $s0
75     %3:fpr32 = contract FMULSrr %1, %0, implicit $fpcr
76     %4:fpr32 = contract FADDSrr killed %3, %2, implicit $fpcr
77     $s0 = COPY %4
78     RET_ReallyLR implicit $s0
80 ...
82 # Do not create FMADD, because we don't have the contract flag on the FADD.
84 # CHECK-LABEL: name: scalar_fmadd_contract_op0
85 # CHECK:        [[C:%.*]]:fpr32 = COPY $s2
86 # CHECK-NEXT:   [[B:%.*]]:fpr32 = COPY $s1
87 # CHECK-NEXT:   [[A:%.*]]:fpr32 = COPY $s0
88 # CHECK-NEXT:   [[MUL:%.*]]:fpr32 = contract FMULSrr [[B]], [[A]], implicit $fpcr
89 # CHECK-NEXT:   fpr32 = FADDSrr killed [[MUL]], [[C]], implicit $fpcr
90 ---
91 name:            scalar_fmadd_contract_op0
92 alignment:       4
93 tracksRegLiveness: true
94 registers:
95   - { id: 0, class: fpr32 }
96   - { id: 1, class: fpr32 }
97   - { id: 2, class: fpr32 }
98   - { id: 3, class: fpr32 }
99   - { id: 4, class: fpr32 }
100 liveins:
101   - { reg: '$s0', virtual-reg: '%0' }
102   - { reg: '$s1', virtual-reg: '%1' }
103   - { reg: '$s2', virtual-reg: '%2' }
104 frameInfo:
105   maxAlignment:    1
106   maxCallFrameSize: 0
107 machineFunctionInfo: {}
108 body:             |
109   bb.0.entry:
110     liveins: $s0, $s1, $s2
112     %2:fpr32 = COPY $s2
113     %1:fpr32 = COPY $s1
114     %0:fpr32 = COPY $s0
115     %3:fpr32 = contract FMULSrr %1, %0, implicit $fpcr
116     %4:fpr32 = FADDSrr killed %3, %2, implicit $fpcr
117     $s0 = COPY %4
118     RET_ReallyLR implicit $s0
122 # Do create FMADD, because we have the contract flag on the FADD.
124 # CHECK-LABEL: name: scalar_fmadd_contract_op1
125 # CHECK:        [[C:%.*]]:fpr32 = COPY $s2
126 # CHECK-NEXT:   [[B:%.*]]:fpr32 = COPY $s1
127 # CHECK-NEXT:   [[A:%.*]]:fpr32 = COPY $s0
128 # CHECK-NEXT:   :fpr32 = contract FMADDSrrr [[B]], [[A]], [[C]], implicit $fpcr
131 name:            scalar_fmadd_contract_op1
132 alignment:       4
133 tracksRegLiveness: true
134 registers:
135   - { id: 0, class: fpr32 }
136   - { id: 1, class: fpr32 }
137   - { id: 2, class: fpr32 }
138   - { id: 3, class: fpr32 }
139   - { id: 4, class: fpr32 }
140 liveins:
141   - { reg: '$s0', virtual-reg: '%0' }
142   - { reg: '$s1', virtual-reg: '%1' }
143   - { reg: '$s2', virtual-reg: '%2' }
144 frameInfo:
145   maxAlignment:    1
146   maxCallFrameSize: 0
147 machineFunctionInfo: {}
148 body:             |
149   bb.0.entry:
150     liveins: $s0, $s1, $s2
152     %2:fpr32 = COPY $s2
153     %1:fpr32 = COPY $s1
154     %0:fpr32 = COPY $s0
155     %3:fpr32 = FMULSrr %1, %0, implicit $fpcr
156     %4:fpr32 = contract FADDSrr killed %3, %2, implicit $fpcr
157     $s0 = COPY %4
158     RET_ReallyLR implicit $s0
162 # Do not create FMADD, as nsz flag does not allow it.
164 # CHECK-LABEL: name: scalar_fmadd_nsz
165 # CHECK:        [[C:%.*]]:fpr32 = COPY $s2
166 # CHECK-NEXT:   [[B:%.*]]:fpr32 = COPY $s1
167 # CHECK-NEXT:   [[A:%.*]]:fpr32 = COPY $s0
168 # CHECK-NEXT:   [[MUL:%.*]]:fpr32 = nsz FMULSrr [[B]], [[A]], implicit $fpcr
169 # CHECK-NEXT:   fpr32 = nsz FADDSrr killed [[MUL]], [[C]], implicit $fpcr
172 name:            scalar_fmadd_nsz
173 alignment:       4
174 tracksRegLiveness: true
175 registers:
176   - { id: 0, class: fpr32 }
177   - { id: 1, class: fpr32 }
178   - { id: 2, class: fpr32 }
179   - { id: 3, class: fpr32 }
180   - { id: 4, class: fpr32 }
181 liveins:
182   - { reg: '$s0', virtual-reg: '%0' }
183   - { reg: '$s1', virtual-reg: '%1' }
184   - { reg: '$s2', virtual-reg: '%2' }
185 frameInfo:
186   maxAlignment:    1
187   maxCallFrameSize: 0
188 machineFunctionInfo: {}
189 body:             |
190   bb.0.entry:
191     liveins: $s0, $s1, $s2
193     %2:fpr32 = COPY $s2
194     %1:fpr32 = COPY $s1
195     %0:fpr32 = COPY $s0
196     %3:fpr32 = nsz FMULSrr %1, %0, implicit $fpcr
197     %4:fpr32 = nsz FADDSrr killed %3, %2, implicit $fpcr
198     $s0 = COPY %4
199     RET_ReallyLR implicit $s0
203 # Can create FMLA, because both the fmul and fadd have all fast-math flags.
205 # CHECK-LABEL: name: vector_fmadd_fast
206 # CHECK:       [[C:%.*]]:fpr128 = COPY $q2
207 # CHECK-NEXT:  [[B:%.*]]:fpr128 = COPY $q1
208 # CHECK-NEXT:  [[A:%.*]]:fpr128 = COPY $q0
209 # CHECK-NEXT:  fpr128 = nnan ninf nsz arcp contract afn reassoc FMLAv2f64 [[C]], [[B]], [[A]], implicit $fpcr
211 name:            vector_fmadd_fast
212 alignment:       4
213 tracksRegLiveness: true
214 registers:
215   - { id: 0, class: fpr128 }
216   - { id: 1, class: fpr128 }
217   - { id: 2, class: fpr128 }
218   - { id: 3, class: fpr128 }
219   - { id: 4, class: fpr128 }
220 liveins:
221   - { reg: '$q0', virtual-reg: '%0' }
222   - { reg: '$q1', virtual-reg: '%1' }
223   - { reg: '$q2', virtual-reg: '%2' }
224 frameInfo:
225   maxAlignment:    1
226   maxCallFrameSize: 0
227 machineFunctionInfo: {}
228 body:             |
229   bb.0.entry:
230     liveins: $q0, $q1, $q2
232     %2:fpr128 = COPY $q2
233     %1:fpr128 = COPY $q1
234     %0:fpr128 = COPY $q0
235     %3:fpr128 = nnan ninf nsz arcp contract afn reassoc FMULv2f64 %1, %0, implicit $fpcr
236     %4:fpr128 = nnan ninf nsz arcp contract afn reassoc FADDv2f64 killed %3, %2, implicit $fpcr
237     $q0 = COPY %4
238     RET_ReallyLR implicit $q0
242 # Can create FMLA, because both the fmul and fadd have the contract fast-math flag.
244 # CHECK-LABEL: name: vector_fmadd_contract
245 # CHECK:       [[C:%.*]]:fpr128 = COPY $q2
246 # CHECK-NEXT:  [[B:%.*]]:fpr128 = COPY $q1
247 # CHECK-NEXT:  [[A:%.*]]:fpr128 = COPY $q0
248 # CHECK-NEXT:  fpr128 = contract FMLAv2f64 [[C]], [[B]], [[A]], implicit $fpcr
250 name:            vector_fmadd_contract
251 alignment:       4
252 tracksRegLiveness: true
253 registers:
254   - { id: 0, class: fpr128 }
255   - { id: 1, class: fpr128 }
256   - { id: 2, class: fpr128 }
257   - { id: 3, class: fpr128 }
258   - { id: 4, class: fpr128 }
259 liveins:
260   - { reg: '$q0', virtual-reg: '%0' }
261   - { reg: '$q1', virtual-reg: '%1' }
262   - { reg: '$q2', virtual-reg: '%2' }
263 frameInfo:
264   maxAlignment:    1
265   maxCallFrameSize: 0
266 machineFunctionInfo: {}
267 body:             |
268   bb.0.entry:
269     liveins: $q0, $q1, $q2
271     %2:fpr128 = COPY $q2
272     %1:fpr128 = COPY $q1
273     %0:fpr128 = COPY $q0
274     %3:fpr128 = contract FMULv2f64 %1, %0, implicit $fpcr
275     %4:fpr128 = contract FADDv2f64 killed %3, %2, implicit $fpcr
276     $q0 = COPY %4
277     RET_ReallyLR implicit $q0
281 # Do not create FMLA, because we don't have the contract flag on the FADD.
283 # CHECK-LABEL: name: vector_fmadd_contract_op0
284 # CHECK:       [[C:%.*]]:fpr128 = COPY $q2
285 # CHECK-NEXT:  [[B:%.*]]:fpr128 = COPY $q1
286 # CHECK-NEXT:  [[A:%.*]]:fpr128 = COPY $q0
287 # CHECK-NEXT:  [[MUL:%.*]]:fpr128 = contract FMULv2f64 [[B]], [[A]], implicit $fpcr
288 # CHECK-NEXT:  fpr128 = FADDv2f64 killed [[MUL]], [[C]], implicit $fpcr
290 name:            vector_fmadd_contract_op0
291 alignment:       4
292 tracksRegLiveness: true
293 registers:
294   - { id: 0, class: fpr128 }
295   - { id: 1, class: fpr128 }
296   - { id: 2, class: fpr128 }
297   - { id: 3, class: fpr128 }
298   - { id: 4, class: fpr128 }
299 liveins:
300   - { reg: '$q0', virtual-reg: '%0' }
301   - { reg: '$q1', virtual-reg: '%1' }
302   - { reg: '$q2', virtual-reg: '%2' }
303 frameInfo:
304   maxAlignment:    1
305   maxCallFrameSize: 0
306 machineFunctionInfo: {}
307 body:             |
308   bb.0.entry:
309     liveins: $q0, $q1, $q2
311     %2:fpr128 = COPY $q2
312     %1:fpr128 = COPY $q1
313     %0:fpr128 = COPY $q0
314     %3:fpr128 = contract FMULv2f64 %1, %0, implicit $fpcr
315     %4:fpr128 = FADDv2f64 killed %3, %2, implicit $fpcr
316     $q0 = COPY %4
317     RET_ReallyLR implicit $q0
321 # Do create FMLA, because we have the contract flag on the FADD.
323 # CHECK-LABEL: name: vector_fmadd_contract_op1
324 # CHECK:       [[C:%.*]]:fpr128 = COPY $q2
325 # CHECK-NEXT:  [[B:%.*]]:fpr128 = COPY $q1
326 # CHECK-NEXT:  [[A:%.*]]:fpr128 = COPY $q0
327 # CHECK-NEXT:  fpr128 = contract FMLAv2f64 [[C]], [[B]], [[A]], implicit $fpcr
330 name:            vector_fmadd_contract_op1
331 alignment:       4
332 tracksRegLiveness: true
333 registers:
334   - { id: 0, class: fpr128 }
335   - { id: 1, class: fpr128 }
336   - { id: 2, class: fpr128 }
337   - { id: 3, class: fpr128 }
338   - { id: 4, class: fpr128 }
339 liveins:
340   - { reg: '$q0', virtual-reg: '%0' }
341   - { reg: '$q1', virtual-reg: '%1' }
342   - { reg: '$q2', virtual-reg: '%2' }
343 frameInfo:
344   maxAlignment:    1
345   maxCallFrameSize: 0
346 machineFunctionInfo: {}
347 body:             |
348   bb.0.entry:
349     liveins: $q0, $q1, $q2
351     %2:fpr128 = COPY $q2
352     %1:fpr128 = COPY $q1
353     %0:fpr128 = COPY $q0
354     %3:fpr128 = FMULv2f64 %1, %0, implicit $fpcr
355     %4:fpr128 = contract FADDv2f64 killed %3, %2, implicit $fpcr
356     $q0 = COPY %4
357     RET_ReallyLR implicit $q0
361 # Do not create FMLA, as nsz flag does not allow it.
363 # CHECK-LABEL: name: vector_fmadd_nsz
364 # CHECK:       [[C:%.*]]:fpr128 = COPY $q2
365 # CHECK-NEXT:  [[B:%.*]]:fpr128 = COPY $q1
366 # CHECK-NEXT:  [[A:%.*]]:fpr128 = COPY $q0
367 # CHECK-NEXT:  [[MUL:%.*]]:fpr128 = nsz FMULv2f64 [[B]], [[A]], implicit $fpcr
368 # CHECK-NEXT:  fpr128 = nsz FADDv2f64 killed [[MUL]], [[C]], implicit $fpcr
370 name:            vector_fmadd_nsz
371 alignment:       4
372 tracksRegLiveness: true
373 registers:
374   - { id: 0, class: fpr128 }
375   - { id: 1, class: fpr128 }
376   - { id: 2, class: fpr128 }
377   - { id: 3, class: fpr128 }
378   - { id: 4, class: fpr128 }
379 liveins:
380   - { reg: '$q0', virtual-reg: '%0' }
381   - { reg: '$q1', virtual-reg: '%1' }
382   - { reg: '$q2', virtual-reg: '%2' }
383 frameInfo:
384   maxAlignment:    1
385   maxCallFrameSize: 0
386 machineFunctionInfo: {}
387 body:             |
388   bb.0.entry:
389     liveins: $q0, $q1, $q2
391     %2:fpr128 = COPY $q2
392     %1:fpr128 = COPY $q1
393     %0:fpr128 = COPY $q0
394     %3:fpr128 = nsz FMULv2f64 %1, %0, implicit $fpcr
395     %4:fpr128 = nsz FADDv2f64 killed %3, %2, implicit $fpcr
396     $q0 = COPY %4
397     RET_ReallyLR implicit $q0