AMDGPU: Mark test as XFAIL in expensive_checks builds
[llvm-project.git] / llvm / lib / Target / ARM / ARMSchedule.td
blobb28de7873b3059cf462253c42396289915c4a6f0
1 //===-- ARMSchedule.td - ARM Scheduling Definitions --------*- tablegen -*-===//
2 //
3 // Part of the LLVM Project, under the Apache License v2.0 with LLVM Exceptions.
4 // See https://llvm.org/LICENSE.txt for license information.
5 // SPDX-License-Identifier: Apache-2.0 WITH LLVM-exception
6 //
7 //===----------------------------------------------------------------------===//
8 //===----------------------------------------------------------------------===//
9 // Instruction scheduling annotations for in-order and out-of-order CPUs.
10 // These annotations are independent of the itinerary class defined below.
11 // Here we define the subtarget independent read/write per-operand resources.
12 // The subtarget schedule definitions will then map these to the subtarget's
13 // resource usages.
14 // For example:
15 // The instruction cycle timings table might contain an entry for an operation
16 // like the following:
17 // Rd <- ADD Rn, Rm, <shift> Rs
18 //  Uops | Latency from register | Uops - resource requirements - latency
19 //  2    | Rn: 1 Rm: 4 Rs: 4     | uop T0, Rm, Rs - P01 - 3
20 //       |                       | uopc Rd, Rn, T0 -  P01 - 1
21 // This is telling us that the result will be available in destination register
22 // Rd after a minimum of three cycles after the result in Rm and Rs is available
23 // and one cycle after the result in Rn is available. The micro-ops can execute
24 // on resource P01.
25 // To model this, we need to express that we need to dispatch two micro-ops,
26 // that the resource P01 is needed and that the latency to Rn is different than
27 // the latency to Rm and Rs. The scheduler can decrease Rn's producer latency by
28 // two.
29 // We will do this by assigning (abstract) resources to register defs/uses.
30 // ARMSchedule.td:
31 //   def WriteALUsr : SchedWrite;
32 //   def ReadAdvanceALUsr : ScheRead;
34 // ARMInstrInfo.td:
35 //   def ADDrs : I<>, Sched<[WriteALUsr, ReadAdvanceALUsr, ReadDefault,
36 //                           ReadDefault]> { ...}
37 // ReadAdvance read resources allow us to define "pipeline by-passes" or
38 // shorter latencies to certain registers as needed in the example above.
39 // The "ReadDefault" can be omitted.
40 // Next, the subtarget td file assigns resources to the abstract resources
41 // defined here.
42 // ARMScheduleSubtarget.td:
43 //  // Resources.
44 //  def P01 : ProcResource<3>; // ALU unit (3 of it).
45 //  ...
46 //  // Resource usages.
47 //  def : WriteRes<WriteALUsr, [P01, P01]> {
48 //    Latency = 4; // Latency of 4.
49 //    NumMicroOps = 2; // Dispatch 2 micro-ops.
50 //    // The two instances of resource P01 are occupied for one cycle. It is one
51 //    // cycle because these resources happen to be pipelined.
52 //    ReleaseAtCycles = [1, 1];
53 //  }
54 //  def : ReadAdvance<ReadAdvanceALUsr, 3>;
56 //===----------------------------------------------------------------------===//
57 // Sched definitions for integer pipeline instructions
59 // Basic ALU operation.
60 def WriteALU : SchedWrite;
61 def ReadALU : SchedRead;
63 // Basic ALU with shifts.
64 def WriteALUsi : SchedWrite; // Shift by immediate.
65 def WriteALUsr : SchedWrite; // Shift by register.
66 def WriteALUSsr : SchedWrite; // Shift by register (flag setting).
67 def ReadALUsr : SchedRead; // Some operands are read later.
69 // Compares.
70 def WriteCMP : SchedWrite;
71 def WriteCMPsi : SchedWrite;
72 def WriteCMPsr : SchedWrite;
74 // Multiplys.
75 def WriteMUL16   : SchedWrite; // 16-bit multiply.
76 def WriteMUL32   : SchedWrite; // 32-bit multiply.
77 def WriteMUL64Lo : SchedWrite; // 64-bit result. Low reg.
78 def WriteMUL64Hi : SchedWrite; // 64-bit result. High reg.
79 def ReadMUL  : SchedRead;
81 // Multiply-accumulates.
82 def WriteMAC16   : SchedWrite; // 16-bit mac.
83 def WriteMAC32   : SchedWrite; // 32-bit mac.
84 def WriteMAC64Lo : SchedWrite; // 64-bit mac. Low reg.
85 def WriteMAC64Hi : SchedWrite; // 64-bit mac. High reg.
86 def ReadMAC : SchedRead;
88 // Divisions.
89 def WriteDIV : SchedWrite;
91 // Loads/Stores.
92 def WriteLd : SchedWrite;
93 def WritePreLd : SchedWrite;
94 def WriteST : SchedWrite;
96 // Branches.
97 def WriteBr : SchedWrite;
98 def WriteBrL : SchedWrite;
99 def WriteBrTbl : SchedWrite;
101 // Noop.
102 def WriteNoop : SchedWrite;
104 //===----------------------------------------------------------------------===//
105 // Sched definitions for floating-point and neon instructions
107 // Floating point conversions
108 def WriteFPCVT : SchedWrite;
109 def WriteFPMOV : SchedWrite; // FP -> GPR and vice-versa
111 // ALU operations (32/64-bit)
112 def WriteFPALU32 : SchedWrite;
113 def WriteFPALU64 : SchedWrite;
115 // Multiplication
116 def WriteFPMUL32 : SchedWrite;
117 def WriteFPMUL64 : SchedWrite;
118 def ReadFPMUL    : SchedRead; // multiplier read
119 def ReadFPMAC    : SchedRead; // accumulator read
121 // Multiply-accumulate
122 def WriteFPMAC32 : SchedWrite;
123 def WriteFPMAC64 : SchedWrite;
125 // Division
126 def WriteFPDIV32 : SchedWrite;
127 def WriteFPDIV64 : SchedWrite;
129 // Square-root
130 def WriteFPSQRT32 : SchedWrite;
131 def WriteFPSQRT64 : SchedWrite;
133 // Vector load and stores
134 def WriteVLD1 : SchedWrite;
135 def WriteVLD2 : SchedWrite;
136 def WriteVLD3 : SchedWrite;
137 def WriteVLD4 : SchedWrite;
138 def WriteVST1 : SchedWrite;
139 def WriteVST2 : SchedWrite;
140 def WriteVST3 : SchedWrite;
141 def WriteVST4 : SchedWrite;
144 // Define TII for use in SchedVariant Predicates.
145 def : PredicateProlog<[{
146   const ARMBaseInstrInfo *TII =
147     static_cast<const ARMBaseInstrInfo*>(SchedModel->getInstrInfo());
148   (void)TII;
149   const ARMSubtarget *STI =
150     static_cast<const ARMSubtarget*>(SchedModel->getSubtargetInfo());
151   (void)STI;
152 }]>;
154 def IsPredicated : CheckFunctionPredicateWithTII<
155   "ARM_MC::isPredicated",
156   "isPredicated"
158 def IsPredicatedPred : MCSchedPredicate<IsPredicated>;
160 def IsCPSRDefined : CheckFunctionPredicateWithTII<
161   "ARM_MC::isCPSRDefined",
162   "ARMBaseInstrInfo::isCPSRDefined"
165 def IsCPSRDefinedPred : MCSchedPredicate<IsCPSRDefined>;
167 let FunctionMapper = "ARM_AM::getAM2ShiftOpc" in {
168   class CheckAM2NoShift<int n> : CheckImmOperand_s<n, "ARM_AM::no_shift">;
169   class CheckAM2ShiftLSL<int n> : CheckImmOperand_s<n, "ARM_AM::lsl">;
172 let FunctionMapper = "ARM_AM::getAM2Op" in {
173   class CheckAM2OpAdd<int n> : CheckImmOperand_s<n, "ARM_AM::add"> {}
174   class CheckAM2OpSub<int n> : CheckImmOperand_s<n, "ARM_AM::sub"> {}
177 let FunctionMapper = "ARM_AM::getAM2Offset" in {
178   class CheckAM2Offset<int n, int of> : CheckImmOperand<n, of> {}
181 def IsLDMBaseRegInList : CheckFunctionPredicate<
182   "ARM_MC::isLDMBaseRegInList", "ARM_MC::isLDMBaseRegInList"
185 let FunctionMapper = "ARM_AM::getAM3Op" in {
186   class CheckAM3OpSub<int n> : CheckImmOperand_s<n, "ARM_AM::sub"> {}
189 // LDM, base reg in list
190 def IsLDMBaseRegInListPred : MCSchedPredicate<IsLDMBaseRegInList>;
192 class IsRegPCPred<int n> : MCSchedPredicate<CheckRegOperand<n, PC>>;
194 class BranchWriteRes<int lat, int uops, list<ProcResourceKind> resl,
195                      list<int> rcl, SchedWriteRes wr> :
196   SchedWriteRes<!listconcat(wr.ProcResources, resl)> {
197   let Latency = !add(wr.Latency, lat);
198   let ReleaseAtCycles = !listconcat(wr.ReleaseAtCycles, rcl);
199   let NumMicroOps = !add(wr.NumMicroOps, uops);
200   SchedWriteRes BaseWr = wr;
203 class CheckBranchForm<int n, BranchWriteRes br> :
204   SchedWriteVariant<[
205     SchedVar<IsRegPCPred<n>, [br]>,
206     SchedVar<NoSchedPred,    [br.BaseWr]>
207   ]>;
209 //===----------------------------------------------------------------------===//
210 // Instruction Itinerary classes used for ARM
212 def IIC_iALUx      : InstrItinClass;
213 def IIC_iALUi      : InstrItinClass;
214 def IIC_iALUr      : InstrItinClass;
215 def IIC_iALUsi     : InstrItinClass;
216 def IIC_iALUsir    : InstrItinClass;
217 def IIC_iALUsr     : InstrItinClass;
218 def IIC_iBITi      : InstrItinClass;
219 def IIC_iBITr      : InstrItinClass;
220 def IIC_iBITsi     : InstrItinClass;
221 def IIC_iBITsr     : InstrItinClass;
222 def IIC_iUNAr      : InstrItinClass;
223 def IIC_iUNAsi     : InstrItinClass;
224 def IIC_iEXTr      : InstrItinClass;
225 def IIC_iEXTAr     : InstrItinClass;
226 def IIC_iEXTAsr    : InstrItinClass;
227 def IIC_iCMPi      : InstrItinClass;
228 def IIC_iCMPr      : InstrItinClass;
229 def IIC_iCMPsi     : InstrItinClass;
230 def IIC_iCMPsr     : InstrItinClass;
231 def IIC_iTSTi      : InstrItinClass;
232 def IIC_iTSTr      : InstrItinClass;
233 def IIC_iTSTsi     : InstrItinClass;
234 def IIC_iTSTsr     : InstrItinClass;
235 def IIC_iMOVi      : InstrItinClass;
236 def IIC_iMOVr      : InstrItinClass;
237 def IIC_iMOVsi     : InstrItinClass;
238 def IIC_iMOVsr     : InstrItinClass;
239 def IIC_iMOVix2    : InstrItinClass;
240 def IIC_iMOVix2addpc : InstrItinClass;
241 def IIC_iMOVix2ld  : InstrItinClass;
242 def IIC_iMVNi      : InstrItinClass;
243 def IIC_iMVNr      : InstrItinClass;
244 def IIC_iMVNsi     : InstrItinClass;
245 def IIC_iMVNsr     : InstrItinClass;
246 def IIC_iCMOVi     : InstrItinClass;
247 def IIC_iCMOVr     : InstrItinClass;
248 def IIC_iCMOVsi    : InstrItinClass;
249 def IIC_iCMOVsr    : InstrItinClass;
250 def IIC_iCMOVix2   : InstrItinClass;
251 def IIC_iMUL16     : InstrItinClass;
252 def IIC_iMAC16     : InstrItinClass;
253 def IIC_iMUL32     : InstrItinClass;
254 def IIC_iMAC32     : InstrItinClass;
255 def IIC_iMUL64     : InstrItinClass;
256 def IIC_iMAC64     : InstrItinClass;
257 def IIC_iDIV     : InstrItinClass;
258 def IIC_iLoad_i    : InstrItinClass;
259 def IIC_iLoad_r    : InstrItinClass;
260 def IIC_iLoad_si   : InstrItinClass;
261 def IIC_iLoad_iu   : InstrItinClass;
262 def IIC_iLoad_ru   : InstrItinClass;
263 def IIC_iLoad_siu  : InstrItinClass;
264 def IIC_iLoad_bh_i   : InstrItinClass;
265 def IIC_iLoad_bh_r   : InstrItinClass;
266 def IIC_iLoad_bh_si  : InstrItinClass;
267 def IIC_iLoad_bh_iu  : InstrItinClass;
268 def IIC_iLoad_bh_ru  : InstrItinClass;
269 def IIC_iLoad_bh_siu : InstrItinClass;
270 def IIC_iLoad_d_i  : InstrItinClass;
271 def IIC_iLoad_d_r  : InstrItinClass;
272 def IIC_iLoad_d_ru : InstrItinClass;
273 def IIC_iLoad_m    : InstrItinClass;
274 def IIC_iLoad_mu   : InstrItinClass;
275 def IIC_iLoad_mBr  : InstrItinClass;
276 def IIC_iPop       : InstrItinClass;
277 def IIC_iPop_Br    : InstrItinClass;
278 def IIC_iLoadiALU  : InstrItinClass;
279 def IIC_iStore_i   : InstrItinClass;
280 def IIC_iStore_r   : InstrItinClass;
281 def IIC_iStore_si  : InstrItinClass;
282 def IIC_iStore_iu  : InstrItinClass;
283 def IIC_iStore_ru  : InstrItinClass;
284 def IIC_iStore_siu : InstrItinClass;
285 def IIC_iStore_bh_i   : InstrItinClass;
286 def IIC_iStore_bh_r   : InstrItinClass;
287 def IIC_iStore_bh_si  : InstrItinClass;
288 def IIC_iStore_bh_iu  : InstrItinClass;
289 def IIC_iStore_bh_ru  : InstrItinClass;
290 def IIC_iStore_bh_siu : InstrItinClass;
291 def IIC_iStore_d_i   : InstrItinClass;
292 def IIC_iStore_d_r   : InstrItinClass;
293 def IIC_iStore_d_ru  : InstrItinClass;
294 def IIC_iStore_m   : InstrItinClass;
295 def IIC_iStore_mu  : InstrItinClass;
296 def IIC_Preload    : InstrItinClass;
297 def IIC_Br         : InstrItinClass;
298 def IIC_fpSTAT     : InstrItinClass;
299 def IIC_fpUNA16    : InstrItinClass;
300 def IIC_fpUNA32    : InstrItinClass;
301 def IIC_fpUNA64    : InstrItinClass;
302 def IIC_fpCMP16    : InstrItinClass;
303 def IIC_fpCMP32    : InstrItinClass;
304 def IIC_fpCMP64    : InstrItinClass;
305 def IIC_fpCVTSD    : InstrItinClass;
306 def IIC_fpCVTDS    : InstrItinClass;
307 def IIC_fpCVTSH    : InstrItinClass;
308 def IIC_fpCVTHS    : InstrItinClass;
309 def IIC_fpCVTIH    : InstrItinClass;
310 def IIC_fpCVTIS    : InstrItinClass;
311 def IIC_fpCVTID    : InstrItinClass;
312 def IIC_fpCVTHI    : InstrItinClass;
313 def IIC_fpCVTSI    : InstrItinClass;
314 def IIC_fpCVTDI    : InstrItinClass;
315 def IIC_fpMOVIS    : InstrItinClass;
316 def IIC_fpMOVID    : InstrItinClass;
317 def IIC_fpMOVSI    : InstrItinClass;
318 def IIC_fpMOVDI    : InstrItinClass;
319 def IIC_fpALU16    : InstrItinClass;
320 def IIC_fpALU32    : InstrItinClass;
321 def IIC_fpALU64    : InstrItinClass;
322 def IIC_fpMUL16    : InstrItinClass;
323 def IIC_fpMUL32    : InstrItinClass;
324 def IIC_fpMUL64    : InstrItinClass;
325 def IIC_fpMAC16    : InstrItinClass;
326 def IIC_fpMAC32    : InstrItinClass;
327 def IIC_fpMAC64    : InstrItinClass;
328 def IIC_fpFMAC16   : InstrItinClass;
329 def IIC_fpFMAC32   : InstrItinClass;
330 def IIC_fpFMAC64   : InstrItinClass;
331 def IIC_fpDIV16    : InstrItinClass;
332 def IIC_fpDIV32    : InstrItinClass;
333 def IIC_fpDIV64    : InstrItinClass;
334 def IIC_fpSQRT16   : InstrItinClass;
335 def IIC_fpSQRT32   : InstrItinClass;
336 def IIC_fpSQRT64   : InstrItinClass;
337 def IIC_fpLoad16   : InstrItinClass;
338 def IIC_fpLoad32   : InstrItinClass;
339 def IIC_fpLoad64   : InstrItinClass;
340 def IIC_fpLoad_m   : InstrItinClass;
341 def IIC_fpLoad_mu  : InstrItinClass;
342 def IIC_fpStore16  : InstrItinClass;
343 def IIC_fpStore32  : InstrItinClass;
344 def IIC_fpStore64  : InstrItinClass;
345 def IIC_fpStore_m  : InstrItinClass;
346 def IIC_fpStore_mu : InstrItinClass;
347 def IIC_VLD1       : InstrItinClass;
348 def IIC_VLD1x2     : InstrItinClass;
349 def IIC_VLD1x3     : InstrItinClass;
350 def IIC_VLD1x4     : InstrItinClass;
351 def IIC_VLD1u      : InstrItinClass;
352 def IIC_VLD1x2u    : InstrItinClass;
353 def IIC_VLD1x3u    : InstrItinClass;
354 def IIC_VLD1x4u    : InstrItinClass;
355 def IIC_VLD1ln     : InstrItinClass;
356 def IIC_VLD1lnu    : InstrItinClass;
357 def IIC_VLD1dup    : InstrItinClass;
358 def IIC_VLD1dupu   : InstrItinClass;
359 def IIC_VLD2       : InstrItinClass;
360 def IIC_VLD2x2     : InstrItinClass;
361 def IIC_VLD2u      : InstrItinClass;
362 def IIC_VLD2x2u    : InstrItinClass;
363 def IIC_VLD2ln     : InstrItinClass;
364 def IIC_VLD2lnu    : InstrItinClass;
365 def IIC_VLD2dup    : InstrItinClass;
366 def IIC_VLD2dupu   : InstrItinClass;
367 def IIC_VLD3       : InstrItinClass;
368 def IIC_VLD3ln     : InstrItinClass;
369 def IIC_VLD3u      : InstrItinClass;
370 def IIC_VLD3lnu    : InstrItinClass;
371 def IIC_VLD3dup    : InstrItinClass;
372 def IIC_VLD3dupu   : InstrItinClass;
373 def IIC_VLD4       : InstrItinClass;
374 def IIC_VLD4ln     : InstrItinClass;
375 def IIC_VLD4u      : InstrItinClass;
376 def IIC_VLD4lnu    : InstrItinClass;
377 def IIC_VLD4dup    : InstrItinClass;
378 def IIC_VLD4dupu   : InstrItinClass;
379 def IIC_VST1       : InstrItinClass;
380 def IIC_VST1x2     : InstrItinClass;
381 def IIC_VST1x3     : InstrItinClass;
382 def IIC_VST1x4     : InstrItinClass;
383 def IIC_VST1u      : InstrItinClass;
384 def IIC_VST1x2u    : InstrItinClass;
385 def IIC_VST1x3u    : InstrItinClass;
386 def IIC_VST1x4u    : InstrItinClass;
387 def IIC_VST1ln     : InstrItinClass;
388 def IIC_VST1lnu    : InstrItinClass;
389 def IIC_VST2       : InstrItinClass;
390 def IIC_VST2x2     : InstrItinClass;
391 def IIC_VST2u      : InstrItinClass;
392 def IIC_VST2x2u    : InstrItinClass;
393 def IIC_VST2ln     : InstrItinClass;
394 def IIC_VST2lnu    : InstrItinClass;
395 def IIC_VST3       : InstrItinClass;
396 def IIC_VST3u      : InstrItinClass;
397 def IIC_VST3ln     : InstrItinClass;
398 def IIC_VST3lnu    : InstrItinClass;
399 def IIC_VST4       : InstrItinClass;
400 def IIC_VST4u      : InstrItinClass;
401 def IIC_VST4ln     : InstrItinClass;
402 def IIC_VST4lnu    : InstrItinClass;
403 def IIC_VUNAD      : InstrItinClass;
404 def IIC_VUNAQ      : InstrItinClass;
405 def IIC_VBIND      : InstrItinClass;
406 def IIC_VBINQ      : InstrItinClass;
407 def IIC_VPBIND     : InstrItinClass;
408 def IIC_VFMULD     : InstrItinClass;
409 def IIC_VFMULQ     : InstrItinClass;
410 def IIC_VMOV       : InstrItinClass;
411 def IIC_VMOVImm    : InstrItinClass;
412 def IIC_VMOVD      : InstrItinClass;
413 def IIC_VMOVQ      : InstrItinClass;
414 def IIC_VMOVIS     : InstrItinClass;
415 def IIC_VMOVID     : InstrItinClass;
416 def IIC_VMOVISL    : InstrItinClass;
417 def IIC_VMOVSI     : InstrItinClass;
418 def IIC_VMOVDI     : InstrItinClass;
419 def IIC_VMOVN      : InstrItinClass;
420 def IIC_VPERMD     : InstrItinClass;
421 def IIC_VPERMQ     : InstrItinClass;
422 def IIC_VPERMQ3    : InstrItinClass;
423 def IIC_VMACD      : InstrItinClass;
424 def IIC_VMACQ      : InstrItinClass;
425 def IIC_VFMACD     : InstrItinClass;
426 def IIC_VFMACQ     : InstrItinClass;
427 def IIC_VRECSD     : InstrItinClass;
428 def IIC_VRECSQ     : InstrItinClass;
429 def IIC_VCNTiD     : InstrItinClass;
430 def IIC_VCNTiQ     : InstrItinClass;
431 def IIC_VUNAiD     : InstrItinClass;
432 def IIC_VUNAiQ     : InstrItinClass;
433 def IIC_VQUNAiD    : InstrItinClass;
434 def IIC_VQUNAiQ    : InstrItinClass;
435 def IIC_VBINiD     : InstrItinClass;
436 def IIC_VBINiQ     : InstrItinClass;
437 def IIC_VSUBiD     : InstrItinClass;
438 def IIC_VSUBiQ     : InstrItinClass;
439 def IIC_VBINi4D    : InstrItinClass;
440 def IIC_VBINi4Q    : InstrItinClass;
441 def IIC_VSUBi4D    : InstrItinClass;
442 def IIC_VSUBi4Q    : InstrItinClass;
443 def IIC_VABAD      : InstrItinClass;
444 def IIC_VABAQ      : InstrItinClass;
445 def IIC_VSHLiD     : InstrItinClass;
446 def IIC_VSHLiQ     : InstrItinClass;
447 def IIC_VSHLi4D    : InstrItinClass;
448 def IIC_VSHLi4Q    : InstrItinClass;
449 def IIC_VPALiD     : InstrItinClass;
450 def IIC_VPALiQ     : InstrItinClass;
451 def IIC_VMULi16D   : InstrItinClass;
452 def IIC_VMULi32D   : InstrItinClass;
453 def IIC_VMULi16Q   : InstrItinClass;
454 def IIC_VMULi32Q   : InstrItinClass;
455 def IIC_VMACi16D   : InstrItinClass;
456 def IIC_VMACi32D   : InstrItinClass;
457 def IIC_VMACi16Q   : InstrItinClass;
458 def IIC_VMACi32Q   : InstrItinClass;
459 def IIC_VEXTD      : InstrItinClass;
460 def IIC_VEXTQ      : InstrItinClass;
461 def IIC_VTB1       : InstrItinClass;
462 def IIC_VTB2       : InstrItinClass;
463 def IIC_VTB3       : InstrItinClass;
464 def IIC_VTB4       : InstrItinClass;
465 def IIC_VTBX1      : InstrItinClass;
466 def IIC_VTBX2      : InstrItinClass;
467 def IIC_VTBX3      : InstrItinClass;
468 def IIC_VTBX4      : InstrItinClass;
469 def IIC_VDOTPROD   : InstrItinClass;