Run DCE after a LoopFlatten test to reduce spurious output [nfc]
[llvm-project.git] / llvm / test / CodeGen / AMDGPU / spill384.mir
blob3d6fe33f98950f78d25a0c7d13dae7dc950bc96a
1 # NOTE: Assertions have been autogenerated by utils/update_mir_test_checks.py
2 # RUN: llc -march=amdgcn -mcpu=tahiti -run-pass=regallocfast -o - %s | FileCheck -check-prefix=SPILLED %s
3 # RUN: llc -march=amdgcn -mcpu=tahiti -run-pass=regallocfast,si-lower-sgpr-spills -o - %s | FileCheck -check-prefix=EXPANDED %s
5 # Make sure spill/restore of 384 bit registers works.
7 ---
8 name: spill_restore_sgpr384
9 tracksRegLiveness: true
10 machineFunctionInfo:
11   scratchRSrcReg: $sgpr0_sgpr1_sgpr2_sgpr3
12   stackPtrOffsetReg: $sgpr32
13 body: |
14   ; SPILLED-LABEL: name: spill_restore_sgpr384
15   ; SPILLED: bb.0:
16   ; SPILLED-NEXT:   successors: %bb.1(0x80000000)
17   ; SPILLED-NEXT: {{  $}}
18   ; SPILLED-NEXT:   S_NOP 0, implicit-def renamable $sgpr4_sgpr5_sgpr6_sgpr7_sgpr8_sgpr9_sgpr10_sgpr11_sgpr12_sgpr13_sgpr14_sgpr15
19   ; SPILLED-NEXT:   SI_SPILL_S384_SAVE killed $sgpr4_sgpr5_sgpr6_sgpr7_sgpr8_sgpr9_sgpr10_sgpr11_sgpr12_sgpr13_sgpr14_sgpr15, %stack.0, implicit $exec, implicit $sgpr32 :: (store (s384) into %stack.0, align 4, addrspace 5)
20   ; SPILLED-NEXT:   S_CBRANCH_SCC1 %bb.1, implicit undef $scc
21   ; SPILLED-NEXT: {{  $}}
22   ; SPILLED-NEXT: bb.1:
23   ; SPILLED-NEXT:   successors: %bb.2(0x80000000)
24   ; SPILLED-NEXT: {{  $}}
25   ; SPILLED-NEXT:   S_NOP 1
26   ; SPILLED-NEXT: {{  $}}
27   ; SPILLED-NEXT: bb.2:
28   ; SPILLED-NEXT:   $sgpr4_sgpr5_sgpr6_sgpr7_sgpr8_sgpr9_sgpr10_sgpr11_sgpr12_sgpr13_sgpr14_sgpr15 = SI_SPILL_S384_RESTORE %stack.0, implicit $exec, implicit $sgpr32 :: (load (s384) from %stack.0, align 4, addrspace 5)
29   ; SPILLED-NEXT:   S_NOP 0, implicit killed renamable $sgpr4_sgpr5_sgpr6_sgpr7_sgpr8_sgpr9_sgpr10_sgpr11_sgpr12_sgpr13_sgpr14_sgpr15
30   ;
31   ; EXPANDED-LABEL: name: spill_restore_sgpr384
32   ; EXPANDED: bb.0:
33   ; EXPANDED-NEXT:   successors: %bb.1(0x80000000)
34   ; EXPANDED-NEXT: {{  $}}
35   ; EXPANDED-NEXT:   [[DEF:%[0-9]+]]:vgpr_32 = IMPLICIT_DEF
36   ; EXPANDED-NEXT:   S_NOP 0, implicit-def renamable $sgpr4_sgpr5_sgpr6_sgpr7_sgpr8_sgpr9_sgpr10_sgpr11_sgpr12_sgpr13_sgpr14_sgpr15
37   ; EXPANDED-NEXT:   [[DEF:%[0-9]+]]:vgpr_32 = SI_SPILL_S32_TO_VGPR $sgpr4, 0, [[DEF]], implicit-def $sgpr4_sgpr5_sgpr6_sgpr7_sgpr8_sgpr9_sgpr10_sgpr11_sgpr12_sgpr13_sgpr14_sgpr15, implicit $sgpr4_sgpr5_sgpr6_sgpr7_sgpr8_sgpr9_sgpr10_sgpr11_sgpr12_sgpr13_sgpr14_sgpr15
38   ; EXPANDED-NEXT:   [[DEF:%[0-9]+]]:vgpr_32 = SI_SPILL_S32_TO_VGPR $sgpr5, 1, [[DEF]]
39   ; EXPANDED-NEXT:   [[DEF:%[0-9]+]]:vgpr_32 = SI_SPILL_S32_TO_VGPR $sgpr6, 2, [[DEF]]
40   ; EXPANDED-NEXT:   [[DEF:%[0-9]+]]:vgpr_32 = SI_SPILL_S32_TO_VGPR $sgpr7, 3, [[DEF]]
41   ; EXPANDED-NEXT:   [[DEF:%[0-9]+]]:vgpr_32 = SI_SPILL_S32_TO_VGPR $sgpr8, 4, [[DEF]]
42   ; EXPANDED-NEXT:   [[DEF:%[0-9]+]]:vgpr_32 = SI_SPILL_S32_TO_VGPR $sgpr9, 5, [[DEF]]
43   ; EXPANDED-NEXT:   [[DEF:%[0-9]+]]:vgpr_32 = SI_SPILL_S32_TO_VGPR $sgpr10, 6, [[DEF]]
44   ; EXPANDED-NEXT:   [[DEF:%[0-9]+]]:vgpr_32 = SI_SPILL_S32_TO_VGPR $sgpr11, 7, [[DEF]]
45   ; EXPANDED-NEXT:   [[DEF:%[0-9]+]]:vgpr_32 = SI_SPILL_S32_TO_VGPR $sgpr12, 8, [[DEF]]
46   ; EXPANDED-NEXT:   [[DEF:%[0-9]+]]:vgpr_32 = SI_SPILL_S32_TO_VGPR $sgpr13, 9, [[DEF]]
47   ; EXPANDED-NEXT:   [[DEF:%[0-9]+]]:vgpr_32 = SI_SPILL_S32_TO_VGPR $sgpr14, 10, [[DEF]]
48   ; EXPANDED-NEXT:   [[DEF:%[0-9]+]]:vgpr_32 = SI_SPILL_S32_TO_VGPR killed $sgpr15, 11, [[DEF]], implicit killed $sgpr4_sgpr5_sgpr6_sgpr7_sgpr8_sgpr9_sgpr10_sgpr11_sgpr12_sgpr13_sgpr14_sgpr15
49   ; EXPANDED-NEXT:   S_CBRANCH_SCC1 %bb.1, implicit undef $scc
50   ; EXPANDED-NEXT: {{  $}}
51   ; EXPANDED-NEXT: bb.1:
52   ; EXPANDED-NEXT:   successors: %bb.2(0x80000000)
53   ; EXPANDED-NEXT: {{  $}}
54   ; EXPANDED-NEXT:   S_NOP 1
55   ; EXPANDED-NEXT: {{  $}}
56   ; EXPANDED-NEXT: bb.2:
57   ; EXPANDED-NEXT:   $sgpr4 = SI_RESTORE_S32_FROM_VGPR [[DEF]], 0, implicit-def $sgpr4_sgpr5_sgpr6_sgpr7_sgpr8_sgpr9_sgpr10_sgpr11_sgpr12_sgpr13_sgpr14_sgpr15
58   ; EXPANDED-NEXT:   $sgpr5 = SI_RESTORE_S32_FROM_VGPR [[DEF]], 1
59   ; EXPANDED-NEXT:   $sgpr6 = SI_RESTORE_S32_FROM_VGPR [[DEF]], 2
60   ; EXPANDED-NEXT:   $sgpr7 = SI_RESTORE_S32_FROM_VGPR [[DEF]], 3
61   ; EXPANDED-NEXT:   $sgpr8 = SI_RESTORE_S32_FROM_VGPR [[DEF]], 4
62   ; EXPANDED-NEXT:   $sgpr9 = SI_RESTORE_S32_FROM_VGPR [[DEF]], 5
63   ; EXPANDED-NEXT:   $sgpr10 = SI_RESTORE_S32_FROM_VGPR [[DEF]], 6
64   ; EXPANDED-NEXT:   $sgpr11 = SI_RESTORE_S32_FROM_VGPR [[DEF]], 7
65   ; EXPANDED-NEXT:   $sgpr12 = SI_RESTORE_S32_FROM_VGPR [[DEF]], 8
66   ; EXPANDED-NEXT:   $sgpr13 = SI_RESTORE_S32_FROM_VGPR [[DEF]], 9
67   ; EXPANDED-NEXT:   $sgpr14 = SI_RESTORE_S32_FROM_VGPR [[DEF]], 10
68   ; EXPANDED-NEXT:   $sgpr15 = SI_RESTORE_S32_FROM_VGPR [[DEF]], 11
69   ; EXPANDED-NEXT:   S_NOP 0, implicit killed renamable $sgpr4_sgpr5_sgpr6_sgpr7_sgpr8_sgpr9_sgpr10_sgpr11_sgpr12_sgpr13_sgpr14_sgpr15
70   bb.0:
71     S_NOP 0, implicit-def %0:sgpr_384
72     S_CBRANCH_SCC1 implicit undef $scc, %bb.1
74   bb.1:
75     S_NOP 1
77   bb.2:
78     S_NOP 0, implicit %0
79 ...
81 ---
82 name: spill_restore_vgpr384
83 tracksRegLiveness: true
84 machineFunctionInfo:
85   scratchRSrcReg: $sgpr0_sgpr1_sgpr2_sgpr3
86   stackPtrOffsetReg: $sgpr32
87 body: |
88   ; SPILLED-LABEL: name: spill_restore_vgpr384
89   ; SPILLED: bb.0:
90   ; SPILLED-NEXT:   successors: %bb.1(0x80000000)
91   ; SPILLED-NEXT: {{  $}}
92   ; SPILLED-NEXT:   S_NOP 0, implicit-def renamable $vgpr0_vgpr1_vgpr2_vgpr3_vgpr4_vgpr5_vgpr6_vgpr7_vgpr8_vgpr9_vgpr10_vgpr11
93   ; SPILLED-NEXT:   SI_SPILL_V384_SAVE killed $vgpr0_vgpr1_vgpr2_vgpr3_vgpr4_vgpr5_vgpr6_vgpr7_vgpr8_vgpr9_vgpr10_vgpr11, %stack.0, $sgpr32, 0, implicit $exec :: (store (s384) into %stack.0, align 4, addrspace 5)
94   ; SPILLED-NEXT:   S_CBRANCH_SCC1 %bb.1, implicit undef $scc
95   ; SPILLED-NEXT: {{  $}}
96   ; SPILLED-NEXT: bb.1:
97   ; SPILLED-NEXT:   successors: %bb.2(0x80000000)
98   ; SPILLED-NEXT: {{  $}}
99   ; SPILLED-NEXT:   S_NOP 1
100   ; SPILLED-NEXT: {{  $}}
101   ; SPILLED-NEXT: bb.2:
102   ; SPILLED-NEXT:   $vgpr0_vgpr1_vgpr2_vgpr3_vgpr4_vgpr5_vgpr6_vgpr7_vgpr8_vgpr9_vgpr10_vgpr11 = SI_SPILL_V384_RESTORE %stack.0, $sgpr32, 0, implicit $exec :: (load (s384) from %stack.0, align 4, addrspace 5)
103   ; SPILLED-NEXT:   S_NOP 0, implicit killed renamable $vgpr0_vgpr1_vgpr2_vgpr3_vgpr4_vgpr5_vgpr6_vgpr7_vgpr8_vgpr9_vgpr10_vgpr11
104   ;
105   ; EXPANDED-LABEL: name: spill_restore_vgpr384
106   ; EXPANDED: bb.0:
107   ; EXPANDED-NEXT:   successors: %bb.1(0x80000000)
108   ; EXPANDED-NEXT: {{  $}}
109   ; EXPANDED-NEXT:   S_NOP 0, implicit-def renamable $vgpr0_vgpr1_vgpr2_vgpr3_vgpr4_vgpr5_vgpr6_vgpr7_vgpr8_vgpr9_vgpr10_vgpr11
110   ; EXPANDED-NEXT:   SI_SPILL_V384_SAVE killed $vgpr0_vgpr1_vgpr2_vgpr3_vgpr4_vgpr5_vgpr6_vgpr7_vgpr8_vgpr9_vgpr10_vgpr11, %stack.0, $sgpr32, 0, implicit $exec :: (store (s384) into %stack.0, align 4, addrspace 5)
111   ; EXPANDED-NEXT:   S_CBRANCH_SCC1 %bb.1, implicit undef $scc
112   ; EXPANDED-NEXT: {{  $}}
113   ; EXPANDED-NEXT: bb.1:
114   ; EXPANDED-NEXT:   successors: %bb.2(0x80000000)
115   ; EXPANDED-NEXT: {{  $}}
116   ; EXPANDED-NEXT:   S_NOP 1
117   ; EXPANDED-NEXT: {{  $}}
118   ; EXPANDED-NEXT: bb.2:
119   ; EXPANDED-NEXT:   $vgpr0_vgpr1_vgpr2_vgpr3_vgpr4_vgpr5_vgpr6_vgpr7_vgpr8_vgpr9_vgpr10_vgpr11 = SI_SPILL_V384_RESTORE %stack.0, $sgpr32, 0, implicit $exec :: (load (s384) from %stack.0, align 4, addrspace 5)
120   ; EXPANDED-NEXT:   S_NOP 0, implicit killed renamable $vgpr0_vgpr1_vgpr2_vgpr3_vgpr4_vgpr5_vgpr6_vgpr7_vgpr8_vgpr9_vgpr10_vgpr11
121   bb.0:
122     S_NOP 0, implicit-def %0:vreg_384
123     S_CBRANCH_SCC1 implicit undef $scc, %bb.1
125   bb.1:
126     S_NOP 1
128   bb.2:
129     S_NOP 0, implicit %0