Use Align for TFL::TransientStackAlignment
[llvm-core.git] / test / CodeGen / AMDGPU / hazard-hidden-bundle.mir
blobd0f32f287473c40511b5f8d2acee04d5ba4de802
1 # RUN: llc -march=amdgcn -mcpu=gfx902 -verify-machineinstrs -run-pass  post-RA-hazard-rec %s -o - | FileCheck -check-prefixes=GCN,XNACK,GCX9 %s
2 # RUN: llc -march=amdgcn -mcpu=gfx900 -verify-machineinstrs -run-pass  post-RA-hazard-rec %s -o - | FileCheck -check-prefixes=GCN,NOXNACK,GFX9 %s
3 # RUN: llc -march=amdgcn -mcpu=gfx1010 -mattr=-WavefrontSize32,+WavefrontSize64 -verify-machineinstrs -run-pass  post-RA-hazard-rec %s -o - | FileCheck -check-prefixes=GCN,NOXNACK,GFX10 %s
5 # GCN-LABEL: name: break_smem_clause_simple_load_smrd8_ptr_hidden_bundle
6 # GCN: bb.0:
7 # GCN:          }
8 # XNACK-NEXT:   S_NOP
9 # NOXNACK-NOT:  S_NOP
10 # GCN:          S_LOAD_DWORDX2_IMM
11 ---
12 name: break_smem_clause_simple_load_smrd8_ptr_hidden_bundle
13 body: |
14   bb.0:
15     BUNDLE implicit-def $sgpr6_sgpr7 {
16       $sgpr10_sgpr11 = S_LOAD_DWORDX2_IMM $sgpr12_sgpr13, 0, 0, 0
17     }
18     $sgpr14_sgpr15 = S_LOAD_DWORDX2_IMM $sgpr10_sgpr11, 0, 0, 0
19     S_ENDPGM 0
20 ...
22 # GFX9-LABEL: name: hazard_precedes_bundle
23 # GFX9:      S_MOV_B32
24 # GFX9-NEXT: S_NOP
25 # GFX9:      BUNDLE
26 # GFX9-NEXT: S_NOP
27 ---
28 name: hazard_precedes_bundle
29 body:   |
30   bb.0:
31     $m0 = S_MOV_B32 $sgpr7
32     S_SENDMSG 3, implicit $exec, implicit $m0
33     $m0 = S_MOV_B32 $sgpr8
34     BUNDLE implicit-def $vgpr0 {
35       $vgpr0 = V_INTERP_P1_F32 killed $vgpr4, 0, 0, implicit $m0, implicit $exec
36     }
37     S_ENDPGM 0
38 ...
40 # GCN-LABEL: name: vmem_vcc_hazard_ignore_bundle_instr
41 # GCN:      S_LOAD_DWORDX2_IMM
42 # GCN-NEXT: }
43 # GCN-NEXT: S_NOP
44 # GCN-NEXT: S_NOP
45 # GCN-NEXT: S_NOP
46 # GCN-NEXT: S_NOP
47 # GCN:      BUFFER_LOAD_DWORD_OFFEN
48 ---
49 name: vmem_vcc_hazard_ignore_bundle_instr
50 body: |
51   bb.0:
52     $sgpr0_sgpr1_sgpr2_sgpr3 = IMPLICIT_DEF
53     $vgpr0 = IMPLICIT_DEF
54     BUNDLE implicit-def $vgpr1, implicit $vgpr0, implicit $vgpr0, implicit-def $vcc, implicit $vcc, implicit $exec {
55       $vgpr1 = V_ADDC_U32_e32 $vgpr0, $vgpr0, implicit-def $vcc, implicit $vcc, implicit $exec
56     }
57     BUNDLE implicit-def $sgpr0_sgpr1, implicit $sgpr10_sgpr11 {
58       $sgpr0_sgpr1 = S_LOAD_DWORDX2_IMM $sgpr10_sgpr11, 0, 0, 0
59     }
60     $vgpr1 = BUFFER_LOAD_DWORD_OFFEN $vgpr0, $sgpr0_sgpr1_sgpr2_sgpr3, $vcc_lo, 0, 0, 0, 0, 0, 0, implicit $exec
61     S_ENDPGM 0
62 ...
64 # GCN-LABEL: name: vmem_vcc_min_of_two_after_bundle
65 # GCN:      bb.2:
66 # GCN-NEXT: S_NOP
67 # GCN-NEXT: S_NOP
68 # GCN-NEXT: S_NOP
69 # GCN-NEXT: S_NOP
70 # GCN-NEXT: S_NOP
71 # GCN-NEXT: BUFFER_LOAD_DWORD_OFFEN
72 ---
73 name: vmem_vcc_min_of_two_after_bundle
74 body: |
75   bb.0:
76     successors: %bb.2
78     BUNDLE implicit-def $vgpr1, implicit $vgpr0 {
79       $sgpr0_sgpr1_sgpr2_sgpr3 = IMPLICIT_DEF
80       $vgpr0 = IMPLICIT_DEF
81       $vgpr1 = V_ADDC_U32_e32 $vgpr0, $vgpr0, implicit-def $vcc, implicit $vcc, implicit $exec
82     }
83     S_NOP 0
84     S_BRANCH %bb.2
86   bb.1:
87     successors: %bb.2
89     BUNDLE implicit-def $vgpr1, implicit $vgpr0 {
90       $vgpr1 = V_ADDC_U32_e32 $vgpr0, $vgpr0, implicit-def $vcc, implicit $vcc, implicit $exec
91     }
93   bb.2:
94     $vgpr1 = BUFFER_LOAD_DWORD_OFFEN $vgpr0, $sgpr0_sgpr1_sgpr2_sgpr3, $vcc_lo, 0, 0, 0, 0, 0, 0, implicit $exec
95 ...