Run DCE after a LoopFlatten test to reduce spurious output [nfc]
[llvm-project.git] / llvm / test / CodeGen / AMDGPU / scheduler-handle-move-bundle.mir
blobbbfc1b6c917127f68e8446f85a126029930a658d
1 # NOTE: Assertions have been autogenerated by utils/update_mir_test_checks.py
2 # RUN: llc -mtriple=amdgcn-amd-amdhsa -mcpu=gfx1010 -run-pass=machine-scheduler -verify-machineinstrs -o - %s | FileCheck -check-prefix=GCN %s
3 # RUN: llc -mtriple=amdgcn-amd-amdhsa -mcpu=gfx1100 -run-pass=machine-scheduler -verify-machineinstrs -o - %s | FileCheck -check-prefix=GCN %s
5 # handleMove was called for the BUNDLE pseudo-instruction, but
6 # considered it to be an instruction in the bundle. Make sure it
7 # doesn't assert when the whole bundle is moved.
9 ---
10 name: handleMove_bundle
11 tracksRegLiveness: true
12 machineFunctionInfo:
13   isEntryFunction: true
14   memoryBound:     false
15   waveLimiter:     false
16 body:             |
17   bb.0:
18     liveins: $sgpr4_sgpr5
20     ; GCN-LABEL: name: handleMove_bundle
21     ; GCN: liveins: $sgpr4_sgpr5
22     ; GCN-NEXT: {{  $}}
23     ; GCN-NEXT: [[COPY:%[0-9]+]]:sgpr_64 = COPY $sgpr4_sgpr5
24     ; GCN-NEXT: [[S_LOAD_DWORD_IMM:%[0-9]+]]:sreg_32_xm0_xexec = S_LOAD_DWORD_IMM [[COPY]], 0, 0 :: (dereferenceable invariant load (s32), align 16, addrspace 4)
25     ; GCN-NEXT: [[V_MOV_B32_e32_:%[0-9]+]]:vgpr_32 = V_MOV_B32_e32 1, implicit $exec
26     ; GCN-NEXT: [[V_MOV_B32_e32_1:%[0-9]+]]:vgpr_32 = V_MOV_B32_e32 0, implicit $exec
27     ; GCN-NEXT: [[V_MOV_B32_e32_2:%[0-9]+]]:vgpr_32 = V_MOV_B32_e32 2, implicit $exec
28     ; GCN-NEXT: DS_WRITE_B32_gfx9 [[V_MOV_B32_e32_1]], [[V_MOV_B32_e32_]], 0, 0, implicit $exec :: (store (s32), addrspace 3)
29     ; GCN-NEXT: $vgpr0 = COPY [[S_LOAD_DWORD_IMM]]
30     ; GCN-NEXT: $m0 = S_MOV_B32 0
31     ; GCN-NEXT: BUNDLE implicit $vgpr0, implicit $m0, implicit $exec {
32     ; GCN-NEXT:   DS_GWS_INIT $vgpr0, 11, implicit $m0, implicit $exec :: (store (s32))
33     ; GCN-NEXT:   S_WAITCNT 0
34     ; GCN-NEXT: }
35     ; GCN-NEXT: DS_WRITE_B32_gfx9 [[V_MOV_B32_e32_1]], [[V_MOV_B32_e32_2]], 0, 0, implicit $exec :: (store (s32), addrspace 3)
36     ; GCN-NEXT: S_ENDPGM 0
37     %2:sgpr_64 = COPY $sgpr4_sgpr5
38     %5:sreg_32_xm0_xexec = S_LOAD_DWORD_IMM %2, 0, 0 :: (dereferenceable invariant load (s32), align 16, addrspace 4)
39     %6:vgpr_32 = V_MOV_B32_e32 1, implicit $exec
40     %7:vgpr_32 = V_MOV_B32_e32 0, implicit $exec
41     DS_WRITE_B32_gfx9 %7, %6, 0, 0, implicit $exec :: (store (s32), addrspace 3)
42     $m0 = S_MOV_B32 0
43     $vgpr0 = COPY %5
44     BUNDLE implicit killed $vgpr0, implicit $m0, implicit $exec {
45       DS_GWS_INIT $vgpr0, 11, implicit $m0, implicit $exec :: (store (s32))
46       S_WAITCNT 0
47     }
48     %8:vgpr_32 = V_MOV_B32_e32 2, implicit $exec
49     DS_WRITE_B32_gfx9 %7, %8, 0, 0, implicit $exec :: (store (s32), addrspace 3)
50     S_ENDPGM 0
52 ...