Run DCE after a LoopFlatten test to reduce spurious output [nfc]
[llvm-project.git] / llvm / test / CodeGen / AMDGPU / fold-multiple-commute.mir
blob2f7bd1c63ad0d664ad6abed91c2f8590c541cf68
1 # NOTE: Assertions have been autogenerated by utils/update_mir_test_checks.py
2 # RUN: llc -march=amdgcn -mcpu=gfx900 -verify-machineinstrs -run-pass si-fold-operands %s -o - | FileCheck %s
4 # Check that the addc instructions are commuted to allow folding of the constant
5 # 0 into multiple uses as an inline operand.
6 ---
7 name: test_commute
8 tracksRegLiveness: true
9 body: |
10   bb.0:
11     liveins: $vgpr0, $vgpr1, $vcc
12     ; CHECK-LABEL: name: test_commute
13     ; CHECK: liveins: $vgpr0, $vgpr1, $vcc
14     ; CHECK-NEXT: {{  $}}
15     ; CHECK-NEXT: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
16     ; CHECK-NEXT: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr1
17     ; CHECK-NEXT: [[V_ADDC_U32_e32_:%[0-9]+]]:vgpr_32 = V_ADDC_U32_e32 0, [[COPY]], implicit-def $vcc, implicit $vcc, implicit $exec
18     ; CHECK-NEXT: [[V_ADDC_U32_e32_1:%[0-9]+]]:vgpr_32 = V_ADDC_U32_e32 0, [[COPY1]], implicit-def $vcc, implicit $vcc, implicit $exec
19     ; CHECK-NEXT: S_NOP 0, implicit [[V_ADDC_U32_e32_]], implicit [[V_ADDC_U32_e32_1]]
20     %0:vgpr_32 = COPY $vgpr0
21     %1:vgpr_32 = COPY $vgpr1
22     %2:vgpr_32 = V_MOV_B32_e32 0, implicit $exec
23     %3:vgpr_32 = V_ADDC_U32_e32 %0, %2, implicit-def $vcc, implicit $vcc, implicit $exec
24     %4:vgpr_32 = V_ADDC_U32_e32 %1, %2, implicit-def $vcc, implicit $vcc, implicit $exec
25     S_NOP 0, implicit %3, implicit %4
26 ...