Run DCE after a LoopFlatten test to reduce spurious output [nfc]
[llvm-project.git] / llvm / test / CodeGen / X86 / AMX / amx-fastpreconfig.mir
blobdcc8d542c70704b9a684224357f34675f1a943b5
1 # NOTE: Assertions have been autogenerated by utils/update_mir_test_checks.py
2 # RUN: llc -mtriple=x86_64-- -mattr=+amx-int8,avx512f -run-pass=fastpretileconfig -o - %s | FileCheck %s
4 # Test the case which has TILELOADD being mixed in pseudo AMX instruction
5 ...
6 ---
7 name:            main
8 alignment:       16
9 tracksRegLiveness: true
10 registers:
11   - { id: 0, class: gr64_nosp }
12   - { id: 1, class: gr64 }
13   - { id: 2, class: gr16 }
14   - { id: 3, class: gr16 }
15   - { id: 4, class: tile }
16   - { id: 5, class: tile }
17   - { id: 6, class: tile }
18   - { id: 7, class: tile }
19   - { id: 8, class: gr32 }
20   - { id: 9, class: vr512 }
21 frameInfo:
22   maxAlignment:    16
23 stack:
24   - { id: 0, size: 1024, alignment: 16 }
25   - { id: 1, size: 64, alignment: 4 }
26 machineFunctionInfo: {}
27 body:             |
28   bb.0.entry:
29     ; CHECK-LABEL: name: main
30     ; CHECK: [[AVX512_512_SET0_:%[0-9]+]]:vr512 = AVX512_512_SET0
31     ; CHECK-NEXT: VMOVUPSZmr %stack.2, 1, $noreg, 0, $noreg, [[AVX512_512_SET0_]] :: (store (s512) into %stack.2, align 4)
32     ; CHECK-NEXT: MOV8mi %stack.2, 1, $noreg, 0, $noreg, 1 :: (store (s512) into %stack.2, align 4)
33     ; CHECK-NEXT: [[MOV32ri64_:%[0-9]+]]:gr64_nosp = MOV32ri64 32
34     ; CHECK-NEXT: [[LEA64r:%[0-9]+]]:gr64 = LEA64r %stack.0, 1, $noreg, 0, $noreg
35     ; CHECK-NEXT: [[MOV16ri:%[0-9]+]]:gr16 = MOV16ri 32
36     ; CHECK-NEXT: [[MOV16ri1:%[0-9]+]]:gr16 = MOV16ri 8
37     ; CHECK-NEXT: PLDTILECFGV %stack.2, 1, $noreg, 0, $noreg, implicit-def $tmm0, implicit-def $tmm1, implicit-def $tmm2, implicit-def $tmm3, implicit-def $tmm4, implicit-def $tmm5, implicit-def $tmm6, implicit-def $tmm7 :: (load (s512) from %stack.2, align 4)
38     ; CHECK-NEXT: $tmm0 = TILELOADD [[LEA64r]], 1, [[MOV32ri64_]], 0, $noreg
39     ; CHECK-NEXT: [[PTILELOADDV:%[0-9]+]]:tile = PTILELOADDV [[MOV16ri1]], [[MOV16ri]], [[LEA64r]], 1, [[MOV32ri64_]], 0, $noreg
40     ; CHECK-NEXT: [[PTILELOADDV1:%[0-9]+]]:tile = PTILELOADDV [[MOV16ri1]], [[MOV16ri]], [[LEA64r]], 1, [[MOV32ri64_]], 0, $noreg
41     ; CHECK-NEXT: [[PTILELOADDV2:%[0-9]+]]:tile = PTILELOADDV [[MOV16ri1]], [[MOV16ri]], [[LEA64r]], 1, [[MOV32ri64_]], 0, $noreg
42     ; CHECK-NEXT: [[PTDPBSSDV:%[0-9]+]]:tile = PTDPBSSDV [[MOV16ri1]], [[MOV16ri]], [[MOV16ri]], killed [[PTILELOADDV2]], killed [[PTILELOADDV]], killed [[PTILELOADDV1]]
43     ; CHECK-NEXT: PTILESTOREDV killed [[MOV16ri1]], killed [[MOV16ri]], killed [[LEA64r]], 1, killed [[MOV32ri64_]], 0, $noreg, killed [[PTDPBSSDV]]
44     ; CHECK-NEXT: [[MOV32r0_:%[0-9]+]]:gr32 = MOV32r0 implicit-def dead $eflags
45     ; CHECK-NEXT: $eax = COPY killed [[MOV32r0_]]
46     ; CHECK-NEXT: RET 0, killed $eax
47     %0:gr64_nosp = MOV32ri64 32
48     %1:gr64 = LEA64r %stack.0, 1, $noreg, 0, $noreg
49     %2:gr16 = MOV16ri 32
50     %3:gr16 = MOV16ri 8
51     $tmm0   = TILELOADD %1, 1, %0, 0, $noreg
52     %4:tile = PTILELOADDV %3, %2, %1, 1, %0, 0, $noreg
53     %5:tile = PTILELOADDV %3, %2, %1, 1, %0, 0, $noreg
54     %6:tile = PTILELOADDV %3, %2, %1, 1, %0, 0, $noreg
55     %7:tile = PTDPBSSDV %3, %2, %2, killed %6, killed %4, killed %5
56     PTILESTOREDV killed %3, killed %2, killed %1, 1, killed %0, 0, $noreg, killed %7
57     %8:gr32 = MOV32r0 implicit-def dead $eflags
58     $eax = COPY killed %8
59     RET 0, killed $eax
61 ...