Run DCE after a LoopFlatten test to reduce spurious output [nfc]
[llvm-project.git] / llvm / test / CodeGen / X86 / AMX / amx-fastconfig-phi4.mir
blob15d3eb6bdfebb62eb7889cf35484f98c9713dbb7
1 # NOTE: Assertions have been autogenerated by utils/update_mir_test_checks.py
2 # RUN: llc -mtriple=x86_64-- -mattr=+amx-tile -run-pass=fastpretileconfig -o - %s | FileCheck %s
4 #             bb.0
5 #            def %0
6 #          /        \
7 #       bb.1     |-->bb.2   <-----------
8 #                |  %2=phi(%0, %3, %4) |
9 #      def %1    -- %5=phi(%0, %3, %2) |
10 #           \      /                   |
11 #             bb.3 ---------------------
12 #             def %3
14 # This case test tile PHIs depend each other, and the its def block is
15 # not visited yet.
16 ---
17 name:            foo
18 alignment:       16
19 tracksRegLiveness: true
20 registers:
21   - { id: 1, class: tile }
22   - { id: 2, class: tile }
23   - { id: 3, class: tile }
24   - { id: 4, class: tile }
25   - { id: 12, class: gr32 }
26   - { id: 13, class: gr32 }
27   - { id: 16, class: gr8 }
28   - { id: 17, class: gr16 }
29   - { id: 18, class: gr16 }
30   - { id: 19, class: gr64_nosp }
31   - { id: 22, class: gr32 }
32   - { id: 23, class: gr16 }
33   - { id: 24, class: gr16 }
34 liveins:
35   - { reg: '$edi', virtual-reg: '%12' }
36 frameInfo:
37   maxAlignment:    1
38 machineFunctionInfo: {}
39 body:             |
40   ; CHECK-LABEL: name: foo
41   ; CHECK: bb.0.entry:
42   ; CHECK-NEXT:   successors: %bb.2(0x40000000), %bb.1(0x40000000)
43   ; CHECK-NEXT:   liveins: $edi
44   ; CHECK-NEXT: {{  $}}
45   ; CHECK-NEXT:   [[V_SET0_:%[0-9]+]]:vr128 = V_SET0
46   ; CHECK-NEXT:   MOVUPSmr %stack.1, 1, $noreg, 0, $noreg, [[V_SET0_]] :: (store (s512) into %stack.1, align 4)
47   ; CHECK-NEXT:   MOVUPSmr %stack.1, 1, $noreg, 16, $noreg, [[V_SET0_]] :: (store (s512) into %stack.1 + 16, align 4)
48   ; CHECK-NEXT:   MOVUPSmr %stack.1, 1, $noreg, 32, $noreg, [[V_SET0_]] :: (store (s512) into %stack.1 + 32, align 4)
49   ; CHECK-NEXT:   MOVUPSmr %stack.1, 1, $noreg, 48, $noreg, [[V_SET0_]] :: (store (s512) into %stack.1 + 48, align 4)
50   ; CHECK-NEXT:   MOV8mi %stack.1, 1, $noreg, 0, $noreg, 1 :: (store (s512) into %stack.1, align 4)
51   ; CHECK-NEXT:   [[COPY:%[0-9]+]]:gr32 = COPY $edi
52   ; CHECK-NEXT:   [[COPY1:%[0-9]+]]:gr32 = COPY killed [[COPY]]
53   ; CHECK-NEXT:   %r0:gr16 = MOV16ri 64
54   ; CHECK-NEXT:   %c0:gr16 = MOV16ri 16
55   ; CHECK-NEXT:   PLDTILECFGV %stack.1, 1, $noreg, 0, $noreg, implicit-def $tmm0, implicit-def $tmm1, implicit-def $tmm2, implicit-def $tmm3, implicit-def $tmm4, implicit-def $tmm5, implicit-def $tmm6, implicit-def $tmm7 :: (load (s512) from %stack.1, align 4)
56   ; CHECK-NEXT:   [[LEA64r:%[0-9]+]]:gr64_nosp = LEA64r %stack.0, 1, $noreg, 0, $noreg
57   ; CHECK-NEXT:   [[LEA64r1:%[0-9]+]]:gr64_nosp = LEA64r %stack.0, 1, $noreg, 0, $noreg
58   ; CHECK-NEXT:   %t0:tile = PTILEZEROV %r0, %c0
59   ; CHECK-NEXT:   [[MOV64ri:%[0-9]+]]:gr64_nosp = MOV64ri 64
60   ; CHECK-NEXT:   TILESTORED %stack.0, 1, killed [[MOV64ri]], 0, $noreg, %t0 :: (store (s8192) into %stack.0)
61   ; CHECK-NEXT:   CMP32ri8 [[COPY1]], 0, implicit-def $eflags
62   ; CHECK-NEXT:   [[SETCCr:%[0-9]+]]:gr8 = SETCCr 4, implicit $eflags
63   ; CHECK-NEXT:   TEST8ri [[SETCCr]], 1, implicit-def $eflags
64   ; CHECK-NEXT:   JCC_1 %bb.2, 5, implicit $eflags
65   ; CHECK-NEXT: {{  $}}
66   ; CHECK-NEXT: bb.1:
67   ; CHECK-NEXT:   successors: %bb.3(0x80000000)
68   ; CHECK-NEXT: {{  $}}
69   ; CHECK-NEXT:   [[MOV16ri:%[0-9]+]]:gr16 = MOV16ri 64
70   ; CHECK-NEXT:   [[MOV16ri1:%[0-9]+]]:gr16 = MOV16ri 16
71   ; CHECK-NEXT:   PLDTILECFGV %stack.1, 1, $noreg, 0, $noreg, implicit-def $tmm0, implicit-def $tmm1, implicit-def $tmm2, implicit-def $tmm3, implicit-def $tmm4, implicit-def $tmm5, implicit-def $tmm6, implicit-def $tmm7 :: (load (s512) from %stack.1, align 4)
72   ; CHECK-NEXT:   [[PTILEZEROV:%[0-9]+]]:tile = PTILEZEROV killed [[MOV16ri1]], killed [[MOV16ri]]
73   ; CHECK-NEXT:   JMP_1 %bb.3
74   ; CHECK-NEXT: {{  $}}
75   ; CHECK-NEXT: bb.2:
76   ; CHECK-NEXT:   successors: %bb.2(0x40000000), %bb.3(0x40000000)
77   ; CHECK-NEXT: {{  $}}
78   ; CHECK-NEXT:   [[PHI:%[0-9]+]]:gr16 = PHI %c0, %bb.0, %11, %bb.3, %17, %bb.2
79   ; CHECK-NEXT:   [[PHI1:%[0-9]+]]:gr16 = PHI %r0, %bb.0, %12, %bb.3, %18, %bb.2
80   ; CHECK-NEXT:   [[PHI2:%[0-9]+]]:gr64_nosp = PHI [[LEA64r1]], %bb.0, %31, %bb.3, %32, %bb.2
81   ; CHECK-NEXT:   [[PHI3:%[0-9]+]]:gr16 = PHI %c0, %bb.0, %11, %bb.3, %17, %bb.2
82   ; CHECK-NEXT:   [[PHI4:%[0-9]+]]:gr16 = PHI %r0, %bb.0, %12, %bb.3, %18, %bb.2
83   ; CHECK-NEXT:   [[PHI5:%[0-9]+]]:gr64_nosp = PHI [[LEA64r]], %bb.0, %24, %bb.3, %25, %bb.2
84   ; CHECK-NEXT:   PLDTILECFGV %stack.1, 1, $noreg, 0, $noreg, implicit-def $tmm0, implicit-def $tmm1, implicit-def $tmm2, implicit-def $tmm3, implicit-def $tmm4, implicit-def $tmm5, implicit-def $tmm6, implicit-def $tmm7 :: (load (s512) from %stack.1, align 4)
85   ; CHECK-NEXT:   [[MOV64ri1:%[0-9]+]]:gr64_nosp = MOV64ri 64
86   ; CHECK-NEXT:   [[PTILELOADDV:%[0-9]+]]:tile = PTILELOADDV [[PHI1]], [[PHI]], [[PHI2]], 1, killed [[MOV64ri1]], 0, $noreg
87   ; CHECK-NEXT:   [[MOV64ri2:%[0-9]+]]:gr64_nosp = MOV64ri 64
88   ; CHECK-NEXT:   [[PTILELOADDV1:%[0-9]+]]:tile = PTILELOADDV [[PHI4]], [[PHI3]], [[PHI5]], 1, killed [[MOV64ri2]], 0, $noreg
89   ; CHECK-NEXT:   [[MOV16ri2:%[0-9]+]]:gr16 = MOV16ri 64
90   ; CHECK-NEXT:   [[MOV16ri3:%[0-9]+]]:gr16 = MOV16ri 16
91   ; CHECK-NEXT:   PLDTILECFGV %stack.1, 1, $noreg, 0, $noreg, implicit-def $tmm0, implicit-def $tmm1, implicit-def $tmm2, implicit-def $tmm3, implicit-def $tmm4, implicit-def $tmm5, implicit-def $tmm6, implicit-def $tmm7 :: (load (s512) from %stack.1, align 4)
92   ; CHECK-NEXT:   [[LEA64r2:%[0-9]+]]:gr64_nosp = LEA64r %stack.3, 1, $noreg, 0, $noreg
93   ; CHECK-NEXT:   [[LEA64r3:%[0-9]+]]:gr64_nosp = LEA64r %stack.3, 1, $noreg, 0, $noreg
94   ; CHECK-NEXT:   [[PTILEZEROV1:%[0-9]+]]:tile = PTILEZEROV [[MOV16ri3]], [[MOV16ri2]]
95   ; CHECK-NEXT:   [[MOV64ri3:%[0-9]+]]:gr64_nosp = MOV64ri 64
96   ; CHECK-NEXT:   TILESTORED %stack.3, 1, killed [[MOV64ri3]], 0, $noreg, [[PTILEZEROV1]] :: (store (s8192) into %stack.3)
97   ; CHECK-NEXT:   TEST8ri [[SETCCr]], 1, implicit-def $eflags
98   ; CHECK-NEXT:   JCC_1 %bb.2, 5, implicit $eflags
99   ; CHECK-NEXT: {{  $}}
100   ; CHECK-NEXT: bb.3:
101   ; CHECK-NEXT:   successors: %bb.2(0x80000000)
102   ; CHECK-NEXT: {{  $}}
103   ; CHECK-NEXT:   [[MOV16ri4:%[0-9]+]]:gr16 = MOV16ri 64
104   ; CHECK-NEXT:   [[MOV16ri5:%[0-9]+]]:gr16 = MOV16ri 16
105   ; CHECK-NEXT:   PLDTILECFGV %stack.1, 1, $noreg, 0, $noreg, implicit-def $tmm0, implicit-def $tmm1, implicit-def $tmm2, implicit-def $tmm3, implicit-def $tmm4, implicit-def $tmm5, implicit-def $tmm6, implicit-def $tmm7 :: (load (s512) from %stack.1, align 4)
106   ; CHECK-NEXT:   [[LEA64r4:%[0-9]+]]:gr64_nosp = LEA64r %stack.2, 1, $noreg, 0, $noreg
107   ; CHECK-NEXT:   [[LEA64r5:%[0-9]+]]:gr64_nosp = LEA64r %stack.2, 1, $noreg, 0, $noreg
108   ; CHECK-NEXT:   [[PTILEZEROV2:%[0-9]+]]:tile = PTILEZEROV [[MOV16ri5]], [[MOV16ri4]]
109   ; CHECK-NEXT:   [[MOV64ri4:%[0-9]+]]:gr64_nosp = MOV64ri 64
110   ; CHECK-NEXT:   TILESTORED %stack.2, 1, killed [[MOV64ri4]], 0, $noreg, [[PTILEZEROV2]] :: (store (s8192) into %stack.2)
111   ; CHECK-NEXT:   JMP_1 %bb.2
112   bb.0.entry:
113     liveins: $edi
115     %12:gr32 = COPY $edi
116     %13:gr32 = COPY killed %12
117     %r0:gr16 = MOV16ri 64
118     %c0:gr16 = MOV16ri 16
119     %t0:tile = PTILEZEROV %r0, %c0
120     CMP32ri8 %13, 0, implicit-def $eflags
121     %16:gr8 = SETCCr 4, implicit $eflags
122     TEST8ri %16, 1, implicit-def $eflags
123     JCC_1 %bb.2, 5, implicit $eflags
125   bb.1:
126     %17:gr16 = MOV16ri 64
127     %18:gr16 = MOV16ri 16
128     %1:tile = PTILEZEROV killed %18, killed %17
129     JMP_1 %bb.3
131   bb.2:
132     %2:tile = PHI %t0, %bb.0, %3, %bb.3, %4, %bb.2
133     %5:tile = PHI %t0, %bb.0, %3, %bb.3, %2, %bb.2
134     %25:gr16 = MOV16ri 64
135     %26:gr16 = MOV16ri 16
136     %4:tile = PTILEZEROV killed %26, killed %25
137     TEST8ri %16, 1, implicit-def $eflags
138     JCC_1 %bb.2, 5, implicit $eflags
140   bb.3:
141     %23:gr16 = MOV16ri 64
142     %24:gr16 = MOV16ri 16
143     %3:tile = PTILEZEROV killed %24, killed %23
144     JMP_1 %bb.2