[clang][modules] Don't prevent translation of FW_Private includes when explicitly...
[llvm-project.git] / llvm / test / CodeGen / X86 / AMX / amx-fastconfig-phi.mir
blobe79f4d1f989a916fb896023a83fa6c3c4cace75a
1 # NOTE: Assertions have been autogenerated by utils/update_mir_test_checks.py
2 # RUN: llc -mtriple=x86_64-- -mattr=+amx-tile -run-pass=fastpretileconfig -o - %s | FileCheck %s
4 # This case test tile phi is nested accessed, but the its def block is
5 # not visited yet.
7 #                  BB.5
8 #           %6 = phi(%3, b%10) <-----
9 #            |               |      |
10 #            |               |      |
11 #          BB.6             BB.7    |
12 #            \              /       |
13 #              \          /         |
14 #                \      /           |
15 #                  BB.8 -------------
16 #            %10 = phi(%8, %9)
18 # #define STRIDE 32
19 # void foo(int cond, char *buf) {
20 #   __tile1024i a = {16, 64};
21 #   __tile1024i b = {16, 64};
22 #   __tile1024i c = {16, 64};
24 #   if (cond) {
25 #     __tile_zero(&c);
26 #   } else {
27 #     __tile_loadd(&c, buf, STRIDE);
28 #   }
29 #   __tile_zero(&a);
30 #   __tile_zero(&b);
31 #   for(int i = 0; i < 10; i++) {
32 #     __tile_dpbssd(&c, a, b);
33 #     if (cond) {
34 #       __tile_zero(&c);
35 #     } else {
36 #       __tile_loadd(&c, buf, STRIDE);
37 #     }
38 #   }
39 #   __tile_stored(buf, STRIDE, c);
40 # }
41 ---
42 name:            foo
43 alignment:       16
44 tracksRegLiveness: true
45 registers:
46   - { id: 0, class: gr8 }
47   - { id: 1, class: tile }
48   - { id: 2, class: tile }
49   - { id: 3, class: tile }
50   - { id: 4, class: tile }
51   - { id: 5, class: tile }
52   - { id: 6, class: gr32 }
53   - { id: 7, class: tile }
54   - { id: 8, class: tile }
55   - { id: 9, class: tile }
56   - { id: 10, class: tile }
57   - { id: 11, class: gr32 }
58   - { id: 12, class: gr32 }
59   - { id: 13, class: gr32 }
60   - { id: 14, class: gr64 }
61   - { id: 15, class: gr64 }
62   - { id: 16, class: gr8 }
63   - { id: 17, class: gr16 }
64   - { id: 18, class: gr16 }
65   - { id: 19, class: gr64_nosp }
66   - { id: 20, class: gr16 }
67   - { id: 21, class: gr16 }
68   - { id: 22, class: gr32 }
69   - { id: 23, class: gr16 }
70   - { id: 24, class: gr16 }
71   - { id: 25, class: gr16 }
72   - { id: 26, class: gr16 }
73   - { id: 27, class: gr16 }
74   - { id: 28, class: gr16 }
75   - { id: 29, class: tile }
76   - { id: 30, class: gr16 }
77   - { id: 31, class: gr16 }
78   - { id: 32, class: gr64_nosp }
79   - { id: 33, class: gr16 }
80   - { id: 34, class: gr16 }
81   - { id: 35, class: gr32 }
82   - { id: 36, class: gr64_nosp }
83   - { id: 37, class: gr16 }
84   - { id: 38, class: gr16 }
85 liveins:
86   - { reg: '$edi', virtual-reg: '%12' }
87   - { reg: '$rsi', virtual-reg: '%14' }
88 frameInfo:
89   maxAlignment:    1
90 machineFunctionInfo: {}
91 body:             |
92   ; CHECK-LABEL: name: foo
93   ; CHECK: bb.0.entry:
94   ; CHECK-NEXT:   successors: %bb.2(0x40000000), %bb.1(0x40000000)
95   ; CHECK-NEXT:   liveins: $edi, $rsi
96   ; CHECK-NEXT: {{  $}}
97   ; CHECK-NEXT:   [[V_SET0_:%[0-9]+]]:vr128 = V_SET0
98   ; CHECK-NEXT:   MOVUPSmr %stack.1, 1, $noreg, 0, $noreg, [[V_SET0_]] :: (store (s512) into %stack.1, align 4)
99   ; CHECK-NEXT:   MOVUPSmr %stack.1, 1, $noreg, 16, $noreg, [[V_SET0_]] :: (store (s512) into %stack.1 + 16, align 4)
100   ; CHECK-NEXT:   MOVUPSmr %stack.1, 1, $noreg, 32, $noreg, [[V_SET0_]] :: (store (s512) into %stack.1 + 32, align 4)
101   ; CHECK-NEXT:   MOVUPSmr %stack.1, 1, $noreg, 48, $noreg, [[V_SET0_]] :: (store (s512) into %stack.1 + 48, align 4)
102   ; CHECK-NEXT:   MOV8mi %stack.1, 1, $noreg, 0, $noreg, 1 :: (store (s512) into %stack.1, align 4)
103   ; CHECK-NEXT:   [[COPY:%[0-9]+]]:gr64 = COPY $rsi
104   ; CHECK-NEXT:   [[COPY1:%[0-9]+]]:gr32 = COPY $edi
105   ; CHECK-NEXT:   [[COPY2:%[0-9]+]]:gr32 = COPY killed [[COPY1]]
106   ; CHECK-NEXT:   [[COPY3:%[0-9]+]]:gr64 = COPY killed [[COPY]]
107   ; CHECK-NEXT:   CMP32ri8 [[COPY2]], 0, implicit-def $eflags
108   ; CHECK-NEXT:   [[SETCCr:%[0-9]+]]:gr8 = SETCCr 4, implicit $eflags
109   ; CHECK-NEXT:   TEST8ri [[SETCCr]], 1, implicit-def $eflags
110   ; CHECK-NEXT:   JCC_1 %bb.2, 5, implicit $eflags
111   ; CHECK-NEXT: {{  $}}
112   ; CHECK-NEXT: bb.1:
113   ; CHECK-NEXT:   successors: %bb.3(0x80000000)
114   ; CHECK-NEXT: {{  $}}
115   ; CHECK-NEXT:   [[MOV16ri:%[0-9]+]]:gr16 = MOV16ri 64
116   ; CHECK-NEXT:   [[MOV16ri1:%[0-9]+]]:gr16 = MOV16ri 16
117   ; CHECK-NEXT:   PLDTILECFGV %stack.1, 1, $noreg, 0, $noreg, implicit-def $tmm0, implicit-def $tmm1, implicit-def $tmm2, implicit-def $tmm3, implicit-def $tmm4, implicit-def $tmm5, implicit-def $tmm6, implicit-def $tmm7 :: (load (s512) from %stack.1, align 4)
118   ; CHECK-NEXT:   [[LEA64r:%[0-9]+]]:gr64_nosp = LEA64r %stack.0, 1, $noreg, 0, $noreg
119   ; CHECK-NEXT:   [[PTILEZEROV:%[0-9]+]]:tile = PTILEZEROV [[MOV16ri1]], [[MOV16ri]]
120   ; CHECK-NEXT:   [[MOV64ri:%[0-9]+]]:gr64_nosp = MOV64ri 64
121   ; CHECK-NEXT:   TILESTORED %stack.0, 1, killed [[MOV64ri]], 0, $noreg, [[PTILEZEROV]] :: (store (s8192) into %stack.0)
122   ; CHECK-NEXT:   JMP_1 %bb.3
123   ; CHECK-NEXT: {{  $}}
124   ; CHECK-NEXT: bb.2:
125   ; CHECK-NEXT:   successors: %bb.3(0x80000000)
126   ; CHECK-NEXT: {{  $}}
127   ; CHECK-NEXT:   [[MOV32ri64_:%[0-9]+]]:gr64_nosp = MOV32ri64 32
128   ; CHECK-NEXT:   [[MOV16ri2:%[0-9]+]]:gr16 = MOV16ri 64
129   ; CHECK-NEXT:   [[MOV16ri3:%[0-9]+]]:gr16 = MOV16ri 16
130   ; CHECK-NEXT:   PLDTILECFGV %stack.1, 1, $noreg, 0, $noreg, implicit-def $tmm0, implicit-def $tmm1, implicit-def $tmm2, implicit-def $tmm3, implicit-def $tmm4, implicit-def $tmm5, implicit-def $tmm6, implicit-def $tmm7 :: (load (s512) from %stack.1, align 4)
131   ; CHECK-NEXT:   [[LEA64r1:%[0-9]+]]:gr64_nosp = LEA64r %stack.2, 1, $noreg, 0, $noreg
132   ; CHECK-NEXT:   [[PTILELOADDV:%[0-9]+]]:tile = PTILELOADDV [[MOV16ri3]], [[MOV16ri2]], [[COPY3]], 1, killed [[MOV32ri64_]], 0, $noreg
133   ; CHECK-NEXT:   [[MOV64ri1:%[0-9]+]]:gr64_nosp = MOV64ri 64
134   ; CHECK-NEXT:   TILESTORED %stack.2, 1, killed [[MOV64ri1]], 0, $noreg, [[PTILELOADDV]] :: (store (s8192) into %stack.2)
135   ; CHECK-NEXT: {{  $}}
136   ; CHECK-NEXT: bb.3:
137   ; CHECK-NEXT:   successors: %bb.5(0x80000000)
138   ; CHECK-NEXT: {{  $}}
139   ; CHECK-NEXT:   [[PHI:%[0-9]+]]:gr16 = PHI [[MOV16ri]], %bb.1, [[MOV16ri2]], %bb.2
140   ; CHECK-NEXT:   [[PHI1:%[0-9]+]]:gr16 = PHI [[MOV16ri1]], %bb.1, [[MOV16ri3]], %bb.2
141   ; CHECK-NEXT:   [[PHI2:%[0-9]+]]:gr64_nosp = PHI [[LEA64r]], %bb.1, [[LEA64r1]], %bb.2
142   ; CHECK-NEXT:   PLDTILECFGV %stack.1, 1, $noreg, 0, $noreg, implicit-def $tmm0, implicit-def $tmm1, implicit-def $tmm2, implicit-def $tmm3, implicit-def $tmm4, implicit-def $tmm5, implicit-def $tmm6, implicit-def $tmm7 :: (load (s512) from %stack.1, align 4)
143   ; CHECK-NEXT:   [[MOV64ri2:%[0-9]+]]:gr64_nosp = MOV64ri 64
144   ; CHECK-NEXT:   [[LEA64r2:%[0-9]+]]:gr64_nosp = LEA64r %stack.5, 1, $noreg, 0, $noreg
145   ; CHECK-NEXT:   [[PTILELOADDV1:%[0-9]+]]:tile = PTILELOADDV [[PHI1]], [[PHI]], [[PHI2]], 1, killed [[MOV64ri2]], 0, $noreg
146   ; CHECK-NEXT:   [[MOV64ri3:%[0-9]+]]:gr64_nosp = MOV64ri 64
147   ; CHECK-NEXT:   TILESTORED %stack.5, 1, killed [[MOV64ri3]], 0, $noreg, [[PTILELOADDV1]] :: (store (s8192) into %stack.5)
148   ; CHECK-NEXT:   [[MOV16ri4:%[0-9]+]]:gr16 = MOV16ri 64
149   ; CHECK-NEXT:   [[MOV16ri5:%[0-9]+]]:gr16 = MOV16ri 16
150   ; CHECK-NEXT:   PLDTILECFGV %stack.1, 1, $noreg, 0, $noreg, implicit-def $tmm0, implicit-def $tmm1, implicit-def $tmm2, implicit-def $tmm3, implicit-def $tmm4, implicit-def $tmm5, implicit-def $tmm6, implicit-def $tmm7 :: (load (s512) from %stack.1, align 4)
151   ; CHECK-NEXT:   [[PTILEZEROV1:%[0-9]+]]:tile = PTILEZEROV [[MOV16ri5]], [[MOV16ri4]]
152   ; CHECK-NEXT:   [[MOV64ri4:%[0-9]+]]:gr64_nosp = MOV64ri 64
153   ; CHECK-NEXT:   TILESTORED %stack.4, 1, killed [[MOV64ri4]], 0, $noreg, [[PTILEZEROV1]] :: (store (s8192) into %stack.4)
154   ; CHECK-NEXT:   [[MOV16ri6:%[0-9]+]]:gr16 = MOV16ri 64
155   ; CHECK-NEXT:   [[MOV16ri7:%[0-9]+]]:gr16 = MOV16ri 16
156   ; CHECK-NEXT:   PLDTILECFGV %stack.1, 1, $noreg, 0, $noreg, implicit-def $tmm0, implicit-def $tmm1, implicit-def $tmm2, implicit-def $tmm3, implicit-def $tmm4, implicit-def $tmm5, implicit-def $tmm6, implicit-def $tmm7 :: (load (s512) from %stack.1, align 4)
157   ; CHECK-NEXT:   [[PTILEZEROV2:%[0-9]+]]:tile = PTILEZEROV [[MOV16ri7]], [[MOV16ri6]]
158   ; CHECK-NEXT:   [[MOV64ri5:%[0-9]+]]:gr64_nosp = MOV64ri 64
159   ; CHECK-NEXT:   TILESTORED %stack.3, 1, killed [[MOV64ri5]], 0, $noreg, [[PTILEZEROV2]] :: (store (s8192) into %stack.3)
160   ; CHECK-NEXT:   [[MOV32r0_:%[0-9]+]]:gr32 = MOV32r0 implicit-def $eflags
161   ; CHECK-NEXT:   JMP_1 %bb.5
162   ; CHECK-NEXT: {{  $}}
163   ; CHECK-NEXT: bb.4:
164   ; CHECK-NEXT:   PLDTILECFGV %stack.1, 1, $noreg, 0, $noreg, implicit-def $tmm0, implicit-def $tmm1, implicit-def $tmm2, implicit-def $tmm3, implicit-def $tmm4, implicit-def $tmm5, implicit-def $tmm6, implicit-def $tmm7 :: (load (s512) from %stack.1, align 4)
165   ; CHECK-NEXT:   [[MOV32ri64_1:%[0-9]+]]:gr64_nosp = MOV32ri64 32
166   ; CHECK-NEXT:   [[MOV16ri8:%[0-9]+]]:gr16 = MOV16ri 64
167   ; CHECK-NEXT:   [[MOV16ri9:%[0-9]+]]:gr16 = MOV16ri 16
168   ; CHECK-NEXT:   [[MOV64ri6:%[0-9]+]]:gr64_nosp = MOV64ri 64
169   ; CHECK-NEXT:   [[PTILELOADDV2:%[0-9]+]]:tile = PTILELOADDV %59, %60, %stack.9, 1, killed [[MOV64ri6]], 0, $noreg :: (load (s8192) from %stack.9)
170   ; CHECK-NEXT:   PTILESTOREDV killed [[MOV16ri9]], killed [[MOV16ri8]], [[COPY3]], 1, killed [[MOV32ri64_1]], 0, $noreg, [[PTILELOADDV2]]
171   ; CHECK-NEXT:   RET64
172   ; CHECK-NEXT: {{  $}}
173   ; CHECK-NEXT: bb.5:
174   ; CHECK-NEXT:   successors: %bb.7(0x40000000), %bb.6(0x40000000)
175   ; CHECK-NEXT: {{  $}}
176   ; CHECK-NEXT:   [[PHI3:%[0-9]+]]:gr32 = PHI [[MOV32r0_]], %bb.3, %35, %bb.8
177   ; CHECK-NEXT:   [[PHI4:%[0-9]+]]:gr16 = PHI [[PHI]], %bb.3, %60, %bb.8
178   ; CHECK-NEXT:   [[PHI5:%[0-9]+]]:gr16 = PHI [[PHI1]], %bb.3, %59, %bb.8
179   ; CHECK-NEXT:   [[PHI6:%[0-9]+]]:gr64_nosp = PHI [[LEA64r2]], %bb.3, %58, %bb.8
180   ; CHECK-NEXT:   PLDTILECFGV %stack.1, 1, $noreg, 0, $noreg, implicit-def $tmm0, implicit-def $tmm1, implicit-def $tmm2, implicit-def $tmm3, implicit-def $tmm4, implicit-def $tmm5, implicit-def $tmm6, implicit-def $tmm7 :: (load (s512) from %stack.1, align 4)
181   ; CHECK-NEXT:   [[MOV64ri7:%[0-9]+]]:gr64_nosp = MOV64ri 64
182   ; CHECK-NEXT:   [[PTILELOADDV3:%[0-9]+]]:tile = PTILELOADDV [[PHI5]], [[PHI4]], [[PHI6]], 1, killed [[MOV64ri7]], 0, $noreg
183   ; CHECK-NEXT:   [[MOV64ri8:%[0-9]+]]:gr64_nosp = MOV64ri 64
184   ; CHECK-NEXT:   TILESTORED %stack.8, 1, killed [[MOV64ri8]], 0, $noreg, [[PTILELOADDV3]] :: (store (s8192) into %stack.8)
185   ; CHECK-NEXT:   [[MOV16ri10:%[0-9]+]]:gr16 = MOV16ri 64
186   ; CHECK-NEXT:   [[MOV16ri11:%[0-9]+]]:gr16 = MOV16ri 16
187   ; CHECK-NEXT:   PLDTILECFGV %stack.1, 1, $noreg, 0, $noreg, implicit-def $tmm0, implicit-def $tmm1, implicit-def $tmm2, implicit-def $tmm3, implicit-def $tmm4, implicit-def $tmm5, implicit-def $tmm6, implicit-def $tmm7 :: (load (s512) from %stack.1, align 4)
188   ; CHECK-NEXT:   [[MOV64ri9:%[0-9]+]]:gr64_nosp = MOV64ri 64
189   ; CHECK-NEXT:   [[PTILELOADDV4:%[0-9]+]]:tile = PTILELOADDV [[MOV16ri7]], [[MOV16ri6]], %stack.3, 1, killed [[MOV64ri9]], 0, $noreg :: (load (s8192) from %stack.3)
190   ; CHECK-NEXT:   [[MOV64ri10:%[0-9]+]]:gr64_nosp = MOV64ri 64
191   ; CHECK-NEXT:   [[PTILELOADDV5:%[0-9]+]]:tile = PTILELOADDV [[MOV16ri5]], [[MOV16ri4]], %stack.4, 1, killed [[MOV64ri10]], 0, $noreg :: (load (s8192) from %stack.4)
192   ; CHECK-NEXT:   [[MOV64ri11:%[0-9]+]]:gr64_nosp = MOV64ri 64
193   ; CHECK-NEXT:   [[PTILELOADDV6:%[0-9]+]]:tile = PTILELOADDV [[PHI5]], [[PHI4]], %stack.8, 1, killed [[MOV64ri11]], 0, $noreg :: (load (s8192) from %stack.8)
194   ; CHECK-NEXT:   [[PTDPBSSDV:%[0-9]+]]:tile = PTDPBSSDV killed [[MOV16ri11]], [[MOV16ri10]], [[MOV16ri10]], [[PTILELOADDV6]], [[PTILELOADDV5]], [[PTILELOADDV4]]
195   ; CHECK-NEXT:   TEST8ri [[SETCCr]], 1, implicit-def $eflags
196   ; CHECK-NEXT:   JCC_1 %bb.7, 5, implicit $eflags
197   ; CHECK-NEXT: {{  $}}
198   ; CHECK-NEXT: bb.6:
199   ; CHECK-NEXT:   successors: %bb.8(0x80000000)
200   ; CHECK-NEXT: {{  $}}
201   ; CHECK-NEXT:   [[MOV16ri12:%[0-9]+]]:gr16 = MOV16ri 64
202   ; CHECK-NEXT:   [[MOV16ri13:%[0-9]+]]:gr16 = MOV16ri 16
203   ; CHECK-NEXT:   PLDTILECFGV %stack.1, 1, $noreg, 0, $noreg, implicit-def $tmm0, implicit-def $tmm1, implicit-def $tmm2, implicit-def $tmm3, implicit-def $tmm4, implicit-def $tmm5, implicit-def $tmm6, implicit-def $tmm7 :: (load (s512) from %stack.1, align 4)
204   ; CHECK-NEXT:   [[LEA64r3:%[0-9]+]]:gr64_nosp = LEA64r %stack.6, 1, $noreg, 0, $noreg
205   ; CHECK-NEXT:   [[PTILEZEROV3:%[0-9]+]]:tile = PTILEZEROV [[MOV16ri13]], [[MOV16ri12]]
206   ; CHECK-NEXT:   [[MOV64ri12:%[0-9]+]]:gr64_nosp = MOV64ri 64
207   ; CHECK-NEXT:   TILESTORED %stack.6, 1, killed [[MOV64ri12]], 0, $noreg, [[PTILEZEROV3]] :: (store (s8192) into %stack.6)
208   ; CHECK-NEXT:   JMP_1 %bb.8
209   ; CHECK-NEXT: {{  $}}
210   ; CHECK-NEXT: bb.7:
211   ; CHECK-NEXT:   successors: %bb.8(0x80000000)
212   ; CHECK-NEXT: {{  $}}
213   ; CHECK-NEXT:   [[MOV32ri64_2:%[0-9]+]]:gr64_nosp = MOV32ri64 32
214   ; CHECK-NEXT:   [[MOV16ri14:%[0-9]+]]:gr16 = MOV16ri 64
215   ; CHECK-NEXT:   [[MOV16ri15:%[0-9]+]]:gr16 = MOV16ri 16
216   ; CHECK-NEXT:   PLDTILECFGV %stack.1, 1, $noreg, 0, $noreg, implicit-def $tmm0, implicit-def $tmm1, implicit-def $tmm2, implicit-def $tmm3, implicit-def $tmm4, implicit-def $tmm5, implicit-def $tmm6, implicit-def $tmm7 :: (load (s512) from %stack.1, align 4)
217   ; CHECK-NEXT:   [[LEA64r4:%[0-9]+]]:gr64_nosp = LEA64r %stack.7, 1, $noreg, 0, $noreg
218   ; CHECK-NEXT:   [[PTILELOADDV7:%[0-9]+]]:tile = PTILELOADDV [[MOV16ri15]], [[MOV16ri14]], [[COPY3]], 1, killed [[MOV32ri64_2]], 0, $noreg
219   ; CHECK-NEXT:   [[MOV64ri13:%[0-9]+]]:gr64_nosp = MOV64ri 64
220   ; CHECK-NEXT:   TILESTORED %stack.7, 1, killed [[MOV64ri13]], 0, $noreg, [[PTILELOADDV7]] :: (store (s8192) into %stack.7)
221   ; CHECK-NEXT: {{  $}}
222   ; CHECK-NEXT: bb.8:
223   ; CHECK-NEXT:   successors: %bb.4(0x40000000), %bb.5(0x40000000)
224   ; CHECK-NEXT: {{  $}}
225   ; CHECK-NEXT:   [[PHI7:%[0-9]+]]:gr16 = PHI [[MOV16ri12]], %bb.6, [[MOV16ri14]], %bb.7
226   ; CHECK-NEXT:   [[PHI8:%[0-9]+]]:gr16 = PHI [[MOV16ri13]], %bb.6, [[MOV16ri15]], %bb.7
227   ; CHECK-NEXT:   [[PHI9:%[0-9]+]]:gr64_nosp = PHI [[LEA64r3]], %bb.6, [[LEA64r4]], %bb.7
228   ; CHECK-NEXT:   PLDTILECFGV %stack.1, 1, $noreg, 0, $noreg, implicit-def $tmm0, implicit-def $tmm1, implicit-def $tmm2, implicit-def $tmm3, implicit-def $tmm4, implicit-def $tmm5, implicit-def $tmm6, implicit-def $tmm7 :: (load (s512) from %stack.1, align 4)
229   ; CHECK-NEXT:   [[MOV64ri14:%[0-9]+]]:gr64_nosp = MOV64ri 64
230   ; CHECK-NEXT:   [[PTILELOADDV8:%[0-9]+]]:tile = PTILELOADDV [[PHI8]], [[PHI7]], [[PHI9]], 1, killed [[MOV64ri14]], 0, $noreg
231   ; CHECK-NEXT:   [[MOV64ri15:%[0-9]+]]:gr64_nosp = MOV64ri 64
232   ; CHECK-NEXT:   TILESTORED %stack.9, 1, killed [[MOV64ri15]], 0, $noreg, [[PTILELOADDV8]] :: (store (s8192) into %stack.9)
233   ; CHECK-NEXT:   [[ADD32ri8_:%[0-9]+]]:gr32 = ADD32ri8 [[PHI3]], 1, implicit-def $eflags
234   ; CHECK-NEXT:   CMP32ri8 [[ADD32ri8_]], 10, implicit-def $eflags
235   ; CHECK-NEXT:   JCC_1 %bb.4, 4, implicit $eflags
236   ; CHECK-NEXT:   JMP_1 %bb.5
237   bb.0.entry:
238     liveins: $edi, $rsi
240     %14:gr64 = COPY $rsi
241     %12:gr32 = COPY $edi
242     %13:gr32 = COPY killed %12
243     %15:gr64 = COPY killed %14
244     CMP32ri8 %13, 0, implicit-def $eflags
245     %16:gr8 = SETCCr 4, implicit $eflags
246     TEST8ri %16, 1, implicit-def $eflags
247     JCC_1 %bb.2, 5, implicit $eflags
249   bb.1:
250     %17:gr16 = MOV16ri 64
251     %18:gr16 = MOV16ri 16
252     %1:tile = PTILEZEROV killed %18, killed %17
253     JMP_1 %bb.3
255   bb.2:
256     %19:gr64_nosp = MOV32ri64 32
257     %20:gr16 = MOV16ri 64
258     %21:gr16 = MOV16ri 16
259     %2:tile = PTILELOADDV killed %21, killed %20, %15, 1, killed %19, 0, $noreg
261   bb.3:
263     %3:tile = PHI %1, %bb.1, %2, %bb.2
264     %25:gr16 = MOV16ri 64
265     %26:gr16 = MOV16ri 16
266     %4:tile = PTILEZEROV killed %26, killed %25
267     %23:gr16 = MOV16ri 64
268     %24:gr16 = MOV16ri 16
269     %5:tile = PTILEZEROV killed %24, killed %23
270     %22:gr32 = MOV32r0 implicit-def $eflags
271     JMP_1 %bb.5
273   bb.4:
274     %36:gr64_nosp = MOV32ri64 32
275     %37:gr16 = MOV16ri 64
276     %38:gr16 = MOV16ri 16
277     PTILESTOREDV killed %38, killed %37, %15, 1, killed %36, 0, $noreg, %10
278     RET64
280   bb.5:
282     %6:gr32 = PHI %22, %bb.3, %35, %bb.8
283     %7:tile = PHI %3, %bb.3, %10, %bb.8
284     %27:gr16 = MOV16ri 64
285     %28:gr16 = MOV16ri 16
286     %29:tile = PTDPBSSDV killed %28, %27, %27, %7, %4, %5
287     TEST8ri %16, 1, implicit-def $eflags
288     JCC_1 %bb.7, 5, implicit $eflags
290   bb.6:
291     %30:gr16 = MOV16ri 64
292     %31:gr16 = MOV16ri 16
293     %8:tile = PTILEZEROV killed %31, killed %30
294     JMP_1 %bb.8
296   bb.7:
297     %32:gr64_nosp = MOV32ri64 32
298     %33:gr16 = MOV16ri 64
299     %34:gr16 = MOV16ri 16
300     %9:tile = PTILELOADDV killed %34, killed %33, %15, 1, killed %32, 0, $noreg
302   bb.8:
304     %10:tile = PHI %8, %bb.6, %9, %bb.7
305     %35:gr32 = ADD32ri8 %6, 1, implicit-def $eflags
306     CMP32ri8 %35, 10, implicit-def $eflags
307     JCC_1 %bb.4, 4, implicit $eflags
308     JMP_1 %bb.5