Run DCE after a LoopFlatten test to reduce spurious output [nfc]
[llvm-project.git] / llvm / test / CodeGen / AMDGPU / GlobalISel / regbankselect-salu-float.mir
blobdba206af69fe77c1441448223d98d3329411a5d4
1 # NOTE: Assertions have been autogenerated by utils/update_mir_test_checks.py
2 # RUN: llc -march=amdgcn -mcpu=gfx1150 -run-pass=regbankselect %s -verify-machineinstrs -o - -regbankselect-fast | FileCheck --check-prefixes=GFX1150 %s
3 # RUN: llc -march=amdgcn -mcpu=gfx1150 -run-pass=regbankselect %s -verify-machineinstrs -o - -regbankselect-greedy | FileCheck --check-prefixes=GFX1150 %s
5 ---
6 name:            fadd_f32
7 legalized:       true
8 body:             |
9   bb.0:
10     liveins: $sgpr0, $sgpr1
12     ; GFX1150-LABEL: name: fadd_f32
13     ; GFX1150: liveins: $sgpr0, $sgpr1
14     ; GFX1150-NEXT: {{  $}}
15     ; GFX1150-NEXT: [[COPY:%[0-9]+]]:sgpr(s32) = COPY $sgpr0
16     ; GFX1150-NEXT: [[COPY1:%[0-9]+]]:sgpr(s32) = COPY $sgpr1
17     ; GFX1150-NEXT: [[FADD:%[0-9]+]]:sgpr(s32) = G_FADD [[COPY]], [[COPY1]]
18     %0:_(s32) = COPY $sgpr0
19     %1:_(s32) = COPY $sgpr1
20     %2:_(s32) = G_FADD %0, %1
21 ...
23 ---
24 name:            fptosi_f32_to_i32
25 legalized:       true
26 body:             |
27   bb.0:
28     liveins: $sgpr0
30     ; GFX1150-LABEL: name: fptosi_f32_to_i32
31     ; GFX1150: liveins: $sgpr0
32     ; GFX1150-NEXT: {{  $}}
33     ; GFX1150-NEXT: [[COPY:%[0-9]+]]:sgpr(s32) = COPY $sgpr0
34     ; GFX1150-NEXT: [[FPTOSI:%[0-9]+]]:sgpr(s32) = G_FPTOSI [[COPY]](s32)
35     %0:_(s32) = COPY $sgpr0
36     %1:_(s32) = G_FPTOSI %0(s32)
37 ...
39 ---
40 name:            fptoui_f32_to_u32
41 legalized:       true
42 body:             |
43   bb.0:
44     liveins: $sgpr0
46     ; GFX1150-LABEL: name: fptoui_f32_to_u32
47     ; GFX1150: liveins: $sgpr0
48     ; GFX1150-NEXT: {{  $}}
49     ; GFX1150-NEXT: [[COPY:%[0-9]+]]:sgpr(s32) = COPY $sgpr0
50     ; GFX1150-NEXT: [[FPTOUI:%[0-9]+]]:sgpr(s32) = G_FPTOUI [[COPY]](s32)
51     %0:_(s32) = COPY $sgpr0
52     %1:_(s32) = G_FPTOUI %0(s32)
53 ...
55 ---
56 name:            sitofp_i32_to_f32
57 legalized:       true
58 body:             |
59   bb.0:
60     liveins: $sgpr0
62     ; GFX1150-LABEL: name: sitofp_i32_to_f32
63     ; GFX1150: liveins: $sgpr0
64     ; GFX1150-NEXT: {{  $}}
65     ; GFX1150-NEXT: [[COPY:%[0-9]+]]:sgpr(s32) = COPY $sgpr0
66     ; GFX1150-NEXT: [[SITOFP:%[0-9]+]]:sgpr(s32) = G_SITOFP [[COPY]](s32)
67     %0:_(s32) = COPY $sgpr0
68     %1:_(s32) = G_SITOFP %0(s32)
69 ...
71 ---
72 name:            uitofp_u32_to_f32
73 legalized:       true
74 body:             |
75   bb.0:
76     liveins: $sgpr0
78     ; GFX1150-LABEL: name: uitofp_u32_to_f32
79     ; GFX1150: liveins: $sgpr0
80     ; GFX1150-NEXT: {{  $}}
81     ; GFX1150-NEXT: [[COPY:%[0-9]+]]:sgpr(s32) = COPY $sgpr0
82     ; GFX1150-NEXT: [[UITOFP:%[0-9]+]]:sgpr(s32) = G_UITOFP [[COPY]](s32)
83     %0:_(s32) = COPY $sgpr0
84     %1:_(s32) = G_UITOFP %0(s32)
85 ...
87 ---
88 name:            fptrunc_f32_to_f16
89 legalized:       true
90 body:             |
91   bb.0:
92     liveins: $sgpr0
94     ; GFX1150-LABEL: name: fptrunc_f32_to_f16
95     ; GFX1150: liveins: $sgpr0
96     ; GFX1150-NEXT: {{  $}}
97     ; GFX1150-NEXT: [[COPY:%[0-9]+]]:sgpr(s32) = COPY $sgpr0
98     ; GFX1150-NEXT: [[FPTRUNC:%[0-9]+]]:sgpr(s16) = G_FPTRUNC [[COPY]](s32)
99     %0:_(s32) = COPY $sgpr0
100     %1:_(s16) = G_FPTRUNC %0(s32)
104 name:            fpext_f16_to_f32
105 legalized:       true
106 body:             |
107   bb.0:
108     liveins: $sgpr0
110     ; GFX1150-LABEL: name: fpext_f16_to_f32
111     ; GFX1150: liveins: $sgpr0
112     ; GFX1150-NEXT: {{  $}}
113     ; GFX1150-NEXT: [[COPY:%[0-9]+]]:sgpr(s32) = COPY $sgpr0
114     ; GFX1150-NEXT: [[TRUNC:%[0-9]+]]:sgpr(s16) = G_TRUNC [[COPY]](s32)
115     %1:_(s32) = COPY $sgpr0
116     %0:_(s16) = G_TRUNC %1(s32)
119 # Tests below should not select scalar registers
122 name:            fadd_f64
123 legalized:       true
124 body:             |
125   bb.0:
126     liveins: $sgpr0_sgpr1, $sgpr2_sgpr3
128     ; GFX1150-LABEL: name: fadd_f64
129     ; GFX1150: liveins: $sgpr0_sgpr1, $sgpr2_sgpr3
130     ; GFX1150-NEXT: {{  $}}
131     ; GFX1150-NEXT: [[COPY:%[0-9]+]]:sgpr(s64) = COPY $sgpr0_sgpr1
132     ; GFX1150-NEXT: [[COPY1:%[0-9]+]]:sgpr(s64) = COPY $sgpr2_sgpr3
133     ; GFX1150-NEXT: [[COPY2:%[0-9]+]]:vgpr(s64) = COPY [[COPY]](s64)
134     ; GFX1150-NEXT: [[COPY3:%[0-9]+]]:vgpr(s64) = COPY [[COPY1]](s64)
135     ; GFX1150-NEXT: [[FADD:%[0-9]+]]:vgpr(s64) = G_FADD [[COPY2]], [[COPY3]]
136     %0:_(s64) = COPY $sgpr0_sgpr1
137     %1:_(s64) = COPY $sgpr2_sgpr3
138     %2:_(s64) = G_FADD %0, %1
142 name:            fptosi_f64_to_i32
143 legalized:       true
144 body:             |
145   bb.0:
146     liveins: $sgpr0, $sgpr1
148     ; GFX1150-LABEL: name: fptosi_f64_to_i32
149     ; GFX1150: liveins: $sgpr0, $sgpr1
150     ; GFX1150-NEXT: {{  $}}
151     ; GFX1150-NEXT: [[COPY:%[0-9]+]]:sgpr(s64) = COPY $sgpr0_sgpr1
152     ; GFX1150-NEXT: [[COPY1:%[0-9]+]]:vgpr(s64) = COPY [[COPY]](s64)
153     ; GFX1150-NEXT: [[FPTOSI:%[0-9]+]]:vgpr(s32) = G_FPTOSI [[COPY1]](s64)
154     %0:_(s64) = COPY $sgpr0_sgpr1
155     %1:_(s32) = G_FPTOSI %0(s64)
159 name:            fptoui_f16_to_u16
160 legalized:       true
161 body:             |
162   bb.0:
163     liveins: $sgpr0
165     ; GFX1150-LABEL: name: fptoui_f16_to_u16
166     ; GFX1150: liveins: $sgpr0
167     ; GFX1150-NEXT: {{  $}}
168     ; GFX1150-NEXT: [[COPY:%[0-9]+]]:sgpr(s32) = COPY $sgpr0
169     ; GFX1150-NEXT: [[TRUNC:%[0-9]+]]:sgpr(s16) = G_TRUNC [[COPY]](s32)
170     ; GFX1150-NEXT: [[COPY1:%[0-9]+]]:vgpr(s16) = COPY [[TRUNC]](s16)
171     ; GFX1150-NEXT: [[FPTOUI:%[0-9]+]]:vgpr(s16) = G_FPTOUI [[COPY1]](s16)
172     %1:_(s32) = COPY $sgpr0
173     %0:_(s16) = G_TRUNC %1(s32)
174     %2:_(s16) = G_FPTOUI %0(s16)
178 name:            sitofp_i32_to_f64
179 legalized:       true
180 body:             |
181   bb.0:
182     liveins: $sgpr0
184     ; GFX1150-LABEL: name: sitofp_i32_to_f64
185     ; GFX1150: liveins: $sgpr0
186     ; GFX1150-NEXT: {{  $}}
187     ; GFX1150-NEXT: [[COPY:%[0-9]+]]:sgpr(s32) = COPY $sgpr0
188     ; GFX1150-NEXT: [[COPY1:%[0-9]+]]:vgpr(s32) = COPY [[COPY]](s32)
189     ; GFX1150-NEXT: [[SITOFP:%[0-9]+]]:vgpr(s64) = G_SITOFP [[COPY1]](s32)
190     %0:_(s32) = COPY $sgpr0
191     %1:_(s64) = G_SITOFP %0(s32)
195 name:            uitofp_u16_to_f16
196 legalized:       true
197 body:             |
198   bb.0:
199     liveins: $sgpr0
201     ; GFX1150-LABEL: name: uitofp_u16_to_f16
202     ; GFX1150: liveins: $sgpr0
203     ; GFX1150-NEXT: {{  $}}
204     ; GFX1150-NEXT: [[COPY:%[0-9]+]]:sgpr(s32) = COPY $sgpr0
205     ; GFX1150-NEXT: [[TRUNC:%[0-9]+]]:sgpr(s16) = G_TRUNC [[COPY]](s32)
206     ; GFX1150-NEXT: [[COPY1:%[0-9]+]]:vgpr(s16) = COPY [[TRUNC]](s16)
207     ; GFX1150-NEXT: [[UITOFP:%[0-9]+]]:vgpr(s16) = G_UITOFP [[COPY1]](s16)
208     %1:_(s32) = COPY $sgpr0
209     %0:_(s16) = G_TRUNC %1(s32)
210     %2:_(s16) = G_UITOFP %0(s16)
214 name:            fptrunc_f64_to_f32
215 legalized:       true
216 body:             |
217   bb.0:
218     liveins: $sgpr0_sgpr1
220     ; GFX1150-LABEL: name: fptrunc_f64_to_f32
221     ; GFX1150: liveins: $sgpr0_sgpr1
222     ; GFX1150-NEXT: {{  $}}
223     ; GFX1150-NEXT: [[COPY:%[0-9]+]]:sgpr(s64) = COPY $sgpr0_sgpr1
224     ; GFX1150-NEXT: [[COPY1:%[0-9]+]]:vgpr(s64) = COPY [[COPY]](s64)
225     ; GFX1150-NEXT: [[FPTRUNC:%[0-9]+]]:vgpr(s32) = G_FPTRUNC [[COPY1]](s64)
226     %0:_(s64) = COPY $sgpr0_sgpr1
227     %1:_(s32) = G_FPTRUNC %0(s64)
231 name:            fpext_f32_to_f64
232 legalized:       true
233 body:             |
234   bb.0:
235     liveins: $sgpr0
237     ; GFX1150-LABEL: name: fpext_f32_to_f64
238     ; GFX1150: liveins: $sgpr0
239     ; GFX1150-NEXT: {{  $}}
240     ; GFX1150-NEXT: [[COPY:%[0-9]+]]:sgpr(s32) = COPY $sgpr0
241     ; GFX1150-NEXT: [[COPY1:%[0-9]+]]:vgpr(s32) = COPY [[COPY]](s32)
242     ; GFX1150-NEXT: [[FPEXT:%[0-9]+]]:vgpr(s64) = G_FPEXT [[COPY1]](s32)
243     %0:_(s32) = COPY $sgpr0
244     %1:_(s64) = G_FPEXT %0(s32)