Run DCE after a LoopFlatten test to reduce spurious output [nfc]
[llvm-project.git] / llvm / test / CodeGen / AMDGPU / GlobalISel / inst-select-uadde.mir
blob9e1ba05a7f19c9d3542dd98e7517c3d86601ce90
1 # NOTE: Assertions have been autogenerated by utils/update_mir_test_checks.py
2 # RUN: llc -march=amdgcn -mcpu=tahiti -run-pass=instruction-select -verify-machineinstrs -o - %s  | FileCheck -check-prefix=WAVE64 %s
3 # RUN: llc -march=amdgcn -mcpu=fiji -run-pass=instruction-select -verify-machineinstrs -o - %s  | FileCheck -check-prefix=WAVE64 %s
4 # RUN: llc -march=amdgcn -mcpu=gfx900 -run-pass=instruction-select -verify-machineinstrs -o - %s  | FileCheck -check-prefix=WAVE64 %s
5 # RUN: llc -march=amdgcn -mcpu=gfx1010 -run-pass=instruction-select -verify-machineinstrs -o - %s  | FileCheck -check-prefix=WAVE32 %s
6 # RUN: llc -march=amdgcn -mcpu=gfx1100 -run-pass=instruction-select -verify-machineinstrs -o - %s  | FileCheck -check-prefix=WAVE32 %s
8 ---
9 name: uadde_s32_s1_sss
10 legalized: true
11 regBankSelected: true
13 body: |
14   bb.0:
15     liveins: $sgpr0, $sgpr1, $sgpr2
17     ; WAVE64-LABEL: name: uadde_s32_s1_sss
18     ; WAVE64: liveins: $sgpr0, $sgpr1, $sgpr2
19     ; WAVE64-NEXT: {{  $}}
20     ; WAVE64-NEXT: [[COPY:%[0-9]+]]:sreg_32 = COPY $sgpr0
21     ; WAVE64-NEXT: [[COPY1:%[0-9]+]]:sreg_32 = COPY $sgpr1
22     ; WAVE64-NEXT: [[COPY2:%[0-9]+]]:sreg_32 = COPY $sgpr2
23     ; WAVE64-NEXT: [[S_MOV_B32_:%[0-9]+]]:sreg_32 = S_MOV_B32 0
24     ; WAVE64-NEXT: S_CMP_EQ_U32 [[COPY2]], [[S_MOV_B32_]], implicit-def $scc
25     ; WAVE64-NEXT: [[COPY3:%[0-9]+]]:sreg_32 = COPY $scc
26     ; WAVE64-NEXT: $scc = COPY [[COPY3]]
27     ; WAVE64-NEXT: [[S_ADDC_U32_:%[0-9]+]]:sreg_32 = S_ADDC_U32 [[COPY]], [[COPY1]], implicit-def $scc, implicit $scc
28     ; WAVE64-NEXT: [[COPY4:%[0-9]+]]:sreg_32 = COPY $scc
29     ; WAVE64-NEXT: $scc = COPY [[COPY4]]
30     ; WAVE64-NEXT: [[S_CSELECT_B32_:%[0-9]+]]:sreg_32 = S_CSELECT_B32 [[COPY]], [[COPY1]], implicit $scc
31     ; WAVE64-NEXT: S_ENDPGM 0, implicit [[S_ADDC_U32_]], implicit [[S_CSELECT_B32_]]
32     ;
33     ; WAVE32-LABEL: name: uadde_s32_s1_sss
34     ; WAVE32: liveins: $sgpr0, $sgpr1, $sgpr2
35     ; WAVE32-NEXT: {{  $}}
36     ; WAVE32-NEXT: [[COPY:%[0-9]+]]:sreg_32 = COPY $sgpr0
37     ; WAVE32-NEXT: [[COPY1:%[0-9]+]]:sreg_32 = COPY $sgpr1
38     ; WAVE32-NEXT: [[COPY2:%[0-9]+]]:sreg_32 = COPY $sgpr2
39     ; WAVE32-NEXT: [[S_MOV_B32_:%[0-9]+]]:sreg_32 = S_MOV_B32 0
40     ; WAVE32-NEXT: S_CMP_EQ_U32 [[COPY2]], [[S_MOV_B32_]], implicit-def $scc
41     ; WAVE32-NEXT: [[COPY3:%[0-9]+]]:sreg_32 = COPY $scc
42     ; WAVE32-NEXT: $scc = COPY [[COPY3]]
43     ; WAVE32-NEXT: [[S_ADDC_U32_:%[0-9]+]]:sreg_32 = S_ADDC_U32 [[COPY]], [[COPY1]], implicit-def $scc, implicit $scc
44     ; WAVE32-NEXT: [[COPY4:%[0-9]+]]:sreg_32 = COPY $scc
45     ; WAVE32-NEXT: $scc = COPY [[COPY4]]
46     ; WAVE32-NEXT: [[S_CSELECT_B32_:%[0-9]+]]:sreg_32 = S_CSELECT_B32 [[COPY]], [[COPY1]], implicit $scc
47     ; WAVE32-NEXT: S_ENDPGM 0, implicit [[S_ADDC_U32_]], implicit [[S_CSELECT_B32_]]
48     %0:sgpr(s32) = COPY $sgpr0
49     %1:sgpr(s32) = COPY $sgpr1
50     %2:sgpr(s32) = COPY $sgpr2
51     %3:sgpr(s32) = G_CONSTANT i32 0
52     %4:sgpr(s32) = G_ICMP intpred(eq), %2, %3
53     %5:sgpr(s32), %6:sgpr(s32) = G_UADDE %0, %1, %4
54     %7:sgpr(s32) = G_SELECT %6, %0, %1
55     S_ENDPGM 0, implicit %5, implicit %7
56 ...
58 ---
59 name: uadde_s32_s1_vvv
60 legalized: true
61 regBankSelected: true
63 body: |
64   bb.0:
65     liveins: $vgpr0, $vgpr1, $vgpr2
67     ; WAVE64-LABEL: name: uadde_s32_s1_vvv
68     ; WAVE64: liveins: $vgpr0, $vgpr1, $vgpr2
69     ; WAVE64-NEXT: {{  $}}
70     ; WAVE64-NEXT: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
71     ; WAVE64-NEXT: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr1
72     ; WAVE64-NEXT: [[COPY2:%[0-9]+]]:vgpr_32 = COPY $vgpr2
73     ; WAVE64-NEXT: [[V_MOV_B32_e32_:%[0-9]+]]:vgpr_32 = V_MOV_B32_e32 0, implicit $exec
74     ; WAVE64-NEXT: [[V_CMP_EQ_U32_e64_:%[0-9]+]]:sreg_64_xexec = V_CMP_EQ_U32_e64 [[COPY2]], [[V_MOV_B32_e32_]], implicit $exec
75     ; WAVE64-NEXT: [[V_ADDC_U32_e64_:%[0-9]+]]:vgpr_32, [[V_ADDC_U32_e64_1:%[0-9]+]]:sreg_64_xexec = V_ADDC_U32_e64 [[COPY]], [[COPY1]], [[V_CMP_EQ_U32_e64_]], 0, implicit $exec
76     ; WAVE64-NEXT: [[V_CNDMASK_B32_e64_:%[0-9]+]]:vgpr_32 = V_CNDMASK_B32_e64 0, [[COPY1]], 0, [[COPY]], [[V_ADDC_U32_e64_1]], implicit $exec
77     ; WAVE64-NEXT: S_ENDPGM 0, implicit [[V_ADDC_U32_e64_]], implicit [[V_CNDMASK_B32_e64_]]
78     ;
79     ; WAVE32-LABEL: name: uadde_s32_s1_vvv
80     ; WAVE32: liveins: $vgpr0, $vgpr1, $vgpr2
81     ; WAVE32-NEXT: {{  $}}
82     ; WAVE32-NEXT: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
83     ; WAVE32-NEXT: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr1
84     ; WAVE32-NEXT: [[COPY2:%[0-9]+]]:vgpr_32 = COPY $vgpr2
85     ; WAVE32-NEXT: [[V_MOV_B32_e32_:%[0-9]+]]:vgpr_32 = V_MOV_B32_e32 0, implicit $exec
86     ; WAVE32-NEXT: [[V_CMP_EQ_U32_e64_:%[0-9]+]]:sreg_32_xm0_xexec = V_CMP_EQ_U32_e64 [[COPY2]], [[V_MOV_B32_e32_]], implicit $exec
87     ; WAVE32-NEXT: [[V_ADDC_U32_e64_:%[0-9]+]]:vgpr_32, [[V_ADDC_U32_e64_1:%[0-9]+]]:sreg_32_xm0_xexec = V_ADDC_U32_e64 [[COPY]], [[COPY1]], [[V_CMP_EQ_U32_e64_]], 0, implicit $exec
88     ; WAVE32-NEXT: [[V_CNDMASK_B32_e64_:%[0-9]+]]:vgpr_32 = V_CNDMASK_B32_e64 0, [[COPY1]], 0, [[COPY]], [[V_ADDC_U32_e64_1]], implicit $exec
89     ; WAVE32-NEXT: S_ENDPGM 0, implicit [[V_ADDC_U32_e64_]], implicit [[V_CNDMASK_B32_e64_]]
90     %0:vgpr(s32) = COPY $vgpr0
91     %1:vgpr(s32) = COPY $vgpr1
92     %2:vgpr(s32) = COPY $vgpr2
93     %3:vgpr(s32) = G_CONSTANT i32 0
94     %4:vcc(s1) = G_ICMP intpred(eq), %2, %3
95     %5:vgpr(s32), %6:vcc(s1) = G_UADDE %0, %1, %4
96     %7:vgpr(s32) = G_SELECT %6, %0, %1
97     S_ENDPGM 0, implicit %5, implicit %7
98 ...
101 name: uadde_s32_s1_sss_unused_co
102 legalized: true
103 regBankSelected: true
105 body: |
106   bb.0:
107     liveins: $sgpr0, $sgpr1, $sgpr2
109     ; WAVE64-LABEL: name: uadde_s32_s1_sss_unused_co
110     ; WAVE64: liveins: $sgpr0, $sgpr1, $sgpr2
111     ; WAVE64-NEXT: {{  $}}
112     ; WAVE64-NEXT: [[COPY:%[0-9]+]]:sreg_32 = COPY $sgpr0
113     ; WAVE64-NEXT: [[COPY1:%[0-9]+]]:sreg_32 = COPY $sgpr1
114     ; WAVE64-NEXT: [[COPY2:%[0-9]+]]:sreg_32 = COPY $sgpr2
115     ; WAVE64-NEXT: [[S_MOV_B32_:%[0-9]+]]:sreg_32 = S_MOV_B32 0
116     ; WAVE64-NEXT: S_CMP_EQ_U32 [[COPY2]], [[S_MOV_B32_]], implicit-def $scc
117     ; WAVE64-NEXT: [[COPY3:%[0-9]+]]:sreg_32 = COPY $scc
118     ; WAVE64-NEXT: $scc = COPY [[COPY3]]
119     ; WAVE64-NEXT: [[S_ADDC_U32_:%[0-9]+]]:sreg_32 = S_ADDC_U32 [[COPY]], [[COPY1]], implicit-def dead $scc, implicit $scc
120     ; WAVE64-NEXT: S_ENDPGM 0, implicit [[S_ADDC_U32_]]
121     ;
122     ; WAVE32-LABEL: name: uadde_s32_s1_sss_unused_co
123     ; WAVE32: liveins: $sgpr0, $sgpr1, $sgpr2
124     ; WAVE32-NEXT: {{  $}}
125     ; WAVE32-NEXT: [[COPY:%[0-9]+]]:sreg_32 = COPY $sgpr0
126     ; WAVE32-NEXT: [[COPY1:%[0-9]+]]:sreg_32 = COPY $sgpr1
127     ; WAVE32-NEXT: [[COPY2:%[0-9]+]]:sreg_32 = COPY $sgpr2
128     ; WAVE32-NEXT: [[S_MOV_B32_:%[0-9]+]]:sreg_32 = S_MOV_B32 0
129     ; WAVE32-NEXT: S_CMP_EQ_U32 [[COPY2]], [[S_MOV_B32_]], implicit-def $scc
130     ; WAVE32-NEXT: [[COPY3:%[0-9]+]]:sreg_32 = COPY $scc
131     ; WAVE32-NEXT: $scc = COPY [[COPY3]]
132     ; WAVE32-NEXT: [[S_ADDC_U32_:%[0-9]+]]:sreg_32 = S_ADDC_U32 [[COPY]], [[COPY1]], implicit-def dead $scc, implicit $scc
133     ; WAVE32-NEXT: S_ENDPGM 0, implicit [[S_ADDC_U32_]]
134     %0:sgpr(s32) = COPY $sgpr0
135     %1:sgpr(s32) = COPY $sgpr1
136     %2:sgpr(s32) = COPY $sgpr2
137     %3:sgpr(s32) = G_CONSTANT i32 0
138     %4:sgpr(s32) = G_ICMP intpred(eq), %2, %3
139     %5:sgpr(s32), %6:sgpr(s32) = G_UADDE %0, %1, %4
140     S_ENDPGM 0, implicit %5
144 name: uadde_s32_s1_vvv_unused_co
145 legalized: true
146 regBankSelected: true
148 body: |
149   bb.0:
150     liveins: $vgpr0, $vgpr1, $vgpr2
152     ; WAVE64-LABEL: name: uadde_s32_s1_vvv_unused_co
153     ; WAVE64: liveins: $vgpr0, $vgpr1, $vgpr2
154     ; WAVE64-NEXT: {{  $}}
155     ; WAVE64-NEXT: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
156     ; WAVE64-NEXT: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr1
157     ; WAVE64-NEXT: [[COPY2:%[0-9]+]]:vgpr_32 = COPY $vgpr2
158     ; WAVE64-NEXT: [[V_MOV_B32_e32_:%[0-9]+]]:vgpr_32 = V_MOV_B32_e32 0, implicit $exec
159     ; WAVE64-NEXT: [[V_CMP_EQ_U32_e64_:%[0-9]+]]:sreg_64_xexec = V_CMP_EQ_U32_e64 [[COPY2]], [[V_MOV_B32_e32_]], implicit $exec
160     ; WAVE64-NEXT: [[V_ADDC_U32_e64_:%[0-9]+]]:vgpr_32, [[V_ADDC_U32_e64_1:%[0-9]+]]:sreg_64_xexec = V_ADDC_U32_e64 [[COPY]], [[COPY1]], [[V_CMP_EQ_U32_e64_]], 0, implicit $exec
161     ; WAVE64-NEXT: S_ENDPGM 0, implicit [[V_ADDC_U32_e64_]]
162     ;
163     ; WAVE32-LABEL: name: uadde_s32_s1_vvv_unused_co
164     ; WAVE32: liveins: $vgpr0, $vgpr1, $vgpr2
165     ; WAVE32-NEXT: {{  $}}
166     ; WAVE32-NEXT: [[COPY:%[0-9]+]]:vgpr_32 = COPY $vgpr0
167     ; WAVE32-NEXT: [[COPY1:%[0-9]+]]:vgpr_32 = COPY $vgpr1
168     ; WAVE32-NEXT: [[COPY2:%[0-9]+]]:vgpr_32 = COPY $vgpr2
169     ; WAVE32-NEXT: [[V_MOV_B32_e32_:%[0-9]+]]:vgpr_32 = V_MOV_B32_e32 0, implicit $exec
170     ; WAVE32-NEXT: [[V_CMP_EQ_U32_e64_:%[0-9]+]]:sreg_32_xm0_xexec = V_CMP_EQ_U32_e64 [[COPY2]], [[V_MOV_B32_e32_]], implicit $exec
171     ; WAVE32-NEXT: [[V_ADDC_U32_e64_:%[0-9]+]]:vgpr_32, [[V_ADDC_U32_e64_1:%[0-9]+]]:sreg_32_xm0_xexec = V_ADDC_U32_e64 [[COPY]], [[COPY1]], [[V_CMP_EQ_U32_e64_]], 0, implicit $exec
172     ; WAVE32-NEXT: S_ENDPGM 0, implicit [[V_ADDC_U32_e64_]]
173     %0:vgpr(s32) = COPY $vgpr0
174     %1:vgpr(s32) = COPY $vgpr1
175     %2:vgpr(s32) = COPY $vgpr2
176     %3:vgpr(s32) = G_CONSTANT i32 0
177     %4:vcc(s1) = G_ICMP intpred(eq), %2, %3
178     %5:vgpr(s32), %6:vcc(s1) = G_UADDE %0, %1, %4
179     S_ENDPGM 0, implicit %5