Run DCE after a LoopFlatten test to reduce spurious output [nfc]
[llvm-project.git] / llvm / test / CodeGen / X86 / avx-cvt.ll
blob1bd25273ecd48800c06c4cb1c53e3f95b7920f51
1 ; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
2 ; RUN: llc < %s -disable-peephole -mtriple=x86_64-unknown-unknown -mattr=+avx | FileCheck %s --check-prefix=CHECK --check-prefix=AVX
3 ; RUN: llc < %s -disable-peephole -mtriple=x86_64-unknown-unknown -mattr=+avx512f | FileCheck %s --check-prefix=CHECK --check-prefix=AVX512
5 define <8 x float> @sitofp00(<8 x i32> %a) nounwind {
6 ; CHECK-LABEL: sitofp00:
7 ; CHECK:       # %bb.0:
8 ; CHECK-NEXT:    vcvtdq2ps %ymm0, %ymm0
9 ; CHECK-NEXT:    retq
10   %b = sitofp <8 x i32> %a to <8 x float>
11   ret <8 x float> %b
14 define <8 x i32> @fptosi00(<8 x float> %a) nounwind {
15 ; CHECK-LABEL: fptosi00:
16 ; CHECK:       # %bb.0:
17 ; CHECK-NEXT:    vcvttps2dq %ymm0, %ymm0
18 ; CHECK-NEXT:    retq
19   %b = fptosi <8 x float> %a to <8 x i32>
20   ret <8 x i32> %b
23 define <4 x double> @sitofp01(<4 x i32> %a) {
24 ; CHECK-LABEL: sitofp01:
25 ; CHECK:       # %bb.0:
26 ; CHECK-NEXT:    vcvtdq2pd %xmm0, %ymm0
27 ; CHECK-NEXT:    retq
28   %b = sitofp <4 x i32> %a to <4 x double>
29   ret <4 x double> %b
32 define <8 x float> @sitofp02(<8 x i16> %a) {
33 ; AVX-LABEL: sitofp02:
34 ; AVX:       # %bb.0:
35 ; AVX-NEXT:    vpmovsxwd %xmm0, %xmm1
36 ; AVX-NEXT:    vpshufd {{.*#+}} xmm0 = xmm0[2,3,2,3]
37 ; AVX-NEXT:    vpmovsxwd %xmm0, %xmm0
38 ; AVX-NEXT:    vinsertf128 $1, %xmm0, %ymm1, %ymm0
39 ; AVX-NEXT:    vcvtdq2ps %ymm0, %ymm0
40 ; AVX-NEXT:    retq
42 ; AVX512-LABEL: sitofp02:
43 ; AVX512:       # %bb.0:
44 ; AVX512-NEXT:    vpmovsxwd %xmm0, %ymm0
45 ; AVX512-NEXT:    vcvtdq2ps %ymm0, %ymm0
46 ; AVX512-NEXT:    retq
47   %b = sitofp <8 x i16> %a to <8 x float>
48   ret <8 x float> %b
51 define <4 x i32> @fptosi01(<4 x double> %a) {
52 ; CHECK-LABEL: fptosi01:
53 ; CHECK:       # %bb.0:
54 ; CHECK-NEXT:    vcvttpd2dq %ymm0, %xmm0
55 ; CHECK-NEXT:    vzeroupper
56 ; CHECK-NEXT:    retq
57   %b = fptosi <4 x double> %a to <4 x i32>
58   ret <4 x i32> %b
61 define <8 x float> @fptrunc00(<8 x double> %b) nounwind {
62 ; AVX-LABEL: fptrunc00:
63 ; AVX:       # %bb.0:
64 ; AVX-NEXT:    vcvtpd2ps %ymm0, %xmm0
65 ; AVX-NEXT:    vcvtpd2ps %ymm1, %xmm1
66 ; AVX-NEXT:    vinsertf128 $1, %xmm1, %ymm0, %ymm0
67 ; AVX-NEXT:    retq
69 ; AVX512-LABEL: fptrunc00:
70 ; AVX512:       # %bb.0:
71 ; AVX512-NEXT:    vcvtpd2ps %zmm0, %ymm0
72 ; AVX512-NEXT:    retq
73   %a = fptrunc <8 x double> %b to <8 x float>
74   ret <8 x float> %a
77 define <4 x float> @fptrunc01(<2 x double> %a0, <4 x float> %a1) nounwind {
78 ; CHECK-LABEL: fptrunc01:
79 ; CHECK:       # %bb.0:
80 ; CHECK-NEXT:    vcvtsd2ss %xmm0, %xmm1, %xmm0
81 ; CHECK-NEXT:    retq
82   %ext = extractelement <2 x double> %a0, i32 0
83   %cvt = fptrunc double %ext to float
84   %res = insertelement <4 x float> %a1, float %cvt, i32 0
85   ret <4 x float> %res
88 define <4 x double> @fpext00(<4 x float> %b) nounwind {
89 ; CHECK-LABEL: fpext00:
90 ; CHECK:       # %bb.0:
91 ; CHECK-NEXT:    vcvtps2pd %xmm0, %ymm0
92 ; CHECK-NEXT:    retq
93   %a = fpext <4 x float> %b to <4 x double>
94   ret <4 x double> %a
97 define <2 x double> @fpext01(<2 x double> %a0, <4 x float> %a1) nounwind {
98 ; CHECK-LABEL: fpext01:
99 ; CHECK:       # %bb.0:
100 ; CHECK-NEXT:    vcvtss2sd %xmm1, %xmm0, %xmm0
101 ; CHECK-NEXT:    retq
102   %ext = extractelement <4 x float> %a1, i32 0
103   %cvt = fpext float %ext to double
104   %res = insertelement <2 x double> %a0, double %cvt, i32 0
105   ret <2 x double> %res
108 define double @funcA(ptr nocapture %e) nounwind uwtable readonly ssp {
109 ; CHECK-LABEL: funcA:
110 ; CHECK:       # %bb.0:
111 ; CHECK-NEXT:    vcvtsi2sdq (%rdi), %xmm0, %xmm0
112 ; CHECK-NEXT:    retq
113   %tmp1 = load i64, ptr %e, align 8
114   %conv = sitofp i64 %tmp1 to double
115   ret double %conv
118 define double @funcB(ptr nocapture %e) nounwind uwtable readonly ssp {
119 ; CHECK-LABEL: funcB:
120 ; CHECK:       # %bb.0:
121 ; CHECK-NEXT:    vcvtsi2sdl (%rdi), %xmm0, %xmm0
122 ; CHECK-NEXT:    retq
123   %tmp1 = load i32, ptr %e, align 4
124   %conv = sitofp i32 %tmp1 to double
125   ret double %conv
128 define float @funcC(ptr nocapture %e) nounwind uwtable readonly ssp {
129 ; CHECK-LABEL: funcC:
130 ; CHECK:       # %bb.0:
131 ; CHECK-NEXT:    vcvtsi2ssl (%rdi), %xmm0, %xmm0
132 ; CHECK-NEXT:    retq
133   %tmp1 = load i32, ptr %e, align 4
134   %conv = sitofp i32 %tmp1 to float
135   ret float %conv
138 define float @funcD(ptr nocapture %e) nounwind uwtable readonly ssp {
139 ; CHECK-LABEL: funcD:
140 ; CHECK:       # %bb.0:
141 ; CHECK-NEXT:    vcvtsi2ssq (%rdi), %xmm0, %xmm0
142 ; CHECK-NEXT:    retq
143   %tmp1 = load i64, ptr %e, align 8
144   %conv = sitofp i64 %tmp1 to float
145   ret float %conv
148 define void @fpext() nounwind uwtable {
149 ; CHECK-LABEL: fpext:
150 ; CHECK:       # %bb.0:
151 ; CHECK-NEXT:    vmovss {{.*#+}} xmm0 = mem[0],zero,zero,zero
152 ; CHECK-NEXT:    vcvtss2sd %xmm0, %xmm0, %xmm0
153 ; CHECK-NEXT:    vmovsd %xmm0, -{{[0-9]+}}(%rsp)
154 ; CHECK-NEXT:    retq
155   %f = alloca float, align 4
156   %d = alloca double, align 8
157   %tmp = load float, ptr %f, align 4
158   %conv = fpext float %tmp to double
159   store double %conv, ptr %d, align 8
160   ret void
163 define double @nearbyint_f64(double %a) {
164 ; CHECK-LABEL: nearbyint_f64:
165 ; CHECK:       # %bb.0:
166 ; CHECK-NEXT:    vroundsd $12, %xmm0, %xmm0, %xmm0
167 ; CHECK-NEXT:    retq
168   %res = call double @llvm.nearbyint.f64(double %a)
169   ret double %res
171 declare double @llvm.nearbyint.f64(double %p)
173 define float @floor_f32(float %a) {
174 ; CHECK-LABEL: floor_f32:
175 ; CHECK:       # %bb.0:
176 ; CHECK-NEXT:    vroundss $9, %xmm0, %xmm0, %xmm0
177 ; CHECK-NEXT:    retq
178   %res = call float @llvm.floor.f32(float %a)
179   ret float %res
181 declare float @llvm.floor.f32(float %p)
183 define float @floor_f32_load(ptr %aptr) optsize {
184 ; CHECK-LABEL: floor_f32_load:
185 ; CHECK:       # %bb.0:
186 ; CHECK-NEXT:    vroundss $9, (%rdi), %xmm0, %xmm0
187 ; CHECK-NEXT:    retq
188   %a = load float, ptr %aptr
189   %res = call float @llvm.floor.f32(float %a)
190   ret float %res
193 define float @floor_f32_load_pgso(ptr %aptr) !prof !14 {
194 ; CHECK-LABEL: floor_f32_load_pgso:
195 ; CHECK:       # %bb.0:
196 ; CHECK-NEXT:    vroundss $9, (%rdi), %xmm0, %xmm0
197 ; CHECK-NEXT:    retq
198   %a = load float, ptr %aptr
199   %res = call float @llvm.floor.f32(float %a)
200   ret float %res
203 define double @nearbyint_f64_load(ptr %aptr) optsize {
204 ; CHECK-LABEL: nearbyint_f64_load:
205 ; CHECK:       # %bb.0:
206 ; CHECK-NEXT:    vroundsd $12, (%rdi), %xmm0, %xmm0
207 ; CHECK-NEXT:    retq
208   %a = load double, ptr %aptr
209   %res = call double @llvm.nearbyint.f64(double %a)
210   ret double %res
213 define double @nearbyint_f64_load_pgso(ptr %aptr) !prof !14 {
214 ; CHECK-LABEL: nearbyint_f64_load_pgso:
215 ; CHECK:       # %bb.0:
216 ; CHECK-NEXT:    vroundsd $12, (%rdi), %xmm0, %xmm0
217 ; CHECK-NEXT:    retq
218   %a = load double, ptr %aptr
219   %res = call double @llvm.nearbyint.f64(double %a)
220   ret double %res
223 !llvm.module.flags = !{!0}
224 !0 = !{i32 1, !"ProfileSummary", !1}
225 !1 = !{!2, !3, !4, !5, !6, !7, !8, !9}
226 !2 = !{!"ProfileFormat", !"InstrProf"}
227 !3 = !{!"TotalCount", i64 10000}
228 !4 = !{!"MaxCount", i64 10}
229 !5 = !{!"MaxInternalCount", i64 1}
230 !6 = !{!"MaxFunctionCount", i64 1000}
231 !7 = !{!"NumCounts", i64 3}
232 !8 = !{!"NumFunctions", i64 3}
233 !9 = !{!"DetailedSummary", !10}
234 !10 = !{!11, !12, !13}
235 !11 = !{i32 10000, i64 100, i32 1}
236 !12 = !{i32 999000, i64 100, i32 1}
237 !13 = !{i32 999999, i64 1, i32 2}
238 !14 = !{!"function_entry_count", i64 0}