Run DCE after a LoopFlatten test to reduce spurious output [nfc]
[llvm-project.git] / clang / test / CodeGen / X86 / avx512bf16-builtins.c
blob8eb93e6889bea8a25856af46bb206677bc31494d
1 // RUN: %clang_cc1 -flax-vector-conversions=none -ffreestanding %s -triple=x86_64-apple-darwin \
2 // RUN: -target-feature +avx512bf16 -emit-llvm -o - -Wall -Werror \
3 // RUN: | FileCheck %s
5 #include <immintrin.h>
7 float test_mm_cvtsbh_ss(__bf16 A) {
8 // CHECK-LABEL: @test_mm_cvtsbh_ss
9 // CHECK: fpext bfloat %{{.*}} to float
10 // CHECK: ret float %{{.*}}
11 return _mm_cvtsbh_ss(A);
14 __m512bh test_mm512_cvtne2ps_pbh(__m512 A, __m512 B) {
15 // CHECK-LABEL: @test_mm512_cvtne2ps_pbh
16 // CHECK: @llvm.x86.avx512bf16.cvtne2ps2bf16.512
17 // CHECK: ret <32 x bfloat> %{{.*}}
18 return _mm512_cvtne2ps_pbh(A, B);
21 __m512bh test_mm512_maskz_cvtne2ps_pbh(__m512 A, __m512 B, __mmask32 U) {
22 // CHECK-LABEL: @test_mm512_maskz_cvtne2ps_pbh
23 // CHECK: @llvm.x86.avx512bf16.cvtne2ps2bf16.512
24 // CHECK: select <32 x i1> %{{.*}}, <32 x bfloat> %{{.*}}, <32 x bfloat> %{{.*}}
25 // CHECK: ret <32 x bfloat> %{{.*}}
26 return _mm512_maskz_cvtne2ps_pbh(U, A, B);
29 __m512bh test_mm512_mask_cvtne2ps_pbh(__m512bh C, __mmask32 U, __m512 A, __m512 B) {
30 // CHECK-LABEL: @test_mm512_mask_cvtne2ps_pbh
31 // CHECK: @llvm.x86.avx512bf16.cvtne2ps2bf16.512
32 // CHECK: select <32 x i1> %{{.*}}, <32 x bfloat> %{{.*}}, <32 x bfloat> %{{.*}}
33 // CHECK: ret <32 x bfloat> %{{.*}}
34 return _mm512_mask_cvtne2ps_pbh(C, U, A, B);
37 __m256bh test_mm512_cvtneps_pbh(__m512 A) {
38 // CHECK-LABEL: @test_mm512_cvtneps_pbh
39 // CHECK: @llvm.x86.avx512bf16.cvtneps2bf16.512
40 // CHECK: ret <16 x bfloat> %{{.*}}
41 return _mm512_cvtneps_pbh(A);
44 __m256bh test_mm512_mask_cvtneps_pbh(__m256bh C, __mmask16 U, __m512 A) {
45 // CHECK-LABEL: @test_mm512_mask_cvtneps_pbh
46 // CHECK: @llvm.x86.avx512bf16.cvtneps2bf16.512
47 // CHECK: select <16 x i1> %{{.*}}, <16 x bfloat> %{{.*}}, <16 x bfloat> %{{.*}}
48 // CHECK: ret <16 x bfloat> %{{.*}}
49 return _mm512_mask_cvtneps_pbh(C, U, A);
52 __m256bh test_mm512_maskz_cvtneps_pbh(__m512 A, __mmask16 U) {
53 // CHECK-LABEL: @test_mm512_maskz_cvtneps_pbh
54 // CHECK: @llvm.x86.avx512bf16.cvtneps2bf16.512
55 // CHECK: select <16 x i1> %{{.*}}, <16 x bfloat> %{{.*}}, <16 x bfloat> %{{.*}}
56 // CHECK: ret <16 x bfloat> %{{.*}}
57 return _mm512_maskz_cvtneps_pbh(U, A);
60 __m512 test_mm512_dpbf16_ps(__m512 D, __m512bh A, __m512bh B) {
61 // CHECK-LABEL: @test_mm512_dpbf16_ps
62 // CHECK: @llvm.x86.avx512bf16.dpbf16ps.512
63 // CHECK: ret <16 x float> %{{.*}}
64 return _mm512_dpbf16_ps(D, A, B);
67 __m512 test_mm512_maskz_dpbf16_ps(__m512 D, __m512bh A, __m512bh B, __mmask16 U) {
68 // CHECK-LABEL: @test_mm512_maskz_dpbf16_ps
69 // CHECK: @llvm.x86.avx512bf16.dpbf16ps.512
70 // CHECK: select <16 x i1> %{{.*}}, <16 x float> %{{.*}}, <16 x float> %{{.*}}
71 // CHECK: ret <16 x float> %{{.*}}
72 return _mm512_maskz_dpbf16_ps(U, D, A, B);
75 __m512 test_mm512_mask_dpbf16_ps(__m512 D, __m512bh A, __m512bh B, __mmask16 U) {
76 // CHECK-LABEL: @test_mm512_mask_dpbf16_ps
77 // CHECK: @llvm.x86.avx512bf16.dpbf16ps.512
78 // CHECK: select <16 x i1> %{{.*}}, <16 x float> %{{.*}}, <16 x float> %{{.*}}
79 // CHECK: ret <16 x float> %{{.*}}
80 return _mm512_mask_dpbf16_ps(D, U, A, B);
83 __m512 test_mm512_cvtpbh_ps(__m256bh A) {
84 // CHECK-LABEL: @test_mm512_cvtpbh_ps
85 // CHECK: sext <16 x i16> %{{.*}} to <16 x i32>
86 // CHECK: @llvm.x86.avx512.pslli.d.512
87 // CHECK: ret <16 x float> %{{.*}}
88 return _mm512_cvtpbh_ps(A);
91 __m512 test_mm512_maskz_cvtpbh_ps(__mmask16 M, __m256bh A) {
92 // CHECK-LABEL: @test_mm512_maskz_cvtpbh_ps
93 // CHECK: sext <16 x i16> %{{.*}} to <16 x i32>
94 // CHECK: select <16 x i1> %{{.*}}, <16 x i32> %{{.*}}, <16 x i32> %{{.*}}
95 // CHECK: @llvm.x86.avx512.pslli.d.512
96 // CHECK: ret <16 x float> %{{.*}}
97 return _mm512_maskz_cvtpbh_ps(M, A);
100 __m512 test_mm512_mask_cvtpbh_ps(__m512 S, __mmask16 M, __m256bh A) {
101 // CHECK-LABEL: @test_mm512_mask_cvtpbh_ps
102 // CHECK: sext <16 x i16> %{{.*}} to <16 x i32>
103 // CHECK: @llvm.x86.avx512.pslli.d.512
104 // CHECK: select <16 x i1> %{{.*}}, <16 x i32> %{{.*}}, <16 x i32> %{{.*}}
105 // CHECK: ret <16 x float> %{{.*}}
106 return _mm512_mask_cvtpbh_ps(S, M, A);