Run DCE after a LoopFlatten test to reduce spurious output [nfc]
[llvm-project.git] / clang / test / SemaCUDA / amdgpu-bf16.cu
blob0b5ce1a4f64cf571ecce2f055ef09d58035f0de2
1 // REQUIRES: amdgpu-registered-target
2 // REQUIRES: x86-registered-target
4 // RUN: %clang_cc1 "-aux-triple" "x86_64-unknown-linux-gnu" "-triple" "r600-unknown-unknown"\
5 // RUN:    -fcuda-is-device "-aux-target-cpu" "x86-64" -fsyntax-only -verify=r600 %s
7 // AMDGCN has storage-only support for bf16. R600 does not support it should error out when
8 // it's the main target.
10 #include "Inputs/cuda.h"
12 // There should be no errors on using the type itself, or when loading/storing values for amdgcn.
13 // r600 should error on all uses of the type.
15 // r600-error@+1 {{__bf16 is not supported on this target}}
16 typedef __attribute__((ext_vector_type(2))) __bf16 bf16_x2;
17 // r600-error@+1 {{__bf16 is not supported on this target}}
18 typedef __attribute__((ext_vector_type(4))) __bf16 bf16_x4;
19 // r600-error@+1 {{__bf16 is not supported on this target}}
20 typedef __attribute__((ext_vector_type(8))) __bf16 bf16_x8;
21 // r600-error@+1 {{__bf16 is not supported on this target}}
22 typedef __attribute__((ext_vector_type(16))) __bf16 bf16_x16;
24 // r600-error@+1 2 {{__bf16 is not supported on this target}}
25 __device__ void test(bool b, __bf16 *out, __bf16 in) {
26   __bf16 bf16 = in;  // r600-error {{__bf16 is not supported on this target}}
27   *out = bf16;
29   // r600-error@+1 {{__bf16 is not supported on this target}}
30   typedef __attribute__((ext_vector_type(2))) __bf16 bf16_x2;
31   bf16_x2 vec2_a, vec2_b;
32   vec2_a = vec2_b;
34   // r600-error@+1 {{__bf16 is not supported on this target}}
35   typedef __attribute__((ext_vector_type(4))) __bf16 bf16_x4;
36   bf16_x4 vec4_a, vec4_b;
37   vec4_a = vec4_b;
39   // r600-error@+1 {{__bf16 is not supported on this target}}
40   typedef __attribute__((ext_vector_type(8))) __bf16 bf16_x8;
41   bf16_x8 vec8_a, vec8_b;
42   vec8_a = vec8_b;
44   // r600-error@+1 {{__bf16 is not supported on this target}}
45   typedef __attribute__((ext_vector_type(16))) __bf16 bf16_x16;
46   bf16_x16 vec16_a, vec16_b;
47   vec16_a = vec16_b;
50 // r600-error@+1 2 {{__bf16 is not supported on this target}}
51 __bf16 hostfn(__bf16 a) {
52   return a;
55 // r600-error@+2 {{__bf16 is not supported on this target}}
56 // r600-error@+1 {{vector size not an integral multiple of component size}}
57 typedef __bf16 foo __attribute__((__vector_size__(16), __aligned__(16)));