Run DCE after a LoopFlatten test to reduce spurious output [nfc]
[llvm-project.git] / clang / test / CodeGenCUDA / noinline.cu
blob41e8231246b258c49c87d3af7c348704c4fa0e30
1 // Uses -O2 since the defalt -O0 option adds noinline to all functions.
3 // RUN: %clang_cc1 -triple nvptx-nvidia-cuda -fcuda-is-device \
4 // RUN:     -O2 -disable-llvm-passes -emit-llvm -o - %s | FileCheck %s
6 // RUN: %clang_cc1 -triple amdgcn-amd-amdhsa -fcuda-is-device \
7 // RUN:     -O2 -disable-llvm-passes -emit-llvm -o - -x hip %s | FileCheck %s
9 // RUN: %clang_cc1 -triple x86_64-unknown-gnu-linux \
10 // RUN:     -O2 -disable-llvm-passes -emit-llvm -o - %s | FileCheck %s
12 #include "Inputs/cuda.h"
14 __noinline__ __device__ __host__ void fun1() {}
16 __attribute__((noinline)) __device__ __host__ void fun2() {}
18 __attribute__((__noinline__)) __device__ __host__ void fun3() {}
20 [[gnu::__noinline__]] __device__ __host__ void fun4() {}
22 #define __noinline__ __attribute__((__noinline__))
23 __noinline__ __device__ __host__ void fun5() {}
25 __device__ __host__ void fun6() {}
27 // CHECK: define{{.*}}@_Z4fun1v{{.*}}#[[ATTR1:[0-9]*]]
28 // CHECK: define{{.*}}@_Z4fun2v{{.*}}#[[ATTR1:[0-9]*]]
29 // CHECK: define{{.*}}@_Z4fun3v{{.*}}#[[ATTR1:[0-9]*]]
30 // CHECK: define{{.*}}@_Z4fun4v{{.*}}#[[ATTR1:[0-9]*]]
31 // CHECK: define{{.*}}@_Z4fun5v{{.*}}#[[ATTR1:[0-9]*]]
32 // CHECK: define{{.*}}@_Z4fun6v{{.*}}#[[ATTR2:[0-9]*]]
33 // CHECK: attributes #[[ATTR1]] = {{.*}}noinline
34 // CHECK-NOT: attributes #[[ATTR2]] = {{.*}}noinline