[clang-format] Fix a bug in aligning comments above PPDirective (#72791)
[llvm-project.git] / clang / test / Driver / cuda-arch-translation.cu
blobf37964d87c66a1a65a7eaaad8a8b024763c1f8be
1 // Tests that "sm_XX" gets correctly converted to "compute_YY" when we invoke
2 // fatbinary.
3 //
4 // REQUIRES: x86-registered-target
5 // REQUIRES: nvptx-registered-target
7 // RUN: %clang -### --target=x86_64-linux-gnu -c --cuda-gpu-arch=sm_20 --cuda-path=%S/Inputs/CUDA_80/usr/local/cuda %s 2>&1 \
8 // RUN: | FileCheck -check-prefixes=CUDA,SM20 %s
9 // RUN: %clang -### --target=x86_64-linux-gnu -c --cuda-gpu-arch=sm_21 --cuda-path=%S/Inputs/CUDA_80/usr/local/cuda %s 2>&1 \
10 // RUN: | FileCheck -check-prefixes=CUDA,SM21 %s
11 // RUN: %clang -### --target=x86_64-linux-gnu -c --cuda-gpu-arch=sm_30 --cuda-path=%S/Inputs/CUDA_80/usr/local/cuda %s 2>&1 \
12 // RUN: | FileCheck -check-prefixes=CUDA,SM30 %s
13 // RUN: %clang -### --target=x86_64-linux-gnu -c --cuda-gpu-arch=sm_32 --cuda-path=%S/Inputs/CUDA_80/usr/local/cuda %s 2>&1 \
14 // RUN: | FileCheck -check-prefixes=CUDA,SM32 %s
15 // RUN: %clang -### --target=x86_64-linux-gnu -c --cuda-gpu-arch=sm_35 --cuda-path=%S/Inputs/CUDA_80/usr/local/cuda %s 2>&1 \
16 // RUN: | FileCheck -check-prefixes=CUDA,SM35 %s
17 // RUN: %clang -### --target=x86_64-linux-gnu -c --cuda-gpu-arch=sm_37 --cuda-path=%S/Inputs/CUDA_80/usr/local/cuda %s 2>&1 \
18 // RUN: | FileCheck -check-prefixes=CUDA,SM37 %s
19 // RUN: %clang -### --target=x86_64-linux-gnu -c --cuda-gpu-arch=sm_50 --cuda-path=%S/Inputs/CUDA_80/usr/local/cuda %s 2>&1 \
20 // RUN: | FileCheck -check-prefixes=CUDA,SM50 %s
21 // RUN: %clang -### --target=x86_64-linux-gnu -c --cuda-gpu-arch=sm_52 --cuda-path=%S/Inputs/CUDA_80/usr/local/cuda %s 2>&1 \
22 // RUN: | FileCheck -check-prefixes=CUDA,SM52 %s
23 // RUN: %clang -### --target=x86_64-linux-gnu -c --cuda-gpu-arch=sm_53 --cuda-path=%S/Inputs/CUDA_80/usr/local/cuda %s 2>&1 \
24 // RUN: | FileCheck -check-prefixes=CUDA,SM53 %s
25 // RUN: %clang -### --target=x86_64-linux-gnu -c --cuda-gpu-arch=sm_60 --cuda-path=%S/Inputs/CUDA_80/usr/local/cuda %s 2>&1 \
26 // RUN: | FileCheck -check-prefixes=CUDA,SM60 %s
27 // RUN: %clang -### --target=x86_64-linux-gnu -c --cuda-gpu-arch=sm_61 --cuda-path=%S/Inputs/CUDA_80/usr/local/cuda %s 2>&1 \
28 // RUN: | FileCheck -check-prefixes=CUDA,SM61 %s
29 // RUN: %clang -### --target=x86_64-linux-gnu -c --cuda-gpu-arch=sm_62 --cuda-path=%S/Inputs/CUDA_80/usr/local/cuda %s 2>&1 \
30 // RUN: | FileCheck -check-prefixes=CUDA,SM62 %s
31 // RUN: %clang -### --target=x86_64-linux-gnu -c --cuda-gpu-arch=sm_70 --cuda-path=%S/Inputs/CUDA_111/usr/local/cuda %s 2>&1 \
32 // RUN: | FileCheck -check-prefixes=CUDA,SM70 %s
33 // RUN: %clang -x hip -### --target=x86_64-linux-gnu -c --cuda-gpu-arch=gfx600 -nogpuinc -nogpulib %s 2>&1 \
34 // RUN: | FileCheck -check-prefixes=HIP,GFX600 %s
35 // RUN: %clang -x hip -### --target=x86_64-linux-gnu -c --cuda-gpu-arch=gfx601 -nogpuinc -nogpulib %s 2>&1 \
36 // RUN: | FileCheck -check-prefixes=HIP,GFX601 %s
37 // RUN: %clang -x hip -### --target=x86_64-linux-gnu -c --cuda-gpu-arch=gfx602 -nogpuinc -nogpulib %s 2>&1 \
38 // RUN: | FileCheck -check-prefixes=HIP,GFX602 %s
39 // RUN: %clang -x hip -### --target=x86_64-linux-gnu -c --cuda-gpu-arch=gfx700 -nogpuinc -nogpulib %s 2>&1 \
40 // RUN: | FileCheck -check-prefixes=HIP,GFX700 %s
41 // RUN: %clang -x hip -### --target=x86_64-linux-gnu -c --cuda-gpu-arch=gfx701 -nogpuinc -nogpulib %s 2>&1 \
42 // RUN: | FileCheck -check-prefixes=HIP,GFX701 %s
43 // RUN: %clang -x hip -### --target=x86_64-linux-gnu -c --cuda-gpu-arch=gfx702 -nogpuinc -nogpulib %s 2>&1 \
44 // RUN: | FileCheck -check-prefixes=HIP,GFX702 %s
45 // RUN: %clang -x hip -### --target=x86_64-linux-gnu -c --cuda-gpu-arch=gfx703 -nogpuinc -nogpulib %s 2>&1 \
46 // RUN: | FileCheck -check-prefixes=HIP,GFX703 %s
47 // RUN: %clang -x hip -### --target=x86_64-linux-gnu -c --cuda-gpu-arch=gfx704 -nogpuinc -nogpulib %s 2>&1 \
48 // RUN: | FileCheck -check-prefixes=HIP,GFX704 %s
49 // RUN: %clang -x hip -### --target=x86_64-linux-gnu -c --cuda-gpu-arch=gfx705 -nogpuinc -nogpulib %s 2>&1 \
50 // RUN: | FileCheck -check-prefixes=HIP,GFX705 %s
51 // RUN: %clang -x hip -### --target=x86_64-linux-gnu -c --cuda-gpu-arch=gfx801 -nogpuinc -nogpulib %s 2>&1 \
52 // RUN: | FileCheck -check-prefixes=HIP,GFX801 %s
53 // RUN: %clang -x hip -### --target=x86_64-linux-gnu -c --cuda-gpu-arch=gfx802 -nogpuinc -nogpulib %s 2>&1 \
54 // RUN: | FileCheck -check-prefixes=HIP,GFX802 %s
55 // RUN: %clang -x hip -### --target=x86_64-linux-gnu -c --cuda-gpu-arch=gfx803 -nogpuinc -nogpulib %s 2>&1 \
56 // RUN: | FileCheck -check-prefixes=HIP,GFX803 %s
57 // RUN: %clang -x hip -### --target=x86_64-linux-gnu -c --cuda-gpu-arch=gfx805 -nogpuinc -nogpulib %s 2>&1 \
58 // RUN: | FileCheck -check-prefixes=HIP,GFX805 %s
59 // RUN: %clang -x hip -### --target=x86_64-linux-gnu -c --cuda-gpu-arch=gfx810 -nogpuinc -nogpulib %s 2>&1 \
60 // RUN: | FileCheck -check-prefixes=HIP,GFX810 %s
61 // RUN: %clang -x hip -### --target=x86_64-linux-gnu -c --cuda-gpu-arch=gfx900 -nogpuinc -nogpulib %s 2>&1 \
62 // RUN: | FileCheck -check-prefixes=HIP,GFX900 %s
63 // RUN: %clang -x hip -### --target=x86_64-linux-gnu -c --cuda-gpu-arch=gfx902 -nogpuinc -nogpulib %s 2>&1 \
64 // RUN: | FileCheck -check-prefixes=HIP,GFX902 %s
66 // CUDA: ptxas
67 // CUDA-SAME: -m64
68 // CUDA: fatbinary
70 // HIP: clang-offload-bundler
72 // SM20:--image=profile=sm_20{{.*}}--image=profile=compute_20
73 // SM21:--image=profile=sm_21{{.*}}--image=profile=compute_20
74 // SM30:--image=profile=sm_30{{.*}}--image=profile=compute_30
75 // SM32:--image=profile=sm_32{{.*}}--image=profile=compute_32
76 // SM35:--image=profile=sm_35{{.*}}--image=profile=compute_35
77 // SM37:--image=profile=sm_37{{.*}}--image=profile=compute_37
78 // SM50:--image=profile=sm_50{{.*}}--image=profile=compute_50
79 // SM52:--image=profile=sm_52{{.*}}--image=profile=compute_52
80 // SM53:--image=profile=sm_53{{.*}}--image=profile=compute_53
81 // SM60:--image=profile=sm_60{{.*}}--image=profile=compute_60
82 // SM61:--image=profile=sm_61{{.*}}--image=profile=compute_61
83 // SM62:--image=profile=sm_62{{.*}}--image=profile=compute_62
84 // SM70:--image=profile=sm_70{{.*}}--image=profile=compute_70
85 // GFX600:-targets=host-x86_64-unknown-linux,hipv4-amdgcn-amd-amdhsa--gfx600
86 // GFX601:-targets=host-x86_64-unknown-linux,hipv4-amdgcn-amd-amdhsa--gfx601
87 // GFX602:-targets=host-x86_64-unknown-linux,hipv4-amdgcn-amd-amdhsa--gfx602
88 // GFX700:-targets=host-x86_64-unknown-linux,hipv4-amdgcn-amd-amdhsa--gfx700
89 // GFX701:-targets=host-x86_64-unknown-linux,hipv4-amdgcn-amd-amdhsa--gfx701
90 // GFX702:-targets=host-x86_64-unknown-linux,hipv4-amdgcn-amd-amdhsa--gfx702
91 // GFX703:-targets=host-x86_64-unknown-linux,hipv4-amdgcn-amd-amdhsa--gfx703
92 // GFX704:-targets=host-x86_64-unknown-linux,hipv4-amdgcn-amd-amdhsa--gfx704
93 // GFX705:-targets=host-x86_64-unknown-linux,hipv4-amdgcn-amd-amdhsa--gfx705
94 // GFX801:-targets=host-x86_64-unknown-linux,hipv4-amdgcn-amd-amdhsa--gfx801
95 // GFX802:-targets=host-x86_64-unknown-linux,hipv4-amdgcn-amd-amdhsa--gfx802
96 // GFX803:-targets=host-x86_64-unknown-linux,hipv4-amdgcn-amd-amdhsa--gfx803
97 // GFX805:-targets=host-x86_64-unknown-linux,hipv4-amdgcn-amd-amdhsa--gfx805
98 // GFX810:-targets=host-x86_64-unknown-linux,hipv4-amdgcn-amd-amdhsa--gfx810
99 // GFX900:-targets=host-x86_64-unknown-linux,hipv4-amdgcn-amd-amdhsa--gfx900
100 // GFX902:-targets=host-x86_64-unknown-linux,hipv4-amdgcn-amd-amdhsa--gfx902