AMDGPU: Allow f16/bf16 for DS_READ_TR16_B64 gfx950 builtins (#118297)
[llvm-project.git] / openmp / docs / remarks / OMP170.rst
blobf33c7a6921dfc186c9721e78f15cd02981410dca
1 .. _omp170:
3 OpenMP runtime call <call> deduplicated. [OMP170]
4 ====================================================================
6 This optimization remark indicates that a call to an OpenMP runtime call was
7 replaced with the result of an existing one. This occurs when the compiler knows
8 that the result of a runtime call is immutable. Removing duplicate calls is done
9 by replacing all calls to that function with the result of the first call. This
10 cannot be done automatically by the compiler because the implementations of the
11 OpenMP runtime calls live in a separate library the compiler cannot see.
13 Example
14 -------
16 This optimization will trigger for known OpenMP runtime calls whose return value
17 will not change.
19 .. code-block:: c++
21   void foo(int N) {
22     double *A = malloc(N * omp_get_thread_limit());
23     double *B = malloc(N * omp_get_thread_limit());
25   #pragma omp parallel
26     work(&A[omp_get_thread_num() * N]);
27   #pragma omp parallel
28     work(&B[omp_get_thread_num() * N]);
29   }
31 .. code-block:: console
33   $ clang -fopenmp -O2 -Rpass=openmp-opt omp170.c
34   ompi170.c:2:26: remark: OpenMP runtime call omp_get_thread_limit deduplicated. [OMP170]
35   double *A = malloc(N * omp_get_thread_limit());
36                          ^
38 Diagnostic Scope
39 ----------------
41 OpenMP optimization remark.