[DAG] TransformFPLoadStorePair - early out if we're not loading a simple type
[llvm-project.git] / clang / test / OpenMP / master_taskloop_simd_codegen.cpp
blob47fb9c06b2e4958e7739eb10f4c239d48c3349e2
1 // RUN: %clang_cc1 -verify -triple x86_64-apple-darwin10 -fopenmp -fopenmp-version=45 -x c++ -emit-llvm %s -o - -femit-all-decls | FileCheck %s --check-prefix CHECK --check-prefix OMP45
2 // RUN: %clang_cc1 -fopenmp -fopenmp-version=45 -x c++ -triple x86_64-apple-darwin10 -emit-pch -o %t %s
3 // RUN: %clang_cc1 -fopenmp -fopenmp-version=45 -x c++ -triple x86_64-apple-darwin10 -include-pch %t -verify %s -emit-llvm -o - -femit-all-decls | FileCheck %s --check-prefix CHECK --check-prefix OMP45
4 // RUN: %clang_cc1 -verify -triple x86_64-apple-darwin10 -fopenmp -x c++ -emit-llvm %s -o - | FileCheck %s --check-prefix CHECK --check-prefix OMP50
5 // RUN: %clang_cc1 -fopenmp -x c++ -triple x86_64-apple-darwin10 -emit-pch -o %t %s
6 // RUN: %clang_cc1 -fopenmp -x c++ -triple x86_64-apple-darwin10 -include-pch %t -verify %s -emit-llvm -o - | FileCheck %s --check-prefix CHECK --check-prefix OMP50
8 // RUN: %clang_cc1 -verify -triple x86_64-apple-darwin10 -fopenmp-simd -fopenmp-version=45 -x c++ -emit-llvm %s -o - -femit-all-decls | FileCheck --check-prefix SIMD-ONLY0 %s
9 // RUN: %clang_cc1 -fopenmp-simd -fopenmp-version=45 -x c++ -triple x86_64-apple-darwin10 -emit-pch -o %t %s
10 // RUN: %clang_cc1 -fopenmp-simd -fopenmp-version=45 -x c++ -triple x86_64-apple-darwin10 -include-pch %t -verify %s -emit-llvm -o - -femit-all-decls | FileCheck --check-prefix SIMD-ONLY0 %s
11 // RUN: %clang_cc1 -verify -triple x86_64-apple-darwin10 -fopenmp-simd -x c++ -emit-llvm %s -o - -femit-all-decls | FileCheck --check-prefix SIMD-ONLY0 %s
12 // RUN: %clang_cc1 -fopenmp-simd -x c++ -triple x86_64-apple-darwin10 -emit-pch -o %t %s
13 // RUN: %clang_cc1 -fopenmp-simd -x c++ -triple x86_64-apple-darwin10 -include-pch %t -verify %s -emit-llvm -o - -femit-all-decls | FileCheck --check-prefix SIMD-ONLY0 %s
14 // SIMD-ONLY0-NOT: {{__kmpc|__tgt}}
15 // expected-no-diagnostics
16 #ifndef HEADER
17 #define HEADER
19 // CHECK-LABEL: @main
20 int main(int argc, char **argv) {
21 // CHECK: [[GTID:%.+]] = call i32 @__kmpc_global_thread_num(ptr [[DEFLOC:@.+]])
22 // CHECK: [[RES:%.+]] = call {{.*}}i32 @__kmpc_master(ptr [[DEFLOC]], i32 [[GTID]])
23 // CHECK-NEXT: [[IS_MASTER:%.+]] = icmp ne i32 [[RES]], 0
24 // CHECK-NEXT: br i1 [[IS_MASTER]], label {{%?}}[[THEN:.+]], label {{%?}}[[EXIT:.+]]
25 // CHECK: [[THEN]]
26 // CHECK: call void @__kmpc_taskgroup(ptr [[DEFLOC]], i32 [[GTID]])
27 // CHECK: [[TASKV:%.+]] = call ptr @__kmpc_omp_task_alloc(ptr [[DEFLOC]], i32 [[GTID]], i32 33, i64 80, i64 1, ptr [[TASK1:@.+]])
28 // CHECK: [[TASK_DATA:%.+]] = getelementptr inbounds nuw %{{.+}}, ptr [[TASKV]], i32 0, i32 0
29 // CHECK: [[DOWN:%.+]] = getelementptr inbounds nuw [[TD_TY:%.+]], ptr [[TASK_DATA]], i32 0, i32 5
30 // CHECK: store i64 0, ptr [[DOWN]],
31 // CHECK: [[UP:%.+]] = getelementptr inbounds nuw [[TD_TY]], ptr [[TASK_DATA]], i32 0, i32 6
32 // CHECK: store i64 9, ptr [[UP]],
33 // CHECK: [[ST:%.+]] = getelementptr inbounds nuw [[TD_TY]], ptr [[TASK_DATA]], i32 0, i32 7
34 // CHECK: store i64 1, ptr [[ST]],
35 // CHECK: [[ST_VAL:%.+]] = load i64, ptr [[ST]],
36 // CHECK: call void @__kmpc_taskloop(ptr [[DEFLOC]], i32 [[GTID]], ptr [[TASKV]], i32 1, ptr [[DOWN]], ptr [[UP]], i64 [[ST_VAL]], i32 1, i32 0, i64 0, ptr null)
37 // CHECK: call void @__kmpc_end_taskgroup(ptr [[DEFLOC]], i32 [[GTID]])
38 // CHECK: call {{.*}}void @__kmpc_end_master(ptr [[DEFLOC]], i32 [[GTID]])
39 // CHECK-NEXT: br label {{%?}}[[EXIT]]
40 // CHECK: [[EXIT]]
41 #pragma omp master taskloop simd priority(argc)
42 for (int i = 0; i < 10; ++i)
44 // CHECK: [[RES:%.+]] = call {{.*}}i32 @__kmpc_master(ptr [[DEFLOC]], i32 [[GTID]])
45 // CHECK-NEXT: [[IS_MASTER:%.+]] = icmp ne i32 [[RES]], 0
46 // CHECK-NEXT: br i1 [[IS_MASTER]], label {{%?}}[[THEN:.+]], label {{%?}}[[EXIT:.+]]
47 // CHECK: [[THEN]]
48 // CHECK: [[TASKV:%.+]] = call ptr @__kmpc_omp_task_alloc(ptr [[DEFLOC]], i32 [[GTID]], i32 1, i64 80, i64 1, ptr [[TASK2:@.+]])
49 // CHECK: [[TASK_DATA:%.+]] = getelementptr inbounds nuw %{{.+}}, ptr [[TASKV]], i32 0, i32 0
50 // CHECK: [[DOWN:%.+]] = getelementptr inbounds nuw [[TD_TY:%.+]], ptr [[TASK_DATA]], i32 0, i32 5
51 // CHECK: store i64 0, ptr [[DOWN]],
52 // CHECK: [[UP:%.+]] = getelementptr inbounds nuw [[TD_TY]], ptr [[TASK_DATA]], i32 0, i32 6
53 // CHECK: store i64 9, ptr [[UP]],
54 // CHECK: [[ST:%.+]] = getelementptr inbounds nuw [[TD_TY]], ptr [[TASK_DATA]], i32 0, i32 7
55 // CHECK: store i64 1, ptr [[ST]],
56 // CHECK: [[ST_VAL:%.+]] = load i64, ptr [[ST]],
57 // CHECK: [[GRAINSIZE:%.+]] = zext i32 %{{.+}} to i64
58 // CHECK: call void @__kmpc_taskloop(ptr [[DEFLOC]], i32 [[GTID]], ptr [[TASKV]], i32 1, ptr [[DOWN]], ptr [[UP]], i64 [[ST_VAL]], i32 1, i32 1, i64 [[GRAINSIZE]], ptr null)
59 // CHECK: call {{.*}}void @__kmpc_end_master(ptr [[DEFLOC]], i32 [[GTID]])
60 // CHECK-NEXT: br label {{%?}}[[EXIT]]
61 // CHECK: [[EXIT]]
62 #pragma omp master taskloop simd nogroup grainsize(argc) simdlen(4)
63 for (int i = 0; i < 10; ++i)
65 // CHECK: [[RES:%.+]] = call {{.*}}i32 @__kmpc_master(ptr [[DEFLOC]], i32 [[GTID]])
66 // CHECK-NEXT: [[IS_MASTER:%.+]] = icmp ne i32 [[RES]], 0
67 // CHECK-NEXT: br i1 [[IS_MASTER]], label {{%?}}[[THEN:.+]], label {{%?}}[[EXIT:.+]]
68 // CHECK: [[THEN]]
69 // CHECK: call void @__kmpc_taskgroup(ptr [[DEFLOC]], i32 [[GTID]])
70 // OMP45: [[TASKV:%.+]] = call ptr @__kmpc_omp_task_alloc(ptr [[DEFLOC]], i32 [[GTID]], i32 1, i64 80, i64 16, ptr [[TASK3:@.+]])
71 // OMP50: [[TASKV:%.+]] = call ptr @__kmpc_omp_task_alloc(ptr [[DEFLOC]], i32 [[GTID]], i32 1, i64 80, i64 24, ptr [[TASK3:@.+]])
72 // CHECK: [[TASK_DATA:%.+]] = getelementptr inbounds nuw %{{.+}}, ptr [[TASKV]], i32 0, i32 0
73 // OMP45: [[IF:%.+]] = icmp ne i32 %{{.+}}, 0
74 // OMP50: [[IF_VAL:%.+]] = load i8, ptr %
75 // OMP50: [[IF:%.+]] = trunc i8 [[IF_VAL]] to i1
76 // CHECK: [[IF_INT:%.+]] = sext i1 [[IF]] to i32
77 // CHECK: [[DOWN:%.+]] = getelementptr inbounds nuw [[TD_TY:%.+]], ptr [[TASK_DATA]], i32 0, i32 5
78 // CHECK: store i64 0, ptr [[DOWN]],
79 // CHECK: [[UP:%.+]] = getelementptr inbounds nuw [[TD_TY]], ptr [[TASK_DATA]], i32 0, i32 6
80 // CHECK: store i64 %{{.+}}, ptr [[UP]],
81 // CHECK: [[ST:%.+]] = getelementptr inbounds nuw [[TD_TY]], ptr [[TASK_DATA]], i32 0, i32 7
82 // CHECK: store i64 1, ptr [[ST]],
83 // CHECK: [[ST_VAL:%.+]] = load i64, ptr [[ST]],
84 // CHECK: call void @__kmpc_taskloop(ptr [[DEFLOC]], i32 [[GTID]], ptr [[TASKV]], i32 [[IF_INT]], ptr [[DOWN]], ptr [[UP]], i64 [[ST_VAL]], i32 1, i32 2, i64 4, ptr null)
85 // CHECK: call void @__kmpc_end_taskgroup(ptr [[DEFLOC]], i32 [[GTID]])
86 // CHECK: call {{.*}}void @__kmpc_end_master(ptr [[DEFLOC]], i32 [[GTID]])
87 // CHECK-NEXT: br label {{%?}}[[EXIT]]
88 // CHECK: [[EXIT]]
89 int i;
90 #pragma omp master taskloop simd if(argc) shared(argc, argv) collapse(2) num_tasks(4) safelen(32)
91 for (i = 0; i < argc; ++i)
92 for (int j = argc; j < argv[argc][argc]; ++j)
96 // CHECK: define internal noundef i32 [[TASK1]](
97 // CHECK: [[DOWN:%.+]] = getelementptr inbounds nuw [[TD_TY:%.+]], ptr %{{.+}}, i32 0, i32 5
98 // CHECK: [[DOWN_VAL:%.+]] = load i64, ptr [[DOWN]],
99 // CHECK: [[UP:%.+]] = getelementptr inbounds nuw [[TD_TY]], ptr %{{.+}}, i32 0, i32 6
100 // CHECK: [[UP_VAL:%.+]] = load i64, ptr [[UP]],
101 // CHECK: [[ST:%.+]] = getelementptr inbounds nuw [[TD_TY]], ptr %{{.+}}, i32 0, i32 7
102 // CHECK: [[ST_VAL:%.+]] = load i64, ptr [[ST]],
103 // CHECK: [[LITER:%.+]] = getelementptr inbounds nuw [[TD_TY]], ptr %{{.+}}, i32 0, i32 8
104 // CHECK: [[LITER_VAL:%.+]] = load i32, ptr [[LITER]],
105 // CHECK: store i64 [[DOWN_VAL]], ptr [[LB:%[^,]+]],
106 // CHECK: store i64 [[UP_VAL]], ptr [[UB:%[^,]+]],
107 // CHECK: store i64 [[ST_VAL]], ptr [[ST:%[^,]+]],
108 // CHECK: store i32 [[LITER_VAL]], ptr [[LITER:%[^,]+]],
109 // CHECK: [[LB_VAL:%.+]] = load i64, ptr [[LB]],
110 // CHECK: [[LB_I32:%.+]] = trunc i64 [[LB_VAL]] to i32
111 // CHECK: store i32 [[LB_I32]], ptr [[CNT:%.+]],
112 // CHECK: br label
113 // CHECK: [[VAL:%.+]] = load i32, ptr [[CNT]],{{.*}}!llvm.access.group
114 // CHECK: [[VAL_I64:%.+]] = sext i32 [[VAL]] to i64
115 // CHECK: [[UB_VAL:%.+]] = load i64, ptr [[UB]],{{.*}}!llvm.access.group
116 // CHECK: [[CMP:%.+]] = icmp ule i64 [[VAL_I64]], [[UB_VAL]]
117 // CHECK: br i1 [[CMP]], label %{{.+}}, label %{{.+}}
118 // CHECK: load i32, ptr %{{.*}}!llvm.access.group
119 // CHECK: store i32 %{{.*}}!llvm.access.group
120 // CHECK: load i32, ptr %{{.*}}!llvm.access.group
121 // CHECK: add nsw i32 %{{.+}}, 1
122 // CHECK: store i32 %{{.+}}, ptr %{{.*}}!llvm.access.group
123 // CHECK: br label %{{.*}}!llvm.loop
124 // CHECK: ret i32 0
126 // CHECK: define internal noundef i32 [[TASK2]](
127 // CHECK: [[DOWN:%.+]] = getelementptr inbounds nuw [[TD_TY:%.+]], ptr %{{.+}}, i32 0, i32 5
128 // CHECK: [[DOWN_VAL:%.+]] = load i64, ptr [[DOWN]],
129 // CHECK: [[UP:%.+]] = getelementptr inbounds nuw [[TD_TY]], ptr %{{.+}}, i32 0, i32 6
130 // CHECK: [[UP_VAL:%.+]] = load i64, ptr [[UP]],
131 // CHECK: [[ST:%.+]] = getelementptr inbounds nuw [[TD_TY]], ptr %{{.+}}, i32 0, i32 7
132 // CHECK: [[ST_VAL:%.+]] = load i64, ptr [[ST]],
133 // CHECK: [[LITER:%.+]] = getelementptr inbounds nuw [[TD_TY]], ptr %{{.+}}, i32 0, i32 8
134 // CHECK: [[LITER_VAL:%.+]] = load i32, ptr [[LITER]],
135 // CHECK: store i64 [[DOWN_VAL]], ptr [[LB:%[^,]+]],
136 // CHECK: store i64 [[UP_VAL]], ptr [[UB:%[^,]+]],
137 // CHECK: store i64 [[ST_VAL]], ptr [[ST:%[^,]+]],
138 // CHECK: store i32 [[LITER_VAL]], ptr [[LITER:%[^,]+]],
139 // CHECK: [[LB_VAL:%.+]] = load i64, ptr [[LB]],
140 // CHECK: [[LB_I32:%.+]] = trunc i64 [[LB_VAL]] to i32
141 // CHECK: store i32 [[LB_I32]], ptr [[CNT:%.+]],
142 // CHECK: br label
143 // CHECK: [[VAL:%.+]] = load i32, ptr [[CNT]],{{.*}}!llvm.access.group
144 // CHECK: [[VAL_I64:%.+]] = sext i32 [[VAL]] to i64
145 // CHECK: [[UB_VAL:%.+]] = load i64, ptr [[UB]],{{.*}}!llvm.access.group
146 // CHECK: [[CMP:%.+]] = icmp ule i64 [[VAL_I64]], [[UB_VAL]]
147 // CHECK: br i1 [[CMP]], label %{{.+}}, label %{{.+}}
148 // CHECK: load i32, ptr %{{.*}}!llvm.access.group
149 // CHECK: store i32 %{{.*}}!llvm.access.group
150 // CHECK: load i32, ptr %{{.*}}!llvm.access.group
151 // CHECK: add nsw i32 %{{.+}}, 1
152 // CHECK: store i32 %{{.+}}, ptr %{{.*}}!llvm.access.group
153 // CHECK: br label %{{.*}}!llvm.loop
154 // CHECK: ret i32 0
156 // CHECK: define internal noundef i32 [[TASK3]](
157 // CHECK: [[DOWN:%.+]] = getelementptr inbounds nuw [[TD_TY:%.+]], ptr %{{.+}}, i32 0, i32 5
158 // CHECK: [[DOWN_VAL:%.+]] = load i64, ptr [[DOWN]],
159 // CHECK: [[UP:%.+]] = getelementptr inbounds nuw [[TD_TY]], ptr %{{.+}}, i32 0, i32 6
160 // CHECK: [[UP_VAL:%.+]] = load i64, ptr [[UP]],
161 // CHECK: [[ST:%.+]] = getelementptr inbounds nuw [[TD_TY]], ptr %{{.+}}, i32 0, i32 7
162 // CHECK: [[ST_VAL:%.+]] = load i64, ptr [[ST]],
163 // CHECK: [[LITER:%.+]] = getelementptr inbounds nuw [[TD_TY]], ptr %{{.+}}, i32 0, i32 8
164 // CHECK: [[LITER_VAL:%.+]] = load i32, ptr [[LITER]],
165 // CHECK: store i64 [[DOWN_VAL]], ptr [[LB:%[^,]+]],
166 // CHECK: store i64 [[UP_VAL]], ptr [[UB:%[^,]+]],
167 // CHECK: store i64 [[ST_VAL]], ptr [[ST:%[^,]+]],
168 // CHECK: store i32 [[LITER_VAL]], ptr [[LITER:%[^,]+]],
169 // CHECK: [[LB_VAL:%.+]] = load i64, ptr [[LB]],
170 // CHECK: store i64 [[LB_VAL]], ptr [[CNT:%.+]],
171 // CHECK: br label
172 // CHECK-NOT: !llvm.access.group
173 // CHECK: br label %{{.*}}!llvm.loop
174 // OMP45-NOT: br label %{{.*}}!llvm.loop
175 // OMP50: br label %{{.*}}!llvm.loop
176 // CHECK: ret i32 0
178 // CHECK-LABEL: @_ZN1SC2Ei
179 struct S {
180 int a;
181 S(int c) {
182 // CHECK: [[GTID:%.+]] = call i32 @__kmpc_global_thread_num(ptr [[DEFLOC:@.+]])
183 // CHECK: [[RES:%.+]] = call {{.*}}i32 @__kmpc_master(ptr [[DEFLOC]], i32 [[GTID]])
184 // CHECK-NEXT: [[IS_MASTER:%.+]] = icmp ne i32 [[RES]], 0
185 // CHECK-NEXT: br i1 [[IS_MASTER]], label {{%?}}[[THEN:.+]], label {{%?}}[[EXIT:.+]]
186 // CHECK: [[THEN]]
187 // CHECK: [[TASKV:%.+]] = call ptr @__kmpc_omp_task_alloc(ptr [[DEFLOC]], i32 [[GTID]], i32 1, i64 80, i64 16, ptr [[TASK4:@.+]])
188 // CHECK: [[TASK_DATA:%.+]] = getelementptr inbounds nuw %{{.+}}, ptr [[TASKV]], i32 0, i32 0
189 // CHECK: [[DOWN:%.+]] = getelementptr inbounds nuw [[TD_TY:%.+]], ptr [[TASK_DATA]], i32 0, i32 5
190 // CHECK: store i64 0, ptr [[DOWN]],
191 // CHECK: [[UP:%.+]] = getelementptr inbounds nuw [[TD_TY]], ptr [[TASK_DATA]], i32 0, i32 6
192 // CHECK: store i64 %{{.+}}, ptr [[UP]],
193 // CHECK: [[ST:%.+]] = getelementptr inbounds nuw [[TD_TY]], ptr [[TASK_DATA]], i32 0, i32 7
194 // CHECK: store i64 1, ptr [[ST]],
195 // CHECK: [[ST_VAL:%.+]] = load i64, ptr [[ST]],
196 // CHECK: [[NUM_TASKS:%.+]] = zext i32 %{{.+}} to i64
197 // CHECK: call void @__kmpc_taskloop(ptr [[DEFLOC]], i32 [[GTID]], ptr [[TASKV]], i32 1, ptr [[DOWN]], ptr [[UP]], i64 [[ST_VAL]], i32 1, i32 2, i64 [[NUM_TASKS]], ptr null)
198 // CHECK: call {{.*}}void @__kmpc_end_master(ptr [[DEFLOC]], i32 [[GTID]])
199 // CHECK-NEXT: br label {{%?}}[[EXIT]]
200 // CHECK: [[EXIT]]
201 #pragma omp master taskloop simd shared(c) num_tasks(a) simdlen(8) safelen(64)
202 for (a = 0; a < c; ++a)
205 } s(1);
207 // CHECK: define internal noundef i32 [[TASK4]](
208 // CHECK: [[DOWN:%.+]] = getelementptr inbounds nuw [[TD_TY:%.+]], ptr %{{.+}}, i32 0, i32 5
209 // CHECK: [[DOWN_VAL:%.+]] = load i64, ptr [[DOWN]],
210 // CHECK: [[UP:%.+]] = getelementptr inbounds nuw [[TD_TY]], ptr %{{.+}}, i32 0, i32 6
211 // CHECK: [[UP_VAL:%.+]] = load i64, ptr [[UP]],
212 // CHECK: [[ST:%.+]] = getelementptr inbounds nuw [[TD_TY]], ptr %{{.+}}, i32 0, i32 7
213 // CHECK: [[ST_VAL:%.+]] = load i64, ptr [[ST]],
214 // CHECK: [[LITER:%.+]] = getelementptr inbounds nuw [[TD_TY]], ptr %{{.+}}, i32 0, i32 8
215 // CHECK: [[LITER_VAL:%.+]] = load i32, ptr [[LITER]],
216 // CHECK: store i64 [[DOWN_VAL]], ptr [[LB:%[^,]+]],
217 // CHECK: store i64 [[UP_VAL]], ptr [[UB:%[^,]+]],
218 // CHECK: store i64 [[ST_VAL]], ptr [[ST:%[^,]+]],
219 // CHECK: store i32 [[LITER_VAL]], ptr [[LITER:%[^,]+]],
220 // CHECK: [[LB_VAL:%.+]] = load i64, ptr [[LB]],
221 // CHECK: [[LB_I32:%.+]] = trunc i64 [[LB_VAL]] to i32
222 // CHECK: store i32 [[LB_I32]], ptr [[CNT:%.+]],
223 // CHECK: br label
224 // CHECK: [[VAL:%.+]] = load i32, ptr [[CNT]],
225 // CHECK: [[VAL_I64:%.+]] = sext i32 [[VAL]] to i64
226 // CHECK: [[UB_VAL:%.+]] = load i64, ptr [[UB]],
227 // CHECK: [[CMP:%.+]] = icmp ule i64 [[VAL_I64]], [[UB_VAL]]
228 // CHECK: br i1 [[CMP]], label %{{.+}}, label %{{.+}}
229 // CHECK: load i32, ptr %
230 // CHECK-NOT: !llvm.access.group
231 // CHECK: store i32 %
232 // CHECK-NOT: !llvm.access.group
233 // CHECK: load i32, ptr %
234 // CHECK-NOT: !llvm.access.group
235 // CHECK: add nsw i32 %{{.+}}, 1
236 // CHECK: store i32 %{{.+}}, ptr %
237 // CHECK-NOT: !llvm.access.group
238 // CHECK: br label %{{.*}}!llvm.loop
239 // CHECK: ret i32 0
241 // OMP45-NOT: !{!"llvm.loop.vectorize.enable", i1 false}
242 // CHECK-DAG: !{!"llvm.loop.vectorize.enable", i1 true}
243 // OMP50-DAG: !{!"llvm.loop.vectorize.enable", i1 false}
244 // OMP45-NOT: !{!"llvm.loop.vectorize.enable", i1 false}
245 // CHECK-DAG: !{!"llvm.loop.vectorize.width", i32 4}
246 // CHECK-DAG: !{!"llvm.loop.vectorize.width", i32 32}
247 // CHECK-DAG: !{!"llvm.loop.vectorize.width", i32 8}
249 #endif