1 // RUN: %clang_cc1 -verify -triple x86_64-apple-darwin10 -fopenmp -fopenmp-version=45 -x c++ -emit-llvm %s -o - -femit-all-decls | FileCheck %s --check-prefix CHECK --check-prefix OMP45 2 // RUN: %clang_cc1 -fopenmp -fopenmp-version=45 -x c++ -triple x86_64-apple-darwin10 -emit-pch -o %t %s 3 // RUN: %clang_cc1 -fopenmp -fopenmp-version=45 -x c++ -triple x86_64-apple-darwin10 -include-pch %t -verify %s -emit-llvm -o - -femit-all-decls | FileCheck %s --check-prefix CHECK --check-prefix OMP45 4 // RUN: %clang_cc1 -verify -triple x86_64-apple-darwin10 -fopenmp -x c++ -emit-llvm %s -o - | FileCheck %s --check-prefix CHECK --check-prefix OMP50 5 // RUN: %clang_cc1 -fopenmp -x c++ -triple x86_64-apple-darwin10 -emit-pch -o %t %s 6 // RUN: %clang_cc1 -fopenmp -x c++ -triple x86_64-apple-darwin10 -include-pch %t -verify %s -emit-llvm -o - | FileCheck %s --check-prefix CHECK --check-prefix OMP50 7 8 // RUN: %clang_cc1 -verify -triple x86_64-apple-darwin10 -fopenmp-simd -fopenmp-version=45 -x c++ -emit-llvm %s -o - -femit-all-decls | FileCheck --check-prefix SIMD-ONLY0 %s 9 // RUN: %clang_cc1 -fopenmp-simd -fopenmp-version=45 -x c++ -triple x86_64-apple-darwin10 -emit-pch -o %t %s 10 // RUN: %clang_cc1 -fopenmp-simd -fopenmp-version=45 -x c++ -triple x86_64-apple-darwin10 -include-pch %t -verify %s -emit-llvm -o - -femit-all-decls | FileCheck --check-prefix SIMD-ONLY0 %s 11 // RUN: %clang_cc1 -verify -triple x86_64-apple-darwin10 -fopenmp-simd -x c++ -emit-llvm %s -o - -femit-all-decls | FileCheck --check-prefix SIMD-ONLY0 %s 12 // RUN: %clang_cc1 -fopenmp-simd -x c++ -triple x86_64-apple-darwin10 -emit-pch -o %t %s 13 // RUN: %clang_cc1 -fopenmp-simd -x c++ -triple x86_64-apple-darwin10 -include-pch %t -verify %s -emit-llvm -o - -femit-all-decls | FileCheck --check-prefix SIMD-ONLY0 %s 14 // SIMD-ONLY0-NOT: {{__kmpc|__tgt}} 15 // expected-no-diagnostics 16 #ifndef HEADER 17 #define HEADER 18 19 // CHECK-LABEL: @main 20 int main(int argc, char **argv) { 21 // CHECK: [[GTID:%.+]] = call i32 @__kmpc_global_thread_num(ptr [[DEFLOC:@.+]]) 22 // CHECK: call void @__kmpc_taskgroup(ptr [[DEFLOC]], i32 [[GTID]]) 23 // CHECK: [[TASKV:%.+]] = call ptr @__kmpc_omp_task_alloc(ptr [[DEFLOC]], i32 [[GTID]], i32 33, i64 80, i64 1, ptr [[TASK1:@.+]]) 24 // CHECK: [[TASK_DATA:%.+]] = getelementptr inbounds nuw %{{.+}}, ptr [[TASKV]], i32 0, i32 0 25 // CHECK: [[DOWN:%.+]] = getelementptr inbounds nuw [[TD_TY:%.+]], ptr [[TASK_DATA]], i32 0, i32 5 26 // CHECK: store i64 0, ptr [[DOWN]], 27 // CHECK: [[UP:%.+]] = getelementptr inbounds nuw [[TD_TY]], ptr [[TASK_DATA]], i32 0, i32 6 28 // CHECK: store i64 9, ptr [[UP]], 29 // CHECK: [[ST:%.+]] = getelementptr inbounds nuw [[TD_TY]], ptr [[TASK_DATA]], i32 0, i32 7 30 // CHECK: store i64 1, ptr [[ST]], 31 // CHECK: [[ST_VAL:%.+]] = load i64, ptr [[ST]], 32 // CHECK: call void @__kmpc_taskloop(ptr [[DEFLOC]], i32 [[GTID]], ptr [[TASKV]], i32 1, ptr [[DOWN]], ptr [[UP]], i64 [[ST_VAL]], i32 1, i32 0, i64 0, ptr null) 33 // CHECK: call void @__kmpc_end_taskgroup(ptr [[DEFLOC]], i32 [[GTID]]) 34 #pragma omp taskloop simd priority(argc) 35 for (int i = 0; i < 10; ++i) 36 ; 37 // CHECK: [[TASKV:%.+]] = call ptr @__kmpc_omp_task_alloc(ptr [[DEFLOC]], i32 [[GTID]], i32 1, i64 80, i64 1, ptr [[TASK2:@.+]]) 38 // CHECK: [[TASK_DATA:%.+]] = getelementptr inbounds nuw %{{.+}}, ptr [[TASKV]], i32 0, i32 0 39 // CHECK: [[DOWN:%.+]] = getelementptr inbounds nuw [[TD_TY:%.+]], ptr [[TASK_DATA]], i32 0, i32 5 40 // CHECK: store i64 0, ptr [[DOWN]], 41 // CHECK: [[UP:%.+]] = getelementptr inbounds nuw [[TD_TY]], ptr [[TASK_DATA]], i32 0, i32 6 42 // CHECK: store i64 9, ptr [[UP]], 43 // CHECK: [[ST:%.+]] = getelementptr inbounds nuw [[TD_TY]], ptr [[TASK_DATA]], i32 0, i32 7 44 // CHECK: store i64 1, ptr [[ST]], 45 // CHECK: [[ST_VAL:%.+]] = load i64, ptr [[ST]], 46 // CHECK: [[GRAINSIZE:%.+]] = zext i32 %{{.+}} to i64 47 // CHECK: call void @__kmpc_taskloop(ptr [[DEFLOC]], i32 [[GTID]], ptr [[TASKV]], i32 1, ptr [[DOWN]], ptr [[UP]], i64 [[ST_VAL]], i32 1, i32 1, i64 [[GRAINSIZE]], ptr null) 48 #pragma omp taskloop simd nogroup grainsize(argc) simdlen(4) 49 for (int i = 0; i < 10; ++i) 50 ; 51 // CHECK: call void @__kmpc_taskgroup(ptr [[DEFLOC]], i32 [[GTID]]) 52 // OMP45: [[TASKV:%.+]] = call ptr @__kmpc_omp_task_alloc(ptr [[DEFLOC]], i32 [[GTID]], i32 1, i64 80, i64 16, ptr [[TASK3:@.+]]) 53 // OMP50: [[TASKV:%.+]] = call ptr @__kmpc_omp_task_alloc(ptr [[DEFLOC]], i32 [[GTID]], i32 1, i64 80, i64 24, ptr [[TASK3:@.+]]) 54 // CHECK: [[TASK_DATA:%.+]] = getelementptr inbounds nuw %{{.+}}, ptr [[TASKV]], i32 0, i32 0 55 // OMP45: [[IF:%.+]] = icmp ne i32 %{{.+}}, 0 56 // OMP50: [[IF_VAL:%.+]] = load i8, ptr % 57 // OMP50: [[IF:%.+]] = trunc i8 [[IF_VAL]] to i1 58 // CHECK: [[IF_INT:%.+]] = sext i1 [[IF]] to i32 59 // CHECK: [[DOWN:%.+]] = getelementptr inbounds nuw [[TD_TY:%.+]], ptr [[TASK_DATA]], i32 0, i32 5 60 // CHECK: store i64 0, ptr [[DOWN]], 61 // CHECK: [[UP:%.+]] = getelementptr inbounds nuw [[TD_TY]], ptr [[TASK_DATA]], i32 0, i32 6 62 // CHECK: store i64 %{{.+}}, ptr [[UP]], 63 // CHECK: [[ST:%.+]] = getelementptr inbounds nuw [[TD_TY]], ptr [[TASK_DATA]], i32 0, i32 7 64 // CHECK: store i64 1, ptr [[ST]], 65 // CHECK: [[ST_VAL:%.+]] = load i64, ptr [[ST]], 66 // CHECK: call void @__kmpc_taskloop(ptr [[DEFLOC]], i32 [[GTID]], ptr [[TASKV]], i32 [[IF_INT]], ptr [[DOWN]], ptr [[UP]], i64 [[ST_VAL]], i32 1, i32 2, i64 4, ptr null) 67 // CHECK: call void @__kmpc_end_taskgroup(ptr [[DEFLOC]], i32 [[GTID]]) 68 int i; 69 #pragma omp taskloop simd if(argc) shared(argc, argv) collapse(2) num_tasks(4) safelen(32) 70 for (i = 0; i < argc; ++i) 71 for (int j = argc; j < argv[argc][argc]; ++j) 72 ; 73 } 74 75 // CHECK: define internal noundef i32 [[TASK1]]( 76 // CHECK: [[DOWN:%.+]] = getelementptr inbounds nuw [[TD_TY:%.+]], ptr %{{.+}}, i32 0, i32 5 77 // CHECK: [[DOWN_VAL:%.+]] = load i64, ptr [[DOWN]], 78 // CHECK: [[UP:%.+]] = getelementptr inbounds nuw [[TD_TY]], ptr %{{.+}}, i32 0, i32 6 79 // CHECK: [[UP_VAL:%.+]] = load i64, ptr [[UP]], 80 // CHECK: [[ST:%.+]] = getelementptr inbounds nuw [[TD_TY]], ptr %{{.+}}, i32 0, i32 7 81 // CHECK: [[ST_VAL:%.+]] = load i64, ptr [[ST]], 82 // CHECK: [[LITER:%.+]] = getelementptr inbounds nuw [[TD_TY]], ptr %{{.+}}, i32 0, i32 8 83 // CHECK: [[LITER_VAL:%.+]] = load i32, ptr [[LITER]], 84 // CHECK: store i64 [[DOWN_VAL]], ptr [[LB:%[^,]+]], 85 // CHECK: store i64 [[UP_VAL]], ptr [[UB:%[^,]+]], 86 // CHECK: store i64 [[ST_VAL]], ptr [[ST:%[^,]+]], 87 // CHECK: store i32 [[LITER_VAL]], ptr [[LITER:%[^,]+]], 88 // CHECK: [[LB_VAL:%.+]] = load i64, ptr [[LB]], 89 // CHECK: [[LB_I32:%.+]] = trunc i64 [[LB_VAL]] to i32 90 // CHECK: store i32 [[LB_I32]], ptr [[CNT:%.+]], 91 // CHECK: br label 92 // CHECK: [[VAL:%.+]] = load i32, ptr [[CNT]],{{.*}}!llvm.access.group 93 // CHECK: [[VAL_I64:%.+]] = sext i32 [[VAL]] to i64 94 // CHECK: [[UB_VAL:%.+]] = load i64, ptr [[UB]],{{.*}}!llvm.access.group 95 // CHECK: [[CMP:%.+]] = icmp ule i64 [[VAL_I64]], [[UB_VAL]] 96 // CHECK: br i1 [[CMP]], label %{{.+}}, label %{{.+}} 97 // CHECK: load i32, ptr %{{.*}}!llvm.access.group 98 // CHECK: store i32 %{{.*}}!llvm.access.group 99 // CHECK: load i32, ptr %{{.*}}!llvm.access.group 100 // CHECK: add nsw i32 %{{.+}}, 1 101 // CHECK: store i32 %{{.+}}, ptr %{{.*}}!llvm.access.group 102 // CHECK: br label %{{.*}}!llvm.loop 103 // CHECK: ret i32 0 104 105 // CHECK: define internal noundef i32 [[TASK2]]( 106 // CHECK: [[DOWN:%.+]] = getelementptr inbounds nuw [[TD_TY:%.+]], ptr %{{.+}}, i32 0, i32 5 107 // CHECK: [[DOWN_VAL:%.+]] = load i64, ptr [[DOWN]], 108 // CHECK: [[UP:%.+]] = getelementptr inbounds nuw [[TD_TY]], ptr %{{.+}}, i32 0, i32 6 109 // CHECK: [[UP_VAL:%.+]] = load i64, ptr [[UP]], 110 // CHECK: [[ST:%.+]] = getelementptr inbounds nuw [[TD_TY]], ptr %{{.+}}, i32 0, i32 7 111 // CHECK: [[ST_VAL:%.+]] = load i64, ptr [[ST]], 112 // CHECK: [[LITER:%.+]] = getelementptr inbounds nuw [[TD_TY]], ptr %{{.+}}, i32 0, i32 8 113 // CHECK: [[LITER_VAL:%.+]] = load i32, ptr [[LITER]], 114 // CHECK: store i64 [[DOWN_VAL]], ptr [[LB:%[^,]+]], 115 // CHECK: store i64 [[UP_VAL]], ptr [[UB:%[^,]+]], 116 // CHECK: store i64 [[ST_VAL]], ptr [[ST:%[^,]+]], 117 // CHECK: store i32 [[LITER_VAL]], ptr [[LITER:%[^,]+]], 118 // CHECK: [[LB_VAL:%.+]] = load i64, ptr [[LB]], 119 // CHECK: [[LB_I32:%.+]] = trunc i64 [[LB_VAL]] to i32 120 // CHECK: store i32 [[LB_I32]], ptr [[CNT:%.+]], 121 // CHECK: br label 122 // CHECK: [[VAL:%.+]] = load i32, ptr [[CNT]],{{.*}}!llvm.access.group 123 // CHECK: [[VAL_I64:%.+]] = sext i32 [[VAL]] to i64 124 // CHECK: [[UB_VAL:%.+]] = load i64, ptr [[UB]],{{.*}}!llvm.access.group 125 // CHECK: [[CMP:%.+]] = icmp ule i64 [[VAL_I64]], [[UB_VAL]] 126 // CHECK: br i1 [[CMP]], label %{{.+}}, label %{{.+}} 127 // CHECK: load i32, ptr %{{.*}}!llvm.access.group 128 // CHECK: store i32 %{{.*}}!llvm.access.group 129 // CHECK: load i32, ptr %{{.*}}!llvm.access.group 130 // CHECK: add nsw i32 %{{.+}}, 1 131 // CHECK: store i32 %{{.+}}, ptr %{{.*}}!llvm.access.group 132 // CHECK: br label %{{.*}}!llvm.loop 133 // CHECK: ret i32 0 134 135 // CHECK: define internal noundef i32 [[TASK3]]( 136 // CHECK: [[DOWN:%.+]] = getelementptr inbounds nuw [[TD_TY:%.+]], ptr %{{.+}}, i32 0, i32 5 137 // CHECK: [[DOWN_VAL:%.+]] = load i64, ptr [[DOWN]], 138 // CHECK: [[UP:%.+]] = getelementptr inbounds nuw [[TD_TY]], ptr %{{.+}}, i32 0, i32 6 139 // CHECK: [[UP_VAL:%.+]] = load i64, ptr [[UP]], 140 // CHECK: [[ST:%.+]] = getelementptr inbounds nuw [[TD_TY]], ptr %{{.+}}, i32 0, i32 7 141 // CHECK: [[ST_VAL:%.+]] = load i64, ptr [[ST]], 142 // CHECK: [[LITER:%.+]] = getelementptr inbounds nuw [[TD_TY]], ptr %{{.+}}, i32 0, i32 8 143 // CHECK: [[LITER_VAL:%.+]] = load i32, ptr [[LITER]], 144 // CHECK: store i64 [[DOWN_VAL]], ptr [[LB:%[^,]+]], 145 // CHECK: store i64 [[UP_VAL]], ptr [[UB:%[^,]+]], 146 // CHECK: store i64 [[ST_VAL]], ptr [[ST:%[^,]+]], 147 // CHECK: store i32 [[LITER_VAL]], ptr [[LITER:%[^,]+]], 148 // CHECK: [[LB_VAL:%.+]] = load i64, ptr [[LB]], 149 // CHECK: store i64 [[LB_VAL]], ptr [[CNT:%.+]], 150 // CHECK: br label 151 // CHECK-NOT: !llvm.access.group 152 // CHECK: br label %{{.*}}!llvm.loop 153 // CHECK: ret i32 0 154 155 // CHECK-LABEL: @_ZN1SC2Ei 156 struct S { 157 int a; 158 S(int c) { 159 // CHECK: [[GTID:%.+]] = call i32 @__kmpc_global_thread_num(ptr [[DEFLOC:@.+]]) 160 // CHECK: [[TASKV:%.+]] = call ptr @__kmpc_omp_task_alloc(ptr [[DEFLOC]], i32 [[GTID]], i32 1, i64 80, i64 16, ptr [[TASK4:@.+]]) 161 // CHECK: [[TASK_DATA:%.+]] = getelementptr inbounds nuw %{{.+}}, ptr [[TASKV]], i32 0, i32 0 162 // CHECK: [[DOWN:%.+]] = getelementptr inbounds nuw [[TD_TY:%.+]], ptr [[TASK_DATA]], i32 0, i32 5 163 // CHECK: store i64 0, ptr [[DOWN]], 164 // CHECK: [[UP:%.+]] = getelementptr inbounds nuw [[TD_TY]], ptr [[TASK_DATA]], i32 0, i32 6 165 // CHECK: store i64 %{{.+}}, ptr [[UP]], 166 // CHECK: [[ST:%.+]] = getelementptr inbounds nuw [[TD_TY]], ptr [[TASK_DATA]], i32 0, i32 7 167 // CHECK: store i64 1, ptr [[ST]], 168 // CHECK: [[ST_VAL:%.+]] = load i64, ptr [[ST]], 169 // CHECK: [[NUM_TASKS:%.+]] = zext i32 %{{.+}} to i64 170 // CHECK: call void @__kmpc_taskloop(ptr [[DEFLOC]], i32 [[GTID]], ptr [[TASKV]], i32 1, ptr [[DOWN]], ptr [[UP]], i64 [[ST_VAL]], i32 1, i32 2, i64 [[NUM_TASKS]], ptr null) 171 #pragma omp taskloop simd shared(c) num_tasks(a) simdlen(8) safelen(64) 172 for (a = 0; a < c; ++a) 173 ; 174 } 175 } s(1); 176 177 // CHECK: define internal noundef i32 [[TASK4]]( 178 // CHECK: [[DOWN:%.+]] = getelementptr inbounds nuw [[TD_TY:%.+]], ptr %{{.+}}, i32 0, i32 5 179 // CHECK: [[DOWN_VAL:%.+]] = load i64, ptr [[DOWN]], 180 // CHECK: [[UP:%.+]] = getelementptr inbounds nuw [[TD_TY]], ptr %{{.+}}, i32 0, i32 6 181 // CHECK: [[UP_VAL:%.+]] = load i64, ptr [[UP]], 182 // CHECK: [[ST:%.+]] = getelementptr inbounds nuw [[TD_TY]], ptr %{{.+}}, i32 0, i32 7 183 // CHECK: [[ST_VAL:%.+]] = load i64, ptr [[ST]], 184 // CHECK: [[LITER:%.+]] = getelementptr inbounds nuw [[TD_TY]], ptr %{{.+}}, i32 0, i32 8 185 // CHECK: [[LITER_VAL:%.+]] = load i32, ptr [[LITER]], 186 // CHECK: store i64 [[DOWN_VAL]], ptr [[LB:%[^,]+]], 187 // CHECK: store i64 [[UP_VAL]], ptr [[UB:%[^,]+]], 188 // CHECK: store i64 [[ST_VAL]], ptr [[ST:%[^,]+]], 189 // CHECK: store i32 [[LITER_VAL]], ptr [[LITER:%[^,]+]], 190 // CHECK: [[LB_VAL:%.+]] = load i64, ptr [[LB]], 191 // CHECK: [[LB_I32:%.+]] = trunc i64 [[LB_VAL]] to i32 192 // CHECK: store i32 [[LB_I32]], ptr [[CNT:%.+]], 193 // CHECK: br label 194 // CHECK: [[VAL:%.+]] = load i32, ptr [[CNT]], 195 // CHECK: [[VAL_I64:%.+]] = sext i32 [[VAL]] to i64 196 // CHECK: [[UB_VAL:%.+]] = load i64, ptr [[UB]], 197 // CHECK: [[CMP:%.+]] = icmp ule i64 [[VAL_I64]], [[UB_VAL]] 198 // CHECK: br i1 [[CMP]], label %{{.+}}, label %{{.+}} 199 // CHECK: load i32, ptr % 200 // CHECK-NOT: !llvm.access.group 201 // CHECK: store i32 % 202 // CHECK-NOT: !llvm.access.group 203 // CHECK: load i32, ptr % 204 // CHECK-NOT: !llvm.access.group 205 // CHECK: add nsw i32 %{{.+}}, 1 206 // CHECK: store i32 %{{.+}}, ptr % 207 // CHECK-NOT: !llvm.access.group 208 // CHECK: br label %{{.*}}!llvm.loop 209 // CHECK: ret i32 0 210 211 // CHECK: !{!"llvm.loop.vectorize.enable", i1 true} 212 // CHECK: !{!"llvm.loop.vectorize.width", i32 4} 213 // CHECK: !{!"llvm.loop.vectorize.width", i32 32} 214 // CHECK: !{!"llvm.loop.vectorize.width", i32 8} 215 216 #endif 217