test/offloading/thread_limit.c

330d8983SJohannes Doerfert// clang-format off
330d8983SJohannes Doerfert// RUN: %libomptarget-compile-generic
330d8983SJohannes Doerfert// RUN: env LIBOMPTARGET_INFO=16 \
330d8983SJohannes Doerfert// RUN:   %libomptarget-run-generic 2>&1 | %fcheck-generic --check-prefix=DEFAULT
330d8983SJohannes Doerfert
330d8983SJohannes Doerfert// UNSUPPORTED: nvptx64-nvidia-cuda
330d8983SJohannes Doerfert// UNSUPPORTED: nvptx64-nvidia-cuda-LTO
*88234488SEthan Luis McDonough// REQUIRES: gpu
330d8983SJohannes Doerfert
330d8983SJohannes Doerfertint main() {
330d8983SJohannes Doerfert  int n = 1 << 20;
330d8983SJohannes Doerfert  int th = 12;
330d8983SJohannes Doerfert  int te = n / th;
330d8983SJohannes Doerfert// DEFAULT: 12 (MaxFlatWorkGroupSize:
330d8983SJohannes Doerfert#pragma omp target
330d8983SJohannes Doerfert#pragma omp teams loop num_teams(te), thread_limit(th)
330d8983SJohannes Doerfert  for (int i = 0; i < n; i++) {
330d8983SJohannes Doerfert  }
330d8983SJohannes Doerfert
330d8983SJohannes Doerfert// DEFAULT: 13 (MaxFlatWorkGroupSize:
330d8983SJohannes Doerfert  #pragma omp target
330d8983SJohannes Doerfert  #pragma omp teams distribute parallel for simd num_teams(te), thread_limit(th+1) simdlen(64)
330d8983SJohannes Doerfert  for(int i = 0; i < n; i++) {
330d8983SJohannes Doerfert  }
330d8983SJohannes Doerfert  return 0;
330d8983SJohannes Doerfert}