1*330d8983SJohannes Doerfert // RUN: %libomptarget-compile-generic && \
2*330d8983SJohannes Doerfert // RUN: env LIBOMPTARGET_AMDGPU_MAX_ASYNC_COPY_BYTES=0 %libomptarget-run-generic | \
3*330d8983SJohannes Doerfert // RUN: %fcheck-generic -allow-empty
4*330d8983SJohannes Doerfert // REQUIRES: amdgcn-amd-amdhsa
5*330d8983SJohannes Doerfert
6*330d8983SJohannes Doerfert #include <assert.h>
7*330d8983SJohannes Doerfert #include <omp.h>
8*330d8983SJohannes Doerfert #include <stdio.h>
9*330d8983SJohannes Doerfert #include <stdlib.h>
10*330d8983SJohannes Doerfert
11*330d8983SJohannes Doerfert const int magic_num = 7;
12*330d8983SJohannes Doerfert
main(int argc,char * argv[])13*330d8983SJohannes Doerfert int main(int argc, char *argv[]) {
14*330d8983SJohannes Doerfert const int N = 128;
15*330d8983SJohannes Doerfert const int num_devices = omp_get_num_devices();
16*330d8983SJohannes Doerfert
17*330d8983SJohannes Doerfert // No target device, just return
18*330d8983SJohannes Doerfert if (num_devices == 0) {
19*330d8983SJohannes Doerfert printf("PASS\n");
20*330d8983SJohannes Doerfert return 0;
21*330d8983SJohannes Doerfert }
22*330d8983SJohannes Doerfert
23*330d8983SJohannes Doerfert const int src_device = 0;
24*330d8983SJohannes Doerfert int dst_device = num_devices - 1;
25*330d8983SJohannes Doerfert
26*330d8983SJohannes Doerfert int length = N * sizeof(int);
27*330d8983SJohannes Doerfert int *src_ptr = omp_target_alloc(length, src_device);
28*330d8983SJohannes Doerfert int *dst_ptr = omp_target_alloc(length, dst_device);
29*330d8983SJohannes Doerfert
30*330d8983SJohannes Doerfert if (!src_ptr || !dst_ptr) {
31*330d8983SJohannes Doerfert printf("FAIL\n");
32*330d8983SJohannes Doerfert return 1;
33*330d8983SJohannes Doerfert }
34*330d8983SJohannes Doerfert
35*330d8983SJohannes Doerfert #pragma omp target teams distribute parallel for device(src_device) \
36*330d8983SJohannes Doerfert is_device_ptr(src_ptr)
37*330d8983SJohannes Doerfert for (int i = 0; i < N; ++i) {
38*330d8983SJohannes Doerfert src_ptr[i] = magic_num;
39*330d8983SJohannes Doerfert }
40*330d8983SJohannes Doerfert
41*330d8983SJohannes Doerfert if (omp_target_memcpy(dst_ptr, src_ptr, length, 0, 0, dst_device,
42*330d8983SJohannes Doerfert src_device)) {
43*330d8983SJohannes Doerfert printf("FAIL\n");
44*330d8983SJohannes Doerfert return 1;
45*330d8983SJohannes Doerfert }
46*330d8983SJohannes Doerfert
47*330d8983SJohannes Doerfert int *buffer = malloc(length);
48*330d8983SJohannes Doerfert if (!buffer) {
49*330d8983SJohannes Doerfert printf("FAIL\n");
50*330d8983SJohannes Doerfert return 1;
51*330d8983SJohannes Doerfert }
52*330d8983SJohannes Doerfert
53*330d8983SJohannes Doerfert #pragma omp target teams distribute parallel for device(dst_device) \
54*330d8983SJohannes Doerfert map(from : buffer[0 : N]) is_device_ptr(dst_ptr)
55*330d8983SJohannes Doerfert for (int i = 0; i < N; ++i) {
56*330d8983SJohannes Doerfert buffer[i] = dst_ptr[i] + magic_num;
57*330d8983SJohannes Doerfert }
58*330d8983SJohannes Doerfert
59*330d8983SJohannes Doerfert for (int i = 0; i < N; ++i)
60*330d8983SJohannes Doerfert assert(buffer[i] == 2 * magic_num);
61*330d8983SJohannes Doerfert
62*330d8983SJohannes Doerfert printf("PASS\n");
63*330d8983SJohannes Doerfert
64*330d8983SJohannes Doerfert // Free host and device memory
65*330d8983SJohannes Doerfert free(buffer);
66*330d8983SJohannes Doerfert omp_target_free(src_ptr, src_device);
67*330d8983SJohannes Doerfert omp_target_free(dst_ptr, dst_device);
68*330d8983SJohannes Doerfert
69*330d8983SJohannes Doerfert return 0;
70*330d8983SJohannes Doerfert }
71*330d8983SJohannes Doerfert
72*330d8983SJohannes Doerfert // CHECK: PASS
73