xref: /llvm-project/offload/test/offloading/d2d_memcpy_sync.c (revision 330d8983d25d08580fc1642fea48b2473f47a9da)
1*330d8983SJohannes Doerfert // RUN: %libomptarget-compile-generic && \
2*330d8983SJohannes Doerfert // RUN: env LIBOMPTARGET_AMDGPU_MAX_ASYNC_COPY_BYTES=0 %libomptarget-run-generic | \
3*330d8983SJohannes Doerfert // RUN: %fcheck-generic -allow-empty
4*330d8983SJohannes Doerfert // REQUIRES: amdgcn-amd-amdhsa
5*330d8983SJohannes Doerfert 
6*330d8983SJohannes Doerfert #include <assert.h>
7*330d8983SJohannes Doerfert #include <omp.h>
8*330d8983SJohannes Doerfert #include <stdio.h>
9*330d8983SJohannes Doerfert #include <stdlib.h>
10*330d8983SJohannes Doerfert 
11*330d8983SJohannes Doerfert const int magic_num = 7;
12*330d8983SJohannes Doerfert 
main(int argc,char * argv[])13*330d8983SJohannes Doerfert int main(int argc, char *argv[]) {
14*330d8983SJohannes Doerfert   const int N = 128;
15*330d8983SJohannes Doerfert   const int num_devices = omp_get_num_devices();
16*330d8983SJohannes Doerfert 
17*330d8983SJohannes Doerfert   // No target device, just return
18*330d8983SJohannes Doerfert   if (num_devices == 0) {
19*330d8983SJohannes Doerfert     printf("PASS\n");
20*330d8983SJohannes Doerfert     return 0;
21*330d8983SJohannes Doerfert   }
22*330d8983SJohannes Doerfert 
23*330d8983SJohannes Doerfert   const int src_device = 0;
24*330d8983SJohannes Doerfert   int dst_device = num_devices - 1;
25*330d8983SJohannes Doerfert 
26*330d8983SJohannes Doerfert   int length = N * sizeof(int);
27*330d8983SJohannes Doerfert   int *src_ptr = omp_target_alloc(length, src_device);
28*330d8983SJohannes Doerfert   int *dst_ptr = omp_target_alloc(length, dst_device);
29*330d8983SJohannes Doerfert 
30*330d8983SJohannes Doerfert   if (!src_ptr || !dst_ptr) {
31*330d8983SJohannes Doerfert     printf("FAIL\n");
32*330d8983SJohannes Doerfert     return 1;
33*330d8983SJohannes Doerfert   }
34*330d8983SJohannes Doerfert 
35*330d8983SJohannes Doerfert #pragma omp target teams distribute parallel for device(src_device)            \
36*330d8983SJohannes Doerfert     is_device_ptr(src_ptr)
37*330d8983SJohannes Doerfert   for (int i = 0; i < N; ++i) {
38*330d8983SJohannes Doerfert     src_ptr[i] = magic_num;
39*330d8983SJohannes Doerfert   }
40*330d8983SJohannes Doerfert 
41*330d8983SJohannes Doerfert   if (omp_target_memcpy(dst_ptr, src_ptr, length, 0, 0, dst_device,
42*330d8983SJohannes Doerfert                         src_device)) {
43*330d8983SJohannes Doerfert     printf("FAIL\n");
44*330d8983SJohannes Doerfert     return 1;
45*330d8983SJohannes Doerfert   }
46*330d8983SJohannes Doerfert 
47*330d8983SJohannes Doerfert   int *buffer = malloc(length);
48*330d8983SJohannes Doerfert   if (!buffer) {
49*330d8983SJohannes Doerfert     printf("FAIL\n");
50*330d8983SJohannes Doerfert     return 1;
51*330d8983SJohannes Doerfert   }
52*330d8983SJohannes Doerfert 
53*330d8983SJohannes Doerfert #pragma omp target teams distribute parallel for device(dst_device)            \
54*330d8983SJohannes Doerfert     map(from : buffer[0 : N]) is_device_ptr(dst_ptr)
55*330d8983SJohannes Doerfert   for (int i = 0; i < N; ++i) {
56*330d8983SJohannes Doerfert     buffer[i] = dst_ptr[i] + magic_num;
57*330d8983SJohannes Doerfert   }
58*330d8983SJohannes Doerfert 
59*330d8983SJohannes Doerfert   for (int i = 0; i < N; ++i)
60*330d8983SJohannes Doerfert     assert(buffer[i] == 2 * magic_num);
61*330d8983SJohannes Doerfert 
62*330d8983SJohannes Doerfert   printf("PASS\n");
63*330d8983SJohannes Doerfert 
64*330d8983SJohannes Doerfert   // Free host and device memory
65*330d8983SJohannes Doerfert   free(buffer);
66*330d8983SJohannes Doerfert   omp_target_free(src_ptr, src_device);
67*330d8983SJohannes Doerfert   omp_target_free(dst_ptr, dst_device);
68*330d8983SJohannes Doerfert 
69*330d8983SJohannes Doerfert   return 0;
70*330d8983SJohannes Doerfert }
71*330d8983SJohannes Doerfert 
72*330d8983SJohannes Doerfert // CHECK: PASS
73