xref: /dpdk/lib/gpudev/gpudev.c (revision 72b452c5f2599f970f47fd17d3e8e5d60bfebe7a)
18b8036a6SElena Agostini /* SPDX-License-Identifier: BSD-3-Clause
28b8036a6SElena Agostini  * Copyright (c) 2021 NVIDIA Corporation & Affiliates
38b8036a6SElena Agostini  */
48b8036a6SElena Agostini 
5*72b452c5SDmitry Kozlyuk #include <stdlib.h>
6*72b452c5SDmitry Kozlyuk 
78b8036a6SElena Agostini #include <rte_eal.h>
818cb0756SThomas Monjalon #include <rte_tailq.h>
98b8036a6SElena Agostini #include <rte_string_fns.h>
10a9af048aSThomas Monjalon #include <rte_memzone.h>
11e818c4e2SElena Agostini #include <rte_malloc.h>
128b8036a6SElena Agostini #include <rte_errno.h>
138b8036a6SElena Agostini #include <rte_log.h>
148b8036a6SElena Agostini 
158b8036a6SElena Agostini #include "rte_gpudev.h"
168b8036a6SElena Agostini #include "gpudev_driver.h"
178b8036a6SElena Agostini 
188b8036a6SElena Agostini /* Logging */
198b8036a6SElena Agostini RTE_LOG_REGISTER_DEFAULT(gpu_logtype, NOTICE);
208b8036a6SElena Agostini #define GPU_LOG(level, ...) \
218b8036a6SElena Agostini 	rte_log(RTE_LOG_ ## level, gpu_logtype, RTE_FMT("gpu: " \
228b8036a6SElena Agostini 		RTE_FMT_HEAD(__VA_ARGS__, ) "\n", RTE_FMT_TAIL(__VA_ARGS__, )))
238b8036a6SElena Agostini 
248b8036a6SElena Agostini /* Set any driver error as EPERM */
258b8036a6SElena Agostini #define GPU_DRV_RET(function) \
268b8036a6SElena Agostini 	((function != 0) ? -(rte_errno = EPERM) : (rte_errno = 0))
278b8036a6SElena Agostini 
288b8036a6SElena Agostini /* Array of devices */
298b8036a6SElena Agostini static struct rte_gpu *gpus;
308b8036a6SElena Agostini /* Number of currently valid devices */
318b8036a6SElena Agostini static int16_t gpu_max;
328b8036a6SElena Agostini /* Number of currently valid devices */
338b8036a6SElena Agostini static int16_t gpu_count;
348b8036a6SElena Agostini 
35a9af048aSThomas Monjalon /* Shared memory between processes. */
36a9af048aSThomas Monjalon static const char *GPU_MEMZONE = "rte_gpu_shared";
37a9af048aSThomas Monjalon static struct {
38a9af048aSThomas Monjalon 	__extension__ struct rte_gpu_mpshared gpus[0];
39a9af048aSThomas Monjalon } *gpu_shared_mem;
40a9af048aSThomas Monjalon 
4118cb0756SThomas Monjalon /* Event callback object */
4218cb0756SThomas Monjalon struct rte_gpu_callback {
4318cb0756SThomas Monjalon 	TAILQ_ENTRY(rte_gpu_callback) next;
4418cb0756SThomas Monjalon 	rte_gpu_callback_t *function;
4518cb0756SThomas Monjalon 	void *user_data;
4618cb0756SThomas Monjalon 	enum rte_gpu_event event;
4718cb0756SThomas Monjalon };
4818cb0756SThomas Monjalon static rte_rwlock_t gpu_callback_lock = RTE_RWLOCK_INITIALIZER;
4918cb0756SThomas Monjalon static void gpu_free_callbacks(struct rte_gpu *dev);
5018cb0756SThomas Monjalon 
518b8036a6SElena Agostini int
528b8036a6SElena Agostini rte_gpu_init(size_t dev_max)
538b8036a6SElena Agostini {
548b8036a6SElena Agostini 	if (dev_max == 0 || dev_max > INT16_MAX) {
558b8036a6SElena Agostini 		GPU_LOG(ERR, "invalid array size");
568b8036a6SElena Agostini 		rte_errno = EINVAL;
578b8036a6SElena Agostini 		return -rte_errno;
588b8036a6SElena Agostini 	}
598b8036a6SElena Agostini 
608b8036a6SElena Agostini 	/* No lock, it must be called before or during first probing. */
618b8036a6SElena Agostini 	if (gpus != NULL) {
628b8036a6SElena Agostini 		GPU_LOG(ERR, "already initialized");
638b8036a6SElena Agostini 		rte_errno = EBUSY;
648b8036a6SElena Agostini 		return -rte_errno;
658b8036a6SElena Agostini 	}
668b8036a6SElena Agostini 
678b8036a6SElena Agostini 	gpus = calloc(dev_max, sizeof(struct rte_gpu));
688b8036a6SElena Agostini 	if (gpus == NULL) {
698b8036a6SElena Agostini 		GPU_LOG(ERR, "cannot initialize library");
708b8036a6SElena Agostini 		rte_errno = ENOMEM;
718b8036a6SElena Agostini 		return -rte_errno;
728b8036a6SElena Agostini 	}
738b8036a6SElena Agostini 
748b8036a6SElena Agostini 	gpu_max = dev_max;
758b8036a6SElena Agostini 	return 0;
768b8036a6SElena Agostini }
778b8036a6SElena Agostini 
788b8036a6SElena Agostini uint16_t
798b8036a6SElena Agostini rte_gpu_count_avail(void)
808b8036a6SElena Agostini {
818b8036a6SElena Agostini 	return gpu_count;
828b8036a6SElena Agostini }
838b8036a6SElena Agostini 
848b8036a6SElena Agostini bool
858b8036a6SElena Agostini rte_gpu_is_valid(int16_t dev_id)
868b8036a6SElena Agostini {
878b8036a6SElena Agostini 	if (dev_id >= 0 && dev_id < gpu_max &&
88a9af048aSThomas Monjalon 		gpus[dev_id].process_state == RTE_GPU_STATE_INITIALIZED)
898b8036a6SElena Agostini 		return true;
908b8036a6SElena Agostini 	return false;
918b8036a6SElena Agostini }
928b8036a6SElena Agostini 
9382e5f6b6SThomas Monjalon static bool
9482e5f6b6SThomas Monjalon gpu_match_parent(int16_t dev_id, int16_t parent)
9582e5f6b6SThomas Monjalon {
9682e5f6b6SThomas Monjalon 	if (parent == RTE_GPU_ID_ANY)
9782e5f6b6SThomas Monjalon 		return true;
98a9af048aSThomas Monjalon 	return gpus[dev_id].mpshared->info.parent == parent;
9982e5f6b6SThomas Monjalon }
10082e5f6b6SThomas Monjalon 
1018b8036a6SElena Agostini int16_t
10282e5f6b6SThomas Monjalon rte_gpu_find_next(int16_t dev_id, int16_t parent)
1038b8036a6SElena Agostini {
1048b8036a6SElena Agostini 	if (dev_id < 0)
1058b8036a6SElena Agostini 		dev_id = 0;
1068b8036a6SElena Agostini 	while (dev_id < gpu_max &&
107a9af048aSThomas Monjalon 			(gpus[dev_id].process_state == RTE_GPU_STATE_UNUSED ||
10882e5f6b6SThomas Monjalon 			!gpu_match_parent(dev_id, parent)))
1098b8036a6SElena Agostini 		dev_id++;
1108b8036a6SElena Agostini 
1118b8036a6SElena Agostini 	if (dev_id >= gpu_max)
1128b8036a6SElena Agostini 		return RTE_GPU_ID_NONE;
1138b8036a6SElena Agostini 	return dev_id;
1148b8036a6SElena Agostini }
1158b8036a6SElena Agostini 
1168b8036a6SElena Agostini static int16_t
1178b8036a6SElena Agostini gpu_find_free_id(void)
1188b8036a6SElena Agostini {
1198b8036a6SElena Agostini 	int16_t dev_id;
1208b8036a6SElena Agostini 
1218b8036a6SElena Agostini 	for (dev_id = 0; dev_id < gpu_max; dev_id++) {
122a9af048aSThomas Monjalon 		if (gpus[dev_id].process_state == RTE_GPU_STATE_UNUSED)
1238b8036a6SElena Agostini 			return dev_id;
1248b8036a6SElena Agostini 	}
1258b8036a6SElena Agostini 	return RTE_GPU_ID_NONE;
1268b8036a6SElena Agostini }
1278b8036a6SElena Agostini 
1288b8036a6SElena Agostini static struct rte_gpu *
1298b8036a6SElena Agostini gpu_get_by_id(int16_t dev_id)
1308b8036a6SElena Agostini {
1318b8036a6SElena Agostini 	if (!rte_gpu_is_valid(dev_id))
1328b8036a6SElena Agostini 		return NULL;
1338b8036a6SElena Agostini 	return &gpus[dev_id];
1348b8036a6SElena Agostini }
1358b8036a6SElena Agostini 
1368b8036a6SElena Agostini struct rte_gpu *
1378b8036a6SElena Agostini rte_gpu_get_by_name(const char *name)
1388b8036a6SElena Agostini {
1398b8036a6SElena Agostini 	int16_t dev_id;
1408b8036a6SElena Agostini 	struct rte_gpu *dev;
1418b8036a6SElena Agostini 
1428b8036a6SElena Agostini 	if (name == NULL) {
1438b8036a6SElena Agostini 		rte_errno = EINVAL;
1448b8036a6SElena Agostini 		return NULL;
1458b8036a6SElena Agostini 	}
1468b8036a6SElena Agostini 
1478b8036a6SElena Agostini 	RTE_GPU_FOREACH(dev_id) {
1488b8036a6SElena Agostini 		dev = &gpus[dev_id];
149a9af048aSThomas Monjalon 		if (strncmp(name, dev->mpshared->name, RTE_DEV_NAME_MAX_LEN) == 0)
1508b8036a6SElena Agostini 			return dev;
1518b8036a6SElena Agostini 	}
1528b8036a6SElena Agostini 	return NULL;
1538b8036a6SElena Agostini }
1548b8036a6SElena Agostini 
155a9af048aSThomas Monjalon static int
156a9af048aSThomas Monjalon gpu_shared_mem_init(void)
157a9af048aSThomas Monjalon {
158a9af048aSThomas Monjalon 	const struct rte_memzone *memzone;
159a9af048aSThomas Monjalon 
160a9af048aSThomas Monjalon 	if (rte_eal_process_type() == RTE_PROC_PRIMARY) {
161a9af048aSThomas Monjalon 		memzone = rte_memzone_reserve(GPU_MEMZONE,
162a9af048aSThomas Monjalon 				sizeof(*gpu_shared_mem) +
163a9af048aSThomas Monjalon 				sizeof(*gpu_shared_mem->gpus) * gpu_max,
164a9af048aSThomas Monjalon 				SOCKET_ID_ANY, 0);
165a9af048aSThomas Monjalon 	} else {
166a9af048aSThomas Monjalon 		memzone = rte_memzone_lookup(GPU_MEMZONE);
167a9af048aSThomas Monjalon 	}
168a9af048aSThomas Monjalon 	if (memzone == NULL) {
169a9af048aSThomas Monjalon 		GPU_LOG(ERR, "cannot initialize shared memory");
170a9af048aSThomas Monjalon 		rte_errno = ENOMEM;
171a9af048aSThomas Monjalon 		return -rte_errno;
172a9af048aSThomas Monjalon 	}
173a9af048aSThomas Monjalon 
174a9af048aSThomas Monjalon 	gpu_shared_mem = memzone->addr;
175a9af048aSThomas Monjalon 	return 0;
176a9af048aSThomas Monjalon }
177a9af048aSThomas Monjalon 
1788b8036a6SElena Agostini struct rte_gpu *
1798b8036a6SElena Agostini rte_gpu_allocate(const char *name)
1808b8036a6SElena Agostini {
1818b8036a6SElena Agostini 	int16_t dev_id;
1828b8036a6SElena Agostini 	struct rte_gpu *dev;
1838b8036a6SElena Agostini 
1848b8036a6SElena Agostini 	if (rte_eal_process_type() != RTE_PROC_PRIMARY) {
1858b8036a6SElena Agostini 		GPU_LOG(ERR, "only primary process can allocate device");
1868b8036a6SElena Agostini 		rte_errno = EPERM;
1878b8036a6SElena Agostini 		return NULL;
1888b8036a6SElena Agostini 	}
1898b8036a6SElena Agostini 	if (name == NULL) {
1908b8036a6SElena Agostini 		GPU_LOG(ERR, "allocate device without a name");
1918b8036a6SElena Agostini 		rte_errno = EINVAL;
1928b8036a6SElena Agostini 		return NULL;
1938b8036a6SElena Agostini 	}
1948b8036a6SElena Agostini 
1958b8036a6SElena Agostini 	/* implicit initialization of library before adding first device */
1968b8036a6SElena Agostini 	if (gpus == NULL && rte_gpu_init(RTE_GPU_DEFAULT_MAX) < 0)
1978b8036a6SElena Agostini 		return NULL;
1988b8036a6SElena Agostini 
199a9af048aSThomas Monjalon 	/* initialize shared memory before adding first device */
200a9af048aSThomas Monjalon 	if (gpu_shared_mem == NULL && gpu_shared_mem_init() < 0)
201a9af048aSThomas Monjalon 		return NULL;
202a9af048aSThomas Monjalon 
2038b8036a6SElena Agostini 	if (rte_gpu_get_by_name(name) != NULL) {
2048b8036a6SElena Agostini 		GPU_LOG(ERR, "device with name %s already exists", name);
2058b8036a6SElena Agostini 		rte_errno = EEXIST;
2068b8036a6SElena Agostini 		return NULL;
2078b8036a6SElena Agostini 	}
2088b8036a6SElena Agostini 	dev_id = gpu_find_free_id();
2098b8036a6SElena Agostini 	if (dev_id == RTE_GPU_ID_NONE) {
2108b8036a6SElena Agostini 		GPU_LOG(ERR, "reached maximum number of devices");
2118b8036a6SElena Agostini 		rte_errno = ENOENT;
2128b8036a6SElena Agostini 		return NULL;
2138b8036a6SElena Agostini 	}
2148b8036a6SElena Agostini 
2158b8036a6SElena Agostini 	dev = &gpus[dev_id];
2168b8036a6SElena Agostini 	memset(dev, 0, sizeof(*dev));
2178b8036a6SElena Agostini 
218a9af048aSThomas Monjalon 	dev->mpshared = &gpu_shared_mem->gpus[dev_id];
219a9af048aSThomas Monjalon 	memset(dev->mpshared, 0, sizeof(*dev->mpshared));
220a9af048aSThomas Monjalon 
221a9af048aSThomas Monjalon 	if (rte_strscpy(dev->mpshared->name, name, RTE_DEV_NAME_MAX_LEN) < 0) {
2228b8036a6SElena Agostini 		GPU_LOG(ERR, "device name too long: %s", name);
2238b8036a6SElena Agostini 		rte_errno = ENAMETOOLONG;
2248b8036a6SElena Agostini 		return NULL;
2258b8036a6SElena Agostini 	}
226a9af048aSThomas Monjalon 	dev->mpshared->info.name = dev->mpshared->name;
227a9af048aSThomas Monjalon 	dev->mpshared->info.dev_id = dev_id;
228a9af048aSThomas Monjalon 	dev->mpshared->info.numa_node = -1;
229a9af048aSThomas Monjalon 	dev->mpshared->info.parent = RTE_GPU_ID_NONE;
23018cb0756SThomas Monjalon 	TAILQ_INIT(&dev->callbacks);
231a9af048aSThomas Monjalon 	__atomic_fetch_add(&dev->mpshared->process_refcnt, 1, __ATOMIC_RELAXED);
2328b8036a6SElena Agostini 
2338b8036a6SElena Agostini 	gpu_count++;
2348b8036a6SElena Agostini 	GPU_LOG(DEBUG, "new device %s (id %d) of total %d",
2358b8036a6SElena Agostini 			name, dev_id, gpu_count);
2368b8036a6SElena Agostini 	return dev;
2378b8036a6SElena Agostini }
2388b8036a6SElena Agostini 
239a9af048aSThomas Monjalon struct rte_gpu *
240a9af048aSThomas Monjalon rte_gpu_attach(const char *name)
241a9af048aSThomas Monjalon {
242a9af048aSThomas Monjalon 	int16_t dev_id;
243a9af048aSThomas Monjalon 	struct rte_gpu *dev;
244a9af048aSThomas Monjalon 	struct rte_gpu_mpshared *shared_dev;
245a9af048aSThomas Monjalon 
246a9af048aSThomas Monjalon 	if (rte_eal_process_type() != RTE_PROC_SECONDARY) {
247a9af048aSThomas Monjalon 		GPU_LOG(ERR, "only secondary process can attach device");
248a9af048aSThomas Monjalon 		rte_errno = EPERM;
249a9af048aSThomas Monjalon 		return NULL;
250a9af048aSThomas Monjalon 	}
251a9af048aSThomas Monjalon 	if (name == NULL) {
252a9af048aSThomas Monjalon 		GPU_LOG(ERR, "attach device without a name");
253a9af048aSThomas Monjalon 		rte_errno = EINVAL;
254a9af048aSThomas Monjalon 		return NULL;
255a9af048aSThomas Monjalon 	}
256a9af048aSThomas Monjalon 
257a9af048aSThomas Monjalon 	/* implicit initialization of library before adding first device */
258a9af048aSThomas Monjalon 	if (gpus == NULL && rte_gpu_init(RTE_GPU_DEFAULT_MAX) < 0)
259a9af048aSThomas Monjalon 		return NULL;
260a9af048aSThomas Monjalon 
261a9af048aSThomas Monjalon 	/* initialize shared memory before adding first device */
262a9af048aSThomas Monjalon 	if (gpu_shared_mem == NULL && gpu_shared_mem_init() < 0)
263a9af048aSThomas Monjalon 		return NULL;
264a9af048aSThomas Monjalon 
265a9af048aSThomas Monjalon 	for (dev_id = 0; dev_id < gpu_max; dev_id++) {
266a9af048aSThomas Monjalon 		shared_dev = &gpu_shared_mem->gpus[dev_id];
267a9af048aSThomas Monjalon 		if (strncmp(name, shared_dev->name, RTE_DEV_NAME_MAX_LEN) == 0)
268a9af048aSThomas Monjalon 			break;
269a9af048aSThomas Monjalon 	}
270a9af048aSThomas Monjalon 	if (dev_id >= gpu_max) {
271a9af048aSThomas Monjalon 		GPU_LOG(ERR, "device with name %s not found", name);
272a9af048aSThomas Monjalon 		rte_errno = ENOENT;
273a9af048aSThomas Monjalon 		return NULL;
274a9af048aSThomas Monjalon 	}
275a9af048aSThomas Monjalon 	dev = &gpus[dev_id];
276a9af048aSThomas Monjalon 	memset(dev, 0, sizeof(*dev));
277a9af048aSThomas Monjalon 
278a9af048aSThomas Monjalon 	TAILQ_INIT(&dev->callbacks);
279a9af048aSThomas Monjalon 	dev->mpshared = shared_dev;
280a9af048aSThomas Monjalon 	__atomic_fetch_add(&dev->mpshared->process_refcnt, 1, __ATOMIC_RELAXED);
281a9af048aSThomas Monjalon 
282a9af048aSThomas Monjalon 	gpu_count++;
283a9af048aSThomas Monjalon 	GPU_LOG(DEBUG, "attached device %s (id %d) of total %d",
284a9af048aSThomas Monjalon 			name, dev_id, gpu_count);
285a9af048aSThomas Monjalon 	return dev;
286a9af048aSThomas Monjalon }
287a9af048aSThomas Monjalon 
28882e5f6b6SThomas Monjalon int16_t
28982e5f6b6SThomas Monjalon rte_gpu_add_child(const char *name, int16_t parent, uint64_t child_context)
29082e5f6b6SThomas Monjalon {
29182e5f6b6SThomas Monjalon 	struct rte_gpu *dev;
29282e5f6b6SThomas Monjalon 
29382e5f6b6SThomas Monjalon 	if (!rte_gpu_is_valid(parent)) {
29482e5f6b6SThomas Monjalon 		GPU_LOG(ERR, "add child to invalid parent ID %d", parent);
29582e5f6b6SThomas Monjalon 		rte_errno = ENODEV;
29682e5f6b6SThomas Monjalon 		return -rte_errno;
29782e5f6b6SThomas Monjalon 	}
29882e5f6b6SThomas Monjalon 
29982e5f6b6SThomas Monjalon 	dev = rte_gpu_allocate(name);
30082e5f6b6SThomas Monjalon 	if (dev == NULL)
30182e5f6b6SThomas Monjalon 		return -rte_errno;
30282e5f6b6SThomas Monjalon 
303a9af048aSThomas Monjalon 	dev->mpshared->info.parent = parent;
304a9af048aSThomas Monjalon 	dev->mpshared->info.context = child_context;
30582e5f6b6SThomas Monjalon 
30682e5f6b6SThomas Monjalon 	rte_gpu_complete_new(dev);
307a9af048aSThomas Monjalon 	return dev->mpshared->info.dev_id;
30882e5f6b6SThomas Monjalon }
30982e5f6b6SThomas Monjalon 
3108b8036a6SElena Agostini void
3118b8036a6SElena Agostini rte_gpu_complete_new(struct rte_gpu *dev)
3128b8036a6SElena Agostini {
3138b8036a6SElena Agostini 	if (dev == NULL)
3148b8036a6SElena Agostini 		return;
3158b8036a6SElena Agostini 
316a9af048aSThomas Monjalon 	dev->process_state = RTE_GPU_STATE_INITIALIZED;
31718cb0756SThomas Monjalon 	rte_gpu_notify(dev, RTE_GPU_EVENT_NEW);
3188b8036a6SElena Agostini }
3198b8036a6SElena Agostini 
3208b8036a6SElena Agostini int
3218b8036a6SElena Agostini rte_gpu_release(struct rte_gpu *dev)
3228b8036a6SElena Agostini {
32382e5f6b6SThomas Monjalon 	int16_t dev_id, child;
32482e5f6b6SThomas Monjalon 
3258b8036a6SElena Agostini 	if (dev == NULL) {
3268b8036a6SElena Agostini 		rte_errno = ENODEV;
3278b8036a6SElena Agostini 		return -rte_errno;
3288b8036a6SElena Agostini 	}
329a9af048aSThomas Monjalon 	dev_id = dev->mpshared->info.dev_id;
33082e5f6b6SThomas Monjalon 	RTE_GPU_FOREACH_CHILD(child, dev_id) {
33182e5f6b6SThomas Monjalon 		GPU_LOG(ERR, "cannot release device %d with child %d",
33282e5f6b6SThomas Monjalon 				dev_id, child);
33382e5f6b6SThomas Monjalon 		rte_errno = EBUSY;
33482e5f6b6SThomas Monjalon 		return -rte_errno;
33582e5f6b6SThomas Monjalon 	}
3368b8036a6SElena Agostini 
3378b8036a6SElena Agostini 	GPU_LOG(DEBUG, "free device %s (id %d)",
338a9af048aSThomas Monjalon 			dev->mpshared->info.name, dev->mpshared->info.dev_id);
33918cb0756SThomas Monjalon 	rte_gpu_notify(dev, RTE_GPU_EVENT_DEL);
34018cb0756SThomas Monjalon 
34118cb0756SThomas Monjalon 	gpu_free_callbacks(dev);
342a9af048aSThomas Monjalon 	dev->process_state = RTE_GPU_STATE_UNUSED;
343a9af048aSThomas Monjalon 	__atomic_fetch_sub(&dev->mpshared->process_refcnt, 1, __ATOMIC_RELAXED);
3448b8036a6SElena Agostini 	gpu_count--;
3458b8036a6SElena Agostini 
3468b8036a6SElena Agostini 	return 0;
3478b8036a6SElena Agostini }
3488b8036a6SElena Agostini 
3498b8036a6SElena Agostini int
3508b8036a6SElena Agostini rte_gpu_close(int16_t dev_id)
3518b8036a6SElena Agostini {
3528b8036a6SElena Agostini 	int firsterr, binerr;
3538b8036a6SElena Agostini 	int *lasterr = &firsterr;
3548b8036a6SElena Agostini 	struct rte_gpu *dev;
3558b8036a6SElena Agostini 
3568b8036a6SElena Agostini 	dev = gpu_get_by_id(dev_id);
3578b8036a6SElena Agostini 	if (dev == NULL) {
3588b8036a6SElena Agostini 		GPU_LOG(ERR, "close invalid device ID %d", dev_id);
3598b8036a6SElena Agostini 		rte_errno = ENODEV;
3608b8036a6SElena Agostini 		return -rte_errno;
3618b8036a6SElena Agostini 	}
3628b8036a6SElena Agostini 
3638b8036a6SElena Agostini 	if (dev->ops.dev_close != NULL) {
3648b8036a6SElena Agostini 		*lasterr = GPU_DRV_RET(dev->ops.dev_close(dev));
3658b8036a6SElena Agostini 		if (*lasterr != 0)
3668b8036a6SElena Agostini 			lasterr = &binerr;
3678b8036a6SElena Agostini 	}
3688b8036a6SElena Agostini 
3698b8036a6SElena Agostini 	*lasterr = rte_gpu_release(dev);
3708b8036a6SElena Agostini 
3718b8036a6SElena Agostini 	rte_errno = -firsterr;
3728b8036a6SElena Agostini 	return firsterr;
3738b8036a6SElena Agostini }
3748b8036a6SElena Agostini 
3758b8036a6SElena Agostini int
37618cb0756SThomas Monjalon rte_gpu_callback_register(int16_t dev_id, enum rte_gpu_event event,
37718cb0756SThomas Monjalon 		rte_gpu_callback_t *function, void *user_data)
37818cb0756SThomas Monjalon {
37918cb0756SThomas Monjalon 	int16_t next_dev, last_dev;
38018cb0756SThomas Monjalon 	struct rte_gpu_callback_list *callbacks;
38118cb0756SThomas Monjalon 	struct rte_gpu_callback *callback;
38218cb0756SThomas Monjalon 
38318cb0756SThomas Monjalon 	if (!rte_gpu_is_valid(dev_id) && dev_id != RTE_GPU_ID_ANY) {
38418cb0756SThomas Monjalon 		GPU_LOG(ERR, "register callback of invalid ID %d", dev_id);
38518cb0756SThomas Monjalon 		rte_errno = ENODEV;
38618cb0756SThomas Monjalon 		return -rte_errno;
38718cb0756SThomas Monjalon 	}
38818cb0756SThomas Monjalon 	if (function == NULL) {
38918cb0756SThomas Monjalon 		GPU_LOG(ERR, "cannot register callback without function");
39018cb0756SThomas Monjalon 		rte_errno = EINVAL;
39118cb0756SThomas Monjalon 		return -rte_errno;
39218cb0756SThomas Monjalon 	}
39318cb0756SThomas Monjalon 
39418cb0756SThomas Monjalon 	if (dev_id == RTE_GPU_ID_ANY) {
39518cb0756SThomas Monjalon 		next_dev = 0;
39618cb0756SThomas Monjalon 		last_dev = gpu_max - 1;
39718cb0756SThomas Monjalon 	} else {
39818cb0756SThomas Monjalon 		next_dev = last_dev = dev_id;
39918cb0756SThomas Monjalon 	}
40018cb0756SThomas Monjalon 
40118cb0756SThomas Monjalon 	rte_rwlock_write_lock(&gpu_callback_lock);
40218cb0756SThomas Monjalon 	do {
40318cb0756SThomas Monjalon 		callbacks = &gpus[next_dev].callbacks;
40418cb0756SThomas Monjalon 
40518cb0756SThomas Monjalon 		/* check if not already registered */
40618cb0756SThomas Monjalon 		TAILQ_FOREACH(callback, callbacks, next) {
40718cb0756SThomas Monjalon 			if (callback->event == event &&
40818cb0756SThomas Monjalon 					callback->function == function &&
40918cb0756SThomas Monjalon 					callback->user_data == user_data) {
41018cb0756SThomas Monjalon 				GPU_LOG(INFO, "callback already registered");
41118cb0756SThomas Monjalon 				return 0;
41218cb0756SThomas Monjalon 			}
41318cb0756SThomas Monjalon 		}
41418cb0756SThomas Monjalon 
41518cb0756SThomas Monjalon 		callback = malloc(sizeof(*callback));
41618cb0756SThomas Monjalon 		if (callback == NULL) {
41718cb0756SThomas Monjalon 			GPU_LOG(ERR, "cannot allocate callback");
41818cb0756SThomas Monjalon 			return -ENOMEM;
41918cb0756SThomas Monjalon 		}
42018cb0756SThomas Monjalon 		callback->function = function;
42118cb0756SThomas Monjalon 		callback->user_data = user_data;
42218cb0756SThomas Monjalon 		callback->event = event;
42318cb0756SThomas Monjalon 		TAILQ_INSERT_TAIL(callbacks, callback, next);
42418cb0756SThomas Monjalon 
42518cb0756SThomas Monjalon 	} while (++next_dev <= last_dev);
42618cb0756SThomas Monjalon 	rte_rwlock_write_unlock(&gpu_callback_lock);
42718cb0756SThomas Monjalon 
42818cb0756SThomas Monjalon 	return 0;
42918cb0756SThomas Monjalon }
43018cb0756SThomas Monjalon 
43118cb0756SThomas Monjalon int
43218cb0756SThomas Monjalon rte_gpu_callback_unregister(int16_t dev_id, enum rte_gpu_event event,
43318cb0756SThomas Monjalon 		rte_gpu_callback_t *function, void *user_data)
43418cb0756SThomas Monjalon {
43518cb0756SThomas Monjalon 	int16_t next_dev, last_dev;
43618cb0756SThomas Monjalon 	struct rte_gpu_callback_list *callbacks;
43718cb0756SThomas Monjalon 	struct rte_gpu_callback *callback, *nextcb;
43818cb0756SThomas Monjalon 
43918cb0756SThomas Monjalon 	if (!rte_gpu_is_valid(dev_id) && dev_id != RTE_GPU_ID_ANY) {
44018cb0756SThomas Monjalon 		GPU_LOG(ERR, "unregister callback of invalid ID %d", dev_id);
44118cb0756SThomas Monjalon 		rte_errno = ENODEV;
44218cb0756SThomas Monjalon 		return -rte_errno;
44318cb0756SThomas Monjalon 	}
44418cb0756SThomas Monjalon 	if (function == NULL) {
44518cb0756SThomas Monjalon 		GPU_LOG(ERR, "cannot unregister callback without function");
44618cb0756SThomas Monjalon 		rte_errno = EINVAL;
44718cb0756SThomas Monjalon 		return -rte_errno;
44818cb0756SThomas Monjalon 	}
44918cb0756SThomas Monjalon 
45018cb0756SThomas Monjalon 	if (dev_id == RTE_GPU_ID_ANY) {
45118cb0756SThomas Monjalon 		next_dev = 0;
45218cb0756SThomas Monjalon 		last_dev = gpu_max - 1;
45318cb0756SThomas Monjalon 	} else {
45418cb0756SThomas Monjalon 		next_dev = last_dev = dev_id;
45518cb0756SThomas Monjalon 	}
45618cb0756SThomas Monjalon 
45718cb0756SThomas Monjalon 	rte_rwlock_write_lock(&gpu_callback_lock);
45818cb0756SThomas Monjalon 	do {
45918cb0756SThomas Monjalon 		callbacks = &gpus[next_dev].callbacks;
46018cb0756SThomas Monjalon 		RTE_TAILQ_FOREACH_SAFE(callback, callbacks, next, nextcb) {
46118cb0756SThomas Monjalon 			if (callback->event != event ||
46218cb0756SThomas Monjalon 					callback->function != function ||
46318cb0756SThomas Monjalon 					(callback->user_data != user_data &&
46418cb0756SThomas Monjalon 					user_data != (void *)-1))
46518cb0756SThomas Monjalon 				continue;
46618cb0756SThomas Monjalon 			TAILQ_REMOVE(callbacks, callback, next);
46718cb0756SThomas Monjalon 			free(callback);
46818cb0756SThomas Monjalon 		}
46918cb0756SThomas Monjalon 	} while (++next_dev <= last_dev);
47018cb0756SThomas Monjalon 	rte_rwlock_write_unlock(&gpu_callback_lock);
47118cb0756SThomas Monjalon 
47218cb0756SThomas Monjalon 	return 0;
47318cb0756SThomas Monjalon }
47418cb0756SThomas Monjalon 
47518cb0756SThomas Monjalon static void
47618cb0756SThomas Monjalon gpu_free_callbacks(struct rte_gpu *dev)
47718cb0756SThomas Monjalon {
47818cb0756SThomas Monjalon 	struct rte_gpu_callback_list *callbacks;
47918cb0756SThomas Monjalon 	struct rte_gpu_callback *callback, *nextcb;
48018cb0756SThomas Monjalon 
48118cb0756SThomas Monjalon 	callbacks = &dev->callbacks;
48218cb0756SThomas Monjalon 	rte_rwlock_write_lock(&gpu_callback_lock);
48318cb0756SThomas Monjalon 	RTE_TAILQ_FOREACH_SAFE(callback, callbacks, next, nextcb) {
48418cb0756SThomas Monjalon 		TAILQ_REMOVE(callbacks, callback, next);
48518cb0756SThomas Monjalon 		free(callback);
48618cb0756SThomas Monjalon 	}
48718cb0756SThomas Monjalon 	rte_rwlock_write_unlock(&gpu_callback_lock);
48818cb0756SThomas Monjalon }
48918cb0756SThomas Monjalon 
49018cb0756SThomas Monjalon void
49118cb0756SThomas Monjalon rte_gpu_notify(struct rte_gpu *dev, enum rte_gpu_event event)
49218cb0756SThomas Monjalon {
49318cb0756SThomas Monjalon 	int16_t dev_id;
49418cb0756SThomas Monjalon 	struct rte_gpu_callback *callback;
49518cb0756SThomas Monjalon 
496a9af048aSThomas Monjalon 	dev_id = dev->mpshared->info.dev_id;
49718cb0756SThomas Monjalon 	rte_rwlock_read_lock(&gpu_callback_lock);
49818cb0756SThomas Monjalon 	TAILQ_FOREACH(callback, &dev->callbacks, next) {
49918cb0756SThomas Monjalon 		if (callback->event != event || callback->function == NULL)
50018cb0756SThomas Monjalon 			continue;
50118cb0756SThomas Monjalon 		callback->function(dev_id, event, callback->user_data);
50218cb0756SThomas Monjalon 	}
50318cb0756SThomas Monjalon 	rte_rwlock_read_unlock(&gpu_callback_lock);
50418cb0756SThomas Monjalon }
50518cb0756SThomas Monjalon 
50618cb0756SThomas Monjalon int
5078b8036a6SElena Agostini rte_gpu_info_get(int16_t dev_id, struct rte_gpu_info *info)
5088b8036a6SElena Agostini {
5098b8036a6SElena Agostini 	struct rte_gpu *dev;
5108b8036a6SElena Agostini 
5118b8036a6SElena Agostini 	dev = gpu_get_by_id(dev_id);
5128b8036a6SElena Agostini 	if (dev == NULL) {
5138b8036a6SElena Agostini 		GPU_LOG(ERR, "query invalid device ID %d", dev_id);
5148b8036a6SElena Agostini 		rte_errno = ENODEV;
5158b8036a6SElena Agostini 		return -rte_errno;
5168b8036a6SElena Agostini 	}
5178b8036a6SElena Agostini 	if (info == NULL) {
5188b8036a6SElena Agostini 		GPU_LOG(ERR, "query without storage");
5198b8036a6SElena Agostini 		rte_errno = EINVAL;
5208b8036a6SElena Agostini 		return -rte_errno;
5218b8036a6SElena Agostini 	}
5228b8036a6SElena Agostini 
5238b8036a6SElena Agostini 	if (dev->ops.dev_info_get == NULL) {
524a9af048aSThomas Monjalon 		*info = dev->mpshared->info;
5258b8036a6SElena Agostini 		return 0;
5268b8036a6SElena Agostini 	}
5278b8036a6SElena Agostini 	return GPU_DRV_RET(dev->ops.dev_info_get(dev, info));
5288b8036a6SElena Agostini }
529e818c4e2SElena Agostini 
530e818c4e2SElena Agostini void *
531c8557ed4SElena Agostini rte_gpu_mem_alloc(int16_t dev_id, size_t size, unsigned int align)
532e818c4e2SElena Agostini {
533e818c4e2SElena Agostini 	struct rte_gpu *dev;
534e818c4e2SElena Agostini 	void *ptr;
535e818c4e2SElena Agostini 	int ret;
536e818c4e2SElena Agostini 
537e818c4e2SElena Agostini 	dev = gpu_get_by_id(dev_id);
538e818c4e2SElena Agostini 	if (dev == NULL) {
539e818c4e2SElena Agostini 		GPU_LOG(ERR, "alloc mem for invalid device ID %d", dev_id);
540e818c4e2SElena Agostini 		rte_errno = ENODEV;
541e818c4e2SElena Agostini 		return NULL;
542e818c4e2SElena Agostini 	}
543e818c4e2SElena Agostini 
544e818c4e2SElena Agostini 	if (dev->ops.mem_alloc == NULL) {
545e818c4e2SElena Agostini 		GPU_LOG(ERR, "mem allocation not supported");
546e818c4e2SElena Agostini 		rte_errno = ENOTSUP;
547e818c4e2SElena Agostini 		return NULL;
548e818c4e2SElena Agostini 	}
549e818c4e2SElena Agostini 
550e818c4e2SElena Agostini 	if (size == 0) /* dry-run */
551e818c4e2SElena Agostini 		return NULL;
552e818c4e2SElena Agostini 
553c8557ed4SElena Agostini 	if (align && !rte_is_power_of_2(align)) {
554c8557ed4SElena Agostini 		GPU_LOG(ERR, "requested alignment is not a power of two %u", align);
555c8557ed4SElena Agostini 		rte_errno = EINVAL;
556c8557ed4SElena Agostini 		return NULL;
557c8557ed4SElena Agostini 	}
558c8557ed4SElena Agostini 
559c8557ed4SElena Agostini 	ret = dev->ops.mem_alloc(dev, size, align, &ptr);
560e818c4e2SElena Agostini 
561e818c4e2SElena Agostini 	switch (ret) {
562e818c4e2SElena Agostini 	case 0:
563e818c4e2SElena Agostini 		return ptr;
564e818c4e2SElena Agostini 	case -ENOMEM:
565e818c4e2SElena Agostini 	case -E2BIG:
566e818c4e2SElena Agostini 		rte_errno = -ret;
567e818c4e2SElena Agostini 		return NULL;
568e818c4e2SElena Agostini 	default:
569e818c4e2SElena Agostini 		rte_errno = -EPERM;
570e818c4e2SElena Agostini 		return NULL;
571e818c4e2SElena Agostini 	}
572e818c4e2SElena Agostini }
573e818c4e2SElena Agostini 
574e818c4e2SElena Agostini int
575e818c4e2SElena Agostini rte_gpu_mem_free(int16_t dev_id, void *ptr)
576e818c4e2SElena Agostini {
577e818c4e2SElena Agostini 	struct rte_gpu *dev;
578e818c4e2SElena Agostini 
579e818c4e2SElena Agostini 	dev = gpu_get_by_id(dev_id);
580e818c4e2SElena Agostini 	if (dev == NULL) {
581e818c4e2SElena Agostini 		GPU_LOG(ERR, "free mem for invalid device ID %d", dev_id);
582e818c4e2SElena Agostini 		rte_errno = ENODEV;
583e818c4e2SElena Agostini 		return -rte_errno;
584e818c4e2SElena Agostini 	}
585e818c4e2SElena Agostini 
586e818c4e2SElena Agostini 	if (dev->ops.mem_free == NULL) {
587e818c4e2SElena Agostini 		rte_errno = ENOTSUP;
588e818c4e2SElena Agostini 		return -rte_errno;
589e818c4e2SElena Agostini 	}
5901674c56dSElena Agostini 
5911674c56dSElena Agostini 	if (ptr == NULL) /* dry-run */
5921674c56dSElena Agostini 		return 0;
5931674c56dSElena Agostini 
594e818c4e2SElena Agostini 	return GPU_DRV_RET(dev->ops.mem_free(dev, ptr));
595e818c4e2SElena Agostini }
596e818c4e2SElena Agostini 
597e818c4e2SElena Agostini int
598e818c4e2SElena Agostini rte_gpu_mem_register(int16_t dev_id, size_t size, void *ptr)
599e818c4e2SElena Agostini {
600e818c4e2SElena Agostini 	struct rte_gpu *dev;
601e818c4e2SElena Agostini 
602e818c4e2SElena Agostini 	dev = gpu_get_by_id(dev_id);
603e818c4e2SElena Agostini 	if (dev == NULL) {
604e818c4e2SElena Agostini 		GPU_LOG(ERR, "alloc mem for invalid device ID %d", dev_id);
605e818c4e2SElena Agostini 		rte_errno = ENODEV;
606e818c4e2SElena Agostini 		return -rte_errno;
607e818c4e2SElena Agostini 	}
608e818c4e2SElena Agostini 
609e818c4e2SElena Agostini 	if (dev->ops.mem_register == NULL) {
610e818c4e2SElena Agostini 		GPU_LOG(ERR, "mem registration not supported");
611e818c4e2SElena Agostini 		rte_errno = ENOTSUP;
612e818c4e2SElena Agostini 		return -rte_errno;
613e818c4e2SElena Agostini 	}
614e818c4e2SElena Agostini 
6151674c56dSElena Agostini 	if (ptr == NULL || size == 0) /* dry-run  */
6161674c56dSElena Agostini 		return 0;
617e818c4e2SElena Agostini 
618e818c4e2SElena Agostini 	return GPU_DRV_RET(dev->ops.mem_register(dev, size, ptr));
619e818c4e2SElena Agostini }
620e818c4e2SElena Agostini 
621e818c4e2SElena Agostini int
622e818c4e2SElena Agostini rte_gpu_mem_unregister(int16_t dev_id, void *ptr)
623e818c4e2SElena Agostini {
624e818c4e2SElena Agostini 	struct rte_gpu *dev;
625e818c4e2SElena Agostini 
626e818c4e2SElena Agostini 	dev = gpu_get_by_id(dev_id);
627e818c4e2SElena Agostini 	if (dev == NULL) {
628e818c4e2SElena Agostini 		GPU_LOG(ERR, "unregister mem for invalid device ID %d", dev_id);
629e818c4e2SElena Agostini 		rte_errno = ENODEV;
630e818c4e2SElena Agostini 		return -rte_errno;
631e818c4e2SElena Agostini 	}
632e818c4e2SElena Agostini 
633e818c4e2SElena Agostini 	if (dev->ops.mem_unregister == NULL) {
634e818c4e2SElena Agostini 		rte_errno = ENOTSUP;
635e818c4e2SElena Agostini 		return -rte_errno;
636e818c4e2SElena Agostini 	}
6371674c56dSElena Agostini 
6381674c56dSElena Agostini 	if (ptr == NULL) /* dry-run */
6391674c56dSElena Agostini 		return 0;
6401674c56dSElena Agostini 
641e818c4e2SElena Agostini 	return GPU_DRV_RET(dev->ops.mem_unregister(dev, ptr));
642e818c4e2SElena Agostini }
6432d61b429SElena Agostini 
644d69bb47dSElena Agostini void *
645d69bb47dSElena Agostini rte_gpu_mem_cpu_map(int16_t dev_id, size_t size, void *ptr)
646d69bb47dSElena Agostini {
647d69bb47dSElena Agostini 	struct rte_gpu *dev;
648d69bb47dSElena Agostini 	void *ptr_out;
649d69bb47dSElena Agostini 	int ret;
650d69bb47dSElena Agostini 
651d69bb47dSElena Agostini 	dev = gpu_get_by_id(dev_id);
652d69bb47dSElena Agostini 	if (dev == NULL) {
653d69bb47dSElena Agostini 		GPU_LOG(ERR, "mem CPU map for invalid device ID %d", dev_id);
654d69bb47dSElena Agostini 		rte_errno = ENODEV;
655d69bb47dSElena Agostini 		return NULL;
656d69bb47dSElena Agostini 	}
657d69bb47dSElena Agostini 
658d69bb47dSElena Agostini 	if (dev->ops.mem_cpu_map == NULL) {
659d69bb47dSElena Agostini 		GPU_LOG(ERR, "mem CPU map not supported");
660d69bb47dSElena Agostini 		rte_errno = ENOTSUP;
661d69bb47dSElena Agostini 		return NULL;
662d69bb47dSElena Agostini 	}
663d69bb47dSElena Agostini 
664d69bb47dSElena Agostini 	if (ptr == NULL || size == 0) /* dry-run  */
665d69bb47dSElena Agostini 		return NULL;
666d69bb47dSElena Agostini 
667d69bb47dSElena Agostini 	ret = GPU_DRV_RET(dev->ops.mem_cpu_map(dev, size, ptr, &ptr_out));
668d69bb47dSElena Agostini 
669d69bb47dSElena Agostini 	switch (ret) {
670d69bb47dSElena Agostini 	case 0:
671d69bb47dSElena Agostini 		return ptr_out;
672d69bb47dSElena Agostini 	case -ENOMEM:
673d69bb47dSElena Agostini 	case -E2BIG:
674d69bb47dSElena Agostini 		rte_errno = -ret;
675d69bb47dSElena Agostini 		return NULL;
676d69bb47dSElena Agostini 	default:
677d69bb47dSElena Agostini 		rte_errno = -EPERM;
678d69bb47dSElena Agostini 		return NULL;
679d69bb47dSElena Agostini 	}
680d69bb47dSElena Agostini }
681d69bb47dSElena Agostini 
682d69bb47dSElena Agostini int
683d69bb47dSElena Agostini rte_gpu_mem_cpu_unmap(int16_t dev_id, void *ptr)
684d69bb47dSElena Agostini {
685d69bb47dSElena Agostini 	struct rte_gpu *dev;
686d69bb47dSElena Agostini 
687d69bb47dSElena Agostini 	dev = gpu_get_by_id(dev_id);
688d69bb47dSElena Agostini 	if (dev == NULL) {
689d69bb47dSElena Agostini 		GPU_LOG(ERR, "cpu_unmap mem for invalid device ID %d", dev_id);
690d69bb47dSElena Agostini 		rte_errno = ENODEV;
691d69bb47dSElena Agostini 		return -rte_errno;
692d69bb47dSElena Agostini 	}
693d69bb47dSElena Agostini 
694d69bb47dSElena Agostini 	if (dev->ops.mem_cpu_unmap == NULL) {
695d69bb47dSElena Agostini 		rte_errno = ENOTSUP;
696d69bb47dSElena Agostini 		return -rte_errno;
697d69bb47dSElena Agostini 	}
698d69bb47dSElena Agostini 
699d69bb47dSElena Agostini 	if (ptr == NULL) /* dry-run */
700d69bb47dSElena Agostini 		return 0;
701d69bb47dSElena Agostini 
702d69bb47dSElena Agostini 	return GPU_DRV_RET(dev->ops.mem_cpu_unmap(dev, ptr));
703d69bb47dSElena Agostini }
704d69bb47dSElena Agostini 
7052d61b429SElena Agostini int
7062d61b429SElena Agostini rte_gpu_wmb(int16_t dev_id)
7072d61b429SElena Agostini {
7082d61b429SElena Agostini 	struct rte_gpu *dev;
7092d61b429SElena Agostini 
7102d61b429SElena Agostini 	dev = gpu_get_by_id(dev_id);
7112d61b429SElena Agostini 	if (dev == NULL) {
7122d61b429SElena Agostini 		GPU_LOG(ERR, "memory barrier for invalid device ID %d", dev_id);
7132d61b429SElena Agostini 		rte_errno = ENODEV;
7142d61b429SElena Agostini 		return -rte_errno;
7152d61b429SElena Agostini 	}
7162d61b429SElena Agostini 
7172d61b429SElena Agostini 	if (dev->ops.wmb == NULL) {
7182d61b429SElena Agostini 		rte_errno = ENOTSUP;
7192d61b429SElena Agostini 		return -rte_errno;
7202d61b429SElena Agostini 	}
7212d61b429SElena Agostini 	return GPU_DRV_RET(dev->ops.wmb(dev));
7222d61b429SElena Agostini }
723f56160a2SElena Agostini 
724f56160a2SElena Agostini int
725f56160a2SElena Agostini rte_gpu_comm_create_flag(uint16_t dev_id, struct rte_gpu_comm_flag *devflag,
726f56160a2SElena Agostini 		enum rte_gpu_comm_flag_type mtype)
727f56160a2SElena Agostini {
728f56160a2SElena Agostini 	size_t flag_size;
729f56160a2SElena Agostini 	int ret;
730f56160a2SElena Agostini 
731f56160a2SElena Agostini 	if (devflag == NULL) {
732f56160a2SElena Agostini 		rte_errno = EINVAL;
733f56160a2SElena Agostini 		return -rte_errno;
734f56160a2SElena Agostini 	}
735f56160a2SElena Agostini 	if (mtype != RTE_GPU_COMM_FLAG_CPU) {
736f56160a2SElena Agostini 		rte_errno = EINVAL;
737f56160a2SElena Agostini 		return -rte_errno;
738f56160a2SElena Agostini 	}
739f56160a2SElena Agostini 
740f56160a2SElena Agostini 	flag_size = sizeof(uint32_t);
741f56160a2SElena Agostini 
742f56160a2SElena Agostini 	devflag->ptr = rte_zmalloc(NULL, flag_size, 0);
743f56160a2SElena Agostini 	if (devflag->ptr == NULL) {
744f56160a2SElena Agostini 		rte_errno = ENOMEM;
745f56160a2SElena Agostini 		return -rte_errno;
746f56160a2SElena Agostini 	}
747f56160a2SElena Agostini 
748f56160a2SElena Agostini 	ret = rte_gpu_mem_register(dev_id, flag_size, devflag->ptr);
749f56160a2SElena Agostini 	if (ret < 0) {
750f56160a2SElena Agostini 		rte_errno = ENOMEM;
751f56160a2SElena Agostini 		return -rte_errno;
752f56160a2SElena Agostini 	}
753f56160a2SElena Agostini 
754f56160a2SElena Agostini 	devflag->mtype = mtype;
755f56160a2SElena Agostini 	devflag->dev_id = dev_id;
756f56160a2SElena Agostini 
757f56160a2SElena Agostini 	return 0;
758f56160a2SElena Agostini }
759f56160a2SElena Agostini 
760f56160a2SElena Agostini int
761f56160a2SElena Agostini rte_gpu_comm_destroy_flag(struct rte_gpu_comm_flag *devflag)
762f56160a2SElena Agostini {
763f56160a2SElena Agostini 	int ret;
764f56160a2SElena Agostini 
765f56160a2SElena Agostini 	if (devflag == NULL) {
766f56160a2SElena Agostini 		rte_errno = EINVAL;
767f56160a2SElena Agostini 		return -rte_errno;
768f56160a2SElena Agostini 	}
769f56160a2SElena Agostini 
770f56160a2SElena Agostini 	ret = rte_gpu_mem_unregister(devflag->dev_id, devflag->ptr);
771f56160a2SElena Agostini 	if (ret < 0) {
772f56160a2SElena Agostini 		rte_errno = EINVAL;
773f56160a2SElena Agostini 		return -1;
774f56160a2SElena Agostini 	}
775f56160a2SElena Agostini 
776f56160a2SElena Agostini 	rte_free(devflag->ptr);
777f56160a2SElena Agostini 
778f56160a2SElena Agostini 	return 0;
779f56160a2SElena Agostini }
780f56160a2SElena Agostini 
781f56160a2SElena Agostini int
782f56160a2SElena Agostini rte_gpu_comm_set_flag(struct rte_gpu_comm_flag *devflag, uint32_t val)
783f56160a2SElena Agostini {
784f56160a2SElena Agostini 	if (devflag == NULL) {
785f56160a2SElena Agostini 		rte_errno = EINVAL;
786f56160a2SElena Agostini 		return -rte_errno;
787f56160a2SElena Agostini 	}
788f56160a2SElena Agostini 
789f56160a2SElena Agostini 	if (devflag->mtype != RTE_GPU_COMM_FLAG_CPU) {
790f56160a2SElena Agostini 		rte_errno = EINVAL;
791f56160a2SElena Agostini 		return -rte_errno;
792f56160a2SElena Agostini 	}
793f56160a2SElena Agostini 
794f56160a2SElena Agostini 	RTE_GPU_VOLATILE(*devflag->ptr) = val;
795f56160a2SElena Agostini 
796f56160a2SElena Agostini 	return 0;
797f56160a2SElena Agostini }
798f56160a2SElena Agostini 
799f56160a2SElena Agostini int
800f56160a2SElena Agostini rte_gpu_comm_get_flag_value(struct rte_gpu_comm_flag *devflag, uint32_t *val)
801f56160a2SElena Agostini {
802f56160a2SElena Agostini 	if (devflag == NULL) {
803f56160a2SElena Agostini 		rte_errno = EINVAL;
804f56160a2SElena Agostini 		return -rte_errno;
805f56160a2SElena Agostini 	}
806f56160a2SElena Agostini 	if (devflag->mtype != RTE_GPU_COMM_FLAG_CPU) {
807f56160a2SElena Agostini 		rte_errno = EINVAL;
808f56160a2SElena Agostini 		return -rte_errno;
809f56160a2SElena Agostini 	}
810f56160a2SElena Agostini 
811f56160a2SElena Agostini 	*val = RTE_GPU_VOLATILE(*devflag->ptr);
812f56160a2SElena Agostini 
813f56160a2SElena Agostini 	return 0;
814f56160a2SElena Agostini }
815c7ebd65cSElena Agostini 
816c7ebd65cSElena Agostini struct rte_gpu_comm_list *
817c7ebd65cSElena Agostini rte_gpu_comm_create_list(uint16_t dev_id,
818c7ebd65cSElena Agostini 		uint32_t num_comm_items)
819c7ebd65cSElena Agostini {
820c7ebd65cSElena Agostini 	struct rte_gpu_comm_list *comm_list;
821c7ebd65cSElena Agostini 	uint32_t idx_l;
822c7ebd65cSElena Agostini 	int ret;
823c7ebd65cSElena Agostini 	struct rte_gpu *dev;
8241fd3de64SElena Agostini 	struct rte_gpu_info info;
825c7ebd65cSElena Agostini 
826c7ebd65cSElena Agostini 	if (num_comm_items == 0) {
827c7ebd65cSElena Agostini 		rte_errno = EINVAL;
828c7ebd65cSElena Agostini 		return NULL;
829c7ebd65cSElena Agostini 	}
830c7ebd65cSElena Agostini 
831c7ebd65cSElena Agostini 	dev = gpu_get_by_id(dev_id);
832c7ebd65cSElena Agostini 	if (dev == NULL) {
833c7ebd65cSElena Agostini 		GPU_LOG(ERR, "memory barrier for invalid device ID %d", dev_id);
834c7ebd65cSElena Agostini 		rte_errno = ENODEV;
835c7ebd65cSElena Agostini 		return NULL;
836c7ebd65cSElena Agostini 	}
837c7ebd65cSElena Agostini 
8381fd3de64SElena Agostini 	ret = rte_gpu_info_get(dev_id, &info);
8391fd3de64SElena Agostini 	if (ret < 0) {
8401fd3de64SElena Agostini 		rte_errno = ENODEV;
8411fd3de64SElena Agostini 		return NULL;
8421fd3de64SElena Agostini 	}
8431fd3de64SElena Agostini 
844c7ebd65cSElena Agostini 	comm_list = rte_zmalloc(NULL,
845c7ebd65cSElena Agostini 			sizeof(struct rte_gpu_comm_list) * num_comm_items, 0);
846c7ebd65cSElena Agostini 	if (comm_list == NULL) {
847c7ebd65cSElena Agostini 		rte_errno = ENOMEM;
848c7ebd65cSElena Agostini 		return NULL;
849c7ebd65cSElena Agostini 	}
850c7ebd65cSElena Agostini 
851c7ebd65cSElena Agostini 	ret = rte_gpu_mem_register(dev_id,
852c7ebd65cSElena Agostini 			sizeof(struct rte_gpu_comm_list) * num_comm_items, comm_list);
853c7ebd65cSElena Agostini 	if (ret < 0) {
854c7ebd65cSElena Agostini 		rte_errno = ENOMEM;
855c7ebd65cSElena Agostini 		return NULL;
856c7ebd65cSElena Agostini 	}
857c7ebd65cSElena Agostini 
8589b8cae4dSElena Agostini 	/*
8599b8cae4dSElena Agostini 	 * Use GPU memory CPU map feature if enabled in the driver
8609b8cae4dSElena Agostini 	 * to allocate the status flags of the list.
8619b8cae4dSElena Agostini 	 * Allocating this flag in GPU memory will reduce
8629b8cae4dSElena Agostini 	 * the latency when GPU workload is polling this flag.
8639b8cae4dSElena Agostini 	 */
8649b8cae4dSElena Agostini 	comm_list[0].status_d = rte_gpu_mem_alloc(dev_id,
8659b8cae4dSElena Agostini 			sizeof(enum rte_gpu_comm_list_status) * num_comm_items,
8661fd3de64SElena Agostini 			info.page_size);
8679b8cae4dSElena Agostini 	if (ret < 0) {
8689b8cae4dSElena Agostini 		rte_errno = ENOMEM;
8699b8cae4dSElena Agostini 		return NULL;
8709b8cae4dSElena Agostini 	}
8719b8cae4dSElena Agostini 
8729b8cae4dSElena Agostini 	comm_list[0].status_h = rte_gpu_mem_cpu_map(dev_id,
8739b8cae4dSElena Agostini 			sizeof(enum rte_gpu_comm_list_status) * num_comm_items,
8749b8cae4dSElena Agostini 			comm_list[0].status_d);
8759b8cae4dSElena Agostini 	if (comm_list[0].status_h == NULL) {
8769b8cae4dSElena Agostini 		/*
8779b8cae4dSElena Agostini 		 * If CPU mapping is not supported by driver
8789b8cae4dSElena Agostini 		 * use regular CPU registered memory.
8799b8cae4dSElena Agostini 		 */
8809b8cae4dSElena Agostini 		comm_list[0].status_h = rte_zmalloc(NULL,
8819b8cae4dSElena Agostini 				sizeof(enum rte_gpu_comm_list_status) * num_comm_items, 0);
8829b8cae4dSElena Agostini 		if (comm_list[0].status_h == NULL) {
8839b8cae4dSElena Agostini 			rte_errno = ENOMEM;
8849b8cae4dSElena Agostini 			return NULL;
8859b8cae4dSElena Agostini 		}
8869b8cae4dSElena Agostini 
8879b8cae4dSElena Agostini 		ret = rte_gpu_mem_register(dev_id,
8889b8cae4dSElena Agostini 				sizeof(enum rte_gpu_comm_list_status) * num_comm_items,
8899b8cae4dSElena Agostini 				comm_list[0].status_h);
8909b8cae4dSElena Agostini 		if (ret < 0) {
8919b8cae4dSElena Agostini 			rte_errno = ENOMEM;
8929b8cae4dSElena Agostini 			return NULL;
8939b8cae4dSElena Agostini 		}
8949b8cae4dSElena Agostini 
8959b8cae4dSElena Agostini 		comm_list[0].status_d = comm_list[0].status_h;
8969b8cae4dSElena Agostini 	}
8979b8cae4dSElena Agostini 
898c7ebd65cSElena Agostini 	for (idx_l = 0; idx_l < num_comm_items; idx_l++) {
899c7ebd65cSElena Agostini 		comm_list[idx_l].pkt_list = rte_zmalloc(NULL,
900c7ebd65cSElena Agostini 				sizeof(struct rte_gpu_comm_pkt) * RTE_GPU_COMM_LIST_PKTS_MAX, 0);
901c7ebd65cSElena Agostini 		if (comm_list[idx_l].pkt_list == NULL) {
902c7ebd65cSElena Agostini 			rte_errno = ENOMEM;
903c7ebd65cSElena Agostini 			return NULL;
904c7ebd65cSElena Agostini 		}
905c7ebd65cSElena Agostini 
906c7ebd65cSElena Agostini 		ret = rte_gpu_mem_register(dev_id,
907c7ebd65cSElena Agostini 				sizeof(struct rte_gpu_comm_pkt) * RTE_GPU_COMM_LIST_PKTS_MAX,
908c7ebd65cSElena Agostini 				comm_list[idx_l].pkt_list);
909c7ebd65cSElena Agostini 		if (ret < 0) {
910c7ebd65cSElena Agostini 			rte_errno = ENOMEM;
911c7ebd65cSElena Agostini 			return NULL;
912c7ebd65cSElena Agostini 		}
913c7ebd65cSElena Agostini 
914c7ebd65cSElena Agostini 		comm_list[idx_l].num_pkts = 0;
915c7ebd65cSElena Agostini 		comm_list[idx_l].dev_id = dev_id;
916c7ebd65cSElena Agostini 
917c7ebd65cSElena Agostini 		comm_list[idx_l].mbufs = rte_zmalloc(NULL,
918c7ebd65cSElena Agostini 				sizeof(struct rte_mbuf *) * RTE_GPU_COMM_LIST_PKTS_MAX, 0);
919c7ebd65cSElena Agostini 		if (comm_list[idx_l].mbufs == NULL) {
920c7ebd65cSElena Agostini 			rte_errno = ENOMEM;
921c7ebd65cSElena Agostini 			return NULL;
922c7ebd65cSElena Agostini 		}
9239b8cae4dSElena Agostini 
9249b8cae4dSElena Agostini 		if (idx_l > 0) {
9259b8cae4dSElena Agostini 			comm_list[idx_l].status_h = &(comm_list[0].status_h[idx_l]);
9269b8cae4dSElena Agostini 			comm_list[idx_l].status_d = &(comm_list[0].status_d[idx_l]);
9279b8cae4dSElena Agostini 
9289b8cae4dSElena Agostini 			ret = rte_gpu_comm_set_status(&comm_list[idx_l], RTE_GPU_COMM_LIST_FREE);
9299b8cae4dSElena Agostini 			if (ret < 0) {
9309b8cae4dSElena Agostini 				rte_errno = ENOMEM;
9319b8cae4dSElena Agostini 				return NULL;
9329b8cae4dSElena Agostini 			}
9339b8cae4dSElena Agostini 		}
934c7ebd65cSElena Agostini 	}
935c7ebd65cSElena Agostini 
936c7ebd65cSElena Agostini 	return comm_list;
937c7ebd65cSElena Agostini }
938c7ebd65cSElena Agostini 
939c7ebd65cSElena Agostini int
940c7ebd65cSElena Agostini rte_gpu_comm_destroy_list(struct rte_gpu_comm_list *comm_list,
941c7ebd65cSElena Agostini 		uint32_t num_comm_items)
942c7ebd65cSElena Agostini {
943c7ebd65cSElena Agostini 	uint32_t idx_l;
944c7ebd65cSElena Agostini 	int ret;
945c7ebd65cSElena Agostini 	uint16_t dev_id;
946c7ebd65cSElena Agostini 
947c7ebd65cSElena Agostini 	if (comm_list == NULL) {
948c7ebd65cSElena Agostini 		rte_errno = EINVAL;
949c7ebd65cSElena Agostini 		return -rte_errno;
950c7ebd65cSElena Agostini 	}
951c7ebd65cSElena Agostini 
952c7ebd65cSElena Agostini 	dev_id = comm_list[0].dev_id;
953c7ebd65cSElena Agostini 
954c7ebd65cSElena Agostini 	for (idx_l = 0; idx_l < num_comm_items; idx_l++) {
955c7ebd65cSElena Agostini 		ret = rte_gpu_mem_unregister(dev_id, comm_list[idx_l].pkt_list);
956c7ebd65cSElena Agostini 		if (ret < 0) {
957c7ebd65cSElena Agostini 			rte_errno = EINVAL;
958c7ebd65cSElena Agostini 			return -1;
959c7ebd65cSElena Agostini 		}
960c7ebd65cSElena Agostini 
961c7ebd65cSElena Agostini 		rte_free(comm_list[idx_l].pkt_list);
962c7ebd65cSElena Agostini 		rte_free(comm_list[idx_l].mbufs);
963c7ebd65cSElena Agostini 	}
964c7ebd65cSElena Agostini 
965c7ebd65cSElena Agostini 	ret = rte_gpu_mem_unregister(dev_id, comm_list);
966c7ebd65cSElena Agostini 	if (ret < 0) {
967c7ebd65cSElena Agostini 		rte_errno = EINVAL;
968c7ebd65cSElena Agostini 		return -1;
969c7ebd65cSElena Agostini 	}
970c7ebd65cSElena Agostini 
9719b8cae4dSElena Agostini 	ret = rte_gpu_mem_cpu_unmap(dev_id, comm_list[0].status_d);
9729b8cae4dSElena Agostini 	if (ret == 0) {
9739b8cae4dSElena Agostini 		rte_gpu_mem_free(dev_id, comm_list[0].status_d);
9749b8cae4dSElena Agostini 	} else {
9759b8cae4dSElena Agostini 		rte_gpu_mem_unregister(dev_id, comm_list[0].status_h);
9769b8cae4dSElena Agostini 		rte_free(comm_list[0].status_h);
9779b8cae4dSElena Agostini 	}
9789b8cae4dSElena Agostini 
979c7ebd65cSElena Agostini 	rte_free(comm_list);
980c7ebd65cSElena Agostini 
981c7ebd65cSElena Agostini 	return 0;
982c7ebd65cSElena Agostini }
983c7ebd65cSElena Agostini 
984c7ebd65cSElena Agostini int
985c7ebd65cSElena Agostini rte_gpu_comm_populate_list_pkts(struct rte_gpu_comm_list *comm_list_item,
986c7ebd65cSElena Agostini 		struct rte_mbuf **mbufs, uint32_t num_mbufs)
987c7ebd65cSElena Agostini {
988c7ebd65cSElena Agostini 	uint32_t idx;
9899b8cae4dSElena Agostini 	int ret;
990c7ebd65cSElena Agostini 
991c7ebd65cSElena Agostini 	if (comm_list_item == NULL || comm_list_item->pkt_list == NULL ||
992c7ebd65cSElena Agostini 			mbufs == NULL || num_mbufs > RTE_GPU_COMM_LIST_PKTS_MAX) {
993c7ebd65cSElena Agostini 		rte_errno = EINVAL;
994c7ebd65cSElena Agostini 		return -rte_errno;
995c7ebd65cSElena Agostini 	}
996c7ebd65cSElena Agostini 
997c7ebd65cSElena Agostini 	for (idx = 0; idx < num_mbufs; idx++) {
998c7ebd65cSElena Agostini 		/* support only unchained mbufs */
999c7ebd65cSElena Agostini 		if (unlikely((mbufs[idx]->nb_segs > 1) ||
1000c7ebd65cSElena Agostini 				(mbufs[idx]->next != NULL) ||
1001c7ebd65cSElena Agostini 				(mbufs[idx]->data_len != mbufs[idx]->pkt_len))) {
1002c7ebd65cSElena Agostini 			rte_errno = ENOTSUP;
1003c7ebd65cSElena Agostini 			return -rte_errno;
1004c7ebd65cSElena Agostini 		}
1005c7ebd65cSElena Agostini 		comm_list_item->pkt_list[idx].addr =
1006c7ebd65cSElena Agostini 				rte_pktmbuf_mtod_offset(mbufs[idx], uintptr_t, 0);
1007c7ebd65cSElena Agostini 		comm_list_item->pkt_list[idx].size = mbufs[idx]->pkt_len;
1008c7ebd65cSElena Agostini 		comm_list_item->mbufs[idx] = mbufs[idx];
1009c7ebd65cSElena Agostini 	}
1010c7ebd65cSElena Agostini 
1011c7ebd65cSElena Agostini 	RTE_GPU_VOLATILE(comm_list_item->num_pkts) = num_mbufs;
1012c7ebd65cSElena Agostini 	rte_gpu_wmb(comm_list_item->dev_id);
10139b8cae4dSElena Agostini 	ret = rte_gpu_comm_set_status(comm_list_item, RTE_GPU_COMM_LIST_READY);
10149b8cae4dSElena Agostini 	if (ret < 0) {
10159b8cae4dSElena Agostini 		rte_errno = EINVAL;
10169b8cae4dSElena Agostini 		return -rte_errno;
10179b8cae4dSElena Agostini 	}
10189b8cae4dSElena Agostini 
10199b8cae4dSElena Agostini 	return 0;
10209b8cae4dSElena Agostini }
10219b8cae4dSElena Agostini 
10229b8cae4dSElena Agostini int
10239b8cae4dSElena Agostini rte_gpu_comm_set_status(struct rte_gpu_comm_list *comm_list_item,
10249b8cae4dSElena Agostini 		enum rte_gpu_comm_list_status status)
10259b8cae4dSElena Agostini {
10269b8cae4dSElena Agostini 	if (comm_list_item == NULL) {
10279b8cae4dSElena Agostini 		rte_errno = EINVAL;
10289b8cae4dSElena Agostini 		return -rte_errno;
10299b8cae4dSElena Agostini 	}
10309b8cae4dSElena Agostini 
10319b8cae4dSElena Agostini 	RTE_GPU_VOLATILE(comm_list_item->status_h[0]) = status;
10329b8cae4dSElena Agostini 
10339b8cae4dSElena Agostini 	return 0;
10349b8cae4dSElena Agostini }
10359b8cae4dSElena Agostini 
10369b8cae4dSElena Agostini int
10379b8cae4dSElena Agostini rte_gpu_comm_get_status(struct rte_gpu_comm_list *comm_list_item,
10389b8cae4dSElena Agostini 		enum rte_gpu_comm_list_status *status)
10399b8cae4dSElena Agostini {
10409b8cae4dSElena Agostini 	if (comm_list_item == NULL || status == NULL) {
10419b8cae4dSElena Agostini 		rte_errno = EINVAL;
10429b8cae4dSElena Agostini 		return -rte_errno;
10439b8cae4dSElena Agostini 	}
10449b8cae4dSElena Agostini 
10459b8cae4dSElena Agostini 	*status = RTE_GPU_VOLATILE(comm_list_item->status_h[0]);
1046c7ebd65cSElena Agostini 
1047c7ebd65cSElena Agostini 	return 0;
1048c7ebd65cSElena Agostini }
1049c7ebd65cSElena Agostini 
1050c7ebd65cSElena Agostini int
1051c7ebd65cSElena Agostini rte_gpu_comm_cleanup_list(struct rte_gpu_comm_list *comm_list_item)
1052c7ebd65cSElena Agostini {
1053c7ebd65cSElena Agostini 	uint32_t idx = 0;
10549b8cae4dSElena Agostini 	enum rte_gpu_comm_list_status status;
10559b8cae4dSElena Agostini 	int ret;
1056c7ebd65cSElena Agostini 
1057c7ebd65cSElena Agostini 	if (comm_list_item == NULL) {
1058c7ebd65cSElena Agostini 		rte_errno = EINVAL;
1059c7ebd65cSElena Agostini 		return -rte_errno;
1060c7ebd65cSElena Agostini 	}
1061c7ebd65cSElena Agostini 
10629b8cae4dSElena Agostini 	ret = rte_gpu_comm_get_status(comm_list_item, &status);
10639b8cae4dSElena Agostini 	if (ret < 0) {
10649b8cae4dSElena Agostini 		rte_errno = EINVAL;
10659b8cae4dSElena Agostini 		return -rte_errno;
10669b8cae4dSElena Agostini 	}
10679b8cae4dSElena Agostini 
10689b8cae4dSElena Agostini 	if (status == RTE_GPU_COMM_LIST_READY) {
1069c7ebd65cSElena Agostini 		GPU_LOG(ERR, "packet list is still in progress");
1070c7ebd65cSElena Agostini 		rte_errno = EINVAL;
1071c7ebd65cSElena Agostini 		return -rte_errno;
1072c7ebd65cSElena Agostini 	}
1073c7ebd65cSElena Agostini 
1074c7ebd65cSElena Agostini 	for (idx = 0; idx < RTE_GPU_COMM_LIST_PKTS_MAX; idx++) {
1075c7ebd65cSElena Agostini 		if (comm_list_item->pkt_list[idx].addr == 0)
1076c7ebd65cSElena Agostini 			break;
1077c7ebd65cSElena Agostini 
1078c7ebd65cSElena Agostini 		comm_list_item->pkt_list[idx].addr = 0;
1079c7ebd65cSElena Agostini 		comm_list_item->pkt_list[idx].size = 0;
1080c7ebd65cSElena Agostini 		comm_list_item->mbufs[idx] = NULL;
1081c7ebd65cSElena Agostini 	}
1082c7ebd65cSElena Agostini 
10839b8cae4dSElena Agostini 	ret = rte_gpu_comm_set_status(comm_list_item, RTE_GPU_COMM_LIST_FREE);
10849b8cae4dSElena Agostini 	if (ret < 0) {
10859b8cae4dSElena Agostini 		rte_errno = EINVAL;
10869b8cae4dSElena Agostini 		return -rte_errno;
10879b8cae4dSElena Agostini 	}
1088c7ebd65cSElena Agostini 	RTE_GPU_VOLATILE(comm_list_item->num_pkts) = 0;
1089c7ebd65cSElena Agostini 	rte_mb();
1090c7ebd65cSElena Agostini 
1091c7ebd65cSElena Agostini 	return 0;
1092c7ebd65cSElena Agostini }
1093