i915/gem/i915_gem_busy.c

c349dbc7Sjsg/*
c349dbc7Sjsg * SPDX-License-Identifier: MIT
c349dbc7Sjsg *
c349dbc7Sjsg * Copyright © 2014-2016 Intel Corporation
c349dbc7Sjsg */
c349dbc7Sjsg
*1bb76ff1Sjsg#include <linux/dma-fence-array.h>
*1bb76ff1Sjsg
c349dbc7Sjsg#include "gt/intel_engine.h"
c349dbc7Sjsg
c349dbc7Sjsg#include "i915_gem_ioctls.h"
c349dbc7Sjsg#include "i915_gem_object.h"
c349dbc7Sjsg
c349dbc7Sjsgstatic __always_inline u32 __busy_read_flag(u16 id)
c349dbc7Sjsg{
c349dbc7Sjsg	if (id == (u16)I915_ENGINE_CLASS_INVALID)
c349dbc7Sjsg		return 0xffff0000u;
c349dbc7Sjsg
c349dbc7Sjsg	GEM_BUG_ON(id >= 16);
c349dbc7Sjsg	return 0x10000u << id;
c349dbc7Sjsg}
c349dbc7Sjsg
c349dbc7Sjsgstatic __always_inline u32 __busy_write_id(u16 id)
c349dbc7Sjsg{
c349dbc7Sjsg	/*
c349dbc7Sjsg	 * The uABI guarantees an active writer is also amongst the read
c349dbc7Sjsg	 * engines. This would be true if we accessed the activity tracking
c349dbc7Sjsg	 * under the lock, but as we perform the lookup of the object and
c349dbc7Sjsg	 * its activity locklessly we can not guarantee that the last_write
c349dbc7Sjsg	 * being active implies that we have set the same engine flag from
c349dbc7Sjsg	 * last_read - hence we always set both read and write busy for
c349dbc7Sjsg	 * last_write.
c349dbc7Sjsg	 */
c349dbc7Sjsg	if (id == (u16)I915_ENGINE_CLASS_INVALID)
c349dbc7Sjsg		return 0xffffffffu;
c349dbc7Sjsg
c349dbc7Sjsg	return (id + 1) | __busy_read_flag(id);
c349dbc7Sjsg}
c349dbc7Sjsg
c349dbc7Sjsgstatic __always_inline unsigned int
*1bb76ff1Sjsg__busy_set_if_active(struct dma_fence *fence, u32 (*flag)(u16 id))
c349dbc7Sjsg{
c349dbc7Sjsg	const struct i915_request *rq;
c349dbc7Sjsg
c349dbc7Sjsg	/*
c349dbc7Sjsg	 * We have to check the current hw status of the fence as the uABI
c349dbc7Sjsg	 * guarantees forward progress. We could rely on the idle worker
c349dbc7Sjsg	 * to eventually flush us, but to minimise latency just ask the
c349dbc7Sjsg	 * hardware.
c349dbc7Sjsg	 *
*1bb76ff1Sjsg	 * Note we only report on the status of native fences and we currently
*1bb76ff1Sjsg	 * have two native fences:
*1bb76ff1Sjsg	 *
*1bb76ff1Sjsg	 * 1. A composite fence (dma_fence_array) constructed of i915 requests
*1bb76ff1Sjsg	 * created during a parallel submission. In this case we deconstruct the
*1bb76ff1Sjsg	 * composite fence into individual i915 requests and check the status of
*1bb76ff1Sjsg	 * each request.
*1bb76ff1Sjsg	 *
*1bb76ff1Sjsg	 * 2. A single i915 request.
c349dbc7Sjsg	 */
*1bb76ff1Sjsg	if (dma_fence_is_array(fence)) {
*1bb76ff1Sjsg		struct dma_fence_array *array = to_dma_fence_array(fence);
*1bb76ff1Sjsg		struct dma_fence **child = array->fences;
*1bb76ff1Sjsg		unsigned int nchild = array->num_fences;
*1bb76ff1Sjsg
*1bb76ff1Sjsg		do {
*1bb76ff1Sjsg			struct dma_fence *current_fence = *child++;
*1bb76ff1Sjsg
*1bb76ff1Sjsg			/* Not an i915 fence, can't be busy per above */
*1bb76ff1Sjsg			if (!dma_fence_is_i915(current_fence) ||
*1bb76ff1Sjsg			    !test_bit(I915_FENCE_FLAG_COMPOSITE,
*1bb76ff1Sjsg				      &current_fence->flags)) {
*1bb76ff1Sjsg				return 0;
*1bb76ff1Sjsg			}
*1bb76ff1Sjsg
*1bb76ff1Sjsg			rq = to_request(current_fence);
*1bb76ff1Sjsg			if (!i915_request_completed(rq))
*1bb76ff1Sjsg				return flag(rq->engine->uabi_class);
*1bb76ff1Sjsg		} while (--nchild);
*1bb76ff1Sjsg
*1bb76ff1Sjsg		/* All requests in array complete, not busy */
*1bb76ff1Sjsg		return 0;
*1bb76ff1Sjsg	} else {
c349dbc7Sjsg		if (!dma_fence_is_i915(fence))
c349dbc7Sjsg			return 0;
c349dbc7Sjsg
*1bb76ff1Sjsg		rq = to_request(fence);
c349dbc7Sjsg		if (i915_request_completed(rq))
c349dbc7Sjsg			return 0;
c349dbc7Sjsg
c349dbc7Sjsg		/* Beware type-expansion follies! */
c349dbc7Sjsg		BUILD_BUG_ON(!typecheck(u16, rq->engine->uabi_class));
c349dbc7Sjsg		return flag(rq->engine->uabi_class);
c349dbc7Sjsg	}
*1bb76ff1Sjsg}
c349dbc7Sjsg
c349dbc7Sjsgstatic __always_inline unsigned int
*1bb76ff1Sjsgbusy_check_reader(struct dma_fence *fence)
c349dbc7Sjsg{
c349dbc7Sjsg	return __busy_set_if_active(fence, __busy_read_flag);
c349dbc7Sjsg}
c349dbc7Sjsg
c349dbc7Sjsgstatic __always_inline unsigned int
*1bb76ff1Sjsgbusy_check_writer(struct dma_fence *fence)
c349dbc7Sjsg{
c349dbc7Sjsg	if (!fence)
c349dbc7Sjsg		return 0;
c349dbc7Sjsg
c349dbc7Sjsg	return __busy_set_if_active(fence, __busy_write_id);
c349dbc7Sjsg}
c349dbc7Sjsg
c349dbc7Sjsgint
c349dbc7Sjsgi915_gem_busy_ioctl(struct drm_device *dev, void *data,
c349dbc7Sjsg		    struct drm_file *file)
c349dbc7Sjsg{
c349dbc7Sjsg	struct drm_i915_gem_busy *args = data;
c349dbc7Sjsg	struct drm_i915_gem_object *obj;
*1bb76ff1Sjsg	struct dma_resv_iter cursor;
*1bb76ff1Sjsg	struct dma_fence *fence;
c349dbc7Sjsg	int err;
c349dbc7Sjsg
c349dbc7Sjsg	err = -ENOENT;
c349dbc7Sjsg	rcu_read_lock();
c349dbc7Sjsg	obj = i915_gem_object_lookup_rcu(file, args->handle);
c349dbc7Sjsg	if (!obj)
c349dbc7Sjsg		goto out;
c349dbc7Sjsg
c349dbc7Sjsg	/*
c349dbc7Sjsg	 * A discrepancy here is that we do not report the status of
c349dbc7Sjsg	 * non-i915 fences, i.e. even though we may report the object as idle,
c349dbc7Sjsg	 * a call to set-domain may still stall waiting for foreign rendering.
c349dbc7Sjsg	 * This also means that wait-ioctl may report an object as busy,
c349dbc7Sjsg	 * where busy-ioctl considers it idle.
c349dbc7Sjsg	 *
c349dbc7Sjsg	 * We trade the ability to warn of foreign fences to report on which
c349dbc7Sjsg	 * i915 engines are active for the object.
c349dbc7Sjsg	 *
c349dbc7Sjsg	 * Alternatively, we can trade that extra information on read/write
c349dbc7Sjsg	 * activity with
c349dbc7Sjsg	 *	args->busy =
*1bb76ff1Sjsg	 *		!dma_resv_test_signaled(obj->resv, DMA_RESV_USAGE_READ);
c349dbc7Sjsg	 * to report the overall busyness. This is what the wait-ioctl does.
c349dbc7Sjsg	 *
c349dbc7Sjsg	 */
*1bb76ff1Sjsg	args->busy = 0;
*1bb76ff1Sjsg	dma_resv_iter_begin(&cursor, obj->base.resv, DMA_RESV_USAGE_READ);
*1bb76ff1Sjsg	dma_resv_for_each_fence_unlocked(&cursor, fence) {
*1bb76ff1Sjsg		if (dma_resv_iter_is_restarted(&cursor))
*1bb76ff1Sjsg			args->busy = 0;
c349dbc7Sjsg
*1bb76ff1Sjsg		if (dma_resv_iter_usage(&cursor) <= DMA_RESV_USAGE_WRITE)
*1bb76ff1Sjsg			/* Translate the write fences to the READ *and* WRITE engine */
*1bb76ff1Sjsg			args->busy |= busy_check_writer(fence);
*1bb76ff1Sjsg		else
*1bb76ff1Sjsg			/* Translate read fences to READ set of engines */
c349dbc7Sjsg			args->busy |= busy_check_reader(fence);
c349dbc7Sjsg	}
*1bb76ff1Sjsg	dma_resv_iter_end(&cursor);
c349dbc7Sjsg
c349dbc7Sjsg	err = 0;
c349dbc7Sjsgout:
c349dbc7Sjsg	rcu_read_unlock();
c349dbc7Sjsg	return err;
c349dbc7Sjsg}