i915/gt/selftest_ring_submission.c

c349dbc7Sjsg// SPDX-License-Identifier: MIT
c349dbc7Sjsg/*
c349dbc7Sjsg * Copyright © 2020 Intel Corporation
c349dbc7Sjsg */
c349dbc7Sjsg
c349dbc7Sjsg#include "intel_engine_pm.h"
c349dbc7Sjsg#include "selftests/igt_flush_test.h"
c349dbc7Sjsg
c349dbc7Sjsgstatic struct i915_vma *create_wally(struct intel_engine_cs *engine)
c349dbc7Sjsg{
c349dbc7Sjsg	struct drm_i915_gem_object *obj;
c349dbc7Sjsg	struct i915_vma *vma;
c349dbc7Sjsg	u32 *cs;
c349dbc7Sjsg	int err;
c349dbc7Sjsg
c349dbc7Sjsg	obj = i915_gem_object_create_internal(engine->i915, 4096);
c349dbc7Sjsg	if (IS_ERR(obj))
c349dbc7Sjsg		return ERR_CAST(obj);
c349dbc7Sjsg
c349dbc7Sjsg	vma = i915_vma_instance(obj, engine->gt->vm, NULL);
c349dbc7Sjsg	if (IS_ERR(vma)) {
c349dbc7Sjsg		i915_gem_object_put(obj);
c349dbc7Sjsg		return vma;
c349dbc7Sjsg	}
c349dbc7Sjsg
c349dbc7Sjsg	err = i915_vma_pin(vma, 0, 0, PIN_USER | PIN_HIGH);
c349dbc7Sjsg	if (err) {
c349dbc7Sjsg		i915_gem_object_put(obj);
c349dbc7Sjsg		return ERR_PTR(err);
c349dbc7Sjsg	}
c349dbc7Sjsg
c349dbc7Sjsg	err = i915_vma_sync(vma);
c349dbc7Sjsg	if (err) {
c349dbc7Sjsg		i915_gem_object_put(obj);
c349dbc7Sjsg		return ERR_PTR(err);
c349dbc7Sjsg	}
c349dbc7Sjsg
5ca02815Sjsg	cs = i915_gem_object_pin_map_unlocked(obj, I915_MAP_WC);
c349dbc7Sjsg	if (IS_ERR(cs)) {
c349dbc7Sjsg		i915_gem_object_put(obj);
c349dbc7Sjsg		return ERR_CAST(cs);
c349dbc7Sjsg	}
c349dbc7Sjsg
5ca02815Sjsg	if (GRAPHICS_VER(engine->i915) >= 6) {
c349dbc7Sjsg		*cs++ = MI_STORE_DWORD_IMM_GEN4;
c349dbc7Sjsg		*cs++ = 0;
5ca02815Sjsg	} else if (GRAPHICS_VER(engine->i915) >= 4) {
c349dbc7Sjsg		*cs++ = MI_STORE_DWORD_IMM_GEN4 | MI_USE_GGTT;
c349dbc7Sjsg		*cs++ = 0;
c349dbc7Sjsg	} else {
c349dbc7Sjsg		*cs++ = MI_STORE_DWORD_IMM | MI_MEM_VIRTUAL;
c349dbc7Sjsg	}
*f005ef32Sjsg	*cs++ = i915_vma_offset(vma) + 4000;
c349dbc7Sjsg	*cs++ = STACK_MAGIC;
c349dbc7Sjsg
c349dbc7Sjsg	*cs++ = MI_BATCH_BUFFER_END;
ad8b1aafSjsg
ad8b1aafSjsg	i915_gem_object_flush_map(obj);
c349dbc7Sjsg	i915_gem_object_unpin_map(obj);
c349dbc7Sjsg
c349dbc7Sjsg	vma->private = intel_context_create(engine); /* dummy residuals */
c349dbc7Sjsg	if (IS_ERR(vma->private)) {
c349dbc7Sjsg		vma = ERR_CAST(vma->private);
c349dbc7Sjsg		i915_gem_object_put(obj);
c349dbc7Sjsg	}
c349dbc7Sjsg
c349dbc7Sjsg	return vma;
c349dbc7Sjsg}
c349dbc7Sjsg
c349dbc7Sjsgstatic int context_sync(struct intel_context *ce)
c349dbc7Sjsg{
c349dbc7Sjsg	struct i915_request *rq;
c349dbc7Sjsg	int err = 0;
c349dbc7Sjsg
c349dbc7Sjsg	rq = intel_context_create_request(ce);
c349dbc7Sjsg	if (IS_ERR(rq))
c349dbc7Sjsg		return PTR_ERR(rq);
c349dbc7Sjsg
c349dbc7Sjsg	i915_request_get(rq);
c349dbc7Sjsg	i915_request_add(rq);
c349dbc7Sjsg
c349dbc7Sjsg	if (i915_request_wait(rq, 0, HZ / 5) < 0)
c349dbc7Sjsg		err = -ETIME;
c349dbc7Sjsg	i915_request_put(rq);
c349dbc7Sjsg
c349dbc7Sjsg	return err;
c349dbc7Sjsg}
c349dbc7Sjsg
c349dbc7Sjsgstatic int new_context_sync(struct intel_engine_cs *engine)
c349dbc7Sjsg{
c349dbc7Sjsg	struct intel_context *ce;
c349dbc7Sjsg	int err;
c349dbc7Sjsg
c349dbc7Sjsg	ce = intel_context_create(engine);
c349dbc7Sjsg	if (IS_ERR(ce))
c349dbc7Sjsg		return PTR_ERR(ce);
c349dbc7Sjsg
c349dbc7Sjsg	err = context_sync(ce);
c349dbc7Sjsg	intel_context_put(ce);
c349dbc7Sjsg
c349dbc7Sjsg	return err;
c349dbc7Sjsg}
c349dbc7Sjsg
c349dbc7Sjsgstatic int mixed_contexts_sync(struct intel_engine_cs *engine, u32 *result)
c349dbc7Sjsg{
c349dbc7Sjsg	int pass;
c349dbc7Sjsg	int err;
c349dbc7Sjsg
c349dbc7Sjsg	for (pass = 0; pass < 2; pass++) {
c349dbc7Sjsg		WRITE_ONCE(*result, 0);
c349dbc7Sjsg		err = context_sync(engine->kernel_context);
c349dbc7Sjsg		if (err || READ_ONCE(*result)) {
c349dbc7Sjsg			if (!err) {
c349dbc7Sjsg				pr_err("pass[%d] wa_bb emitted for the kernel context\n",
c349dbc7Sjsg				       pass);
c349dbc7Sjsg				err = -EINVAL;
c349dbc7Sjsg			}
c349dbc7Sjsg			return err;
c349dbc7Sjsg		}
c349dbc7Sjsg
c349dbc7Sjsg		WRITE_ONCE(*result, 0);
c349dbc7Sjsg		err = new_context_sync(engine);
c349dbc7Sjsg		if (READ_ONCE(*result) != STACK_MAGIC) {
c349dbc7Sjsg			if (!err) {
c349dbc7Sjsg				pr_err("pass[%d] wa_bb *NOT* emitted after the kernel context\n",
c349dbc7Sjsg				       pass);
c349dbc7Sjsg				err = -EINVAL;
c349dbc7Sjsg			}
c349dbc7Sjsg			return err;
c349dbc7Sjsg		}
c349dbc7Sjsg
c349dbc7Sjsg		WRITE_ONCE(*result, 0);
c349dbc7Sjsg		err = new_context_sync(engine);
c349dbc7Sjsg		if (READ_ONCE(*result) != STACK_MAGIC) {
c349dbc7Sjsg			if (!err) {
c349dbc7Sjsg				pr_err("pass[%d] wa_bb *NOT* emitted for the user context switch\n",
c349dbc7Sjsg				       pass);
c349dbc7Sjsg				err = -EINVAL;
c349dbc7Sjsg			}
c349dbc7Sjsg			return err;
c349dbc7Sjsg		}
c349dbc7Sjsg	}
c349dbc7Sjsg
c349dbc7Sjsg	return 0;
c349dbc7Sjsg}
c349dbc7Sjsg
c349dbc7Sjsgstatic int double_context_sync_00(struct intel_engine_cs *engine, u32 *result)
c349dbc7Sjsg{
c349dbc7Sjsg	struct intel_context *ce;
c349dbc7Sjsg	int err, i;
c349dbc7Sjsg
c349dbc7Sjsg	ce = intel_context_create(engine);
c349dbc7Sjsg	if (IS_ERR(ce))
c349dbc7Sjsg		return PTR_ERR(ce);
c349dbc7Sjsg
c349dbc7Sjsg	for (i = 0; i < 2; i++) {
c349dbc7Sjsg		WRITE_ONCE(*result, 0);
c349dbc7Sjsg		err = context_sync(ce);
c349dbc7Sjsg		if (err)
c349dbc7Sjsg			break;
c349dbc7Sjsg	}
c349dbc7Sjsg	intel_context_put(ce);
c349dbc7Sjsg	if (err)
c349dbc7Sjsg		return err;
c349dbc7Sjsg
c349dbc7Sjsg	if (READ_ONCE(*result)) {
c349dbc7Sjsg		pr_err("wa_bb emitted between the same user context\n");
c349dbc7Sjsg		return -EINVAL;
c349dbc7Sjsg	}
c349dbc7Sjsg
c349dbc7Sjsg	return 0;
c349dbc7Sjsg}
c349dbc7Sjsg
c349dbc7Sjsgstatic int kernel_context_sync_00(struct intel_engine_cs *engine, u32 *result)
c349dbc7Sjsg{
c349dbc7Sjsg	struct intel_context *ce;
c349dbc7Sjsg	int err, i;
c349dbc7Sjsg
c349dbc7Sjsg	ce = intel_context_create(engine);
c349dbc7Sjsg	if (IS_ERR(ce))
c349dbc7Sjsg		return PTR_ERR(ce);
c349dbc7Sjsg
c349dbc7Sjsg	for (i = 0; i < 2; i++) {
c349dbc7Sjsg		WRITE_ONCE(*result, 0);
c349dbc7Sjsg		err = context_sync(ce);
c349dbc7Sjsg		if (err)
c349dbc7Sjsg			break;
c349dbc7Sjsg
c349dbc7Sjsg		err = context_sync(engine->kernel_context);
c349dbc7Sjsg		if (err)
c349dbc7Sjsg			break;
c349dbc7Sjsg	}
c349dbc7Sjsg	intel_context_put(ce);
c349dbc7Sjsg	if (err)
c349dbc7Sjsg		return err;
c349dbc7Sjsg
c349dbc7Sjsg	if (READ_ONCE(*result)) {
c349dbc7Sjsg		pr_err("wa_bb emitted between the same user context [with intervening kernel]\n");
c349dbc7Sjsg		return -EINVAL;
c349dbc7Sjsg	}
c349dbc7Sjsg
c349dbc7Sjsg	return 0;
c349dbc7Sjsg}
c349dbc7Sjsg
c349dbc7Sjsgstatic int __live_ctx_switch_wa(struct intel_engine_cs *engine)
c349dbc7Sjsg{
c349dbc7Sjsg	struct i915_vma *bb;
c349dbc7Sjsg	u32 *result;
c349dbc7Sjsg	int err;
c349dbc7Sjsg
c349dbc7Sjsg	bb = create_wally(engine);
c349dbc7Sjsg	if (IS_ERR(bb))
c349dbc7Sjsg		return PTR_ERR(bb);
c349dbc7Sjsg
5ca02815Sjsg	result = i915_gem_object_pin_map_unlocked(bb->obj, I915_MAP_WC);
c349dbc7Sjsg	if (IS_ERR(result)) {
c349dbc7Sjsg		intel_context_put(bb->private);
c349dbc7Sjsg		i915_vma_unpin_and_release(&bb, 0);
c349dbc7Sjsg		return PTR_ERR(result);
c349dbc7Sjsg	}
c349dbc7Sjsg	result += 1000;
c349dbc7Sjsg
c349dbc7Sjsg	engine->wa_ctx.vma = bb;
c349dbc7Sjsg
c349dbc7Sjsg	err = mixed_contexts_sync(engine, result);
c349dbc7Sjsg	if (err)
c349dbc7Sjsg		goto out;
c349dbc7Sjsg
c349dbc7Sjsg	err = double_context_sync_00(engine, result);
c349dbc7Sjsg	if (err)
c349dbc7Sjsg		goto out;
c349dbc7Sjsg
c349dbc7Sjsg	err = kernel_context_sync_00(engine, result);
c349dbc7Sjsg	if (err)
c349dbc7Sjsg		goto out;
c349dbc7Sjsg
c349dbc7Sjsgout:
c349dbc7Sjsg	intel_context_put(engine->wa_ctx.vma->private);
c349dbc7Sjsg	i915_vma_unpin_and_release(&engine->wa_ctx.vma, I915_VMA_RELEASE_MAP);
c349dbc7Sjsg	return err;
c349dbc7Sjsg}
c349dbc7Sjsg
c349dbc7Sjsgstatic int live_ctx_switch_wa(void *arg)
c349dbc7Sjsg{
c349dbc7Sjsg	struct intel_gt *gt = arg;
c349dbc7Sjsg	struct intel_engine_cs *engine;
c349dbc7Sjsg	enum intel_engine_id id;
c349dbc7Sjsg
c349dbc7Sjsg	/*
c349dbc7Sjsg	 * Exercise the inter-context wa batch.
c349dbc7Sjsg	 *
c349dbc7Sjsg	 * Between each user context we run a wa batch, and since it may
c349dbc7Sjsg	 * have implications for user visible state, we have to check that
c349dbc7Sjsg	 * we do actually execute it.
c349dbc7Sjsg	 *
c349dbc7Sjsg	 * The trick we use is to replace the normal wa batch with a custom
c349dbc7Sjsg	 * one that writes to a marker within it, and we can then look for
c349dbc7Sjsg	 * that marker to confirm if the batch was run when we expect it,
c349dbc7Sjsg	 * and equally important it was wasn't run when we don't!
c349dbc7Sjsg	 */
c349dbc7Sjsg
c349dbc7Sjsg	for_each_engine(engine, gt, id) {
c349dbc7Sjsg		struct i915_vma *saved_wa;
c349dbc7Sjsg		int err;
c349dbc7Sjsg
c349dbc7Sjsg		if (!intel_engine_can_store_dword(engine))
c349dbc7Sjsg			continue;
c349dbc7Sjsg
5ca02815Sjsg		if (IS_GRAPHICS_VER(gt->i915, 4, 5))
c349dbc7Sjsg			continue; /* MI_STORE_DWORD is privileged! */
c349dbc7Sjsg
c349dbc7Sjsg		saved_wa = fetch_and_zero(&engine->wa_ctx.vma);
c349dbc7Sjsg
c349dbc7Sjsg		intel_engine_pm_get(engine);
c349dbc7Sjsg		err = __live_ctx_switch_wa(engine);
c349dbc7Sjsg		intel_engine_pm_put(engine);
c349dbc7Sjsg		if (igt_flush_test(gt->i915))
c349dbc7Sjsg			err = -EIO;
c349dbc7Sjsg
c349dbc7Sjsg		engine->wa_ctx.vma = saved_wa;
c349dbc7Sjsg		if (err)
c349dbc7Sjsg			return err;
c349dbc7Sjsg	}
c349dbc7Sjsg
c349dbc7Sjsg	return 0;
c349dbc7Sjsg}
c349dbc7Sjsg
c349dbc7Sjsgint intel_ring_submission_live_selftests(struct drm_i915_private *i915)
c349dbc7Sjsg{
c349dbc7Sjsg	static const struct i915_subtest tests[] = {
c349dbc7Sjsg		SUBTEST(live_ctx_switch_wa),
c349dbc7Sjsg	};
c349dbc7Sjsg
1bb76ff1Sjsg	if (to_gt(i915)->submission_method > INTEL_SUBMISSION_RING)
c349dbc7Sjsg		return 0;
c349dbc7Sjsg
1bb76ff1Sjsg	return intel_gt_live_subtests(tests, to_gt(i915));
c349dbc7Sjsg}