lib/mldev/mldev_utils_scalar.c

9637de38SSrikanth Yalavarthi/* SPDX-License-Identifier: BSD-3-Clause
9637de38SSrikanth Yalavarthi * Copyright (c) 2022 Marvell.
9637de38SSrikanth Yalavarthi */
9637de38SSrikanth Yalavarthi
9637de38SSrikanth Yalavarthi#include <errno.h>
9637de38SSrikanth Yalavarthi#include <math.h>
9637de38SSrikanth Yalavarthi#include <stdint.h>
9637de38SSrikanth Yalavarthi
9637de38SSrikanth Yalavarthi#include "mldev_utils.h"
9637de38SSrikanth Yalavarthi
9637de38SSrikanth Yalavarthi/* Description:
9637de38SSrikanth Yalavarthi * This file implements scalar versions of Machine Learning utility functions used to convert data
9637de38SSrikanth Yalavarthi * types from higher precision to lower precision and vice-versa.
9637de38SSrikanth Yalavarthi */
9637de38SSrikanth Yalavarthi
9637de38SSrikanth Yalavarthi#ifndef BIT
9637de38SSrikanth Yalavarthi#define BIT(nr) (1UL << (nr))
9637de38SSrikanth Yalavarthi#endif
9637de38SSrikanth Yalavarthi
9637de38SSrikanth Yalavarthi#ifndef BITS_PER_LONG
9637de38SSrikanth Yalavarthi#define BITS_PER_LONG (__SIZEOF_LONG__ * 8)
9637de38SSrikanth Yalavarthi#endif
9637de38SSrikanth Yalavarthi
9637de38SSrikanth Yalavarthi#ifndef GENMASK_U32
9637de38SSrikanth Yalavarthi#define GENMASK_U32(h, l) (((~0UL) << (l)) & (~0UL >> (BITS_PER_LONG - 1 - (h))))
9637de38SSrikanth Yalavarthi#endif
9637de38SSrikanth Yalavarthi
9637de38SSrikanth Yalavarthi/* float32: bit index of MSB & LSB of sign, exponent and mantissa */
9637de38SSrikanth Yalavarthi#define FP32_LSB_M 0
9637de38SSrikanth Yalavarthi#define FP32_MSB_M 22
9637de38SSrikanth Yalavarthi#define FP32_LSB_E 23
9637de38SSrikanth Yalavarthi#define FP32_MSB_E 30
9637de38SSrikanth Yalavarthi#define FP32_LSB_S 31
9637de38SSrikanth Yalavarthi#define FP32_MSB_S 31
9637de38SSrikanth Yalavarthi
9637de38SSrikanth Yalavarthi/* float32: bitmask for sign, exponent and mantissa */
9637de38SSrikanth Yalavarthi#define FP32_MASK_S GENMASK_U32(FP32_MSB_S, FP32_LSB_S)
9637de38SSrikanth Yalavarthi#define FP32_MASK_E GENMASK_U32(FP32_MSB_E, FP32_LSB_E)
9637de38SSrikanth Yalavarthi#define FP32_MASK_M GENMASK_U32(FP32_MSB_M, FP32_LSB_M)
9637de38SSrikanth Yalavarthi
9637de38SSrikanth Yalavarthi/* float16: bit index of MSB & LSB of sign, exponent and mantissa */
9637de38SSrikanth Yalavarthi#define FP16_LSB_M 0
9637de38SSrikanth Yalavarthi#define FP16_MSB_M 9
9637de38SSrikanth Yalavarthi#define FP16_LSB_E 10
9637de38SSrikanth Yalavarthi#define FP16_MSB_E 14
9637de38SSrikanth Yalavarthi#define FP16_LSB_S 15
9637de38SSrikanth Yalavarthi#define FP16_MSB_S 15
9637de38SSrikanth Yalavarthi
9637de38SSrikanth Yalavarthi/* float16: bitmask for sign, exponent and mantissa */
9637de38SSrikanth Yalavarthi#define FP16_MASK_S GENMASK_U32(FP16_MSB_S, FP16_LSB_S)
9637de38SSrikanth Yalavarthi#define FP16_MASK_E GENMASK_U32(FP16_MSB_E, FP16_LSB_E)
9637de38SSrikanth Yalavarthi#define FP16_MASK_M GENMASK_U32(FP16_MSB_M, FP16_LSB_M)
9637de38SSrikanth Yalavarthi
9637de38SSrikanth Yalavarthi/* bfloat16: bit index of MSB & LSB of sign, exponent and mantissa */
9637de38SSrikanth Yalavarthi#define BF16_LSB_M 0
9637de38SSrikanth Yalavarthi#define BF16_MSB_M 6
9637de38SSrikanth Yalavarthi#define BF16_LSB_E 7
9637de38SSrikanth Yalavarthi#define BF16_MSB_E 14
9637de38SSrikanth Yalavarthi#define BF16_LSB_S 15
9637de38SSrikanth Yalavarthi#define BF16_MSB_S 15
9637de38SSrikanth Yalavarthi
9637de38SSrikanth Yalavarthi/* bfloat16: bitmask for sign, exponent and mantissa */
9637de38SSrikanth Yalavarthi#define BF16_MASK_S GENMASK_U32(BF16_MSB_S, BF16_LSB_S)
9637de38SSrikanth Yalavarthi#define BF16_MASK_E GENMASK_U32(BF16_MSB_E, BF16_LSB_E)
9637de38SSrikanth Yalavarthi#define BF16_MASK_M GENMASK_U32(BF16_MSB_M, BF16_LSB_M)
9637de38SSrikanth Yalavarthi
9637de38SSrikanth Yalavarthi/* Exponent bias */
9637de38SSrikanth Yalavarthi#define FP32_BIAS_E 127
9637de38SSrikanth Yalavarthi#define FP16_BIAS_E 15
9637de38SSrikanth Yalavarthi#define BF16_BIAS_E 127
9637de38SSrikanth Yalavarthi
9637de38SSrikanth Yalavarthi#define FP32_PACK(sign, exponent, mantissa)                                                        \
9637de38SSrikanth Yalavarthi	(((sign) << FP32_LSB_S) | ((exponent) << FP32_LSB_E) | (mantissa))
9637de38SSrikanth Yalavarthi
9637de38SSrikanth Yalavarthi#define FP16_PACK(sign, exponent, mantissa)                                                        \
9637de38SSrikanth Yalavarthi	(((sign) << FP16_LSB_S) | ((exponent) << FP16_LSB_E) | (mantissa))
9637de38SSrikanth Yalavarthi
9637de38SSrikanth Yalavarthi#define BF16_PACK(sign, exponent, mantissa)                                                        \
9637de38SSrikanth Yalavarthi	(((sign) << BF16_LSB_S) | ((exponent) << BF16_LSB_E) | (mantissa))
9637de38SSrikanth Yalavarthi
9637de38SSrikanth Yalavarthi/* Represent float32 as float and uint32_t */
9637de38SSrikanth Yalavarthiunion float32 {
9637de38SSrikanth Yalavarthi	float f;
9637de38SSrikanth Yalavarthi	uint32_t u;
9637de38SSrikanth Yalavarthi};
9637de38SSrikanth Yalavarthi
*8c9bfcb1SSrikanth Yalavarthiint
9637de38SSrikanth Yalavarthirte_ml_io_float32_to_int8(float scale, uint64_t nb_elements, void *input, void *output)
9637de38SSrikanth Yalavarthi{
9637de38SSrikanth Yalavarthi	float *input_buffer;
9637de38SSrikanth Yalavarthi	int8_t *output_buffer;
9637de38SSrikanth Yalavarthi	uint64_t i;
9637de38SSrikanth Yalavarthi	int i32;
9637de38SSrikanth Yalavarthi
9637de38SSrikanth Yalavarthi	if ((scale == 0) || (nb_elements == 0) || (input == NULL) || (output == NULL))
9637de38SSrikanth Yalavarthi		return -EINVAL;
9637de38SSrikanth Yalavarthi
9637de38SSrikanth Yalavarthi	input_buffer = (float *)input;
9637de38SSrikanth Yalavarthi	output_buffer = (int8_t *)output;
9637de38SSrikanth Yalavarthi
9637de38SSrikanth Yalavarthi	for (i = 0; i < nb_elements; i++) {
9637de38SSrikanth Yalavarthi		i32 = (int32_t)round((*input_buffer) * scale);
9637de38SSrikanth Yalavarthi
9637de38SSrikanth Yalavarthi		if (i32 < INT8_MIN)
9637de38SSrikanth Yalavarthi			i32 = INT8_MIN;
9637de38SSrikanth Yalavarthi
9637de38SSrikanth Yalavarthi		if (i32 > INT8_MAX)
9637de38SSrikanth Yalavarthi			i32 = INT8_MAX;
9637de38SSrikanth Yalavarthi
9637de38SSrikanth Yalavarthi		*output_buffer = (int8_t)i32;
9637de38SSrikanth Yalavarthi
9637de38SSrikanth Yalavarthi		input_buffer++;
9637de38SSrikanth Yalavarthi		output_buffer++;
9637de38SSrikanth Yalavarthi	}
9637de38SSrikanth Yalavarthi
9637de38SSrikanth Yalavarthi	return 0;
9637de38SSrikanth Yalavarthi}
9637de38SSrikanth Yalavarthi
*8c9bfcb1SSrikanth Yalavarthiint
9637de38SSrikanth Yalavarthirte_ml_io_int8_to_float32(float scale, uint64_t nb_elements, void *input, void *output)
9637de38SSrikanth Yalavarthi{
9637de38SSrikanth Yalavarthi	int8_t *input_buffer;
9637de38SSrikanth Yalavarthi	float *output_buffer;
9637de38SSrikanth Yalavarthi	uint64_t i;
9637de38SSrikanth Yalavarthi
9637de38SSrikanth Yalavarthi	if ((scale == 0) || (nb_elements == 0) || (input == NULL) || (output == NULL))
9637de38SSrikanth Yalavarthi		return -EINVAL;
9637de38SSrikanth Yalavarthi
9637de38SSrikanth Yalavarthi	input_buffer = (int8_t *)input;
9637de38SSrikanth Yalavarthi	output_buffer = (float *)output;
9637de38SSrikanth Yalavarthi
9637de38SSrikanth Yalavarthi	for (i = 0; i < nb_elements; i++) {
9637de38SSrikanth Yalavarthi		*output_buffer = scale * (float)(*input_buffer);
9637de38SSrikanth Yalavarthi
9637de38SSrikanth Yalavarthi		input_buffer++;
9637de38SSrikanth Yalavarthi		output_buffer++;
9637de38SSrikanth Yalavarthi	}
9637de38SSrikanth Yalavarthi
9637de38SSrikanth Yalavarthi	return 0;
9637de38SSrikanth Yalavarthi}
9637de38SSrikanth Yalavarthi
*8c9bfcb1SSrikanth Yalavarthiint
9637de38SSrikanth Yalavarthirte_ml_io_float32_to_uint8(float scale, uint64_t nb_elements, void *input, void *output)
9637de38SSrikanth Yalavarthi{
9637de38SSrikanth Yalavarthi	float *input_buffer;
9637de38SSrikanth Yalavarthi	uint8_t *output_buffer;
9637de38SSrikanth Yalavarthi	int32_t i32;
9637de38SSrikanth Yalavarthi	uint64_t i;
9637de38SSrikanth Yalavarthi
9637de38SSrikanth Yalavarthi	if ((scale == 0) || (nb_elements == 0) || (input == NULL) || (output == NULL))
9637de38SSrikanth Yalavarthi		return -EINVAL;
9637de38SSrikanth Yalavarthi
9637de38SSrikanth Yalavarthi	input_buffer = (float *)input;
9637de38SSrikanth Yalavarthi	output_buffer = (uint8_t *)output;
9637de38SSrikanth Yalavarthi
9637de38SSrikanth Yalavarthi	for (i = 0; i < nb_elements; i++) {
9637de38SSrikanth Yalavarthi		i32 = (int32_t)round((*input_buffer) * scale);
9637de38SSrikanth Yalavarthi
9637de38SSrikanth Yalavarthi		if (i32 < 0)
9637de38SSrikanth Yalavarthi			i32 = 0;
9637de38SSrikanth Yalavarthi
9637de38SSrikanth Yalavarthi		if (i32 > UINT8_MAX)
9637de38SSrikanth Yalavarthi			i32 = UINT8_MAX;
9637de38SSrikanth Yalavarthi
9637de38SSrikanth Yalavarthi		*output_buffer = (uint8_t)i32;
9637de38SSrikanth Yalavarthi
9637de38SSrikanth Yalavarthi		input_buffer++;
9637de38SSrikanth Yalavarthi		output_buffer++;
9637de38SSrikanth Yalavarthi	}
9637de38SSrikanth Yalavarthi
9637de38SSrikanth Yalavarthi	return 0;
9637de38SSrikanth Yalavarthi}
9637de38SSrikanth Yalavarthi
*8c9bfcb1SSrikanth Yalavarthiint
9637de38SSrikanth Yalavarthirte_ml_io_uint8_to_float32(float scale, uint64_t nb_elements, void *input, void *output)
9637de38SSrikanth Yalavarthi{
9637de38SSrikanth Yalavarthi	uint8_t *input_buffer;
9637de38SSrikanth Yalavarthi	float *output_buffer;
9637de38SSrikanth Yalavarthi	uint64_t i;
9637de38SSrikanth Yalavarthi
9637de38SSrikanth Yalavarthi	if ((scale == 0) || (nb_elements == 0) || (input == NULL) || (output == NULL))
9637de38SSrikanth Yalavarthi		return -EINVAL;
9637de38SSrikanth Yalavarthi
9637de38SSrikanth Yalavarthi	input_buffer = (uint8_t *)input;
9637de38SSrikanth Yalavarthi	output_buffer = (float *)output;
9637de38SSrikanth Yalavarthi
9637de38SSrikanth Yalavarthi	for (i = 0; i < nb_elements; i++) {
9637de38SSrikanth Yalavarthi		*output_buffer = scale * (float)(*input_buffer);
9637de38SSrikanth Yalavarthi
9637de38SSrikanth Yalavarthi		input_buffer++;
9637de38SSrikanth Yalavarthi		output_buffer++;
9637de38SSrikanth Yalavarthi	}
9637de38SSrikanth Yalavarthi
9637de38SSrikanth Yalavarthi	return 0;
9637de38SSrikanth Yalavarthi}
9637de38SSrikanth Yalavarthi
*8c9bfcb1SSrikanth Yalavarthiint
9637de38SSrikanth Yalavarthirte_ml_io_float32_to_int16(float scale, uint64_t nb_elements, void *input, void *output)
9637de38SSrikanth Yalavarthi{
9637de38SSrikanth Yalavarthi	float *input_buffer;
9637de38SSrikanth Yalavarthi	int16_t *output_buffer;
9637de38SSrikanth Yalavarthi	int32_t i32;
9637de38SSrikanth Yalavarthi	uint64_t i;
9637de38SSrikanth Yalavarthi
9637de38SSrikanth Yalavarthi	if ((scale == 0) || (nb_elements == 0) || (input == NULL) || (output == NULL))
9637de38SSrikanth Yalavarthi		return -EINVAL;
9637de38SSrikanth Yalavarthi
9637de38SSrikanth Yalavarthi	input_buffer = (float *)input;
9637de38SSrikanth Yalavarthi	output_buffer = (int16_t *)output;
9637de38SSrikanth Yalavarthi
9637de38SSrikanth Yalavarthi	for (i = 0; i < nb_elements; i++) {
9637de38SSrikanth Yalavarthi		i32 = (int32_t)round((*input_buffer) * scale);
9637de38SSrikanth Yalavarthi
9637de38SSrikanth Yalavarthi		if (i32 < INT16_MIN)
9637de38SSrikanth Yalavarthi			i32 = INT16_MIN;
9637de38SSrikanth Yalavarthi
9637de38SSrikanth Yalavarthi		if (i32 > INT16_MAX)
9637de38SSrikanth Yalavarthi			i32 = INT16_MAX;
9637de38SSrikanth Yalavarthi
9637de38SSrikanth Yalavarthi		*output_buffer = (int16_t)i32;
9637de38SSrikanth Yalavarthi
9637de38SSrikanth Yalavarthi		input_buffer++;
9637de38SSrikanth Yalavarthi		output_buffer++;
9637de38SSrikanth Yalavarthi	}
9637de38SSrikanth Yalavarthi
9637de38SSrikanth Yalavarthi	return 0;
9637de38SSrikanth Yalavarthi}
9637de38SSrikanth Yalavarthi
*8c9bfcb1SSrikanth Yalavarthiint
9637de38SSrikanth Yalavarthirte_ml_io_int16_to_float32(float scale, uint64_t nb_elements, void *input, void *output)
9637de38SSrikanth Yalavarthi{
9637de38SSrikanth Yalavarthi	int16_t *input_buffer;
9637de38SSrikanth Yalavarthi	float *output_buffer;
9637de38SSrikanth Yalavarthi	uint64_t i;
9637de38SSrikanth Yalavarthi
9637de38SSrikanth Yalavarthi	if ((scale == 0) || (nb_elements == 0) || (input == NULL) || (output == NULL))
9637de38SSrikanth Yalavarthi		return -EINVAL;
9637de38SSrikanth Yalavarthi
9637de38SSrikanth Yalavarthi	input_buffer = (int16_t *)input;
9637de38SSrikanth Yalavarthi	output_buffer = (float *)output;
9637de38SSrikanth Yalavarthi
9637de38SSrikanth Yalavarthi	for (i = 0; i < nb_elements; i++) {
9637de38SSrikanth Yalavarthi		*output_buffer = scale * (float)(*input_buffer);
9637de38SSrikanth Yalavarthi
9637de38SSrikanth Yalavarthi		input_buffer++;
9637de38SSrikanth Yalavarthi		output_buffer++;
9637de38SSrikanth Yalavarthi	}
9637de38SSrikanth Yalavarthi
9637de38SSrikanth Yalavarthi	return 0;
9637de38SSrikanth Yalavarthi}
9637de38SSrikanth Yalavarthi
*8c9bfcb1SSrikanth Yalavarthiint
9637de38SSrikanth Yalavarthirte_ml_io_float32_to_uint16(float scale, uint64_t nb_elements, void *input, void *output)
9637de38SSrikanth Yalavarthi{
9637de38SSrikanth Yalavarthi	float *input_buffer;
9637de38SSrikanth Yalavarthi	uint16_t *output_buffer;
9637de38SSrikanth Yalavarthi	int32_t i32;
9637de38SSrikanth Yalavarthi	uint64_t i;
9637de38SSrikanth Yalavarthi
9637de38SSrikanth Yalavarthi	if ((scale == 0) || (nb_elements == 0) || (input == NULL) || (output == NULL))
9637de38SSrikanth Yalavarthi		return -EINVAL;
9637de38SSrikanth Yalavarthi
9637de38SSrikanth Yalavarthi	input_buffer = (float *)input;
9637de38SSrikanth Yalavarthi	output_buffer = (uint16_t *)output;
9637de38SSrikanth Yalavarthi
9637de38SSrikanth Yalavarthi	for (i = 0; i < nb_elements; i++) {
9637de38SSrikanth Yalavarthi		i32 = (int32_t)round((*input_buffer) * scale);
9637de38SSrikanth Yalavarthi
9637de38SSrikanth Yalavarthi		if (i32 < 0)
9637de38SSrikanth Yalavarthi			i32 = 0;
9637de38SSrikanth Yalavarthi
9637de38SSrikanth Yalavarthi		if (i32 > UINT16_MAX)
9637de38SSrikanth Yalavarthi			i32 = UINT16_MAX;
9637de38SSrikanth Yalavarthi
9637de38SSrikanth Yalavarthi		*output_buffer = (uint16_t)i32;
9637de38SSrikanth Yalavarthi
9637de38SSrikanth Yalavarthi		input_buffer++;
9637de38SSrikanth Yalavarthi		output_buffer++;
9637de38SSrikanth Yalavarthi	}
9637de38SSrikanth Yalavarthi
9637de38SSrikanth Yalavarthi	return 0;
9637de38SSrikanth Yalavarthi}
9637de38SSrikanth Yalavarthi
*8c9bfcb1SSrikanth Yalavarthiint
9637de38SSrikanth Yalavarthirte_ml_io_uint16_to_float32(float scale, uint64_t nb_elements, void *input, void *output)
9637de38SSrikanth Yalavarthi{
9637de38SSrikanth Yalavarthi	uint16_t *input_buffer;
9637de38SSrikanth Yalavarthi	float *output_buffer;
9637de38SSrikanth Yalavarthi	uint64_t i;
9637de38SSrikanth Yalavarthi
9637de38SSrikanth Yalavarthi	if ((scale == 0) || (nb_elements == 0) || (input == NULL) || (output == NULL))
9637de38SSrikanth Yalavarthi		return -EINVAL;
9637de38SSrikanth Yalavarthi
9637de38SSrikanth Yalavarthi	input_buffer = (uint16_t *)input;
9637de38SSrikanth Yalavarthi	output_buffer = (float *)output;
9637de38SSrikanth Yalavarthi
9637de38SSrikanth Yalavarthi	for (i = 0; i < nb_elements; i++) {
9637de38SSrikanth Yalavarthi		*output_buffer = scale * (float)(*input_buffer);
9637de38SSrikanth Yalavarthi
9637de38SSrikanth Yalavarthi		input_buffer++;
9637de38SSrikanth Yalavarthi		output_buffer++;
9637de38SSrikanth Yalavarthi	}
9637de38SSrikanth Yalavarthi
9637de38SSrikanth Yalavarthi	return 0;
9637de38SSrikanth Yalavarthi}
9637de38SSrikanth Yalavarthi
9637de38SSrikanth Yalavarthi/* Convert a single precision floating point number (float32) into a half precision
9637de38SSrikanth Yalavarthi * floating point number (float16) using round to nearest rounding mode.
9637de38SSrikanth Yalavarthi */
9637de38SSrikanth Yalavarthistatic uint16_t
9637de38SSrikanth Yalavarthi__float32_to_float16_scalar_rtn(float x)
9637de38SSrikanth Yalavarthi{
9637de38SSrikanth Yalavarthi	union float32 f32; /* float32 input */
9637de38SSrikanth Yalavarthi	uint32_t f32_s;	   /* float32 sign */
9637de38SSrikanth Yalavarthi	uint32_t f32_e;	   /* float32 exponent */
9637de38SSrikanth Yalavarthi	uint32_t f32_m;	   /* float32 mantissa */
9637de38SSrikanth Yalavarthi	uint16_t f16_s;	   /* float16 sign */
9637de38SSrikanth Yalavarthi	uint16_t f16_e;	   /* float16 exponent */
9637de38SSrikanth Yalavarthi	uint16_t f16_m;	   /* float16 mantissa */
9637de38SSrikanth Yalavarthi	uint32_t tbits;	   /* number of truncated bits */
9637de38SSrikanth Yalavarthi	uint32_t tmsb;	   /* MSB position of truncated bits */
9637de38SSrikanth Yalavarthi	uint32_t m_32;	   /* temporary float32 mantissa */
9637de38SSrikanth Yalavarthi	uint16_t m_16;	   /* temporary float16 mantissa */
9637de38SSrikanth Yalavarthi	uint16_t u16;	   /* float16 output */
9637de38SSrikanth Yalavarthi	int be_16;	   /* float16 biased exponent, signed */
9637de38SSrikanth Yalavarthi
9637de38SSrikanth Yalavarthi	f32.f = x;
9637de38SSrikanth Yalavarthi	f32_s = (f32.u & FP32_MASK_S) >> FP32_LSB_S;
9637de38SSrikanth Yalavarthi	f32_e = (f32.u & FP32_MASK_E) >> FP32_LSB_E;
9637de38SSrikanth Yalavarthi	f32_m = (f32.u & FP32_MASK_M) >> FP32_LSB_M;
9637de38SSrikanth Yalavarthi
9637de38SSrikanth Yalavarthi	f16_s = f32_s;
9637de38SSrikanth Yalavarthi	f16_e = 0;
9637de38SSrikanth Yalavarthi	f16_m = 0;
9637de38SSrikanth Yalavarthi
9637de38SSrikanth Yalavarthi	switch (f32_e) {
9637de38SSrikanth Yalavarthi	case (0): /* float32: zero or subnormal number */
9637de38SSrikanth Yalavarthi		f16_e = 0;
f71c5365SSrikanth Yalavarthi		f16_m = 0; /* convert to zero */
9637de38SSrikanth Yalavarthi		break;
9637de38SSrikanth Yalavarthi	case (FP32_MASK_E >> FP32_LSB_E): /* float32: infinity or nan */
9637de38SSrikanth Yalavarthi		f16_e = FP16_MASK_E >> FP16_LSB_E;
9637de38SSrikanth Yalavarthi		if (f32_m == 0) { /* infinity */
9637de38SSrikanth Yalavarthi			f16_m = 0;
9637de38SSrikanth Yalavarthi		} else { /* nan, propagate mantissa and set MSB of mantissa to 1 */
9637de38SSrikanth Yalavarthi			f16_m = f32_m >> (FP32_MSB_M - FP16_MSB_M);
9637de38SSrikanth Yalavarthi			f16_m |= BIT(FP16_MSB_M);
9637de38SSrikanth Yalavarthi		}
9637de38SSrikanth Yalavarthi		break;
9637de38SSrikanth Yalavarthi	default: /* float32: normal number */
9637de38SSrikanth Yalavarthi		/* compute biased exponent for float16 */
9637de38SSrikanth Yalavarthi		be_16 = (int)f32_e - FP32_BIAS_E + FP16_BIAS_E;
9637de38SSrikanth Yalavarthi
9637de38SSrikanth Yalavarthi		/* overflow, be_16 = [31-INF], set to infinity */
9637de38SSrikanth Yalavarthi		if (be_16 >= (int)(FP16_MASK_E >> FP16_LSB_E)) {
9637de38SSrikanth Yalavarthi			f16_e = FP16_MASK_E >> FP16_LSB_E;
9637de38SSrikanth Yalavarthi			f16_m = 0;
9637de38SSrikanth Yalavarthi		} else if ((be_16 >= 1) && (be_16 < (int)(FP16_MASK_E >> FP16_LSB_E))) {
9637de38SSrikanth Yalavarthi			/* normal float16, be_16 = [1:30]*/
9637de38SSrikanth Yalavarthi			f16_e = be_16;
9637de38SSrikanth Yalavarthi			m_16 = f32_m >> (FP32_LSB_E - FP16_LSB_E);
9637de38SSrikanth Yalavarthi			tmsb = FP32_MSB_M - FP16_MSB_M - 1;
9637de38SSrikanth Yalavarthi			if ((f32_m & GENMASK_U32(tmsb, 0)) > BIT(tmsb)) {
9637de38SSrikanth Yalavarthi				/* round: non-zero truncated bits except MSB */
9637de38SSrikanth Yalavarthi				m_16++;
9637de38SSrikanth Yalavarthi
9637de38SSrikanth Yalavarthi				/* overflow into exponent */
9637de38SSrikanth Yalavarthi				if (((m_16 & FP16_MASK_E) >> FP16_LSB_E) == 0x1)
9637de38SSrikanth Yalavarthi					f16_e++;
9637de38SSrikanth Yalavarthi			} else if ((f32_m & GENMASK_U32(tmsb, 0)) == BIT(tmsb)) {
9637de38SSrikanth Yalavarthi				/* round: MSB of truncated bits and LSB of m_16 is set */
9637de38SSrikanth Yalavarthi				if ((m_16 & 0x1) == 0x1) {
9637de38SSrikanth Yalavarthi					m_16++;
9637de38SSrikanth Yalavarthi
9637de38SSrikanth Yalavarthi					/* overflow into exponent */
9637de38SSrikanth Yalavarthi					if (((m_16 & FP16_MASK_E) >> FP16_LSB_E) == 0x1)
9637de38SSrikanth Yalavarthi						f16_e++;
9637de38SSrikanth Yalavarthi				}
9637de38SSrikanth Yalavarthi			}
9637de38SSrikanth Yalavarthi			f16_m = m_16 & FP16_MASK_M;
9637de38SSrikanth Yalavarthi		} else if ((be_16 >= -(int)(FP16_MSB_M)) && (be_16 < 1)) {
9637de38SSrikanth Yalavarthi			/* underflow: zero / subnormal, be_16 = [-9:0] */
9637de38SSrikanth Yalavarthi			f16_e = 0;
9637de38SSrikanth Yalavarthi
9637de38SSrikanth Yalavarthi			/* add implicit leading zero */
9637de38SSrikanth Yalavarthi			m_32 = f32_m | BIT(FP32_LSB_E);
9637de38SSrikanth Yalavarthi			tbits = FP32_LSB_E - FP16_LSB_E - be_16 + 1;
9637de38SSrikanth Yalavarthi			m_16 = m_32 >> tbits;
9637de38SSrikanth Yalavarthi
9637de38SSrikanth Yalavarthi			/* if non-leading truncated bits are set */
9637de38SSrikanth Yalavarthi			if ((f32_m & GENMASK_U32(tbits - 1, 0)) > BIT(tbits - 1)) {
9637de38SSrikanth Yalavarthi				m_16++;
9637de38SSrikanth Yalavarthi
9637de38SSrikanth Yalavarthi				/* overflow into exponent */
9637de38SSrikanth Yalavarthi				if (((m_16 & FP16_MASK_E) >> FP16_LSB_E) == 0x1)
9637de38SSrikanth Yalavarthi					f16_e++;
9637de38SSrikanth Yalavarthi			} else if ((f32_m & GENMASK_U32(tbits - 1, 0)) == BIT(tbits - 1)) {
9637de38SSrikanth Yalavarthi				/* if leading truncated bit is set */
9637de38SSrikanth Yalavarthi				if ((m_16 & 0x1) == 0x1) {
9637de38SSrikanth Yalavarthi					m_16++;
9637de38SSrikanth Yalavarthi
9637de38SSrikanth Yalavarthi					/* overflow into exponent */
9637de38SSrikanth Yalavarthi					if (((m_16 & FP16_MASK_E) >> FP16_LSB_E) == 0x1)
9637de38SSrikanth Yalavarthi						f16_e++;
9637de38SSrikanth Yalavarthi				}
9637de38SSrikanth Yalavarthi			}
9637de38SSrikanth Yalavarthi			f16_m = m_16 & FP16_MASK_M;
9637de38SSrikanth Yalavarthi		} else if (be_16 == -(int)(FP16_MSB_M + 1)) {
9637de38SSrikanth Yalavarthi			/* underflow: zero, be_16 = [-10] */
9637de38SSrikanth Yalavarthi			f16_e = 0;
9637de38SSrikanth Yalavarthi			if (f32_m != 0)
9637de38SSrikanth Yalavarthi				f16_m = 1;
9637de38SSrikanth Yalavarthi			else
9637de38SSrikanth Yalavarthi				f16_m = 0;
9637de38SSrikanth Yalavarthi		} else {
9637de38SSrikanth Yalavarthi			/* underflow: zero, be_16 = [-INF:-11] */
9637de38SSrikanth Yalavarthi			f16_e = 0;
9637de38SSrikanth Yalavarthi			f16_m = 0;
9637de38SSrikanth Yalavarthi		}
9637de38SSrikanth Yalavarthi
9637de38SSrikanth Yalavarthi		break;
9637de38SSrikanth Yalavarthi	}
9637de38SSrikanth Yalavarthi
9637de38SSrikanth Yalavarthi	u16 = FP16_PACK(f16_s, f16_e, f16_m);
9637de38SSrikanth Yalavarthi
9637de38SSrikanth Yalavarthi	return u16;
9637de38SSrikanth Yalavarthi}
9637de38SSrikanth Yalavarthi
*8c9bfcb1SSrikanth Yalavarthiint
9637de38SSrikanth Yalavarthirte_ml_io_float32_to_float16(uint64_t nb_elements, void *input, void *output)
9637de38SSrikanth Yalavarthi{
9637de38SSrikanth Yalavarthi	float *input_buffer;
9637de38SSrikanth Yalavarthi	uint16_t *output_buffer;
9637de38SSrikanth Yalavarthi	uint64_t i;
9637de38SSrikanth Yalavarthi
9637de38SSrikanth Yalavarthi	if ((nb_elements == 0) || (input == NULL) || (output == NULL))
9637de38SSrikanth Yalavarthi		return -EINVAL;
9637de38SSrikanth Yalavarthi
9637de38SSrikanth Yalavarthi	input_buffer = (float *)input;
9637de38SSrikanth Yalavarthi	output_buffer = (uint16_t *)output;
9637de38SSrikanth Yalavarthi
9637de38SSrikanth Yalavarthi	for (i = 0; i < nb_elements; i++) {
9637de38SSrikanth Yalavarthi		*output_buffer = __float32_to_float16_scalar_rtn(*input_buffer);
9637de38SSrikanth Yalavarthi
9637de38SSrikanth Yalavarthi		input_buffer = input_buffer + 1;
9637de38SSrikanth Yalavarthi		output_buffer = output_buffer + 1;
9637de38SSrikanth Yalavarthi	}
9637de38SSrikanth Yalavarthi
9637de38SSrikanth Yalavarthi	return 0;
9637de38SSrikanth Yalavarthi}
9637de38SSrikanth Yalavarthi
9637de38SSrikanth Yalavarthi/* Convert a half precision floating point number (float16) into a single precision
9637de38SSrikanth Yalavarthi * floating point number (float32).
9637de38SSrikanth Yalavarthi */
9637de38SSrikanth Yalavarthistatic float
9637de38SSrikanth Yalavarthi__float16_to_float32_scalar_rtx(uint16_t f16)
9637de38SSrikanth Yalavarthi{
9637de38SSrikanth Yalavarthi	union float32 f32; /* float32 output */
9637de38SSrikanth Yalavarthi	uint16_t f16_s;	   /* float16 sign */
9637de38SSrikanth Yalavarthi	uint16_t f16_e;	   /* float16 exponent */
9637de38SSrikanth Yalavarthi	uint16_t f16_m;	   /* float16 mantissa */
9637de38SSrikanth Yalavarthi	uint32_t f32_s;	   /* float32 sign */
9637de38SSrikanth Yalavarthi	uint32_t f32_e;	   /* float32 exponent */
9637de38SSrikanth Yalavarthi	uint32_t f32_m;	   /* float32 mantissa*/
9637de38SSrikanth Yalavarthi	uint8_t shift;	   /* number of bits to be shifted */
9637de38SSrikanth Yalavarthi	uint32_t clz;	   /* count of leading zeroes */
9637de38SSrikanth Yalavarthi	int e_16;	   /* float16 exponent unbiased */
9637de38SSrikanth Yalavarthi
9637de38SSrikanth Yalavarthi	f16_s = (f16 & FP16_MASK_S) >> FP16_LSB_S;
9637de38SSrikanth Yalavarthi	f16_e = (f16 & FP16_MASK_E) >> FP16_LSB_E;
9637de38SSrikanth Yalavarthi	f16_m = (f16 & FP16_MASK_M) >> FP16_LSB_M;
9637de38SSrikanth Yalavarthi
9637de38SSrikanth Yalavarthi	f32_s = f16_s;
9637de38SSrikanth Yalavarthi	switch (f16_e) {
9637de38SSrikanth Yalavarthi	case (FP16_MASK_E >> FP16_LSB_E): /* float16: infinity or nan */
9637de38SSrikanth Yalavarthi		f32_e = FP32_MASK_E >> FP32_LSB_E;
9637de38SSrikanth Yalavarthi		if (f16_m == 0x0) { /* infinity */
9637de38SSrikanth Yalavarthi			f32_m = f16_m;
9637de38SSrikanth Yalavarthi		} else { /* nan, propagate mantissa, set MSB of mantissa to 1 */
9637de38SSrikanth Yalavarthi			f32_m = f16_m;
9637de38SSrikanth Yalavarthi			shift = FP32_MSB_M - FP16_MSB_M;
9637de38SSrikanth Yalavarthi			f32_m = (f32_m << shift) & FP32_MASK_M;
9637de38SSrikanth Yalavarthi			f32_m |= BIT(FP32_MSB_M);
9637de38SSrikanth Yalavarthi		}
9637de38SSrikanth Yalavarthi		break;
9637de38SSrikanth Yalavarthi	case 0: /* float16: zero or sub-normal */
9637de38SSrikanth Yalavarthi		f32_m = f16_m;
9637de38SSrikanth Yalavarthi		if (f16_m == 0) { /* zero signed */
9637de38SSrikanth Yalavarthi			f32_e = 0;
9637de38SSrikanth Yalavarthi		} else { /* subnormal numbers */
9637de38SSrikanth Yalavarthi			clz = __builtin_clz((uint32_t)f16_m) - sizeof(uint32_t) * 8 + FP16_LSB_E;
9637de38SSrikanth Yalavarthi			e_16 = (int)f16_e - clz;
9637de38SSrikanth Yalavarthi			f32_e = FP32_BIAS_E + e_16 - FP16_BIAS_E;
9637de38SSrikanth Yalavarthi
9637de38SSrikanth Yalavarthi			shift = clz + (FP32_MSB_M - FP16_MSB_M) + 1;
9637de38SSrikanth Yalavarthi			f32_m = (f32_m << shift) & FP32_MASK_M;
9637de38SSrikanth Yalavarthi		}
9637de38SSrikanth Yalavarthi		break;
9637de38SSrikanth Yalavarthi	default: /* normal numbers */
9637de38SSrikanth Yalavarthi		f32_m = f16_m;
9637de38SSrikanth Yalavarthi		e_16 = (int)f16_e;
9637de38SSrikanth Yalavarthi		f32_e = FP32_BIAS_E + e_16 - FP16_BIAS_E;
9637de38SSrikanth Yalavarthi
9637de38SSrikanth Yalavarthi		shift = (FP32_MSB_M - FP16_MSB_M);
9637de38SSrikanth Yalavarthi		f32_m = (f32_m << shift) & FP32_MASK_M;
9637de38SSrikanth Yalavarthi	}
9637de38SSrikanth Yalavarthi
9637de38SSrikanth Yalavarthi	f32.u = FP32_PACK(f32_s, f32_e, f32_m);
9637de38SSrikanth Yalavarthi
9637de38SSrikanth Yalavarthi	return f32.f;
9637de38SSrikanth Yalavarthi}
9637de38SSrikanth Yalavarthi
*8c9bfcb1SSrikanth Yalavarthiint
9637de38SSrikanth Yalavarthirte_ml_io_float16_to_float32(uint64_t nb_elements, void *input, void *output)
9637de38SSrikanth Yalavarthi{
9637de38SSrikanth Yalavarthi	uint16_t *input_buffer;
9637de38SSrikanth Yalavarthi	float *output_buffer;
9637de38SSrikanth Yalavarthi	uint64_t i;
9637de38SSrikanth Yalavarthi
9637de38SSrikanth Yalavarthi	if ((nb_elements == 0) || (input == NULL) || (output == NULL))
9637de38SSrikanth Yalavarthi		return -EINVAL;
9637de38SSrikanth Yalavarthi
9637de38SSrikanth Yalavarthi	input_buffer = (uint16_t *)input;
9637de38SSrikanth Yalavarthi	output_buffer = (float *)output;
9637de38SSrikanth Yalavarthi
9637de38SSrikanth Yalavarthi	for (i = 0; i < nb_elements; i++) {
9637de38SSrikanth Yalavarthi		*output_buffer = __float16_to_float32_scalar_rtx(*input_buffer);
9637de38SSrikanth Yalavarthi
9637de38SSrikanth Yalavarthi		input_buffer = input_buffer + 1;
9637de38SSrikanth Yalavarthi		output_buffer = output_buffer + 1;
9637de38SSrikanth Yalavarthi	}
9637de38SSrikanth Yalavarthi
9637de38SSrikanth Yalavarthi	return 0;
9637de38SSrikanth Yalavarthi}
9637de38SSrikanth Yalavarthi
9637de38SSrikanth Yalavarthi/* Convert a single precision floating point number (float32) into a
9637de38SSrikanth Yalavarthi * brain float number (bfloat16) using round to nearest rounding mode.
9637de38SSrikanth Yalavarthi */
9637de38SSrikanth Yalavarthistatic uint16_t
9637de38SSrikanth Yalavarthi__float32_to_bfloat16_scalar_rtn(float x)
9637de38SSrikanth Yalavarthi{
9637de38SSrikanth Yalavarthi	union float32 f32; /* float32 input */
9637de38SSrikanth Yalavarthi	uint32_t f32_s;	   /* float32 sign */
9637de38SSrikanth Yalavarthi	uint32_t f32_e;	   /* float32 exponent */
9637de38SSrikanth Yalavarthi	uint32_t f32_m;	   /* float32 mantissa */
9637de38SSrikanth Yalavarthi	uint16_t b16_s;	   /* float16 sign */
9637de38SSrikanth Yalavarthi	uint16_t b16_e;	   /* float16 exponent */
9637de38SSrikanth Yalavarthi	uint16_t b16_m;	   /* float16 mantissa */
9637de38SSrikanth Yalavarthi	uint32_t tbits;	   /* number of truncated bits */
9637de38SSrikanth Yalavarthi	uint16_t u16;	   /* float16 output */
9637de38SSrikanth Yalavarthi
9637de38SSrikanth Yalavarthi	f32.f = x;
9637de38SSrikanth Yalavarthi	f32_s = (f32.u & FP32_MASK_S) >> FP32_LSB_S;
9637de38SSrikanth Yalavarthi	f32_e = (f32.u & FP32_MASK_E) >> FP32_LSB_E;
9637de38SSrikanth Yalavarthi	f32_m = (f32.u & FP32_MASK_M) >> FP32_LSB_M;
9637de38SSrikanth Yalavarthi
9637de38SSrikanth Yalavarthi	b16_s = f32_s;
9637de38SSrikanth Yalavarthi	b16_e = 0;
9637de38SSrikanth Yalavarthi	b16_m = 0;
9637de38SSrikanth Yalavarthi
9637de38SSrikanth Yalavarthi	switch (f32_e) {
9637de38SSrikanth Yalavarthi	case (0): /* float32: zero or subnormal number */
9637de38SSrikanth Yalavarthi		b16_e = 0;
9637de38SSrikanth Yalavarthi		if (f32_m == 0) /* zero */
9637de38SSrikanth Yalavarthi			b16_m = 0;
9637de38SSrikanth Yalavarthi		else /* subnormal float32 number, normal bfloat16 */
9637de38SSrikanth Yalavarthi			goto bf16_normal;
9637de38SSrikanth Yalavarthi		break;
9637de38SSrikanth Yalavarthi	case (FP32_MASK_E >> FP32_LSB_E): /* float32: infinity or nan */
9637de38SSrikanth Yalavarthi		b16_e = BF16_MASK_E >> BF16_LSB_E;
9637de38SSrikanth Yalavarthi		if (f32_m == 0) { /* infinity */
9637de38SSrikanth Yalavarthi			b16_m = 0;
9637de38SSrikanth Yalavarthi		} else { /* nan, propagate mantissa and set MSB of mantissa to 1 */
9637de38SSrikanth Yalavarthi			b16_m = f32_m >> (FP32_MSB_M - BF16_MSB_M);
9637de38SSrikanth Yalavarthi			b16_m |= BIT(BF16_MSB_M);
9637de38SSrikanth Yalavarthi		}
9637de38SSrikanth Yalavarthi		break;
9637de38SSrikanth Yalavarthi	default: /* float32: normal number, normal bfloat16 */
9637de38SSrikanth Yalavarthi		goto bf16_normal;
9637de38SSrikanth Yalavarthi	}
9637de38SSrikanth Yalavarthi
9637de38SSrikanth Yalavarthi	goto bf16_pack;
9637de38SSrikanth Yalavarthi
9637de38SSrikanth Yalavarthibf16_normal:
9637de38SSrikanth Yalavarthi	b16_e = f32_e;
9637de38SSrikanth Yalavarthi	tbits = FP32_MSB_M - BF16_MSB_M;
9637de38SSrikanth Yalavarthi	b16_m = f32_m >> tbits;
9637de38SSrikanth Yalavarthi
9637de38SSrikanth Yalavarthi	/* if non-leading truncated bits are set */
9637de38SSrikanth Yalavarthi	if ((f32_m & GENMASK_U32(tbits - 1, 0)) > BIT(tbits - 1)) {
9637de38SSrikanth Yalavarthi		b16_m++;
9637de38SSrikanth Yalavarthi
9637de38SSrikanth Yalavarthi		/* if overflow into exponent */
9637de38SSrikanth Yalavarthi		if (((b16_m & BF16_MASK_E) >> BF16_LSB_E) == 0x1)
9637de38SSrikanth Yalavarthi			b16_e++;
9637de38SSrikanth Yalavarthi	} else if ((f32_m & GENMASK_U32(tbits - 1, 0)) == BIT(tbits - 1)) {
9637de38SSrikanth Yalavarthi		/* if only leading truncated bit is set */
9637de38SSrikanth Yalavarthi		if ((b16_m & 0x1) == 0x1) {
9637de38SSrikanth Yalavarthi			b16_m++;
9637de38SSrikanth Yalavarthi
9637de38SSrikanth Yalavarthi			/* if overflow into exponent */
9637de38SSrikanth Yalavarthi			if (((b16_m & BF16_MASK_E) >> BF16_LSB_E) == 0x1)
9637de38SSrikanth Yalavarthi				b16_e++;
9637de38SSrikanth Yalavarthi		}
9637de38SSrikanth Yalavarthi	}
9637de38SSrikanth Yalavarthi	b16_m = b16_m & BF16_MASK_M;
9637de38SSrikanth Yalavarthi
9637de38SSrikanth Yalavarthibf16_pack:
9637de38SSrikanth Yalavarthi	u16 = BF16_PACK(b16_s, b16_e, b16_m);
9637de38SSrikanth Yalavarthi
9637de38SSrikanth Yalavarthi	return u16;
9637de38SSrikanth Yalavarthi}
9637de38SSrikanth Yalavarthi
*8c9bfcb1SSrikanth Yalavarthiint
9637de38SSrikanth Yalavarthirte_ml_io_float32_to_bfloat16(uint64_t nb_elements, void *input, void *output)
9637de38SSrikanth Yalavarthi{
9637de38SSrikanth Yalavarthi	float *input_buffer;
9637de38SSrikanth Yalavarthi	uint16_t *output_buffer;
9637de38SSrikanth Yalavarthi	uint64_t i;
9637de38SSrikanth Yalavarthi
9637de38SSrikanth Yalavarthi	if ((nb_elements == 0) || (input == NULL) || (output == NULL))
9637de38SSrikanth Yalavarthi		return -EINVAL;
9637de38SSrikanth Yalavarthi
9637de38SSrikanth Yalavarthi	input_buffer = (float *)input;
9637de38SSrikanth Yalavarthi	output_buffer = (uint16_t *)output;
9637de38SSrikanth Yalavarthi
9637de38SSrikanth Yalavarthi	for (i = 0; i < nb_elements; i++) {
9637de38SSrikanth Yalavarthi		*output_buffer = __float32_to_bfloat16_scalar_rtn(*input_buffer);
9637de38SSrikanth Yalavarthi
9637de38SSrikanth Yalavarthi		input_buffer = input_buffer + 1;
9637de38SSrikanth Yalavarthi		output_buffer = output_buffer + 1;
9637de38SSrikanth Yalavarthi	}
9637de38SSrikanth Yalavarthi
9637de38SSrikanth Yalavarthi	return 0;
9637de38SSrikanth Yalavarthi}
9637de38SSrikanth Yalavarthi
9637de38SSrikanth Yalavarthi/* Convert a brain float number (bfloat16) into a
9637de38SSrikanth Yalavarthi * single precision floating point number (float32).
9637de38SSrikanth Yalavarthi */
9637de38SSrikanth Yalavarthistatic float
9637de38SSrikanth Yalavarthi__bfloat16_to_float32_scalar_rtx(uint16_t f16)
9637de38SSrikanth Yalavarthi{
9637de38SSrikanth Yalavarthi	union float32 f32; /* float32 output */
9637de38SSrikanth Yalavarthi	uint16_t b16_s;	   /* float16 sign */
9637de38SSrikanth Yalavarthi	uint16_t b16_e;	   /* float16 exponent */
9637de38SSrikanth Yalavarthi	uint16_t b16_m;	   /* float16 mantissa */
9637de38SSrikanth Yalavarthi	uint32_t f32_s;	   /* float32 sign */
9637de38SSrikanth Yalavarthi	uint32_t f32_e;	   /* float32 exponent */
9637de38SSrikanth Yalavarthi	uint32_t f32_m;	   /* float32 mantissa*/
9637de38SSrikanth Yalavarthi	uint8_t shift;	   /* number of bits to be shifted */
9637de38SSrikanth Yalavarthi
9637de38SSrikanth Yalavarthi	b16_s = (f16 & BF16_MASK_S) >> BF16_LSB_S;
9637de38SSrikanth Yalavarthi	b16_e = (f16 & BF16_MASK_E) >> BF16_LSB_E;
9637de38SSrikanth Yalavarthi	b16_m = (f16 & BF16_MASK_M) >> BF16_LSB_M;
9637de38SSrikanth Yalavarthi
9637de38SSrikanth Yalavarthi	f32_s = b16_s;
9637de38SSrikanth Yalavarthi	switch (b16_e) {
9637de38SSrikanth Yalavarthi	case (BF16_MASK_E >> BF16_LSB_E): /* bfloat16: infinity or nan */
9637de38SSrikanth Yalavarthi		f32_e = FP32_MASK_E >> FP32_LSB_E;
9637de38SSrikanth Yalavarthi		if (b16_m == 0x0) { /* infinity */
9637de38SSrikanth Yalavarthi			f32_m = 0;
9637de38SSrikanth Yalavarthi		} else { /* nan, propagate mantissa, set MSB of mantissa to 1 */
9637de38SSrikanth Yalavarthi			f32_m = b16_m;
9637de38SSrikanth Yalavarthi			shift = FP32_MSB_M - BF16_MSB_M;
9637de38SSrikanth Yalavarthi			f32_m = (f32_m << shift) & FP32_MASK_M;
9637de38SSrikanth Yalavarthi			f32_m |= BIT(FP32_MSB_M);
9637de38SSrikanth Yalavarthi		}
9637de38SSrikanth Yalavarthi		break;
9637de38SSrikanth Yalavarthi	case 0: /* bfloat16: zero or subnormal */
9637de38SSrikanth Yalavarthi		f32_m = b16_m;
9637de38SSrikanth Yalavarthi		if (b16_m == 0) { /* zero signed */
9637de38SSrikanth Yalavarthi			f32_e = 0;
9637de38SSrikanth Yalavarthi		} else { /* subnormal numbers */
9637de38SSrikanth Yalavarthi			goto fp32_normal;
9637de38SSrikanth Yalavarthi		}
9637de38SSrikanth Yalavarthi		break;
9637de38SSrikanth Yalavarthi	default: /* bfloat16: normal number */
9637de38SSrikanth Yalavarthi		goto fp32_normal;
9637de38SSrikanth Yalavarthi	}
9637de38SSrikanth Yalavarthi
9637de38SSrikanth Yalavarthi	goto fp32_pack;
9637de38SSrikanth Yalavarthi
9637de38SSrikanth Yalavarthifp32_normal:
9637de38SSrikanth Yalavarthi	f32_m = b16_m;
9637de38SSrikanth Yalavarthi	f32_e = FP32_BIAS_E + b16_e - BF16_BIAS_E;
9637de38SSrikanth Yalavarthi
9637de38SSrikanth Yalavarthi	shift = (FP32_MSB_M - BF16_MSB_M);
9637de38SSrikanth Yalavarthi	f32_m = (f32_m << shift) & FP32_MASK_M;
9637de38SSrikanth Yalavarthi
9637de38SSrikanth Yalavarthifp32_pack:
9637de38SSrikanth Yalavarthi	f32.u = FP32_PACK(f32_s, f32_e, f32_m);
9637de38SSrikanth Yalavarthi
9637de38SSrikanth Yalavarthi	return f32.f;
9637de38SSrikanth Yalavarthi}
9637de38SSrikanth Yalavarthi
*8c9bfcb1SSrikanth Yalavarthiint
9637de38SSrikanth Yalavarthirte_ml_io_bfloat16_to_float32(uint64_t nb_elements, void *input, void *output)
9637de38SSrikanth Yalavarthi{
9637de38SSrikanth Yalavarthi	uint16_t *input_buffer;
9637de38SSrikanth Yalavarthi	float *output_buffer;
9637de38SSrikanth Yalavarthi	uint64_t i;
9637de38SSrikanth Yalavarthi
9637de38SSrikanth Yalavarthi	if ((nb_elements == 0) || (input == NULL) || (output == NULL))
9637de38SSrikanth Yalavarthi		return -EINVAL;
9637de38SSrikanth Yalavarthi
9637de38SSrikanth Yalavarthi	input_buffer = (uint16_t *)input;
9637de38SSrikanth Yalavarthi	output_buffer = (float *)output;
9637de38SSrikanth Yalavarthi
9637de38SSrikanth Yalavarthi	for (i = 0; i < nb_elements; i++) {
9637de38SSrikanth Yalavarthi		*output_buffer = __bfloat16_to_float32_scalar_rtx(*input_buffer);
9637de38SSrikanth Yalavarthi
9637de38SSrikanth Yalavarthi		input_buffer = input_buffer + 1;
9637de38SSrikanth Yalavarthi		output_buffer = output_buffer + 1;
9637de38SSrikanth Yalavarthi	}
9637de38SSrikanth Yalavarthi
9637de38SSrikanth Yalavarthi	return 0;
9637de38SSrikanth Yalavarthi}