11103a2a3SJanek van Oirschot //===--- AMDHSAKernelDescriptor.h -----------------------------------------===// 21103a2a3SJanek van Oirschot // 31103a2a3SJanek van Oirschot // Part of the LLVM Project, under the Apache License v2.0 with LLVM Exceptions. 41103a2a3SJanek van Oirschot // See https://llvm.org/LICENSE.txt for license information. 51103a2a3SJanek van Oirschot // SPDX-License-Identifier: Apache-2.0 WITH LLVM-exception 61103a2a3SJanek van Oirschot // 71103a2a3SJanek van Oirschot //===----------------------------------------------------------------------===// 81103a2a3SJanek van Oirschot 91103a2a3SJanek van Oirschot #include "AMDGPUMCKernelDescriptor.h" 101103a2a3SJanek van Oirschot #include "AMDGPUMCTargetDesc.h" 111103a2a3SJanek van Oirschot #include "Utils/AMDGPUBaseInfo.h" 121103a2a3SJanek van Oirschot #include "llvm/MC/MCContext.h" 131103a2a3SJanek van Oirschot #include "llvm/MC/MCExpr.h" 141103a2a3SJanek van Oirschot #include "llvm/MC/MCSubtargetInfo.h" 151103a2a3SJanek van Oirschot #include "llvm/TargetParser/TargetParser.h" 161103a2a3SJanek van Oirschot 171103a2a3SJanek van Oirschot using namespace llvm; 181103a2a3SJanek van Oirschot using namespace llvm::AMDGPU; 191103a2a3SJanek van Oirschot 201103a2a3SJanek van Oirschot MCKernelDescriptor 211103a2a3SJanek van Oirschot MCKernelDescriptor::getDefaultAmdhsaKernelDescriptor(const MCSubtargetInfo *STI, 221103a2a3SJanek van Oirschot MCContext &Ctx) { 231103a2a3SJanek van Oirschot IsaVersion Version = getIsaVersion(STI->getCPU()); 241103a2a3SJanek van Oirschot 251103a2a3SJanek van Oirschot MCKernelDescriptor KD; 261103a2a3SJanek van Oirschot const MCExpr *ZeroMCExpr = MCConstantExpr::create(0, Ctx); 271103a2a3SJanek van Oirschot const MCExpr *OneMCExpr = MCConstantExpr::create(1, Ctx); 281103a2a3SJanek van Oirschot 291103a2a3SJanek van Oirschot KD.group_segment_fixed_size = ZeroMCExpr; 301103a2a3SJanek van Oirschot KD.private_segment_fixed_size = ZeroMCExpr; 311103a2a3SJanek van Oirschot KD.compute_pgm_rsrc1 = ZeroMCExpr; 321103a2a3SJanek van Oirschot KD.compute_pgm_rsrc2 = ZeroMCExpr; 331103a2a3SJanek van Oirschot KD.compute_pgm_rsrc3 = ZeroMCExpr; 341103a2a3SJanek van Oirschot KD.kernarg_size = ZeroMCExpr; 351103a2a3SJanek van Oirschot KD.kernel_code_properties = ZeroMCExpr; 361103a2a3SJanek van Oirschot KD.kernarg_preload = ZeroMCExpr; 371103a2a3SJanek van Oirschot 381103a2a3SJanek van Oirschot MCKernelDescriptor::bits_set( 391103a2a3SJanek van Oirschot KD.compute_pgm_rsrc1, 401103a2a3SJanek van Oirschot MCConstantExpr::create(amdhsa::FLOAT_DENORM_MODE_FLUSH_NONE, Ctx), 411103a2a3SJanek van Oirschot amdhsa::COMPUTE_PGM_RSRC1_FLOAT_DENORM_MODE_16_64_SHIFT, 421103a2a3SJanek van Oirschot amdhsa::COMPUTE_PGM_RSRC1_FLOAT_DENORM_MODE_16_64, Ctx); 431103a2a3SJanek van Oirschot if (Version.Major < 12) { 441103a2a3SJanek van Oirschot MCKernelDescriptor::bits_set( 451103a2a3SJanek van Oirschot KD.compute_pgm_rsrc1, OneMCExpr, 461103a2a3SJanek van Oirschot amdhsa::COMPUTE_PGM_RSRC1_GFX6_GFX11_ENABLE_DX10_CLAMP_SHIFT, 471103a2a3SJanek van Oirschot amdhsa::COMPUTE_PGM_RSRC1_GFX6_GFX11_ENABLE_DX10_CLAMP, Ctx); 481103a2a3SJanek van Oirschot MCKernelDescriptor::bits_set( 491103a2a3SJanek van Oirschot KD.compute_pgm_rsrc1, OneMCExpr, 501103a2a3SJanek van Oirschot amdhsa::COMPUTE_PGM_RSRC1_GFX6_GFX11_ENABLE_IEEE_MODE_SHIFT, 511103a2a3SJanek van Oirschot amdhsa::COMPUTE_PGM_RSRC1_GFX6_GFX11_ENABLE_IEEE_MODE, Ctx); 521103a2a3SJanek van Oirschot } 531103a2a3SJanek van Oirschot MCKernelDescriptor::bits_set( 541103a2a3SJanek van Oirschot KD.compute_pgm_rsrc2, OneMCExpr, 551103a2a3SJanek van Oirschot amdhsa::COMPUTE_PGM_RSRC2_ENABLE_SGPR_WORKGROUP_ID_X_SHIFT, 561103a2a3SJanek van Oirschot amdhsa::COMPUTE_PGM_RSRC2_ENABLE_SGPR_WORKGROUP_ID_X, Ctx); 571103a2a3SJanek van Oirschot if (Version.Major >= 10) { 581103a2a3SJanek van Oirschot if (STI->getFeatureBits().test(FeatureWavefrontSize32)) 591103a2a3SJanek van Oirschot MCKernelDescriptor::bits_set( 601103a2a3SJanek van Oirschot KD.kernel_code_properties, OneMCExpr, 611103a2a3SJanek van Oirschot amdhsa::KERNEL_CODE_PROPERTY_ENABLE_WAVEFRONT_SIZE32_SHIFT, 621103a2a3SJanek van Oirschot amdhsa::KERNEL_CODE_PROPERTY_ENABLE_WAVEFRONT_SIZE32, Ctx); 631103a2a3SJanek van Oirschot if (!STI->getFeatureBits().test(FeatureCuMode)) 641103a2a3SJanek van Oirschot MCKernelDescriptor::bits_set( 651103a2a3SJanek van Oirschot KD.compute_pgm_rsrc1, OneMCExpr, 661103a2a3SJanek van Oirschot amdhsa::COMPUTE_PGM_RSRC1_GFX10_PLUS_WGP_MODE_SHIFT, 671103a2a3SJanek van Oirschot amdhsa::COMPUTE_PGM_RSRC1_GFX10_PLUS_WGP_MODE, Ctx); 681103a2a3SJanek van Oirschot 691103a2a3SJanek van Oirschot MCKernelDescriptor::bits_set( 701103a2a3SJanek van Oirschot KD.compute_pgm_rsrc1, OneMCExpr, 711103a2a3SJanek van Oirschot amdhsa::COMPUTE_PGM_RSRC1_GFX10_PLUS_MEM_ORDERED_SHIFT, 721103a2a3SJanek van Oirschot amdhsa::COMPUTE_PGM_RSRC1_GFX10_PLUS_MEM_ORDERED, Ctx); 731103a2a3SJanek van Oirschot } 741103a2a3SJanek van Oirschot if (AMDGPU::isGFX90A(*STI) && STI->getFeatureBits().test(FeatureTgSplit)) 751103a2a3SJanek van Oirschot MCKernelDescriptor::bits_set( 761103a2a3SJanek van Oirschot KD.compute_pgm_rsrc3, OneMCExpr, 771103a2a3SJanek van Oirschot amdhsa::COMPUTE_PGM_RSRC3_GFX90A_TG_SPLIT_SHIFT, 781103a2a3SJanek van Oirschot amdhsa::COMPUTE_PGM_RSRC3_GFX90A_TG_SPLIT, Ctx); 791103a2a3SJanek van Oirschot return KD; 801103a2a3SJanek van Oirschot } 811103a2a3SJanek van Oirschot 821103a2a3SJanek van Oirschot void MCKernelDescriptor::bits_set(const MCExpr *&Dst, const MCExpr *Value, 831103a2a3SJanek van Oirschot uint32_t Shift, uint32_t Mask, 841103a2a3SJanek van Oirschot MCContext &Ctx) { 85*8d13e7b8SJay Foad const auto *Sft = MCConstantExpr::create(Shift, Ctx); 86*8d13e7b8SJay Foad const auto *Msk = MCConstantExpr::create(Mask, Ctx); 871103a2a3SJanek van Oirschot Dst = MCBinaryExpr::createAnd(Dst, MCUnaryExpr::createNot(Msk, Ctx), Ctx); 881103a2a3SJanek van Oirschot Dst = MCBinaryExpr::createOr(Dst, MCBinaryExpr::createShl(Value, Sft, Ctx), 891103a2a3SJanek van Oirschot Ctx); 901103a2a3SJanek van Oirschot } 911103a2a3SJanek van Oirschot 921103a2a3SJanek van Oirschot const MCExpr *MCKernelDescriptor::bits_get(const MCExpr *Src, uint32_t Shift, 931103a2a3SJanek van Oirschot uint32_t Mask, MCContext &Ctx) { 94*8d13e7b8SJay Foad const auto *Sft = MCConstantExpr::create(Shift, Ctx); 95*8d13e7b8SJay Foad const auto *Msk = MCConstantExpr::create(Mask, Ctx); 961103a2a3SJanek van Oirschot return MCBinaryExpr::createLShr(MCBinaryExpr::createAnd(Src, Msk, Ctx), Sft, 971103a2a3SJanek van Oirschot Ctx); 981103a2a3SJanek van Oirschot } 99