xref: /llvm-project/llvm/lib/Target/AMDGPU/MCTargetDesc/AMDGPUMCKernelDescriptor.cpp (revision 8d13e7b8c382499c1cf0c2a3184b483e760f266b)
11103a2a3SJanek van Oirschot //===--- AMDHSAKernelDescriptor.h -----------------------------------------===//
21103a2a3SJanek van Oirschot //
31103a2a3SJanek van Oirschot // Part of the LLVM Project, under the Apache License v2.0 with LLVM Exceptions.
41103a2a3SJanek van Oirschot // See https://llvm.org/LICENSE.txt for license information.
51103a2a3SJanek van Oirschot // SPDX-License-Identifier: Apache-2.0 WITH LLVM-exception
61103a2a3SJanek van Oirschot //
71103a2a3SJanek van Oirschot //===----------------------------------------------------------------------===//
81103a2a3SJanek van Oirschot 
91103a2a3SJanek van Oirschot #include "AMDGPUMCKernelDescriptor.h"
101103a2a3SJanek van Oirschot #include "AMDGPUMCTargetDesc.h"
111103a2a3SJanek van Oirschot #include "Utils/AMDGPUBaseInfo.h"
121103a2a3SJanek van Oirschot #include "llvm/MC/MCContext.h"
131103a2a3SJanek van Oirschot #include "llvm/MC/MCExpr.h"
141103a2a3SJanek van Oirschot #include "llvm/MC/MCSubtargetInfo.h"
151103a2a3SJanek van Oirschot #include "llvm/TargetParser/TargetParser.h"
161103a2a3SJanek van Oirschot 
171103a2a3SJanek van Oirschot using namespace llvm;
181103a2a3SJanek van Oirschot using namespace llvm::AMDGPU;
191103a2a3SJanek van Oirschot 
201103a2a3SJanek van Oirschot MCKernelDescriptor
211103a2a3SJanek van Oirschot MCKernelDescriptor::getDefaultAmdhsaKernelDescriptor(const MCSubtargetInfo *STI,
221103a2a3SJanek van Oirschot                                                      MCContext &Ctx) {
231103a2a3SJanek van Oirschot   IsaVersion Version = getIsaVersion(STI->getCPU());
241103a2a3SJanek van Oirschot 
251103a2a3SJanek van Oirschot   MCKernelDescriptor KD;
261103a2a3SJanek van Oirschot   const MCExpr *ZeroMCExpr = MCConstantExpr::create(0, Ctx);
271103a2a3SJanek van Oirschot   const MCExpr *OneMCExpr = MCConstantExpr::create(1, Ctx);
281103a2a3SJanek van Oirschot 
291103a2a3SJanek van Oirschot   KD.group_segment_fixed_size = ZeroMCExpr;
301103a2a3SJanek van Oirschot   KD.private_segment_fixed_size = ZeroMCExpr;
311103a2a3SJanek van Oirschot   KD.compute_pgm_rsrc1 = ZeroMCExpr;
321103a2a3SJanek van Oirschot   KD.compute_pgm_rsrc2 = ZeroMCExpr;
331103a2a3SJanek van Oirschot   KD.compute_pgm_rsrc3 = ZeroMCExpr;
341103a2a3SJanek van Oirschot   KD.kernarg_size = ZeroMCExpr;
351103a2a3SJanek van Oirschot   KD.kernel_code_properties = ZeroMCExpr;
361103a2a3SJanek van Oirschot   KD.kernarg_preload = ZeroMCExpr;
371103a2a3SJanek van Oirschot 
381103a2a3SJanek van Oirschot   MCKernelDescriptor::bits_set(
391103a2a3SJanek van Oirschot       KD.compute_pgm_rsrc1,
401103a2a3SJanek van Oirschot       MCConstantExpr::create(amdhsa::FLOAT_DENORM_MODE_FLUSH_NONE, Ctx),
411103a2a3SJanek van Oirschot       amdhsa::COMPUTE_PGM_RSRC1_FLOAT_DENORM_MODE_16_64_SHIFT,
421103a2a3SJanek van Oirschot       amdhsa::COMPUTE_PGM_RSRC1_FLOAT_DENORM_MODE_16_64, Ctx);
431103a2a3SJanek van Oirschot   if (Version.Major < 12) {
441103a2a3SJanek van Oirschot     MCKernelDescriptor::bits_set(
451103a2a3SJanek van Oirschot         KD.compute_pgm_rsrc1, OneMCExpr,
461103a2a3SJanek van Oirschot         amdhsa::COMPUTE_PGM_RSRC1_GFX6_GFX11_ENABLE_DX10_CLAMP_SHIFT,
471103a2a3SJanek van Oirschot         amdhsa::COMPUTE_PGM_RSRC1_GFX6_GFX11_ENABLE_DX10_CLAMP, Ctx);
481103a2a3SJanek van Oirschot     MCKernelDescriptor::bits_set(
491103a2a3SJanek van Oirschot         KD.compute_pgm_rsrc1, OneMCExpr,
501103a2a3SJanek van Oirschot         amdhsa::COMPUTE_PGM_RSRC1_GFX6_GFX11_ENABLE_IEEE_MODE_SHIFT,
511103a2a3SJanek van Oirschot         amdhsa::COMPUTE_PGM_RSRC1_GFX6_GFX11_ENABLE_IEEE_MODE, Ctx);
521103a2a3SJanek van Oirschot   }
531103a2a3SJanek van Oirschot   MCKernelDescriptor::bits_set(
541103a2a3SJanek van Oirschot       KD.compute_pgm_rsrc2, OneMCExpr,
551103a2a3SJanek van Oirschot       amdhsa::COMPUTE_PGM_RSRC2_ENABLE_SGPR_WORKGROUP_ID_X_SHIFT,
561103a2a3SJanek van Oirschot       amdhsa::COMPUTE_PGM_RSRC2_ENABLE_SGPR_WORKGROUP_ID_X, Ctx);
571103a2a3SJanek van Oirschot   if (Version.Major >= 10) {
581103a2a3SJanek van Oirschot     if (STI->getFeatureBits().test(FeatureWavefrontSize32))
591103a2a3SJanek van Oirschot       MCKernelDescriptor::bits_set(
601103a2a3SJanek van Oirschot           KD.kernel_code_properties, OneMCExpr,
611103a2a3SJanek van Oirschot           amdhsa::KERNEL_CODE_PROPERTY_ENABLE_WAVEFRONT_SIZE32_SHIFT,
621103a2a3SJanek van Oirschot           amdhsa::KERNEL_CODE_PROPERTY_ENABLE_WAVEFRONT_SIZE32, Ctx);
631103a2a3SJanek van Oirschot     if (!STI->getFeatureBits().test(FeatureCuMode))
641103a2a3SJanek van Oirschot       MCKernelDescriptor::bits_set(
651103a2a3SJanek van Oirschot           KD.compute_pgm_rsrc1, OneMCExpr,
661103a2a3SJanek van Oirschot           amdhsa::COMPUTE_PGM_RSRC1_GFX10_PLUS_WGP_MODE_SHIFT,
671103a2a3SJanek van Oirschot           amdhsa::COMPUTE_PGM_RSRC1_GFX10_PLUS_WGP_MODE, Ctx);
681103a2a3SJanek van Oirschot 
691103a2a3SJanek van Oirschot     MCKernelDescriptor::bits_set(
701103a2a3SJanek van Oirschot         KD.compute_pgm_rsrc1, OneMCExpr,
711103a2a3SJanek van Oirschot         amdhsa::COMPUTE_PGM_RSRC1_GFX10_PLUS_MEM_ORDERED_SHIFT,
721103a2a3SJanek van Oirschot         amdhsa::COMPUTE_PGM_RSRC1_GFX10_PLUS_MEM_ORDERED, Ctx);
731103a2a3SJanek van Oirschot   }
741103a2a3SJanek van Oirschot   if (AMDGPU::isGFX90A(*STI) && STI->getFeatureBits().test(FeatureTgSplit))
751103a2a3SJanek van Oirschot     MCKernelDescriptor::bits_set(
761103a2a3SJanek van Oirschot         KD.compute_pgm_rsrc3, OneMCExpr,
771103a2a3SJanek van Oirschot         amdhsa::COMPUTE_PGM_RSRC3_GFX90A_TG_SPLIT_SHIFT,
781103a2a3SJanek van Oirschot         amdhsa::COMPUTE_PGM_RSRC3_GFX90A_TG_SPLIT, Ctx);
791103a2a3SJanek van Oirschot   return KD;
801103a2a3SJanek van Oirschot }
811103a2a3SJanek van Oirschot 
821103a2a3SJanek van Oirschot void MCKernelDescriptor::bits_set(const MCExpr *&Dst, const MCExpr *Value,
831103a2a3SJanek van Oirschot                                   uint32_t Shift, uint32_t Mask,
841103a2a3SJanek van Oirschot                                   MCContext &Ctx) {
85*8d13e7b8SJay Foad   const auto *Sft = MCConstantExpr::create(Shift, Ctx);
86*8d13e7b8SJay Foad   const auto *Msk = MCConstantExpr::create(Mask, Ctx);
871103a2a3SJanek van Oirschot   Dst = MCBinaryExpr::createAnd(Dst, MCUnaryExpr::createNot(Msk, Ctx), Ctx);
881103a2a3SJanek van Oirschot   Dst = MCBinaryExpr::createOr(Dst, MCBinaryExpr::createShl(Value, Sft, Ctx),
891103a2a3SJanek van Oirschot                                Ctx);
901103a2a3SJanek van Oirschot }
911103a2a3SJanek van Oirschot 
921103a2a3SJanek van Oirschot const MCExpr *MCKernelDescriptor::bits_get(const MCExpr *Src, uint32_t Shift,
931103a2a3SJanek van Oirschot                                            uint32_t Mask, MCContext &Ctx) {
94*8d13e7b8SJay Foad   const auto *Sft = MCConstantExpr::create(Shift, Ctx);
95*8d13e7b8SJay Foad   const auto *Msk = MCConstantExpr::create(Mask, Ctx);
961103a2a3SJanek van Oirschot   return MCBinaryExpr::createLShr(MCBinaryExpr::createAnd(Src, Msk, Ctx), Sft,
971103a2a3SJanek van Oirschot                                   Ctx);
981103a2a3SJanek van Oirschot }
99