X86 - OpenGrok cross reference for /llvm-project/llvm/lib/Target/X86/

//===---------------------------------------------------------------------===//
// Random ideas for the X86 backend: FP stack related stuff
//===---------------------------------------------------------------------===//

//===---------------------------------------------------------------------===//

Some targets (e.g. athlons) prefer freep to fstp ST(0):
http://gcc.gnu.org/ml/gcc-patches/2004-04/msg00659.html

//===---------------------------------------------------------------------===//

This should use fiadd on chips where it is profitable:
double foo(double P, int *I) { return P+*I; }

We have fiadd patterns now but the followings have the same cost and
complexity. We need a way to specify the later is more profitable.

def FpADD32m  : FpI<(ops RFP:$dst, RFP:$src1, f32mem:$src2), OneArgFPRW,
                    [(set RFP:$dst, (fadd RFP:$src1,
                                     (extloadf64f32 addr:$src2)))]>;
                // ST(0) = ST(0) + [mem32]

def FpIADD32m : FpI<(ops RFP:$dst, RFP:$src1, i32mem:$src2), OneArgFPRW,
                    [(set RFP:$dst, (fadd RFP:$src1,
                                     (X86fild addr:$src2, i32)))]>;
                // ST(0) = ST(0) + [mem32int]

//===---------------------------------------------------------------------===//

The FP stackifier should handle simple permutates to reduce number of shuffle
instructions, e.g. turning:

fld P	->		fld Q
fld Q			fld P
fxch

or:

fxch	->		fucomi
fucomi			jl X
jg X

Ideas:
http://gcc.gnu.org/ml/gcc-patches/2004-11/msg02410.html


//===---------------------------------------------------------------------===//

Add a target specific hook to DAG combiner to handle SINT_TO_FP and
FP_TO_SINT when the source operand is already in memory.

//===---------------------------------------------------------------------===//

Open code rint,floor,ceil,trunc:
http://gcc.gnu.org/ml/gcc-patches/2004-08/msg02006.html
http://gcc.gnu.org/ml/gcc-patches/2004-08/msg02011.html

Opencode the sincos[f] libcall.

//===---------------------------------------------------------------------===//

None of the FPStack instructions are handled in
X86RegisterInfo::foldMemoryOperand, which prevents the spiller from
folding spill code into the instructions.

//===---------------------------------------------------------------------===//

Currently the x86 codegen isn't very good at mixing SSE and FPStack
code:

unsigned int foo(double x) { return x; }

foo:
	subl $20, %esp
	movsd 24(%esp), %xmm0
	movsd %xmm0, 8(%esp)
	fldl 8(%esp)
	fisttpll (%esp)
	movl (%esp), %eax
	addl $20, %esp
	ret

This just requires being smarter when custom expanding fptoui.

//===---------------------------------------------------------------------===//
Name		Date	Size	#Lines	LOC
..		-	-
AsmParser/	H	-	-	5,778	4,709
Disassembler/	H	-	-	3,292	2,565
GISel/	H	-	-	3,596	2,787
MCA/	H	-	-	127	72
MCTargetDesc/	H	-	-	12,737	9,583
TargetInfo/	H	-	-	62	33
CMakeLists.txt	H A D	08-Jul-2024	3.2 KiB	125	117
ImmutableGraph.h	H A D	04-Jan-2023	15.1 KiB	446	356
README-FPStack.txt	H A D	17-Jul-2010	2.7 KiB	86	58
README-SSE.txt	H A D	27-Jul-2023	23.4 KiB	799	616
README-X86-64.txt	H A D	07-Dec-2017	6 KiB	185	150
README.txt	H A D	09-Aug-2023	45.7 KiB	1,749	1,363
X86.h	H A D	01-Nov-2024	9.1 KiB	221	98
X86.td	H A D	16-Dec-2024	102 KiB	2,003	1,806
X86ArgumentStackSlotRebase.cpp	H A D	19-Jan-2025	6.2 KiB	199	140
X86AsmPrinter.cpp	H A D	07-Nov-2024	36.1 KiB	1,047	780
X86AsmPrinter.h	H A D	14-Dec-2023	6.7 KiB	171	105
X86AvoidStoreForwardingBlocks.cpp	H A D	09-Nov-2024	27.6 KiB	729	594
X86AvoidTrailingCall.cpp	H A D	15-Mar-2022	5 KiB	137	67
X86CallFrameOptimization.cpp	H A D	20-May-2023	22.7 KiB	632	375
X86CallingConv.cpp	H A D	24-Jan-2025	14.8 KiB	346	204
X86CallingConv.h	H A D	19-Jan-2019	1.1 KiB	34	13
X86CallingConv.td	H A D	24-Jan-2025	48.6 KiB	1,244	993
X86CmovConversion.cpp	H A D	09-Jul-2024	35.5 KiB	899	461
X86CodeGenPassBuilder.cpp	H A D	24-Jun-2024	2.2 KiB	65	39
X86CompressEVEX.cpp	H A D	22-Nov-2024	10 KiB	308	205
X86DiscriminateMemOps.cpp	H A D	14-Nov-2024	7.1 KiB	188	126
X86DomainReassignment.cpp	H A D	09-Nov-2024	28.2 KiB	839	562
X86DynAllocaExpander.cpp	H A D	09-Nov-2024	9.5 KiB	299	207
X86ExpandPseudo.cpp	H A D	17-Jan-2025	39.1 KiB	850	629
X86FastISel.cpp	H A D	09-Nov-2024	139.6 KiB	4,073	3,040
X86FastPreTileConfig.cpp	H A D	09-Nov-2024	25.1 KiB	703	456
X86FastTileConfig.cpp	H A D	09-Nov-2024	7 KiB	190	113
X86FixupBWInsts.cpp	H A D	28-Oct-2024	18.2 KiB	465	223
X86FixupInstTuning.cpp	H A D	09-Nov-2024	19.3 KiB	518	417
X86FixupLEAs.cpp	H A D	10-Nov-2023	32.5 KiB	915	670
X86FixupSetCC.cpp	H A D	26-Jun-2024	5 KiB	148	79
X86FixupVectorConstants.cpp	H A D	18-Jan-2025	30.5 KiB	706	586
X86FlagsCopyLowering.cpp	H A D	13-Dec-2024	37 KiB	919	602
X86FloatingPoint.cpp	H A D	12-Dec-2024	66 KiB	1,791	1,162
X86FrameLowering.cpp	H A D	29-Jan-2025	176.4 KiB	4,234	2,792
X86FrameLowering.h	H A D	18-Oct-2024	13.6 KiB	275	151
X86GenRegisterBankInfo.def	H A D	05-Mar-2024	3.8 KiB	113	103
X86ISelDAGToDAG.cpp	H A D	17-Jan-2025	249.3 KiB	6,622	4,769
X86ISelDAGToDAG.h	H A D	04-Jun-2024	734	26	11
X86ISelLowering.cpp	H A D	27-Jan-2025	2.4 MiB	59,285	43,305
X86ISelLowering.h	H A D	24-Jan-2025	68.8 KiB	1,898	984
X86ISelLoweringCall.cpp	H A D	24-Jan-2025	117.8 KiB	2,937	2,008
X86IndirectBranchTracking.cpp	H A D	20-Jul-2024	6.5 KiB	192	121
X86IndirectThunks.cpp	H A D	09-Nov-2024	8.9 KiB	249	138
X86InsertPrefetch.cpp	H A D	09-Nov-2024	9.8 KiB	263	193
X86InsertWait.cpp	H A D	03-Nov-2021	4 KiB	131	86
X86InstCombineIntrinsic.cpp	H A D	20-Jan-2025	107.7 KiB	3,388	2,797
X86Instr3DNow.td	H A D	16-Jul-2024	4.3 KiB	102	90
X86InstrAMX.td	H A D	17-Jan-2025	38.9 KiB	270	250
X86InstrAVX10.td	H A D	24-Jan-2025	103.3 KiB
X86InstrAVX512.td	H A D	13-Jan-2025	708.2 KiB	13,583	12,269
X86InstrArithmetic.td	H A D	09-Nov-2024	72.6 KiB	1,481	1,367
X86InstrAsmAlias.td	H A D	13-Aug-2024	50.3 KiB	904	813
X86InstrBuilder.h	H A D	30-Mar-2020	8.5 KiB	233	146
X86InstrCMovSetCC.td	H A D	27-Jun-2024	8.5 KiB	176	160
X86InstrCompiler.td	H A D	23-Jan-2025	103.4 KiB	2,206	1,963
X86InstrConditionalCompare.td	H A D	11-Jul-2024	7.7 KiB	157	141
X86InstrControl.td	H A D	11-Apr-2024	20.3 KiB	433	383
X86InstrExtension.td	H A D	05-Apr-2023	11.5 KiB	223	209
X86InstrFMA.td	H A D	05-Apr-2023	32.8 KiB	633	587
X86InstrFMA3Info.cpp	H A D	24-Jan-2025	8.1 KiB	179	134
X86InstrFMA3Info.h	H A D	19-Apr-2020	3.2 KiB	98	41
X86InstrFPStack.td	H A D	23-Dec-2023	36.3 KiB	732	671
X86InstrFoldTables.cpp	H A D	31-Jan-2024	13.4 KiB	335	257
X86InstrFoldTables.h	H A D	31-Jan-2024	2.2 KiB	64	29
X86InstrFormats.td	H A D	03-Aug-2024	12.6 KiB	313	288
X86InstrFragments.td	H A D	23-Jan-2025	38 KiB	868	719
X86InstrFragmentsSIMD.td	H A D	23-Jan-2025	76.1 KiB	1,364	1,167
X86InstrInfo.cpp	H A D	29-Jan-2025	355.8 KiB	10,830	8,942
X86InstrInfo.h	H A D	22-Jan-2025	33.2 KiB	730	375
X86InstrInfo.td	H A D	03-Aug-2024	2.6 KiB	94	74
X86InstrKL.td	H A D	19-Apr-2024	3.7 KiB	75	66
X86InstrMMX.td	H A D	15-Sep-2024	29.7 KiB	579	519
X86InstrMisc.td	H A D	23-Jan-2025	82.6 KiB	1,732	1,553
X86InstrOperands.td	H A D	13-Jan-2025	19.2 KiB	504	441
X86InstrPredicates.td	H A D	26-Nov-2024	13.8 KiB	242	234
X86InstrRAOINT.td	H A D	26-Jan-2024	2 KiB	48	41
X86InstrSGX.td	H A D	23-Dec-2023	1.1 KiB	30	25
X86InstrSNP.td	H A D	22-Dec-2023	2.3 KiB	54	45
X86InstrSSE.td	H A D	13-Jan-2025	411.5 KiB	8,471	7,658
X86InstrSVM.td	H A D	21-Feb-2023	2 KiB	63	53
X86InstrShiftRotate.td	H A D	23-Jan-2024	32.3 KiB	692	609
X86InstrSystem.td	H A D	09-Nov-2024	38.9 KiB	849	741
X86InstrTBM.td	H A D	22-Dec-2023	8.1 KiB	195	165
X86InstrTDX.td	H A D	22-Dec-2023	1.2 KiB	34	28
X86InstrTSX.td	H A D	23-Dec-2023	2.2 KiB	62	49
X86InstrUtils.td	H A D	24-Jan-2025	62.4 KiB	1,388	1,273
X86InstrVMX.td	H A D	29-Feb-2024	3.8 KiB	86	74
X86InstrVecCompiler.td	H A D	17-Sep-2024	22.3 KiB	488	417
X86InstrXOP.td	H A D	22-Dec-2023	23.8 KiB	474	443
X86InterleavedAccess.cpp	H A D	09-Nov-2024	32.1 KiB	849	473
X86IntrinsicsInfo.h	H A D	24-Jan-2025	134.7 KiB	1,391	1,336
X86LoadValueInjectionLoadHardening.cpp	H A D	09-Nov-2024	31.7 KiB	811	625
X86LoadValueInjectionRetHardening.cpp	H A D	29-Dec-2024	4.1 KiB	120	78
X86LowerAMXIntrinsics.cpp	H A D	09-Nov-2024	27.1 KiB	679	518
X86LowerAMXType.cpp	H A D	24-Jan-2025	51.9 KiB	1,299	819
X86LowerTileCopy.cpp	H A D	09-Nov-2024	5.7 KiB	163	111
X86MCInstLower.cpp	H A D	28-Jan-2025	88 KiB	2,493	1,927
X86MachineFunctionInfo.cpp	H A D	21-Nov-2024	1.8 KiB	51	34
X86MachineFunctionInfo.h	H A D	21-Nov-2024	13.3 KiB	336	187
X86MacroFusion.cpp	H A D	22-Dec-2023	2.7 KiB	76	42
X86MacroFusion.h	H A D	26-Apr-2020	992	32	9
X86OptimizeLEAs.cpp	H A D	28-Oct-2024	28.9 KiB	752	455
X86PadShortFunction.cpp	H A D	09-Nov-2024	7 KiB	226	140
X86PartialReduction.cpp	H A D	09-Nov-2024	17.3 KiB	546	363
X86PassRegistry.def	H A D	04-Jun-2024	751	20	17
X86PfmCounters.td	H A D	25-Nov-2024	16.6 KiB	353	325
X86PreTileConfig.cpp	H A D	17-Jan-2025	16.2 KiB	418	310
X86RegisterBanks.td	H A D	05-Mar-2024	723	20	16
X86RegisterInfo.cpp	H A D	19-Jan-2025	43.5 KiB	1,125	871
X86RegisterInfo.h	H A D	26-Sep-2024	7.3 KiB	184	83
X86RegisterInfo.td	H A D	19-Dec-2024	35.8 KiB	849	763
X86ReplaceableInstrs.def	H A D	20-Nov-2024	21.3 KiB	427	415
X86ReturnThunks.cpp	H A D	20-Jul-2024	3.3 KiB	102	61
X86SchedAlderlakeP.td	H A D	25-Nov-2024	104.8 KiB	2,476	2,166
X86SchedBroadwell.td	H A D	28-Nov-2024	68.3 KiB	1,701	1,475
X86SchedHaswell.td	H A D	28-Nov-2024	72.9 KiB	1,970	1,692
X86SchedIceLake.td	H A D	09-Dec-2024	113.3 KiB	2,592	2,306
X86SchedPredicates.td	H A D	20-Aug-2019	4.2 KiB	144	119
X86SchedSandyBridge.td	H A D	27-Nov-2024	52.7 KiB	1,286	1,119
X86SchedSapphireRapids.td	H A D	02-Jan-2025	236.6 KiB	5,203	4,605
X86SchedSkylakeClient.td	H A D	27-Nov-2024	70.6 KiB	1,782	1,551
X86SchedSkylakeServer.td	H A D	27-Nov-2024	111.5 KiB	2,575	2,288
X86Schedule.td	H A D	23-Aug-2023	38.1 KiB	752	681
X86ScheduleAtom.td	H A D	23-Aug-2023	40.5 KiB	943	814
X86ScheduleBdVer2.td	H A D	15-Sep-2024	56.7 KiB	1,457	1,165
X86ScheduleBtVer2.td	H A D	15-Sep-2024	47.3 KiB	1,056	905
X86ScheduleSLM.td	H A D	23-Aug-2023	23.7 KiB	517	455
X86ScheduleZnver1.td	H A D	15-Sep-2024	45.7 KiB	1,398	1,184
X86ScheduleZnver2.td	H A D	15-Sep-2024	45.7 KiB	1,404	1,186
X86ScheduleZnver3.td	H A D	15-Sep-2024	75 KiB	1,628	1,367
X86ScheduleZnver4.td	H A D	02-Jan-2025	89.5 KiB	1,961	1,667
X86SelectionDAGInfo.cpp	H A D	21-Dec-2024	13.9 KiB	294	205
X86SelectionDAGInfo.h	H A D	21-Dec-2024	1.9 KiB	46	23
X86ShuffleDecodeConstantPool.cpp	H A D	30-Sep-2021	9.5 KiB	297	188
X86ShuffleDecodeConstantPool.h	H A D	03-Dec-2020	1.7 KiB	44	15
X86SpeculativeExecutionSideEffectSuppression.cpp	H A D	14-Sep-2023	7 KiB	183	108
X86SpeculativeLoadHardening.cpp	H A D	13-Jan-2025	92.7 KiB	2,272	1,282
X86Subtarget.cpp	H A D	14-Aug-2024	14.4 KiB	386	248
X86Subtarget.h	H A D	28-Jan-2025	15.8 KiB	442	271
X86TargetMachine.cpp	H A D	14-Nov-2024	24.3 KiB	692	489
X86TargetMachine.h	H A D	14-Nov-2024	3.1 KiB	84	49
X86TargetObjectFile.cpp	H A D	18-Jan-2024	2.8 KiB	69	47
X86TargetObjectFile.h	H A D	18-Jan-2024	2.7 KiB	66	38
X86TargetTransformInfo.cpp	H A D	29-Jan-2025	345.5 KiB	6,759	5,280
X86TargetTransformInfo.h	H A D	29-Nov-2024	14 KiB	312	235
X86TileConfig.cpp	H A D	06-Dec-2024	9.2 KiB	207	141
X86VZeroUpper.cpp	H A D	25-Aug-2024	12.4 KiB	355	214
X86WinEHState.cpp	H A D	24-Jan-2025	30.1 KiB	786	538
X86WinFixupBufferSecurityCheck.cpp	H A D	09-Nov-2024	8.1 KiB	248	162