]> CyberLeo.Net >> Repos - FreeBSD/FreeBSD.git/blob - contrib/llvm/lib/Target/X86/X86RegisterInfo.cpp
Merge llvm, clang, lld, lldb, compiler-rt and libc++ r308421, and update
[FreeBSD/FreeBSD.git] / contrib / llvm / lib / Target / X86 / X86RegisterInfo.cpp
1 //===-- X86RegisterInfo.cpp - X86 Register Information --------------------===//
2 //
3 //                     The LLVM Compiler Infrastructure
4 //
5 // This file is distributed under the University of Illinois Open Source
6 // License. See LICENSE.TXT for details.
7 //
8 //===----------------------------------------------------------------------===//
9 //
10 // This file contains the X86 implementation of the TargetRegisterInfo class.
11 // This file is responsible for the frame pointer elimination optimization
12 // on X86.
13 //
14 //===----------------------------------------------------------------------===//
15
16 #include "X86RegisterInfo.h"
17 #include "X86FrameLowering.h"
18 #include "X86InstrBuilder.h"
19 #include "X86MachineFunctionInfo.h"
20 #include "X86Subtarget.h"
21 #include "X86TargetMachine.h"
22 #include "llvm/ADT/BitVector.h"
23 #include "llvm/ADT/STLExtras.h"
24 #include "llvm/CodeGen/MachineFrameInfo.h"
25 #include "llvm/CodeGen/MachineFunction.h"
26 #include "llvm/CodeGen/MachineFunctionPass.h"
27 #include "llvm/CodeGen/MachineInstrBuilder.h"
28 #include "llvm/CodeGen/MachineModuleInfo.h"
29 #include "llvm/CodeGen/MachineRegisterInfo.h"
30 #include "llvm/IR/Constants.h"
31 #include "llvm/IR/Function.h"
32 #include "llvm/IR/Type.h"
33 #include "llvm/MC/MCAsmInfo.h"
34 #include "llvm/Support/CommandLine.h"
35 #include "llvm/Support/ErrorHandling.h"
36 #include "llvm/Target/TargetFrameLowering.h"
37 #include "llvm/Target/TargetInstrInfo.h"
38 #include "llvm/Target/TargetMachine.h"
39 #include "llvm/Target/TargetOptions.h"
40
41 using namespace llvm;
42
43 #define GET_REGINFO_TARGET_DESC
44 #include "X86GenRegisterInfo.inc"
45
46 static cl::opt<bool>
47 EnableBasePointer("x86-use-base-pointer", cl::Hidden, cl::init(true),
48           cl::desc("Enable use of a base pointer for complex stack frames"));
49
50 X86RegisterInfo::X86RegisterInfo(const Triple &TT)
51     : X86GenRegisterInfo((TT.isArch64Bit() ? X86::RIP : X86::EIP),
52                          X86_MC::getDwarfRegFlavour(TT, false),
53                          X86_MC::getDwarfRegFlavour(TT, true),
54                          (TT.isArch64Bit() ? X86::RIP : X86::EIP)) {
55   X86_MC::initLLVMToSEHAndCVRegMapping(this);
56
57   // Cache some information.
58   Is64Bit = TT.isArch64Bit();
59   IsWin64 = Is64Bit && TT.isOSWindows();
60
61   // Use a callee-saved register as the base pointer.  These registers must
62   // not conflict with any ABI requirements.  For example, in 32-bit mode PIC
63   // requires GOT in the EBX register before function calls via PLT GOT pointer.
64   if (Is64Bit) {
65     SlotSize = 8;
66     // This matches the simplified 32-bit pointer code in the data layout
67     // computation.
68     // FIXME: Should use the data layout?
69     bool Use64BitReg = TT.getEnvironment() != Triple::GNUX32;
70     StackPtr = Use64BitReg ? X86::RSP : X86::ESP;
71     FramePtr = Use64BitReg ? X86::RBP : X86::EBP;
72     BasePtr = Use64BitReg ? X86::RBX : X86::EBX;
73   } else {
74     SlotSize = 4;
75     StackPtr = X86::ESP;
76     FramePtr = X86::EBP;
77     BasePtr = X86::ESI;
78   }
79 }
80
81 bool
82 X86RegisterInfo::trackLivenessAfterRegAlloc(const MachineFunction &MF) const {
83   // ExecutionDepsFixer and PostRAScheduler require liveness.
84   return true;
85 }
86
87 int
88 X86RegisterInfo::getSEHRegNum(unsigned i) const {
89   return getEncodingValue(i);
90 }
91
92 const TargetRegisterClass *
93 X86RegisterInfo::getSubClassWithSubReg(const TargetRegisterClass *RC,
94                                        unsigned Idx) const {
95   // The sub_8bit sub-register index is more constrained in 32-bit mode.
96   // It behaves just like the sub_8bit_hi index.
97   if (!Is64Bit && Idx == X86::sub_8bit)
98     Idx = X86::sub_8bit_hi;
99
100   // Forward to TableGen's default version.
101   return X86GenRegisterInfo::getSubClassWithSubReg(RC, Idx);
102 }
103
104 const TargetRegisterClass *
105 X86RegisterInfo::getMatchingSuperRegClass(const TargetRegisterClass *A,
106                                           const TargetRegisterClass *B,
107                                           unsigned SubIdx) const {
108   // The sub_8bit sub-register index is more constrained in 32-bit mode.
109   if (!Is64Bit && SubIdx == X86::sub_8bit) {
110     A = X86GenRegisterInfo::getSubClassWithSubReg(A, X86::sub_8bit_hi);
111     if (!A)
112       return nullptr;
113   }
114   return X86GenRegisterInfo::getMatchingSuperRegClass(A, B, SubIdx);
115 }
116
117 const TargetRegisterClass *
118 X86RegisterInfo::getLargestLegalSuperClass(const TargetRegisterClass *RC,
119                                            const MachineFunction &MF) const {
120   // Don't allow super-classes of GR8_NOREX.  This class is only used after
121   // extracting sub_8bit_hi sub-registers.  The H sub-registers cannot be copied
122   // to the full GR8 register class in 64-bit mode, so we cannot allow the
123   // reigster class inflation.
124   //
125   // The GR8_NOREX class is always used in a way that won't be constrained to a
126   // sub-class, so sub-classes like GR8_ABCD_L are allowed to expand to the
127   // full GR8 class.
128   if (RC == &X86::GR8_NOREXRegClass)
129     return RC;
130
131   const X86Subtarget &Subtarget = MF.getSubtarget<X86Subtarget>();
132
133   const TargetRegisterClass *Super = RC;
134   TargetRegisterClass::sc_iterator I = RC->getSuperClasses();
135   do {
136     switch (Super->getID()) {
137     case X86::FR32RegClassID:
138     case X86::FR64RegClassID:
139       // If AVX-512 isn't supported we should only inflate to these classes.
140       if (!Subtarget.hasAVX512() &&
141           getRegSizeInBits(*Super) == getRegSizeInBits(*RC))
142         return Super;
143       break;
144     case X86::VR128RegClassID:
145     case X86::VR256RegClassID:
146       // If VLX isn't supported we should only inflate to these classes.
147       if (!Subtarget.hasVLX() &&
148           getRegSizeInBits(*Super) == getRegSizeInBits(*RC))
149         return Super;
150       break;
151     case X86::VR128XRegClassID:
152     case X86::VR256XRegClassID:
153       // If VLX isn't support we shouldn't inflate to these classes.
154       if (Subtarget.hasVLX() &&
155           getRegSizeInBits(*Super) == getRegSizeInBits(*RC))
156         return Super;
157       break;
158     case X86::FR32XRegClassID:
159     case X86::FR64XRegClassID:
160       // If AVX-512 isn't support we shouldn't inflate to these classes.
161       if (Subtarget.hasAVX512() &&
162           getRegSizeInBits(*Super) == getRegSizeInBits(*RC))
163         return Super;
164       break;
165     case X86::GR8RegClassID:
166     case X86::GR16RegClassID:
167     case X86::GR32RegClassID:
168     case X86::GR64RegClassID:
169     case X86::RFP32RegClassID:
170     case X86::RFP64RegClassID:
171     case X86::RFP80RegClassID:
172     case X86::VR512RegClassID:
173       // Don't return a super-class that would shrink the spill size.
174       // That can happen with the vector and float classes.
175       if (getRegSizeInBits(*Super) == getRegSizeInBits(*RC))
176         return Super;
177     }
178     Super = *I++;
179   } while (Super);
180   return RC;
181 }
182
183 const TargetRegisterClass *
184 X86RegisterInfo::getPointerRegClass(const MachineFunction &MF,
185                                     unsigned Kind) const {
186   const X86Subtarget &Subtarget = MF.getSubtarget<X86Subtarget>();
187   switch (Kind) {
188   default: llvm_unreachable("Unexpected Kind in getPointerRegClass!");
189   case 0: // Normal GPRs.
190     if (Subtarget.isTarget64BitLP64())
191       return &X86::GR64RegClass;
192     // If the target is 64bit but we have been told to use 32bit addresses,
193     // we can still use 64-bit register as long as we know the high bits
194     // are zeros.
195     // Reflect that in the returned register class.
196     if (Is64Bit) {
197       // When the target also allows 64-bit frame pointer and we do have a
198       // frame, this is fine to use it for the address accesses as well.
199       const X86FrameLowering *TFI = getFrameLowering(MF);
200       return TFI->hasFP(MF) && TFI->Uses64BitFramePtr
201                  ? &X86::LOW32_ADDR_ACCESS_RBPRegClass
202                  : &X86::LOW32_ADDR_ACCESSRegClass;
203     }
204     return &X86::GR32RegClass;
205   case 1: // Normal GPRs except the stack pointer (for encoding reasons).
206     if (Subtarget.isTarget64BitLP64())
207       return &X86::GR64_NOSPRegClass;
208     // NOSP does not contain RIP, so no special case here.
209     return &X86::GR32_NOSPRegClass;
210   case 2: // NOREX GPRs.
211     if (Subtarget.isTarget64BitLP64())
212       return &X86::GR64_NOREXRegClass;
213     return &X86::GR32_NOREXRegClass;
214   case 3: // NOREX GPRs except the stack pointer (for encoding reasons).
215     if (Subtarget.isTarget64BitLP64())
216       return &X86::GR64_NOREX_NOSPRegClass;
217     // NOSP does not contain RIP, so no special case here.
218     return &X86::GR32_NOREX_NOSPRegClass;
219   case 4: // Available for tailcall (not callee-saved GPRs).
220     return getGPRsForTailCall(MF);
221   }
222 }
223
224 const TargetRegisterClass *
225 X86RegisterInfo::getGPRsForTailCall(const MachineFunction &MF) const {
226   const Function *F = MF.getFunction();
227   if (IsWin64 || (F && F->getCallingConv() == CallingConv::Win64))
228     return &X86::GR64_TCW64RegClass;
229   else if (Is64Bit)
230     return &X86::GR64_TCRegClass;
231
232   bool hasHipeCC = (F ? F->getCallingConv() == CallingConv::HiPE : false);
233   if (hasHipeCC)
234     return &X86::GR32RegClass;
235   return &X86::GR32_TCRegClass;
236 }
237
238 const TargetRegisterClass *
239 X86RegisterInfo::getCrossCopyRegClass(const TargetRegisterClass *RC) const {
240   if (RC == &X86::CCRRegClass) {
241     if (Is64Bit)
242       return &X86::GR64RegClass;
243     else
244       return &X86::GR32RegClass;
245   }
246   return RC;
247 }
248
249 unsigned
250 X86RegisterInfo::getRegPressureLimit(const TargetRegisterClass *RC,
251                                      MachineFunction &MF) const {
252   const X86FrameLowering *TFI = getFrameLowering(MF);
253
254   unsigned FPDiff = TFI->hasFP(MF) ? 1 : 0;
255   switch (RC->getID()) {
256   default:
257     return 0;
258   case X86::GR32RegClassID:
259     return 4 - FPDiff;
260   case X86::GR64RegClassID:
261     return 12 - FPDiff;
262   case X86::VR128RegClassID:
263     return Is64Bit ? 10 : 4;
264   case X86::VR64RegClassID:
265     return 4;
266   }
267 }
268
269 const MCPhysReg *
270 X86RegisterInfo::getCalleeSavedRegs(const MachineFunction *MF) const {
271   assert(MF && "MachineFunction required");
272
273   const X86Subtarget &Subtarget = MF->getSubtarget<X86Subtarget>();
274   bool HasSSE = Subtarget.hasSSE1();
275   bool HasAVX = Subtarget.hasAVX();
276   bool HasAVX512 = Subtarget.hasAVX512();
277   bool CallsEHReturn = MF->callsEHReturn();
278
279   CallingConv::ID CC = MF->getFunction()->getCallingConv();
280
281   // If attribute NoCallerSavedRegisters exists then we set X86_INTR calling
282   // convention because it has the CSR list.
283   if (MF->getFunction()->hasFnAttribute("no_caller_saved_registers"))
284     CC = CallingConv::X86_INTR;
285
286   switch (CC) {
287   case CallingConv::GHC:
288   case CallingConv::HiPE:
289     return CSR_NoRegs_SaveList;
290   case CallingConv::AnyReg:
291     if (HasAVX)
292       return CSR_64_AllRegs_AVX_SaveList;
293     return CSR_64_AllRegs_SaveList;
294   case CallingConv::PreserveMost:
295     return CSR_64_RT_MostRegs_SaveList;
296   case CallingConv::PreserveAll:
297     if (HasAVX)
298       return CSR_64_RT_AllRegs_AVX_SaveList;
299     return CSR_64_RT_AllRegs_SaveList;
300   case CallingConv::CXX_FAST_TLS:
301     if (Is64Bit)
302       return MF->getInfo<X86MachineFunctionInfo>()->isSplitCSR() ?
303              CSR_64_CXX_TLS_Darwin_PE_SaveList : CSR_64_TLS_Darwin_SaveList;
304     break;
305   case CallingConv::Intel_OCL_BI: {
306     if (HasAVX512 && IsWin64)
307       return CSR_Win64_Intel_OCL_BI_AVX512_SaveList;
308     if (HasAVX512 && Is64Bit)
309       return CSR_64_Intel_OCL_BI_AVX512_SaveList;
310     if (HasAVX && IsWin64)
311       return CSR_Win64_Intel_OCL_BI_AVX_SaveList;
312     if (HasAVX && Is64Bit)
313       return CSR_64_Intel_OCL_BI_AVX_SaveList;
314     if (!HasAVX && !IsWin64 && Is64Bit)
315       return CSR_64_Intel_OCL_BI_SaveList;
316     break;
317   }
318   case CallingConv::HHVM:
319     return CSR_64_HHVM_SaveList;
320   case CallingConv::X86_RegCall:
321     if (Is64Bit) {
322       if (IsWin64) {
323         return (HasSSE ? CSR_Win64_RegCall_SaveList :
324                          CSR_Win64_RegCall_NoSSE_SaveList);
325       } else {
326         return (HasSSE ? CSR_SysV64_RegCall_SaveList :
327                          CSR_SysV64_RegCall_NoSSE_SaveList);
328       }
329     } else {
330       return (HasSSE ? CSR_32_RegCall_SaveList :
331                        CSR_32_RegCall_NoSSE_SaveList);
332     }
333   case CallingConv::Cold:
334     if (Is64Bit)
335       return CSR_64_MostRegs_SaveList;
336     break;
337   case CallingConv::Win64:
338     if (!HasSSE)
339       return CSR_Win64_NoSSE_SaveList;
340     return CSR_Win64_SaveList;
341   case CallingConv::X86_64_SysV:
342     if (CallsEHReturn)
343       return CSR_64EHRet_SaveList;
344     return CSR_64_SaveList;
345   case CallingConv::X86_INTR:
346     if (Is64Bit) {
347       if (HasAVX512)
348         return CSR_64_AllRegs_AVX512_SaveList;
349       if (HasAVX)
350         return CSR_64_AllRegs_AVX_SaveList;
351       if (HasSSE)
352         return CSR_64_AllRegs_SaveList;
353       return CSR_64_AllRegs_NoSSE_SaveList;
354     } else {
355       if (HasAVX512)
356         return CSR_32_AllRegs_AVX512_SaveList;
357       if (HasAVX)
358         return CSR_32_AllRegs_AVX_SaveList;
359       if (HasSSE)
360         return CSR_32_AllRegs_SSE_SaveList;
361       return CSR_32_AllRegs_SaveList;
362     }
363   default:
364     break;
365   }
366
367   if (Is64Bit) {
368     if (IsWin64) {
369       if (!HasSSE)
370         return CSR_Win64_NoSSE_SaveList;
371       return CSR_Win64_SaveList;
372     }
373     if (CallsEHReturn)
374       return CSR_64EHRet_SaveList;
375     if (Subtarget.getTargetLowering()->supportSwiftError() &&
376         MF->getFunction()->getAttributes().hasAttrSomewhere(
377             Attribute::SwiftError))
378       return CSR_64_SwiftError_SaveList;
379     return CSR_64_SaveList;
380   }
381   if (CallsEHReturn)
382     return CSR_32EHRet_SaveList;
383   return CSR_32_SaveList;
384 }
385
386 const MCPhysReg *X86RegisterInfo::getCalleeSavedRegsViaCopy(
387     const MachineFunction *MF) const {
388   assert(MF && "Invalid MachineFunction pointer.");
389   if (MF->getFunction()->getCallingConv() == CallingConv::CXX_FAST_TLS &&
390       MF->getInfo<X86MachineFunctionInfo>()->isSplitCSR())
391     return CSR_64_CXX_TLS_Darwin_ViaCopy_SaveList;
392   return nullptr;
393 }
394
395 const uint32_t *
396 X86RegisterInfo::getCallPreservedMask(const MachineFunction &MF,
397                                       CallingConv::ID CC) const {
398   const X86Subtarget &Subtarget = MF.getSubtarget<X86Subtarget>();
399   bool HasSSE = Subtarget.hasSSE1();
400   bool HasAVX = Subtarget.hasAVX();
401   bool HasAVX512 = Subtarget.hasAVX512();
402
403   switch (CC) {
404   case CallingConv::GHC:
405   case CallingConv::HiPE:
406     return CSR_NoRegs_RegMask;
407   case CallingConv::AnyReg:
408     if (HasAVX)
409       return CSR_64_AllRegs_AVX_RegMask;
410     return CSR_64_AllRegs_RegMask;
411   case CallingConv::PreserveMost:
412     return CSR_64_RT_MostRegs_RegMask;
413   case CallingConv::PreserveAll:
414     if (HasAVX)
415       return CSR_64_RT_AllRegs_AVX_RegMask;
416     return CSR_64_RT_AllRegs_RegMask;
417   case CallingConv::CXX_FAST_TLS:
418     if (Is64Bit)
419       return CSR_64_TLS_Darwin_RegMask;
420     break;
421   case CallingConv::Intel_OCL_BI: {
422     if (HasAVX512 && IsWin64)
423       return CSR_Win64_Intel_OCL_BI_AVX512_RegMask;
424     if (HasAVX512 && Is64Bit)
425       return CSR_64_Intel_OCL_BI_AVX512_RegMask;
426     if (HasAVX && IsWin64)
427       return CSR_Win64_Intel_OCL_BI_AVX_RegMask;
428     if (HasAVX && Is64Bit)
429       return CSR_64_Intel_OCL_BI_AVX_RegMask;
430     if (!HasAVX && !IsWin64 && Is64Bit)
431       return CSR_64_Intel_OCL_BI_RegMask;
432     break;
433   }
434   case CallingConv::HHVM:
435     return CSR_64_HHVM_RegMask;
436   case CallingConv::X86_RegCall:
437     if (Is64Bit) {
438       if (IsWin64) {
439         return (HasSSE ? CSR_Win64_RegCall_RegMask :
440                          CSR_Win64_RegCall_NoSSE_RegMask);
441       } else {
442         return (HasSSE ? CSR_SysV64_RegCall_RegMask :
443                          CSR_SysV64_RegCall_NoSSE_RegMask);
444       }
445     } else {
446       return (HasSSE ? CSR_32_RegCall_RegMask :
447                        CSR_32_RegCall_NoSSE_RegMask);
448     }
449   case CallingConv::Cold:
450     if (Is64Bit)
451       return CSR_64_MostRegs_RegMask;
452     break;
453   case CallingConv::Win64:
454     return CSR_Win64_RegMask;
455   case CallingConv::X86_64_SysV:
456     return CSR_64_RegMask;
457   case CallingConv::X86_INTR:
458     if (Is64Bit) {
459       if (HasAVX512)
460         return CSR_64_AllRegs_AVX512_RegMask;
461       if (HasAVX)
462         return CSR_64_AllRegs_AVX_RegMask;
463       if (HasSSE)
464         return CSR_64_AllRegs_RegMask;
465       return CSR_64_AllRegs_NoSSE_RegMask;
466     } else {
467       if (HasAVX512)
468         return CSR_32_AllRegs_AVX512_RegMask;
469       if (HasAVX)
470         return CSR_32_AllRegs_AVX_RegMask;
471       if (HasSSE)
472         return CSR_32_AllRegs_SSE_RegMask;
473       return CSR_32_AllRegs_RegMask;
474     }
475   default:
476     break;
477   }
478
479   // Unlike getCalleeSavedRegs(), we don't have MMI so we can't check
480   // callsEHReturn().
481   if (Is64Bit) {
482     if (IsWin64)
483       return CSR_Win64_RegMask;
484     if (Subtarget.getTargetLowering()->supportSwiftError() &&
485         MF.getFunction()->getAttributes().hasAttrSomewhere(
486             Attribute::SwiftError))
487       return CSR_64_SwiftError_RegMask;
488     return CSR_64_RegMask;
489   }
490   return CSR_32_RegMask;
491 }
492
493 const uint32_t*
494 X86RegisterInfo::getNoPreservedMask() const {
495   return CSR_NoRegs_RegMask;
496 }
497
498 const uint32_t *X86RegisterInfo::getDarwinTLSCallPreservedMask() const {
499   return CSR_64_TLS_Darwin_RegMask;
500 }
501
502 BitVector X86RegisterInfo::getReservedRegs(const MachineFunction &MF) const {
503   BitVector Reserved(getNumRegs());
504   const X86FrameLowering *TFI = getFrameLowering(MF);
505
506   // Set the stack-pointer register and its aliases as reserved.
507   for (MCSubRegIterator I(X86::RSP, this, /*IncludeSelf=*/true); I.isValid();
508        ++I)
509     Reserved.set(*I);
510
511   // Set the instruction pointer register and its aliases as reserved.
512   for (MCSubRegIterator I(X86::RIP, this, /*IncludeSelf=*/true); I.isValid();
513        ++I)
514     Reserved.set(*I);
515
516   // Set the frame-pointer register and its aliases as reserved if needed.
517   if (TFI->hasFP(MF)) {
518     for (MCSubRegIterator I(X86::RBP, this, /*IncludeSelf=*/true); I.isValid();
519          ++I)
520       Reserved.set(*I);
521   }
522
523   // Set the base-pointer register and its aliases as reserved if needed.
524   if (hasBasePointer(MF)) {
525     CallingConv::ID CC = MF.getFunction()->getCallingConv();
526     const uint32_t *RegMask = getCallPreservedMask(MF, CC);
527     if (MachineOperand::clobbersPhysReg(RegMask, getBaseRegister()))
528       report_fatal_error(
529         "Stack realignment in presence of dynamic allocas is not supported with"
530         "this calling convention.");
531
532     unsigned BasePtr = getX86SubSuperRegister(getBaseRegister(), 64);
533     for (MCSubRegIterator I(BasePtr, this, /*IncludeSelf=*/true);
534          I.isValid(); ++I)
535       Reserved.set(*I);
536   }
537
538   // Mark the segment registers as reserved.
539   Reserved.set(X86::CS);
540   Reserved.set(X86::SS);
541   Reserved.set(X86::DS);
542   Reserved.set(X86::ES);
543   Reserved.set(X86::FS);
544   Reserved.set(X86::GS);
545
546   // Mark the floating point stack registers as reserved.
547   for (unsigned n = 0; n != 8; ++n)
548     Reserved.set(X86::ST0 + n);
549
550   // Reserve the registers that only exist in 64-bit mode.
551   if (!Is64Bit) {
552     // These 8-bit registers are part of the x86-64 extension even though their
553     // super-registers are old 32-bits.
554     Reserved.set(X86::SIL);
555     Reserved.set(X86::DIL);
556     Reserved.set(X86::BPL);
557     Reserved.set(X86::SPL);
558
559     for (unsigned n = 0; n != 8; ++n) {
560       // R8, R9, ...
561       for (MCRegAliasIterator AI(X86::R8 + n, this, true); AI.isValid(); ++AI)
562         Reserved.set(*AI);
563
564       // XMM8, XMM9, ...
565       for (MCRegAliasIterator AI(X86::XMM8 + n, this, true); AI.isValid(); ++AI)
566         Reserved.set(*AI);
567     }
568   }
569   if (!Is64Bit || !MF.getSubtarget<X86Subtarget>().hasAVX512()) {
570     for (unsigned n = 16; n != 32; ++n) {
571       for (MCRegAliasIterator AI(X86::XMM0 + n, this, true); AI.isValid(); ++AI)
572         Reserved.set(*AI);
573     }
574   }
575
576   assert(checkAllSuperRegsMarked(Reserved,
577                                  {X86::SIL, X86::DIL, X86::BPL, X86::SPL}));
578   return Reserved;
579 }
580
581 void X86RegisterInfo::adjustStackMapLiveOutMask(uint32_t *Mask) const {
582   // Check if the EFLAGS register is marked as live-out. This shouldn't happen,
583   // because the calling convention defines the EFLAGS register as NOT
584   // preserved.
585   //
586   // Unfortunatelly the EFLAGS show up as live-out after branch folding. Adding
587   // an assert to track this and clear the register afterwards to avoid
588   // unnecessary crashes during release builds.
589   assert(!(Mask[X86::EFLAGS / 32] & (1U << (X86::EFLAGS % 32))) &&
590          "EFLAGS are not live-out from a patchpoint.");
591
592   // Also clean other registers that don't need preserving (IP).
593   for (auto Reg : {X86::EFLAGS, X86::RIP, X86::EIP, X86::IP})
594     Mask[Reg / 32] &= ~(1U << (Reg % 32));
595 }
596
597 //===----------------------------------------------------------------------===//
598 // Stack Frame Processing methods
599 //===----------------------------------------------------------------------===//
600
601 static bool CantUseSP(const MachineFrameInfo &MFI) {
602   return MFI.hasVarSizedObjects() || MFI.hasOpaqueSPAdjustment();
603 }
604
605 bool X86RegisterInfo::hasBasePointer(const MachineFunction &MF) const {
606    const MachineFrameInfo &MFI = MF.getFrameInfo();
607
608    if (!EnableBasePointer)
609      return false;
610
611    // When we need stack realignment, we can't address the stack from the frame
612    // pointer.  When we have dynamic allocas or stack-adjusting inline asm, we
613    // can't address variables from the stack pointer.  MS inline asm can
614    // reference locals while also adjusting the stack pointer.  When we can't
615    // use both the SP and the FP, we need a separate base pointer register.
616    bool CantUseFP = needsStackRealignment(MF);
617    return CantUseFP && CantUseSP(MFI);
618 }
619
620 bool X86RegisterInfo::canRealignStack(const MachineFunction &MF) const {
621   if (!TargetRegisterInfo::canRealignStack(MF))
622     return false;
623
624   const MachineFrameInfo &MFI = MF.getFrameInfo();
625   const MachineRegisterInfo *MRI = &MF.getRegInfo();
626
627   // Stack realignment requires a frame pointer.  If we already started
628   // register allocation with frame pointer elimination, it is too late now.
629   if (!MRI->canReserveReg(FramePtr))
630     return false;
631
632   // If a base pointer is necessary.  Check that it isn't too late to reserve
633   // it.
634   if (CantUseSP(MFI))
635     return MRI->canReserveReg(BasePtr);
636   return true;
637 }
638
639 bool X86RegisterInfo::hasReservedSpillSlot(const MachineFunction &MF,
640                                            unsigned Reg, int &FrameIdx) const {
641   // Since X86 defines assignCalleeSavedSpillSlots which always return true
642   // this function neither used nor tested.
643   llvm_unreachable("Unused function on X86. Otherwise need a test case.");
644 }
645
646 // tryOptimizeLEAtoMOV - helper function that tries to replace a LEA instruction
647 // of the form 'lea (%esp), %ebx' --> 'mov %esp, %ebx'.
648 // TODO: In this case we should be really trying first to entirely eliminate
649 // this instruction which is a plain copy.
650 static bool tryOptimizeLEAtoMOV(MachineBasicBlock::iterator II) {
651   MachineInstr &MI = *II;
652   unsigned Opc = II->getOpcode();
653   // Check if this is a LEA of the form 'lea (%esp), %ebx'
654   if ((Opc != X86::LEA32r && Opc != X86::LEA64r && Opc != X86::LEA64_32r) ||
655       MI.getOperand(2).getImm() != 1 ||
656       MI.getOperand(3).getReg() != X86::NoRegister ||
657       MI.getOperand(4).getImm() != 0 ||
658       MI.getOperand(5).getReg() != X86::NoRegister)
659     return false;
660   unsigned BasePtr = MI.getOperand(1).getReg();
661   // In X32 mode, ensure the base-pointer is a 32-bit operand, so the LEA will
662   // be replaced with a 32-bit operand MOV which will zero extend the upper
663   // 32-bits of the super register.
664   if (Opc == X86::LEA64_32r)
665     BasePtr = getX86SubSuperRegister(BasePtr, 32);
666   unsigned NewDestReg = MI.getOperand(0).getReg();
667   const X86InstrInfo *TII =
668       MI.getParent()->getParent()->getSubtarget<X86Subtarget>().getInstrInfo();
669   TII->copyPhysReg(*MI.getParent(), II, MI.getDebugLoc(), NewDestReg, BasePtr,
670                    MI.getOperand(1).isKill());
671   MI.eraseFromParent();
672   return true;
673 }
674
675 void
676 X86RegisterInfo::eliminateFrameIndex(MachineBasicBlock::iterator II,
677                                      int SPAdj, unsigned FIOperandNum,
678                                      RegScavenger *RS) const {
679   MachineInstr &MI = *II;
680   MachineFunction &MF = *MI.getParent()->getParent();
681   const X86FrameLowering *TFI = getFrameLowering(MF);
682   int FrameIndex = MI.getOperand(FIOperandNum).getIndex();
683
684   // Determine base register and offset.
685   int FIOffset;
686   unsigned BasePtr;
687   if (MI.isReturn()) {
688     assert((!needsStackRealignment(MF) ||
689            MF.getFrameInfo().isFixedObjectIndex(FrameIndex)) &&
690            "Return instruction can only reference SP relative frame objects");
691     FIOffset = TFI->getFrameIndexReferenceSP(MF, FrameIndex, BasePtr, 0);
692   } else {
693     FIOffset = TFI->getFrameIndexReference(MF, FrameIndex, BasePtr);
694   }
695
696   // LOCAL_ESCAPE uses a single offset, with no register. It only works in the
697   // simple FP case, and doesn't work with stack realignment. On 32-bit, the
698   // offset is from the traditional base pointer location.  On 64-bit, the
699   // offset is from the SP at the end of the prologue, not the FP location. This
700   // matches the behavior of llvm.frameaddress.
701   unsigned Opc = MI.getOpcode();
702   if (Opc == TargetOpcode::LOCAL_ESCAPE) {
703     MachineOperand &FI = MI.getOperand(FIOperandNum);
704     FI.ChangeToImmediate(FIOffset);
705     return;
706   }
707
708   // For LEA64_32r when BasePtr is 32-bits (X32) we can use full-size 64-bit
709   // register as source operand, semantic is the same and destination is
710   // 32-bits. It saves one byte per lea in code since 0x67 prefix is avoided.
711   // Don't change BasePtr since it is used later for stack adjustment.
712   unsigned MachineBasePtr = BasePtr;
713   if (Opc == X86::LEA64_32r && X86::GR32RegClass.contains(BasePtr))
714     MachineBasePtr = getX86SubSuperRegister(BasePtr, 64);
715
716   // This must be part of a four operand memory reference.  Replace the
717   // FrameIndex with base register.  Add an offset to the offset.
718   MI.getOperand(FIOperandNum).ChangeToRegister(MachineBasePtr, false);
719
720   if (BasePtr == StackPtr)
721     FIOffset += SPAdj;
722
723   // The frame index format for stackmaps and patchpoints is different from the
724   // X86 format. It only has a FI and an offset.
725   if (Opc == TargetOpcode::STACKMAP || Opc == TargetOpcode::PATCHPOINT) {
726     assert(BasePtr == FramePtr && "Expected the FP as base register");
727     int64_t Offset = MI.getOperand(FIOperandNum + 1).getImm() + FIOffset;
728     MI.getOperand(FIOperandNum + 1).ChangeToImmediate(Offset);
729     return;
730   }
731
732   if (MI.getOperand(FIOperandNum+3).isImm()) {
733     // Offset is a 32-bit integer.
734     int Imm = (int)(MI.getOperand(FIOperandNum + 3).getImm());
735     int Offset = FIOffset + Imm;
736     assert((!Is64Bit || isInt<32>((long long)FIOffset + Imm)) &&
737            "Requesting 64-bit offset in 32-bit immediate!");
738     if (Offset != 0 || !tryOptimizeLEAtoMOV(II))
739       MI.getOperand(FIOperandNum + 3).ChangeToImmediate(Offset);
740   } else {
741     // Offset is symbolic. This is extremely rare.
742     uint64_t Offset = FIOffset +
743       (uint64_t)MI.getOperand(FIOperandNum+3).getOffset();
744     MI.getOperand(FIOperandNum + 3).setOffset(Offset);
745   }
746 }
747
748 unsigned X86RegisterInfo::getFrameRegister(const MachineFunction &MF) const {
749   const X86FrameLowering *TFI = getFrameLowering(MF);
750   return TFI->hasFP(MF) ? FramePtr : StackPtr;
751 }
752
753 unsigned
754 X86RegisterInfo::getPtrSizedFrameRegister(const MachineFunction &MF) const {
755   const X86Subtarget &Subtarget = MF.getSubtarget<X86Subtarget>();
756   unsigned FrameReg = getFrameRegister(MF);
757   if (Subtarget.isTarget64BitILP32())
758     FrameReg = getX86SubSuperRegister(FrameReg, 32);
759   return FrameReg;
760 }