]> CyberLeo.Net >> Repos - FreeBSD/FreeBSD.git/blob - contrib/llvm-project/llvm/lib/Target/X86/X86InstrInfo.td
zfs: merge openzfs/zfs@ef83e07db (zfs-2.1-release) into stable/13
[FreeBSD/FreeBSD.git] / contrib / llvm-project / llvm / lib / Target / X86 / X86InstrInfo.td
1 //===-- X86InstrInfo.td - Main X86 Instruction Definition --*- tablegen -*-===//
2 //
3 // Part of the LLVM Project, under the Apache License v2.0 with LLVM Exceptions.
4 // See https://llvm.org/LICENSE.txt for license information.
5 // SPDX-License-Identifier: Apache-2.0 WITH LLVM-exception
6 //
7 //===----------------------------------------------------------------------===//
8 //
9 // This file describes the X86 instruction set, defining the instructions, and
10 // properties of the instructions which are needed for code generation, machine
11 // code emission, and analysis.
12 //
13 //===----------------------------------------------------------------------===//
14
15 //===----------------------------------------------------------------------===//
16 // X86 specific DAG Nodes.
17 //
18
19 def SDTX86CmpTest : SDTypeProfile<1, 2, [SDTCisVT<0, i32>, SDTCisInt<1>,
20                                          SDTCisSameAs<1, 2>]>;
21 def SDTX86FCmp    : SDTypeProfile<1, 2, [SDTCisVT<0, i32>, SDTCisFP<1>,
22                                          SDTCisSameAs<1, 2>]>;
23
24 def SDTX86Cmov    : SDTypeProfile<1, 4,
25                                   [SDTCisSameAs<0, 1>, SDTCisSameAs<1, 2>,
26                                    SDTCisVT<3, i8>, SDTCisVT<4, i32>]>;
27
28 // Unary and binary operator instructions that set EFLAGS as a side-effect.
29 def SDTUnaryArithWithFlags : SDTypeProfile<2, 1,
30                                            [SDTCisSameAs<0, 2>,
31                                             SDTCisInt<0>, SDTCisVT<1, i32>]>;
32
33 def SDTBinaryArithWithFlags : SDTypeProfile<2, 2,
34                                             [SDTCisSameAs<0, 2>,
35                                              SDTCisSameAs<0, 3>,
36                                              SDTCisInt<0>, SDTCisVT<1, i32>]>;
37
38 // SDTBinaryArithWithFlagsInOut - RES1, EFLAGS = op LHS, RHS, EFLAGS
39 def SDTBinaryArithWithFlagsInOut : SDTypeProfile<2, 3,
40                                             [SDTCisSameAs<0, 2>,
41                                              SDTCisSameAs<0, 3>,
42                                              SDTCisInt<0>,
43                                              SDTCisVT<1, i32>,
44                                              SDTCisVT<4, i32>]>;
45 // RES1, RES2, FLAGS = op LHS, RHS
46 def SDT2ResultBinaryArithWithFlags : SDTypeProfile<3, 2,
47                                             [SDTCisSameAs<0, 1>,
48                                              SDTCisSameAs<0, 2>,
49                                              SDTCisSameAs<0, 3>,
50                                              SDTCisInt<0>, SDTCisVT<1, i32>]>;
51 def SDTX86BrCond  : SDTypeProfile<0, 3,
52                                   [SDTCisVT<0, OtherVT>,
53                                    SDTCisVT<1, i8>, SDTCisVT<2, i32>]>;
54
55 def SDTX86SetCC   : SDTypeProfile<1, 2,
56                                   [SDTCisVT<0, i8>,
57                                    SDTCisVT<1, i8>, SDTCisVT<2, i32>]>;
58 def SDTX86SetCC_C : SDTypeProfile<1, 2,
59                                   [SDTCisInt<0>,
60                                    SDTCisVT<1, i8>, SDTCisVT<2, i32>]>;
61
62 def SDTX86sahf : SDTypeProfile<1, 1, [SDTCisVT<0, i32>, SDTCisVT<1, i8>]>;
63
64 def SDTX86rdrand : SDTypeProfile<2, 0, [SDTCisInt<0>, SDTCisVT<1, i32>]>;
65
66 def SDTX86rdpkru : SDTypeProfile<1, 1, [SDTCisVT<0, i32>, SDTCisVT<1, i32>]>;
67 def SDTX86wrpkru : SDTypeProfile<0, 3, [SDTCisVT<0, i32>, SDTCisVT<1, i32>,
68                                         SDTCisVT<2, i32>]>;
69
70 def SDTX86cas : SDTypeProfile<0, 3, [SDTCisPtrTy<0>, SDTCisInt<1>,
71                                      SDTCisVT<2, i8>]>;
72 def SDTX86cas8pair : SDTypeProfile<0, 1, [SDTCisPtrTy<0>]>;
73 def SDTX86cas16pair : SDTypeProfile<0, 2, [SDTCisPtrTy<0>, SDTCisVT<1, i64>]>;
74
75 def SDTLockBinaryArithWithFlags : SDTypeProfile<1, 2, [SDTCisVT<0, i32>,
76                                                        SDTCisPtrTy<1>,
77                                                        SDTCisInt<2>]>;
78
79 def SDTLockUnaryArithWithFlags : SDTypeProfile<1, 1, [SDTCisVT<0, i32>,
80                                                       SDTCisPtrTy<1>]>;
81
82 def SDTX86Ret     : SDTypeProfile<0, -1, [SDTCisVT<0, i32>]>;
83
84 def SDT_X86CallSeqStart : SDCallSeqStart<[SDTCisVT<0, i32>,
85                                           SDTCisVT<1, i32>]>;
86 def SDT_X86CallSeqEnd   : SDCallSeqEnd<[SDTCisVT<0, i32>,
87                                         SDTCisVT<1, i32>]>;
88
89 def SDT_X86Call   : SDTypeProfile<0, -1, [SDTCisVT<0, iPTR>]>;
90
91 def SDT_X86NtBrind : SDTypeProfile<0, -1, [SDTCisVT<0, iPTR>]>;
92
93 def SDT_X86VASTART_SAVE_XMM_REGS : SDTypeProfile<0, -1, [SDTCisVT<0, i8>,
94                                                          SDTCisVT<1, iPTR>,
95                                                          SDTCisVT<2, iPTR>]>;
96
97 def SDT_X86VAARG : SDTypeProfile<1, -1, [SDTCisPtrTy<0>,
98                                          SDTCisPtrTy<1>,
99                                          SDTCisVT<2, i32>,
100                                          SDTCisVT<3, i8>,
101                                          SDTCisVT<4, i32>]>;
102
103 def SDTX86RepStr  : SDTypeProfile<0, 1, [SDTCisVT<0, OtherVT>]>;
104
105 def SDTX86Void    : SDTypeProfile<0, 0, []>;
106
107 def SDTX86Wrapper : SDTypeProfile<1, 1, [SDTCisSameAs<0, 1>, SDTCisPtrTy<0>]>;
108
109 def SDT_X86TLSADDR : SDTypeProfile<0, 1, [SDTCisInt<0>]>;
110
111 def SDT_X86TLSBASEADDR : SDTypeProfile<0, 1, [SDTCisInt<0>]>;
112
113 def SDT_X86TLSCALL : SDTypeProfile<0, 1, [SDTCisInt<0>]>;
114
115 def SDT_X86WIN_ALLOCA : SDTypeProfile<0, 1, [SDTCisVT<0, iPTR>]>;
116
117 def SDT_X86SEG_ALLOCA : SDTypeProfile<1, 1, [SDTCisVT<0, iPTR>, SDTCisVT<1, iPTR>]>;
118
119 def SDT_X86PROBED_ALLOCA : SDTypeProfile<1, 1, [SDTCisVT<0, iPTR>, SDTCisVT<1, iPTR>]>;
120
121 def SDT_X86EHRET : SDTypeProfile<0, 1, [SDTCisInt<0>]>;
122
123 def SDT_X86TCRET : SDTypeProfile<0, 2, [SDTCisPtrTy<0>, SDTCisVT<1, i32>]>;
124
125 def SDT_X86MEMBARRIER : SDTypeProfile<0, 0, []>;
126
127 def SDT_X86ENQCMD : SDTypeProfile<1, 2, [SDTCisVT<0, i32>,
128                                          SDTCisPtrTy<1>, SDTCisSameAs<1, 2>]>;
129
130 def SDT_X86AESENCDECKL : SDTypeProfile<2, 2, [SDTCisVT<0, v2i64>,
131                                               SDTCisVT<1, i32>,
132                                               SDTCisVT<2, v2i64>,
133                                               SDTCisPtrTy<3>]>;
134
135 def X86MemBarrier : SDNode<"X86ISD::MEMBARRIER", SDT_X86MEMBARRIER,
136                             [SDNPHasChain,SDNPSideEffect]>;
137 def X86MFence : SDNode<"X86ISD::MFENCE", SDT_X86MEMBARRIER,
138                         [SDNPHasChain]>;
139
140
141 def X86bsf     : SDNode<"X86ISD::BSF",      SDTUnaryArithWithFlags>;
142 def X86bsr     : SDNode<"X86ISD::BSR",      SDTUnaryArithWithFlags>;
143 def X86fshl    : SDNode<"X86ISD::FSHL",     SDTIntShiftDOp>;
144 def X86fshr    : SDNode<"X86ISD::FSHR",     SDTIntShiftDOp>;
145
146 def X86cmp     : SDNode<"X86ISD::CMP" ,     SDTX86CmpTest>;
147 def X86fcmp    : SDNode<"X86ISD::FCMP",     SDTX86FCmp>;
148 def X86strict_fcmp : SDNode<"X86ISD::STRICT_FCMP", SDTX86FCmp, [SDNPHasChain]>;
149 def X86strict_fcmps : SDNode<"X86ISD::STRICT_FCMPS", SDTX86FCmp, [SDNPHasChain]>;
150 def X86bt      : SDNode<"X86ISD::BT",       SDTX86CmpTest>;
151
152 def X86cmov    : SDNode<"X86ISD::CMOV",     SDTX86Cmov>;
153 def X86brcond  : SDNode<"X86ISD::BRCOND",   SDTX86BrCond,
154                         [SDNPHasChain]>;
155 def X86setcc   : SDNode<"X86ISD::SETCC",    SDTX86SetCC>;
156 def X86setcc_c : SDNode<"X86ISD::SETCC_CARRY", SDTX86SetCC_C>;
157
158 def X86rdrand  : SDNode<"X86ISD::RDRAND",   SDTX86rdrand,
159                         [SDNPHasChain, SDNPSideEffect]>;
160
161 def X86rdseed  : SDNode<"X86ISD::RDSEED",   SDTX86rdrand,
162                         [SDNPHasChain, SDNPSideEffect]>;
163
164 def X86rdpkru : SDNode<"X86ISD::RDPKRU",    SDTX86rdpkru,
165                        [SDNPHasChain, SDNPSideEffect]>;
166 def X86wrpkru : SDNode<"X86ISD::WRPKRU",    SDTX86wrpkru,
167                        [SDNPHasChain, SDNPSideEffect]>;
168
169 def X86cas : SDNode<"X86ISD::LCMPXCHG_DAG", SDTX86cas,
170                         [SDNPHasChain, SDNPInGlue, SDNPOutGlue, SDNPMayStore,
171                          SDNPMayLoad, SDNPMemOperand]>;
172 def X86cas8 : SDNode<"X86ISD::LCMPXCHG8_DAG", SDTX86cas8pair,
173                         [SDNPHasChain, SDNPInGlue, SDNPOutGlue, SDNPMayStore,
174                          SDNPMayLoad, SDNPMemOperand]>;
175 def X86cas16 : SDNode<"X86ISD::LCMPXCHG16_DAG", SDTX86cas16pair,
176                         [SDNPHasChain, SDNPInGlue, SDNPOutGlue, SDNPMayStore,
177                          SDNPMayLoad, SDNPMemOperand]>;
178
179 def X86retflag : SDNode<"X86ISD::RET_FLAG", SDTX86Ret,
180                         [SDNPHasChain, SDNPOptInGlue, SDNPVariadic]>;
181 def X86iret : SDNode<"X86ISD::IRET", SDTX86Ret,
182                         [SDNPHasChain, SDNPOptInGlue]>;
183
184 def X86vastart_save_xmm_regs :
185                  SDNode<"X86ISD::VASTART_SAVE_XMM_REGS",
186                         SDT_X86VASTART_SAVE_XMM_REGS,
187                         [SDNPHasChain, SDNPVariadic]>;
188 def X86vaarg64 :
189                  SDNode<"X86ISD::VAARG_64", SDT_X86VAARG,
190                         [SDNPHasChain, SDNPMayLoad, SDNPMayStore,
191                          SDNPMemOperand]>;
192 def X86vaargx32 :
193                  SDNode<"X86ISD::VAARG_X32", SDT_X86VAARG,
194                         [SDNPHasChain, SDNPMayLoad, SDNPMayStore,
195                          SDNPMemOperand]>;
196 def X86callseq_start :
197                  SDNode<"ISD::CALLSEQ_START", SDT_X86CallSeqStart,
198                         [SDNPHasChain, SDNPOutGlue]>;
199 def X86callseq_end :
200                  SDNode<"ISD::CALLSEQ_END",   SDT_X86CallSeqEnd,
201                         [SDNPHasChain, SDNPOptInGlue, SDNPOutGlue]>;
202
203 def X86call    : SDNode<"X86ISD::CALL",     SDT_X86Call,
204                         [SDNPHasChain, SDNPOutGlue, SDNPOptInGlue,
205                          SDNPVariadic]>;
206
207 def X86call_rvmarker  : SDNode<"X86ISD::CALL_RVMARKER",     SDT_X86Call,
208                         [SDNPHasChain, SDNPOutGlue, SDNPOptInGlue,
209                          SDNPVariadic]>;
210
211
212 def X86NoTrackCall : SDNode<"X86ISD::NT_CALL", SDT_X86Call,
213                             [SDNPHasChain, SDNPOutGlue, SDNPOptInGlue,
214                              SDNPVariadic]>;
215 def X86NoTrackBrind : SDNode<"X86ISD::NT_BRIND", SDT_X86NtBrind,
216                              [SDNPHasChain]>;
217
218 def X86rep_stos: SDNode<"X86ISD::REP_STOS", SDTX86RepStr,
219                         [SDNPHasChain, SDNPInGlue, SDNPOutGlue, SDNPMayStore]>;
220 def X86rep_movs: SDNode<"X86ISD::REP_MOVS", SDTX86RepStr,
221                         [SDNPHasChain, SDNPInGlue, SDNPOutGlue, SDNPMayStore,
222                          SDNPMayLoad]>;
223
224 def X86Wrapper    : SDNode<"X86ISD::Wrapper",     SDTX86Wrapper>;
225 def X86WrapperRIP : SDNode<"X86ISD::WrapperRIP",  SDTX86Wrapper>;
226
227 def X86RecoverFrameAlloc : SDNode<"ISD::LOCAL_RECOVER",
228                                   SDTypeProfile<1, 1, [SDTCisSameAs<0, 1>,
229                                                        SDTCisInt<1>]>>;
230
231 def X86tlsaddr : SDNode<"X86ISD::TLSADDR", SDT_X86TLSADDR,
232                         [SDNPHasChain, SDNPOptInGlue, SDNPOutGlue]>;
233
234 def X86tlsbaseaddr : SDNode<"X86ISD::TLSBASEADDR", SDT_X86TLSBASEADDR,
235                         [SDNPHasChain, SDNPOptInGlue, SDNPOutGlue]>;
236
237 def X86ehret : SDNode<"X86ISD::EH_RETURN", SDT_X86EHRET,
238                         [SDNPHasChain]>;
239
240 def X86eh_sjlj_setjmp  : SDNode<"X86ISD::EH_SJLJ_SETJMP",
241                                 SDTypeProfile<1, 1, [SDTCisInt<0>,
242                                                      SDTCisPtrTy<1>]>,
243                                 [SDNPHasChain, SDNPSideEffect]>;
244 def X86eh_sjlj_longjmp : SDNode<"X86ISD::EH_SJLJ_LONGJMP",
245                                 SDTypeProfile<0, 1, [SDTCisPtrTy<0>]>,
246                                 [SDNPHasChain, SDNPSideEffect]>;
247 def X86eh_sjlj_setup_dispatch : SDNode<"X86ISD::EH_SJLJ_SETUP_DISPATCH",
248                                        SDTypeProfile<0, 0, []>,
249                                        [SDNPHasChain, SDNPSideEffect]>;
250
251 def X86tcret : SDNode<"X86ISD::TC_RETURN", SDT_X86TCRET,
252                         [SDNPHasChain,  SDNPOptInGlue, SDNPVariadic]>;
253
254 def X86add_flag  : SDNode<"X86ISD::ADD",  SDTBinaryArithWithFlags,
255                           [SDNPCommutative]>;
256 def X86sub_flag  : SDNode<"X86ISD::SUB",  SDTBinaryArithWithFlags>;
257 def X86smul_flag : SDNode<"X86ISD::SMUL", SDTBinaryArithWithFlags,
258                           [SDNPCommutative]>;
259 def X86umul_flag : SDNode<"X86ISD::UMUL", SDT2ResultBinaryArithWithFlags,
260                           [SDNPCommutative]>;
261 def X86adc_flag  : SDNode<"X86ISD::ADC",  SDTBinaryArithWithFlagsInOut>;
262 def X86sbb_flag  : SDNode<"X86ISD::SBB",  SDTBinaryArithWithFlagsInOut>;
263
264 def X86or_flag   : SDNode<"X86ISD::OR",   SDTBinaryArithWithFlags,
265                           [SDNPCommutative]>;
266 def X86xor_flag  : SDNode<"X86ISD::XOR",  SDTBinaryArithWithFlags,
267                           [SDNPCommutative]>;
268 def X86and_flag  : SDNode<"X86ISD::AND",  SDTBinaryArithWithFlags,
269                           [SDNPCommutative]>;
270
271 def X86lock_add  : SDNode<"X86ISD::LADD",  SDTLockBinaryArithWithFlags,
272                           [SDNPHasChain, SDNPMayStore, SDNPMayLoad,
273                            SDNPMemOperand]>;
274 def X86lock_sub  : SDNode<"X86ISD::LSUB",  SDTLockBinaryArithWithFlags,
275                           [SDNPHasChain, SDNPMayStore, SDNPMayLoad,
276                            SDNPMemOperand]>;
277 def X86lock_or  : SDNode<"X86ISD::LOR",  SDTLockBinaryArithWithFlags,
278                          [SDNPHasChain, SDNPMayStore, SDNPMayLoad,
279                           SDNPMemOperand]>;
280 def X86lock_xor  : SDNode<"X86ISD::LXOR",  SDTLockBinaryArithWithFlags,
281                           [SDNPHasChain, SDNPMayStore, SDNPMayLoad,
282                            SDNPMemOperand]>;
283 def X86lock_and  : SDNode<"X86ISD::LAND",  SDTLockBinaryArithWithFlags,
284                           [SDNPHasChain, SDNPMayStore, SDNPMayLoad,
285                            SDNPMemOperand]>;
286
287 def X86bextr  : SDNode<"X86ISD::BEXTR",  SDTIntBinOp>;
288 def X86bextri : SDNode<"X86ISD::BEXTRI", SDTIntBinOp>;
289
290 def X86bzhi   : SDNode<"X86ISD::BZHI",   SDTIntBinOp>;
291
292 def X86pdep   : SDNode<"X86ISD::PDEP",   SDTIntBinOp>;
293 def X86pext   : SDNode<"X86ISD::PEXT",   SDTIntBinOp>;
294
295 def X86mul_imm : SDNode<"X86ISD::MUL_IMM", SDTIntBinOp>;
296
297 def X86WinAlloca : SDNode<"X86ISD::WIN_ALLOCA", SDT_X86WIN_ALLOCA,
298                           [SDNPHasChain, SDNPOutGlue]>;
299
300 def X86SegAlloca : SDNode<"X86ISD::SEG_ALLOCA", SDT_X86SEG_ALLOCA,
301                           [SDNPHasChain]>;
302
303 def X86ProbedAlloca : SDNode<"X86ISD::PROBED_ALLOCA", SDT_X86PROBED_ALLOCA,
304                           [SDNPHasChain]>;
305
306 def X86TLSCall : SDNode<"X86ISD::TLSCALL", SDT_X86TLSCALL,
307                         [SDNPHasChain, SDNPOptInGlue, SDNPOutGlue]>;
308
309 def X86lwpins : SDNode<"X86ISD::LWPINS",
310                        SDTypeProfile<1, 3, [SDTCisVT<0, i32>, SDTCisInt<1>,
311                                             SDTCisVT<2, i32>, SDTCisVT<3, i32>]>,
312                        [SDNPHasChain, SDNPMayStore, SDNPMayLoad, SDNPSideEffect]>;
313
314 def X86umwait : SDNode<"X86ISD::UMWAIT",
315                        SDTypeProfile<1, 3, [SDTCisVT<0, i32>, SDTCisInt<1>,
316                                             SDTCisVT<2, i32>, SDTCisVT<3, i32>]>,
317                        [SDNPHasChain, SDNPSideEffect]>;
318
319 def X86tpause : SDNode<"X86ISD::TPAUSE",
320                        SDTypeProfile<1, 3, [SDTCisVT<0, i32>, SDTCisInt<1>,
321                                             SDTCisVT<2, i32>, SDTCisVT<3, i32>]>,
322                        [SDNPHasChain, SDNPSideEffect]>;
323
324 def X86enqcmd : SDNode<"X86ISD::ENQCMD", SDT_X86ENQCMD,
325                        [SDNPHasChain, SDNPSideEffect]>;
326 def X86enqcmds : SDNode<"X86ISD::ENQCMDS", SDT_X86ENQCMD,
327                        [SDNPHasChain, SDNPSideEffect]>;
328 def X86testui : SDNode<"X86ISD::TESTUI",
329                        SDTypeProfile<1, 0, [SDTCisVT<0, i32>]>,
330                        [SDNPHasChain, SDNPSideEffect]>;
331
332 def X86aesenc128kl : SDNode<"X86ISD::AESENC128KL", SDT_X86AESENCDECKL,
333                             [SDNPHasChain, SDNPMayLoad, SDNPSideEffect,
334                              SDNPMemOperand]>;
335 def X86aesdec128kl : SDNode<"X86ISD::AESDEC128KL", SDT_X86AESENCDECKL,
336                             [SDNPHasChain, SDNPMayLoad, SDNPSideEffect,
337                              SDNPMemOperand]>;
338 def X86aesenc256kl : SDNode<"X86ISD::AESENC256KL", SDT_X86AESENCDECKL,
339                             [SDNPHasChain, SDNPMayLoad, SDNPSideEffect,
340                              SDNPMemOperand]>;
341 def X86aesdec256kl : SDNode<"X86ISD::AESDEC256KL", SDT_X86AESENCDECKL,
342                             [SDNPHasChain, SDNPMayLoad, SDNPSideEffect,
343                              SDNPMemOperand]>;
344
345 //===----------------------------------------------------------------------===//
346 // X86 Operand Definitions.
347 //
348
349 // A version of ptr_rc which excludes SP, ESP, and RSP. This is used for
350 // the index operand of an address, to conform to x86 encoding restrictions.
351 def ptr_rc_nosp : PointerLikeRegClass<1>;
352
353 // *mem - Operand definitions for the funky X86 addressing mode operands.
354 //
355 def X86MemAsmOperand : AsmOperandClass {
356  let Name = "Mem";
357 }
358 let RenderMethod = "addMemOperands", SuperClasses = [X86MemAsmOperand] in {
359   def X86Mem8AsmOperand   : AsmOperandClass { let Name = "Mem8"; }
360   def X86Mem16AsmOperand  : AsmOperandClass { let Name = "Mem16"; }
361   def X86Mem32AsmOperand  : AsmOperandClass { let Name = "Mem32"; }
362   def X86Mem64AsmOperand  : AsmOperandClass { let Name = "Mem64"; }
363   def X86Mem80AsmOperand  : AsmOperandClass { let Name = "Mem80"; }
364   def X86Mem128AsmOperand : AsmOperandClass { let Name = "Mem128"; }
365   def X86Mem256AsmOperand : AsmOperandClass { let Name = "Mem256"; }
366   def X86Mem512AsmOperand : AsmOperandClass { let Name = "Mem512"; }
367   // Gather mem operands
368   def X86Mem64_RC128Operand  : AsmOperandClass { let Name = "Mem64_RC128"; }
369   def X86Mem128_RC128Operand : AsmOperandClass { let Name = "Mem128_RC128"; }
370   def X86Mem256_RC128Operand : AsmOperandClass { let Name = "Mem256_RC128"; }
371   def X86Mem128_RC256Operand : AsmOperandClass { let Name = "Mem128_RC256"; }
372   def X86Mem256_RC256Operand : AsmOperandClass { let Name = "Mem256_RC256"; }
373
374   def X86Mem64_RC128XOperand  : AsmOperandClass { let Name = "Mem64_RC128X"; }
375   def X86Mem128_RC128XOperand : AsmOperandClass { let Name = "Mem128_RC128X"; }
376   def X86Mem256_RC128XOperand : AsmOperandClass { let Name = "Mem256_RC128X"; }
377   def X86Mem128_RC256XOperand : AsmOperandClass { let Name = "Mem128_RC256X"; }
378   def X86Mem256_RC256XOperand : AsmOperandClass { let Name = "Mem256_RC256X"; }
379   def X86Mem512_RC256XOperand : AsmOperandClass { let Name = "Mem512_RC256X"; }
380   def X86Mem256_RC512Operand  : AsmOperandClass { let Name = "Mem256_RC512"; }
381   def X86Mem512_RC512Operand  : AsmOperandClass { let Name = "Mem512_RC512"; }
382
383   def X86SibMemOperand : AsmOperandClass { let Name = "SibMem"; }
384 }
385
386 def X86AbsMemAsmOperand : AsmOperandClass {
387   let Name = "AbsMem";
388   let SuperClasses = [X86MemAsmOperand];
389 }
390
391 class X86MemOperand<string printMethod,
392           AsmOperandClass parserMatchClass = X86MemAsmOperand> : Operand<iPTR> {
393   let PrintMethod = printMethod;
394   let MIOperandInfo = (ops ptr_rc, i8imm, ptr_rc_nosp, i32imm, SEGMENT_REG);
395   let ParserMatchClass = parserMatchClass;
396   let OperandType = "OPERAND_MEMORY";
397 }
398
399 // Gather mem operands
400 class X86VMemOperand<RegisterClass RC, string printMethod,
401                      AsmOperandClass parserMatchClass>
402     : X86MemOperand<printMethod, parserMatchClass> {
403   let MIOperandInfo = (ops ptr_rc, i8imm, RC, i32imm, SEGMENT_REG);
404 }
405
406 def anymem : X86MemOperand<"printMemReference">;
407 def X86any_fcmp : PatFrags<(ops node:$lhs, node:$rhs),
408                           [(X86strict_fcmp node:$lhs, node:$rhs),
409                            (X86fcmp node:$lhs, node:$rhs)]>;
410
411 // FIXME: Right now we allow any size during parsing, but we might want to
412 // restrict to only unsized memory.
413 def opaquemem : X86MemOperand<"printMemReference">;
414
415 def sibmem: X86MemOperand<"printMemReference", X86SibMemOperand>;
416
417 def i8mem   : X86MemOperand<"printbytemem",   X86Mem8AsmOperand>;
418 def i16mem  : X86MemOperand<"printwordmem",  X86Mem16AsmOperand>;
419 def i32mem  : X86MemOperand<"printdwordmem",  X86Mem32AsmOperand>;
420 def i64mem  : X86MemOperand<"printqwordmem",  X86Mem64AsmOperand>;
421 def i128mem : X86MemOperand<"printxmmwordmem", X86Mem128AsmOperand>;
422 def i256mem : X86MemOperand<"printymmwordmem", X86Mem256AsmOperand>;
423 def i512mem : X86MemOperand<"printzmmwordmem", X86Mem512AsmOperand>;
424 def f32mem  : X86MemOperand<"printdwordmem",  X86Mem32AsmOperand>;
425 def f64mem  : X86MemOperand<"printqwordmem",  X86Mem64AsmOperand>;
426 def f80mem  : X86MemOperand<"printtbytemem",  X86Mem80AsmOperand>;
427 def f128mem : X86MemOperand<"printxmmwordmem", X86Mem128AsmOperand>;
428 def f256mem : X86MemOperand<"printymmwordmem", X86Mem256AsmOperand>;
429 def f512mem : X86MemOperand<"printzmmwordmem", X86Mem512AsmOperand>;
430
431 // Gather mem operands
432 def vx64mem  : X86VMemOperand<VR128,  "printqwordmem",  X86Mem64_RC128Operand>;
433 def vx128mem : X86VMemOperand<VR128,  "printxmmwordmem", X86Mem128_RC128Operand>;
434 def vx256mem : X86VMemOperand<VR128,  "printymmwordmem", X86Mem256_RC128Operand>;
435 def vy128mem : X86VMemOperand<VR256,  "printxmmwordmem", X86Mem128_RC256Operand>;
436 def vy256mem : X86VMemOperand<VR256,  "printymmwordmem", X86Mem256_RC256Operand>;
437
438 def vx64xmem  : X86VMemOperand<VR128X, "printqwordmem",  X86Mem64_RC128XOperand>;
439 def vx128xmem : X86VMemOperand<VR128X, "printxmmwordmem", X86Mem128_RC128XOperand>;
440 def vx256xmem : X86VMemOperand<VR128X, "printymmwordmem", X86Mem256_RC128XOperand>;
441 def vy128xmem : X86VMemOperand<VR256X, "printxmmwordmem", X86Mem128_RC256XOperand>;
442 def vy256xmem : X86VMemOperand<VR256X, "printymmwordmem", X86Mem256_RC256XOperand>;
443 def vy512xmem : X86VMemOperand<VR256X, "printzmmwordmem", X86Mem512_RC256XOperand>;
444 def vz256mem  : X86VMemOperand<VR512,  "printymmwordmem", X86Mem256_RC512Operand>;
445 def vz512mem  : X86VMemOperand<VR512,  "printzmmwordmem", X86Mem512_RC512Operand>;
446
447 // A version of i8mem for use on x86-64 and x32 that uses a NOREX GPR instead
448 // of a plain GPR, so that it doesn't potentially require a REX prefix.
449 def ptr_rc_norex : PointerLikeRegClass<2>;
450 def ptr_rc_norex_nosp : PointerLikeRegClass<3>;
451
452 def i8mem_NOREX : Operand<iPTR> {
453   let PrintMethod = "printbytemem";
454   let MIOperandInfo = (ops ptr_rc_norex, i8imm, ptr_rc_norex_nosp, i32imm,
455                        SEGMENT_REG);
456   let ParserMatchClass = X86Mem8AsmOperand;
457   let OperandType = "OPERAND_MEMORY";
458 }
459
460 // GPRs available for tailcall.
461 // It represents GR32_TC, GR64_TC or GR64_TCW64.
462 def ptr_rc_tailcall : PointerLikeRegClass<4>;
463
464 // Special i32mem for addresses of load folding tail calls. These are not
465 // allowed to use callee-saved registers since they must be scheduled
466 // after callee-saved register are popped.
467 def i32mem_TC : Operand<i32> {
468   let PrintMethod = "printdwordmem";
469   let MIOperandInfo = (ops ptr_rc_tailcall, i8imm, ptr_rc_tailcall,
470                        i32imm, SEGMENT_REG);
471   let ParserMatchClass = X86Mem32AsmOperand;
472   let OperandType = "OPERAND_MEMORY";
473 }
474
475 // Special i64mem for addresses of load folding tail calls. These are not
476 // allowed to use callee-saved registers since they must be scheduled
477 // after callee-saved register are popped.
478 def i64mem_TC : Operand<i64> {
479   let PrintMethod = "printqwordmem";
480   let MIOperandInfo = (ops ptr_rc_tailcall, i8imm,
481                        ptr_rc_tailcall, i32imm, SEGMENT_REG);
482   let ParserMatchClass = X86Mem64AsmOperand;
483   let OperandType = "OPERAND_MEMORY";
484 }
485
486 // Special parser to detect 16-bit mode to select 16-bit displacement.
487 def X86AbsMem16AsmOperand : AsmOperandClass {
488   let Name = "AbsMem16";
489   let RenderMethod = "addAbsMemOperands";
490   let SuperClasses = [X86AbsMemAsmOperand];
491 }
492
493 // Branch targets print as pc-relative values.
494 class BranchTargetOperand<ValueType ty> : Operand<ty> {
495   let OperandType = "OPERAND_PCREL";
496   let PrintMethod = "printPCRelImm";
497   let ParserMatchClass = X86AbsMemAsmOperand;
498 }
499
500 def i32imm_brtarget : BranchTargetOperand<i32>;
501 def i16imm_brtarget : BranchTargetOperand<i16>;
502
503 // 64-bits but only 32 bits are significant, and those bits are treated as being
504 // pc relative.
505 def i64i32imm_brtarget : BranchTargetOperand<i64>;
506
507 def brtarget : BranchTargetOperand<OtherVT>;
508 def brtarget8 : BranchTargetOperand<OtherVT>;
509 def brtarget16 : BranchTargetOperand<OtherVT> {
510   let ParserMatchClass = X86AbsMem16AsmOperand;
511 }
512 def brtarget32 : BranchTargetOperand<OtherVT>;
513
514 let RenderMethod = "addSrcIdxOperands" in {
515   def X86SrcIdx8Operand : AsmOperandClass {
516     let Name = "SrcIdx8";
517     let SuperClasses = [X86Mem8AsmOperand];
518   }
519   def X86SrcIdx16Operand : AsmOperandClass {
520     let Name = "SrcIdx16";
521     let SuperClasses = [X86Mem16AsmOperand];
522   }
523   def X86SrcIdx32Operand : AsmOperandClass {
524     let Name = "SrcIdx32";
525     let SuperClasses = [X86Mem32AsmOperand];
526   }
527   def X86SrcIdx64Operand : AsmOperandClass {
528     let Name = "SrcIdx64";
529     let SuperClasses = [X86Mem64AsmOperand];
530   }
531 } // RenderMethod = "addSrcIdxOperands"
532
533 let RenderMethod = "addDstIdxOperands" in {
534  def X86DstIdx8Operand : AsmOperandClass {
535    let Name = "DstIdx8";
536    let SuperClasses = [X86Mem8AsmOperand];
537  }
538  def X86DstIdx16Operand : AsmOperandClass {
539    let Name = "DstIdx16";
540    let SuperClasses = [X86Mem16AsmOperand];
541  }
542  def X86DstIdx32Operand : AsmOperandClass {
543    let Name = "DstIdx32";
544    let SuperClasses = [X86Mem32AsmOperand];
545  }
546  def X86DstIdx64Operand : AsmOperandClass {
547    let Name = "DstIdx64";
548    let SuperClasses = [X86Mem64AsmOperand];
549  }
550 } // RenderMethod = "addDstIdxOperands"
551
552 let RenderMethod = "addMemOffsOperands" in {
553   def X86MemOffs16_8AsmOperand : AsmOperandClass {
554     let Name = "MemOffs16_8";
555     let SuperClasses = [X86Mem8AsmOperand];
556   }
557   def X86MemOffs16_16AsmOperand : AsmOperandClass {
558     let Name = "MemOffs16_16";
559     let SuperClasses = [X86Mem16AsmOperand];
560   }
561   def X86MemOffs16_32AsmOperand : AsmOperandClass {
562     let Name = "MemOffs16_32";
563     let SuperClasses = [X86Mem32AsmOperand];
564   }
565   def X86MemOffs32_8AsmOperand : AsmOperandClass {
566     let Name = "MemOffs32_8";
567     let SuperClasses = [X86Mem8AsmOperand];
568   }
569   def X86MemOffs32_16AsmOperand : AsmOperandClass {
570     let Name = "MemOffs32_16";
571     let SuperClasses = [X86Mem16AsmOperand];
572   }
573   def X86MemOffs32_32AsmOperand : AsmOperandClass {
574     let Name = "MemOffs32_32";
575     let SuperClasses = [X86Mem32AsmOperand];
576   }
577   def X86MemOffs32_64AsmOperand : AsmOperandClass {
578     let Name = "MemOffs32_64";
579     let SuperClasses = [X86Mem64AsmOperand];
580   }
581   def X86MemOffs64_8AsmOperand : AsmOperandClass {
582     let Name = "MemOffs64_8";
583     let SuperClasses = [X86Mem8AsmOperand];
584   }
585   def X86MemOffs64_16AsmOperand : AsmOperandClass {
586     let Name = "MemOffs64_16";
587     let SuperClasses = [X86Mem16AsmOperand];
588   }
589   def X86MemOffs64_32AsmOperand : AsmOperandClass {
590     let Name = "MemOffs64_32";
591     let SuperClasses = [X86Mem32AsmOperand];
592   }
593   def X86MemOffs64_64AsmOperand : AsmOperandClass {
594     let Name = "MemOffs64_64";
595     let SuperClasses = [X86Mem64AsmOperand];
596   }
597 } // RenderMethod = "addMemOffsOperands"
598
599 class X86SrcIdxOperand<string printMethod, AsmOperandClass parserMatchClass>
600     : X86MemOperand<printMethod, parserMatchClass> {
601   let MIOperandInfo = (ops ptr_rc, SEGMENT_REG);
602 }
603
604 class X86DstIdxOperand<string printMethod, AsmOperandClass parserMatchClass>
605     : X86MemOperand<printMethod, parserMatchClass> {
606   let MIOperandInfo = (ops ptr_rc);
607 }
608
609 def srcidx8  : X86SrcIdxOperand<"printSrcIdx8",  X86SrcIdx8Operand>;
610 def srcidx16 : X86SrcIdxOperand<"printSrcIdx16", X86SrcIdx16Operand>;
611 def srcidx32 : X86SrcIdxOperand<"printSrcIdx32", X86SrcIdx32Operand>;
612 def srcidx64 : X86SrcIdxOperand<"printSrcIdx64", X86SrcIdx64Operand>;
613 def dstidx8  : X86DstIdxOperand<"printDstIdx8",  X86DstIdx8Operand>;
614 def dstidx16 : X86DstIdxOperand<"printDstIdx16", X86DstIdx16Operand>;
615 def dstidx32 : X86DstIdxOperand<"printDstIdx32", X86DstIdx32Operand>;
616 def dstidx64 : X86DstIdxOperand<"printDstIdx64", X86DstIdx64Operand>;
617
618 class X86MemOffsOperand<Operand immOperand, string printMethod,
619                         AsmOperandClass parserMatchClass>
620     : X86MemOperand<printMethod, parserMatchClass> {
621   let MIOperandInfo = (ops immOperand, SEGMENT_REG);
622 }
623
624 def offset16_8  : X86MemOffsOperand<i16imm, "printMemOffs8",
625                                     X86MemOffs16_8AsmOperand>;
626 def offset16_16 : X86MemOffsOperand<i16imm, "printMemOffs16",
627                                     X86MemOffs16_16AsmOperand>;
628 def offset16_32 : X86MemOffsOperand<i16imm, "printMemOffs32",
629                                     X86MemOffs16_32AsmOperand>;
630 def offset32_8  : X86MemOffsOperand<i32imm, "printMemOffs8",
631                                     X86MemOffs32_8AsmOperand>;
632 def offset32_16 : X86MemOffsOperand<i32imm, "printMemOffs16",
633                                     X86MemOffs32_16AsmOperand>;
634 def offset32_32 : X86MemOffsOperand<i32imm, "printMemOffs32",
635                                     X86MemOffs32_32AsmOperand>;
636 def offset32_64 : X86MemOffsOperand<i32imm, "printMemOffs64",
637                                     X86MemOffs32_64AsmOperand>;
638 def offset64_8  : X86MemOffsOperand<i64imm, "printMemOffs8",
639                                     X86MemOffs64_8AsmOperand>;
640 def offset64_16 : X86MemOffsOperand<i64imm, "printMemOffs16",
641                                     X86MemOffs64_16AsmOperand>;
642 def offset64_32 : X86MemOffsOperand<i64imm, "printMemOffs32",
643                                     X86MemOffs64_32AsmOperand>;
644 def offset64_64 : X86MemOffsOperand<i64imm, "printMemOffs64",
645                                     X86MemOffs64_64AsmOperand>;
646
647 def ccode : Operand<i8> {
648   let PrintMethod = "printCondCode";
649   let OperandNamespace = "X86";
650   let OperandType = "OPERAND_COND_CODE";
651 }
652
653 class ImmSExtAsmOperandClass : AsmOperandClass {
654   let SuperClasses = [ImmAsmOperand];
655   let RenderMethod = "addImmOperands";
656 }
657
658 def X86GR32orGR64AsmOperand : AsmOperandClass {
659   let Name = "GR32orGR64";
660 }
661 def GR32orGR64 : RegisterOperand<GR32> {
662   let ParserMatchClass = X86GR32orGR64AsmOperand;
663 }
664
665 def X86GR16orGR32orGR64AsmOperand : AsmOperandClass {
666   let Name = "GR16orGR32orGR64";
667 }
668 def GR16orGR32orGR64 : RegisterOperand<GR16> {
669   let ParserMatchClass = X86GR16orGR32orGR64AsmOperand;
670 }
671
672 def AVX512RCOperand : AsmOperandClass {
673   let Name = "AVX512RC";
674 }
675 def AVX512RC : Operand<i32> {
676   let PrintMethod = "printRoundingControl";
677   let OperandNamespace = "X86";
678   let OperandType = "OPERAND_ROUNDING_CONTROL";
679   let ParserMatchClass = AVX512RCOperand;
680 }
681
682 // Sign-extended immediate classes. We don't need to define the full lattice
683 // here because there is no instruction with an ambiguity between ImmSExti64i32
684 // and ImmSExti32i8.
685 //
686 // The strange ranges come from the fact that the assembler always works with
687 // 64-bit immediates, but for a 16-bit target value we want to accept both "-1"
688 // (which will be a -1ULL), and "0xFF" (-1 in 16-bits).
689
690 // [0, 0x7FFFFFFF]                                            |
691 //   [0xFFFFFFFF80000000, 0xFFFFFFFFFFFFFFFF]
692 def ImmSExti64i32AsmOperand : ImmSExtAsmOperandClass {
693   let Name = "ImmSExti64i32";
694 }
695
696 // [0, 0x0000007F] | [0x000000000000FF80, 0x000000000000FFFF] |
697 //   [0xFFFFFFFFFFFFFF80, 0xFFFFFFFFFFFFFFFF]
698 def ImmSExti16i8AsmOperand : ImmSExtAsmOperandClass {
699   let Name = "ImmSExti16i8";
700   let SuperClasses = [ImmSExti64i32AsmOperand];
701 }
702
703 // [0, 0x0000007F] | [0x00000000FFFFFF80, 0x00000000FFFFFFFF] |
704 //   [0xFFFFFFFFFFFFFF80, 0xFFFFFFFFFFFFFFFF]
705 def ImmSExti32i8AsmOperand : ImmSExtAsmOperandClass {
706   let Name = "ImmSExti32i8";
707 }
708
709 // [0, 0x0000007F]                                            |
710 //   [0xFFFFFFFFFFFFFF80, 0xFFFFFFFFFFFFFFFF]
711 def ImmSExti64i8AsmOperand : ImmSExtAsmOperandClass {
712   let Name = "ImmSExti64i8";
713   let SuperClasses = [ImmSExti16i8AsmOperand, ImmSExti32i8AsmOperand,
714                       ImmSExti64i32AsmOperand];
715 }
716
717 // 4-bit immediate used by some XOP instructions
718 // [0, 0xF]
719 def ImmUnsignedi4AsmOperand : AsmOperandClass {
720   let Name = "ImmUnsignedi4";
721   let RenderMethod = "addImmOperands";
722   let DiagnosticType = "InvalidImmUnsignedi4";
723 }
724
725 // Unsigned immediate used by SSE/AVX instructions
726 // [0, 0xFF]
727 //   [0xFFFFFFFFFFFFFF80, 0xFFFFFFFFFFFFFFFF]
728 def ImmUnsignedi8AsmOperand : AsmOperandClass {
729   let Name = "ImmUnsignedi8";
730   let RenderMethod = "addImmOperands";
731 }
732
733 // A couple of more descriptive operand definitions.
734 // 16-bits but only 8 bits are significant.
735 def i16i8imm  : Operand<i16> {
736   let ParserMatchClass = ImmSExti16i8AsmOperand;
737   let OperandType = "OPERAND_IMMEDIATE";
738 }
739 // 32-bits but only 8 bits are significant.
740 def i32i8imm  : Operand<i32> {
741   let ParserMatchClass = ImmSExti32i8AsmOperand;
742   let OperandType = "OPERAND_IMMEDIATE";
743 }
744
745 // 64-bits but only 32 bits are significant.
746 def i64i32imm  : Operand<i64> {
747   let ParserMatchClass = ImmSExti64i32AsmOperand;
748   let OperandType = "OPERAND_IMMEDIATE";
749 }
750
751 // 64-bits but only 8 bits are significant.
752 def i64i8imm   : Operand<i64> {
753   let ParserMatchClass = ImmSExti64i8AsmOperand;
754   let OperandType = "OPERAND_IMMEDIATE";
755 }
756
757 // Unsigned 4-bit immediate used by some XOP instructions.
758 def u4imm : Operand<i8> {
759   let PrintMethod = "printU8Imm";
760   let ParserMatchClass = ImmUnsignedi4AsmOperand;
761   let OperandType = "OPERAND_IMMEDIATE";
762 }
763
764 // Unsigned 8-bit immediate used by SSE/AVX instructions.
765 def u8imm : Operand<i8> {
766   let PrintMethod = "printU8Imm";
767   let ParserMatchClass = ImmUnsignedi8AsmOperand;
768   let OperandType = "OPERAND_IMMEDIATE";
769 }
770
771 // 16-bit immediate but only 8-bits are significant and they are unsigned.
772 // Used by BT instructions.
773 def i16u8imm : Operand<i16> {
774   let PrintMethod = "printU8Imm";
775   let ParserMatchClass = ImmUnsignedi8AsmOperand;
776   let OperandType = "OPERAND_IMMEDIATE";
777 }
778
779 // 32-bit immediate but only 8-bits are significant and they are unsigned.
780 // Used by some SSE/AVX instructions that use intrinsics.
781 def i32u8imm : Operand<i32> {
782   let PrintMethod = "printU8Imm";
783   let ParserMatchClass = ImmUnsignedi8AsmOperand;
784   let OperandType = "OPERAND_IMMEDIATE";
785 }
786
787 // 64-bit immediate but only 8-bits are significant and they are unsigned.
788 // Used by BT instructions.
789 def i64u8imm : Operand<i64> {
790   let PrintMethod = "printU8Imm";
791   let ParserMatchClass = ImmUnsignedi8AsmOperand;
792   let OperandType = "OPERAND_IMMEDIATE";
793 }
794
795 def lea64_32mem : Operand<i32> {
796   let PrintMethod = "printMemReference";
797   let MIOperandInfo = (ops GR64, i8imm, GR64_NOSP, i32imm, SEGMENT_REG);
798   let ParserMatchClass = X86MemAsmOperand;
799 }
800
801 // Memory operands that use 64-bit pointers in both ILP32 and LP64.
802 def lea64mem : Operand<i64> {
803   let PrintMethod = "printMemReference";
804   let MIOperandInfo = (ops GR64, i8imm, GR64_NOSP, i32imm, SEGMENT_REG);
805   let ParserMatchClass = X86MemAsmOperand;
806 }
807
808 let RenderMethod = "addMaskPairOperands" in {
809   def VK1PairAsmOperand : AsmOperandClass { let Name = "VK1Pair"; }
810   def VK2PairAsmOperand : AsmOperandClass { let Name = "VK2Pair"; }
811   def VK4PairAsmOperand : AsmOperandClass { let Name = "VK4Pair"; }
812   def VK8PairAsmOperand : AsmOperandClass { let Name = "VK8Pair"; }
813   def VK16PairAsmOperand : AsmOperandClass { let Name = "VK16Pair"; }
814 }
815
816 def VK1Pair : RegisterOperand<VK1PAIR, "printVKPair"> {
817   let ParserMatchClass = VK1PairAsmOperand;
818 }
819
820 def VK2Pair : RegisterOperand<VK2PAIR, "printVKPair"> {
821   let ParserMatchClass = VK2PairAsmOperand;
822 }
823
824 def VK4Pair : RegisterOperand<VK4PAIR, "printVKPair"> {
825   let ParserMatchClass = VK4PairAsmOperand;
826 }
827
828 def VK8Pair : RegisterOperand<VK8PAIR, "printVKPair"> {
829   let ParserMatchClass = VK8PairAsmOperand;
830 }
831
832 def VK16Pair : RegisterOperand<VK16PAIR, "printVKPair"> {
833   let ParserMatchClass = VK16PairAsmOperand;
834 }
835
836 //===----------------------------------------------------------------------===//
837 // X86 Complex Pattern Definitions.
838 //
839
840 // Define X86-specific addressing mode.
841 def addr      : ComplexPattern<iPTR, 5, "selectAddr", [], [SDNPWantParent]>;
842 def lea32addr : ComplexPattern<i32, 5, "selectLEAAddr",
843                                [add, sub, mul, X86mul_imm, shl, or, frameindex],
844                                []>;
845 // In 64-bit mode 32-bit LEAs can use RIP-relative addressing.
846 def lea64_32addr : ComplexPattern<i32, 5, "selectLEA64_32Addr",
847                                   [add, sub, mul, X86mul_imm, shl, or,
848                                    frameindex, X86WrapperRIP],
849                                   []>;
850
851 def tls32addr : ComplexPattern<i32, 5, "selectTLSADDRAddr",
852                                [tglobaltlsaddr], []>;
853
854 def tls32baseaddr : ComplexPattern<i32, 5, "selectTLSADDRAddr",
855                                [tglobaltlsaddr], []>;
856
857 def lea64addr : ComplexPattern<i64, 5, "selectLEAAddr",
858                         [add, sub, mul, X86mul_imm, shl, or, frameindex,
859                          X86WrapperRIP], []>;
860
861 def tls64addr : ComplexPattern<i64, 5, "selectTLSADDRAddr",
862                                [tglobaltlsaddr], []>;
863
864 def tls64baseaddr : ComplexPattern<i64, 5, "selectTLSADDRAddr",
865                                [tglobaltlsaddr], []>;
866
867 def vectoraddr : ComplexPattern<iPTR, 5, "selectVectorAddr", [],[SDNPWantParent]>;
868
869 // A relocatable immediate is an operand that can be relocated by the linker to
870 // an immediate, such as a regular symbol in non-PIC code.
871 def relocImm : ComplexPattern<iAny, 1, "selectRelocImm",
872                               [X86Wrapper], [], 0>;
873
874 //===----------------------------------------------------------------------===//
875 // X86 Instruction Predicate Definitions.
876 def TruePredicate : Predicate<"true">;
877
878 def HasCMov      : Predicate<"Subtarget->hasCMov()">;
879 def NoCMov       : Predicate<"!Subtarget->hasCMov()">;
880
881 def HasMMX       : Predicate<"Subtarget->hasMMX()">;
882 def Has3DNow     : Predicate<"Subtarget->has3DNow()">;
883 def Has3DNowA    : Predicate<"Subtarget->has3DNowA()">;
884 def HasSSE1      : Predicate<"Subtarget->hasSSE1()">;
885 def UseSSE1      : Predicate<"Subtarget->hasSSE1() && !Subtarget->hasAVX()">;
886 def HasSSE2      : Predicate<"Subtarget->hasSSE2()">;
887 def UseSSE2      : Predicate<"Subtarget->hasSSE2() && !Subtarget->hasAVX()">;
888 def HasSSE3      : Predicate<"Subtarget->hasSSE3()">;
889 def UseSSE3      : Predicate<"Subtarget->hasSSE3() && !Subtarget->hasAVX()">;
890 def HasSSSE3     : Predicate<"Subtarget->hasSSSE3()">;
891 def UseSSSE3     : Predicate<"Subtarget->hasSSSE3() && !Subtarget->hasAVX()">;
892 def HasSSE41     : Predicate<"Subtarget->hasSSE41()">;
893 def NoSSE41      : Predicate<"!Subtarget->hasSSE41()">;
894 def UseSSE41     : Predicate<"Subtarget->hasSSE41() && !Subtarget->hasAVX()">;
895 def HasSSE42     : Predicate<"Subtarget->hasSSE42()">;
896 def UseSSE42     : Predicate<"Subtarget->hasSSE42() && !Subtarget->hasAVX()">;
897 def HasSSE4A     : Predicate<"Subtarget->hasSSE4A()">;
898 def NoAVX        : Predicate<"!Subtarget->hasAVX()">;
899 def HasAVX       : Predicate<"Subtarget->hasAVX()">;
900 def HasAVX2      : Predicate<"Subtarget->hasAVX2()">;
901 def HasAVX1Only  : Predicate<"Subtarget->hasAVX() && !Subtarget->hasAVX2()">;
902 def HasAVX512    : Predicate<"Subtarget->hasAVX512()">;
903 def UseAVX       : Predicate<"Subtarget->hasAVX() && !Subtarget->hasAVX512()">;
904 def UseAVX2      : Predicate<"Subtarget->hasAVX2() && !Subtarget->hasAVX512()">;
905 def NoAVX512     : Predicate<"!Subtarget->hasAVX512()">;
906 def HasCDI       : Predicate<"Subtarget->hasCDI()">;
907 def HasVPOPCNTDQ : Predicate<"Subtarget->hasVPOPCNTDQ()">;
908 def HasPFI       : Predicate<"Subtarget->hasPFI()">;
909 def HasERI       : Predicate<"Subtarget->hasERI()">;
910 def HasDQI       : Predicate<"Subtarget->hasDQI()">;
911 def NoDQI        : Predicate<"!Subtarget->hasDQI()">;
912 def HasBWI       : Predicate<"Subtarget->hasBWI()">;
913 def NoBWI        : Predicate<"!Subtarget->hasBWI()">;
914 def HasVLX       : Predicate<"Subtarget->hasVLX()">;
915 def NoVLX        : Predicate<"!Subtarget->hasVLX()">;
916 def NoVLX_Or_NoBWI : Predicate<"!Subtarget->hasVLX() || !Subtarget->hasBWI()">;
917 def NoVLX_Or_NoDQI : Predicate<"!Subtarget->hasVLX() || !Subtarget->hasDQI()">;
918 def PKU        : Predicate<"Subtarget->hasPKU()">;
919 def HasVNNI    : Predicate<"Subtarget->hasVNNI()">;
920 def HasVP2INTERSECT : Predicate<"Subtarget->hasVP2INTERSECT()">;
921 def HasBF16      : Predicate<"Subtarget->hasBF16()">;
922 def HasAVXVNNI : Predicate <"Subtarget->hasAVXVNNI()">;
923 def NoVLX_Or_NoVNNI : Predicate<"!Subtarget->hasVLX() || !Subtarget->hasVNNI()">;
924
925 def HasBITALG    : Predicate<"Subtarget->hasBITALG()">;
926 def HasPOPCNT    : Predicate<"Subtarget->hasPOPCNT()">;
927 def HasAES       : Predicate<"Subtarget->hasAES()">;
928 def HasVAES      : Predicate<"Subtarget->hasVAES()">;
929 def NoVLX_Or_NoVAES : Predicate<"!Subtarget->hasVLX() || !Subtarget->hasVAES()">;
930 def HasFXSR      : Predicate<"Subtarget->hasFXSR()">;
931 def HasXSAVE     : Predicate<"Subtarget->hasXSAVE()">;
932 def HasXSAVEOPT  : Predicate<"Subtarget->hasXSAVEOPT()">;
933 def HasXSAVEC    : Predicate<"Subtarget->hasXSAVEC()">;
934 def HasXSAVES    : Predicate<"Subtarget->hasXSAVES()">;
935 def HasPCLMUL    : Predicate<"Subtarget->hasPCLMUL()">;
936 def NoVLX_Or_NoVPCLMULQDQ :
937                     Predicate<"!Subtarget->hasVLX() || !Subtarget->hasVPCLMULQDQ()">;
938 def HasVPCLMULQDQ : Predicate<"Subtarget->hasVPCLMULQDQ()">;
939 def HasGFNI      : Predicate<"Subtarget->hasGFNI()">;
940 def HasFMA       : Predicate<"Subtarget->hasFMA()">;
941 def HasFMA4      : Predicate<"Subtarget->hasFMA4()">;
942 def NoFMA4       : Predicate<"!Subtarget->hasFMA4()">;
943 def HasXOP       : Predicate<"Subtarget->hasXOP()">;
944 def HasTBM       : Predicate<"Subtarget->hasTBM()">;
945 def NoTBM        : Predicate<"!Subtarget->hasTBM()">;
946 def HasLWP       : Predicate<"Subtarget->hasLWP()">;
947 def HasMOVBE     : Predicate<"Subtarget->hasMOVBE()">;
948 def HasRDRAND    : Predicate<"Subtarget->hasRDRAND()">;
949 def HasF16C      : Predicate<"Subtarget->hasF16C()">;
950 def HasFSGSBase  : Predicate<"Subtarget->hasFSGSBase()">;
951 def HasLZCNT     : Predicate<"Subtarget->hasLZCNT()">;
952 def HasBMI       : Predicate<"Subtarget->hasBMI()">;
953 def HasBMI2      : Predicate<"Subtarget->hasBMI2()">;
954 def NoBMI2       : Predicate<"!Subtarget->hasBMI2()">;
955 def HasVBMI      : Predicate<"Subtarget->hasVBMI()">;
956 def HasVBMI2     : Predicate<"Subtarget->hasVBMI2()">;
957 def HasIFMA      : Predicate<"Subtarget->hasIFMA()">;
958 def HasRTM       : Predicate<"Subtarget->hasRTM()">;
959 def HasADX       : Predicate<"Subtarget->hasADX()">;
960 def HasSHA       : Predicate<"Subtarget->hasSHA()">;
961 def HasSGX       : Predicate<"Subtarget->hasSGX()">;
962 def HasRDSEED    : Predicate<"Subtarget->hasRDSEED()">;
963 def HasSSEPrefetch : Predicate<"Subtarget->hasSSEPrefetch()">;
964 def NoSSEPrefetch : Predicate<"!Subtarget->hasSSEPrefetch()">;
965 def HasPrefetchW : Predicate<"Subtarget->hasPrefetchW()">;
966 def HasPREFETCHWT1 : Predicate<"Subtarget->hasPREFETCHWT1()">;
967 def HasLAHFSAHF  : Predicate<"Subtarget->hasLAHFSAHF()">;
968 def HasMWAITX    : Predicate<"Subtarget->hasMWAITX()">;
969 def HasCLZERO    : Predicate<"Subtarget->hasCLZERO()">;
970 def HasCLDEMOTE  : Predicate<"Subtarget->hasCLDEMOTE()">;
971 def HasMOVDIRI   : Predicate<"Subtarget->hasMOVDIRI()">;
972 def HasMOVDIR64B : Predicate<"Subtarget->hasMOVDIR64B()">;
973 def HasPTWRITE   : Predicate<"Subtarget->hasPTWRITE()">;
974 def FPStackf32   : Predicate<"!Subtarget->hasSSE1()">;
975 def FPStackf64   : Predicate<"!Subtarget->hasSSE2()">;
976 def HasSHSTK     : Predicate<"Subtarget->hasSHSTK()">;
977 def HasCLFLUSHOPT : Predicate<"Subtarget->hasCLFLUSHOPT()">;
978 def HasCLWB      : Predicate<"Subtarget->hasCLWB()">;
979 def HasWBNOINVD  : Predicate<"Subtarget->hasWBNOINVD()">;
980 def HasRDPID     : Predicate<"Subtarget->hasRDPID()">;
981 def HasWAITPKG   : Predicate<"Subtarget->hasWAITPKG()">;
982 def HasINVPCID   : Predicate<"Subtarget->hasINVPCID()">;
983 def HasCmpxchg8b : Predicate<"Subtarget->hasCmpxchg8b()">;
984 def HasCmpxchg16b: Predicate<"Subtarget->hasCmpxchg16b()">;
985 def HasPCONFIG   : Predicate<"Subtarget->hasPCONFIG()">;
986 def HasENQCMD    : Predicate<"Subtarget->hasENQCMD()">;
987 def HasKL        : Predicate<"Subtarget->hasKL()">;
988 def HasWIDEKL    : Predicate<"Subtarget->hasWIDEKL()">;
989 def HasHRESET    : Predicate<"Subtarget->hasHRESET()">;
990 def HasSERIALIZE : Predicate<"Subtarget->hasSERIALIZE()">;
991 def HasTSXLDTRK  : Predicate<"Subtarget->hasTSXLDTRK()">;
992 def HasAMXTILE   : Predicate<"Subtarget->hasAMXTILE()">;
993 def HasAMXBF16   : Predicate<"Subtarget->hasAMXBF16()">;
994 def HasAMXINT8   : Predicate<"Subtarget->hasAMXINT8()">;
995 def HasUINTR     : Predicate<"Subtarget->hasUINTR()">;
996 def Not64BitMode : Predicate<"!Subtarget->is64Bit()">,
997                              AssemblerPredicate<(all_of (not Mode64Bit)), "Not 64-bit mode">;
998 def In64BitMode  : Predicate<"Subtarget->is64Bit()">,
999                              AssemblerPredicate<(all_of Mode64Bit), "64-bit mode">;
1000 def IsLP64  : Predicate<"Subtarget->isTarget64BitLP64()">;
1001 def NotLP64 : Predicate<"!Subtarget->isTarget64BitLP64()">;
1002 def In16BitMode  : Predicate<"Subtarget->is16Bit()">,
1003                              AssemblerPredicate<(all_of Mode16Bit), "16-bit mode">;
1004 def Not16BitMode : Predicate<"!Subtarget->is16Bit()">,
1005                              AssemblerPredicate<(all_of (not Mode16Bit)), "Not 16-bit mode">;
1006 def In32BitMode  : Predicate<"Subtarget->is32Bit()">,
1007                              AssemblerPredicate<(all_of Mode32Bit), "32-bit mode">;
1008 def IsWin64      : Predicate<"Subtarget->isTargetWin64()">;
1009 def NotWin64     : Predicate<"!Subtarget->isTargetWin64()">;
1010 def NotWin64WithoutFP : Predicate<"!Subtarget->isTargetWin64() ||"
1011                                   "Subtarget->getFrameLowering()->hasFP(*MF)"> {
1012   let RecomputePerFunction = 1;
1013 }
1014 def IsPS4        : Predicate<"Subtarget->isTargetPS4()">;
1015 def NotPS4       : Predicate<"!Subtarget->isTargetPS4()">;
1016 def IsNaCl       : Predicate<"Subtarget->isTargetNaCl()">;
1017 def NotNaCl      : Predicate<"!Subtarget->isTargetNaCl()">;
1018 def SmallCode    : Predicate<"TM.getCodeModel() == CodeModel::Small">;
1019 def KernelCode   : Predicate<"TM.getCodeModel() == CodeModel::Kernel">;
1020 def NearData     : Predicate<"TM.getCodeModel() == CodeModel::Small ||"
1021                              "TM.getCodeModel() == CodeModel::Kernel">;
1022 def IsNotPIC     : Predicate<"!TM.isPositionIndependent()">;
1023
1024 // We could compute these on a per-module basis but doing so requires accessing
1025 // the Function object through the <Target>Subtarget and objections were raised
1026 // to that (see post-commit review comments for r301750).
1027 let RecomputePerFunction = 1 in {
1028   def OptForSize   : Predicate<"shouldOptForSize(MF)">;
1029   def OptForMinSize : Predicate<"MF->getFunction().hasMinSize()">;
1030   def OptForSpeed  : Predicate<"!shouldOptForSize(MF)">;
1031   def UseIncDec : Predicate<"!Subtarget->slowIncDec() || "
1032                             "shouldOptForSize(MF)">;
1033   def NoSSE41_Or_OptForSize : Predicate<"shouldOptForSize(MF) || "
1034                                         "!Subtarget->hasSSE41()">;
1035 }
1036
1037 def CallImmAddr  : Predicate<"Subtarget->isLegalToCallImmediateAddr()">;
1038 def FavorMemIndirectCall  : Predicate<"!Subtarget->slowTwoMemOps()">;
1039 def HasFastMem32 : Predicate<"!Subtarget->isUnalignedMem32Slow()">;
1040 def HasFastLZCNT : Predicate<"Subtarget->hasFastLZCNT()">;
1041 def HasFastSHLDRotate : Predicate<"Subtarget->hasFastSHLDRotate()">;
1042 def HasERMSB : Predicate<"Subtarget->hasERMSB()">;
1043 def HasFSRM : Predicate<"Subtarget->hasFSRM()">;
1044 def HasMFence    : Predicate<"Subtarget->hasMFence()">;
1045 def UseIndirectThunkCalls : Predicate<"Subtarget->useIndirectThunkCalls()">;
1046 def NotUseIndirectThunkCalls : Predicate<"!Subtarget->useIndirectThunkCalls()">;
1047
1048 //===----------------------------------------------------------------------===//
1049 // X86 Instruction Format Definitions.
1050 //
1051
1052 include "X86InstrFormats.td"
1053
1054 //===----------------------------------------------------------------------===//
1055 // Pattern fragments.
1056 //
1057
1058 // X86 specific condition code. These correspond to CondCode in
1059 // X86InstrInfo.h. They must be kept in synch.
1060 def X86_COND_O   : PatLeaf<(i8 0)>;
1061 def X86_COND_NO  : PatLeaf<(i8 1)>;
1062 def X86_COND_B   : PatLeaf<(i8 2)>;  // alt. COND_C
1063 def X86_COND_AE  : PatLeaf<(i8 3)>;  // alt. COND_NC
1064 def X86_COND_E   : PatLeaf<(i8 4)>;  // alt. COND_Z
1065 def X86_COND_NE  : PatLeaf<(i8 5)>;  // alt. COND_NZ
1066 def X86_COND_BE  : PatLeaf<(i8 6)>;  // alt. COND_NA
1067 def X86_COND_A   : PatLeaf<(i8 7)>;  // alt. COND_NBE
1068 def X86_COND_S   : PatLeaf<(i8 8)>;
1069 def X86_COND_NS  : PatLeaf<(i8 9)>;
1070 def X86_COND_P   : PatLeaf<(i8 10)>; // alt. COND_PE
1071 def X86_COND_NP  : PatLeaf<(i8 11)>; // alt. COND_PO
1072 def X86_COND_L   : PatLeaf<(i8 12)>; // alt. COND_NGE
1073 def X86_COND_GE  : PatLeaf<(i8 13)>; // alt. COND_NL
1074 def X86_COND_LE  : PatLeaf<(i8 14)>; // alt. COND_NG
1075 def X86_COND_G   : PatLeaf<(i8 15)>; // alt. COND_NLE
1076
1077 def i16immSExt8  : ImmLeaf<i16, [{ return isInt<8>(Imm); }]>;
1078 def i32immSExt8  : ImmLeaf<i32, [{ return isInt<8>(Imm); }]>;
1079 def i64immSExt8  : ImmLeaf<i64, [{ return isInt<8>(Imm); }]>;
1080 def i64immSExt32 : ImmLeaf<i64, [{ return isInt<32>(Imm); }]>;
1081 def i64timmSExt32 : TImmLeaf<i64, [{ return isInt<32>(Imm); }]>;
1082
1083 def i16relocImmSExt8 : PatLeaf<(i16 relocImm), [{
1084   return isSExtAbsoluteSymbolRef(8, N);
1085 }]>;
1086 def i32relocImmSExt8 : PatLeaf<(i32 relocImm), [{
1087   return isSExtAbsoluteSymbolRef(8, N);
1088 }]>;
1089 def i64relocImmSExt8 : PatLeaf<(i64 relocImm), [{
1090   return isSExtAbsoluteSymbolRef(8, N);
1091 }]>;
1092 def i64relocImmSExt32 : PatLeaf<(i64 relocImm), [{
1093   return isSExtAbsoluteSymbolRef(32, N);
1094 }]>;
1095
1096 // If we have multiple users of an immediate, it's much smaller to reuse
1097 // the register, rather than encode the immediate in every instruction.
1098 // This has the risk of increasing register pressure from stretched live
1099 // ranges, however, the immediates should be trivial to rematerialize by
1100 // the RA in the event of high register pressure.
1101 // TODO : This is currently enabled for stores and binary ops. There are more
1102 // cases for which this can be enabled, though this catches the bulk of the
1103 // issues.
1104 // TODO2 : This should really also be enabled under O2, but there's currently
1105 // an issue with RA where we don't pull the constants into their users
1106 // when we rematerialize them. I'll follow-up on enabling O2 after we fix that
1107 // issue.
1108 // TODO3 : This is currently limited to single basic blocks (DAG creation
1109 // pulls block immediates to the top and merges them if necessary).
1110 // Eventually, it would be nice to allow ConstantHoisting to merge constants
1111 // globally for potentially added savings.
1112 //
1113 def imm_su : PatLeaf<(imm), [{
1114     return !shouldAvoidImmediateInstFormsForSize(N);
1115 }]>;
1116 def i64immSExt32_su : PatLeaf<(i64immSExt32), [{
1117     return !shouldAvoidImmediateInstFormsForSize(N);
1118 }]>;
1119
1120 def relocImm8_su : PatLeaf<(i8 relocImm), [{
1121     return !shouldAvoidImmediateInstFormsForSize(N);
1122 }]>;
1123 def relocImm16_su : PatLeaf<(i16 relocImm), [{
1124     return !shouldAvoidImmediateInstFormsForSize(N);
1125 }]>;
1126 def relocImm32_su : PatLeaf<(i32 relocImm), [{
1127     return !shouldAvoidImmediateInstFormsForSize(N);
1128 }]>;
1129
1130 def i16relocImmSExt8_su : PatLeaf<(i16relocImmSExt8), [{
1131     return !shouldAvoidImmediateInstFormsForSize(N);
1132 }]>;
1133 def i32relocImmSExt8_su : PatLeaf<(i32relocImmSExt8), [{
1134     return !shouldAvoidImmediateInstFormsForSize(N);
1135 }]>;
1136 def i64relocImmSExt8_su : PatLeaf<(i64relocImmSExt8), [{
1137     return !shouldAvoidImmediateInstFormsForSize(N);
1138 }]>;
1139 def i64relocImmSExt32_su : PatLeaf<(i64relocImmSExt32), [{
1140     return !shouldAvoidImmediateInstFormsForSize(N);
1141 }]>;
1142
1143 def i16immSExt8_su : PatLeaf<(i16immSExt8), [{
1144     return !shouldAvoidImmediateInstFormsForSize(N);
1145 }]>;
1146 def i32immSExt8_su : PatLeaf<(i32immSExt8), [{
1147     return !shouldAvoidImmediateInstFormsForSize(N);
1148 }]>;
1149 def i64immSExt8_su : PatLeaf<(i64immSExt8), [{
1150     return !shouldAvoidImmediateInstFormsForSize(N);
1151 }]>;
1152
1153 // i64immZExt32 predicate - True if the 64-bit immediate fits in a 32-bit
1154 // unsigned field.
1155 def i64immZExt32 : ImmLeaf<i64, [{ return isUInt<32>(Imm); }]>;
1156
1157 def i64immZExt32SExt8 : ImmLeaf<i64, [{
1158   return isUInt<32>(Imm) && isInt<8>(static_cast<int32_t>(Imm));
1159 }]>;
1160
1161 // Helper fragments for loads.
1162
1163 // It's safe to fold a zextload/extload from i1 as a regular i8 load. The
1164 // upper bits are guaranteed to be zero and we were going to emit a MOV8rm
1165 // which might get folded during peephole anyway.
1166 def loadi8 : PatFrag<(ops node:$ptr), (i8 (unindexedload node:$ptr)), [{
1167   LoadSDNode *LD = cast<LoadSDNode>(N);
1168   ISD::LoadExtType ExtType = LD->getExtensionType();
1169   return ExtType == ISD::NON_EXTLOAD || ExtType == ISD::EXTLOAD ||
1170          ExtType == ISD::ZEXTLOAD;
1171 }]>;
1172
1173 // It's always safe to treat a anyext i16 load as a i32 load if the i16 is
1174 // known to be 32-bit aligned or better. Ditto for i8 to i16.
1175 def loadi16 : PatFrag<(ops node:$ptr), (i16 (unindexedload node:$ptr)), [{
1176   LoadSDNode *LD = cast<LoadSDNode>(N);
1177   ISD::LoadExtType ExtType = LD->getExtensionType();
1178   if (ExtType == ISD::NON_EXTLOAD)
1179     return true;
1180   if (ExtType == ISD::EXTLOAD && EnablePromoteAnyextLoad)
1181     return LD->getAlignment() >= 2 && LD->isSimple();
1182   return false;
1183 }]>;
1184
1185 def loadi32 : PatFrag<(ops node:$ptr), (i32 (unindexedload node:$ptr)), [{
1186   LoadSDNode *LD = cast<LoadSDNode>(N);
1187   ISD::LoadExtType ExtType = LD->getExtensionType();
1188   if (ExtType == ISD::NON_EXTLOAD)
1189     return true;
1190   if (ExtType == ISD::EXTLOAD && EnablePromoteAnyextLoad)
1191     return LD->getAlignment() >= 4 && LD->isSimple();
1192   return false;
1193 }]>;
1194
1195 def loadi64  : PatFrag<(ops node:$ptr), (i64 (load node:$ptr))>;
1196 def loadf32  : PatFrag<(ops node:$ptr), (f32 (load node:$ptr))>;
1197 def loadf64  : PatFrag<(ops node:$ptr), (f64 (load node:$ptr))>;
1198 def loadf80  : PatFrag<(ops node:$ptr), (f80 (load node:$ptr))>;
1199 def loadf128 : PatFrag<(ops node:$ptr), (f128 (load node:$ptr))>;
1200 def alignedloadf128 : PatFrag<(ops node:$ptr), (f128 (load node:$ptr)), [{
1201   LoadSDNode *Ld = cast<LoadSDNode>(N);
1202   return Ld->getAlignment() >= Ld->getMemoryVT().getStoreSize();
1203 }]>;
1204 def memopf128 : PatFrag<(ops node:$ptr), (f128 (load node:$ptr)), [{
1205   LoadSDNode *Ld = cast<LoadSDNode>(N);
1206   return Subtarget->hasSSEUnalignedMem() ||
1207          Ld->getAlignment() >= Ld->getMemoryVT().getStoreSize();
1208 }]>;
1209
1210 def sextloadi16i8  : PatFrag<(ops node:$ptr), (i16 (sextloadi8 node:$ptr))>;
1211 def sextloadi32i8  : PatFrag<(ops node:$ptr), (i32 (sextloadi8 node:$ptr))>;
1212 def sextloadi32i16 : PatFrag<(ops node:$ptr), (i32 (sextloadi16 node:$ptr))>;
1213 def sextloadi64i8  : PatFrag<(ops node:$ptr), (i64 (sextloadi8 node:$ptr))>;
1214 def sextloadi64i16 : PatFrag<(ops node:$ptr), (i64 (sextloadi16 node:$ptr))>;
1215 def sextloadi64i32 : PatFrag<(ops node:$ptr), (i64 (sextloadi32 node:$ptr))>;
1216
1217 def zextloadi8i1   : PatFrag<(ops node:$ptr), (i8  (zextloadi1 node:$ptr))>;
1218 def zextloadi16i1  : PatFrag<(ops node:$ptr), (i16 (zextloadi1 node:$ptr))>;
1219 def zextloadi32i1  : PatFrag<(ops node:$ptr), (i32 (zextloadi1 node:$ptr))>;
1220 def zextloadi16i8  : PatFrag<(ops node:$ptr), (i16 (zextloadi8 node:$ptr))>;
1221 def zextloadi32i8  : PatFrag<(ops node:$ptr), (i32 (zextloadi8 node:$ptr))>;
1222 def zextloadi32i16 : PatFrag<(ops node:$ptr), (i32 (zextloadi16 node:$ptr))>;
1223 def zextloadi64i1  : PatFrag<(ops node:$ptr), (i64 (zextloadi1 node:$ptr))>;
1224 def zextloadi64i8  : PatFrag<(ops node:$ptr), (i64 (zextloadi8 node:$ptr))>;
1225 def zextloadi64i16 : PatFrag<(ops node:$ptr), (i64 (zextloadi16 node:$ptr))>;
1226 def zextloadi64i32 : PatFrag<(ops node:$ptr), (i64 (zextloadi32 node:$ptr))>;
1227
1228 def extloadi8i1    : PatFrag<(ops node:$ptr), (i8  (extloadi1 node:$ptr))>;
1229 def extloadi16i1   : PatFrag<(ops node:$ptr), (i16 (extloadi1 node:$ptr))>;
1230 def extloadi32i1   : PatFrag<(ops node:$ptr), (i32 (extloadi1 node:$ptr))>;
1231 def extloadi16i8   : PatFrag<(ops node:$ptr), (i16 (extloadi8 node:$ptr))>;
1232 def extloadi32i8   : PatFrag<(ops node:$ptr), (i32 (extloadi8 node:$ptr))>;
1233 def extloadi32i16  : PatFrag<(ops node:$ptr), (i32 (extloadi16 node:$ptr))>;
1234 def extloadi64i1   : PatFrag<(ops node:$ptr), (i64 (extloadi1 node:$ptr))>;
1235 def extloadi64i8   : PatFrag<(ops node:$ptr), (i64 (extloadi8 node:$ptr))>;
1236 def extloadi64i16  : PatFrag<(ops node:$ptr), (i64 (extloadi16 node:$ptr))>;
1237
1238 // We can treat an i8/i16 extending load to i64 as a 32 bit load if its known
1239 // to be 4 byte aligned or better.
1240 def extloadi64i32  : PatFrag<(ops node:$ptr), (i64 (unindexedload node:$ptr)), [{
1241   LoadSDNode *LD = cast<LoadSDNode>(N);
1242   ISD::LoadExtType ExtType = LD->getExtensionType();
1243   if (ExtType != ISD::EXTLOAD)
1244     return false;
1245   if (LD->getMemoryVT() == MVT::i32)
1246     return true;
1247
1248   return LD->getAlignment() >= 4 && LD->isSimple();
1249 }]>;
1250
1251
1252 // An 'and' node with a single use.
1253 def and_su : PatFrag<(ops node:$lhs, node:$rhs), (and node:$lhs, node:$rhs), [{
1254   return N->hasOneUse();
1255 }]>;
1256 // An 'srl' node with a single use.
1257 def srl_su : PatFrag<(ops node:$lhs, node:$rhs), (srl node:$lhs, node:$rhs), [{
1258   return N->hasOneUse();
1259 }]>;
1260 // An 'trunc' node with a single use.
1261 def trunc_su : PatFrag<(ops node:$src), (trunc node:$src), [{
1262   return N->hasOneUse();
1263 }]>;
1264
1265 //===----------------------------------------------------------------------===//
1266 // Instruction list.
1267 //
1268
1269 // Nop
1270 let hasSideEffects = 0, SchedRW = [WriteNop] in {
1271   def NOOP : I<0x90, RawFrm, (outs), (ins), "nop", []>;
1272   def NOOPW : I<0x1f, MRMXm, (outs), (ins i16mem:$zero),
1273                 "nop{w}\t$zero", []>, TB, OpSize16, NotMemoryFoldable;
1274   def NOOPL : I<0x1f, MRMXm, (outs), (ins i32mem:$zero),
1275                 "nop{l}\t$zero", []>, TB, OpSize32, NotMemoryFoldable;
1276   def NOOPQ : RI<0x1f, MRMXm, (outs), (ins i64mem:$zero),
1277                 "nop{q}\t$zero", []>, TB, NotMemoryFoldable,
1278                 Requires<[In64BitMode]>;
1279   // Also allow register so we can assemble/disassemble
1280   def NOOPWr : I<0x1f, MRMXr, (outs), (ins GR16:$zero),
1281                  "nop{w}\t$zero", []>, TB, OpSize16, NotMemoryFoldable;
1282   def NOOPLr : I<0x1f, MRMXr, (outs), (ins GR32:$zero),
1283                  "nop{l}\t$zero", []>, TB, OpSize32, NotMemoryFoldable;
1284   def NOOPQr : RI<0x1f, MRMXr, (outs), (ins GR64:$zero),
1285                   "nop{q}\t$zero", []>, TB, NotMemoryFoldable,
1286                   Requires<[In64BitMode]>;
1287 }
1288
1289
1290 // Constructing a stack frame.
1291 def ENTER : Ii16<0xC8, RawFrmImm8, (outs), (ins i16imm:$len, i8imm:$lvl),
1292                  "enter\t$len, $lvl", []>, Sched<[WriteMicrocoded]>;
1293
1294 let SchedRW = [WriteALU] in {
1295 let Defs = [EBP, ESP], Uses = [EBP, ESP], mayLoad = 1, hasSideEffects=0 in
1296 def LEAVE    : I<0xC9, RawFrm, (outs), (ins), "leave", []>,
1297                  Requires<[Not64BitMode]>;
1298
1299 let Defs = [RBP,RSP], Uses = [RBP,RSP], mayLoad = 1, hasSideEffects = 0 in
1300 def LEAVE64  : I<0xC9, RawFrm, (outs), (ins), "leave", []>,
1301                  Requires<[In64BitMode]>;
1302 } // SchedRW
1303
1304 //===----------------------------------------------------------------------===//
1305 //  Miscellaneous Instructions.
1306 //
1307
1308 let isBarrier = 1, hasSideEffects = 1, usesCustomInserter = 1,
1309     SchedRW = [WriteSystem] in
1310   def Int_eh_sjlj_setup_dispatch
1311     : PseudoI<(outs), (ins), [(X86eh_sjlj_setup_dispatch)]>;
1312
1313 let Defs = [ESP], Uses = [ESP], hasSideEffects=0 in {
1314 let mayLoad = 1, SchedRW = [WriteLoad] in {
1315 def POP16r  : I<0x58, AddRegFrm, (outs GR16:$reg), (ins), "pop{w}\t$reg", []>,
1316                 OpSize16;
1317 def POP32r  : I<0x58, AddRegFrm, (outs GR32:$reg), (ins), "pop{l}\t$reg", []>,
1318                 OpSize32, Requires<[Not64BitMode]>;
1319 // Long form for the disassembler.
1320 let isCodeGenOnly = 1, ForceDisassemble = 1 in {
1321 def POP16rmr: I<0x8F, MRM0r, (outs GR16:$reg), (ins), "pop{w}\t$reg", []>,
1322                 OpSize16, NotMemoryFoldable;
1323 def POP32rmr: I<0x8F, MRM0r, (outs GR32:$reg), (ins), "pop{l}\t$reg", []>,
1324                 OpSize32, Requires<[Not64BitMode]>, NotMemoryFoldable;
1325 } // isCodeGenOnly = 1, ForceDisassemble = 1
1326 } // mayLoad, SchedRW
1327 let mayStore = 1, mayLoad = 1, SchedRW = [WriteCopy] in {
1328 def POP16rmm: I<0x8F, MRM0m, (outs), (ins i16mem:$dst), "pop{w}\t$dst", []>,
1329                 OpSize16;
1330 def POP32rmm: I<0x8F, MRM0m, (outs), (ins i32mem:$dst), "pop{l}\t$dst", []>,
1331                 OpSize32, Requires<[Not64BitMode]>;
1332 } // mayStore, mayLoad, SchedRW
1333
1334 let mayStore = 1, SchedRW = [WriteStore] in {
1335 def PUSH16r  : I<0x50, AddRegFrm, (outs), (ins GR16:$reg), "push{w}\t$reg",[]>,
1336                  OpSize16;
1337 def PUSH32r  : I<0x50, AddRegFrm, (outs), (ins GR32:$reg), "push{l}\t$reg",[]>,
1338                  OpSize32, Requires<[Not64BitMode]>;
1339 // Long form for the disassembler.
1340 let isCodeGenOnly = 1, ForceDisassemble = 1 in {
1341 def PUSH16rmr: I<0xFF, MRM6r, (outs), (ins GR16:$reg), "push{w}\t$reg",[]>,
1342                  OpSize16, NotMemoryFoldable;
1343 def PUSH32rmr: I<0xFF, MRM6r, (outs), (ins GR32:$reg), "push{l}\t$reg",[]>,
1344                  OpSize32, Requires<[Not64BitMode]>, NotMemoryFoldable;
1345 } // isCodeGenOnly = 1, ForceDisassemble = 1
1346
1347 def PUSH16i8 : Ii8<0x6a, RawFrm, (outs), (ins i16i8imm:$imm),
1348                    "push{w}\t$imm", []>, OpSize16;
1349 def PUSHi16  : Ii16<0x68, RawFrm, (outs), (ins i16imm:$imm),
1350                    "push{w}\t$imm", []>, OpSize16;
1351
1352 def PUSH32i8 : Ii8<0x6a, RawFrm, (outs), (ins i32i8imm:$imm),
1353                    "push{l}\t$imm", []>, OpSize32,
1354                    Requires<[Not64BitMode]>;
1355 def PUSHi32  : Ii32<0x68, RawFrm, (outs), (ins i32imm:$imm),
1356                    "push{l}\t$imm", []>, OpSize32,
1357                    Requires<[Not64BitMode]>;
1358 } // mayStore, SchedRW
1359
1360 let mayLoad = 1, mayStore = 1, SchedRW = [WriteCopy] in {
1361 def PUSH16rmm: I<0xFF, MRM6m, (outs), (ins i16mem:$src), "push{w}\t$src", []>,
1362                  OpSize16;
1363 def PUSH32rmm: I<0xFF, MRM6m, (outs), (ins i32mem:$src), "push{l}\t$src", []>,
1364                  OpSize32, Requires<[Not64BitMode]>;
1365 } // mayLoad, mayStore, SchedRW
1366
1367 }
1368
1369 let mayLoad = 1, mayStore = 1, usesCustomInserter = 1,
1370     SchedRW = [WriteRMW], Defs = [ESP] in {
1371   let Uses = [ESP] in
1372   def RDFLAGS32 : PseudoI<(outs GR32:$dst), (ins),
1373                    [(set GR32:$dst, (int_x86_flags_read_u32))]>,
1374                 Requires<[Not64BitMode]>;
1375
1376   let Uses = [RSP] in
1377   def RDFLAGS64 : PseudoI<(outs GR64:$dst), (ins),
1378                    [(set GR64:$dst, (int_x86_flags_read_u64))]>,
1379                 Requires<[In64BitMode]>;
1380 }
1381
1382 let mayLoad = 1, mayStore = 1, usesCustomInserter = 1,
1383     SchedRW = [WriteRMW] in {
1384   let Defs = [ESP, EFLAGS, DF], Uses = [ESP] in
1385   def WRFLAGS32 : PseudoI<(outs), (ins GR32:$src),
1386                    [(int_x86_flags_write_u32 GR32:$src)]>,
1387                 Requires<[Not64BitMode]>;
1388
1389   let Defs = [RSP, EFLAGS, DF], Uses = [RSP] in
1390   def WRFLAGS64 : PseudoI<(outs), (ins GR64:$src),
1391                    [(int_x86_flags_write_u64 GR64:$src)]>,
1392                 Requires<[In64BitMode]>;
1393 }
1394
1395 let Defs = [ESP, EFLAGS, DF], Uses = [ESP], mayLoad = 1, hasSideEffects=0,
1396     SchedRW = [WriteLoad] in {
1397 def POPF16   : I<0x9D, RawFrm, (outs), (ins), "popf{w}", []>, OpSize16;
1398 def POPF32   : I<0x9D, RawFrm, (outs), (ins), "popf{l|d}", []>, OpSize32,
1399                  Requires<[Not64BitMode]>;
1400 }
1401
1402 let Defs = [ESP], Uses = [ESP, EFLAGS, DF], mayStore = 1, hasSideEffects=0,
1403     SchedRW = [WriteStore] in {
1404 def PUSHF16  : I<0x9C, RawFrm, (outs), (ins), "pushf{w}", []>, OpSize16;
1405 def PUSHF32  : I<0x9C, RawFrm, (outs), (ins), "pushf{l|d}", []>, OpSize32,
1406                  Requires<[Not64BitMode]>;
1407 }
1408
1409 let Defs = [RSP], Uses = [RSP], hasSideEffects=0 in {
1410 let mayLoad = 1, SchedRW = [WriteLoad] in {
1411 def POP64r   : I<0x58, AddRegFrm, (outs GR64:$reg), (ins), "pop{q}\t$reg", []>,
1412                  OpSize32, Requires<[In64BitMode]>;
1413 // Long form for the disassembler.
1414 let isCodeGenOnly = 1, ForceDisassemble = 1 in {
1415 def POP64rmr: I<0x8F, MRM0r, (outs GR64:$reg), (ins), "pop{q}\t$reg", []>,
1416                 OpSize32, Requires<[In64BitMode]>, NotMemoryFoldable;
1417 } // isCodeGenOnly = 1, ForceDisassemble = 1
1418 } // mayLoad, SchedRW
1419 let mayLoad = 1, mayStore = 1, SchedRW = [WriteCopy] in
1420 def POP64rmm: I<0x8F, MRM0m, (outs), (ins i64mem:$dst), "pop{q}\t$dst", []>,
1421                 OpSize32, Requires<[In64BitMode]>;
1422 let mayStore = 1, SchedRW = [WriteStore] in {
1423 def PUSH64r  : I<0x50, AddRegFrm, (outs), (ins GR64:$reg), "push{q}\t$reg", []>,
1424                  OpSize32, Requires<[In64BitMode]>;
1425 // Long form for the disassembler.
1426 let isCodeGenOnly = 1, ForceDisassemble = 1 in {
1427 def PUSH64rmr: I<0xFF, MRM6r, (outs), (ins GR64:$reg), "push{q}\t$reg", []>,
1428                  OpSize32, Requires<[In64BitMode]>, NotMemoryFoldable;
1429 } // isCodeGenOnly = 1, ForceDisassemble = 1
1430 } // mayStore, SchedRW
1431 let mayLoad = 1, mayStore = 1, SchedRW = [WriteCopy] in {
1432 def PUSH64rmm: I<0xFF, MRM6m, (outs), (ins i64mem:$src), "push{q}\t$src", []>,
1433                  OpSize32, Requires<[In64BitMode]>;
1434 } // mayLoad, mayStore, SchedRW
1435 }
1436
1437 let Defs = [RSP], Uses = [RSP], hasSideEffects = 0, mayStore = 1,
1438     SchedRW = [WriteStore] in {
1439 def PUSH64i8   : Ii8<0x6a, RawFrm, (outs), (ins i64i8imm:$imm),
1440                     "push{q}\t$imm", []>, OpSize32,
1441                     Requires<[In64BitMode]>;
1442 def PUSH64i32  : Ii32S<0x68, RawFrm, (outs), (ins i64i32imm:$imm),
1443                     "push{q}\t$imm", []>, OpSize32,
1444                     Requires<[In64BitMode]>;
1445 }
1446
1447 let Defs = [RSP, EFLAGS, DF], Uses = [RSP], mayLoad = 1, hasSideEffects=0 in
1448 def POPF64   : I<0x9D, RawFrm, (outs), (ins), "popfq", []>,
1449                OpSize32, Requires<[In64BitMode]>, Sched<[WriteLoad]>;
1450 let Defs = [RSP], Uses = [RSP, EFLAGS, DF], mayStore = 1, hasSideEffects=0 in
1451 def PUSHF64    : I<0x9C, RawFrm, (outs), (ins), "pushfq", []>,
1452                  OpSize32, Requires<[In64BitMode]>, Sched<[WriteStore]>;
1453
1454 let Defs = [EDI, ESI, EBP, EBX, EDX, ECX, EAX, ESP], Uses = [ESP],
1455     mayLoad = 1, hasSideEffects = 0, SchedRW = [WriteLoad] in {
1456 def POPA32   : I<0x61, RawFrm, (outs), (ins), "popal", []>,
1457                OpSize32, Requires<[Not64BitMode]>;
1458 def POPA16   : I<0x61, RawFrm, (outs), (ins), "popaw", []>,
1459                OpSize16, Requires<[Not64BitMode]>;
1460 }
1461 let Defs = [ESP], Uses = [EDI, ESI, EBP, EBX, EDX, ECX, EAX, ESP],
1462     mayStore = 1, hasSideEffects = 0, SchedRW = [WriteStore] in {
1463 def PUSHA32  : I<0x60, RawFrm, (outs), (ins), "pushal", []>,
1464                OpSize32, Requires<[Not64BitMode]>;
1465 def PUSHA16  : I<0x60, RawFrm, (outs), (ins), "pushaw", []>,
1466                OpSize16, Requires<[Not64BitMode]>;
1467 }
1468
1469 let Constraints = "$src = $dst", SchedRW = [WriteBSWAP32] in {
1470 // This instruction is a consequence of BSWAP32r observing operand size. The
1471 // encoding is valid, but the behavior is undefined.
1472 let isCodeGenOnly = 1, ForceDisassemble = 1, hasSideEffects = 0 in
1473 def BSWAP16r_BAD : I<0xC8, AddRegFrm, (outs GR16:$dst), (ins GR16:$src),
1474                      "bswap{w}\t$dst", []>, OpSize16, TB;
1475 // GR32 = bswap GR32
1476 def BSWAP32r : I<0xC8, AddRegFrm, (outs GR32:$dst), (ins GR32:$src),
1477                  "bswap{l}\t$dst",
1478                  [(set GR32:$dst, (bswap GR32:$src))]>, OpSize32, TB;
1479
1480 let SchedRW = [WriteBSWAP64] in
1481 def BSWAP64r : RI<0xC8, AddRegFrm, (outs GR64:$dst), (ins GR64:$src),
1482                   "bswap{q}\t$dst",
1483                   [(set GR64:$dst, (bswap GR64:$src))]>, TB;
1484 } // Constraints = "$src = $dst", SchedRW
1485
1486 // Bit scan instructions.
1487 let Defs = [EFLAGS] in {
1488 def BSF16rr  : I<0xBC, MRMSrcReg, (outs GR16:$dst), (ins GR16:$src),
1489                  "bsf{w}\t{$src, $dst|$dst, $src}",
1490                  [(set GR16:$dst, EFLAGS, (X86bsf GR16:$src))]>,
1491                   PS, OpSize16, Sched<[WriteBSF]>;
1492 def BSF16rm  : I<0xBC, MRMSrcMem, (outs GR16:$dst), (ins i16mem:$src),
1493                  "bsf{w}\t{$src, $dst|$dst, $src}",
1494                  [(set GR16:$dst, EFLAGS, (X86bsf (loadi16 addr:$src)))]>,
1495                  PS, OpSize16, Sched<[WriteBSFLd]>;
1496 def BSF32rr  : I<0xBC, MRMSrcReg, (outs GR32:$dst), (ins GR32:$src),
1497                  "bsf{l}\t{$src, $dst|$dst, $src}",
1498                  [(set GR32:$dst, EFLAGS, (X86bsf GR32:$src))]>,
1499                  PS, OpSize32, Sched<[WriteBSF]>;
1500 def BSF32rm  : I<0xBC, MRMSrcMem, (outs GR32:$dst), (ins i32mem:$src),
1501                  "bsf{l}\t{$src, $dst|$dst, $src}",
1502                  [(set GR32:$dst, EFLAGS, (X86bsf (loadi32 addr:$src)))]>,
1503                  PS, OpSize32, Sched<[WriteBSFLd]>;
1504 def BSF64rr  : RI<0xBC, MRMSrcReg, (outs GR64:$dst), (ins GR64:$src),
1505                   "bsf{q}\t{$src, $dst|$dst, $src}",
1506                   [(set GR64:$dst, EFLAGS, (X86bsf GR64:$src))]>,
1507                   PS, Sched<[WriteBSF]>;
1508 def BSF64rm  : RI<0xBC, MRMSrcMem, (outs GR64:$dst), (ins i64mem:$src),
1509                   "bsf{q}\t{$src, $dst|$dst, $src}",
1510                   [(set GR64:$dst, EFLAGS, (X86bsf (loadi64 addr:$src)))]>,
1511                   PS, Sched<[WriteBSFLd]>;
1512
1513 def BSR16rr  : I<0xBD, MRMSrcReg, (outs GR16:$dst), (ins GR16:$src),
1514                  "bsr{w}\t{$src, $dst|$dst, $src}",
1515                  [(set GR16:$dst, EFLAGS, (X86bsr GR16:$src))]>,
1516                  PS, OpSize16, Sched<[WriteBSR]>;
1517 def BSR16rm  : I<0xBD, MRMSrcMem, (outs GR16:$dst), (ins i16mem:$src),
1518                  "bsr{w}\t{$src, $dst|$dst, $src}",
1519                  [(set GR16:$dst, EFLAGS, (X86bsr (loadi16 addr:$src)))]>,
1520                  PS, OpSize16, Sched<[WriteBSRLd]>;
1521 def BSR32rr  : I<0xBD, MRMSrcReg, (outs GR32:$dst), (ins GR32:$src),
1522                  "bsr{l}\t{$src, $dst|$dst, $src}",
1523                  [(set GR32:$dst, EFLAGS, (X86bsr GR32:$src))]>,
1524                  PS, OpSize32, Sched<[WriteBSR]>;
1525 def BSR32rm  : I<0xBD, MRMSrcMem, (outs GR32:$dst), (ins i32mem:$src),
1526                  "bsr{l}\t{$src, $dst|$dst, $src}",
1527                  [(set GR32:$dst, EFLAGS, (X86bsr (loadi32 addr:$src)))]>,
1528                  PS, OpSize32, Sched<[WriteBSRLd]>;
1529 def BSR64rr  : RI<0xBD, MRMSrcReg, (outs GR64:$dst), (ins GR64:$src),
1530                   "bsr{q}\t{$src, $dst|$dst, $src}",
1531                   [(set GR64:$dst, EFLAGS, (X86bsr GR64:$src))]>,
1532                   PS, Sched<[WriteBSR]>;
1533 def BSR64rm  : RI<0xBD, MRMSrcMem, (outs GR64:$dst), (ins i64mem:$src),
1534                   "bsr{q}\t{$src, $dst|$dst, $src}",
1535                   [(set GR64:$dst, EFLAGS, (X86bsr (loadi64 addr:$src)))]>,
1536                   PS, Sched<[WriteBSRLd]>;
1537 } // Defs = [EFLAGS]
1538
1539 let SchedRW = [WriteMicrocoded] in {
1540 let Defs = [EDI,ESI], Uses = [EDI,ESI,DF] in {
1541 def MOVSB : I<0xA4, RawFrmDstSrc, (outs), (ins dstidx8:$dst, srcidx8:$src),
1542               "movsb\t{$src, $dst|$dst, $src}", []>;
1543 def MOVSW : I<0xA5, RawFrmDstSrc, (outs), (ins dstidx16:$dst, srcidx16:$src),
1544               "movsw\t{$src, $dst|$dst, $src}", []>, OpSize16;
1545 def MOVSL : I<0xA5, RawFrmDstSrc, (outs), (ins dstidx32:$dst, srcidx32:$src),
1546               "movs{l|d}\t{$src, $dst|$dst, $src}", []>, OpSize32;
1547 def MOVSQ : RI<0xA5, RawFrmDstSrc, (outs), (ins dstidx64:$dst, srcidx64:$src),
1548                "movsq\t{$src, $dst|$dst, $src}", []>,
1549                Requires<[In64BitMode]>;
1550 }
1551
1552 let Defs = [EDI], Uses = [AL,EDI,DF] in
1553 def STOSB : I<0xAA, RawFrmDst, (outs), (ins dstidx8:$dst),
1554               "stosb\t{%al, $dst|$dst, al}", []>;
1555 let Defs = [EDI], Uses = [AX,EDI,DF] in
1556 def STOSW : I<0xAB, RawFrmDst, (outs), (ins dstidx16:$dst),
1557               "stosw\t{%ax, $dst|$dst, ax}", []>, OpSize16;
1558 let Defs = [EDI], Uses = [EAX,EDI,DF] in
1559 def STOSL : I<0xAB, RawFrmDst, (outs), (ins dstidx32:$dst),
1560               "stos{l|d}\t{%eax, $dst|$dst, eax}", []>, OpSize32;
1561 let Defs = [RDI], Uses = [RAX,RDI,DF] in
1562 def STOSQ : RI<0xAB, RawFrmDst, (outs), (ins dstidx64:$dst),
1563                "stosq\t{%rax, $dst|$dst, rax}", []>,
1564                Requires<[In64BitMode]>;
1565
1566 let Defs = [EDI,EFLAGS], Uses = [AL,EDI,DF] in
1567 def SCASB : I<0xAE, RawFrmDst, (outs), (ins dstidx8:$dst),
1568               "scasb\t{$dst, %al|al, $dst}", []>;
1569 let Defs = [EDI,EFLAGS], Uses = [AX,EDI,DF] in
1570 def SCASW : I<0xAF, RawFrmDst, (outs), (ins dstidx16:$dst),
1571               "scasw\t{$dst, %ax|ax, $dst}", []>, OpSize16;
1572 let Defs = [EDI,EFLAGS], Uses = [EAX,EDI,DF] in
1573 def SCASL : I<0xAF, RawFrmDst, (outs), (ins dstidx32:$dst),
1574               "scas{l|d}\t{$dst, %eax|eax, $dst}", []>, OpSize32;
1575 let Defs = [EDI,EFLAGS], Uses = [RAX,EDI,DF] in
1576 def SCASQ : RI<0xAF, RawFrmDst, (outs), (ins dstidx64:$dst),
1577                "scasq\t{$dst, %rax|rax, $dst}", []>,
1578                Requires<[In64BitMode]>;
1579
1580 let Defs = [EDI,ESI,EFLAGS], Uses = [EDI,ESI,DF] in {
1581 def CMPSB : I<0xA6, RawFrmDstSrc, (outs), (ins dstidx8:$dst, srcidx8:$src),
1582               "cmpsb\t{$dst, $src|$src, $dst}", []>;
1583 def CMPSW : I<0xA7, RawFrmDstSrc, (outs), (ins dstidx16:$dst, srcidx16:$src),
1584               "cmpsw\t{$dst, $src|$src, $dst}", []>, OpSize16;
1585 def CMPSL : I<0xA7, RawFrmDstSrc, (outs), (ins dstidx32:$dst, srcidx32:$src),
1586               "cmps{l|d}\t{$dst, $src|$src, $dst}", []>, OpSize32;
1587 def CMPSQ : RI<0xA7, RawFrmDstSrc, (outs), (ins dstidx64:$dst, srcidx64:$src),
1588                "cmpsq\t{$dst, $src|$src, $dst}", []>,
1589                Requires<[In64BitMode]>;
1590 }
1591 } // SchedRW
1592
1593 //===----------------------------------------------------------------------===//
1594 //  Move Instructions.
1595 //
1596 let SchedRW = [WriteMove] in {
1597 let hasSideEffects = 0, isMoveReg = 1 in {
1598 def MOV8rr  : I<0x88, MRMDestReg, (outs GR8 :$dst), (ins GR8 :$src),
1599                 "mov{b}\t{$src, $dst|$dst, $src}", []>;
1600 def MOV16rr : I<0x89, MRMDestReg, (outs GR16:$dst), (ins GR16:$src),
1601                 "mov{w}\t{$src, $dst|$dst, $src}", []>, OpSize16;
1602 def MOV32rr : I<0x89, MRMDestReg, (outs GR32:$dst), (ins GR32:$src),
1603                 "mov{l}\t{$src, $dst|$dst, $src}", []>, OpSize32;
1604 def MOV64rr : RI<0x89, MRMDestReg, (outs GR64:$dst), (ins GR64:$src),
1605                  "mov{q}\t{$src, $dst|$dst, $src}", []>;
1606 }
1607
1608 let isReMaterializable = 1, isAsCheapAsAMove = 1, isMoveImm = 1 in {
1609 def MOV8ri  : Ii8 <0xB0, AddRegFrm, (outs GR8 :$dst), (ins i8imm :$src),
1610                    "mov{b}\t{$src, $dst|$dst, $src}",
1611                    [(set GR8:$dst, imm:$src)]>;
1612 def MOV16ri : Ii16<0xB8, AddRegFrm, (outs GR16:$dst), (ins i16imm:$src),
1613                    "mov{w}\t{$src, $dst|$dst, $src}",
1614                    [(set GR16:$dst, imm:$src)]>, OpSize16;
1615 def MOV32ri : Ii32<0xB8, AddRegFrm, (outs GR32:$dst), (ins i32imm:$src),
1616                    "mov{l}\t{$src, $dst|$dst, $src}",
1617                    [(set GR32:$dst, imm:$src)]>, OpSize32;
1618 def MOV64ri32 : RIi32S<0xC7, MRM0r, (outs GR64:$dst), (ins i64i32imm:$src),
1619                        "mov{q}\t{$src, $dst|$dst, $src}",
1620                        [(set GR64:$dst, i64immSExt32:$src)]>;
1621 }
1622 let isReMaterializable = 1, isMoveImm = 1 in {
1623 def MOV64ri : RIi64<0xB8, AddRegFrm, (outs GR64:$dst), (ins i64imm:$src),
1624                     "movabs{q}\t{$src, $dst|$dst, $src}",
1625                     [(set GR64:$dst, imm:$src)]>;
1626 }
1627
1628 // Longer forms that use a ModR/M byte. Needed for disassembler
1629 let isCodeGenOnly = 1, ForceDisassemble = 1, hasSideEffects = 0 in {
1630 def MOV8ri_alt  : Ii8 <0xC6, MRM0r, (outs GR8 :$dst), (ins i8imm :$src),
1631                    "mov{b}\t{$src, $dst|$dst, $src}", []>,
1632                    FoldGenData<"MOV8ri">;
1633 def MOV16ri_alt : Ii16<0xC7, MRM0r, (outs GR16:$dst), (ins i16imm:$src),
1634                    "mov{w}\t{$src, $dst|$dst, $src}", []>, OpSize16,
1635                    FoldGenData<"MOV16ri">;
1636 def MOV32ri_alt : Ii32<0xC7, MRM0r, (outs GR32:$dst), (ins i32imm:$src),
1637                    "mov{l}\t{$src, $dst|$dst, $src}", []>, OpSize32,
1638                    FoldGenData<"MOV32ri">;
1639 }
1640 } // SchedRW
1641
1642 let SchedRW = [WriteStore] in {
1643 def MOV8mi  : Ii8 <0xC6, MRM0m, (outs), (ins i8mem :$dst, i8imm :$src),
1644                    "mov{b}\t{$src, $dst|$dst, $src}",
1645                    [(store (i8 imm_su:$src), addr:$dst)]>;
1646 def MOV16mi : Ii16<0xC7, MRM0m, (outs), (ins i16mem:$dst, i16imm:$src),
1647                    "mov{w}\t{$src, $dst|$dst, $src}",
1648                    [(store (i16 imm_su:$src), addr:$dst)]>, OpSize16;
1649 def MOV32mi : Ii32<0xC7, MRM0m, (outs), (ins i32mem:$dst, i32imm:$src),
1650                    "mov{l}\t{$src, $dst|$dst, $src}",
1651                    [(store (i32 imm_su:$src), addr:$dst)]>, OpSize32;
1652 def MOV64mi32 : RIi32S<0xC7, MRM0m, (outs), (ins i64mem:$dst, i64i32imm:$src),
1653                        "mov{q}\t{$src, $dst|$dst, $src}",
1654                        [(store i64immSExt32_su:$src, addr:$dst)]>,
1655                        Requires<[In64BitMode]>;
1656 } // SchedRW
1657
1658 def : Pat<(i32 relocImm:$src), (MOV32ri relocImm:$src)>;
1659 def : Pat<(i64 relocImm:$src), (MOV64ri relocImm:$src)>;
1660
1661 def : Pat<(store (i8 relocImm8_su:$src), addr:$dst),
1662           (MOV8mi addr:$dst, relocImm8_su:$src)>;
1663 def : Pat<(store (i16 relocImm16_su:$src), addr:$dst),
1664           (MOV16mi addr:$dst, relocImm16_su:$src)>;
1665 def : Pat<(store (i32 relocImm32_su:$src), addr:$dst),
1666           (MOV32mi addr:$dst, relocImm32_su:$src)>;
1667 def : Pat<(store (i64 i64relocImmSExt32_su:$src), addr:$dst),
1668           (MOV64mi32 addr:$dst, i64immSExt32_su:$src)>;
1669
1670 let hasSideEffects = 0 in {
1671
1672 /// Memory offset versions of moves. The immediate is an address mode sized
1673 /// offset from the segment base.
1674 let SchedRW = [WriteALU] in {
1675 let mayLoad = 1 in {
1676 let Defs = [AL] in
1677 def MOV8ao32 : Ii32<0xA0, RawFrmMemOffs, (outs), (ins offset32_8:$src),
1678                     "mov{b}\t{$src, %al|al, $src}", []>,
1679                     AdSize32;
1680 let Defs = [AX] in
1681 def MOV16ao32 : Ii32<0xA1, RawFrmMemOffs, (outs), (ins offset32_16:$src),
1682                      "mov{w}\t{$src, %ax|ax, $src}", []>,
1683                      OpSize16, AdSize32;
1684 let Defs = [EAX] in
1685 def MOV32ao32 : Ii32<0xA1, RawFrmMemOffs, (outs), (ins offset32_32:$src),
1686                      "mov{l}\t{$src, %eax|eax, $src}", []>,
1687                      OpSize32, AdSize32;
1688 let Defs = [RAX] in
1689 def MOV64ao32 : RIi32<0xA1, RawFrmMemOffs, (outs), (ins offset32_64:$src),
1690                       "mov{q}\t{$src, %rax|rax, $src}", []>,
1691                       AdSize32;
1692
1693 let Defs = [AL] in
1694 def MOV8ao16 : Ii16<0xA0, RawFrmMemOffs, (outs), (ins offset16_8:$src),
1695                     "mov{b}\t{$src, %al|al, $src}", []>, AdSize16;
1696 let Defs = [AX] in
1697 def MOV16ao16 : Ii16<0xA1, RawFrmMemOffs, (outs), (ins offset16_16:$src),
1698                      "mov{w}\t{$src, %ax|ax, $src}", []>,
1699                      OpSize16, AdSize16;
1700 let Defs = [EAX] in
1701 def MOV32ao16 : Ii16<0xA1, RawFrmMemOffs, (outs), (ins offset16_32:$src),
1702                      "mov{l}\t{$src, %eax|eax, $src}", []>,
1703                      AdSize16, OpSize32;
1704 } // mayLoad
1705 let mayStore = 1 in {
1706 let Uses = [AL] in
1707 def MOV8o32a : Ii32<0xA2, RawFrmMemOffs, (outs), (ins offset32_8:$dst),
1708                     "mov{b}\t{%al, $dst|$dst, al}", []>, AdSize32;
1709 let Uses = [AX] in
1710 def MOV16o32a : Ii32<0xA3, RawFrmMemOffs, (outs), (ins offset32_16:$dst),
1711                      "mov{w}\t{%ax, $dst|$dst, ax}", []>,
1712                      OpSize16, AdSize32;
1713 let Uses = [EAX] in
1714 def MOV32o32a : Ii32<0xA3, RawFrmMemOffs, (outs), (ins offset32_32:$dst),
1715                      "mov{l}\t{%eax, $dst|$dst, eax}", []>,
1716                      OpSize32, AdSize32;
1717 let Uses = [RAX] in
1718 def MOV64o32a : RIi32<0xA3, RawFrmMemOffs, (outs), (ins offset32_64:$dst),
1719                       "mov{q}\t{%rax, $dst|$dst, rax}", []>,
1720                       AdSize32;
1721
1722 let Uses = [AL] in
1723 def MOV8o16a : Ii16<0xA2, RawFrmMemOffs, (outs), (ins offset16_8:$dst),
1724                     "mov{b}\t{%al, $dst|$dst, al}", []>, AdSize16;
1725 let Uses = [AX] in
1726 def MOV16o16a : Ii16<0xA3, RawFrmMemOffs, (outs), (ins offset16_16:$dst),
1727                      "mov{w}\t{%ax, $dst|$dst, ax}", []>,
1728                      OpSize16, AdSize16;
1729 let Uses = [EAX] in
1730 def MOV32o16a : Ii16<0xA3, RawFrmMemOffs, (outs), (ins offset16_32:$dst),
1731                      "mov{l}\t{%eax, $dst|$dst, eax}", []>,
1732                      OpSize32, AdSize16;
1733 } // mayStore
1734
1735 // These forms all have full 64-bit absolute addresses in their instructions
1736 // and use the movabs mnemonic to indicate this specific form.
1737 let mayLoad = 1 in {
1738 let Defs = [AL] in
1739 def MOV8ao64 : Ii64<0xA0, RawFrmMemOffs, (outs), (ins offset64_8:$src),
1740                     "movabs{b}\t{$src, %al|al, $src}", []>,
1741                     AdSize64;
1742 let Defs = [AX] in
1743 def MOV16ao64 : Ii64<0xA1, RawFrmMemOffs, (outs), (ins offset64_16:$src),
1744                      "movabs{w}\t{$src, %ax|ax, $src}", []>,
1745                      OpSize16, AdSize64;
1746 let Defs = [EAX] in
1747 def MOV32ao64 : Ii64<0xA1, RawFrmMemOffs, (outs), (ins offset64_32:$src),
1748                      "movabs{l}\t{$src, %eax|eax, $src}", []>,
1749                      OpSize32, AdSize64;
1750 let Defs = [RAX] in
1751 def MOV64ao64 : RIi64<0xA1, RawFrmMemOffs, (outs), (ins offset64_64:$src),
1752                      "movabs{q}\t{$src, %rax|rax, $src}", []>,
1753                      AdSize64;
1754 } // mayLoad
1755
1756 let mayStore = 1 in {
1757 let Uses = [AL] in
1758 def MOV8o64a : Ii64<0xA2, RawFrmMemOffs, (outs), (ins offset64_8:$dst),
1759                     "movabs{b}\t{%al, $dst|$dst, al}", []>,
1760                     AdSize64;
1761 let Uses = [AX] in
1762 def MOV16o64a : Ii64<0xA3, RawFrmMemOffs, (outs), (ins offset64_16:$dst),
1763                      "movabs{w}\t{%ax, $dst|$dst, ax}", []>,
1764                      OpSize16, AdSize64;
1765 let Uses = [EAX] in
1766 def MOV32o64a : Ii64<0xA3, RawFrmMemOffs, (outs), (ins offset64_32:$dst),
1767                      "movabs{l}\t{%eax, $dst|$dst, eax}", []>,
1768                      OpSize32, AdSize64;
1769 let Uses = [RAX] in
1770 def MOV64o64a : RIi64<0xA3, RawFrmMemOffs, (outs), (ins offset64_64:$dst),
1771                      "movabs{q}\t{%rax, $dst|$dst, rax}", []>,
1772                      AdSize64;
1773 } // mayStore
1774 } // SchedRW
1775 } // hasSideEffects = 0
1776
1777 let isCodeGenOnly = 1, ForceDisassemble = 1, hasSideEffects = 0,
1778     SchedRW = [WriteMove], isMoveReg = 1 in {
1779 def MOV8rr_REV : I<0x8A, MRMSrcReg, (outs GR8:$dst), (ins GR8:$src),
1780                    "mov{b}\t{$src, $dst|$dst, $src}", []>,
1781                    FoldGenData<"MOV8rr">;
1782 def MOV16rr_REV : I<0x8B, MRMSrcReg, (outs GR16:$dst), (ins GR16:$src),
1783                     "mov{w}\t{$src, $dst|$dst, $src}", []>, OpSize16,
1784                     FoldGenData<"MOV16rr">;
1785 def MOV32rr_REV : I<0x8B, MRMSrcReg, (outs GR32:$dst), (ins GR32:$src),
1786                     "mov{l}\t{$src, $dst|$dst, $src}", []>, OpSize32,
1787                     FoldGenData<"MOV32rr">;
1788 def MOV64rr_REV : RI<0x8B, MRMSrcReg, (outs GR64:$dst), (ins GR64:$src),
1789                      "mov{q}\t{$src, $dst|$dst, $src}", []>,
1790                      FoldGenData<"MOV64rr">;
1791 }
1792
1793 // Reversed version with ".s" suffix for GAS compatibility.
1794 def : InstAlias<"mov{b}.s\t{$src, $dst|$dst, $src}",
1795                 (MOV8rr_REV GR8:$dst, GR8:$src), 0>;
1796 def : InstAlias<"mov{w}.s\t{$src, $dst|$dst, $src}",
1797                 (MOV16rr_REV GR16:$dst, GR16:$src), 0>;
1798 def : InstAlias<"mov{l}.s\t{$src, $dst|$dst, $src}",
1799                 (MOV32rr_REV GR32:$dst, GR32:$src), 0>;
1800 def : InstAlias<"mov{q}.s\t{$src, $dst|$dst, $src}",
1801                 (MOV64rr_REV GR64:$dst, GR64:$src), 0>;
1802 def : InstAlias<"mov.s\t{$src, $dst|$dst, $src}",
1803                 (MOV8rr_REV GR8:$dst, GR8:$src), 0, "att">;
1804 def : InstAlias<"mov.s\t{$src, $dst|$dst, $src}",
1805                 (MOV16rr_REV GR16:$dst, GR16:$src), 0, "att">;
1806 def : InstAlias<"mov.s\t{$src, $dst|$dst, $src}",
1807                 (MOV32rr_REV GR32:$dst, GR32:$src), 0, "att">;
1808 def : InstAlias<"mov.s\t{$src, $dst|$dst, $src}",
1809                 (MOV64rr_REV GR64:$dst, GR64:$src), 0, "att">;
1810
1811 let canFoldAsLoad = 1, isReMaterializable = 1, SchedRW = [WriteLoad] in {
1812 def MOV8rm  : I<0x8A, MRMSrcMem, (outs GR8 :$dst), (ins i8mem :$src),
1813                 "mov{b}\t{$src, $dst|$dst, $src}",
1814                 [(set GR8:$dst, (loadi8 addr:$src))]>;
1815 def MOV16rm : I<0x8B, MRMSrcMem, (outs GR16:$dst), (ins i16mem:$src),
1816                 "mov{w}\t{$src, $dst|$dst, $src}",
1817                 [(set GR16:$dst, (loadi16 addr:$src))]>, OpSize16;
1818 def MOV32rm : I<0x8B, MRMSrcMem, (outs GR32:$dst), (ins i32mem:$src),
1819                 "mov{l}\t{$src, $dst|$dst, $src}",
1820                 [(set GR32:$dst, (loadi32 addr:$src))]>, OpSize32;
1821 def MOV64rm : RI<0x8B, MRMSrcMem, (outs GR64:$dst), (ins i64mem:$src),
1822                  "mov{q}\t{$src, $dst|$dst, $src}",
1823                  [(set GR64:$dst, (load addr:$src))]>;
1824 }
1825
1826 let SchedRW = [WriteStore] in {
1827 def MOV8mr  : I<0x88, MRMDestMem, (outs), (ins i8mem :$dst, GR8 :$src),
1828                 "mov{b}\t{$src, $dst|$dst, $src}",
1829                 [(store GR8:$src, addr:$dst)]>;
1830 def MOV16mr : I<0x89, MRMDestMem, (outs), (ins i16mem:$dst, GR16:$src),
1831                 "mov{w}\t{$src, $dst|$dst, $src}",
1832                 [(store GR16:$src, addr:$dst)]>, OpSize16;
1833 def MOV32mr : I<0x89, MRMDestMem, (outs), (ins i32mem:$dst, GR32:$src),
1834                 "mov{l}\t{$src, $dst|$dst, $src}",
1835                 [(store GR32:$src, addr:$dst)]>, OpSize32;
1836 def MOV64mr : RI<0x89, MRMDestMem, (outs), (ins i64mem:$dst, GR64:$src),
1837                  "mov{q}\t{$src, $dst|$dst, $src}",
1838                  [(store GR64:$src, addr:$dst)]>;
1839 } // SchedRW
1840
1841 // Versions of MOV8rr, MOV8mr, and MOV8rm that use i8mem_NOREX and GR8_NOREX so
1842 // that they can be used for copying and storing h registers, which can't be
1843 // encoded when a REX prefix is present.
1844 let isCodeGenOnly = 1 in {
1845 let hasSideEffects = 0, isMoveReg = 1 in
1846 def MOV8rr_NOREX : I<0x88, MRMDestReg,
1847                      (outs GR8_NOREX:$dst), (ins GR8_NOREX:$src),
1848                      "mov{b}\t{$src, $dst|$dst, $src}", []>,
1849                    Sched<[WriteMove]>;
1850 let mayStore = 1, hasSideEffects = 0 in
1851 def MOV8mr_NOREX : I<0x88, MRMDestMem,
1852                      (outs), (ins i8mem_NOREX:$dst, GR8_NOREX:$src),
1853                      "mov{b}\t{$src, $dst|$dst, $src}", []>,
1854                      Sched<[WriteStore]>;
1855 let mayLoad = 1, hasSideEffects = 0,
1856     canFoldAsLoad = 1, isReMaterializable = 1 in
1857 def MOV8rm_NOREX : I<0x8A, MRMSrcMem,
1858                      (outs GR8_NOREX:$dst), (ins i8mem_NOREX:$src),
1859                      "mov{b}\t{$src, $dst|$dst, $src}", []>,
1860                      Sched<[WriteLoad]>;
1861 }
1862
1863
1864 // Condition code ops, incl. set if equal/not equal/...
1865 let SchedRW = [WriteLAHFSAHF] in {
1866 let Defs = [EFLAGS], Uses = [AH], hasSideEffects = 0 in
1867 def SAHF     : I<0x9E, RawFrm, (outs),  (ins), "sahf", []>,  // flags = AH
1868                  Requires<[HasLAHFSAHF]>;
1869 let Defs = [AH], Uses = [EFLAGS], hasSideEffects = 0 in
1870 def LAHF     : I<0x9F, RawFrm, (outs),  (ins), "lahf", []>,  // AH = flags
1871                Requires<[HasLAHFSAHF]>;
1872 } // SchedRW
1873
1874 //===----------------------------------------------------------------------===//
1875 // Bit tests instructions: BT, BTS, BTR, BTC.
1876
1877 let Defs = [EFLAGS] in {
1878 let SchedRW = [WriteBitTest] in {
1879 def BT16rr : I<0xA3, MRMDestReg, (outs), (ins GR16:$src1, GR16:$src2),
1880                "bt{w}\t{$src2, $src1|$src1, $src2}",
1881                [(set EFLAGS, (X86bt GR16:$src1, GR16:$src2))]>,
1882                OpSize16, TB, NotMemoryFoldable;
1883 def BT32rr : I<0xA3, MRMDestReg, (outs), (ins GR32:$src1, GR32:$src2),
1884                "bt{l}\t{$src2, $src1|$src1, $src2}",
1885                [(set EFLAGS, (X86bt GR32:$src1, GR32:$src2))]>,
1886                OpSize32, TB, NotMemoryFoldable;
1887 def BT64rr : RI<0xA3, MRMDestReg, (outs), (ins GR64:$src1, GR64:$src2),
1888                "bt{q}\t{$src2, $src1|$src1, $src2}",
1889                [(set EFLAGS, (X86bt GR64:$src1, GR64:$src2))]>, TB,
1890                NotMemoryFoldable;
1891 } // SchedRW
1892
1893 // Unlike with the register+register form, the memory+register form of the
1894 // bt instruction does not ignore the high bits of the index. From ISel's
1895 // perspective, this is pretty bizarre. Make these instructions disassembly
1896 // only for now. These instructions are also slow on modern CPUs so that's
1897 // another reason to avoid generating them.
1898
1899 let mayLoad = 1, hasSideEffects = 0, SchedRW = [WriteBitTestRegLd] in {
1900   def BT16mr : I<0xA3, MRMDestMem, (outs), (ins i16mem:$src1, GR16:$src2),
1901                  "bt{w}\t{$src2, $src1|$src1, $src2}",
1902                  []>, OpSize16, TB, NotMemoryFoldable;
1903   def BT32mr : I<0xA3, MRMDestMem, (outs), (ins i32mem:$src1, GR32:$src2),
1904                  "bt{l}\t{$src2, $src1|$src1, $src2}",
1905                  []>, OpSize32, TB, NotMemoryFoldable;
1906   def BT64mr : RI<0xA3, MRMDestMem, (outs), (ins i64mem:$src1, GR64:$src2),
1907                  "bt{q}\t{$src2, $src1|$src1, $src2}",
1908                   []>, TB, NotMemoryFoldable;
1909 }
1910
1911 let SchedRW = [WriteBitTest] in {
1912 def BT16ri8 : Ii8<0xBA, MRM4r, (outs), (ins GR16:$src1, i16u8imm:$src2),
1913                 "bt{w}\t{$src2, $src1|$src1, $src2}",
1914                 [(set EFLAGS, (X86bt GR16:$src1, imm:$src2))]>,
1915                 OpSize16, TB;
1916 def BT32ri8 : Ii8<0xBA, MRM4r, (outs), (ins GR32:$src1, i32u8imm:$src2),
1917                 "bt{l}\t{$src2, $src1|$src1, $src2}",
1918                 [(set EFLAGS, (X86bt GR32:$src1, imm:$src2))]>,
1919                 OpSize32, TB;
1920 def BT64ri8 : RIi8<0xBA, MRM4r, (outs), (ins GR64:$src1, i64u8imm:$src2),
1921                 "bt{q}\t{$src2, $src1|$src1, $src2}",
1922                 [(set EFLAGS, (X86bt GR64:$src1, imm:$src2))]>, TB;
1923 } // SchedRW
1924
1925 // Note that these instructions aren't slow because that only applies when the
1926 // other operand is in a register. When it's an immediate, bt is still fast.
1927 let SchedRW = [WriteBitTestImmLd] in {
1928 def BT16mi8 : Ii8<0xBA, MRM4m, (outs), (ins i16mem:$src1, i16u8imm:$src2),
1929                   "bt{w}\t{$src2, $src1|$src1, $src2}",
1930                   [(set EFLAGS, (X86bt (loadi16 addr:$src1),
1931                                        imm:$src2))]>,
1932                   OpSize16, TB;
1933 def BT32mi8 : Ii8<0xBA, MRM4m, (outs), (ins i32mem:$src1, i32u8imm:$src2),
1934                   "bt{l}\t{$src2, $src1|$src1, $src2}",
1935                   [(set EFLAGS, (X86bt (loadi32 addr:$src1),
1936                                        imm:$src2))]>,
1937                   OpSize32, TB;
1938 def BT64mi8 : RIi8<0xBA, MRM4m, (outs), (ins i64mem:$src1, i64u8imm:$src2),
1939                 "bt{q}\t{$src2, $src1|$src1, $src2}",
1940                 [(set EFLAGS, (X86bt (loadi64 addr:$src1),
1941                                      imm:$src2))]>, TB,
1942                 Requires<[In64BitMode]>;
1943 } // SchedRW
1944
1945 let hasSideEffects = 0 in {
1946 let SchedRW = [WriteBitTestSet], Constraints = "$src1 = $dst" in {
1947 def BTC16rr : I<0xBB, MRMDestReg, (outs GR16:$dst), (ins GR16:$src1, GR16:$src2),
1948                 "btc{w}\t{$src2, $src1|$src1, $src2}", []>,
1949                 OpSize16, TB, NotMemoryFoldable;
1950 def BTC32rr : I<0xBB, MRMDestReg, (outs GR32:$dst), (ins GR32:$src1, GR32:$src2),
1951                 "btc{l}\t{$src2, $src1|$src1, $src2}", []>,
1952                 OpSize32, TB, NotMemoryFoldable;
1953 def BTC64rr : RI<0xBB, MRMDestReg, (outs GR64:$dst), (ins GR64:$src1, GR64:$src2),
1954                  "btc{q}\t{$src2, $src1|$src1, $src2}", []>, TB,
1955                  NotMemoryFoldable;
1956 } // SchedRW
1957
1958 let mayLoad = 1, mayStore = 1, SchedRW = [WriteBitTestSetRegRMW] in {
1959 def BTC16mr : I<0xBB, MRMDestMem, (outs), (ins i16mem:$src1, GR16:$src2),
1960                 "btc{w}\t{$src2, $src1|$src1, $src2}", []>,
1961                 OpSize16, TB, NotMemoryFoldable;
1962 def BTC32mr : I<0xBB, MRMDestMem, (outs), (ins i32mem:$src1, GR32:$src2),
1963                 "btc{l}\t{$src2, $src1|$src1, $src2}", []>,
1964                 OpSize32, TB, NotMemoryFoldable;
1965 def BTC64mr : RI<0xBB, MRMDestMem, (outs), (ins i64mem:$src1, GR64:$src2),
1966                  "btc{q}\t{$src2, $src1|$src1, $src2}", []>, TB,
1967                  NotMemoryFoldable;
1968 }
1969
1970 let SchedRW = [WriteBitTestSet], Constraints = "$src1 = $dst" in {
1971 def BTC16ri8 : Ii8<0xBA, MRM7r, (outs GR16:$dst), (ins GR16:$src1, i16u8imm:$src2),
1972                     "btc{w}\t{$src2, $src1|$src1, $src2}", []>, OpSize16, TB;
1973 def BTC32ri8 : Ii8<0xBA, MRM7r, (outs GR32:$dst), (ins GR32:$src1, i32u8imm:$src2),
1974                     "btc{l}\t{$src2, $src1|$src1, $src2}", []>, OpSize32, TB;
1975 def BTC64ri8 : RIi8<0xBA, MRM7r, (outs GR64:$dst), (ins GR64:$src1, i64u8imm:$src2),
1976                     "btc{q}\t{$src2, $src1|$src1, $src2}", []>, TB;
1977 } // SchedRW
1978
1979 let mayLoad = 1, mayStore = 1, SchedRW = [WriteBitTestSetImmRMW] in {
1980 def BTC16mi8 : Ii8<0xBA, MRM7m, (outs), (ins i16mem:$src1, i16u8imm:$src2),
1981                     "btc{w}\t{$src2, $src1|$src1, $src2}", []>, OpSize16, TB;
1982 def BTC32mi8 : Ii8<0xBA, MRM7m, (outs), (ins i32mem:$src1, i32u8imm:$src2),
1983                     "btc{l}\t{$src2, $src1|$src1, $src2}", []>, OpSize32, TB;
1984 def BTC64mi8 : RIi8<0xBA, MRM7m, (outs), (ins i64mem:$src1, i64u8imm:$src2),
1985                     "btc{q}\t{$src2, $src1|$src1, $src2}", []>, TB,
1986                     Requires<[In64BitMode]>;
1987 }
1988
1989 let SchedRW = [WriteBitTestSet], Constraints = "$src1 = $dst" in {
1990 def BTR16rr : I<0xB3, MRMDestReg, (outs GR16:$dst), (ins GR16:$src1, GR16:$src2),
1991                 "btr{w}\t{$src2, $src1|$src1, $src2}", []>,
1992                 OpSize16, TB, NotMemoryFoldable;
1993 def BTR32rr : I<0xB3, MRMDestReg, (outs GR32:$dst), (ins GR32:$src1, GR32:$src2),
1994                 "btr{l}\t{$src2, $src1|$src1, $src2}", []>,
1995                 OpSize32, TB, NotMemoryFoldable;
1996 def BTR64rr : RI<0xB3, MRMDestReg, (outs GR64:$dst), (ins GR64:$src1, GR64:$src2),
1997                  "btr{q}\t{$src2, $src1|$src1, $src2}", []>, TB,
1998                  NotMemoryFoldable;
1999 } // SchedRW
2000
2001 let mayLoad = 1, mayStore = 1, SchedRW = [WriteBitTestSetRegRMW] in {
2002 def BTR16mr : I<0xB3, MRMDestMem, (outs), (ins i16mem:$src1, GR16:$src2),
2003                 "btr{w}\t{$src2, $src1|$src1, $src2}", []>,
2004                 OpSize16, TB, NotMemoryFoldable;
2005 def BTR32mr : I<0xB3, MRMDestMem, (outs), (ins i32mem:$src1, GR32:$src2),
2006                 "btr{l}\t{$src2, $src1|$src1, $src2}", []>,
2007                 OpSize32, TB, NotMemoryFoldable;
2008 def BTR64mr : RI<0xB3, MRMDestMem, (outs), (ins i64mem:$src1, GR64:$src2),
2009                  "btr{q}\t{$src2, $src1|$src1, $src2}", []>, TB,
2010                  NotMemoryFoldable;
2011 }
2012
2013 let SchedRW = [WriteBitTestSet], Constraints = "$src1 = $dst" in {
2014 def BTR16ri8 : Ii8<0xBA, MRM6r, (outs GR16:$dst), (ins GR16:$src1, i16u8imm:$src2),
2015                     "btr{w}\t{$src2, $src1|$src1, $src2}", []>,
2016                     OpSize16, TB;
2017 def BTR32ri8 : Ii8<0xBA, MRM6r, (outs GR32:$dst), (ins GR32:$src1, i32u8imm:$src2),
2018                     "btr{l}\t{$src2, $src1|$src1, $src2}", []>,
2019                     OpSize32, TB;
2020 def BTR64ri8 : RIi8<0xBA, MRM6r, (outs GR64:$dst), (ins GR64:$src1, i64u8imm:$src2),
2021                     "btr{q}\t{$src2, $src1|$src1, $src2}", []>, TB;
2022 } // SchedRW
2023
2024 let mayLoad = 1, mayStore = 1, SchedRW = [WriteBitTestSetImmRMW] in {
2025 def BTR16mi8 : Ii8<0xBA, MRM6m, (outs), (ins i16mem:$src1, i16u8imm:$src2),
2026                     "btr{w}\t{$src2, $src1|$src1, $src2}", []>,
2027                     OpSize16, TB;
2028 def BTR32mi8 : Ii8<0xBA, MRM6m, (outs), (ins i32mem:$src1, i32u8imm:$src2),
2029                     "btr{l}\t{$src2, $src1|$src1, $src2}", []>,
2030                     OpSize32, TB;
2031 def BTR64mi8 : RIi8<0xBA, MRM6m, (outs), (ins i64mem:$src1, i64u8imm:$src2),
2032                     "btr{q}\t{$src2, $src1|$src1, $src2}", []>, TB,
2033                     Requires<[In64BitMode]>;
2034 }
2035
2036 let SchedRW = [WriteBitTestSet], Constraints = "$src1 = $dst" in {
2037 def BTS16rr : I<0xAB, MRMDestReg, (outs GR16:$dst), (ins GR16:$src1, GR16:$src2),
2038                 "bts{w}\t{$src2, $src1|$src1, $src2}", []>,
2039                 OpSize16, TB, NotMemoryFoldable;
2040 def BTS32rr : I<0xAB, MRMDestReg, (outs GR32:$dst), (ins GR32:$src1, GR32:$src2),
2041                 "bts{l}\t{$src2, $src1|$src1, $src2}", []>,
2042               OpSize32, TB, NotMemoryFoldable;
2043 def BTS64rr : RI<0xAB, MRMDestReg, (outs GR64:$dst), (ins GR64:$src1, GR64:$src2),
2044                "bts{q}\t{$src2, $src1|$src1, $src2}", []>, TB,
2045                NotMemoryFoldable;
2046 } // SchedRW
2047
2048 let mayLoad = 1, mayStore = 1, SchedRW = [WriteBitTestSetRegRMW] in {
2049 def BTS16mr : I<0xAB, MRMDestMem, (outs), (ins i16mem:$src1, GR16:$src2),
2050               "bts{w}\t{$src2, $src1|$src1, $src2}", []>,
2051               OpSize16, TB, NotMemoryFoldable;
2052 def BTS32mr : I<0xAB, MRMDestMem, (outs), (ins i32mem:$src1, GR32:$src2),
2053               "bts{l}\t{$src2, $src1|$src1, $src2}", []>,
2054               OpSize32, TB, NotMemoryFoldable;
2055 def BTS64mr : RI<0xAB, MRMDestMem, (outs), (ins i64mem:$src1, GR64:$src2),
2056                  "bts{q}\t{$src2, $src1|$src1, $src2}", []>, TB,
2057                  NotMemoryFoldable;
2058 }
2059
2060 let SchedRW = [WriteBitTestSet], Constraints = "$src1 = $dst" in {
2061 def BTS16ri8 : Ii8<0xBA, MRM5r, (outs GR16:$dst), (ins GR16:$src1, i16u8imm:$src2),
2062                     "bts{w}\t{$src2, $src1|$src1, $src2}", []>, OpSize16, TB;
2063 def BTS32ri8 : Ii8<0xBA, MRM5r, (outs GR32:$dst), (ins GR32:$src1, i32u8imm:$src2),
2064                     "bts{l}\t{$src2, $src1|$src1, $src2}", []>, OpSize32, TB;
2065 def BTS64ri8 : RIi8<0xBA, MRM5r, (outs GR64:$dst), (ins GR64:$src1, i64u8imm:$src2),
2066                     "bts{q}\t{$src2, $src1|$src1, $src2}", []>, TB;
2067 } // SchedRW
2068
2069 let mayLoad = 1, mayStore = 1, SchedRW = [WriteBitTestSetImmRMW] in {
2070 def BTS16mi8 : Ii8<0xBA, MRM5m, (outs), (ins i16mem:$src1, i16u8imm:$src2),
2071                     "bts{w}\t{$src2, $src1|$src1, $src2}", []>, OpSize16, TB;
2072 def BTS32mi8 : Ii8<0xBA, MRM5m, (outs), (ins i32mem:$src1, i32u8imm:$src2),
2073                     "bts{l}\t{$src2, $src1|$src1, $src2}", []>, OpSize32, TB;
2074 def BTS64mi8 : RIi8<0xBA, MRM5m, (outs), (ins i64mem:$src1, i64u8imm:$src2),
2075                     "bts{q}\t{$src2, $src1|$src1, $src2}", []>, TB,
2076                     Requires<[In64BitMode]>;
2077 }
2078 } // hasSideEffects = 0
2079 } // Defs = [EFLAGS]
2080
2081
2082 //===----------------------------------------------------------------------===//
2083 // Atomic support
2084 //
2085
2086 // Atomic swap. These are just normal xchg instructions. But since a memory
2087 // operand is referenced, the atomicity is ensured.
2088 multiclass ATOMIC_SWAP<bits<8> opc8, bits<8> opc, string mnemonic, string frag> {
2089   let Constraints = "$val = $dst", SchedRW = [WriteALULd, WriteRMW] in {
2090     def NAME#8rm  : I<opc8, MRMSrcMem, (outs GR8:$dst),
2091                       (ins GR8:$val, i8mem:$ptr),
2092                       !strconcat(mnemonic, "{b}\t{$val, $ptr|$ptr, $val}"),
2093                       [(set
2094                          GR8:$dst,
2095                          (!cast<PatFrag>(frag # "_8") addr:$ptr, GR8:$val))]>;
2096     def NAME#16rm : I<opc, MRMSrcMem, (outs GR16:$dst),
2097                       (ins GR16:$val, i16mem:$ptr),
2098                       !strconcat(mnemonic, "{w}\t{$val, $ptr|$ptr, $val}"),
2099                       [(set
2100                          GR16:$dst,
2101                          (!cast<PatFrag>(frag # "_16") addr:$ptr, GR16:$val))]>,
2102                       OpSize16;
2103     def NAME#32rm : I<opc, MRMSrcMem, (outs GR32:$dst),
2104                       (ins GR32:$val, i32mem:$ptr),
2105                       !strconcat(mnemonic, "{l}\t{$val, $ptr|$ptr, $val}"),
2106                       [(set
2107                          GR32:$dst,
2108                          (!cast<PatFrag>(frag # "_32") addr:$ptr, GR32:$val))]>,
2109                       OpSize32;
2110     def NAME#64rm : RI<opc, MRMSrcMem, (outs GR64:$dst),
2111                        (ins GR64:$val, i64mem:$ptr),
2112                        !strconcat(mnemonic, "{q}\t{$val, $ptr|$ptr, $val}"),
2113                        [(set
2114                          GR64:$dst,
2115                          (!cast<PatFrag>(frag # "_64") addr:$ptr, GR64:$val))]>;
2116   }
2117 }
2118
2119 defm XCHG    : ATOMIC_SWAP<0x86, 0x87, "xchg", "atomic_swap">, NotMemoryFoldable;
2120
2121 // Swap between registers.
2122 let SchedRW = [WriteXCHG] in {
2123 let Constraints = "$src1 = $dst1, $src2 = $dst2", hasSideEffects = 0 in {
2124 def XCHG8rr : I<0x86, MRMSrcReg, (outs GR8:$dst1, GR8:$dst2),
2125                 (ins GR8:$src1, GR8:$src2),
2126                 "xchg{b}\t{$src2, $src1|$src1, $src2}", []>, NotMemoryFoldable;
2127 def XCHG16rr : I<0x87, MRMSrcReg, (outs GR16:$dst1, GR16:$dst2),
2128                  (ins GR16:$src1, GR16:$src2),
2129                  "xchg{w}\t{$src2, $src1|$src1, $src2}", []>,
2130                  OpSize16, NotMemoryFoldable;
2131 def XCHG32rr : I<0x87, MRMSrcReg, (outs GR32:$dst1, GR32:$dst2),
2132                  (ins GR32:$src1, GR32:$src2),
2133                  "xchg{l}\t{$src2, $src1|$src1, $src2}", []>,
2134                  OpSize32, NotMemoryFoldable;
2135 def XCHG64rr : RI<0x87, MRMSrcReg, (outs GR64:$dst1, GR64:$dst2),
2136                   (ins GR64:$src1 ,GR64:$src2),
2137                   "xchg{q}\t{$src2, $src1|$src1, $src2}", []>, NotMemoryFoldable;
2138 }
2139
2140 // Swap between EAX and other registers.
2141 let Constraints = "$src = $dst", hasSideEffects = 0 in {
2142 let Uses = [AX], Defs = [AX] in
2143 def XCHG16ar : I<0x90, AddRegFrm, (outs GR16:$dst), (ins GR16:$src),
2144                   "xchg{w}\t{$src, %ax|ax, $src}", []>, OpSize16;
2145 let Uses = [EAX], Defs = [EAX] in
2146 def XCHG32ar : I<0x90, AddRegFrm, (outs GR32:$dst), (ins GR32:$src),
2147                   "xchg{l}\t{$src, %eax|eax, $src}", []>, OpSize32;
2148 let Uses = [RAX], Defs = [RAX] in
2149 def XCHG64ar : RI<0x90, AddRegFrm, (outs GR64:$dst), (ins GR64:$src),
2150                   "xchg{q}\t{$src, %rax|rax, $src}", []>;
2151 }
2152 } // SchedRW
2153
2154 let hasSideEffects = 0, Constraints = "$src1 = $dst1, $src2 = $dst2",
2155     Defs = [EFLAGS], SchedRW = [WriteXCHG] in {
2156 def XADD8rr : I<0xC0, MRMDestReg, (outs GR8:$dst1, GR8:$dst2),
2157                 (ins GR8:$src1, GR8:$src2),
2158                 "xadd{b}\t{$src2, $src1|$src1, $src2}", []>, TB;
2159 def XADD16rr : I<0xC1, MRMDestReg, (outs GR16:$dst1, GR16:$dst2),
2160                  (ins GR16:$src1, GR16:$src2),
2161                  "xadd{w}\t{$src2, $src1|$src1, $src2}", []>, TB, OpSize16;
2162 def XADD32rr : I<0xC1, MRMDestReg, (outs GR32:$dst1, GR32:$dst2),
2163                   (ins GR32:$src1, GR32:$src2),
2164                  "xadd{l}\t{$src2, $src1|$src1, $src2}", []>, TB, OpSize32;
2165 def XADD64rr : RI<0xC1, MRMDestReg, (outs GR64:$dst1, GR64:$dst2),
2166                   (ins GR64:$src1, GR64:$src2),
2167                   "xadd{q}\t{$src2, $src1|$src1, $src2}", []>, TB;
2168 } // SchedRW
2169
2170 let mayLoad = 1, mayStore = 1, hasSideEffects = 0, Constraints = "$val = $dst",
2171     Defs = [EFLAGS], SchedRW = [WriteALULd, WriteRMW] in {
2172 def XADD8rm   : I<0xC0, MRMSrcMem, (outs GR8:$dst),
2173                   (ins GR8:$val, i8mem:$ptr),
2174                  "xadd{b}\t{$val, $ptr|$ptr, $val}", []>, TB;
2175 def XADD16rm  : I<0xC1, MRMSrcMem, (outs GR16:$dst),
2176                   (ins GR16:$val, i16mem:$ptr),
2177                  "xadd{w}\t{$val, $ptr|$ptr, $val}", []>, TB,
2178                  OpSize16;
2179 def XADD32rm  : I<0xC1, MRMSrcMem, (outs GR32:$dst),
2180                   (ins GR32:$val, i32mem:$ptr),
2181                  "xadd{l}\t{$val, $ptr|$ptr, $val}", []>, TB,
2182                  OpSize32;
2183 def XADD64rm  : RI<0xC1, MRMSrcMem, (outs GR64:$dst),
2184                    (ins GR64:$val, i64mem:$ptr),
2185                    "xadd{q}\t{$val, $ptr|$ptr, $val}", []>, TB;
2186
2187 }
2188
2189 let SchedRW = [WriteCMPXCHG], hasSideEffects = 0 in {
2190 let Defs = [AL, EFLAGS], Uses = [AL] in
2191 def CMPXCHG8rr : I<0xB0, MRMDestReg, (outs GR8:$dst), (ins GR8:$src),
2192                    "cmpxchg{b}\t{$src, $dst|$dst, $src}", []>, TB,
2193                    NotMemoryFoldable;
2194 let Defs = [AX, EFLAGS], Uses = [AX] in
2195 def CMPXCHG16rr : I<0xB1, MRMDestReg, (outs GR16:$dst), (ins GR16:$src),
2196                     "cmpxchg{w}\t{$src, $dst|$dst, $src}", []>, TB, OpSize16,
2197                     NotMemoryFoldable;
2198 let Defs = [EAX, EFLAGS], Uses = [EAX] in
2199 def CMPXCHG32rr  : I<0xB1, MRMDestReg, (outs GR32:$dst), (ins GR32:$src),
2200                      "cmpxchg{l}\t{$src, $dst|$dst, $src}", []>, TB, OpSize32,
2201                      NotMemoryFoldable;
2202 let Defs = [RAX, EFLAGS], Uses = [RAX] in
2203 def CMPXCHG64rr  : RI<0xB1, MRMDestReg, (outs GR64:$dst), (ins GR64:$src),
2204                       "cmpxchg{q}\t{$src, $dst|$dst, $src}", []>, TB,
2205                       NotMemoryFoldable;
2206 } // SchedRW, hasSideEffects
2207
2208 let SchedRW = [WriteCMPXCHGRMW], mayLoad = 1, mayStore = 1,
2209     hasSideEffects = 0 in {
2210 let Defs = [AL, EFLAGS], Uses = [AL] in
2211 def CMPXCHG8rm   : I<0xB0, MRMDestMem, (outs), (ins i8mem:$dst, GR8:$src),
2212                      "cmpxchg{b}\t{$src, $dst|$dst, $src}", []>, TB,
2213                      NotMemoryFoldable;
2214 let Defs = [AX, EFLAGS], Uses = [AX] in
2215 def CMPXCHG16rm  : I<0xB1, MRMDestMem, (outs), (ins i16mem:$dst, GR16:$src),
2216                      "cmpxchg{w}\t{$src, $dst|$dst, $src}", []>, TB, OpSize16,
2217                      NotMemoryFoldable;
2218 let Defs = [EAX, EFLAGS], Uses = [EAX] in
2219 def CMPXCHG32rm  : I<0xB1, MRMDestMem, (outs), (ins i32mem:$dst, GR32:$src),
2220                      "cmpxchg{l}\t{$src, $dst|$dst, $src}", []>, TB, OpSize32,
2221                      NotMemoryFoldable;
2222 let Defs = [RAX, EFLAGS], Uses = [RAX] in
2223 def CMPXCHG64rm  : RI<0xB1, MRMDestMem, (outs), (ins i64mem:$dst, GR64:$src),
2224                       "cmpxchg{q}\t{$src, $dst|$dst, $src}", []>, TB,
2225                       NotMemoryFoldable;
2226
2227 let Defs = [EAX, EDX, EFLAGS], Uses = [EAX, EBX, ECX, EDX] in
2228 def CMPXCHG8B : I<0xC7, MRM1m, (outs), (ins i64mem:$dst),
2229                   "cmpxchg8b\t$dst", []>, TB, Requires<[HasCmpxchg8b]>;
2230
2231 let Defs = [RAX, RDX, EFLAGS], Uses = [RAX, RBX, RCX, RDX] in
2232 // NOTE: In64BitMode check needed for the AssemblerPredicate.
2233 def CMPXCHG16B : RI<0xC7, MRM1m, (outs), (ins i128mem:$dst),
2234                     "cmpxchg16b\t$dst", []>,
2235                     TB, Requires<[HasCmpxchg16b,In64BitMode]>;
2236 } // SchedRW, mayLoad, mayStore, hasSideEffects
2237
2238
2239 // Lock instruction prefix
2240 let SchedRW = [WriteMicrocoded] in
2241 def LOCK_PREFIX : I<0xF0, PrefixByte, (outs),  (ins), "lock", []>;
2242
2243 let SchedRW = [WriteNop] in {
2244
2245 // Rex64 instruction prefix
2246 def REX64_PREFIX : I<0x48, PrefixByte, (outs),  (ins), "rex64", []>,
2247                      Requires<[In64BitMode]>;
2248
2249 // Data16 instruction prefix
2250 def DATA16_PREFIX : I<0x66, PrefixByte, (outs),  (ins), "data16", []>;
2251 } // SchedRW
2252
2253 // Repeat string operation instruction prefixes
2254 let Defs = [ECX], Uses = [ECX,DF], SchedRW = [WriteMicrocoded] in {
2255 // Repeat (used with INS, OUTS, MOVS, LODS and STOS)
2256 def REP_PREFIX : I<0xF3, PrefixByte, (outs),  (ins), "rep", []>;
2257 // Repeat while not equal (used with CMPS and SCAS)
2258 def REPNE_PREFIX : I<0xF2, PrefixByte, (outs),  (ins), "repne", []>;
2259 }
2260
2261 // String manipulation instructions
2262 let SchedRW = [WriteMicrocoded] in {
2263 let Defs = [AL,ESI], Uses = [ESI,DF] in
2264 def LODSB : I<0xAC, RawFrmSrc, (outs), (ins srcidx8:$src),
2265               "lodsb\t{$src, %al|al, $src}", []>;
2266 let Defs = [AX,ESI], Uses = [ESI,DF] in
2267 def LODSW : I<0xAD, RawFrmSrc, (outs), (ins srcidx16:$src),
2268               "lodsw\t{$src, %ax|ax, $src}", []>, OpSize16;
2269 let Defs = [EAX,ESI], Uses = [ESI,DF] in
2270 def LODSL : I<0xAD, RawFrmSrc, (outs), (ins srcidx32:$src),
2271               "lods{l|d}\t{$src, %eax|eax, $src}", []>, OpSize32;
2272 let Defs = [RAX,ESI], Uses = [ESI,DF] in
2273 def LODSQ : RI<0xAD, RawFrmSrc, (outs), (ins srcidx64:$src),
2274                "lodsq\t{$src, %rax|rax, $src}", []>,
2275                Requires<[In64BitMode]>;
2276 }
2277
2278 let SchedRW = [WriteSystem] in {
2279 let Defs = [ESI], Uses = [DX,ESI,DF] in {
2280 def OUTSB : I<0x6E, RawFrmSrc, (outs), (ins srcidx8:$src),
2281              "outsb\t{$src, %dx|dx, $src}", []>;
2282 def OUTSW : I<0x6F, RawFrmSrc, (outs), (ins srcidx16:$src),
2283               "outsw\t{$src, %dx|dx, $src}", []>, OpSize16;
2284 def OUTSL : I<0x6F, RawFrmSrc, (outs), (ins srcidx32:$src),
2285               "outs{l|d}\t{$src, %dx|dx, $src}", []>, OpSize32;
2286 }
2287
2288 let Defs = [EDI], Uses = [DX,EDI,DF] in {
2289 def INSB : I<0x6C, RawFrmDst, (outs), (ins dstidx8:$dst),
2290              "insb\t{%dx, $dst|$dst, dx}", []>;
2291 def INSW : I<0x6D, RawFrmDst, (outs), (ins dstidx16:$dst),
2292              "insw\t{%dx, $dst|$dst, dx}", []>,  OpSize16;
2293 def INSL : I<0x6D, RawFrmDst, (outs), (ins dstidx32:$dst),
2294              "ins{l|d}\t{%dx, $dst|$dst, dx}", []>, OpSize32;
2295 }
2296 }
2297
2298 // EFLAGS management instructions.
2299 let SchedRW = [WriteALU], Defs = [EFLAGS], Uses = [EFLAGS] in {
2300 def CLC : I<0xF8, RawFrm, (outs), (ins), "clc", []>;
2301 def STC : I<0xF9, RawFrm, (outs), (ins), "stc", []>;
2302 def CMC : I<0xF5, RawFrm, (outs), (ins), "cmc", []>;
2303 }
2304
2305 // DF management instructions.
2306 let SchedRW = [WriteALU], Defs = [DF] in {
2307 def CLD : I<0xFC, RawFrm, (outs), (ins), "cld", []>;
2308 def STD : I<0xFD, RawFrm, (outs), (ins), "std", []>;
2309 }
2310
2311 // Table lookup instructions
2312 let Uses = [AL,EBX], Defs = [AL], hasSideEffects = 0, mayLoad = 1 in
2313 def XLAT : I<0xD7, RawFrm, (outs), (ins), "xlatb", []>, Sched<[WriteLoad]>;
2314
2315 let SchedRW = [WriteMicrocoded] in {
2316 // ASCII Adjust After Addition
2317 let Uses = [AL,EFLAGS], Defs = [AX,EFLAGS], hasSideEffects = 0 in
2318 def AAA : I<0x37, RawFrm, (outs), (ins), "aaa", []>,
2319             Requires<[Not64BitMode]>;
2320
2321 // ASCII Adjust AX Before Division
2322 let Uses = [AX], Defs = [AX,EFLAGS], hasSideEffects = 0 in
2323 def AAD8i8 : Ii8<0xD5, RawFrm, (outs), (ins i8imm:$src),
2324                  "aad\t$src", []>, Requires<[Not64BitMode]>;
2325
2326 // ASCII Adjust AX After Multiply
2327 let Uses = [AL], Defs = [AX,EFLAGS], hasSideEffects = 0 in
2328 def AAM8i8 : Ii8<0xD4, RawFrm, (outs), (ins i8imm:$src),
2329                  "aam\t$src", []>, Requires<[Not64BitMode]>;
2330
2331 // ASCII Adjust AL After Subtraction - sets
2332 let Uses = [AL,EFLAGS], Defs = [AX,EFLAGS], hasSideEffects = 0 in
2333 def AAS : I<0x3F, RawFrm, (outs), (ins), "aas", []>,
2334             Requires<[Not64BitMode]>;
2335
2336 // Decimal Adjust AL after Addition
2337 let Uses = [AL,EFLAGS], Defs = [AL,EFLAGS], hasSideEffects = 0 in
2338 def DAA : I<0x27, RawFrm, (outs), (ins), "daa", []>,
2339             Requires<[Not64BitMode]>;
2340
2341 // Decimal Adjust AL after Subtraction
2342 let Uses = [AL,EFLAGS], Defs = [AL,EFLAGS], hasSideEffects = 0 in
2343 def DAS : I<0x2F, RawFrm, (outs), (ins), "das", []>,
2344             Requires<[Not64BitMode]>;
2345 } // SchedRW
2346
2347 let SchedRW = [WriteSystem] in {
2348 // Check Array Index Against Bounds
2349 // Note: "bound" does not have reversed operands in at&t syntax.
2350 def BOUNDS16rm : I<0x62, MRMSrcMem, (outs GR16:$dst), (ins i16mem:$src),
2351                    "bound\t$dst, $src", []>, OpSize16,
2352                    Requires<[Not64BitMode]>;
2353 def BOUNDS32rm : I<0x62, MRMSrcMem, (outs GR32:$dst), (ins i32mem:$src),
2354                    "bound\t$dst, $src", []>, OpSize32,
2355                    Requires<[Not64BitMode]>;
2356
2357 // Adjust RPL Field of Segment Selector
2358 def ARPL16rr : I<0x63, MRMDestReg, (outs GR16:$dst), (ins GR16:$src),
2359                  "arpl\t{$src, $dst|$dst, $src}", []>,
2360                  Requires<[Not64BitMode]>, NotMemoryFoldable;
2361 let mayStore = 1 in
2362 def ARPL16mr : I<0x63, MRMDestMem, (outs), (ins i16mem:$dst, GR16:$src),
2363                  "arpl\t{$src, $dst|$dst, $src}", []>,
2364                  Requires<[Not64BitMode]>, NotMemoryFoldable;
2365 } // SchedRW
2366
2367 //===----------------------------------------------------------------------===//
2368 // MOVBE Instructions
2369 //
2370 let Predicates = [HasMOVBE] in {
2371   let SchedRW = [WriteALULd] in {
2372   def MOVBE16rm : I<0xF0, MRMSrcMem, (outs GR16:$dst), (ins i16mem:$src),
2373                     "movbe{w}\t{$src, $dst|$dst, $src}",
2374                     [(set GR16:$dst, (bswap (loadi16 addr:$src)))]>,
2375                     OpSize16, T8PS;
2376   def MOVBE32rm : I<0xF0, MRMSrcMem, (outs GR32:$dst), (ins i32mem:$src),
2377                     "movbe{l}\t{$src, $dst|$dst, $src}",
2378                     [(set GR32:$dst, (bswap (loadi32 addr:$src)))]>,
2379                     OpSize32, T8PS;
2380   def MOVBE64rm : RI<0xF0, MRMSrcMem, (outs GR64:$dst), (ins i64mem:$src),
2381                      "movbe{q}\t{$src, $dst|$dst, $src}",
2382                      [(set GR64:$dst, (bswap (loadi64 addr:$src)))]>,
2383                      T8PS;
2384   }
2385   let SchedRW = [WriteStore] in {
2386   def MOVBE16mr : I<0xF1, MRMDestMem, (outs), (ins i16mem:$dst, GR16:$src),
2387                     "movbe{w}\t{$src, $dst|$dst, $src}",
2388                     [(store (bswap GR16:$src), addr:$dst)]>,
2389                     OpSize16, T8PS;
2390   def MOVBE32mr : I<0xF1, MRMDestMem, (outs), (ins i32mem:$dst, GR32:$src),
2391                     "movbe{l}\t{$src, $dst|$dst, $src}",
2392                     [(store (bswap GR32:$src), addr:$dst)]>,
2393                     OpSize32, T8PS;
2394   def MOVBE64mr : RI<0xF1, MRMDestMem, (outs), (ins i64mem:$dst, GR64:$src),
2395                      "movbe{q}\t{$src, $dst|$dst, $src}",
2396                      [(store (bswap GR64:$src), addr:$dst)]>,
2397                      T8PS;
2398   }
2399 }
2400
2401 //===----------------------------------------------------------------------===//
2402 // RDRAND Instruction
2403 //
2404 let Predicates = [HasRDRAND], Defs = [EFLAGS], SchedRW = [WriteSystem] in {
2405   def RDRAND16r : I<0xC7, MRM6r, (outs GR16:$dst), (ins),
2406                     "rdrand{w}\t$dst", [(set GR16:$dst, EFLAGS, (X86rdrand))]>,
2407                     OpSize16, PS;
2408   def RDRAND32r : I<0xC7, MRM6r, (outs GR32:$dst), (ins),
2409                     "rdrand{l}\t$dst", [(set GR32:$dst, EFLAGS, (X86rdrand))]>,
2410                     OpSize32, PS;
2411   def RDRAND64r : RI<0xC7, MRM6r, (outs GR64:$dst), (ins),
2412                      "rdrand{q}\t$dst", [(set GR64:$dst, EFLAGS, (X86rdrand))]>,
2413                      PS;
2414 }
2415
2416 //===----------------------------------------------------------------------===//
2417 // RDSEED Instruction
2418 //
2419 let Predicates = [HasRDSEED], Defs = [EFLAGS], SchedRW = [WriteSystem] in {
2420   def RDSEED16r : I<0xC7, MRM7r, (outs GR16:$dst), (ins), "rdseed{w}\t$dst",
2421                     [(set GR16:$dst, EFLAGS, (X86rdseed))]>, OpSize16, PS;
2422   def RDSEED32r : I<0xC7, MRM7r, (outs GR32:$dst), (ins), "rdseed{l}\t$dst",
2423                     [(set GR32:$dst, EFLAGS, (X86rdseed))]>, OpSize32, PS;
2424   def RDSEED64r : RI<0xC7, MRM7r, (outs GR64:$dst), (ins), "rdseed{q}\t$dst",
2425                      [(set GR64:$dst, EFLAGS, (X86rdseed))]>, PS;
2426 }
2427
2428 //===----------------------------------------------------------------------===//
2429 // LZCNT Instruction
2430 //
2431 let Predicates = [HasLZCNT], Defs = [EFLAGS] in {
2432   def LZCNT16rr : I<0xBD, MRMSrcReg, (outs GR16:$dst), (ins GR16:$src),
2433                     "lzcnt{w}\t{$src, $dst|$dst, $src}",
2434                     [(set GR16:$dst, (ctlz GR16:$src)), (implicit EFLAGS)]>,
2435                     XS, OpSize16, Sched<[WriteLZCNT]>;
2436   def LZCNT16rm : I<0xBD, MRMSrcMem, (outs GR16:$dst), (ins i16mem:$src),
2437                     "lzcnt{w}\t{$src, $dst|$dst, $src}",
2438                     [(set GR16:$dst, (ctlz (loadi16 addr:$src))),
2439                      (implicit EFLAGS)]>, XS, OpSize16, Sched<[WriteLZCNTLd]>;
2440
2441   def LZCNT32rr : I<0xBD, MRMSrcReg, (outs GR32:$dst), (ins GR32:$src),
2442                     "lzcnt{l}\t{$src, $dst|$dst, $src}",
2443                     [(set GR32:$dst, (ctlz GR32:$src)), (implicit EFLAGS)]>,
2444                     XS, OpSize32, Sched<[WriteLZCNT]>;
2445   def LZCNT32rm : I<0xBD, MRMSrcMem, (outs GR32:$dst), (ins i32mem:$src),
2446                     "lzcnt{l}\t{$src, $dst|$dst, $src}",
2447                     [(set GR32:$dst, (ctlz (loadi32 addr:$src))),
2448                      (implicit EFLAGS)]>, XS, OpSize32, Sched<[WriteLZCNTLd]>;
2449
2450   def LZCNT64rr : RI<0xBD, MRMSrcReg, (outs GR64:$dst), (ins GR64:$src),
2451                      "lzcnt{q}\t{$src, $dst|$dst, $src}",
2452                      [(set GR64:$dst, (ctlz GR64:$src)), (implicit EFLAGS)]>,
2453                      XS, Sched<[WriteLZCNT]>;
2454   def LZCNT64rm : RI<0xBD, MRMSrcMem, (outs GR64:$dst), (ins i64mem:$src),
2455                      "lzcnt{q}\t{$src, $dst|$dst, $src}",
2456                      [(set GR64:$dst, (ctlz (loadi64 addr:$src))),
2457                       (implicit EFLAGS)]>, XS, Sched<[WriteLZCNTLd]>;
2458 }
2459
2460 //===----------------------------------------------------------------------===//
2461 // BMI Instructions
2462 //
2463 let Predicates = [HasBMI], Defs = [EFLAGS] in {
2464   def TZCNT16rr : I<0xBC, MRMSrcReg, (outs GR16:$dst), (ins GR16:$src),
2465                     "tzcnt{w}\t{$src, $dst|$dst, $src}",
2466                     [(set GR16:$dst, (cttz GR16:$src)), (implicit EFLAGS)]>,
2467                     XS, OpSize16, Sched<[WriteTZCNT]>;
2468   def TZCNT16rm : I<0xBC, MRMSrcMem, (outs GR16:$dst), (ins i16mem:$src),
2469                     "tzcnt{w}\t{$src, $dst|$dst, $src}",
2470                     [(set GR16:$dst, (cttz (loadi16 addr:$src))),
2471                      (implicit EFLAGS)]>, XS, OpSize16, Sched<[WriteTZCNTLd]>;
2472
2473   def TZCNT32rr : I<0xBC, MRMSrcReg, (outs GR32:$dst), (ins GR32:$src),
2474                     "tzcnt{l}\t{$src, $dst|$dst, $src}",
2475                     [(set GR32:$dst, (cttz GR32:$src)), (implicit EFLAGS)]>,
2476                     XS, OpSize32, Sched<[WriteTZCNT]>;
2477   def TZCNT32rm : I<0xBC, MRMSrcMem, (outs GR32:$dst), (ins i32mem:$src),
2478                     "tzcnt{l}\t{$src, $dst|$dst, $src}",
2479                     [(set GR32:$dst, (cttz (loadi32 addr:$src))),
2480                      (implicit EFLAGS)]>, XS, OpSize32, Sched<[WriteTZCNTLd]>;
2481
2482   def TZCNT64rr : RI<0xBC, MRMSrcReg, (outs GR64:$dst), (ins GR64:$src),
2483                      "tzcnt{q}\t{$src, $dst|$dst, $src}",
2484                      [(set GR64:$dst, (cttz GR64:$src)), (implicit EFLAGS)]>,
2485                      XS, Sched<[WriteTZCNT]>;
2486   def TZCNT64rm : RI<0xBC, MRMSrcMem, (outs GR64:$dst), (ins i64mem:$src),
2487                      "tzcnt{q}\t{$src, $dst|$dst, $src}",
2488                      [(set GR64:$dst, (cttz (loadi64 addr:$src))),
2489                       (implicit EFLAGS)]>, XS, Sched<[WriteTZCNTLd]>;
2490 }
2491
2492 multiclass bmi_bls<string mnemonic, Format RegMRM, Format MemMRM,
2493                   RegisterClass RC, X86MemOperand x86memop,
2494                   X86FoldableSchedWrite sched> {
2495 let hasSideEffects = 0 in {
2496   def rr : I<0xF3, RegMRM, (outs RC:$dst), (ins RC:$src),
2497              !strconcat(mnemonic, "\t{$src, $dst|$dst, $src}"), []>,
2498              T8PS, VEX_4V, Sched<[sched]>;
2499   let mayLoad = 1 in
2500   def rm : I<0xF3, MemMRM, (outs RC:$dst), (ins x86memop:$src),
2501              !strconcat(mnemonic, "\t{$src, $dst|$dst, $src}"), []>,
2502              T8PS, VEX_4V, Sched<[sched.Folded]>;
2503 }
2504 }
2505
2506 let Predicates = [HasBMI], Defs = [EFLAGS] in {
2507   defm BLSR32 : bmi_bls<"blsr{l}", MRM1r, MRM1m, GR32, i32mem, WriteBLS>;
2508   defm BLSR64 : bmi_bls<"blsr{q}", MRM1r, MRM1m, GR64, i64mem, WriteBLS>, VEX_W;
2509   defm BLSMSK32 : bmi_bls<"blsmsk{l}", MRM2r, MRM2m, GR32, i32mem, WriteBLS>;
2510   defm BLSMSK64 : bmi_bls<"blsmsk{q}", MRM2r, MRM2m, GR64, i64mem, WriteBLS>, VEX_W;
2511   defm BLSI32 : bmi_bls<"blsi{l}", MRM3r, MRM3m, GR32, i32mem, WriteBLS>;
2512   defm BLSI64 : bmi_bls<"blsi{q}", MRM3r, MRM3m, GR64, i64mem, WriteBLS>, VEX_W;
2513 }
2514
2515 //===----------------------------------------------------------------------===//
2516 // Pattern fragments to auto generate BMI instructions.
2517 //===----------------------------------------------------------------------===//
2518
2519 def or_flag_nocf : PatFrag<(ops node:$lhs, node:$rhs),
2520                            (X86or_flag node:$lhs, node:$rhs), [{
2521   return hasNoCarryFlagUses(SDValue(N, 1));
2522 }]>;
2523
2524 def xor_flag_nocf : PatFrag<(ops node:$lhs, node:$rhs),
2525                             (X86xor_flag node:$lhs, node:$rhs), [{
2526   return hasNoCarryFlagUses(SDValue(N, 1));
2527 }]>;
2528
2529 def and_flag_nocf : PatFrag<(ops node:$lhs, node:$rhs),
2530                             (X86and_flag node:$lhs, node:$rhs), [{
2531   return hasNoCarryFlagUses(SDValue(N, 1));
2532 }]>;
2533
2534 let Predicates = [HasBMI] in {
2535   // FIXME: patterns for the load versions are not implemented
2536   def : Pat<(and GR32:$src, (add GR32:$src, -1)),
2537             (BLSR32rr GR32:$src)>;
2538   def : Pat<(and GR64:$src, (add GR64:$src, -1)),
2539             (BLSR64rr GR64:$src)>;
2540
2541   def : Pat<(xor GR32:$src, (add GR32:$src, -1)),
2542             (BLSMSK32rr GR32:$src)>;
2543   def : Pat<(xor GR64:$src, (add GR64:$src, -1)),
2544             (BLSMSK64rr GR64:$src)>;
2545
2546   def : Pat<(and GR32:$src, (ineg GR32:$src)),
2547             (BLSI32rr GR32:$src)>;
2548   def : Pat<(and GR64:$src, (ineg GR64:$src)),
2549             (BLSI64rr GR64:$src)>;
2550
2551   // Versions to match flag producing ops.
2552   def : Pat<(and_flag_nocf GR32:$src, (add GR32:$src, -1)),
2553             (BLSR32rr GR32:$src)>;
2554   def : Pat<(and_flag_nocf GR64:$src, (add GR64:$src, -1)),
2555             (BLSR64rr GR64:$src)>;
2556
2557   def : Pat<(xor_flag_nocf GR32:$src, (add GR32:$src, -1)),
2558             (BLSMSK32rr GR32:$src)>;
2559   def : Pat<(xor_flag_nocf GR64:$src, (add GR64:$src, -1)),
2560             (BLSMSK64rr GR64:$src)>;
2561
2562   def : Pat<(and_flag_nocf GR32:$src, (ineg GR32:$src)),
2563             (BLSI32rr GR32:$src)>;
2564   def : Pat<(and_flag_nocf GR64:$src, (ineg GR64:$src)),
2565             (BLSI64rr GR64:$src)>;
2566 }
2567
2568 multiclass bmi_bextr<bits<8> opc, string mnemonic, RegisterClass RC,
2569                      X86MemOperand x86memop, SDNode OpNode,
2570                      PatFrag ld_frag, X86FoldableSchedWrite Sched> {
2571   def rr : I<opc, MRMSrcReg4VOp3, (outs RC:$dst), (ins RC:$src1, RC:$src2),
2572              !strconcat(mnemonic, "\t{$src2, $src1, $dst|$dst, $src1, $src2}"),
2573              [(set RC:$dst, (OpNode RC:$src1, RC:$src2)), (implicit EFLAGS)]>,
2574              T8PS, VEX, Sched<[Sched]>;
2575   def rm : I<opc, MRMSrcMem4VOp3, (outs RC:$dst), (ins x86memop:$src1, RC:$src2),
2576              !strconcat(mnemonic, "\t{$src2, $src1, $dst|$dst, $src1, $src2}"),
2577              [(set RC:$dst, (OpNode (ld_frag addr:$src1), RC:$src2)),
2578               (implicit EFLAGS)]>, T8PS, VEX,
2579              Sched<[Sched.Folded,
2580                     // x86memop:$src1
2581                     ReadDefault, ReadDefault, ReadDefault, ReadDefault,
2582                     ReadDefault,
2583                     // RC:$src2
2584                     Sched.ReadAfterFold]>;
2585 }
2586
2587 let Predicates = [HasBMI], Defs = [EFLAGS] in {
2588   defm BEXTR32 : bmi_bextr<0xF7, "bextr{l}", GR32, i32mem,
2589                            X86bextr, loadi32, WriteBEXTR>;
2590   defm BEXTR64 : bmi_bextr<0xF7, "bextr{q}", GR64, i64mem,
2591                            X86bextr, loadi64, WriteBEXTR>, VEX_W;
2592 }
2593
2594 multiclass bmi_bzhi<bits<8> opc, string mnemonic, RegisterClass RC,
2595                     X86MemOperand x86memop, SDNode Int,
2596                     PatFrag ld_frag, X86FoldableSchedWrite Sched> {
2597   def rr : I<opc, MRMSrcReg4VOp3, (outs RC:$dst), (ins RC:$src1, RC:$src2),
2598              !strconcat(mnemonic, "\t{$src2, $src1, $dst|$dst, $src1, $src2}"),
2599              [(set RC:$dst, (Int RC:$src1, RC:$src2)), (implicit EFLAGS)]>,
2600              T8PS, VEX, Sched<[Sched]>;
2601   def rm : I<opc, MRMSrcMem4VOp3, (outs RC:$dst), (ins x86memop:$src1, RC:$src2),
2602              !strconcat(mnemonic, "\t{$src2, $src1, $dst|$dst, $src1, $src2}"),
2603              [(set RC:$dst, (Int (ld_frag addr:$src1), RC:$src2)),
2604               (implicit EFLAGS)]>, T8PS, VEX,
2605              Sched<[Sched.Folded,
2606                     // x86memop:$src1
2607                     ReadDefault, ReadDefault, ReadDefault, ReadDefault,
2608                     ReadDefault,
2609                     // RC:$src2
2610                     Sched.ReadAfterFold]>;
2611 }
2612
2613 let Predicates = [HasBMI2], Defs = [EFLAGS] in {
2614   defm BZHI32 : bmi_bzhi<0xF5, "bzhi{l}", GR32, i32mem,
2615                          X86bzhi, loadi32, WriteBZHI>;
2616   defm BZHI64 : bmi_bzhi<0xF5, "bzhi{q}", GR64, i64mem,
2617                          X86bzhi, loadi64, WriteBZHI>, VEX_W;
2618 }
2619
2620 def CountTrailingOnes : SDNodeXForm<imm, [{
2621   // Count the trailing ones in the immediate.
2622   return getI8Imm(countTrailingOnes(N->getZExtValue()), SDLoc(N));
2623 }]>;
2624
2625 def BEXTRMaskXForm : SDNodeXForm<imm, [{
2626   unsigned Length = countTrailingOnes(N->getZExtValue());
2627   return getI32Imm(Length << 8, SDLoc(N));
2628 }]>;
2629
2630 def AndMask64 : ImmLeaf<i64, [{
2631   return isMask_64(Imm) && !isUInt<32>(Imm);
2632 }]>;
2633
2634 // Use BEXTR for 64-bit 'and' with large immediate 'mask'.
2635 let Predicates = [HasBMI, NoBMI2, NoTBM] in {
2636   def : Pat<(and GR64:$src, AndMask64:$mask),
2637             (BEXTR64rr GR64:$src,
2638               (SUBREG_TO_REG (i64 0),
2639                              (MOV32ri (BEXTRMaskXForm imm:$mask)), sub_32bit))>;
2640   def : Pat<(and (loadi64 addr:$src), AndMask64:$mask),
2641             (BEXTR64rm addr:$src,
2642               (SUBREG_TO_REG (i64 0),
2643                              (MOV32ri (BEXTRMaskXForm imm:$mask)), sub_32bit))>;
2644 }
2645
2646 // Use BZHI for 64-bit 'and' with large immediate 'mask'.
2647 let Predicates = [HasBMI2, NoTBM] in {
2648   def : Pat<(and GR64:$src, AndMask64:$mask),
2649             (BZHI64rr GR64:$src,
2650               (INSERT_SUBREG (i64 (IMPLICIT_DEF)),
2651                              (MOV8ri (CountTrailingOnes imm:$mask)), sub_8bit))>;
2652   def : Pat<(and (loadi64 addr:$src), AndMask64:$mask),
2653             (BZHI64rm addr:$src,
2654               (INSERT_SUBREG (i64 (IMPLICIT_DEF)),
2655                              (MOV8ri (CountTrailingOnes imm:$mask)), sub_8bit))>;
2656 }
2657
2658 multiclass bmi_pdep_pext<string mnemonic, RegisterClass RC,
2659                          X86MemOperand x86memop, SDNode OpNode,
2660                          PatFrag ld_frag> {
2661   def rr : I<0xF5, MRMSrcReg, (outs RC:$dst), (ins RC:$src1, RC:$src2),
2662              !strconcat(mnemonic, "\t{$src2, $src1, $dst|$dst, $src1, $src2}"),
2663              [(set RC:$dst, (OpNode RC:$src1, RC:$src2))]>,
2664              VEX_4V, Sched<[WriteALU]>;
2665   def rm : I<0xF5, MRMSrcMem, (outs RC:$dst), (ins RC:$src1, x86memop:$src2),
2666              !strconcat(mnemonic, "\t{$src2, $src1, $dst|$dst, $src1, $src2}"),
2667              [(set RC:$dst, (OpNode RC:$src1, (ld_frag addr:$src2)))]>,
2668              VEX_4V, Sched<[WriteALU.Folded, WriteALU.ReadAfterFold]>;
2669 }
2670
2671 let Predicates = [HasBMI2] in {
2672   defm PDEP32 : bmi_pdep_pext<"pdep{l}", GR32, i32mem,
2673                                X86pdep, loadi32>, T8XD;
2674   defm PDEP64 : bmi_pdep_pext<"pdep{q}", GR64, i64mem,
2675                                X86pdep, loadi64>, T8XD, VEX_W;
2676   defm PEXT32 : bmi_pdep_pext<"pext{l}", GR32, i32mem,
2677                                X86pext, loadi32>, T8XS;
2678   defm PEXT64 : bmi_pdep_pext<"pext{q}", GR64, i64mem,
2679                                X86pext, loadi64>, T8XS, VEX_W;
2680 }
2681
2682 //===----------------------------------------------------------------------===//
2683 // TBM Instructions
2684 //
2685 let Predicates = [HasTBM], Defs = [EFLAGS] in {
2686
2687 multiclass tbm_bextri<bits<8> opc, RegisterClass RC, string OpcodeStr,
2688                       X86MemOperand x86memop, PatFrag ld_frag,
2689                       SDNode OpNode, Operand immtype,
2690                       SDPatternOperator immoperator,
2691                       X86FoldableSchedWrite Sched> {
2692   def ri : Ii32<opc,  MRMSrcReg, (outs RC:$dst), (ins RC:$src1, immtype:$cntl),
2693                 !strconcat(OpcodeStr,
2694                            "\t{$cntl, $src1, $dst|$dst, $src1, $cntl}"),
2695                 [(set RC:$dst, (OpNode RC:$src1, immoperator:$cntl))]>,
2696                 XOP, XOPA, Sched<[Sched]>;
2697   def mi : Ii32<opc,  MRMSrcMem, (outs RC:$dst),
2698                 (ins x86memop:$src1, immtype:$cntl),
2699                 !strconcat(OpcodeStr,
2700                            "\t{$cntl, $src1, $dst|$dst, $src1, $cntl}"),
2701                 [(set RC:$dst, (OpNode (ld_frag addr:$src1), immoperator:$cntl))]>,
2702                 XOP, XOPA, Sched<[Sched.Folded]>;
2703 }
2704
2705 defm BEXTRI32 : tbm_bextri<0x10, GR32, "bextr{l}", i32mem, loadi32,
2706                            X86bextri, i32imm, timm, WriteBEXTR>;
2707 let ImmT = Imm32S in
2708 defm BEXTRI64 : tbm_bextri<0x10, GR64, "bextr{q}", i64mem, loadi64,
2709                            X86bextri, i64i32imm,
2710                            i64timmSExt32, WriteBEXTR>, VEX_W;
2711
2712 multiclass tbm_binary_rm<bits<8> opc, Format FormReg, Format FormMem,
2713                          RegisterClass RC, string OpcodeStr,
2714                          X86MemOperand x86memop, X86FoldableSchedWrite Sched> {
2715 let hasSideEffects = 0 in {
2716   def rr : I<opc,  FormReg, (outs RC:$dst), (ins RC:$src),
2717              !strconcat(OpcodeStr,"\t{$src, $dst|$dst, $src}"), []>,
2718              XOP_4V, XOP9, Sched<[Sched]>;
2719   let mayLoad = 1 in
2720   def rm : I<opc,  FormMem, (outs RC:$dst), (ins x86memop:$src),
2721              !strconcat(OpcodeStr,"\t{$src, $dst|$dst, $src}"), []>,
2722              XOP_4V, XOP9, Sched<[Sched.Folded]>;
2723 }
2724 }
2725
2726 multiclass tbm_binary_intr<bits<8> opc, string OpcodeStr,
2727                            X86FoldableSchedWrite Sched,
2728                            Format FormReg, Format FormMem> {
2729   defm NAME#32 : tbm_binary_rm<opc, FormReg, FormMem, GR32, OpcodeStr#"{l}",
2730                                i32mem, Sched>;
2731   defm NAME#64 : tbm_binary_rm<opc, FormReg, FormMem, GR64, OpcodeStr#"{q}",
2732                                i64mem, Sched>, VEX_W;
2733 }
2734
2735 defm BLCFILL : tbm_binary_intr<0x01, "blcfill", WriteALU, MRM1r, MRM1m>;
2736 defm BLCI    : tbm_binary_intr<0x02, "blci", WriteALU, MRM6r, MRM6m>;
2737 defm BLCIC   : tbm_binary_intr<0x01, "blcic", WriteALU, MRM5r, MRM5m>;
2738 defm BLCMSK  : tbm_binary_intr<0x02, "blcmsk", WriteALU, MRM1r, MRM1m>;
2739 defm BLCS    : tbm_binary_intr<0x01, "blcs", WriteALU, MRM3r, MRM3m>;
2740 defm BLSFILL : tbm_binary_intr<0x01, "blsfill", WriteALU, MRM2r, MRM2m>;
2741 defm BLSIC   : tbm_binary_intr<0x01, "blsic", WriteALU, MRM6r, MRM6m>;
2742 defm T1MSKC  : tbm_binary_intr<0x01, "t1mskc", WriteALU, MRM7r, MRM7m>;
2743 defm TZMSK   : tbm_binary_intr<0x01, "tzmsk", WriteALU, MRM4r, MRM4m>;
2744 } // HasTBM, EFLAGS
2745
2746 // Use BEXTRI for 64-bit 'and' with large immediate 'mask'.
2747 let Predicates = [HasTBM] in {
2748   def : Pat<(and GR64:$src, AndMask64:$mask),
2749             (BEXTRI64ri GR64:$src, (BEXTRMaskXForm imm:$mask))>;
2750
2751   def : Pat<(and (loadi64 addr:$src), AndMask64:$mask),
2752             (BEXTRI64mi addr:$src, (BEXTRMaskXForm imm:$mask))>;
2753 }
2754
2755 //===----------------------------------------------------------------------===//
2756 // Lightweight Profiling Instructions
2757
2758 let Predicates = [HasLWP], SchedRW = [WriteSystem] in {
2759
2760 def LLWPCB : I<0x12, MRM0r, (outs), (ins GR32:$src), "llwpcb\t$src",
2761                [(int_x86_llwpcb GR32:$src)]>, XOP, XOP9;
2762 def SLWPCB : I<0x12, MRM1r, (outs GR32:$dst), (ins), "slwpcb\t$dst",
2763                [(set GR32:$dst, (int_x86_slwpcb))]>, XOP, XOP9;
2764
2765 def LLWPCB64 : I<0x12, MRM0r, (outs), (ins GR64:$src), "llwpcb\t$src",
2766                  [(int_x86_llwpcb GR64:$src)]>, XOP, XOP9, VEX_W;
2767 def SLWPCB64 : I<0x12, MRM1r, (outs GR64:$dst), (ins), "slwpcb\t$dst",
2768                  [(set GR64:$dst, (int_x86_slwpcb))]>, XOP, XOP9, VEX_W;
2769
2770 multiclass lwpins_intr<RegisterClass RC> {
2771   def rri : Ii32<0x12, MRM0r, (outs), (ins RC:$src0, GR32:$src1, i32imm:$cntl),
2772                  "lwpins\t{$cntl, $src1, $src0|$src0, $src1, $cntl}",
2773                  [(set EFLAGS, (X86lwpins RC:$src0, GR32:$src1, timm:$cntl))]>,
2774                  XOP_4V, XOPA;
2775   let mayLoad = 1 in
2776   def rmi : Ii32<0x12, MRM0m, (outs), (ins RC:$src0, i32mem:$src1, i32imm:$cntl),
2777                  "lwpins\t{$cntl, $src1, $src0|$src0, $src1, $cntl}",
2778                  [(set EFLAGS, (X86lwpins RC:$src0, (loadi32 addr:$src1), timm:$cntl))]>,
2779                  XOP_4V, XOPA;
2780 }
2781
2782 let Defs = [EFLAGS] in {
2783   defm LWPINS32 : lwpins_intr<GR32>;
2784   defm LWPINS64 : lwpins_intr<GR64>, VEX_W;
2785 } // EFLAGS
2786
2787 multiclass lwpval_intr<RegisterClass RC, Intrinsic Int> {
2788   def rri : Ii32<0x12, MRM1r, (outs), (ins RC:$src0, GR32:$src1, i32imm:$cntl),
2789                  "lwpval\t{$cntl, $src1, $src0|$src0, $src1, $cntl}",
2790                  [(Int RC:$src0, GR32:$src1, timm:$cntl)]>, XOP_4V, XOPA;
2791   let mayLoad = 1 in
2792   def rmi : Ii32<0x12, MRM1m, (outs), (ins RC:$src0, i32mem:$src1, i32imm:$cntl),
2793                  "lwpval\t{$cntl, $src1, $src0|$src0, $src1, $cntl}",
2794                  [(Int RC:$src0, (loadi32 addr:$src1), timm:$cntl)]>,
2795                  XOP_4V, XOPA;
2796 }
2797
2798 defm LWPVAL32 : lwpval_intr<GR32, int_x86_lwpval32>;
2799 defm LWPVAL64 : lwpval_intr<GR64, int_x86_lwpval64>, VEX_W;
2800
2801 } // HasLWP, SchedRW
2802
2803 //===----------------------------------------------------------------------===//
2804 // MONITORX/MWAITX Instructions
2805 //
2806 let SchedRW = [ WriteSystem ] in {
2807   let Uses = [ EAX, ECX, EDX ] in
2808   def MONITORX32rrr : I<0x01, MRM_FA, (outs), (ins), "monitorx", []>,
2809                       TB, Requires<[ HasMWAITX, Not64BitMode ]>;
2810   let Uses = [ RAX, ECX, EDX ] in
2811   def MONITORX64rrr : I<0x01, MRM_FA, (outs), (ins), "monitorx", []>,
2812                       TB, Requires<[ HasMWAITX, In64BitMode ]>;
2813
2814   let Uses = [ ECX, EAX, EBX ] in {
2815     def MWAITXrrr : I<0x01, MRM_FB, (outs), (ins), "mwaitx",
2816                     []>, TB, Requires<[ HasMWAITX ]>;
2817   }
2818 } // SchedRW
2819
2820 def : InstAlias<"mwaitx\t{%eax, %ecx, %ebx|ebx, ecx, eax}", (MWAITXrrr)>,
2821       Requires<[ Not64BitMode ]>;
2822 def : InstAlias<"mwaitx\t{%rax, %rcx, %rbx|rbx, rcx, rax}", (MWAITXrrr)>,
2823       Requires<[ In64BitMode ]>;
2824
2825 def : InstAlias<"monitorx\t{%eax, %ecx, %edx|edx, ecx, eax}", (MONITORX32rrr)>,
2826       Requires<[ Not64BitMode ]>;
2827 def : InstAlias<"monitorx\t{%rax, %rcx, %rdx|rdx, rcx, rax}", (MONITORX64rrr)>,
2828       Requires<[ In64BitMode ]>;
2829
2830 //===----------------------------------------------------------------------===//
2831 // WAITPKG Instructions
2832 //
2833 let SchedRW = [WriteSystem] in {
2834   def UMONITOR16 : I<0xAE, MRM6r, (outs), (ins GR16:$src),
2835                      "umonitor\t$src", [(int_x86_umonitor GR16:$src)]>,
2836                      XS, AdSize16, Requires<[HasWAITPKG, Not64BitMode]>;
2837   def UMONITOR32 : I<0xAE, MRM6r, (outs), (ins GR32:$src),
2838                      "umonitor\t$src", [(int_x86_umonitor GR32:$src)]>,
2839                      XS, AdSize32, Requires<[HasWAITPKG]>;
2840   def UMONITOR64 : I<0xAE, MRM6r, (outs), (ins GR64:$src),
2841                      "umonitor\t$src", [(int_x86_umonitor GR64:$src)]>,
2842                      XS, AdSize64, Requires<[HasWAITPKG, In64BitMode]>;
2843   let Uses = [EAX, EDX], Defs = [EFLAGS] in {
2844     def UMWAIT : I<0xAE, MRM6r,
2845                      (outs), (ins GR32orGR64:$src), "umwait\t$src",
2846                      [(set EFLAGS, (X86umwait GR32orGR64:$src, EDX, EAX))]>,
2847                      XD, Requires<[HasWAITPKG]>;
2848     def TPAUSE : I<0xAE, MRM6r,
2849                      (outs), (ins GR32orGR64:$src), "tpause\t$src",
2850                      [(set EFLAGS, (X86tpause GR32orGR64:$src, EDX, EAX))]>,
2851                      PD, Requires<[HasWAITPKG]>, NotMemoryFoldable;
2852   }
2853 } // SchedRW
2854
2855 //===----------------------------------------------------------------------===//
2856 // MOVDIRI - Move doubleword/quadword as direct store
2857 //
2858 let SchedRW = [WriteStore] in {
2859 def MOVDIRI32 : I<0xF9, MRMDestMem, (outs), (ins i32mem:$dst, GR32:$src),
2860                   "movdiri\t{$src, $dst|$dst, $src}",
2861                   [(int_x86_directstore32 addr:$dst, GR32:$src)]>,
2862                  T8PS, Requires<[HasMOVDIRI]>;
2863 def MOVDIRI64 : RI<0xF9, MRMDestMem, (outs), (ins i64mem:$dst, GR64:$src),
2864                    "movdiri\t{$src, $dst|$dst, $src}",
2865                    [(int_x86_directstore64 addr:$dst, GR64:$src)]>,
2866                   T8PS, Requires<[In64BitMode, HasMOVDIRI]>;
2867 } // SchedRW
2868
2869 //===----------------------------------------------------------------------===//
2870 // MOVDIR64B - Move 64 bytes as direct store
2871 //
2872 let SchedRW = [WriteStore] in {
2873 def MOVDIR64B16 : I<0xF8, MRMSrcMem, (outs), (ins GR16:$dst, i512mem:$src),
2874                     "movdir64b\t{$src, $dst|$dst, $src}", []>,
2875                    T8PD, AdSize16, Requires<[HasMOVDIR64B, Not64BitMode]>;
2876 def MOVDIR64B32 : I<0xF8, MRMSrcMem, (outs), (ins GR32:$dst, i512mem:$src),
2877                     "movdir64b\t{$src, $dst|$dst, $src}",
2878                     [(int_x86_movdir64b GR32:$dst, addr:$src)]>,
2879                    T8PD, AdSize32, Requires<[HasMOVDIR64B]>;
2880 def MOVDIR64B64 : I<0xF8, MRMSrcMem, (outs), (ins GR64:$dst, i512mem:$src),
2881                     "movdir64b\t{$src, $dst|$dst, $src}",
2882                     [(int_x86_movdir64b GR64:$dst, addr:$src)]>,
2883                    T8PD, AdSize64, Requires<[HasMOVDIR64B, In64BitMode]>;
2884 } // SchedRW
2885
2886 //===----------------------------------------------------------------------===//
2887 // ENQCMD/S - Enqueue 64-byte command as user with 64-byte write atomicity
2888 //
2889 let SchedRW = [WriteStore], Defs = [EFLAGS] in {
2890   def ENQCMD16 : I<0xF8, MRMSrcMem, (outs), (ins GR16:$dst, i512mem:$src),
2891                  "enqcmd\t{$src, $dst|$dst, $src}",
2892                  [(set EFLAGS, (X86enqcmd GR16:$dst, addr:$src))]>,
2893                  T8XD, AdSize16, Requires<[HasENQCMD, Not64BitMode]>;
2894   def ENQCMD32 : I<0xF8, MRMSrcMem, (outs), (ins GR32:$dst, i512mem:$src),
2895                  "enqcmd\t{$src, $dst|$dst, $src}",
2896                  [(set EFLAGS, (X86enqcmd GR32:$dst, addr:$src))]>,
2897                  T8XD, AdSize32, Requires<[HasENQCMD]>;
2898   def ENQCMD64 : I<0xF8, MRMSrcMem, (outs), (ins GR64:$dst, i512mem:$src),
2899                  "enqcmd\t{$src, $dst|$dst, $src}",
2900                  [(set EFLAGS, (X86enqcmd GR64:$dst, addr:$src))]>,
2901                  T8XD, AdSize64, Requires<[HasENQCMD, In64BitMode]>;
2902
2903   def ENQCMDS16 : I<0xF8, MRMSrcMem, (outs), (ins GR16:$dst, i512mem:$src),
2904                  "enqcmds\t{$src, $dst|$dst, $src}",
2905                  [(set EFLAGS, (X86enqcmds GR16:$dst, addr:$src))]>,
2906                  T8XS, AdSize16, Requires<[HasENQCMD, Not64BitMode]>;
2907   def ENQCMDS32 : I<0xF8, MRMSrcMem, (outs), (ins GR32:$dst, i512mem:$src),
2908                  "enqcmds\t{$src, $dst|$dst, $src}",
2909                  [(set EFLAGS, (X86enqcmds GR32:$dst, addr:$src))]>,
2910                  T8XS, AdSize32, Requires<[HasENQCMD]>;
2911   def ENQCMDS64 : I<0xF8, MRMSrcMem, (outs), (ins GR64:$dst, i512mem:$src),
2912                  "enqcmds\t{$src, $dst|$dst, $src}",
2913                  [(set EFLAGS, (X86enqcmds GR64:$dst, addr:$src))]>,
2914                  T8XS, AdSize64, Requires<[HasENQCMD, In64BitMode]>;
2915 }
2916
2917 //===----------------------------------------------------------------------===//
2918 // CLZERO Instruction
2919 //
2920 let SchedRW = [WriteLoad] in {
2921   let Uses = [EAX] in
2922   def CLZERO32r : I<0x01, MRM_FC, (outs), (ins), "clzero", []>,
2923                   TB, Requires<[HasCLZERO, Not64BitMode]>;
2924   let Uses = [RAX] in
2925   def CLZERO64r : I<0x01, MRM_FC, (outs), (ins), "clzero", []>,
2926                   TB, Requires<[HasCLZERO, In64BitMode]>;
2927 } // SchedRW
2928
2929 def : InstAlias<"clzero\t{%eax|eax}", (CLZERO32r)>, Requires<[Not64BitMode]>;
2930 def : InstAlias<"clzero\t{%rax|rax}", (CLZERO64r)>, Requires<[In64BitMode]>;
2931
2932 //===----------------------------------------------------------------------===//
2933 // INVLPGB Instruction
2934 // OPCODE 0F 01 FE
2935 //
2936 let SchedRW = [WriteSystem] in {
2937   let Uses = [EAX, EDX] in
2938   def INVLPGB32 : I<0x01, MRM_FE, (outs), (ins),
2939                   "invlpgb}", []>,
2940                   PS, Requires<[Not64BitMode]>;
2941   let Uses = [RAX, EDX] in
2942   def INVLPGB64 : I<0x01, MRM_FE, (outs), (ins),
2943                   "invlpgb", []>,
2944                   PS, Requires<[In64BitMode]>;
2945 } // SchedRW
2946
2947 def : InstAlias<"invlpgb\t{%eax, %edx|eax, edx}", (INVLPGB32)>, Requires<[Not64BitMode]>;
2948 def : InstAlias<"invlpgb\t{%rax, %edx|rax, edx}", (INVLPGB64)>, Requires<[In64BitMode]>;
2949
2950 //===----------------------------------------------------------------------===//
2951 // TLBSYNC Instruction
2952 // OPCODE 0F 01 FF
2953 //
2954 let SchedRW = [WriteSystem] in {
2955   def TLBSYNC   : I<0x01, MRM_FF, (outs), (ins),
2956                   "tlbsync", []>,
2957                   PS, Requires<[]>;
2958 } // SchedRW
2959
2960 //===----------------------------------------------------------------------===//
2961 // HRESET Instruction
2962 //
2963 let Uses = [EAX], SchedRW = [WriteSystem] in
2964   def HRESET : Ii8<0xF0, MRM_C0, (outs), (ins i32u8imm:$imm), "hreset\t$imm", []>,
2965                    Requires<[HasHRESET]>, TAXS;
2966
2967 //===----------------------------------------------------------------------===//
2968 // SERIALIZE Instruction
2969 //
2970 let SchedRW = [WriteSystem] in
2971   def SERIALIZE : I<0x01, MRM_E8, (outs), (ins), "serialize",
2972                     [(int_x86_serialize)]>, PS,
2973                     Requires<[HasSERIALIZE]>;
2974
2975 //===----------------------------------------------------------------------===//
2976 // TSXLDTRK - TSX Suspend Load Address Tracking
2977 //
2978 let Predicates = [HasTSXLDTRK], SchedRW = [WriteSystem] in {
2979   def XSUSLDTRK : I<0x01, MRM_E8, (outs), (ins), "xsusldtrk",
2980                     [(int_x86_xsusldtrk)]>, XD;
2981   def XRESLDTRK : I<0x01, MRM_E9, (outs), (ins), "xresldtrk",
2982                     [(int_x86_xresldtrk)]>, XD;
2983 }
2984
2985 //===----------------------------------------------------------------------===//
2986 // UINTR Instructions
2987 //
2988 let Predicates = [HasUINTR, In64BitMode], SchedRW = [WriteSystem] in {
2989   def UIRET : I<0x01, MRM_EC, (outs), (ins), "uiret",
2990                []>, XS;
2991   def CLUI : I<0x01, MRM_EE, (outs), (ins), "clui",
2992                [(int_x86_clui)]>, XS;
2993   def STUI : I<0x01, MRM_EF, (outs), (ins), "stui",
2994                [(int_x86_stui)]>, XS;
2995
2996   def SENDUIPI : I<0xC7, MRM6r, (outs), (ins GR64:$arg), "senduipi\t$arg",
2997                    [(int_x86_senduipi GR64:$arg)]>, XS;
2998
2999   let Defs = [EFLAGS] in
3000     def TESTUI : I<0x01, MRM_ED, (outs), (ins), "testui",
3001                    [(set EFLAGS, (X86testui))]>, XS;
3002 }
3003
3004 //===----------------------------------------------------------------------===//
3005 // Pattern fragments to auto generate TBM instructions.
3006 //===----------------------------------------------------------------------===//
3007
3008 let Predicates = [HasTBM] in {
3009   // FIXME: patterns for the load versions are not implemented
3010   def : Pat<(and GR32:$src, (add GR32:$src, 1)),
3011             (BLCFILL32rr GR32:$src)>;
3012   def : Pat<(and GR64:$src, (add GR64:$src, 1)),
3013             (BLCFILL64rr GR64:$src)>;
3014
3015   def : Pat<(or GR32:$src, (not (add GR32:$src, 1))),
3016             (BLCI32rr GR32:$src)>;
3017   def : Pat<(or GR64:$src, (not (add GR64:$src, 1))),
3018             (BLCI64rr GR64:$src)>;
3019
3020   // Extra patterns because opt can optimize the above patterns to this.
3021   def : Pat<(or GR32:$src, (sub -2, GR32:$src)),
3022             (BLCI32rr GR32:$src)>;
3023   def : Pat<(or GR64:$src, (sub -2, GR64:$src)),
3024             (BLCI64rr GR64:$src)>;
3025
3026   def : Pat<(and (not GR32:$src), (add GR32:$src, 1)),
3027             (BLCIC32rr GR32:$src)>;
3028   def : Pat<(and (not GR64:$src), (add GR64:$src, 1)),
3029             (BLCIC64rr GR64:$src)>;
3030
3031   def : Pat<(xor GR32:$src, (add GR32:$src, 1)),
3032             (BLCMSK32rr GR32:$src)>;
3033   def : Pat<(xor GR64:$src, (add GR64:$src, 1)),
3034             (BLCMSK64rr GR64:$src)>;
3035
3036   def : Pat<(or GR32:$src, (add GR32:$src, 1)),
3037             (BLCS32rr GR32:$src)>;
3038   def : Pat<(or GR64:$src, (add GR64:$src, 1)),
3039             (BLCS64rr GR64:$src)>;
3040
3041   def : Pat<(or GR32:$src, (add GR32:$src, -1)),
3042             (BLSFILL32rr GR32:$src)>;
3043   def : Pat<(or GR64:$src, (add GR64:$src, -1)),
3044             (BLSFILL64rr GR64:$src)>;
3045
3046   def : Pat<(or (not GR32:$src), (add GR32:$src, -1)),
3047             (BLSIC32rr GR32:$src)>;
3048   def : Pat<(or (not GR64:$src), (add GR64:$src, -1)),
3049             (BLSIC64rr GR64:$src)>;
3050
3051   def : Pat<(or (not GR32:$src), (add GR32:$src, 1)),
3052             (T1MSKC32rr GR32:$src)>;
3053   def : Pat<(or (not GR64:$src), (add GR64:$src, 1)),
3054             (T1MSKC64rr GR64:$src)>;
3055
3056   def : Pat<(and (not GR32:$src), (add GR32:$src, -1)),
3057             (TZMSK32rr GR32:$src)>;
3058   def : Pat<(and (not GR64:$src), (add GR64:$src, -1)),
3059             (TZMSK64rr GR64:$src)>;
3060
3061   // Patterns to match flag producing ops.
3062   def : Pat<(and_flag_nocf GR32:$src, (add GR32:$src, 1)),
3063             (BLCFILL32rr GR32:$src)>;
3064   def : Pat<(and_flag_nocf GR64:$src, (add GR64:$src, 1)),
3065             (BLCFILL64rr GR64:$src)>;
3066
3067   def : Pat<(or_flag_nocf GR32:$src, (not (add GR32:$src, 1))),
3068             (BLCI32rr GR32:$src)>;
3069   def : Pat<(or_flag_nocf GR64:$src, (not (add GR64:$src, 1))),
3070             (BLCI64rr GR64:$src)>;
3071
3072   // Extra patterns because opt can optimize the above patterns to this.
3073   def : Pat<(or_flag_nocf GR32:$src, (sub -2, GR32:$src)),
3074             (BLCI32rr GR32:$src)>;
3075   def : Pat<(or_flag_nocf GR64:$src, (sub -2, GR64:$src)),
3076             (BLCI64rr GR64:$src)>;
3077
3078   def : Pat<(and_flag_nocf (not GR32:$src), (add GR32:$src, 1)),
3079             (BLCIC32rr GR32:$src)>;
3080   def : Pat<(and_flag_nocf (not GR64:$src), (add GR64:$src, 1)),
3081             (BLCIC64rr GR64:$src)>;
3082
3083   def : Pat<(xor_flag_nocf GR32:$src, (add GR32:$src, 1)),
3084             (BLCMSK32rr GR32:$src)>;
3085   def : Pat<(xor_flag_nocf GR64:$src, (add GR64:$src, 1)),
3086             (BLCMSK64rr GR64:$src)>;
3087
3088   def : Pat<(or_flag_nocf GR32:$src, (add GR32:$src, 1)),
3089             (BLCS32rr GR32:$src)>;
3090   def : Pat<(or_flag_nocf GR64:$src, (add GR64:$src, 1)),
3091             (BLCS64rr GR64:$src)>;
3092
3093   def : Pat<(or_flag_nocf GR32:$src, (add GR32:$src, -1)),
3094             (BLSFILL32rr GR32:$src)>;
3095   def : Pat<(or_flag_nocf GR64:$src, (add GR64:$src, -1)),
3096             (BLSFILL64rr GR64:$src)>;
3097
3098   def : Pat<(or_flag_nocf (not GR32:$src), (add GR32:$src, -1)),
3099             (BLSIC32rr GR32:$src)>;
3100   def : Pat<(or_flag_nocf (not GR64:$src), (add GR64:$src, -1)),
3101             (BLSIC64rr GR64:$src)>;
3102
3103   def : Pat<(or_flag_nocf (not GR32:$src), (add GR32:$src, 1)),
3104             (T1MSKC32rr GR32:$src)>;
3105   def : Pat<(or_flag_nocf (not GR64:$src), (add GR64:$src, 1)),
3106             (T1MSKC64rr GR64:$src)>;
3107
3108   def : Pat<(and_flag_nocf (not GR32:$src), (add GR32:$src, -1)),
3109             (TZMSK32rr GR32:$src)>;
3110   def : Pat<(and_flag_nocf (not GR64:$src), (add GR64:$src, -1)),
3111             (TZMSK64rr GR64:$src)>;
3112 } // HasTBM
3113
3114 //===----------------------------------------------------------------------===//
3115 // Memory Instructions
3116 //
3117
3118 let Predicates = [HasCLFLUSHOPT], SchedRW = [WriteLoad] in
3119 def CLFLUSHOPT : I<0xAE, MRM7m, (outs), (ins i8mem:$src),
3120                    "clflushopt\t$src", [(int_x86_clflushopt addr:$src)]>, PD;
3121
3122 let Predicates = [HasCLWB], SchedRW = [WriteLoad] in
3123 def CLWB       : I<0xAE, MRM6m, (outs), (ins i8mem:$src), "clwb\t$src",
3124                    [(int_x86_clwb addr:$src)]>, PD, NotMemoryFoldable;
3125
3126 let Predicates = [HasCLDEMOTE], SchedRW = [WriteLoad] in
3127 def CLDEMOTE : I<0x1C, MRM0m, (outs), (ins i8mem:$src), "cldemote\t$src",
3128                    [(int_x86_cldemote addr:$src)]>, PS;
3129
3130 //===----------------------------------------------------------------------===//
3131 // Subsystems.
3132 //===----------------------------------------------------------------------===//
3133
3134 include "X86InstrArithmetic.td"
3135 include "X86InstrCMovSetCC.td"
3136 include "X86InstrExtension.td"
3137 include "X86InstrControl.td"
3138 include "X86InstrShiftRotate.td"
3139
3140 // X87 Floating Point Stack.
3141 include "X86InstrFPStack.td"
3142
3143 // SIMD support (SSE, MMX and AVX)
3144 include "X86InstrFragmentsSIMD.td"
3145
3146 // FMA - Fused Multiply-Add support (requires FMA)
3147 include "X86InstrFMA.td"
3148
3149 // XOP
3150 include "X86InstrXOP.td"
3151
3152 // SSE, MMX and 3DNow! vector support.
3153 include "X86InstrSSE.td"
3154 include "X86InstrAVX512.td"
3155 include "X86InstrMMX.td"
3156 include "X86Instr3DNow.td"
3157
3158 // MPX instructions
3159 include "X86InstrMPX.td"
3160
3161 include "X86InstrVMX.td"
3162 include "X86InstrSVM.td"
3163 include "X86InstrSNP.td"
3164
3165 include "X86InstrTSX.td"
3166 include "X86InstrSGX.td"
3167
3168 include "X86InstrTDX.td"
3169
3170 // Key Locker instructions
3171 include "X86InstrKL.td"
3172
3173 // AMX instructions
3174 include "X86InstrAMX.td"
3175
3176 // System instructions.
3177 include "X86InstrSystem.td"
3178
3179 // Compiler Pseudo Instructions and Pat Patterns
3180 include "X86InstrCompiler.td"
3181 include "X86InstrVecCompiler.td"
3182
3183 //===----------------------------------------------------------------------===//
3184 // Assembler Mnemonic Aliases
3185 //===----------------------------------------------------------------------===//
3186
3187 def : MnemonicAlias<"call", "callw", "att">, Requires<[In16BitMode]>;
3188 def : MnemonicAlias<"call", "calll", "att">, Requires<[In32BitMode]>;
3189 def : MnemonicAlias<"call", "callq", "att">, Requires<[In64BitMode]>;
3190
3191 def : MnemonicAlias<"cbw",  "cbtw", "att">;
3192 def : MnemonicAlias<"cwde", "cwtl", "att">;
3193 def : MnemonicAlias<"cwd",  "cwtd", "att">;
3194 def : MnemonicAlias<"cdq",  "cltd", "att">;
3195 def : MnemonicAlias<"cdqe", "cltq", "att">;
3196 def : MnemonicAlias<"cqo",  "cqto", "att">;
3197
3198 // In 64-bit mode lret maps to lretl; it is not ambiguous with lretq.
3199 def : MnemonicAlias<"lret", "lretw", "att">, Requires<[In16BitMode]>;
3200 def : MnemonicAlias<"lret", "lretl", "att">, Requires<[Not16BitMode]>;
3201
3202 def : MnemonicAlias<"leavel", "leave", "att">, Requires<[Not64BitMode]>;
3203 def : MnemonicAlias<"leaveq", "leave", "att">, Requires<[In64BitMode]>;
3204
3205 def : MnemonicAlias<"loopz",  "loope">;
3206 def : MnemonicAlias<"loopnz", "loopne">;
3207
3208 def : MnemonicAlias<"pop",   "popw",  "att">, Requires<[In16BitMode]>;
3209 def : MnemonicAlias<"pop",   "popl",  "att">, Requires<[In32BitMode]>;
3210 def : MnemonicAlias<"pop",   "popq",  "att">, Requires<[In64BitMode]>;
3211 def : MnemonicAlias<"popf",  "popfw", "att">, Requires<[In16BitMode]>;
3212 def : MnemonicAlias<"popf",  "popfl", "att">, Requires<[In32BitMode]>;
3213 def : MnemonicAlias<"popf",  "popfq", "att">, Requires<[In64BitMode]>;
3214 def : MnemonicAlias<"popf",  "popfq", "intel">, Requires<[In64BitMode]>;
3215 def : MnemonicAlias<"popfd", "popfl", "att">;
3216 def : MnemonicAlias<"popfw", "popf",  "intel">, Requires<[In32BitMode]>;
3217 def : MnemonicAlias<"popfw", "popf",  "intel">, Requires<[In64BitMode]>;
3218
3219 // FIXME: This is wrong for "push reg".  "push %bx" should turn into pushw in
3220 // all modes.  However: "push (addr)" and "push $42" should default to
3221 // pushl/pushq depending on the current mode.  Similar for "pop %bx"
3222 def : MnemonicAlias<"push",   "pushw",  "att">, Requires<[In16BitMode]>;
3223 def : MnemonicAlias<"push",   "pushl",  "att">, Requires<[In32BitMode]>;
3224 def : MnemonicAlias<"push",   "pushq",  "att">, Requires<[In64BitMode]>;
3225 def : MnemonicAlias<"pushf",  "pushfw", "att">, Requires<[In16BitMode]>;
3226 def : MnemonicAlias<"pushf",  "pushfl", "att">, Requires<[In32BitMode]>;
3227 def : MnemonicAlias<"pushf",  "pushfq", "att">, Requires<[In64BitMode]>;
3228 def : MnemonicAlias<"pushf",  "pushfq", "intel">, Requires<[In64BitMode]>;
3229 def : MnemonicAlias<"pushfd", "pushfl", "att">;
3230 def : MnemonicAlias<"pushfw", "pushf",  "intel">, Requires<[In32BitMode]>;
3231 def : MnemonicAlias<"pushfw", "pushf",  "intel">, Requires<[In64BitMode]>;
3232
3233 def : MnemonicAlias<"popad",  "popal",  "intel">, Requires<[Not64BitMode]>;
3234 def : MnemonicAlias<"pushad", "pushal", "intel">, Requires<[Not64BitMode]>;
3235 def : MnemonicAlias<"popa",   "popaw",  "intel">, Requires<[In16BitMode]>;
3236 def : MnemonicAlias<"pusha",  "pushaw", "intel">, Requires<[In16BitMode]>;
3237 def : MnemonicAlias<"popa",   "popal",  "intel">, Requires<[In32BitMode]>;
3238 def : MnemonicAlias<"pusha",  "pushal", "intel">, Requires<[In32BitMode]>;
3239
3240 def : MnemonicAlias<"popa",   "popaw",  "att">, Requires<[In16BitMode]>;
3241 def : MnemonicAlias<"pusha",  "pushaw", "att">, Requires<[In16BitMode]>;
3242 def : MnemonicAlias<"popa",   "popal",  "att">, Requires<[In32BitMode]>;
3243 def : MnemonicAlias<"pusha",  "pushal", "att">, Requires<[In32BitMode]>;
3244
3245 def : MnemonicAlias<"repe",  "rep">;
3246 def : MnemonicAlias<"repz",  "rep">;
3247 def : MnemonicAlias<"repnz", "repne">;
3248
3249 def : MnemonicAlias<"ret", "retw", "att">, Requires<[In16BitMode]>;
3250 def : MnemonicAlias<"ret", "retl", "att">, Requires<[In32BitMode]>;
3251 def : MnemonicAlias<"ret", "retq", "att">, Requires<[In64BitMode]>;
3252
3253 // Apply 'ret' behavior to 'retn'
3254 def : MnemonicAlias<"retn", "retw", "att">, Requires<[In16BitMode]>;
3255 def : MnemonicAlias<"retn", "retl", "att">, Requires<[In32BitMode]>;
3256 def : MnemonicAlias<"retn", "retq", "att">, Requires<[In64BitMode]>;
3257 def : MnemonicAlias<"retn", "ret", "intel">;
3258
3259 def : MnemonicAlias<"sal", "shl", "intel">;
3260 def : MnemonicAlias<"salb", "shlb", "att">;
3261 def : MnemonicAlias<"salw", "shlw", "att">;
3262 def : MnemonicAlias<"sall", "shll", "att">;
3263 def : MnemonicAlias<"salq", "shlq", "att">;
3264
3265 def : MnemonicAlias<"smovb", "movsb", "att">;
3266 def : MnemonicAlias<"smovw", "movsw", "att">;
3267 def : MnemonicAlias<"smovl", "movsl", "att">;
3268 def : MnemonicAlias<"smovq", "movsq", "att">;
3269
3270 def : MnemonicAlias<"ud2a",  "ud2",  "att">;
3271 def : MnemonicAlias<"ud2bw", "ud1w", "att">;
3272 def : MnemonicAlias<"ud2bl", "ud1l", "att">;
3273 def : MnemonicAlias<"ud2bq", "ud1q", "att">;
3274 def : MnemonicAlias<"verrw", "verr", "att">;
3275
3276 // MS recognizes 'xacquire'/'xrelease' as 'acquire'/'release'
3277 def : MnemonicAlias<"acquire", "xacquire", "intel">;
3278 def : MnemonicAlias<"release", "xrelease", "intel">;
3279
3280 // System instruction aliases.
3281 def : MnemonicAlias<"iret",    "iretw",    "att">, Requires<[In16BitMode]>;
3282 def : MnemonicAlias<"iret",    "iretl",    "att">, Requires<[Not16BitMode]>;
3283 def : MnemonicAlias<"sysret",  "sysretl",  "att">;
3284 def : MnemonicAlias<"sysexit", "sysexitl", "att">;
3285
3286 def : MnemonicAlias<"lgdt", "lgdtw", "att">, Requires<[In16BitMode]>;
3287 def : MnemonicAlias<"lgdt", "lgdtl", "att">, Requires<[In32BitMode]>;
3288 def : MnemonicAlias<"lgdt", "lgdtq", "att">, Requires<[In64BitMode]>;
3289 def : MnemonicAlias<"lidt", "lidtw", "att">, Requires<[In16BitMode]>;
3290 def : MnemonicAlias<"lidt", "lidtl", "att">, Requires<[In32BitMode]>;
3291 def : MnemonicAlias<"lidt", "lidtq", "att">, Requires<[In64BitMode]>;
3292 def : MnemonicAlias<"sgdt", "sgdtw", "att">, Requires<[In16BitMode]>;
3293 def : MnemonicAlias<"sgdt", "sgdtl", "att">, Requires<[In32BitMode]>;
3294 def : MnemonicAlias<"sgdt", "sgdtq", "att">, Requires<[In64BitMode]>;
3295 def : MnemonicAlias<"sidt", "sidtw", "att">, Requires<[In16BitMode]>;
3296 def : MnemonicAlias<"sidt", "sidtl", "att">, Requires<[In32BitMode]>;
3297 def : MnemonicAlias<"sidt", "sidtq", "att">, Requires<[In64BitMode]>;
3298 def : MnemonicAlias<"lgdt", "lgdtw", "intel">, Requires<[In16BitMode]>;
3299 def : MnemonicAlias<"lgdt", "lgdtd", "intel">, Requires<[In32BitMode]>;
3300 def : MnemonicAlias<"lidt", "lidtw", "intel">, Requires<[In16BitMode]>;
3301 def : MnemonicAlias<"lidt", "lidtd", "intel">, Requires<[In32BitMode]>;
3302 def : MnemonicAlias<"sgdt", "sgdtw", "intel">, Requires<[In16BitMode]>;
3303 def : MnemonicAlias<"sgdt", "sgdtd", "intel">, Requires<[In32BitMode]>;
3304 def : MnemonicAlias<"sidt", "sidtw", "intel">, Requires<[In16BitMode]>;
3305 def : MnemonicAlias<"sidt", "sidtd", "intel">, Requires<[In32BitMode]>;
3306
3307
3308 // Floating point stack aliases.
3309 def : MnemonicAlias<"fcmovz",   "fcmove",   "att">;
3310 def : MnemonicAlias<"fcmova",   "fcmovnbe", "att">;
3311 def : MnemonicAlias<"fcmovnae", "fcmovb",   "att">;
3312 def : MnemonicAlias<"fcmovna",  "fcmovbe",  "att">;
3313 def : MnemonicAlias<"fcmovae",  "fcmovnb",  "att">;
3314 def : MnemonicAlias<"fcomip",   "fcompi">;
3315 def : MnemonicAlias<"fildq",    "fildll",   "att">;
3316 def : MnemonicAlias<"fistpq",   "fistpll",  "att">;
3317 def : MnemonicAlias<"fisttpq",  "fisttpll", "att">;
3318 def : MnemonicAlias<"fldcww",   "fldcw",    "att">;
3319 def : MnemonicAlias<"fnstcww",  "fnstcw",   "att">;
3320 def : MnemonicAlias<"fnstsww",  "fnstsw",   "att">;
3321 def : MnemonicAlias<"fucomip",  "fucompi">;
3322 def : MnemonicAlias<"fwait",    "wait">;
3323
3324 def : MnemonicAlias<"fxsaveq",   "fxsave64",   "att">;
3325 def : MnemonicAlias<"fxrstorq",  "fxrstor64",  "att">;
3326 def : MnemonicAlias<"xsaveq",    "xsave64",    "att">;
3327 def : MnemonicAlias<"xrstorq",   "xrstor64",   "att">;
3328 def : MnemonicAlias<"xsaveoptq", "xsaveopt64", "att">;
3329 def : MnemonicAlias<"xrstorsq",  "xrstors64",  "att">;
3330 def : MnemonicAlias<"xsavecq",   "xsavec64",   "att">;
3331 def : MnemonicAlias<"xsavesq",   "xsaves64",   "att">;
3332
3333 class CondCodeAlias<string Prefix,string Suffix, string OldCond, string NewCond,
3334                     string VariantName>
3335   : MnemonicAlias<!strconcat(Prefix, OldCond, Suffix),
3336                   !strconcat(Prefix, NewCond, Suffix), VariantName>;
3337
3338 /// IntegerCondCodeMnemonicAlias - This multiclass defines a bunch of
3339 /// MnemonicAlias's that canonicalize the condition code in a mnemonic, for
3340 /// example "setz" -> "sete".
3341 multiclass IntegerCondCodeMnemonicAlias<string Prefix, string Suffix,
3342                                         string V = ""> {
3343   def C   : CondCodeAlias<Prefix, Suffix, "c",   "b",  V>; // setc   -> setb
3344   def Z   : CondCodeAlias<Prefix, Suffix, "z" ,  "e",  V>; // setz   -> sete
3345   def NA  : CondCodeAlias<Prefix, Suffix, "na",  "be", V>; // setna  -> setbe
3346   def NB  : CondCodeAlias<Prefix, Suffix, "nb",  "ae", V>; // setnb  -> setae
3347   def NC  : CondCodeAlias<Prefix, Suffix, "nc",  "ae", V>; // setnc  -> setae
3348   def NG  : CondCodeAlias<Prefix, Suffix, "ng",  "le", V>; // setng  -> setle
3349   def NL  : CondCodeAlias<Prefix, Suffix, "nl",  "ge", V>; // setnl  -> setge
3350   def NZ  : CondCodeAlias<Prefix, Suffix, "nz",  "ne", V>; // setnz  -> setne
3351   def PE  : CondCodeAlias<Prefix, Suffix, "pe",  "p",  V>; // setpe  -> setp
3352   def PO  : CondCodeAlias<Prefix, Suffix, "po",  "np", V>; // setpo  -> setnp
3353
3354   def NAE : CondCodeAlias<Prefix, Suffix, "nae", "b",  V>; // setnae -> setb
3355   def NBE : CondCodeAlias<Prefix, Suffix, "nbe", "a",  V>; // setnbe -> seta
3356   def NGE : CondCodeAlias<Prefix, Suffix, "nge", "l",  V>; // setnge -> setl
3357   def NLE : CondCodeAlias<Prefix, Suffix, "nle", "g",  V>; // setnle -> setg
3358 }
3359
3360 // Aliases for set<CC>
3361 defm : IntegerCondCodeMnemonicAlias<"set", "">;
3362 // Aliases for j<CC>
3363 defm : IntegerCondCodeMnemonicAlias<"j", "">;
3364 // Aliases for cmov<CC>{w,l,q}
3365 defm : IntegerCondCodeMnemonicAlias<"cmov", "w", "att">;
3366 defm : IntegerCondCodeMnemonicAlias<"cmov", "l", "att">;
3367 defm : IntegerCondCodeMnemonicAlias<"cmov", "q", "att">;
3368 // No size suffix for intel-style asm.
3369 defm : IntegerCondCodeMnemonicAlias<"cmov", "", "intel">;
3370
3371
3372 //===----------------------------------------------------------------------===//
3373 // Assembler Instruction Aliases
3374 //===----------------------------------------------------------------------===//
3375
3376 // aad/aam default to base 10 if no operand is specified.
3377 def : InstAlias<"aad", (AAD8i8 10)>, Requires<[Not64BitMode]>;
3378 def : InstAlias<"aam", (AAM8i8 10)>, Requires<[Not64BitMode]>;
3379
3380 // Disambiguate the mem/imm form of bt-without-a-suffix as btl.
3381 // Likewise for btc/btr/bts.
3382 def : InstAlias<"bt\t{$imm, $mem|$mem, $imm}",
3383                 (BT32mi8 i32mem:$mem, i32u8imm:$imm), 0, "att">;
3384 def : InstAlias<"btc\t{$imm, $mem|$mem, $imm}",
3385                 (BTC32mi8 i32mem:$mem, i32u8imm:$imm), 0, "att">;
3386 def : InstAlias<"btr\t{$imm, $mem|$mem, $imm}",
3387                 (BTR32mi8 i32mem:$mem, i32u8imm:$imm), 0, "att">;
3388 def : InstAlias<"bts\t{$imm, $mem|$mem, $imm}",
3389                 (BTS32mi8 i32mem:$mem, i32u8imm:$imm), 0, "att">;
3390
3391 // clr aliases.
3392 def : InstAlias<"clr{b}\t$reg", (XOR8rr  GR8 :$reg, GR8 :$reg), 0>;
3393 def : InstAlias<"clr{w}\t$reg", (XOR16rr GR16:$reg, GR16:$reg), 0>;
3394 def : InstAlias<"clr{l}\t$reg", (XOR32rr GR32:$reg, GR32:$reg), 0>;
3395 def : InstAlias<"clr{q}\t$reg", (XOR64rr GR64:$reg, GR64:$reg), 0>;
3396
3397 // lods aliases. Accept the destination being omitted because it's implicit
3398 // in the mnemonic, or the mnemonic suffix being omitted because it's implicit
3399 // in the destination.
3400 def : InstAlias<"lodsb\t$src", (LODSB srcidx8:$src),  0>;
3401 def : InstAlias<"lodsw\t$src", (LODSW srcidx16:$src), 0>;
3402 def : InstAlias<"lods{l|d}\t$src", (LODSL srcidx32:$src), 0>;
3403 def : InstAlias<"lodsq\t$src", (LODSQ srcidx64:$src), 0>, Requires<[In64BitMode]>;
3404 def : InstAlias<"lods\t{$src, %al|al, $src}", (LODSB srcidx8:$src),  0>;
3405 def : InstAlias<"lods\t{$src, %ax|ax, $src}", (LODSW srcidx16:$src), 0>;
3406 def : InstAlias<"lods\t{$src, %eax|eax, $src}", (LODSL srcidx32:$src), 0>;
3407 def : InstAlias<"lods\t{$src, %rax|rax, $src}", (LODSQ srcidx64:$src), 0>, Requires<[In64BitMode]>;
3408 def : InstAlias<"lods\t$src", (LODSB srcidx8:$src),  0, "intel">;
3409 def : InstAlias<"lods\t$src", (LODSW srcidx16:$src), 0, "intel">;
3410 def : InstAlias<"lods\t$src", (LODSL srcidx32:$src), 0, "intel">;
3411 def : InstAlias<"lods\t$src", (LODSQ srcidx64:$src), 0, "intel">, Requires<[In64BitMode]>;
3412
3413
3414 // stos aliases. Accept the source being omitted because it's implicit in
3415 // the mnemonic, or the mnemonic suffix being omitted because it's implicit
3416 // in the source.
3417 def : InstAlias<"stosb\t$dst", (STOSB dstidx8:$dst),  0>;
3418 def : InstAlias<"stosw\t$dst", (STOSW dstidx16:$dst), 0>;
3419 def : InstAlias<"stos{l|d}\t$dst", (STOSL dstidx32:$dst), 0>;
3420 def : InstAlias<"stosq\t$dst", (STOSQ dstidx64:$dst), 0>, Requires<[In64BitMode]>;
3421 def : InstAlias<"stos\t{%al, $dst|$dst, al}", (STOSB dstidx8:$dst),  0>;
3422 def : InstAlias<"stos\t{%ax, $dst|$dst, ax}", (STOSW dstidx16:$dst), 0>;
3423 def : InstAlias<"stos\t{%eax, $dst|$dst, eax}", (STOSL dstidx32:$dst), 0>;
3424 def : InstAlias<"stos\t{%rax, $dst|$dst, rax}", (STOSQ dstidx64:$dst), 0>, Requires<[In64BitMode]>;
3425 def : InstAlias<"stos\t$dst", (STOSB dstidx8:$dst),  0, "intel">;
3426 def : InstAlias<"stos\t$dst", (STOSW dstidx16:$dst), 0, "intel">;
3427 def : InstAlias<"stos\t$dst", (STOSL dstidx32:$dst), 0, "intel">;
3428 def : InstAlias<"stos\t$dst", (STOSQ dstidx64:$dst), 0, "intel">, Requires<[In64BitMode]>;
3429
3430
3431 // scas aliases. Accept the destination being omitted because it's implicit
3432 // in the mnemonic, or the mnemonic suffix being omitted because it's implicit
3433 // in the destination.
3434 def : InstAlias<"scasb\t$dst", (SCASB dstidx8:$dst),  0>;
3435 def : InstAlias<"scasw\t$dst", (SCASW dstidx16:$dst), 0>;
3436 def : InstAlias<"scas{l|d}\t$dst", (SCASL dstidx32:$dst), 0>;
3437 def : InstAlias<"scasq\t$dst", (SCASQ dstidx64:$dst), 0>, Requires<[In64BitMode]>;
3438 def : InstAlias<"scas\t{$dst, %al|al, $dst}", (SCASB dstidx8:$dst),  0>;
3439 def : InstAlias<"scas\t{$dst, %ax|ax, $dst}", (SCASW dstidx16:$dst), 0>;
3440 def : InstAlias<"scas\t{$dst, %eax|eax, $dst}", (SCASL dstidx32:$dst), 0>;
3441 def : InstAlias<"scas\t{$dst, %rax|rax, $dst}", (SCASQ dstidx64:$dst), 0>, Requires<[In64BitMode]>;
3442 def : InstAlias<"scas\t$dst", (SCASB dstidx8:$dst),  0, "intel">;
3443 def : InstAlias<"scas\t$dst", (SCASW dstidx16:$dst), 0, "intel">;
3444 def : InstAlias<"scas\t$dst", (SCASL dstidx32:$dst), 0, "intel">;
3445 def : InstAlias<"scas\t$dst", (SCASQ dstidx64:$dst), 0, "intel">, Requires<[In64BitMode]>;
3446
3447 // cmps aliases. Mnemonic suffix being omitted because it's implicit
3448 // in the destination.
3449 def : InstAlias<"cmps\t{$dst, $src|$src, $dst}", (CMPSB dstidx8:$dst, srcidx8:$src),   0, "intel">;
3450 def : InstAlias<"cmps\t{$dst, $src|$src, $dst}", (CMPSW dstidx16:$dst, srcidx16:$src), 0, "intel">;
3451 def : InstAlias<"cmps\t{$dst, $src|$src, $dst}", (CMPSL dstidx32:$dst, srcidx32:$src), 0, "intel">;
3452 def : InstAlias<"cmps\t{$dst, $src|$src, $dst}", (CMPSQ dstidx64:$dst, srcidx64:$src), 0, "intel">, Requires<[In64BitMode]>;
3453
3454 // movs aliases. Mnemonic suffix being omitted because it's implicit
3455 // in the destination.
3456 def : InstAlias<"movs\t{$src, $dst|$dst, $src}", (MOVSB dstidx8:$dst, srcidx8:$src),   0, "intel">;
3457 def : InstAlias<"movs\t{$src, $dst|$dst, $src}", (MOVSW dstidx16:$dst, srcidx16:$src), 0, "intel">;
3458 def : InstAlias<"movs\t{$src, $dst|$dst, $src}", (MOVSL dstidx32:$dst, srcidx32:$src), 0, "intel">;
3459 def : InstAlias<"movs\t{$src, $dst|$dst, $src}", (MOVSQ dstidx64:$dst, srcidx64:$src), 0, "intel">, Requires<[In64BitMode]>;
3460
3461 // div and idiv aliases for explicit A register.
3462 def : InstAlias<"div{b}\t{$src, %al|al, $src}", (DIV8r  GR8 :$src)>;
3463 def : InstAlias<"div{w}\t{$src, %ax|ax, $src}", (DIV16r GR16:$src)>;
3464 def : InstAlias<"div{l}\t{$src, %eax|eax, $src}", (DIV32r GR32:$src)>;
3465 def : InstAlias<"div{q}\t{$src, %rax|rax, $src}", (DIV64r GR64:$src)>;
3466 def : InstAlias<"div{b}\t{$src, %al|al, $src}", (DIV8m  i8mem :$src)>;
3467 def : InstAlias<"div{w}\t{$src, %ax|ax, $src}", (DIV16m i16mem:$src)>;
3468 def : InstAlias<"div{l}\t{$src, %eax|eax, $src}", (DIV32m i32mem:$src)>;
3469 def : InstAlias<"div{q}\t{$src, %rax|rax, $src}", (DIV64m i64mem:$src)>;
3470 def : InstAlias<"idiv{b}\t{$src, %al|al, $src}", (IDIV8r  GR8 :$src)>;
3471 def : InstAlias<"idiv{w}\t{$src, %ax|ax, $src}", (IDIV16r GR16:$src)>;
3472 def : InstAlias<"idiv{l}\t{$src, %eax|eax, $src}", (IDIV32r GR32:$src)>;
3473 def : InstAlias<"idiv{q}\t{$src, %rax|rax, $src}", (IDIV64r GR64:$src)>;
3474 def : InstAlias<"idiv{b}\t{$src, %al|al, $src}", (IDIV8m  i8mem :$src)>;
3475 def : InstAlias<"idiv{w}\t{$src, %ax|ax, $src}", (IDIV16m i16mem:$src)>;
3476 def : InstAlias<"idiv{l}\t{$src, %eax|eax, $src}", (IDIV32m i32mem:$src)>;
3477 def : InstAlias<"idiv{q}\t{$src, %rax|rax, $src}", (IDIV64m i64mem:$src)>;
3478
3479
3480
3481 // Various unary fpstack operations default to operating on ST1.
3482 // For example, "fxch" -> "fxch %st(1)"
3483 def : InstAlias<"faddp",        (ADD_FPrST0  ST1), 0>;
3484 def:  InstAlias<"fadd",         (ADD_FPrST0  ST1), 0>;
3485 def : InstAlias<"fsub{|r}p",    (SUBR_FPrST0 ST1), 0>;
3486 def : InstAlias<"fsub{r|}p",    (SUB_FPrST0  ST1), 0>;
3487 def : InstAlias<"fmul",         (MUL_FPrST0  ST1), 0>;
3488 def : InstAlias<"fmulp",        (MUL_FPrST0  ST1), 0>;
3489 def : InstAlias<"fdiv{|r}p",    (DIVR_FPrST0 ST1), 0>;
3490 def : InstAlias<"fdiv{r|}p",    (DIV_FPrST0  ST1), 0>;
3491 def : InstAlias<"fxch",         (XCH_F       ST1), 0>;
3492 def : InstAlias<"fcom",         (COM_FST0r   ST1), 0>;
3493 def : InstAlias<"fcomp",        (COMP_FST0r  ST1), 0>;
3494 def : InstAlias<"fcomi",        (COM_FIr     ST1), 0>;
3495 def : InstAlias<"fcompi",       (COM_FIPr    ST1), 0>;
3496 def : InstAlias<"fucom",        (UCOM_Fr     ST1), 0>;
3497 def : InstAlias<"fucomp",       (UCOM_FPr    ST1), 0>;
3498 def : InstAlias<"fucomi",       (UCOM_FIr    ST1), 0>;
3499 def : InstAlias<"fucompi",      (UCOM_FIPr   ST1), 0>;
3500
3501 // Handle fmul/fadd/fsub/fdiv instructions with explicitly written st(0) op.
3502 // For example, "fadd %st(4), %st(0)" -> "fadd %st(4)".  We also disambiguate
3503 // instructions like "fadd %st(0), %st(0)" as "fadd %st(0)" for consistency with
3504 // gas.
3505 multiclass FpUnaryAlias<string Mnemonic, Instruction Inst, bit EmitAlias = 1> {
3506  def : InstAlias<!strconcat(Mnemonic, "\t$op"),
3507                  (Inst RSTi:$op), EmitAlias>;
3508  def : InstAlias<!strconcat(Mnemonic, "\t{%st, %st|st, st}"),
3509                  (Inst ST0), EmitAlias>;
3510 }
3511
3512 defm : FpUnaryAlias<"fadd",   ADD_FST0r, 0>;
3513 defm : FpUnaryAlias<"faddp",  ADD_FPrST0, 0>;
3514 defm : FpUnaryAlias<"fsub",   SUB_FST0r, 0>;
3515 defm : FpUnaryAlias<"fsub{|r}p",  SUBR_FPrST0, 0>;
3516 defm : FpUnaryAlias<"fsubr",  SUBR_FST0r, 0>;
3517 defm : FpUnaryAlias<"fsub{r|}p", SUB_FPrST0, 0>;
3518 defm : FpUnaryAlias<"fmul",   MUL_FST0r, 0>;
3519 defm : FpUnaryAlias<"fmulp",  MUL_FPrST0, 0>;
3520 defm : FpUnaryAlias<"fdiv",   DIV_FST0r, 0>;
3521 defm : FpUnaryAlias<"fdiv{|r}p",  DIVR_FPrST0, 0>;
3522 defm : FpUnaryAlias<"fdivr",  DIVR_FST0r, 0>;
3523 defm : FpUnaryAlias<"fdiv{r|}p", DIV_FPrST0, 0>;
3524 defm : FpUnaryAlias<"fcomi",   COM_FIr, 0>;
3525 defm : FpUnaryAlias<"fucomi",  UCOM_FIr, 0>;
3526 defm : FpUnaryAlias<"fcompi",   COM_FIPr, 0>;
3527 defm : FpUnaryAlias<"fucompi",  UCOM_FIPr, 0>;
3528
3529
3530 // Handle "f{mulp,addp} $op, %st(0)" the same as "f{mulp,addp} $op", since they
3531 // commute.  We also allow fdiv[r]p/fsubrp even though they don't commute,
3532 // solely because gas supports it.
3533 def : InstAlias<"faddp\t{$op, %st|st, $op}", (ADD_FPrST0 RSTi:$op), 0>;
3534 def : InstAlias<"fmulp\t{$op, %st|st, $op}", (MUL_FPrST0 RSTi:$op), 0>;
3535 def : InstAlias<"fsub{|r}p\t{$op, %st|st, $op}", (SUBR_FPrST0 RSTi:$op), 0>;
3536 def : InstAlias<"fsub{r|}p\t{$op, %st|st, $op}", (SUB_FPrST0 RSTi:$op), 0>;
3537 def : InstAlias<"fdiv{|r}p\t{$op, %st|st, $op}", (DIVR_FPrST0 RSTi:$op), 0>;
3538 def : InstAlias<"fdiv{r|}p\t{$op, %st|st, $op}", (DIV_FPrST0 RSTi:$op), 0>;
3539
3540 def : InstAlias<"fnstsw"     , (FNSTSW16r), 0>;
3541
3542 // lcall and ljmp aliases.  This seems to be an odd mapping in 64-bit mode, but
3543 // this is compatible with what GAS does.
3544 def : InstAlias<"lcall\t$seg, $off", (FARCALL32i i32imm:$off, i16imm:$seg), 0>, Requires<[In32BitMode]>;
3545 def : InstAlias<"ljmp\t$seg, $off",  (FARJMP32i  i32imm:$off, i16imm:$seg), 0>, Requires<[In32BitMode]>;
3546 def : InstAlias<"lcall\t{*}$dst",    (FARCALL32m opaquemem:$dst), 0>, Requires<[Not16BitMode]>;
3547 def : InstAlias<"ljmp\t{*}$dst",     (FARJMP32m  opaquemem:$dst), 0>, Requires<[Not16BitMode]>;
3548 def : InstAlias<"lcall\t$seg, $off", (FARCALL16i i16imm:$off, i16imm:$seg), 0>, Requires<[In16BitMode]>;
3549 def : InstAlias<"ljmp\t$seg, $off",  (FARJMP16i  i16imm:$off, i16imm:$seg), 0>, Requires<[In16BitMode]>;
3550 def : InstAlias<"lcall\t{*}$dst",    (FARCALL16m opaquemem:$dst), 0>, Requires<[In16BitMode]>;
3551 def : InstAlias<"ljmp\t{*}$dst",     (FARJMP16m  opaquemem:$dst), 0>, Requires<[In16BitMode]>;
3552
3553 def : InstAlias<"jmp\t{*}$dst",      (JMP64m  i64mem:$dst), 0, "att">, Requires<[In64BitMode]>;
3554 def : InstAlias<"jmp\t{*}$dst",      (JMP32m  i32mem:$dst), 0, "att">, Requires<[In32BitMode]>;
3555 def : InstAlias<"jmp\t{*}$dst",      (JMP16m  i16mem:$dst), 0, "att">, Requires<[In16BitMode]>;
3556
3557
3558 // "imul <imm>, B" is an alias for "imul <imm>, B, B".
3559 def : InstAlias<"imul{w}\t{$imm, $r|$r, $imm}", (IMUL16rri  GR16:$r, GR16:$r, i16imm:$imm), 0>;
3560 def : InstAlias<"imul{w}\t{$imm, $r|$r, $imm}", (IMUL16rri8 GR16:$r, GR16:$r, i16i8imm:$imm), 0>;
3561 def : InstAlias<"imul{l}\t{$imm, $r|$r, $imm}", (IMUL32rri  GR32:$r, GR32:$r, i32imm:$imm), 0>;
3562 def : InstAlias<"imul{l}\t{$imm, $r|$r, $imm}", (IMUL32rri8 GR32:$r, GR32:$r, i32i8imm:$imm), 0>;
3563 def : InstAlias<"imul{q}\t{$imm, $r|$r, $imm}", (IMUL64rri32 GR64:$r, GR64:$r, i64i32imm:$imm), 0>;
3564 def : InstAlias<"imul{q}\t{$imm, $r|$r, $imm}", (IMUL64rri8 GR64:$r, GR64:$r, i64i8imm:$imm), 0>;
3565
3566 // ins aliases. Accept the mnemonic suffix being omitted because it's implicit
3567 // in the destination.
3568 def : InstAlias<"ins\t{%dx, $dst|$dst, dx}", (INSB dstidx8:$dst),  0, "intel">;
3569 def : InstAlias<"ins\t{%dx, $dst|$dst, dx}", (INSW dstidx16:$dst), 0, "intel">;
3570 def : InstAlias<"ins\t{%dx, $dst|$dst, dx}", (INSL dstidx32:$dst), 0, "intel">;
3571
3572 // outs aliases. Accept the mnemonic suffix being omitted because it's implicit
3573 // in the source.
3574 def : InstAlias<"outs\t{$src, %dx|dx, $src}", (OUTSB srcidx8:$src),  0, "intel">;
3575 def : InstAlias<"outs\t{$src, %dx|dx, $src}", (OUTSW srcidx16:$src), 0, "intel">;
3576 def : InstAlias<"outs\t{$src, %dx|dx, $src}", (OUTSL srcidx32:$src), 0, "intel">;
3577
3578 // inb %dx -> inb %al, %dx
3579 def : InstAlias<"inb\t{%dx|dx}", (IN8rr), 0>;
3580 def : InstAlias<"inw\t{%dx|dx}", (IN16rr), 0>;
3581 def : InstAlias<"inl\t{%dx|dx}", (IN32rr), 0>;
3582 def : InstAlias<"inb\t$port", (IN8ri u8imm:$port), 0>;
3583 def : InstAlias<"inw\t$port", (IN16ri u8imm:$port), 0>;
3584 def : InstAlias<"inl\t$port", (IN32ri u8imm:$port), 0>;
3585
3586
3587 // jmp and call aliases for lcall and ljmp.  jmp $42,$5 -> ljmp
3588 def : InstAlias<"call\t$seg, $off",  (FARCALL16i i16imm:$off, i16imm:$seg)>, Requires<[In16BitMode]>;
3589 def : InstAlias<"jmp\t$seg, $off",   (FARJMP16i  i16imm:$off, i16imm:$seg)>, Requires<[In16BitMode]>;
3590 def : InstAlias<"call\t$seg, $off",  (FARCALL32i i32imm:$off, i16imm:$seg)>, Requires<[In32BitMode]>;
3591 def : InstAlias<"jmp\t$seg, $off",   (FARJMP32i  i32imm:$off, i16imm:$seg)>, Requires<[In32BitMode]>;
3592 def : InstAlias<"callw\t$seg, $off", (FARCALL16i i16imm:$off, i16imm:$seg)>, Requires<[Not64BitMode]>;
3593 def : InstAlias<"jmpw\t$seg, $off",  (FARJMP16i  i16imm:$off, i16imm:$seg)>, Requires<[Not64BitMode]>;
3594 def : InstAlias<"calll\t$seg, $off", (FARCALL32i i32imm:$off, i16imm:$seg)>, Requires<[Not64BitMode]>;
3595 def : InstAlias<"jmpl\t$seg, $off",  (FARJMP32i  i32imm:$off, i16imm:$seg)>, Requires<[Not64BitMode]>;
3596
3597 // Match 'movq <largeimm>, <reg>' as an alias for movabsq.
3598 def : InstAlias<"mov{q}\t{$imm, $reg|$reg, $imm}", (MOV64ri GR64:$reg, i64imm:$imm), 0>;
3599
3600 // Match 'movd GR64, MMX' as an alias for movq to be compatible with gas,
3601 // which supports this due to an old AMD documentation bug when 64-bit mode was
3602 // created.
3603 def : InstAlias<"movd\t{$src, $dst|$dst, $src}",
3604                 (MMX_MOVD64to64rr VR64:$dst, GR64:$src), 0>;
3605 def : InstAlias<"movd\t{$src, $dst|$dst, $src}",
3606                 (MMX_MOVD64from64rr GR64:$dst, VR64:$src), 0>;
3607
3608 // movsx aliases
3609 def : InstAlias<"movsx\t{$src, $dst|$dst, $src}", (MOVSX16rr8 GR16:$dst, GR8:$src), 0, "att">;
3610 def : InstAlias<"movsx\t{$src, $dst|$dst, $src}", (MOVSX16rm8 GR16:$dst, i8mem:$src), 0, "att">;
3611 def : InstAlias<"movsx\t{$src, $dst|$dst, $src}", (MOVSX32rr8 GR32:$dst, GR8:$src), 0, "att">;
3612 def : InstAlias<"movsx\t{$src, $dst|$dst, $src}", (MOVSX32rr16 GR32:$dst, GR16:$src), 0, "att">;
3613 def : InstAlias<"movsx\t{$src, $dst|$dst, $src}", (MOVSX64rr8 GR64:$dst, GR8:$src), 0, "att">;
3614 def : InstAlias<"movsx\t{$src, $dst|$dst, $src}", (MOVSX64rr16 GR64:$dst, GR16:$src), 0, "att">;
3615 def : InstAlias<"movsx\t{$src, $dst|$dst, $src}", (MOVSX64rr32 GR64:$dst, GR32:$src), 0, "att">;
3616
3617 // movzx aliases
3618 def : InstAlias<"movzx\t{$src, $dst|$dst, $src}", (MOVZX16rr8 GR16:$dst, GR8:$src), 0, "att">;
3619 def : InstAlias<"movzx\t{$src, $dst|$dst, $src}", (MOVZX16rm8 GR16:$dst, i8mem:$src), 0, "att">;
3620 def : InstAlias<"movzx\t{$src, $dst|$dst, $src}", (MOVZX32rr8 GR32:$dst, GR8:$src), 0, "att">;
3621 def : InstAlias<"movzx\t{$src, $dst|$dst, $src}", (MOVZX32rr16 GR32:$dst, GR16:$src), 0, "att">;
3622 def : InstAlias<"movzx\t{$src, $dst|$dst, $src}", (MOVZX64rr8 GR64:$dst, GR8:$src), 0, "att">;
3623 def : InstAlias<"movzx\t{$src, $dst|$dst, $src}", (MOVZX64rr16 GR64:$dst, GR16:$src), 0, "att">;
3624 // Note: No GR32->GR64 movzx form.
3625
3626 // outb %dx -> outb %al, %dx
3627 def : InstAlias<"outb\t{%dx|dx}", (OUT8rr), 0>;
3628 def : InstAlias<"outw\t{%dx|dx}", (OUT16rr), 0>;
3629 def : InstAlias<"outl\t{%dx|dx}", (OUT32rr), 0>;
3630 def : InstAlias<"outb\t$port", (OUT8ir u8imm:$port), 0>;
3631 def : InstAlias<"outw\t$port", (OUT16ir u8imm:$port), 0>;
3632 def : InstAlias<"outl\t$port", (OUT32ir u8imm:$port), 0>;
3633
3634 // 'sldt <mem>' can be encoded with either sldtw or sldtq with the same
3635 // effect (both store to a 16-bit mem).  Force to sldtw to avoid ambiguity
3636 // errors, since its encoding is the most compact.
3637 def : InstAlias<"sldt $mem", (SLDT16m i16mem:$mem), 0>;
3638
3639 // shld/shrd op,op -> shld op, op, CL
3640 def : InstAlias<"shld{w}\t{$r2, $r1|$r1, $r2}", (SHLD16rrCL GR16:$r1, GR16:$r2), 0>;
3641 def : InstAlias<"shld{l}\t{$r2, $r1|$r1, $r2}", (SHLD32rrCL GR32:$r1, GR32:$r2), 0>;
3642 def : InstAlias<"shld{q}\t{$r2, $r1|$r1, $r2}", (SHLD64rrCL GR64:$r1, GR64:$r2), 0>;
3643 def : InstAlias<"shrd{w}\t{$r2, $r1|$r1, $r2}", (SHRD16rrCL GR16:$r1, GR16:$r2), 0>;
3644 def : InstAlias<"shrd{l}\t{$r2, $r1|$r1, $r2}", (SHRD32rrCL GR32:$r1, GR32:$r2), 0>;
3645 def : InstAlias<"shrd{q}\t{$r2, $r1|$r1, $r2}", (SHRD64rrCL GR64:$r1, GR64:$r2), 0>;
3646
3647 def : InstAlias<"shld{w}\t{$reg, $mem|$mem, $reg}", (SHLD16mrCL i16mem:$mem, GR16:$reg), 0>;
3648 def : InstAlias<"shld{l}\t{$reg, $mem|$mem, $reg}", (SHLD32mrCL i32mem:$mem, GR32:$reg), 0>;
3649 def : InstAlias<"shld{q}\t{$reg, $mem|$mem, $reg}", (SHLD64mrCL i64mem:$mem, GR64:$reg), 0>;
3650 def : InstAlias<"shrd{w}\t{$reg, $mem|$mem, $reg}", (SHRD16mrCL i16mem:$mem, GR16:$reg), 0>;
3651 def : InstAlias<"shrd{l}\t{$reg, $mem|$mem, $reg}", (SHRD32mrCL i32mem:$mem, GR32:$reg), 0>;
3652 def : InstAlias<"shrd{q}\t{$reg, $mem|$mem, $reg}", (SHRD64mrCL i64mem:$mem, GR64:$reg), 0>;
3653
3654 /*  FIXME: This is disabled because the asm matcher is currently incapable of
3655  *  matching a fixed immediate like $1.
3656 // "shl X, $1" is an alias for "shl X".
3657 multiclass ShiftRotateByOneAlias<string Mnemonic, string Opc> {
3658  def : InstAlias<!strconcat(Mnemonic, "b $op, $$1"),
3659                  (!cast<Instruction>(!strconcat(Opc, "8r1")) GR8:$op)>;
3660  def : InstAlias<!strconcat(Mnemonic, "w $op, $$1"),
3661                  (!cast<Instruction>(!strconcat(Opc, "16r1")) GR16:$op)>;
3662  def : InstAlias<!strconcat(Mnemonic, "l $op, $$1"),
3663                  (!cast<Instruction>(!strconcat(Opc, "32r1")) GR32:$op)>;
3664  def : InstAlias<!strconcat(Mnemonic, "q $op, $$1"),
3665                  (!cast<Instruction>(!strconcat(Opc, "64r1")) GR64:$op)>;
3666  def : InstAlias<!strconcat(Mnemonic, "b $op, $$1"),
3667                  (!cast<Instruction>(!strconcat(Opc, "8m1")) i8mem:$op)>;
3668  def : InstAlias<!strconcat(Mnemonic, "w $op, $$1"),
3669                  (!cast<Instruction>(!strconcat(Opc, "16m1")) i16mem:$op)>;
3670  def : InstAlias<!strconcat(Mnemonic, "l $op, $$1"),
3671                  (!cast<Instruction>(!strconcat(Opc, "32m1")) i32mem:$op)>;
3672  def : InstAlias<!strconcat(Mnemonic, "q $op, $$1"),
3673                  (!cast<Instruction>(!strconcat(Opc, "64m1")) i64mem:$op)>;
3674 }
3675
3676 defm : ShiftRotateByOneAlias<"rcl", "RCL">;
3677 defm : ShiftRotateByOneAlias<"rcr", "RCR">;
3678 defm : ShiftRotateByOneAlias<"rol", "ROL">;
3679 defm : ShiftRotateByOneAlias<"ror", "ROR">;
3680 FIXME */
3681
3682 // test: We accept "testX <reg>, <mem>" and "testX <mem>, <reg>" as synonyms.
3683 def : InstAlias<"test{b}\t{$mem, $val|$val, $mem}",
3684                 (TEST8mr  i8mem :$mem, GR8 :$val), 0>;
3685 def : InstAlias<"test{w}\t{$mem, $val|$val, $mem}",
3686                 (TEST16mr i16mem:$mem, GR16:$val), 0>;
3687 def : InstAlias<"test{l}\t{$mem, $val|$val, $mem}",
3688                 (TEST32mr i32mem:$mem, GR32:$val), 0>;
3689 def : InstAlias<"test{q}\t{$mem, $val|$val, $mem}",
3690                 (TEST64mr i64mem:$mem, GR64:$val), 0>;
3691
3692 // xchg: We accept "xchgX <reg>, <mem>" and "xchgX <mem>, <reg>" as synonyms.
3693 def : InstAlias<"xchg{b}\t{$mem, $val|$val, $mem}",
3694                 (XCHG8rm  GR8 :$val, i8mem :$mem), 0>;
3695 def : InstAlias<"xchg{w}\t{$mem, $val|$val, $mem}",
3696                 (XCHG16rm GR16:$val, i16mem:$mem), 0>;
3697 def : InstAlias<"xchg{l}\t{$mem, $val|$val, $mem}",
3698                 (XCHG32rm GR32:$val, i32mem:$mem), 0>;
3699 def : InstAlias<"xchg{q}\t{$mem, $val|$val, $mem}",
3700                 (XCHG64rm GR64:$val, i64mem:$mem), 0>;
3701
3702 // xchg: We accept "xchgX <reg>, %eax" and "xchgX %eax, <reg>" as synonyms.
3703 def : InstAlias<"xchg{w}\t{%ax, $src|$src, ax}", (XCHG16ar GR16:$src), 0>;
3704 def : InstAlias<"xchg{l}\t{%eax, $src|$src, eax}", (XCHG32ar GR32:$src), 0>;
3705 def : InstAlias<"xchg{q}\t{%rax, $src|$src, rax}", (XCHG64ar GR64:$src), 0>;
3706
3707 // In 64-bit mode, xchg %eax, %eax can't be encoded with the 0x90 opcode we
3708 // would get by default because it's defined as NOP. But xchg %eax, %eax implies
3709 // implicit zeroing of the upper 32 bits. So alias to the longer encoding.
3710 def : InstAlias<"xchg{l}\t{%eax, %eax|eax, eax}",
3711                 (XCHG32rr EAX, EAX), 0>, Requires<[In64BitMode]>;
3712
3713 // xchg %rax, %rax is a nop in x86-64 and can be encoded as such. Without this
3714 // we emit an unneeded REX.w prefix.
3715 def : InstAlias<"xchg{q}\t{%rax, %rax|rax, rax}", (NOOP), 0>;
3716
3717 // These aliases exist to get the parser to prioritize matching 8-bit
3718 // immediate encodings over matching the implicit ax/eax/rax encodings. By
3719 // explicitly mentioning the A register here, these entries will be ordered
3720 // first due to the more explicit immediate type.
3721 def : InstAlias<"adc{w}\t{$imm, %ax|ax, $imm}", (ADC16ri8 AX, i16i8imm:$imm), 0>;
3722 def : InstAlias<"add{w}\t{$imm, %ax|ax, $imm}", (ADD16ri8 AX, i16i8imm:$imm), 0>;
3723 def : InstAlias<"and{w}\t{$imm, %ax|ax, $imm}", (AND16ri8 AX, i16i8imm:$imm), 0>;
3724 def : InstAlias<"cmp{w}\t{$imm, %ax|ax, $imm}", (CMP16ri8 AX, i16i8imm:$imm), 0>;
3725 def : InstAlias<"or{w}\t{$imm, %ax|ax, $imm}",  (OR16ri8 AX,  i16i8imm:$imm), 0>;
3726 def : InstAlias<"sbb{w}\t{$imm, %ax|ax, $imm}", (SBB16ri8 AX, i16i8imm:$imm), 0>;
3727 def : InstAlias<"sub{w}\t{$imm, %ax|ax, $imm}", (SUB16ri8 AX, i16i8imm:$imm), 0>;
3728 def : InstAlias<"xor{w}\t{$imm, %ax|ax, $imm}", (XOR16ri8 AX, i16i8imm:$imm), 0>;
3729
3730 def : InstAlias<"adc{l}\t{$imm, %eax|eax, $imm}", (ADC32ri8 EAX, i32i8imm:$imm), 0>;
3731 def : InstAlias<"add{l}\t{$imm, %eax|eax, $imm}", (ADD32ri8 EAX, i32i8imm:$imm), 0>;
3732 def : InstAlias<"and{l}\t{$imm, %eax|eax, $imm}", (AND32ri8 EAX, i32i8imm:$imm), 0>;
3733 def : InstAlias<"cmp{l}\t{$imm, %eax|eax, $imm}", (CMP32ri8 EAX, i32i8imm:$imm), 0>;
3734 def : InstAlias<"or{l}\t{$imm, %eax|eax, $imm}",  (OR32ri8 EAX,  i32i8imm:$imm), 0>;
3735 def : InstAlias<"sbb{l}\t{$imm, %eax|eax, $imm}", (SBB32ri8 EAX, i32i8imm:$imm), 0>;
3736 def : InstAlias<"sub{l}\t{$imm, %eax|eax, $imm}", (SUB32ri8 EAX, i32i8imm:$imm), 0>;
3737 def : InstAlias<"xor{l}\t{$imm, %eax|eax, $imm}", (XOR32ri8 EAX, i32i8imm:$imm), 0>;
3738
3739 def : InstAlias<"adc{q}\t{$imm, %rax|rax, $imm}", (ADC64ri8 RAX, i64i8imm:$imm), 0>;
3740 def : InstAlias<"add{q}\t{$imm, %rax|rax, $imm}", (ADD64ri8 RAX, i64i8imm:$imm), 0>;
3741 def : InstAlias<"and{q}\t{$imm, %rax|rax, $imm}", (AND64ri8 RAX, i64i8imm:$imm), 0>;
3742 def : InstAlias<"cmp{q}\t{$imm, %rax|rax, $imm}", (CMP64ri8 RAX, i64i8imm:$imm), 0>;
3743 def : InstAlias<"or{q}\t{$imm, %rax|rax, $imm}",  (OR64ri8 RAX,  i64i8imm:$imm), 0>;
3744 def : InstAlias<"sbb{q}\t{$imm, %rax|rax, $imm}", (SBB64ri8 RAX, i64i8imm:$imm), 0>;
3745 def : InstAlias<"sub{q}\t{$imm, %rax|rax, $imm}", (SUB64ri8 RAX, i64i8imm:$imm), 0>;
3746 def : InstAlias<"xor{q}\t{$imm, %rax|rax, $imm}", (XOR64ri8 RAX, i64i8imm:$imm), 0>;