//===-- HexagonIntrinsics.td - Instruction intrinsics ------*- tablegen -*-===// // // The LLVM Compiler Infrastructure // // This file is distributed under the University of Illinois Open Source // License. See LICENSE.TXT for details. // //===----------------------------------------------------------------------===// // This is populated based on the following specs: // Hexagon V2 Architecture // Application-Level Specification // 80-V9418-8 Rev. B // March 4, 2008 //===----------------------------------------------------------------------===// class T_I_pat : Pat <(IntID imm:$Is), (MI imm:$Is)>; class T_R_pat : Pat <(IntID I32:$Rs), (MI I32:$Rs)>; class T_P_pat : Pat <(IntID I64:$Rs), (MI DoubleRegs:$Rs)>; class T_II_pat : Pat<(IntID Imm1:$Is, Imm2:$It), (MI Imm1:$Is, Imm2:$It)>; class T_RI_pat > : Pat<(IntID I32:$Rs, ImmPred:$It), (MI I32:$Rs, ImmPred:$It)>; class T_IR_pat > : Pat<(IntID ImmPred:$Is, I32:$Rt), (MI ImmPred:$Is, I32:$Rt)>; class T_PI_pat : Pat<(IntID I64:$Rs, imm:$It), (MI DoubleRegs:$Rs, imm:$It)>; class T_RP_pat : Pat<(IntID I32:$Rs, I64:$Rt), (MI I32:$Rs, DoubleRegs:$Rt)>; class T_RR_pat : Pat <(IntID I32:$Rs, I32:$Rt), (MI I32:$Rs, I32:$Rt)>; class T_PP_pat : Pat <(IntID I64:$Rs, I64:$Rt), (MI DoubleRegs:$Rs, DoubleRegs:$Rt)>; class T_QII_pat : Pat <(IntID (i32 PredRegs:$Ps), Imm1:$Is, Imm2:$It), (MI PredRegs:$Ps, Imm1:$Is, Imm2:$It)>; class T_QRI_pat : Pat <(IntID (i32 PredRegs:$Ps), I32:$Rs, ImmPred:$Is), (MI PredRegs:$Ps, I32:$Rs, ImmPred:$Is)>; class T_QIR_pat : Pat <(IntID (i32 PredRegs:$Ps), ImmPred:$Is, I32:$Rs), (MI PredRegs:$Ps, ImmPred:$Is, I32:$Rs)>; class T_RRI_pat : Pat <(IntID I32:$Rs, I32:$Rt, imm:$Iu), (MI I32:$Rs, I32:$Rt, imm:$Iu)>; class T_RII_pat : Pat <(IntID I32:$Rs, imm:$It, imm:$Iu), (MI I32:$Rs, imm:$It, imm:$Iu)>; class T_IRI_pat : Pat <(IntID imm:$It, I32:$Rs, imm:$Iu), (MI imm:$It, I32:$Rs, imm:$Iu)>; class T_IRR_pat : Pat <(IntID imm:$Is, I32:$Rs, I32:$Rt), (MI imm:$Is, I32:$Rs, I32:$Rt)>; class T_RIR_pat : Pat <(IntID I32:$Rs, imm:$Is, I32:$Rt), (MI I32:$Rs, imm:$Is, I32:$Rt)>; class T_RRR_pat : Pat <(IntID I32:$Rs, I32:$Rt, I32:$Ru), (MI I32:$Rs, I32:$Rt, I32:$Ru)>; class T_PPI_pat : Pat <(IntID I64:$Rs, I64:$Rt, imm:$Iu), (MI DoubleRegs:$Rs, DoubleRegs:$Rt, imm:$Iu)>; class T_PII_pat : Pat <(IntID I64:$Rs, imm:$It, imm:$Iu), (MI DoubleRegs:$Rs, imm:$It, imm:$Iu)>; class T_PPP_pat : Pat <(IntID I64:$Rs, I64:$Rt, I64:$Ru), (MI DoubleRegs:$Rs, DoubleRegs:$Rt, DoubleRegs:$Ru)>; class T_PPR_pat : Pat <(IntID I64:$Rs, I64:$Rt, I32:$Ru), (MI DoubleRegs:$Rs, DoubleRegs:$Rt, I32:$Ru)>; class T_PRR_pat : Pat <(IntID I64:$Rs, I32:$Rt, I32:$Ru), (MI DoubleRegs:$Rs, I32:$Rt, I32:$Ru)>; class T_PPQ_pat : Pat <(IntID I64:$Rs, I64:$Rt, (i32 PredRegs:$Ru)), (MI DoubleRegs:$Rs, DoubleRegs:$Rt, PredRegs:$Ru)>; class T_PR_pat : Pat <(IntID I64:$Rs, I32:$Rt), (MI DoubleRegs:$Rs, I32:$Rt)>; class T_D_pat : Pat<(IntID (F64:$Rs)), (MI (F64:$Rs))>; class T_DI_pat > : Pat<(IntID F64:$Rs, ImmPred:$It), (MI F64:$Rs, ImmPred:$It)>; class T_F_pat : Pat<(IntID F32:$Rs), (MI F32:$Rs)>; class T_FI_pat > : Pat<(IntID F32:$Rs, ImmPred:$It), (MI F32:$Rs, ImmPred:$It)>; class T_FF_pat : Pat<(IntID F32:$Rs, F32:$Rt), (MI F32:$Rs, F32:$Rt)>; class T_DD_pat : Pat<(IntID F64:$Rs, F64:$Rt), (MI F64:$Rs, F64:$Rt)>; class T_FFF_pat : Pat<(IntID F32:$Rs, F32:$Rt, F32:$Ru), (MI F32:$Rs, F32:$Rt, F32:$Ru)>; class T_FFFQ_pat : Pat <(IntID F32:$Rs, F32:$Rt, F32:$Ru, (i32 PredRegs:$Rx)), (MI F32:$Rs, F32:$Rt, F32:$Ru, PredRegs:$Rx)>; //===----------------------------------------------------------------------===// // MPYS / Multipy signed/unsigned halfwords //Rd=mpy[u](Rs.[H|L],Rt.[H|L])[:<<1][:rnd][:sat] //===----------------------------------------------------------------------===// def : T_RR_pat ; def : T_RR_pat ; def : T_RR_pat ; def : T_RR_pat ; def : T_RR_pat ; def : T_RR_pat ; def : T_RR_pat ; def : T_RR_pat ; def : T_RR_pat ; def : T_RR_pat ; def : T_RR_pat ; def : T_RR_pat ; def : T_RR_pat ; def : T_RR_pat ; def : T_RR_pat ; def : T_RR_pat ; def : T_RR_pat ; def : T_RR_pat ; def : T_RR_pat ; def : T_RR_pat ; def : T_RR_pat ; def : T_RR_pat ; def : T_RR_pat ; def : T_RR_pat ; def : T_RR_pat ; def : T_RR_pat ; def : T_RR_pat ; def : T_RR_pat ; def : T_RR_pat ; def : T_RR_pat ; def : T_RR_pat ; def : T_RR_pat ; def : T_RR_pat ; def : T_RR_pat ; def : T_RR_pat ; def : T_RR_pat ; def : T_RR_pat ; def : T_RR_pat ; def : T_RR_pat ; def : T_RR_pat ; //===----------------------------------------------------------------------===// // MPYS / Multipy signed/unsigned halfwords and add/subtract the // result from the accumulator. //Rx [-+]= mpy[u](Rs.[H|L],Rt.[H|L])[:<<1][:sat] //===----------------------------------------------------------------------===// def : T_RRR_pat ; def : T_RRR_pat ; def : T_RRR_pat ; def : T_RRR_pat ; def : T_RRR_pat ; def : T_RRR_pat ; def : T_RRR_pat ; def : T_RRR_pat ; def : T_RRR_pat ; def : T_RRR_pat ; def : T_RRR_pat ; def : T_RRR_pat ; def : T_RRR_pat ; def : T_RRR_pat ; def : T_RRR_pat ; def : T_RRR_pat ; def : T_RRR_pat ; def : T_RRR_pat ; def : T_RRR_pat ; def : T_RRR_pat ; def : T_RRR_pat ; def : T_RRR_pat ; def : T_RRR_pat ; def : T_RRR_pat ; def : T_RRR_pat ; def : T_RRR_pat ; def : T_RRR_pat ; def : T_RRR_pat ; def : T_RRR_pat ; def : T_RRR_pat ; def : T_RRR_pat ; def : T_RRR_pat ; def : T_RRR_pat ; def : T_RRR_pat ; def : T_RRR_pat ; def : T_RRR_pat ; def : T_RRR_pat ; def : T_RRR_pat ; def : T_RRR_pat ; def : T_RRR_pat ; def : T_RRR_pat ; def : T_RRR_pat ; def : T_RRR_pat ; def : T_RRR_pat ; def : T_RRR_pat ; def : T_RRR_pat ; def : T_RRR_pat ; def : T_RRR_pat ; //===----------------------------------------------------------------------===// // Multiply signed/unsigned halfwords with and without saturation and rounding // into a 64-bits destination register. //===----------------------------------------------------------------------===// def : T_RR_pat ; def : T_RR_pat ; def : T_RR_pat ; def : T_RR_pat ; def : T_RR_pat ; def : T_RR_pat ; def : T_RR_pat ; def : T_RR_pat ; def : T_RR_pat ; def : T_RR_pat ; def : T_RR_pat ; def : T_RR_pat ; def : T_RR_pat ; def : T_RR_pat ; def : T_RR_pat ; def : T_RR_pat ; def : T_RR_pat ; def : T_RR_pat ; def : T_RR_pat ; def : T_RR_pat ; def : T_RR_pat ; def : T_RR_pat ; def : T_RR_pat ; def : T_RR_pat ; //===----------------------------------------------------------------------===// // MPYS / Multipy signed/unsigned halfwords and add/subtract the // result from the 64-bit destination register. //Rxx [-+]= mpy[u](Rs.[H|L],Rt.[H|L])[:<<1][:sat] //===----------------------------------------------------------------------===// def : T_PRR_pat ; def : T_PRR_pat ; def : T_PRR_pat ; def : T_PRR_pat ; def : T_PRR_pat ; def : T_PRR_pat ; def : T_PRR_pat ; def : T_PRR_pat ; def : T_PRR_pat ; def : T_PRR_pat ; def : T_PRR_pat ; def : T_PRR_pat ; def : T_PRR_pat ; def : T_PRR_pat ; def : T_PRR_pat ; def : T_PRR_pat ; def : T_PRR_pat ; def : T_PRR_pat ; def : T_PRR_pat ; def : T_PRR_pat ; def : T_PRR_pat ; def : T_PRR_pat ; def : T_PRR_pat ; def : T_PRR_pat ; def : T_PRR_pat ; def : T_PRR_pat ; def : T_PRR_pat ; def : T_PRR_pat ; def : T_PRR_pat ; def : T_PRR_pat ; def : T_PRR_pat ; def : T_PRR_pat ; // Vector complex multiply imaginary: Rdd=vcmpyi(Rss,Rtt)[:<<1]:sat def : T_PP_pat ; def : T_PP_pat ; // Vector complex multiply real: Rdd=vcmpyr(Rss,Rtt)[:<<1]:sat def : T_PP_pat ; def : T_PP_pat ; // Vector dual multiply: Rdd=vdmpy(Rss,Rtt)[:<<1]:sat def : T_PP_pat ; def : T_PP_pat ; // Vector multiply even halfwords: Rdd=vmpyeh(Rss,Rtt)[:<<1]:sat def : T_PP_pat ; def : T_PP_pat ; //Rdd=vmpywoh(Rss,Rtt)[:<<1][:rnd]:sat def : T_PP_pat ; def : T_PP_pat ; def : T_PP_pat ; def : T_PP_pat ; //Rdd=vmpyweh(Rss,Rtt)[:<<1][:rnd]:sat def : T_PP_pat ; def : T_PP_pat ; def : T_PP_pat ; def : T_PP_pat ; //Rdd=vmpywouh(Rss,Rtt)[:<<1][:rnd]:sat def : T_PP_pat ; def : T_PP_pat ; def : T_PP_pat ; def : T_PP_pat ; //Rdd=vmpyweuh(Rss,Rtt)[:<<1][:rnd]:sat def : T_PP_pat ; def : T_PP_pat ; def : T_PP_pat ; def : T_PP_pat ; // Vector reduce add unsigned bytes: Rdd32[+]=vrmpybu(Rss32,Rtt32) def : T_PP_pat ; def : T_PPP_pat ; // Vector sum of absolute differences unsigned bytes: Rdd=vrsadub(Rss,Rtt) def : T_PP_pat ; def : T_PPP_pat ; // Vector absolute difference: Rdd=vabsdiffh(Rtt,Rss) def : T_PP_pat ; // Vector absolute difference words: Rdd=vabsdiffw(Rtt,Rss) def : T_PP_pat ; // Vector reduce complex multiply real or imaginary: // Rdd[+]=vrcmpy[ir](Rss,Rtt[*]) def : T_PP_pat ; def : T_PP_pat ; def : T_PPP_pat ; def : T_PPP_pat ; def : T_PP_pat ; def : T_PP_pat ; def : T_PPP_pat ; def : T_PPP_pat ; // Vector reduce halfwords // Rdd[+]=vrmpyh(Rss,Rtt) def : T_PP_pat ; def : T_PPP_pat ; //===----------------------------------------------------------------------===// // Vector Multipy with accumulation //===----------------------------------------------------------------------===// // Vector multiply word by signed half with accumulation // Rxx+=vmpyw[eo]h(Rss,Rtt)[:<<1][:rnd]:sat def : T_PPP_pat ; def : T_PPP_pat ; def : T_PPP_pat ; def : T_PPP_pat ; def : T_PPP_pat ; def : T_PPP_pat ; def : T_PPP_pat ; def : T_PPP_pat ; // Vector multiply word by unsigned half with accumulation // Rxx+=vmpyw[eo]uh(Rss,Rtt)[:<<1][:rnd]:sat def : T_PPP_pat ; def : T_PPP_pat ; def : T_PPP_pat ; def : T_PPP_pat ; def : T_PPP_pat ; def : T_PPP_pat ; def : T_PPP_pat ; def : T_PPP_pat ; // Vector multiply even halfwords with accumulation // Rxx+=vmpyeh(Rss,Rtt)[:<<1][:sat] def : T_PPP_pat ; def : T_PPP_pat ; def : T_PPP_pat ; // Vector dual multiply with accumulation // Rxx+=vdmpy(Rss,Rtt)[:sat] def : T_PPP_pat ; def : T_PPP_pat ; // Vector complex multiply real or imaginary with accumulation // Rxx+=vcmpy[ir](Rss,Rtt):sat def : T_PPP_pat ; def : T_PPP_pat ; //===----------------------------------------------------------------------===// // Add/Subtract halfword // Rd=add(Rt.L,Rs.[HL])[:sat] // Rd=sub(Rt.L,Rs.[HL])[:sat] // Rd=add(Rt.[LH],Rs.[HL])[:sat][:<16] // Rd=sub(Rt.[LH],Rs.[HL])[:sat][:<16] //===----------------------------------------------------------------------===// //Rd=add(Rt.L,Rs.[LH]) def : T_RR_pat ; def : T_RR_pat ; //Rd=add(Rt.L,Rs.[LH]):sat def : T_RR_pat ; def : T_RR_pat ; //Rd=sub(Rt.L,Rs.[LH]) def : T_RR_pat ; def : T_RR_pat ; //Rd=sub(Rt.L,Rs.[LH]):sat def : T_RR_pat ; def : T_RR_pat ; //Rd=add(Rt.[LH],Rs.[LH]):<<16 def : T_RR_pat ; def : T_RR_pat ; def : T_RR_pat ; def : T_RR_pat ; //Rd=sub(Rt.[LH],Rs.[LH]):<<16 def : T_RR_pat ; def : T_RR_pat ; def : T_RR_pat ; def : T_RR_pat ; //Rd=add(Rt.[LH],Rs.[LH]):sat:<<16 def : T_RR_pat ; def : T_RR_pat ; def : T_RR_pat ; def : T_RR_pat ; //Rd=sub(Rt.[LH],Rs.[LH]):sat:<<16 def : T_RR_pat ; def : T_RR_pat ; def : T_RR_pat ; def : T_RR_pat ; // ALU64 / ALU / min max def : T_RR_pat; def : T_RR_pat; def : T_RR_pat; def : T_RR_pat; // Shift and accumulate def : T_RRI_pat ; def : T_RRI_pat ; def : T_RRI_pat ; def : T_RRI_pat ; def : T_RRI_pat ; def : T_RRI_pat ; def : T_RRI_pat ; def : T_RRI_pat ; def : T_RRI_pat ; def : T_RRI_pat ; def : T_RRI_pat ; def : T_RRI_pat ; def : T_RRI_pat ; def : T_RRI_pat ; def : T_PPI_pat ; def : T_PPI_pat ; def : T_PPI_pat ; def : T_PPI_pat ; def : T_PPI_pat ; def : T_PPI_pat ; def : T_PPI_pat ; def : T_PPI_pat ; def : T_PPI_pat ; def : T_PPI_pat ; def : T_PPI_pat ; def : T_PPI_pat ; def : T_PPI_pat ; def : T_PPI_pat ; def : T_RRR_pat ; def : T_RRR_pat ; def : T_RRR_pat ; def : T_RRR_pat ; def : T_RRR_pat ; def : T_RRR_pat ; def : T_RRR_pat ; def : T_RRR_pat ; def : T_RRR_pat ; def : T_RRR_pat ; def : T_RRR_pat ; def : T_RRR_pat ; def : T_RRR_pat ; def : T_RRR_pat ; def : T_RRR_pat ; def : T_RRR_pat ; def : T_PPR_pat ; def : T_PPR_pat ; def : T_PPR_pat ; def : T_PPR_pat ; def : T_PPR_pat ; def : T_PPR_pat ; def : T_PPR_pat ; def : T_PPR_pat ; def : T_PPR_pat ; def : T_PPR_pat ; def : T_PPR_pat ; def : T_PPR_pat ; def : T_PPR_pat ; def : T_PPR_pat ; def : T_PPR_pat ; def : T_PPR_pat ; def : T_RRI_pat ; def : T_RRI_pat ; def : T_RRI_pat ; def : T_RRI_pat ; def : T_RRI_pat ; def : T_RRI_pat ; def : T_RRI_pat ; def : T_RRI_pat ; def : T_RRI_pat ; def : T_RRI_pat ; def : T_RRI_pat ; def : T_RRI_pat ; def : T_RRI_pat ; def : T_RRI_pat ; def : T_PPI_pat ; def : T_PPI_pat ; def : T_PPI_pat ; def : T_PPI_pat ; def : T_PPI_pat ; def : T_PPI_pat ; def : T_PPI_pat ; def : T_PPI_pat ; def : T_PPI_pat ; def : T_PPI_pat ; def : T_PPI_pat ; def : T_PPI_pat ; def : T_PPI_pat ; def : T_PPI_pat ; def : T_RRR_pat ; def : T_RRR_pat ; def : T_RRR_pat ; def : T_RRR_pat ; def : T_RRR_pat ; def : T_RRR_pat ; def : T_RRR_pat ; def : T_RRR_pat ; def : T_RRR_pat ; def : T_RRR_pat ; def : T_RRR_pat ; def : T_RRR_pat ; def : T_RRR_pat ; def : T_RRR_pat ; def : T_RRR_pat ; def : T_RRR_pat ; def : T_PPR_pat ; def : T_PPR_pat ; def : T_PPR_pat ; def : T_PPR_pat ; def : T_PPR_pat ; def : T_PPR_pat ; def : T_PPR_pat ; def : T_PPR_pat ; def : T_PPR_pat ; def : T_PPR_pat ; def : T_PPR_pat ; def : T_PPR_pat ; def : T_PPR_pat ; def : T_PPR_pat ; def : T_PPR_pat ; def : T_PPR_pat ; /******************************************************************** * ALU32/ALU * *********************************************************************/ def : T_RR_pat; def : T_RI_pat; def : T_RR_pat; def : T_IR_pat; def : T_RR_pat; def : T_RI_pat; def : T_RR_pat; def : T_RI_pat; def : T_RR_pat; def : T_RR_pat; // Assembler mapped from Rd32=not(Rs32) to Rd32=sub(#-1,Rs32) def : Pat <(int_hexagon_A2_not (I32:$Rs)), (A2_subri -1, IntRegs:$Rs)>; // Assembler mapped from Rd32=neg(Rs32) to Rd32=sub(#0,Rs32) def : Pat <(int_hexagon_A2_neg IntRegs:$Rs), (A2_subri 0, IntRegs:$Rs)>; // Transfer immediate def : Pat <(int_hexagon_A2_tfril (I32:$Rs), u16_0ImmPred:$Is), (A2_tfril IntRegs:$Rs, u16_0ImmPred:$Is)>; def : Pat <(int_hexagon_A2_tfrih (I32:$Rs), u16_0ImmPred:$Is), (A2_tfrih IntRegs:$Rs, u16_0ImmPred:$Is)>; // Transfer Register/immediate. def : T_R_pat ; def : T_I_pat