]> CyberLeo.Net >> Repos - FreeBSD/FreeBSD.git/blob - contrib/llvm/include/llvm/Analysis/ScalarEvolution.h
Merge llvm, clang, lld, lldb, compiler-rt and libc++ r302069, and update
[FreeBSD/FreeBSD.git] / contrib / llvm / include / llvm / Analysis / ScalarEvolution.h
1 //===- llvm/Analysis/ScalarEvolution.h - Scalar Evolution -------*- C++ -*-===//
2 //
3 //                     The LLVM Compiler Infrastructure
4 //
5 // This file is distributed under the University of Illinois Open Source
6 // License. See LICENSE.TXT for details.
7 //
8 //===----------------------------------------------------------------------===//
9 //
10 // The ScalarEvolution class is an LLVM pass which can be used to analyze and
11 // categorize scalar expressions in loops.  It specializes in recognizing
12 // general induction variables, representing them with the abstract and opaque
13 // SCEV class.  Given this analysis, trip counts of loops and other important
14 // properties can be obtained.
15 //
16 // This analysis is primarily useful for induction variable substitution and
17 // strength reduction.
18 //
19 //===----------------------------------------------------------------------===//
20
21 #ifndef LLVM_ANALYSIS_SCALAREVOLUTION_H
22 #define LLVM_ANALYSIS_SCALAREVOLUTION_H
23
24 #include "llvm/ADT/DenseSet.h"
25 #include "llvm/ADT/FoldingSet.h"
26 #include "llvm/ADT/SetVector.h"
27 #include "llvm/Analysis/LoopInfo.h"
28 #include "llvm/IR/ConstantRange.h"
29 #include "llvm/IR/Instructions.h"
30 #include "llvm/IR/Operator.h"
31 #include "llvm/IR/PassManager.h"
32 #include "llvm/IR/ValueHandle.h"
33 #include "llvm/IR/ValueMap.h"
34 #include "llvm/Pass.h"
35 #include "llvm/Support/Allocator.h"
36 #include "llvm/Support/DataTypes.h"
37
38 namespace llvm {
39 class APInt;
40 class AssumptionCache;
41 class Constant;
42 class ConstantInt;
43 class DominatorTree;
44 class Type;
45 class ScalarEvolution;
46 class DataLayout;
47 class TargetLibraryInfo;
48 class LLVMContext;
49 class Operator;
50 class SCEV;
51 class SCEVAddRecExpr;
52 class SCEVConstant;
53 class SCEVExpander;
54 class SCEVPredicate;
55 class SCEVUnknown;
56 class Function;
57
58 template <> struct FoldingSetTrait<SCEV>;
59 template <> struct FoldingSetTrait<SCEVPredicate>;
60
61 /// This class represents an analyzed expression in the program.  These are
62 /// opaque objects that the client is not allowed to do much with directly.
63 ///
64 class SCEV : public FoldingSetNode {
65   friend struct FoldingSetTrait<SCEV>;
66
67   /// A reference to an Interned FoldingSetNodeID for this node.  The
68   /// ScalarEvolution's BumpPtrAllocator holds the data.
69   FoldingSetNodeIDRef FastID;
70
71   // The SCEV baseclass this node corresponds to
72   const unsigned short SCEVType;
73
74 protected:
75   /// This field is initialized to zero and may be used in subclasses to store
76   /// miscellaneous information.
77   unsigned short SubclassData;
78
79 private:
80   SCEV(const SCEV &) = delete;
81   void operator=(const SCEV &) = delete;
82
83 public:
84   /// NoWrapFlags are bitfield indices into SubclassData.
85   ///
86   /// Add and Mul expressions may have no-unsigned-wrap <NUW> or
87   /// no-signed-wrap <NSW> properties, which are derived from the IR
88   /// operator. NSW is a misnomer that we use to mean no signed overflow or
89   /// underflow.
90   ///
91   /// AddRec expressions may have a no-self-wraparound <NW> property if, in
92   /// the integer domain, abs(step) * max-iteration(loop) <=
93   /// unsigned-max(bitwidth).  This means that the recurrence will never reach
94   /// its start value if the step is non-zero.  Computing the same value on
95   /// each iteration is not considered wrapping, and recurrences with step = 0
96   /// are trivially <NW>.  <NW> is independent of the sign of step and the
97   /// value the add recurrence starts with.
98   ///
99   /// Note that NUW and NSW are also valid properties of a recurrence, and
100   /// either implies NW. For convenience, NW will be set for a recurrence
101   /// whenever either NUW or NSW are set.
102   enum NoWrapFlags {
103     FlagAnyWrap = 0,    // No guarantee.
104     FlagNW = (1 << 0),  // No self-wrap.
105     FlagNUW = (1 << 1), // No unsigned wrap.
106     FlagNSW = (1 << 2), // No signed wrap.
107     NoWrapMask = (1 << 3) - 1
108   };
109
110   explicit SCEV(const FoldingSetNodeIDRef ID, unsigned SCEVTy)
111       : FastID(ID), SCEVType(SCEVTy), SubclassData(0) {}
112
113   unsigned getSCEVType() const { return SCEVType; }
114
115   /// Return the LLVM type of this SCEV expression.
116   ///
117   Type *getType() const;
118
119   /// Return true if the expression is a constant zero.
120   ///
121   bool isZero() const;
122
123   /// Return true if the expression is a constant one.
124   ///
125   bool isOne() const;
126
127   /// Return true if the expression is a constant all-ones value.
128   ///
129   bool isAllOnesValue() const;
130
131   /// Return true if the specified scev is negated, but not a constant.
132   bool isNonConstantNegative() const;
133
134   /// Print out the internal representation of this scalar to the specified
135   /// stream.  This should really only be used for debugging purposes.
136   void print(raw_ostream &OS) const;
137
138   /// This method is used for debugging.
139   ///
140   void dump() const;
141 };
142
143 // Specialize FoldingSetTrait for SCEV to avoid needing to compute
144 // temporary FoldingSetNodeID values.
145 template <> struct FoldingSetTrait<SCEV> : DefaultFoldingSetTrait<SCEV> {
146   static void Profile(const SCEV &X, FoldingSetNodeID &ID) { ID = X.FastID; }
147   static bool Equals(const SCEV &X, const FoldingSetNodeID &ID, unsigned IDHash,
148                      FoldingSetNodeID &TempID) {
149     return ID == X.FastID;
150   }
151   static unsigned ComputeHash(const SCEV &X, FoldingSetNodeID &TempID) {
152     return X.FastID.ComputeHash();
153   }
154 };
155
156 inline raw_ostream &operator<<(raw_ostream &OS, const SCEV &S) {
157   S.print(OS);
158   return OS;
159 }
160
161 /// An object of this class is returned by queries that could not be answered.
162 /// For example, if you ask for the number of iterations of a linked-list
163 /// traversal loop, you will get one of these.  None of the standard SCEV
164 /// operations are valid on this class, it is just a marker.
165 struct SCEVCouldNotCompute : public SCEV {
166   SCEVCouldNotCompute();
167
168   /// Methods for support type inquiry through isa, cast, and dyn_cast:
169   static bool classof(const SCEV *S);
170 };
171
172 /// This class represents an assumption made using SCEV expressions which can
173 /// be checked at run-time.
174 class SCEVPredicate : public FoldingSetNode {
175   friend struct FoldingSetTrait<SCEVPredicate>;
176
177   /// A reference to an Interned FoldingSetNodeID for this node.  The
178   /// ScalarEvolution's BumpPtrAllocator holds the data.
179   FoldingSetNodeIDRef FastID;
180
181 public:
182   enum SCEVPredicateKind { P_Union, P_Equal, P_Wrap };
183
184 protected:
185   SCEVPredicateKind Kind;
186   ~SCEVPredicate() = default;
187   SCEVPredicate(const SCEVPredicate &) = default;
188   SCEVPredicate &operator=(const SCEVPredicate &) = default;
189
190 public:
191   SCEVPredicate(const FoldingSetNodeIDRef ID, SCEVPredicateKind Kind);
192
193   SCEVPredicateKind getKind() const { return Kind; }
194
195   /// Returns the estimated complexity of this predicate.  This is roughly
196   /// measured in the number of run-time checks required.
197   virtual unsigned getComplexity() const { return 1; }
198
199   /// Returns true if the predicate is always true. This means that no
200   /// assumptions were made and nothing needs to be checked at run-time.
201   virtual bool isAlwaysTrue() const = 0;
202
203   /// Returns true if this predicate implies \p N.
204   virtual bool implies(const SCEVPredicate *N) const = 0;
205
206   /// Prints a textual representation of this predicate with an indentation of
207   /// \p Depth.
208   virtual void print(raw_ostream &OS, unsigned Depth = 0) const = 0;
209
210   /// Returns the SCEV to which this predicate applies, or nullptr if this is
211   /// a SCEVUnionPredicate.
212   virtual const SCEV *getExpr() const = 0;
213 };
214
215 inline raw_ostream &operator<<(raw_ostream &OS, const SCEVPredicate &P) {
216   P.print(OS);
217   return OS;
218 }
219
220 // Specialize FoldingSetTrait for SCEVPredicate to avoid needing to compute
221 // temporary FoldingSetNodeID values.
222 template <>
223 struct FoldingSetTrait<SCEVPredicate> : DefaultFoldingSetTrait<SCEVPredicate> {
224
225   static void Profile(const SCEVPredicate &X, FoldingSetNodeID &ID) {
226     ID = X.FastID;
227   }
228
229   static bool Equals(const SCEVPredicate &X, const FoldingSetNodeID &ID,
230                      unsigned IDHash, FoldingSetNodeID &TempID) {
231     return ID == X.FastID;
232   }
233   static unsigned ComputeHash(const SCEVPredicate &X,
234                               FoldingSetNodeID &TempID) {
235     return X.FastID.ComputeHash();
236   }
237 };
238
239 /// This class represents an assumption that two SCEV expressions are equal,
240 /// and this can be checked at run-time. We assume that the left hand side is
241 /// a SCEVUnknown and the right hand side a constant.
242 class SCEVEqualPredicate final : public SCEVPredicate {
243   /// We assume that LHS == RHS, where LHS is a SCEVUnknown and RHS a
244   /// constant.
245   const SCEVUnknown *LHS;
246   const SCEVConstant *RHS;
247
248 public:
249   SCEVEqualPredicate(const FoldingSetNodeIDRef ID, const SCEVUnknown *LHS,
250                      const SCEVConstant *RHS);
251
252   /// Implementation of the SCEVPredicate interface
253   bool implies(const SCEVPredicate *N) const override;
254   void print(raw_ostream &OS, unsigned Depth = 0) const override;
255   bool isAlwaysTrue() const override;
256   const SCEV *getExpr() const override;
257
258   /// Returns the left hand side of the equality.
259   const SCEVUnknown *getLHS() const { return LHS; }
260
261   /// Returns the right hand side of the equality.
262   const SCEVConstant *getRHS() const { return RHS; }
263
264   /// Methods for support type inquiry through isa, cast, and dyn_cast:
265   static inline bool classof(const SCEVPredicate *P) {
266     return P->getKind() == P_Equal;
267   }
268 };
269
270 /// This class represents an assumption made on an AddRec expression. Given an
271 /// affine AddRec expression {a,+,b}, we assume that it has the nssw or nusw
272 /// flags (defined below) in the first X iterations of the loop, where X is a
273 /// SCEV expression returned by getPredicatedBackedgeTakenCount).
274 ///
275 /// Note that this does not imply that X is equal to the backedge taken
276 /// count. This means that if we have a nusw predicate for i32 {0,+,1} with a
277 /// predicated backedge taken count of X, we only guarantee that {0,+,1} has
278 /// nusw in the first X iterations. {0,+,1} may still wrap in the loop if we
279 /// have more than X iterations.
280 class SCEVWrapPredicate final : public SCEVPredicate {
281 public:
282   /// Similar to SCEV::NoWrapFlags, but with slightly different semantics
283   /// for FlagNUSW. The increment is considered to be signed, and a + b
284   /// (where b is the increment) is considered to wrap if:
285   ///    zext(a + b) != zext(a) + sext(b)
286   ///
287   /// If Signed is a function that takes an n-bit tuple and maps to the
288   /// integer domain as the tuples value interpreted as twos complement,
289   /// and Unsigned a function that takes an n-bit tuple and maps to the
290   /// integer domain as as the base two value of input tuple, then a + b
291   /// has IncrementNUSW iff:
292   ///
293   /// 0 <= Unsigned(a) + Signed(b) < 2^n
294   ///
295   /// The IncrementNSSW flag has identical semantics with SCEV::FlagNSW.
296   ///
297   /// Note that the IncrementNUSW flag is not commutative: if base + inc
298   /// has IncrementNUSW, then inc + base doesn't neccessarily have this
299   /// property. The reason for this is that this is used for sign/zero
300   /// extending affine AddRec SCEV expressions when a SCEVWrapPredicate is
301   /// assumed. A {base,+,inc} expression is already non-commutative with
302   /// regards to base and inc, since it is interpreted as:
303   ///     (((base + inc) + inc) + inc) ...
304   enum IncrementWrapFlags {
305     IncrementAnyWrap = 0,     // No guarantee.
306     IncrementNUSW = (1 << 0), // No unsigned with signed increment wrap.
307     IncrementNSSW = (1 << 1), // No signed with signed increment wrap
308                               // (equivalent with SCEV::NSW)
309     IncrementNoWrapMask = (1 << 2) - 1
310   };
311
312   /// Convenient IncrementWrapFlags manipulation methods.
313   LLVM_NODISCARD static SCEVWrapPredicate::IncrementWrapFlags
314   clearFlags(SCEVWrapPredicate::IncrementWrapFlags Flags,
315              SCEVWrapPredicate::IncrementWrapFlags OffFlags) {
316     assert((Flags & IncrementNoWrapMask) == Flags && "Invalid flags value!");
317     assert((OffFlags & IncrementNoWrapMask) == OffFlags &&
318            "Invalid flags value!");
319     return (SCEVWrapPredicate::IncrementWrapFlags)(Flags & ~OffFlags);
320   }
321
322   LLVM_NODISCARD static SCEVWrapPredicate::IncrementWrapFlags
323   maskFlags(SCEVWrapPredicate::IncrementWrapFlags Flags, int Mask) {
324     assert((Flags & IncrementNoWrapMask) == Flags && "Invalid flags value!");
325     assert((Mask & IncrementNoWrapMask) == Mask && "Invalid mask value!");
326
327     return (SCEVWrapPredicate::IncrementWrapFlags)(Flags & Mask);
328   }
329
330   LLVM_NODISCARD static SCEVWrapPredicate::IncrementWrapFlags
331   setFlags(SCEVWrapPredicate::IncrementWrapFlags Flags,
332            SCEVWrapPredicate::IncrementWrapFlags OnFlags) {
333     assert((Flags & IncrementNoWrapMask) == Flags && "Invalid flags value!");
334     assert((OnFlags & IncrementNoWrapMask) == OnFlags &&
335            "Invalid flags value!");
336
337     return (SCEVWrapPredicate::IncrementWrapFlags)(Flags | OnFlags);
338   }
339
340   /// Returns the set of SCEVWrapPredicate no wrap flags implied by a
341   /// SCEVAddRecExpr.
342   LLVM_NODISCARD static SCEVWrapPredicate::IncrementWrapFlags
343   getImpliedFlags(const SCEVAddRecExpr *AR, ScalarEvolution &SE);
344
345 private:
346   const SCEVAddRecExpr *AR;
347   IncrementWrapFlags Flags;
348
349 public:
350   explicit SCEVWrapPredicate(const FoldingSetNodeIDRef ID,
351                              const SCEVAddRecExpr *AR,
352                              IncrementWrapFlags Flags);
353
354   /// Returns the set assumed no overflow flags.
355   IncrementWrapFlags getFlags() const { return Flags; }
356   /// Implementation of the SCEVPredicate interface
357   const SCEV *getExpr() const override;
358   bool implies(const SCEVPredicate *N) const override;
359   void print(raw_ostream &OS, unsigned Depth = 0) const override;
360   bool isAlwaysTrue() const override;
361
362   /// Methods for support type inquiry through isa, cast, and dyn_cast:
363   static inline bool classof(const SCEVPredicate *P) {
364     return P->getKind() == P_Wrap;
365   }
366 };
367
368 /// This class represents a composition of other SCEV predicates, and is the
369 /// class that most clients will interact with.  This is equivalent to a
370 /// logical "AND" of all the predicates in the union.
371 ///
372 /// NB! Unlike other SCEVPredicate sub-classes this class does not live in the
373 /// ScalarEvolution::Preds folding set.  This is why the \c add function is sound.
374 class SCEVUnionPredicate final : public SCEVPredicate {
375 private:
376   typedef DenseMap<const SCEV *, SmallVector<const SCEVPredicate *, 4>>
377       PredicateMap;
378
379   /// Vector with references to all predicates in this union.
380   SmallVector<const SCEVPredicate *, 16> Preds;
381   /// Maps SCEVs to predicates for quick look-ups.
382   PredicateMap SCEVToPreds;
383
384 public:
385   SCEVUnionPredicate();
386
387   const SmallVectorImpl<const SCEVPredicate *> &getPredicates() const {
388     return Preds;
389   }
390
391   /// Adds a predicate to this union.
392   void add(const SCEVPredicate *N);
393
394   /// Returns a reference to a vector containing all predicates which apply to
395   /// \p Expr.
396   ArrayRef<const SCEVPredicate *> getPredicatesForExpr(const SCEV *Expr);
397
398   /// Implementation of the SCEVPredicate interface
399   bool isAlwaysTrue() const override;
400   bool implies(const SCEVPredicate *N) const override;
401   void print(raw_ostream &OS, unsigned Depth) const override;
402   const SCEV *getExpr() const override;
403
404   /// We estimate the complexity of a union predicate as the size number of
405   /// predicates in the union.
406   unsigned getComplexity() const override { return Preds.size(); }
407
408   /// Methods for support type inquiry through isa, cast, and dyn_cast:
409   static inline bool classof(const SCEVPredicate *P) {
410     return P->getKind() == P_Union;
411   }
412 };
413
414 /// The main scalar evolution driver. Because client code (intentionally)
415 /// can't do much with the SCEV objects directly, they must ask this class
416 /// for services.
417 class ScalarEvolution {
418 public:
419   /// An enum describing the relationship between a SCEV and a loop.
420   enum LoopDisposition {
421     LoopVariant,   ///< The SCEV is loop-variant (unknown).
422     LoopInvariant, ///< The SCEV is loop-invariant.
423     LoopComputable ///< The SCEV varies predictably with the loop.
424   };
425
426   /// An enum describing the relationship between a SCEV and a basic block.
427   enum BlockDisposition {
428     DoesNotDominateBlock,  ///< The SCEV does not dominate the block.
429     DominatesBlock,        ///< The SCEV dominates the block.
430     ProperlyDominatesBlock ///< The SCEV properly dominates the block.
431   };
432
433   /// Convenient NoWrapFlags manipulation that hides enum casts and is
434   /// visible in the ScalarEvolution name space.
435   LLVM_NODISCARD static SCEV::NoWrapFlags maskFlags(SCEV::NoWrapFlags Flags,
436                                                     int Mask) {
437     return (SCEV::NoWrapFlags)(Flags & Mask);
438   }
439   LLVM_NODISCARD static SCEV::NoWrapFlags setFlags(SCEV::NoWrapFlags Flags,
440                                                    SCEV::NoWrapFlags OnFlags) {
441     return (SCEV::NoWrapFlags)(Flags | OnFlags);
442   }
443   LLVM_NODISCARD static SCEV::NoWrapFlags
444   clearFlags(SCEV::NoWrapFlags Flags, SCEV::NoWrapFlags OffFlags) {
445     return (SCEV::NoWrapFlags)(Flags & ~OffFlags);
446   }
447
448 private:
449   /// A CallbackVH to arrange for ScalarEvolution to be notified whenever a
450   /// Value is deleted.
451   class SCEVCallbackVH final : public CallbackVH {
452     ScalarEvolution *SE;
453     void deleted() override;
454     void allUsesReplacedWith(Value *New) override;
455
456   public:
457     SCEVCallbackVH(Value *V, ScalarEvolution *SE = nullptr);
458   };
459
460   friend class SCEVCallbackVH;
461   friend class SCEVExpander;
462   friend class SCEVUnknown;
463
464   /// The function we are analyzing.
465   ///
466   Function &F;
467
468   /// Does the module have any calls to the llvm.experimental.guard intrinsic
469   /// at all?  If this is false, we avoid doing work that will only help if
470   /// thare are guards present in the IR.
471   ///
472   bool HasGuards;
473
474   /// The target library information for the target we are targeting.
475   ///
476   TargetLibraryInfo &TLI;
477
478   /// The tracker for @llvm.assume intrinsics in this function.
479   AssumptionCache &AC;
480
481   /// The dominator tree.
482   ///
483   DominatorTree &DT;
484
485   /// The loop information for the function we are currently analyzing.
486   ///
487   LoopInfo &LI;
488
489   /// This SCEV is used to represent unknown trip counts and things.
490   std::unique_ptr<SCEVCouldNotCompute> CouldNotCompute;
491
492   /// The typedef for HasRecMap.
493   ///
494   typedef DenseMap<const SCEV *, bool> HasRecMapType;
495
496   /// This is a cache to record whether a SCEV contains any scAddRecExpr.
497   HasRecMapType HasRecMap;
498
499   /// The typedef for ExprValueMap.
500   ///
501   typedef std::pair<Value *, ConstantInt *> ValueOffsetPair;
502   typedef DenseMap<const SCEV *, SetVector<ValueOffsetPair>> ExprValueMapType;
503
504   /// ExprValueMap -- This map records the original values from which
505   /// the SCEV expr is generated from.
506   ///
507   /// We want to represent the mapping as SCEV -> ValueOffsetPair instead
508   /// of SCEV -> Value:
509   /// Suppose we know S1 expands to V1, and
510   ///  S1 = S2 + C_a
511   ///  S3 = S2 + C_b
512   /// where C_a and C_b are different SCEVConstants. Then we'd like to
513   /// expand S3 as V1 - C_a + C_b instead of expanding S2 literally.
514   /// It is helpful when S2 is a complex SCEV expr.
515   ///
516   /// In order to do that, we represent ExprValueMap as a mapping from
517   /// SCEV to ValueOffsetPair. We will save both S1->{V1, 0} and
518   /// S2->{V1, C_a} into the map when we create SCEV for V1. When S3
519   /// is expanded, it will first expand S2 to V1 - C_a because of
520   /// S2->{V1, C_a} in the map, then expand S3 to V1 - C_a + C_b.
521   ///
522   /// Note: S->{V, Offset} in the ExprValueMap means S can be expanded
523   /// to V - Offset.
524   ExprValueMapType ExprValueMap;
525
526   /// The typedef for ValueExprMap.
527   ///
528   typedef DenseMap<SCEVCallbackVH, const SCEV *, DenseMapInfo<Value *>>
529       ValueExprMapType;
530
531   /// This is a cache of the values we have analyzed so far.
532   ///
533   ValueExprMapType ValueExprMap;
534
535   /// Mark predicate values currently being processed by isImpliedCond.
536   SmallPtrSet<Value *, 6> PendingLoopPredicates;
537
538   /// Set to true by isLoopBackedgeGuardedByCond when we're walking the set of
539   /// conditions dominating the backedge of a loop.
540   bool WalkingBEDominatingConds;
541
542   /// Set to true by isKnownPredicateViaSplitting when we're trying to prove a
543   /// predicate by splitting it into a set of independent predicates.
544   bool ProvingSplitPredicate;
545
546   /// Memoized values for the GetMinTrailingZeros
547   DenseMap<const SCEV *, uint32_t> MinTrailingZerosCache;
548
549   /// Private helper method for the GetMinTrailingZeros method
550   uint32_t GetMinTrailingZerosImpl(const SCEV *S);
551
552   /// Information about the number of loop iterations for which a loop exit's
553   /// branch condition evaluates to the not-taken path.  This is a temporary
554   /// pair of exact and max expressions that are eventually summarized in
555   /// ExitNotTakenInfo and BackedgeTakenInfo.
556   struct ExitLimit {
557     const SCEV *ExactNotTaken; // The exit is not taken exactly this many times
558     const SCEV *MaxNotTaken; // The exit is not taken at most this many times
559     bool MaxOrZero; // Not taken either exactly MaxNotTaken or zero times
560
561     /// A set of predicate guards for this ExitLimit. The result is only valid
562     /// if all of the predicates in \c Predicates evaluate to 'true' at
563     /// run-time.
564     SmallPtrSet<const SCEVPredicate *, 4> Predicates;
565
566     void addPredicate(const SCEVPredicate *P) {
567       assert(!isa<SCEVUnionPredicate>(P) && "Only add leaf predicates here!");
568       Predicates.insert(P);
569     }
570
571     /*implicit*/ ExitLimit(const SCEV *E)
572         : ExactNotTaken(E), MaxNotTaken(E), MaxOrZero(false) {}
573
574     ExitLimit(
575         const SCEV *E, const SCEV *M, bool MaxOrZero,
576         ArrayRef<const SmallPtrSetImpl<const SCEVPredicate *> *> PredSetList)
577         : ExactNotTaken(E), MaxNotTaken(M), MaxOrZero(MaxOrZero) {
578       assert((isa<SCEVCouldNotCompute>(ExactNotTaken) ||
579               !isa<SCEVCouldNotCompute>(MaxNotTaken)) &&
580              "Exact is not allowed to be less precise than Max");
581       for (auto *PredSet : PredSetList)
582         for (auto *P : *PredSet)
583           addPredicate(P);
584     }
585
586     ExitLimit(const SCEV *E, const SCEV *M, bool MaxOrZero,
587               const SmallPtrSetImpl<const SCEVPredicate *> &PredSet)
588         : ExitLimit(E, M, MaxOrZero, {&PredSet}) {}
589
590     ExitLimit(const SCEV *E, const SCEV *M, bool MaxOrZero)
591         : ExitLimit(E, M, MaxOrZero, None) {}
592
593     /// Test whether this ExitLimit contains any computed information, or
594     /// whether it's all SCEVCouldNotCompute values.
595     bool hasAnyInfo() const {
596       return !isa<SCEVCouldNotCompute>(ExactNotTaken) ||
597              !isa<SCEVCouldNotCompute>(MaxNotTaken);
598     }
599
600     /// Test whether this ExitLimit contains all information.
601     bool hasFullInfo() const {
602       return !isa<SCEVCouldNotCompute>(ExactNotTaken);
603     }
604   };
605
606   /// Information about the number of times a particular loop exit may be
607   /// reached before exiting the loop.
608   struct ExitNotTakenInfo {
609     PoisoningVH<BasicBlock> ExitingBlock;
610     const SCEV *ExactNotTaken;
611     std::unique_ptr<SCEVUnionPredicate> Predicate;
612     bool hasAlwaysTruePredicate() const {
613       return !Predicate || Predicate->isAlwaysTrue();
614     }
615
616     explicit ExitNotTakenInfo(PoisoningVH<BasicBlock> ExitingBlock,
617                               const SCEV *ExactNotTaken,
618                               std::unique_ptr<SCEVUnionPredicate> Predicate)
619         : ExitingBlock(ExitingBlock), ExactNotTaken(ExactNotTaken),
620           Predicate(std::move(Predicate)) {}
621   };
622
623   /// Information about the backedge-taken count of a loop. This currently
624   /// includes an exact count and a maximum count.
625   ///
626   class BackedgeTakenInfo {
627     /// A list of computable exits and their not-taken counts.  Loops almost
628     /// never have more than one computable exit.
629     SmallVector<ExitNotTakenInfo, 1> ExitNotTaken;
630
631     /// The pointer part of \c MaxAndComplete is an expression indicating the
632     /// least maximum backedge-taken count of the loop that is known, or a
633     /// SCEVCouldNotCompute. This expression is only valid if the predicates
634     /// associated with all loop exits are true.
635     ///
636     /// The integer part of \c MaxAndComplete is a boolean indicating if \c
637     /// ExitNotTaken has an element for every exiting block in the loop.
638     PointerIntPair<const SCEV *, 1> MaxAndComplete;
639
640     /// True iff the backedge is taken either exactly Max or zero times.
641     bool MaxOrZero;
642
643     /// \name Helper projection functions on \c MaxAndComplete.
644     /// @{
645     bool isComplete() const { return MaxAndComplete.getInt(); }
646     const SCEV *getMax() const { return MaxAndComplete.getPointer(); }
647     /// @}
648
649   public:
650     BackedgeTakenInfo() : MaxAndComplete(nullptr, 0) {}
651
652     BackedgeTakenInfo(BackedgeTakenInfo &&) = default;
653     BackedgeTakenInfo &operator=(BackedgeTakenInfo &&) = default;
654
655     typedef std::pair<BasicBlock *, ExitLimit> EdgeExitInfo;
656
657     /// Initialize BackedgeTakenInfo from a list of exact exit counts.
658     BackedgeTakenInfo(SmallVectorImpl<EdgeExitInfo> &&ExitCounts, bool Complete,
659                       const SCEV *MaxCount, bool MaxOrZero);
660
661     /// Test whether this BackedgeTakenInfo contains any computed information,
662     /// or whether it's all SCEVCouldNotCompute values.
663     bool hasAnyInfo() const {
664       return !ExitNotTaken.empty() || !isa<SCEVCouldNotCompute>(getMax());
665     }
666
667     /// Test whether this BackedgeTakenInfo contains complete information.
668     bool hasFullInfo() const { return isComplete(); }
669
670     /// Return an expression indicating the exact backedge-taken count of the
671     /// loop if it is known or SCEVCouldNotCompute otherwise. This is the
672     /// number of times the loop header can be guaranteed to execute, minus
673     /// one.
674     ///
675     /// If the SCEV predicate associated with the answer can be different
676     /// from AlwaysTrue, we must add a (non null) Predicates argument.
677     /// The SCEV predicate associated with the answer will be added to
678     /// Predicates. A run-time check needs to be emitted for the SCEV
679     /// predicate in order for the answer to be valid.
680     ///
681     /// Note that we should always know if we need to pass a predicate
682     /// argument or not from the way the ExitCounts vector was computed.
683     /// If we allowed SCEV predicates to be generated when populating this
684     /// vector, this information can contain them and therefore a
685     /// SCEVPredicate argument should be added to getExact.
686     const SCEV *getExact(ScalarEvolution *SE,
687                          SCEVUnionPredicate *Predicates = nullptr) const;
688
689     /// Return the number of times this loop exit may fall through to the back
690     /// edge, or SCEVCouldNotCompute. The loop is guaranteed not to exit via
691     /// this block before this number of iterations, but may exit via another
692     /// block.
693     const SCEV *getExact(BasicBlock *ExitingBlock, ScalarEvolution *SE) const;
694
695     /// Get the max backedge taken count for the loop.
696     const SCEV *getMax(ScalarEvolution *SE) const;
697
698     /// Return true if the number of times this backedge is taken is either the
699     /// value returned by getMax or zero.
700     bool isMaxOrZero(ScalarEvolution *SE) const;
701
702     /// Return true if any backedge taken count expressions refer to the given
703     /// subexpression.
704     bool hasOperand(const SCEV *S, ScalarEvolution *SE) const;
705
706     /// Invalidate this result and free associated memory.
707     void clear();
708   };
709
710   /// Cache the backedge-taken count of the loops for this function as they
711   /// are computed.
712   DenseMap<const Loop *, BackedgeTakenInfo> BackedgeTakenCounts;
713
714   /// Cache the predicated backedge-taken count of the loops for this
715   /// function as they are computed.
716   DenseMap<const Loop *, BackedgeTakenInfo> PredicatedBackedgeTakenCounts;
717
718   /// This map contains entries for all of the PHI instructions that we
719   /// attempt to compute constant evolutions for.  This allows us to avoid
720   /// potentially expensive recomputation of these properties.  An instruction
721   /// maps to null if we are unable to compute its exit value.
722   DenseMap<PHINode *, Constant *> ConstantEvolutionLoopExitValue;
723
724   /// This map contains entries for all the expressions that we attempt to
725   /// compute getSCEVAtScope information for, which can be expensive in
726   /// extreme cases.
727   DenseMap<const SCEV *, SmallVector<std::pair<const Loop *, const SCEV *>, 2>>
728       ValuesAtScopes;
729
730   /// Memoized computeLoopDisposition results.
731   DenseMap<const SCEV *,
732            SmallVector<PointerIntPair<const Loop *, 2, LoopDisposition>, 2>>
733       LoopDispositions;
734
735   struct LoopProperties {
736     /// Set to true if the loop contains no instruction that can have side
737     /// effects (i.e. via throwing an exception, volatile or atomic access).
738     bool HasNoAbnormalExits;
739
740     /// Set to true if the loop contains no instruction that can abnormally exit
741     /// the loop (i.e. via throwing an exception, by terminating the thread
742     /// cleanly or by infinite looping in a called function).  Strictly
743     /// speaking, the last one is not leaving the loop, but is identical to
744     /// leaving the loop for reasoning about undefined behavior.
745     bool HasNoSideEffects;
746   };
747
748   /// Cache for \c getLoopProperties.
749   DenseMap<const Loop *, LoopProperties> LoopPropertiesCache;
750
751   /// Return a \c LoopProperties instance for \p L, creating one if necessary.
752   LoopProperties getLoopProperties(const Loop *L);
753
754   bool loopHasNoSideEffects(const Loop *L) {
755     return getLoopProperties(L).HasNoSideEffects;
756   }
757
758   bool loopHasNoAbnormalExits(const Loop *L) {
759     return getLoopProperties(L).HasNoAbnormalExits;
760   }
761
762   /// Compute a LoopDisposition value.
763   LoopDisposition computeLoopDisposition(const SCEV *S, const Loop *L);
764
765   /// Memoized computeBlockDisposition results.
766   DenseMap<
767       const SCEV *,
768       SmallVector<PointerIntPair<const BasicBlock *, 2, BlockDisposition>, 2>>
769       BlockDispositions;
770
771   /// Compute a BlockDisposition value.
772   BlockDisposition computeBlockDisposition(const SCEV *S, const BasicBlock *BB);
773
774   /// Memoized results from getRange
775   DenseMap<const SCEV *, ConstantRange> UnsignedRanges;
776
777   /// Memoized results from getRange
778   DenseMap<const SCEV *, ConstantRange> SignedRanges;
779
780   /// Used to parameterize getRange
781   enum RangeSignHint { HINT_RANGE_UNSIGNED, HINT_RANGE_SIGNED };
782
783   /// Set the memoized range for the given SCEV.
784   const ConstantRange &setRange(const SCEV *S, RangeSignHint Hint,
785                                 const ConstantRange &CR) {
786     DenseMap<const SCEV *, ConstantRange> &Cache =
787         Hint == HINT_RANGE_UNSIGNED ? UnsignedRanges : SignedRanges;
788
789     auto Pair = Cache.insert({S, CR});
790     if (!Pair.second)
791       Pair.first->second = CR;
792     return Pair.first->second;
793   }
794
795   /// Determine the range for a particular SCEV.
796   ConstantRange getRange(const SCEV *S, RangeSignHint Hint);
797
798   /// Determines the range for the affine SCEVAddRecExpr {\p Start,+,\p Stop}.
799   /// Helper for \c getRange.
800   ConstantRange getRangeForAffineAR(const SCEV *Start, const SCEV *Stop,
801                                     const SCEV *MaxBECount, unsigned BitWidth);
802
803   /// Try to compute a range for the affine SCEVAddRecExpr {\p Start,+,\p
804   /// Stop} by "factoring out" a ternary expression from the add recurrence.
805   /// Helper called by \c getRange.
806   ConstantRange getRangeViaFactoring(const SCEV *Start, const SCEV *Stop,
807                                      const SCEV *MaxBECount, unsigned BitWidth);
808
809   /// We know that there is no SCEV for the specified value.  Analyze the
810   /// expression.
811   const SCEV *createSCEV(Value *V);
812
813   /// Provide the special handling we need to analyze PHI SCEVs.
814   const SCEV *createNodeForPHI(PHINode *PN);
815
816   /// Helper function called from createNodeForPHI.
817   const SCEV *createAddRecFromPHI(PHINode *PN);
818
819   /// Helper function called from createNodeForPHI.
820   const SCEV *createNodeFromSelectLikePHI(PHINode *PN);
821
822   /// Provide special handling for a select-like instruction (currently this
823   /// is either a select instruction or a phi node).  \p I is the instruction
824   /// being processed, and it is assumed equivalent to "Cond ? TrueVal :
825   /// FalseVal".
826   const SCEV *createNodeForSelectOrPHI(Instruction *I, Value *Cond,
827                                        Value *TrueVal, Value *FalseVal);
828
829   /// Provide the special handling we need to analyze GEP SCEVs.
830   const SCEV *createNodeForGEP(GEPOperator *GEP);
831
832   /// Implementation code for getSCEVAtScope; called at most once for each
833   /// SCEV+Loop pair.
834   ///
835   const SCEV *computeSCEVAtScope(const SCEV *S, const Loop *L);
836
837   /// This looks up computed SCEV values for all instructions that depend on
838   /// the given instruction and removes them from the ValueExprMap map if they
839   /// reference SymName. This is used during PHI resolution.
840   void forgetSymbolicName(Instruction *I, const SCEV *SymName);
841
842   /// Return the BackedgeTakenInfo for the given loop, lazily computing new
843   /// values if the loop hasn't been analyzed yet. The returned result is
844   /// guaranteed not to be predicated.
845   const BackedgeTakenInfo &getBackedgeTakenInfo(const Loop *L);
846
847   /// Similar to getBackedgeTakenInfo, but will add predicates as required
848   /// with the purpose of returning complete information.
849   const BackedgeTakenInfo &getPredicatedBackedgeTakenInfo(const Loop *L);
850
851   /// Compute the number of times the specified loop will iterate.
852   /// If AllowPredicates is set, we will create new SCEV predicates as
853   /// necessary in order to return an exact answer.
854   BackedgeTakenInfo computeBackedgeTakenCount(const Loop *L,
855                                               bool AllowPredicates = false);
856
857   /// Compute the number of times the backedge of the specified loop will
858   /// execute if it exits via the specified block. If AllowPredicates is set,
859   /// this call will try to use a minimal set of SCEV predicates in order to
860   /// return an exact answer.
861   ExitLimit computeExitLimit(const Loop *L, BasicBlock *ExitingBlock,
862                              bool AllowPredicates = false);
863
864   /// Compute the number of times the backedge of the specified loop will
865   /// execute if its exit condition were a conditional branch of ExitCond,
866   /// TBB, and FBB.
867   ///
868   /// \p ControlsExit is true if ExitCond directly controls the exit
869   /// branch. In this case, we can assume that the loop exits only if the
870   /// condition is true and can infer that failing to meet the condition prior
871   /// to integer wraparound results in undefined behavior.
872   ///
873   /// If \p AllowPredicates is set, this call will try to use a minimal set of
874   /// SCEV predicates in order to return an exact answer.
875   ExitLimit computeExitLimitFromCond(const Loop *L, Value *ExitCond,
876                                      BasicBlock *TBB, BasicBlock *FBB,
877                                      bool ControlsExit,
878                                      bool AllowPredicates = false);
879
880   // Helper functions for computeExitLimitFromCond to avoid exponential time
881   // complexity.
882
883   class ExitLimitCache {
884     // It may look like we need key on the whole (L, TBB, FBB, ControlsExit,
885     // AllowPredicates) tuple, but recursive calls to
886     // computeExitLimitFromCondCached from computeExitLimitFromCondImpl only
887     // vary the in \c ExitCond and \c ControlsExit parameters.  We remember the
888     // initial values of the other values to assert our assumption.
889     SmallDenseMap<PointerIntPair<Value *, 1>, ExitLimit> TripCountMap;
890
891     const Loop *L;
892     BasicBlock *TBB;
893     BasicBlock *FBB;
894     bool AllowPredicates;
895
896   public:
897     ExitLimitCache(const Loop *L, BasicBlock *TBB, BasicBlock *FBB,
898                    bool AllowPredicates)
899         : L(L), TBB(TBB), FBB(FBB), AllowPredicates(AllowPredicates) {}
900
901     Optional<ExitLimit> find(const Loop *L, Value *ExitCond, BasicBlock *TBB,
902                              BasicBlock *FBB, bool ControlsExit,
903                              bool AllowPredicates);
904
905     void insert(const Loop *L, Value *ExitCond, BasicBlock *TBB,
906                 BasicBlock *FBB, bool ControlsExit, bool AllowPredicates,
907                 const ExitLimit &EL);
908   };
909
910   typedef ExitLimitCache ExitLimitCacheTy;
911   ExitLimit computeExitLimitFromCondCached(ExitLimitCacheTy &Cache,
912                                            const Loop *L, Value *ExitCond,
913                                            BasicBlock *TBB, BasicBlock *FBB,
914                                            bool ControlsExit,
915                                            bool AllowPredicates);
916   ExitLimit computeExitLimitFromCondImpl(ExitLimitCacheTy &Cache, const Loop *L,
917                                          Value *ExitCond, BasicBlock *TBB,
918                                          BasicBlock *FBB, bool ControlsExit,
919                                          bool AllowPredicates);
920
921   /// Compute the number of times the backedge of the specified loop will
922   /// execute if its exit condition were a conditional branch of the ICmpInst
923   /// ExitCond, TBB, and FBB. If AllowPredicates is set, this call will try
924   /// to use a minimal set of SCEV predicates in order to return an exact
925   /// answer.
926   ExitLimit computeExitLimitFromICmp(const Loop *L, ICmpInst *ExitCond,
927                                      BasicBlock *TBB, BasicBlock *FBB,
928                                      bool IsSubExpr,
929                                      bool AllowPredicates = false);
930
931   /// Compute the number of times the backedge of the specified loop will
932   /// execute if its exit condition were a switch with a single exiting case
933   /// to ExitingBB.
934   ExitLimit computeExitLimitFromSingleExitSwitch(const Loop *L,
935                                                  SwitchInst *Switch,
936                                                  BasicBlock *ExitingBB,
937                                                  bool IsSubExpr);
938
939   /// Given an exit condition of 'icmp op load X, cst', try to see if we can
940   /// compute the backedge-taken count.
941   ExitLimit computeLoadConstantCompareExitLimit(LoadInst *LI, Constant *RHS,
942                                                 const Loop *L,
943                                                 ICmpInst::Predicate p);
944
945   /// Compute the exit limit of a loop that is controlled by a
946   /// "(IV >> 1) != 0" type comparison.  We cannot compute the exact trip
947   /// count in these cases (since SCEV has no way of expressing them), but we
948   /// can still sometimes compute an upper bound.
949   ///
950   /// Return an ExitLimit for a loop whose backedge is guarded by `LHS Pred
951   /// RHS`.
952   ExitLimit computeShiftCompareExitLimit(Value *LHS, Value *RHS, const Loop *L,
953                                          ICmpInst::Predicate Pred);
954
955   /// If the loop is known to execute a constant number of times (the
956   /// condition evolves only from constants), try to evaluate a few iterations
957   /// of the loop until we get the exit condition gets a value of ExitWhen
958   /// (true or false).  If we cannot evaluate the exit count of the loop,
959   /// return CouldNotCompute.
960   const SCEV *computeExitCountExhaustively(const Loop *L, Value *Cond,
961                                            bool ExitWhen);
962
963   /// Return the number of times an exit condition comparing the specified
964   /// value to zero will execute.  If not computable, return CouldNotCompute.
965   /// If AllowPredicates is set, this call will try to use a minimal set of
966   /// SCEV predicates in order to return an exact answer.
967   ExitLimit howFarToZero(const SCEV *V, const Loop *L, bool IsSubExpr,
968                          bool AllowPredicates = false);
969
970   /// Return the number of times an exit condition checking the specified
971   /// value for nonzero will execute.  If not computable, return
972   /// CouldNotCompute.
973   ExitLimit howFarToNonZero(const SCEV *V, const Loop *L);
974
975   /// Return the number of times an exit condition containing the specified
976   /// less-than comparison will execute.  If not computable, return
977   /// CouldNotCompute.
978   ///
979   /// \p isSigned specifies whether the less-than is signed.
980   ///
981   /// \p ControlsExit is true when the LHS < RHS condition directly controls
982   /// the branch (loops exits only if condition is true). In this case, we can
983   /// use NoWrapFlags to skip overflow checks.
984   ///
985   /// If \p AllowPredicates is set, this call will try to use a minimal set of
986   /// SCEV predicates in order to return an exact answer.
987   ExitLimit howManyLessThans(const SCEV *LHS, const SCEV *RHS, const Loop *L,
988                              bool isSigned, bool ControlsExit,
989                              bool AllowPredicates = false);
990
991   ExitLimit howManyGreaterThans(const SCEV *LHS, const SCEV *RHS, const Loop *L,
992                                 bool isSigned, bool IsSubExpr,
993                                 bool AllowPredicates = false);
994
995   /// Return a predecessor of BB (which may not be an immediate predecessor)
996   /// which has exactly one successor from which BB is reachable, or null if
997   /// no such block is found.
998   std::pair<BasicBlock *, BasicBlock *>
999   getPredecessorWithUniqueSuccessorForBB(BasicBlock *BB);
1000
1001   /// Test whether the condition described by Pred, LHS, and RHS is true
1002   /// whenever the given FoundCondValue value evaluates to true.
1003   bool isImpliedCond(ICmpInst::Predicate Pred, const SCEV *LHS, const SCEV *RHS,
1004                      Value *FoundCondValue, bool Inverse);
1005
1006   /// Test whether the condition described by Pred, LHS, and RHS is true
1007   /// whenever the condition described by FoundPred, FoundLHS, FoundRHS is
1008   /// true.
1009   bool isImpliedCond(ICmpInst::Predicate Pred, const SCEV *LHS, const SCEV *RHS,
1010                      ICmpInst::Predicate FoundPred, const SCEV *FoundLHS,
1011                      const SCEV *FoundRHS);
1012
1013   /// Test whether the condition described by Pred, LHS, and RHS is true
1014   /// whenever the condition described by Pred, FoundLHS, and FoundRHS is
1015   /// true.
1016   bool isImpliedCondOperands(ICmpInst::Predicate Pred, const SCEV *LHS,
1017                              const SCEV *RHS, const SCEV *FoundLHS,
1018                              const SCEV *FoundRHS);
1019
1020   /// Test whether the condition described by Pred, LHS, and RHS is true
1021   /// whenever the condition described by Pred, FoundLHS, and FoundRHS is
1022   /// true. Here LHS is an operation that includes FoundLHS as one of its
1023   /// arguments.
1024   bool isImpliedViaOperations(ICmpInst::Predicate Pred,
1025                               const SCEV *LHS, const SCEV *RHS,
1026                               const SCEV *FoundLHS, const SCEV *FoundRHS,
1027                               unsigned Depth = 0);
1028
1029   /// Test whether the condition described by Pred, LHS, and RHS is true.
1030   /// Use only simple non-recursive types of checks, such as range analysis etc.
1031   bool isKnownViaSimpleReasoning(ICmpInst::Predicate Pred,
1032                                  const SCEV *LHS, const SCEV *RHS);
1033
1034   /// Test whether the condition described by Pred, LHS, and RHS is true
1035   /// whenever the condition described by Pred, FoundLHS, and FoundRHS is
1036   /// true.
1037   bool isImpliedCondOperandsHelper(ICmpInst::Predicate Pred, const SCEV *LHS,
1038                                    const SCEV *RHS, const SCEV *FoundLHS,
1039                                    const SCEV *FoundRHS);
1040
1041   /// Test whether the condition described by Pred, LHS, and RHS is true
1042   /// whenever the condition described by Pred, FoundLHS, and FoundRHS is
1043   /// true.  Utility function used by isImpliedCondOperands.  Tries to get
1044   /// cases like "X `sgt` 0 => X - 1 `sgt` -1".
1045   bool isImpliedCondOperandsViaRanges(ICmpInst::Predicate Pred, const SCEV *LHS,
1046                                       const SCEV *RHS, const SCEV *FoundLHS,
1047                                       const SCEV *FoundRHS);
1048
1049   /// Return true if the condition denoted by \p LHS \p Pred \p RHS is implied
1050   /// by a call to \c @llvm.experimental.guard in \p BB.
1051   bool isImpliedViaGuard(BasicBlock *BB, ICmpInst::Predicate Pred,
1052                          const SCEV *LHS, const SCEV *RHS);
1053
1054   /// Test whether the condition described by Pred, LHS, and RHS is true
1055   /// whenever the condition described by Pred, FoundLHS, and FoundRHS is
1056   /// true.
1057   ///
1058   /// This routine tries to rule out certain kinds of integer overflow, and
1059   /// then tries to reason about arithmetic properties of the predicates.
1060   bool isImpliedCondOperandsViaNoOverflow(ICmpInst::Predicate Pred,
1061                                           const SCEV *LHS, const SCEV *RHS,
1062                                           const SCEV *FoundLHS,
1063                                           const SCEV *FoundRHS);
1064
1065   /// If we know that the specified Phi is in the header of its containing
1066   /// loop, we know the loop executes a constant number of times, and the PHI
1067   /// node is just a recurrence involving constants, fold it.
1068   Constant *getConstantEvolutionLoopExitValue(PHINode *PN, const APInt &BEs,
1069                                               const Loop *L);
1070
1071   /// Test if the given expression is known to satisfy the condition described
1072   /// by Pred and the known constant ranges of LHS and RHS.
1073   ///
1074   bool isKnownPredicateViaConstantRanges(ICmpInst::Predicate Pred,
1075                                          const SCEV *LHS, const SCEV *RHS);
1076
1077   /// Try to prove the condition described by "LHS Pred RHS" by ruling out
1078   /// integer overflow.
1079   ///
1080   /// For instance, this will return true for "A s< (A + C)<nsw>" if C is
1081   /// positive.
1082   bool isKnownPredicateViaNoOverflow(ICmpInst::Predicate Pred, const SCEV *LHS,
1083                                      const SCEV *RHS);
1084
1085   /// Try to split Pred LHS RHS into logical conjunctions (and's) and try to
1086   /// prove them individually.
1087   bool isKnownPredicateViaSplitting(ICmpInst::Predicate Pred, const SCEV *LHS,
1088                                     const SCEV *RHS);
1089
1090   /// Try to match the Expr as "(L + R)<Flags>".
1091   bool splitBinaryAdd(const SCEV *Expr, const SCEV *&L, const SCEV *&R,
1092                       SCEV::NoWrapFlags &Flags);
1093
1094   /// Compute \p LHS - \p RHS and returns the result as an APInt if it is a
1095   /// constant, and None if it isn't.
1096   ///
1097   /// This is intended to be a cheaper version of getMinusSCEV.  We can be
1098   /// frugal here since we just bail out of actually constructing and
1099   /// canonicalizing an expression in the cases where the result isn't going
1100   /// to be a constant.
1101   Optional<APInt> computeConstantDifference(const SCEV *LHS, const SCEV *RHS);
1102
1103   /// Drop memoized information computed for S.
1104   void forgetMemoizedResults(const SCEV *S);
1105
1106   /// Return an existing SCEV for V if there is one, otherwise return nullptr.
1107   const SCEV *getExistingSCEV(Value *V);
1108
1109   /// Return false iff given SCEV contains a SCEVUnknown with NULL value-
1110   /// pointer.
1111   bool checkValidity(const SCEV *S) const;
1112
1113   /// Return true if `ExtendOpTy`({`Start`,+,`Step`}) can be proved to be
1114   /// equal to {`ExtendOpTy`(`Start`),+,`ExtendOpTy`(`Step`)}.  This is
1115   /// equivalent to proving no signed (resp. unsigned) wrap in
1116   /// {`Start`,+,`Step`} if `ExtendOpTy` is `SCEVSignExtendExpr`
1117   /// (resp. `SCEVZeroExtendExpr`).
1118   ///
1119   template <typename ExtendOpTy>
1120   bool proveNoWrapByVaryingStart(const SCEV *Start, const SCEV *Step,
1121                                  const Loop *L);
1122
1123   /// Try to prove NSW or NUW on \p AR relying on ConstantRange manipulation.
1124   SCEV::NoWrapFlags proveNoWrapViaConstantRanges(const SCEVAddRecExpr *AR);
1125
1126   bool isMonotonicPredicateImpl(const SCEVAddRecExpr *LHS,
1127                                 ICmpInst::Predicate Pred, bool &Increasing);
1128
1129   /// Return SCEV no-wrap flags that can be proven based on reasoning about
1130   /// how poison produced from no-wrap flags on this value (e.g. a nuw add)
1131   /// would trigger undefined behavior on overflow.
1132   SCEV::NoWrapFlags getNoWrapFlagsFromUB(const Value *V);
1133
1134   /// Return true if the SCEV corresponding to \p I is never poison.  Proving
1135   /// this is more complex than proving that just \p I is never poison, since
1136   /// SCEV commons expressions across control flow, and you can have cases
1137   /// like:
1138   ///
1139   ///   idx0 = a + b;
1140   ///   ptr[idx0] = 100;
1141   ///   if (<condition>) {
1142   ///     idx1 = a +nsw b;
1143   ///     ptr[idx1] = 200;
1144   ///   }
1145   ///
1146   /// where the SCEV expression (+ a b) is guaranteed to not be poison (and
1147   /// hence not sign-overflow) only if "<condition>" is true.  Since both
1148   /// `idx0` and `idx1` will be mapped to the same SCEV expression, (+ a b),
1149   /// it is not okay to annotate (+ a b) with <nsw> in the above example.
1150   bool isSCEVExprNeverPoison(const Instruction *I);
1151
1152   /// This is like \c isSCEVExprNeverPoison but it specifically works for
1153   /// instructions that will get mapped to SCEV add recurrences.  Return true
1154   /// if \p I will never generate poison under the assumption that \p I is an
1155   /// add recurrence on the loop \p L.
1156   bool isAddRecNeverPoison(const Instruction *I, const Loop *L);
1157
1158 public:
1159   ScalarEvolution(Function &F, TargetLibraryInfo &TLI, AssumptionCache &AC,
1160                   DominatorTree &DT, LoopInfo &LI);
1161   ~ScalarEvolution();
1162   ScalarEvolution(ScalarEvolution &&Arg);
1163
1164   LLVMContext &getContext() const { return F.getContext(); }
1165
1166   /// Test if values of the given type are analyzable within the SCEV
1167   /// framework. This primarily includes integer types, and it can optionally
1168   /// include pointer types if the ScalarEvolution class has access to
1169   /// target-specific information.
1170   bool isSCEVable(Type *Ty) const;
1171
1172   /// Return the size in bits of the specified type, for which isSCEVable must
1173   /// return true.
1174   uint64_t getTypeSizeInBits(Type *Ty) const;
1175
1176   /// Return a type with the same bitwidth as the given type and which
1177   /// represents how SCEV will treat the given type, for which isSCEVable must
1178   /// return true. For pointer types, this is the pointer-sized integer type.
1179   Type *getEffectiveSCEVType(Type *Ty) const;
1180
1181   // Returns a wider type among {Ty1, Ty2}.
1182   Type *getWiderType(Type *Ty1, Type *Ty2) const;
1183
1184   /// Return true if the SCEV is a scAddRecExpr or it contains
1185   /// scAddRecExpr. The result will be cached in HasRecMap.
1186   ///
1187   bool containsAddRecurrence(const SCEV *S);
1188
1189   /// Return the Value set from which the SCEV expr is generated.
1190   SetVector<ValueOffsetPair> *getSCEVValues(const SCEV *S);
1191
1192   /// Erase Value from ValueExprMap and ExprValueMap.
1193   void eraseValueFromMap(Value *V);
1194
1195   /// Return a SCEV expression for the full generality of the specified
1196   /// expression.
1197   const SCEV *getSCEV(Value *V);
1198
1199   const SCEV *getConstant(ConstantInt *V);
1200   const SCEV *getConstant(const APInt &Val);
1201   const SCEV *getConstant(Type *Ty, uint64_t V, bool isSigned = false);
1202   const SCEV *getTruncateExpr(const SCEV *Op, Type *Ty);
1203
1204   typedef SmallDenseMap<std::pair<const SCEV *, Type *>, const SCEV *, 8>
1205       ExtendCacheTy;
1206   const SCEV *getZeroExtendExpr(const SCEV *Op, Type *Ty);
1207   const SCEV *getZeroExtendExprCached(const SCEV *Op, Type *Ty,
1208                                       ExtendCacheTy &Cache);
1209   const SCEV *getZeroExtendExprImpl(const SCEV *Op, Type *Ty,
1210                                     ExtendCacheTy &Cache);
1211
1212   const SCEV *getSignExtendExpr(const SCEV *Op, Type *Ty);
1213   const SCEV *getSignExtendExprCached(const SCEV *Op, Type *Ty,
1214                                       ExtendCacheTy &Cache);
1215   const SCEV *getSignExtendExprImpl(const SCEV *Op, Type *Ty,
1216                                     ExtendCacheTy &Cache);
1217   const SCEV *getAnyExtendExpr(const SCEV *Op, Type *Ty);
1218   const SCEV *getAddExpr(SmallVectorImpl<const SCEV *> &Ops,
1219                          SCEV::NoWrapFlags Flags = SCEV::FlagAnyWrap,
1220                          unsigned Depth = 0);
1221   const SCEV *getAddExpr(const SCEV *LHS, const SCEV *RHS,
1222                          SCEV::NoWrapFlags Flags = SCEV::FlagAnyWrap) {
1223     SmallVector<const SCEV *, 2> Ops = {LHS, RHS};
1224     return getAddExpr(Ops, Flags);
1225   }
1226   const SCEV *getAddExpr(const SCEV *Op0, const SCEV *Op1, const SCEV *Op2,
1227                          SCEV::NoWrapFlags Flags = SCEV::FlagAnyWrap) {
1228     SmallVector<const SCEV *, 3> Ops = {Op0, Op1, Op2};
1229     return getAddExpr(Ops, Flags);
1230   }
1231   const SCEV *getMulExpr(SmallVectorImpl<const SCEV *> &Ops,
1232                          SCEV::NoWrapFlags Flags = SCEV::FlagAnyWrap);
1233   const SCEV *getMulExpr(const SCEV *LHS, const SCEV *RHS,
1234                          SCEV::NoWrapFlags Flags = SCEV::FlagAnyWrap) {
1235     SmallVector<const SCEV *, 2> Ops = {LHS, RHS};
1236     return getMulExpr(Ops, Flags);
1237   }
1238   const SCEV *getMulExpr(const SCEV *Op0, const SCEV *Op1, const SCEV *Op2,
1239                          SCEV::NoWrapFlags Flags = SCEV::FlagAnyWrap) {
1240     SmallVector<const SCEV *, 3> Ops = {Op0, Op1, Op2};
1241     return getMulExpr(Ops, Flags);
1242   }
1243   const SCEV *getUDivExpr(const SCEV *LHS, const SCEV *RHS);
1244   const SCEV *getUDivExactExpr(const SCEV *LHS, const SCEV *RHS);
1245   const SCEV *getAddRecExpr(const SCEV *Start, const SCEV *Step, const Loop *L,
1246                             SCEV::NoWrapFlags Flags);
1247   const SCEV *getAddRecExpr(SmallVectorImpl<const SCEV *> &Operands,
1248                             const Loop *L, SCEV::NoWrapFlags Flags);
1249   const SCEV *getAddRecExpr(const SmallVectorImpl<const SCEV *> &Operands,
1250                             const Loop *L, SCEV::NoWrapFlags Flags) {
1251     SmallVector<const SCEV *, 4> NewOp(Operands.begin(), Operands.end());
1252     return getAddRecExpr(NewOp, L, Flags);
1253   }
1254   /// Returns an expression for a GEP
1255   ///
1256   /// \p GEP The GEP. The indices contained in the GEP itself are ignored,
1257   /// instead we use IndexExprs.
1258   /// \p IndexExprs The expressions for the indices.
1259   const SCEV *getGEPExpr(GEPOperator *GEP,
1260                          const SmallVectorImpl<const SCEV *> &IndexExprs);
1261   const SCEV *getSMaxExpr(const SCEV *LHS, const SCEV *RHS);
1262   const SCEV *getSMaxExpr(SmallVectorImpl<const SCEV *> &Operands);
1263   const SCEV *getUMaxExpr(const SCEV *LHS, const SCEV *RHS);
1264   const SCEV *getUMaxExpr(SmallVectorImpl<const SCEV *> &Operands);
1265   const SCEV *getSMinExpr(const SCEV *LHS, const SCEV *RHS);
1266   const SCEV *getUMinExpr(const SCEV *LHS, const SCEV *RHS);
1267   const SCEV *getUnknown(Value *V);
1268   const SCEV *getCouldNotCompute();
1269
1270   /// Return a SCEV for the constant 0 of a specific type.
1271   const SCEV *getZero(Type *Ty) { return getConstant(Ty, 0); }
1272
1273   /// Return a SCEV for the constant 1 of a specific type.
1274   const SCEV *getOne(Type *Ty) { return getConstant(Ty, 1); }
1275
1276   /// Return an expression for sizeof AllocTy that is type IntTy
1277   ///
1278   const SCEV *getSizeOfExpr(Type *IntTy, Type *AllocTy);
1279
1280   /// Return an expression for offsetof on the given field with type IntTy
1281   ///
1282   const SCEV *getOffsetOfExpr(Type *IntTy, StructType *STy, unsigned FieldNo);
1283
1284   /// Return the SCEV object corresponding to -V.
1285   ///
1286   const SCEV *getNegativeSCEV(const SCEV *V,
1287                               SCEV::NoWrapFlags Flags = SCEV::FlagAnyWrap);
1288
1289   /// Return the SCEV object corresponding to ~V.
1290   ///
1291   const SCEV *getNotSCEV(const SCEV *V);
1292
1293   /// Return LHS-RHS.  Minus is represented in SCEV as A+B*-1.
1294   const SCEV *getMinusSCEV(const SCEV *LHS, const SCEV *RHS,
1295                            SCEV::NoWrapFlags Flags = SCEV::FlagAnyWrap);
1296
1297   /// Return a SCEV corresponding to a conversion of the input value to the
1298   /// specified type.  If the type must be extended, it is zero extended.
1299   const SCEV *getTruncateOrZeroExtend(const SCEV *V, Type *Ty);
1300
1301   /// Return a SCEV corresponding to a conversion of the input value to the
1302   /// specified type.  If the type must be extended, it is sign extended.
1303   const SCEV *getTruncateOrSignExtend(const SCEV *V, Type *Ty);
1304
1305   /// Return a SCEV corresponding to a conversion of the input value to the
1306   /// specified type.  If the type must be extended, it is zero extended.  The
1307   /// conversion must not be narrowing.
1308   const SCEV *getNoopOrZeroExtend(const SCEV *V, Type *Ty);
1309
1310   /// Return a SCEV corresponding to a conversion of the input value to the
1311   /// specified type.  If the type must be extended, it is sign extended.  The
1312   /// conversion must not be narrowing.
1313   const SCEV *getNoopOrSignExtend(const SCEV *V, Type *Ty);
1314
1315   /// Return a SCEV corresponding to a conversion of the input value to the
1316   /// specified type. If the type must be extended, it is extended with
1317   /// unspecified bits. The conversion must not be narrowing.
1318   const SCEV *getNoopOrAnyExtend(const SCEV *V, Type *Ty);
1319
1320   /// Return a SCEV corresponding to a conversion of the input value to the
1321   /// specified type.  The conversion must not be widening.
1322   const SCEV *getTruncateOrNoop(const SCEV *V, Type *Ty);
1323
1324   /// Promote the operands to the wider of the types using zero-extension, and
1325   /// then perform a umax operation with them.
1326   const SCEV *getUMaxFromMismatchedTypes(const SCEV *LHS, const SCEV *RHS);
1327
1328   /// Promote the operands to the wider of the types using zero-extension, and
1329   /// then perform a umin operation with them.
1330   const SCEV *getUMinFromMismatchedTypes(const SCEV *LHS, const SCEV *RHS);
1331
1332   /// Transitively follow the chain of pointer-type operands until reaching a
1333   /// SCEV that does not have a single pointer operand. This returns a
1334   /// SCEVUnknown pointer for well-formed pointer-type expressions, but corner
1335   /// cases do exist.
1336   const SCEV *getPointerBase(const SCEV *V);
1337
1338   /// Return a SCEV expression for the specified value at the specified scope
1339   /// in the program.  The L value specifies a loop nest to evaluate the
1340   /// expression at, where null is the top-level or a specified loop is
1341   /// immediately inside of the loop.
1342   ///
1343   /// This method can be used to compute the exit value for a variable defined
1344   /// in a loop by querying what the value will hold in the parent loop.
1345   ///
1346   /// In the case that a relevant loop exit value cannot be computed, the
1347   /// original value V is returned.
1348   const SCEV *getSCEVAtScope(const SCEV *S, const Loop *L);
1349
1350   /// This is a convenience function which does getSCEVAtScope(getSCEV(V), L).
1351   const SCEV *getSCEVAtScope(Value *V, const Loop *L);
1352
1353   /// Test whether entry to the loop is protected by a conditional between LHS
1354   /// and RHS.  This is used to help avoid max expressions in loop trip
1355   /// counts, and to eliminate casts.
1356   bool isLoopEntryGuardedByCond(const Loop *L, ICmpInst::Predicate Pred,
1357                                 const SCEV *LHS, const SCEV *RHS);
1358
1359   /// Test whether the backedge of the loop is protected by a conditional
1360   /// between LHS and RHS.  This is used to to eliminate casts.
1361   bool isLoopBackedgeGuardedByCond(const Loop *L, ICmpInst::Predicate Pred,
1362                                    const SCEV *LHS, const SCEV *RHS);
1363
1364   /// Returns the maximum trip count of the loop if it is a single-exit
1365   /// loop and we can compute a small maximum for that loop.
1366   ///
1367   /// Implemented in terms of the \c getSmallConstantTripCount overload with
1368   /// the single exiting block passed to it. See that routine for details.
1369   unsigned getSmallConstantTripCount(const Loop *L);
1370
1371   /// Returns the maximum trip count of this loop as a normal unsigned
1372   /// value. Returns 0 if the trip count is unknown or not constant. This
1373   /// "trip count" assumes that control exits via ExitingBlock. More
1374   /// precisely, it is the number of times that control may reach ExitingBlock
1375   /// before taking the branch. For loops with multiple exits, it may not be
1376   /// the number times that the loop header executes if the loop exits
1377   /// prematurely via another branch.
1378   unsigned getSmallConstantTripCount(const Loop *L, BasicBlock *ExitingBlock);
1379
1380   /// Returns the upper bound of the loop trip count as a normal unsigned
1381   /// value.
1382   /// Returns 0 if the trip count is unknown or not constant.
1383   unsigned getSmallConstantMaxTripCount(const Loop *L);
1384
1385   /// Returns the largest constant divisor of the trip count of the
1386   /// loop if it is a single-exit loop and we can compute a small maximum for
1387   /// that loop.
1388   ///
1389   /// Implemented in terms of the \c getSmallConstantTripMultiple overload with
1390   /// the single exiting block passed to it. See that routine for details.
1391   unsigned getSmallConstantTripMultiple(const Loop *L);
1392
1393   /// Returns the largest constant divisor of the trip count of this loop as a
1394   /// normal unsigned value, if possible. This means that the actual trip
1395   /// count is always a multiple of the returned value (don't forget the trip
1396   /// count could very well be zero as well!). As explained in the comments
1397   /// for getSmallConstantTripCount, this assumes that control exits the loop
1398   /// via ExitingBlock.
1399   unsigned getSmallConstantTripMultiple(const Loop *L,
1400                                         BasicBlock *ExitingBlock);
1401
1402   /// Get the expression for the number of loop iterations for which this loop
1403   /// is guaranteed not to exit via ExitingBlock. Otherwise return
1404   /// SCEVCouldNotCompute.
1405   const SCEV *getExitCount(const Loop *L, BasicBlock *ExitingBlock);
1406
1407   /// If the specified loop has a predictable backedge-taken count, return it,
1408   /// otherwise return a SCEVCouldNotCompute object. The backedge-taken count
1409   /// is the number of times the loop header will be branched to from within
1410   /// the loop. This is one less than the trip count of the loop, since it
1411   /// doesn't count the first iteration, when the header is branched to from
1412   /// outside the loop.
1413   ///
1414   /// Note that it is not valid to call this method on a loop without a
1415   /// loop-invariant backedge-taken count (see
1416   /// hasLoopInvariantBackedgeTakenCount).
1417   ///
1418   const SCEV *getBackedgeTakenCount(const Loop *L);
1419
1420   /// Similar to getBackedgeTakenCount, except it will add a set of
1421   /// SCEV predicates to Predicates that are required to be true in order for
1422   /// the answer to be correct. Predicates can be checked with run-time
1423   /// checks and can be used to perform loop versioning.
1424   const SCEV *getPredicatedBackedgeTakenCount(const Loop *L,
1425                                               SCEVUnionPredicate &Predicates);
1426
1427   /// Similar to getBackedgeTakenCount, except return the least SCEV value
1428   /// that is known never to be less than the actual backedge taken count.
1429   const SCEV *getMaxBackedgeTakenCount(const Loop *L);
1430
1431   /// Return true if the backedge taken count is either the value returned by
1432   /// getMaxBackedgeTakenCount or zero.
1433   bool isBackedgeTakenCountMaxOrZero(const Loop *L);
1434
1435   /// Return true if the specified loop has an analyzable loop-invariant
1436   /// backedge-taken count.
1437   bool hasLoopInvariantBackedgeTakenCount(const Loop *L);
1438
1439   /// This method should be called by the client when it has changed a loop in
1440   /// a way that may effect ScalarEvolution's ability to compute a trip count,
1441   /// or if the loop is deleted.  This call is potentially expensive for large
1442   /// loop bodies.
1443   void forgetLoop(const Loop *L);
1444
1445   /// This method should be called by the client when it has changed a value
1446   /// in a way that may effect its value, or which may disconnect it from a
1447   /// def-use chain linking it to a loop.
1448   void forgetValue(Value *V);
1449
1450   /// Called when the client has changed the disposition of values in
1451   /// this loop.
1452   ///
1453   /// We don't have a way to invalidate per-loop dispositions. Clear and
1454   /// recompute is simpler.
1455   void forgetLoopDispositions(const Loop *L) { LoopDispositions.clear(); }
1456
1457   /// Determine the minimum number of zero bits that S is guaranteed to end in
1458   /// (at every loop iteration).  It is, at the same time, the minimum number
1459   /// of times S is divisible by 2.  For example, given {4,+,8} it returns 2.
1460   /// If S is guaranteed to be 0, it returns the bitwidth of S.
1461   uint32_t GetMinTrailingZeros(const SCEV *S);
1462
1463   /// Determine the unsigned range for a particular SCEV.
1464   ///
1465   ConstantRange getUnsignedRange(const SCEV *S) {
1466     return getRange(S, HINT_RANGE_UNSIGNED);
1467   }
1468
1469   /// Determine the signed range for a particular SCEV.
1470   ///
1471   ConstantRange getSignedRange(const SCEV *S) {
1472     return getRange(S, HINT_RANGE_SIGNED);
1473   }
1474
1475   /// Test if the given expression is known to be negative.
1476   ///
1477   bool isKnownNegative(const SCEV *S);
1478
1479   /// Test if the given expression is known to be positive.
1480   ///
1481   bool isKnownPositive(const SCEV *S);
1482
1483   /// Test if the given expression is known to be non-negative.
1484   ///
1485   bool isKnownNonNegative(const SCEV *S);
1486
1487   /// Test if the given expression is known to be non-positive.
1488   ///
1489   bool isKnownNonPositive(const SCEV *S);
1490
1491   /// Test if the given expression is known to be non-zero.
1492   ///
1493   bool isKnownNonZero(const SCEV *S);
1494
1495   /// Test if the given expression is known to satisfy the condition described
1496   /// by Pred, LHS, and RHS.
1497   ///
1498   bool isKnownPredicate(ICmpInst::Predicate Pred, const SCEV *LHS,
1499                         const SCEV *RHS);
1500
1501   /// Return true if, for all loop invariant X, the predicate "LHS `Pred` X"
1502   /// is monotonically increasing or decreasing.  In the former case set
1503   /// `Increasing` to true and in the latter case set `Increasing` to false.
1504   ///
1505   /// A predicate is said to be monotonically increasing if may go from being
1506   /// false to being true as the loop iterates, but never the other way
1507   /// around.  A predicate is said to be monotonically decreasing if may go
1508   /// from being true to being false as the loop iterates, but never the other
1509   /// way around.
1510   bool isMonotonicPredicate(const SCEVAddRecExpr *LHS, ICmpInst::Predicate Pred,
1511                             bool &Increasing);
1512
1513   /// Return true if the result of the predicate LHS `Pred` RHS is loop
1514   /// invariant with respect to L.  Set InvariantPred, InvariantLHS and
1515   /// InvariantLHS so that InvariantLHS `InvariantPred` InvariantRHS is the
1516   /// loop invariant form of LHS `Pred` RHS.
1517   bool isLoopInvariantPredicate(ICmpInst::Predicate Pred, const SCEV *LHS,
1518                                 const SCEV *RHS, const Loop *L,
1519                                 ICmpInst::Predicate &InvariantPred,
1520                                 const SCEV *&InvariantLHS,
1521                                 const SCEV *&InvariantRHS);
1522
1523   /// Simplify LHS and RHS in a comparison with predicate Pred. Return true
1524   /// iff any changes were made. If the operands are provably equal or
1525   /// unequal, LHS and RHS are set to the same value and Pred is set to either
1526   /// ICMP_EQ or ICMP_NE.
1527   ///
1528   bool SimplifyICmpOperands(ICmpInst::Predicate &Pred, const SCEV *&LHS,
1529                             const SCEV *&RHS, unsigned Depth = 0);
1530
1531   /// Return the "disposition" of the given SCEV with respect to the given
1532   /// loop.
1533   LoopDisposition getLoopDisposition(const SCEV *S, const Loop *L);
1534
1535   /// Return true if the value of the given SCEV is unchanging in the
1536   /// specified loop.
1537   bool isLoopInvariant(const SCEV *S, const Loop *L);
1538
1539   /// Return true if the given SCEV changes value in a known way in the
1540   /// specified loop.  This property being true implies that the value is
1541   /// variant in the loop AND that we can emit an expression to compute the
1542   /// value of the expression at any particular loop iteration.
1543   bool hasComputableLoopEvolution(const SCEV *S, const Loop *L);
1544
1545   /// Return the "disposition" of the given SCEV with respect to the given
1546   /// block.
1547   BlockDisposition getBlockDisposition(const SCEV *S, const BasicBlock *BB);
1548
1549   /// Return true if elements that makes up the given SCEV dominate the
1550   /// specified basic block.
1551   bool dominates(const SCEV *S, const BasicBlock *BB);
1552
1553   /// Return true if elements that makes up the given SCEV properly dominate
1554   /// the specified basic block.
1555   bool properlyDominates(const SCEV *S, const BasicBlock *BB);
1556
1557   /// Test whether the given SCEV has Op as a direct or indirect operand.
1558   bool hasOperand(const SCEV *S, const SCEV *Op) const;
1559
1560   /// Return the size of an element read or written by Inst.
1561   const SCEV *getElementSize(Instruction *Inst);
1562
1563   /// Compute the array dimensions Sizes from the set of Terms extracted from
1564   /// the memory access function of this SCEVAddRecExpr (second step of
1565   /// delinearization).
1566   void findArrayDimensions(SmallVectorImpl<const SCEV *> &Terms,
1567                            SmallVectorImpl<const SCEV *> &Sizes,
1568                            const SCEV *ElementSize) const;
1569
1570   void print(raw_ostream &OS) const;
1571   void verify() const;
1572   bool invalidate(Function &F, const PreservedAnalyses &PA,
1573                   FunctionAnalysisManager::Invalidator &Inv);
1574
1575   /// Collect parametric terms occurring in step expressions (first step of
1576   /// delinearization).
1577   void collectParametricTerms(const SCEV *Expr,
1578                               SmallVectorImpl<const SCEV *> &Terms);
1579
1580   /// Return in Subscripts the access functions for each dimension in Sizes
1581   /// (third step of delinearization).
1582   void computeAccessFunctions(const SCEV *Expr,
1583                               SmallVectorImpl<const SCEV *> &Subscripts,
1584                               SmallVectorImpl<const SCEV *> &Sizes);
1585
1586   /// Split this SCEVAddRecExpr into two vectors of SCEVs representing the
1587   /// subscripts and sizes of an array access.
1588   ///
1589   /// The delinearization is a 3 step process: the first two steps compute the
1590   /// sizes of each subscript and the third step computes the access functions
1591   /// for the delinearized array:
1592   ///
1593   /// 1. Find the terms in the step functions
1594   /// 2. Compute the array size
1595   /// 3. Compute the access function: divide the SCEV by the array size
1596   ///    starting with the innermost dimensions found in step 2. The Quotient
1597   ///    is the SCEV to be divided in the next step of the recursion. The
1598   ///    Remainder is the subscript of the innermost dimension. Loop over all
1599   ///    array dimensions computed in step 2.
1600   ///
1601   /// To compute a uniform array size for several memory accesses to the same
1602   /// object, one can collect in step 1 all the step terms for all the memory
1603   /// accesses, and compute in step 2 a unique array shape. This guarantees
1604   /// that the array shape will be the same across all memory accesses.
1605   ///
1606   /// FIXME: We could derive the result of steps 1 and 2 from a description of
1607   /// the array shape given in metadata.
1608   ///
1609   /// Example:
1610   ///
1611   /// A[][n][m]
1612   ///
1613   /// for i
1614   ///   for j
1615   ///     for k
1616   ///       A[j+k][2i][5i] =
1617   ///
1618   /// The initial SCEV:
1619   ///
1620   /// A[{{{0,+,2*m+5}_i, +, n*m}_j, +, n*m}_k]
1621   ///
1622   /// 1. Find the different terms in the step functions:
1623   /// -> [2*m, 5, n*m, n*m]
1624   ///
1625   /// 2. Compute the array size: sort and unique them
1626   /// -> [n*m, 2*m, 5]
1627   /// find the GCD of all the terms = 1
1628   /// divide by the GCD and erase constant terms
1629   /// -> [n*m, 2*m]
1630   /// GCD = m
1631   /// divide by GCD -> [n, 2]
1632   /// remove constant terms
1633   /// -> [n]
1634   /// size of the array is A[unknown][n][m]
1635   ///
1636   /// 3. Compute the access function
1637   /// a. Divide {{{0,+,2*m+5}_i, +, n*m}_j, +, n*m}_k by the innermost size m
1638   /// Quotient: {{{0,+,2}_i, +, n}_j, +, n}_k
1639   /// Remainder: {{{0,+,5}_i, +, 0}_j, +, 0}_k
1640   /// The remainder is the subscript of the innermost array dimension: [5i].
1641   ///
1642   /// b. Divide Quotient: {{{0,+,2}_i, +, n}_j, +, n}_k by next outer size n
1643   /// Quotient: {{{0,+,0}_i, +, 1}_j, +, 1}_k
1644   /// Remainder: {{{0,+,2}_i, +, 0}_j, +, 0}_k
1645   /// The Remainder is the subscript of the next array dimension: [2i].
1646   ///
1647   /// The subscript of the outermost dimension is the Quotient: [j+k].
1648   ///
1649   /// Overall, we have: A[][n][m], and the access function: A[j+k][2i][5i].
1650   void delinearize(const SCEV *Expr, SmallVectorImpl<const SCEV *> &Subscripts,
1651                    SmallVectorImpl<const SCEV *> &Sizes,
1652                    const SCEV *ElementSize);
1653
1654   /// Return the DataLayout associated with the module this SCEV instance is
1655   /// operating on.
1656   const DataLayout &getDataLayout() const {
1657     return F.getParent()->getDataLayout();
1658   }
1659
1660   const SCEVPredicate *getEqualPredicate(const SCEVUnknown *LHS,
1661                                          const SCEVConstant *RHS);
1662
1663   const SCEVPredicate *
1664   getWrapPredicate(const SCEVAddRecExpr *AR,
1665                    SCEVWrapPredicate::IncrementWrapFlags AddedFlags);
1666
1667   /// Re-writes the SCEV according to the Predicates in \p A.
1668   const SCEV *rewriteUsingPredicate(const SCEV *S, const Loop *L,
1669                                     SCEVUnionPredicate &A);
1670   /// Tries to convert the \p S expression to an AddRec expression,
1671   /// adding additional predicates to \p Preds as required.
1672   const SCEVAddRecExpr *convertSCEVToAddRecWithPredicates(
1673       const SCEV *S, const Loop *L,
1674       SmallPtrSetImpl<const SCEVPredicate *> &Preds);
1675
1676 private:
1677   /// Compute the backedge taken count knowing the interval difference, the
1678   /// stride and presence of the equality in the comparison.
1679   const SCEV *computeBECount(const SCEV *Delta, const SCEV *Stride,
1680                              bool Equality);
1681
1682   /// Verify if an linear IV with positive stride can overflow when in a
1683   /// less-than comparison, knowing the invariant term of the comparison,
1684   /// the stride and the knowledge of NSW/NUW flags on the recurrence.
1685   bool doesIVOverflowOnLT(const SCEV *RHS, const SCEV *Stride, bool IsSigned,
1686                           bool NoWrap);
1687
1688   /// Verify if an linear IV with negative stride can overflow when in a
1689   /// greater-than comparison, knowing the invariant term of the comparison,
1690   /// the stride and the knowledge of NSW/NUW flags on the recurrence.
1691   bool doesIVOverflowOnGT(const SCEV *RHS, const SCEV *Stride, bool IsSigned,
1692                           bool NoWrap);
1693
1694   /// Get add expr already created or create a new one
1695   const SCEV *getOrCreateAddExpr(SmallVectorImpl<const SCEV *> &Ops,
1696                                  SCEV::NoWrapFlags Flags);
1697
1698 private:
1699   FoldingSet<SCEV> UniqueSCEVs;
1700   FoldingSet<SCEVPredicate> UniquePreds;
1701   BumpPtrAllocator SCEVAllocator;
1702
1703   /// The head of a linked list of all SCEVUnknown values that have been
1704   /// allocated. This is used by releaseMemory to locate them all and call
1705   /// their destructors.
1706   SCEVUnknown *FirstUnknown;
1707 };
1708
1709 /// Analysis pass that exposes the \c ScalarEvolution for a function.
1710 class ScalarEvolutionAnalysis
1711     : public AnalysisInfoMixin<ScalarEvolutionAnalysis> {
1712   friend AnalysisInfoMixin<ScalarEvolutionAnalysis>;
1713   static AnalysisKey Key;
1714
1715 public:
1716   typedef ScalarEvolution Result;
1717
1718   ScalarEvolution run(Function &F, FunctionAnalysisManager &AM);
1719 };
1720
1721 /// Printer pass for the \c ScalarEvolutionAnalysis results.
1722 class ScalarEvolutionPrinterPass
1723     : public PassInfoMixin<ScalarEvolutionPrinterPass> {
1724   raw_ostream &OS;
1725
1726 public:
1727   explicit ScalarEvolutionPrinterPass(raw_ostream &OS) : OS(OS) {}
1728   PreservedAnalyses run(Function &F, FunctionAnalysisManager &AM);
1729 };
1730
1731 class ScalarEvolutionWrapperPass : public FunctionPass {
1732   std::unique_ptr<ScalarEvolution> SE;
1733
1734 public:
1735   static char ID;
1736
1737   ScalarEvolutionWrapperPass();
1738
1739   ScalarEvolution &getSE() { return *SE; }
1740   const ScalarEvolution &getSE() const { return *SE; }
1741
1742   bool runOnFunction(Function &F) override;
1743   void releaseMemory() override;
1744   void getAnalysisUsage(AnalysisUsage &AU) const override;
1745   void print(raw_ostream &OS, const Module * = nullptr) const override;
1746   void verifyAnalysis() const override;
1747 };
1748
1749 /// An interface layer with SCEV used to manage how we see SCEV expressions
1750 /// for values in the context of existing predicates. We can add new
1751 /// predicates, but we cannot remove them.
1752 ///
1753 /// This layer has multiple purposes:
1754 ///   - provides a simple interface for SCEV versioning.
1755 ///   - guarantees that the order of transformations applied on a SCEV
1756 ///     expression for a single Value is consistent across two different
1757 ///     getSCEV calls. This means that, for example, once we've obtained
1758 ///     an AddRec expression for a certain value through expression
1759 ///     rewriting, we will continue to get an AddRec expression for that
1760 ///     Value.
1761 ///   - lowers the number of expression rewrites.
1762 class PredicatedScalarEvolution {
1763 public:
1764   PredicatedScalarEvolution(ScalarEvolution &SE, Loop &L);
1765   const SCEVUnionPredicate &getUnionPredicate() const;
1766
1767   /// Returns the SCEV expression of V, in the context of the current SCEV
1768   /// predicate.  The order of transformations applied on the expression of V
1769   /// returned by ScalarEvolution is guaranteed to be preserved, even when
1770   /// adding new predicates.
1771   const SCEV *getSCEV(Value *V);
1772
1773   /// Get the (predicated) backedge count for the analyzed loop.
1774   const SCEV *getBackedgeTakenCount();
1775
1776   /// Adds a new predicate.
1777   void addPredicate(const SCEVPredicate &Pred);
1778
1779   /// Attempts to produce an AddRecExpr for V by adding additional SCEV
1780   /// predicates. If we can't transform the expression into an AddRecExpr we
1781   /// return nullptr and not add additional SCEV predicates to the current
1782   /// context.
1783   const SCEVAddRecExpr *getAsAddRec(Value *V);
1784
1785   /// Proves that V doesn't overflow by adding SCEV predicate.
1786   void setNoOverflow(Value *V, SCEVWrapPredicate::IncrementWrapFlags Flags);
1787
1788   /// Returns true if we've proved that V doesn't wrap by means of a SCEV
1789   /// predicate.
1790   bool hasNoOverflow(Value *V, SCEVWrapPredicate::IncrementWrapFlags Flags);
1791
1792   /// Returns the ScalarEvolution analysis used.
1793   ScalarEvolution *getSE() const { return &SE; }
1794
1795   /// We need to explicitly define the copy constructor because of FlagsMap.
1796   PredicatedScalarEvolution(const PredicatedScalarEvolution &);
1797
1798   /// Print the SCEV mappings done by the Predicated Scalar Evolution.
1799   /// The printed text is indented by \p Depth.
1800   void print(raw_ostream &OS, unsigned Depth) const;
1801
1802 private:
1803   /// Increments the version number of the predicate.  This needs to be called
1804   /// every time the SCEV predicate changes.
1805   void updateGeneration();
1806
1807   /// Holds a SCEV and the version number of the SCEV predicate used to
1808   /// perform the rewrite of the expression.
1809   typedef std::pair<unsigned, const SCEV *> RewriteEntry;
1810
1811   /// Maps a SCEV to the rewrite result of that SCEV at a certain version
1812   /// number. If this number doesn't match the current Generation, we will
1813   /// need to do a rewrite. To preserve the transformation order of previous
1814   /// rewrites, we will rewrite the previous result instead of the original
1815   /// SCEV.
1816   DenseMap<const SCEV *, RewriteEntry> RewriteMap;
1817
1818   /// Records what NoWrap flags we've added to a Value *.
1819   ValueMap<Value *, SCEVWrapPredicate::IncrementWrapFlags> FlagsMap;
1820
1821   /// The ScalarEvolution analysis.
1822   ScalarEvolution &SE;
1823
1824   /// The analyzed Loop.
1825   const Loop &L;
1826
1827   /// The SCEVPredicate that forms our context. We will rewrite all
1828   /// expressions assuming that this predicate true.
1829   SCEVUnionPredicate Preds;
1830
1831   /// Marks the version of the SCEV predicate used. When rewriting a SCEV
1832   /// expression we mark it with the version of the predicate. We use this to
1833   /// figure out if the predicate has changed from the last rewrite of the
1834   /// SCEV. If so, we need to perform a new rewrite.
1835   unsigned Generation;
1836
1837   /// The backedge taken count.
1838   const SCEV *BackedgeCount;
1839 };
1840 }
1841
1842 #endif