]> CyberLeo.Net >> Repos - FreeBSD/FreeBSD.git/blob - contrib/bmake/dir.c
byacc: Update to 20230201.
[FreeBSD/FreeBSD.git] / contrib / bmake / dir.c
1 /*      $NetBSD: dir.c,v 1.280 2023/01/24 00:24:02 sjg Exp $    */
2
3 /*
4  * Copyright (c) 1988, 1989, 1990 The Regents of the University of California.
5  * All rights reserved.
6  *
7  * This code is derived from software contributed to Berkeley by
8  * Adam de Boor.
9  *
10  * Redistribution and use in source and binary forms, with or without
11  * modification, are permitted provided that the following conditions
12  * are met:
13  * 1. Redistributions of source code must retain the above copyright
14  *    notice, this list of conditions and the following disclaimer.
15  * 2. Redistributions in binary form must reproduce the above copyright
16  *    notice, this list of conditions and the following disclaimer in the
17  *    documentation and/or other materials provided with the distribution.
18  * 3. Neither the name of the University nor the names of its contributors
19  *    may be used to endorse or promote products derived from this software
20  *    without specific prior written permission.
21  *
22  * THIS SOFTWARE IS PROVIDED BY THE REGENTS AND CONTRIBUTORS ``AS IS'' AND
23  * ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE
24  * IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE
25  * ARE DISCLAIMED.  IN NO EVENT SHALL THE REGENTS OR CONTRIBUTORS BE LIABLE
26  * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL
27  * DAMAGES (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS
28  * OR SERVICES; LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION)
29  * HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT
30  * LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY
31  * OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF
32  * SUCH DAMAGE.
33  */
34
35 /*
36  * Copyright (c) 1988, 1989 by Adam de Boor
37  * Copyright (c) 1989 by Berkeley Softworks
38  * All rights reserved.
39  *
40  * This code is derived from software contributed to Berkeley by
41  * Adam de Boor.
42  *
43  * Redistribution and use in source and binary forms, with or without
44  * modification, are permitted provided that the following conditions
45  * are met:
46  * 1. Redistributions of source code must retain the above copyright
47  *    notice, this list of conditions and the following disclaimer.
48  * 2. Redistributions in binary form must reproduce the above copyright
49  *    notice, this list of conditions and the following disclaimer in the
50  *    documentation and/or other materials provided with the distribution.
51  * 3. All advertising materials mentioning features or use of this software
52  *    must display the following acknowledgement:
53  *      This product includes software developed by the University of
54  *      California, Berkeley and its contributors.
55  * 4. Neither the name of the University nor the names of its contributors
56  *    may be used to endorse or promote products derived from this software
57  *    without specific prior written permission.
58  *
59  * THIS SOFTWARE IS PROVIDED BY THE REGENTS AND CONTRIBUTORS ``AS IS'' AND
60  * ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE
61  * IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE
62  * ARE DISCLAIMED.  IN NO EVENT SHALL THE REGENTS OR CONTRIBUTORS BE LIABLE
63  * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL
64  * DAMAGES (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS
65  * OR SERVICES; LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION)
66  * HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT
67  * LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY
68  * OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF
69  * SUCH DAMAGE.
70  */
71
72 /*
73  * Directory searching using wildcards and/or normal names.
74  * Used both for source wildcarding in the makefile and for finding
75  * implicit sources.
76  *
77  * The interface for this module is:
78  *      Dir_Init        Initialize the module.
79  *
80  *      Dir_InitCur     Set the cur CachedDir.
81  *
82  *      Dir_InitDot     Set the dot CachedDir.
83  *
84  *      Dir_End         Clean up the module.
85  *
86  *      Dir_SetPATH     Set ${.PATH} to reflect state of dirSearchPath.
87  *
88  *      Dir_HasWildcards
89  *                      Returns true if the name given it needs to
90  *                      be wildcard-expanded.
91  *
92  *      SearchPath_Expand
93  *                      Expand a filename pattern to find all matching files
94  *                      from the search path.
95  *
96  *      Dir_FindFile    Searches for a file on a given search path.
97  *                      If it exists, the entire path is returned.
98  *                      Otherwise NULL is returned.
99  *
100  *      Dir_FindHereOrAbove
101  *                      Search for a path in the current directory and
102  *                      then all the directories above it in turn until
103  *                      the path is found or we reach the root ("/").
104  *
105  *      Dir_UpdateMTime
106  *                      Update the modification time and path of a node with
107  *                      data from the file corresponding to the node.
108  *
109  *      SearchPath_Add  Add a directory to a search path.
110  *
111  *      SearchPath_ToFlags
112  *                      Given a search path and a command flag, create
113  *                      a string with each of the directories in the path
114  *                      preceded by the command flag and all of them
115  *                      separated by a space.
116  *
117  *      Dir_Destroy     Destroy an element of a search path. Frees up all
118  *                      things that can be freed for the element as long
119  *                      as the element is no longer referenced by any other
120  *                      search path.
121  *
122  *      SearchPath_Clear
123  *                      Resets a search path to the empty list.
124  *
125  * For debugging:
126  *      Dir_PrintDirectories
127  *                      Print stats about the directory cache.
128  */
129
130 #include <sys/types.h>
131 #include <sys/stat.h>
132
133 #include <dirent.h>
134 #include <errno.h>
135
136 #include "make.h"
137 #include "dir.h"
138 #include "job.h"
139
140 /*      "@(#)dir.c      8.2 (Berkeley) 1/2/94"  */
141 MAKE_RCSID("$NetBSD: dir.c,v 1.280 2023/01/24 00:24:02 sjg Exp $");
142
143 /*
144  * A search path is a list of CachedDir structures. A CachedDir has in it the
145  * name of the directory and the names of all the files in the directory.
146  * This is used to cut down on the number of system calls necessary to find
147  * implicit dependents and their like. Since these searches are made before
148  * any actions are taken, we need not worry about the directory changing due
149  * to creation commands. If this hampers the style of some makefiles, they
150  * must be changed.
151  *
152  * All previously-read directories are kept in openDirs, which is checked
153  * first before a directory is opened.
154  *
155  * The need for the caching of whole directories is brought about by the
156  * multi-level transformation code in suff.c, which tends to search for far
157  * more files than regular make does. In the initial implementation, the
158  * amount of time spent performing "stat" calls was truly astronomical.
159  * The problem with caching at the start is, of course, that pmake doesn't
160  * then detect changes to these directories during the course of the make.
161  * Three possibilities suggest themselves:
162  *
163  * 1)   just use stat to test for a file's existence. As mentioned above,
164  *      this is very inefficient due to the number of checks engendered by
165  *      the multi-level transformation code.
166  *
167  * 2)   use readdir() and company to search the directories, keeping them
168  *      open between checks. I have tried this and while it didn't slow down
169  *      the process too much, it could severely affect the amount of
170  *      parallelism available as each directory open would take another file
171  *      descriptor out of play for handling I/O for another job. Given that
172  *      it is only recently (as of 1993 or earlier) that UNIX OS's have taken
173  *      to allowing more than 20 or 32 file descriptors for a process, this
174  *      doesn't seem acceptable to me.
175  *
176  * 3)   record the mtime of the directory in the CachedDir structure and
177  *      verify the directory hasn't changed since the contents were cached.
178  *      This will catch the creation or deletion of files, but not the
179  *      updating of files. However, since it is the creation and deletion
180  *      that is the problem, this could be a good thing to do. Unfortunately,
181  *      if the directory (say ".") were fairly large and changed fairly
182  *      frequently, the constant reloading could seriously degrade
183  *      performance. It might be good in such cases to keep track of the
184  *      number of reloadings and if the number goes over a (small) limit,
185  *      resort to using stat in its place.
186  *
187  * An additional thing to consider is that pmake is used primarily to create
188  * C programs and until recently (as of 1993 or earlier) pcc-based compilers
189  * refused to allow you to specify where the resulting object file should be
190  * placed. This forced all objects to be created in the current directory.
191  * This isn't meant as a full excuse, just an explanation of some of the
192  * reasons for the caching used here.
193  *
194  * One more note: the location of a target's file is only performed on the
195  * downward traversal of the graph and then only for terminal nodes in the
196  * graph. This could be construed as wrong in some cases, but prevents
197  * inadvertent modification of files when the "installed" directory for a
198  * file is provided in the search path.
199  *
200  * Another data structure maintained by this module is an mtime cache used
201  * when the searching of cached directories fails to find a file. In the past,
202  * Dir_FindFile would simply perform an access() call in such a case to
203  * determine if the file could be found using just the name given. When this
204  * hit, however, all that was gained was the knowledge that the file existed.
205  * Given that an access() is essentially a stat() without the copyout() call,
206  * and that the same filesystem overhead would have to be incurred in
207  * Dir_MTime, it made sense to replace the access() with a stat() and record
208  * the mtime in a cache for when Dir_UpdateMTime was actually called.
209  */
210
211
212 /* A cache for the filenames in a directory. */
213 struct CachedDir {
214         /*
215          * Name of directory, either absolute or relative to the current
216          * directory. The name is not normalized in any way, that is, "."
217          * and "./." are different.
218          *
219          * Not sure what happens when .CURDIR is assigned a new value; see
220          * Parse_Var.
221          */
222         char *name;
223
224         /*
225          * The number of SearchPaths that refer to this directory.
226          * Plus the number of global variables that refer to this directory.
227          * References from openDirs do not count though.
228          */
229         int refCount;
230
231         /* The number of times a file in this directory has been found. */
232         int hits;
233
234         /* The names of the directory entries. */
235         HashSet files;
236 };
237
238 typedef List CachedDirList;
239 typedef ListNode CachedDirListNode;
240
241 typedef ListNode SearchPathNode;
242
243 /* A list of cached directories, with fast lookup by directory name. */
244 typedef struct OpenDirs {
245         CachedDirList list;
246         HashTable /* of CachedDirListNode */ table;
247 } OpenDirs;
248
249
250 SearchPath dirSearchPath = { LST_INIT }; /* main search path */
251
252 static OpenDirs openDirs;       /* all cached directories */
253
254 /*
255  * Variables for gathering statistics on the efficiency of the caching
256  * mechanism.
257  */
258 static int hits;                /* Found in directory cache */
259 static int misses;              /* Sad, but not evil misses */
260 static int nearmisses;          /* Found under search path */
261 static int bigmisses;           /* Sought by itself */
262
263 /* The cached contents of ".", the relative current directory. */
264 static CachedDir *dot = NULL;
265 /* The cached contents of the absolute current directory. */
266 static CachedDir *cur = NULL;
267 /* A fake path entry indicating we need to look for '.' last. */
268 static CachedDir *dotLast = NULL;
269
270 /*
271  * Results of doing a last-resort stat in Dir_FindFile -- if we have to go to
272  * the system to find the file, we might as well have its mtime on record.
273  *
274  * XXX: If this is done way early, there's a chance other rules will have
275  * already updated the file, in which case we'll update it again. Generally,
276  * there won't be two rules to update a single file, so this should be ok,
277  * but...
278  */
279 static HashTable mtimes;
280
281 static HashTable lmtimes;       /* same as mtimes but for lstat */
282
283
284 static void OpenDirs_Remove(OpenDirs *, const char *);
285
286
287 static CachedDir *
288 CachedDir_New(const char *name)
289 {
290         CachedDir *dir = bmake_malloc(sizeof *dir);
291
292         dir->name = bmake_strdup(name);
293         dir->refCount = 0;
294         dir->hits = 0;
295         HashSet_Init(&dir->files);
296
297 #ifdef DEBUG_REFCNT
298         DEBUG2(DIR, "CachedDir %p new  for \"%s\"\n", dir, dir->name);
299 #endif
300
301         return dir;
302 }
303
304 static CachedDir *
305 CachedDir_Ref(CachedDir *dir)
306 {
307         dir->refCount++;
308
309 #ifdef DEBUG_REFCNT
310         DEBUG3(DIR, "CachedDir %p ++ %d for \"%s\"\n",
311             dir, dir->refCount, dir->name);
312 #endif
313
314         return dir;
315 }
316
317 static void
318 CachedDir_Unref(CachedDir *dir)
319 {
320         dir->refCount--;
321
322 #ifdef DEBUG_REFCNT
323         DEBUG3(DIR, "CachedDir %p -- %d for \"%s\"\n",
324             dir, dir->refCount, dir->name);
325 #endif
326
327         if (dir->refCount > 0)
328                 return;
329
330 #ifdef DEBUG_REFCNT
331         DEBUG2(DIR, "CachedDir %p free for \"%s\"\n", dir, dir->name);
332 #endif
333
334         OpenDirs_Remove(&openDirs, dir->name);
335
336         free(dir->name);
337         HashSet_Done(&dir->files);
338         free(dir);
339 }
340
341 /* Update the value of the CachedDir variable, updating the reference counts. */
342 static void
343 CachedDir_Assign(CachedDir **var, CachedDir *dir)
344 {
345         CachedDir *prev;
346
347         prev = *var;
348         *var = dir;
349         if (dir != NULL)
350                 CachedDir_Ref(dir);
351         if (prev != NULL)
352                 CachedDir_Unref(prev);
353 }
354
355 static void
356 OpenDirs_Init(OpenDirs *odirs)
357 {
358         Lst_Init(&odirs->list);
359         HashTable_Init(&odirs->table);
360 }
361
362 #ifdef CLEANUP
363 static void
364 OpenDirs_Done(OpenDirs *odirs)
365 {
366         CachedDirListNode *ln = odirs->list.first;
367         DEBUG1(DIR, "OpenDirs_Done: %u entries to remove\n",
368             odirs->table.numEntries);
369         while (ln != NULL) {
370                 CachedDirListNode *next = ln->next;
371                 CachedDir *dir = ln->datum;
372                 DEBUG2(DIR, "OpenDirs_Done: refCount %d for \"%s\"\n",
373                     dir->refCount, dir->name);
374                 CachedDir_Unref(dir);   /* removes the dir from odirs->list */
375                 ln = next;
376         }
377         Lst_Done(&odirs->list);
378         HashTable_Done(&odirs->table);
379 }
380 #endif
381
382 static CachedDir *
383 OpenDirs_Find(OpenDirs *odirs, const char *name)
384 {
385         CachedDirListNode *ln = HashTable_FindValue(&odirs->table, name);
386         return ln != NULL ? ln->datum : NULL;
387 }
388
389 static void
390 OpenDirs_Add(OpenDirs *odirs, CachedDir *cdir)
391 {
392         if (HashTable_FindEntry(&odirs->table, cdir->name) != NULL)
393                 return;
394         Lst_Append(&odirs->list, cdir);
395         HashTable_Set(&odirs->table, cdir->name, odirs->list.last);
396 }
397
398 static void
399 OpenDirs_Remove(OpenDirs *odirs, const char *name)
400 {
401         HashEntry *he = HashTable_FindEntry(&odirs->table, name);
402         CachedDirListNode *ln;
403         if (he == NULL)
404                 return;
405         ln = HashEntry_Get(he);
406         HashTable_DeleteEntry(&odirs->table, he);
407         Lst_Remove(&odirs->list, ln);
408 }
409
410 /*
411  * Returns 0 and the result of stat(2) or lstat(2) in *out_cst,
412  * or -1 on error.
413  */
414 static int
415 cached_stats(const char *pathname, struct cached_stat *out_cst,
416              bool useLstat, bool forceRefresh)
417 {
418         HashTable *tbl = useLstat ? &lmtimes : &mtimes;
419         struct stat sys_st;
420         struct cached_stat *cst;
421         int rc;
422
423         if (pathname == NULL || pathname[0] == '\0')
424                 return -1;      /* This can happen in meta mode. */
425
426         cst = HashTable_FindValue(tbl, pathname);
427         if (cst != NULL && !forceRefresh) {
428                 *out_cst = *cst;
429                 DEBUG2(DIR, "Using cached time %s for %s\n",
430                     Targ_FmtTime(cst->cst_mtime), pathname);
431                 return 0;
432         }
433
434         rc = (useLstat ? lstat : stat)(pathname, &sys_st);
435         if (rc == -1)
436                 return -1;      /* don't cache negative lookups */
437
438         if (sys_st.st_mtime == 0)
439                 sys_st.st_mtime = 1; /* avoid confusion with missing file */
440
441         if (cst == NULL) {
442                 cst = bmake_malloc(sizeof *cst);
443                 HashTable_Set(tbl, pathname, cst);
444         }
445
446         cst->cst_mtime = sys_st.st_mtime;
447         cst->cst_mode = sys_st.st_mode;
448
449         *out_cst = *cst;
450         DEBUG2(DIR, "   Caching %s for %s\n",
451             Targ_FmtTime(sys_st.st_mtime), pathname);
452
453         return 0;
454 }
455
456 int
457 cached_stat(const char *pathname, struct cached_stat *cst)
458 {
459         return cached_stats(pathname, cst, false, false);
460 }
461
462 int
463 cached_lstat(const char *pathname, struct cached_stat *cst)
464 {
465         return cached_stats(pathname, cst, true, false);
466 }
467
468 /* Initialize the directories module. */
469 void
470 Dir_Init(void)
471 {
472         OpenDirs_Init(&openDirs);
473         HashTable_Init(&mtimes);
474         HashTable_Init(&lmtimes);
475         CachedDir_Assign(&dotLast, CachedDir_New(".DOTLAST"));
476 }
477
478 /*
479  * Called by Dir_InitDir and whenever .CURDIR is assigned to.
480  */
481 void
482 Dir_InitCur(const char *newCurdir)
483 {
484         CachedDir *dir;
485
486         if (newCurdir == NULL)
487                 return;
488
489         /*
490          * Our build directory is not the same as our source directory.
491          * Keep this one around too.
492          */
493         dir = SearchPath_Add(NULL, newCurdir);
494         if (dir == NULL)
495                 return;
496
497         CachedDir_Assign(&cur, dir);
498 }
499
500 /*
501  * (Re)initialize "dot" (current/object directory) path hash.
502  * Some directories may be cached.
503  */
504 void
505 Dir_InitDot(void)
506 {
507         CachedDir *dir;
508
509         dir = SearchPath_Add(NULL, ".");
510         if (dir == NULL) {
511                 Error("Cannot open `.' (%s)", strerror(errno));
512                 exit(2);        /* Not 1 so -q can distinguish error */
513         }
514
515         CachedDir_Assign(&dot, dir);
516
517         Dir_SetPATH();          /* initialize */
518 }
519
520 /* Clean up the directories module. */
521 void
522 Dir_End(void)
523 {
524 #ifdef CLEANUP
525         CachedDir_Assign(&cur, NULL);
526         CachedDir_Assign(&dot, NULL);
527         CachedDir_Assign(&dotLast, NULL);
528         SearchPath_Clear(&dirSearchPath);
529         OpenDirs_Done(&openDirs);
530         HashTable_Done(&mtimes);
531         HashTable_Done(&lmtimes);
532 #endif
533 }
534
535 /*
536  * We want ${.PATH} to indicate the order in which we will actually
537  * search, so we rebuild it after any .PATH: target.
538  * This is the simplest way to deal with the effect of .DOTLAST.
539  */
540 void
541 Dir_SetPATH(void)
542 {
543         CachedDirListNode *ln;
544         bool seenDotLast = false;       /* true if we should search '.' last */
545
546         Global_Delete(".PATH");
547
548         if ((ln = dirSearchPath.dirs.first) != NULL) {
549                 CachedDir *dir = ln->datum;
550                 if (dir == dotLast) {
551                         seenDotLast = true;
552                         Global_Append(".PATH", dotLast->name);
553                 }
554         }
555
556         if (!seenDotLast) {
557                 if (dot != NULL)
558                         Global_Append(".PATH", dot->name);
559                 if (cur != NULL)
560                         Global_Append(".PATH", cur->name);
561         }
562
563         for (ln = dirSearchPath.dirs.first; ln != NULL; ln = ln->next) {
564                 CachedDir *dir = ln->datum;
565                 if (dir == dotLast)
566                         continue;
567                 if (dir == dot && seenDotLast)
568                         continue;
569                 Global_Append(".PATH", dir->name);
570         }
571
572         if (seenDotLast) {
573                 if (dot != NULL)
574                         Global_Append(".PATH", dot->name);
575                 if (cur != NULL)
576                         Global_Append(".PATH", cur->name);
577         }
578 }
579
580
581 void
582 Dir_SetSYSPATH(void)
583 {
584         CachedDirListNode *ln;
585
586         Var_ReadOnly(".SYSPATH", false);
587         Global_Delete(".SYSPATH");
588         for (ln = sysIncPath->dirs.first; ln != NULL; ln = ln->next) {
589                 CachedDir *dir = ln->datum;
590                 Global_Append(".SYSPATH", dir->name);
591         }
592         Var_ReadOnly(".SYSPATH", true);
593 }
594
595 /*
596  * See if the given name has any wildcard characters in it and all braces and
597  * brackets are properly balanced.
598  *
599  * XXX: This code is not 100% correct ([^]] fails etc.). I really don't think
600  * that make(1) should be expanding patterns, because then you have to set a
601  * mechanism for escaping the expansion!
602  *
603  * Return true if the word should be expanded, false otherwise.
604  */
605 bool
606 Dir_HasWildcards(const char *name)
607 {
608         const char *p;
609         bool wild = false;
610         int braces = 0, brackets = 0;
611
612         for (p = name; *p != '\0'; p++) {
613                 switch (*p) {
614                 case '{':
615                         braces++;
616                         wild = true;
617                         break;
618                 case '}':
619                         braces--;
620                         break;
621                 case '[':
622                         brackets++;
623                         wild = true;
624                         break;
625                 case ']':
626                         brackets--;
627                         break;
628                 case '?':
629                 case '*':
630                         wild = true;
631                         break;
632                 default:
633                         break;
634                 }
635         }
636         return wild && brackets == 0 && braces == 0;
637 }
638
639 /*
640  * See if any files match the pattern and add their names to the 'expansions'
641  * list if they do.
642  *
643  * This is incomplete -- wildcards are only expanded in the final path
644  * component, but not in directories like src/lib*c/file*.c, but it
645  * will do for now (now being 1993 until at least 2020). To expand these,
646  * delegate the work to the shell, using the '!=' variable assignment
647  * operator, the ':sh' variable modifier or the ':!...!' variable modifier,
648  * such as in ${:!echo src/lib*c/file*.c!}.
649  *
650  * Input:
651  *      pattern         Pattern to look for
652  *      dir             Directory to search
653  *      expansion       Place to store the results
654  */
655 static void
656 DirMatchFiles(const char *pattern, CachedDir *dir, StringList *expansions)
657 {
658         const char *dirName = dir->name;
659         bool isDot = dirName[0] == '.' && dirName[1] == '\0';
660         HashIter hi;
661
662         /*
663          * XXX: Iterating over all hash entries is inefficient.  If the
664          * pattern is a plain string without any wildcards, a direct lookup
665          * is faster.
666          */
667
668         HashIter_InitSet(&hi, &dir->files);
669         while (HashIter_Next(&hi) != NULL) {
670                 const char *base = hi.entry->key;
671
672                 if (!Str_Match(base, pattern))
673                         continue;
674
675                 /*
676                  * Follow the UNIX convention that dot files are only found
677                  * if the pattern begins with a dot. The pattern '.*' does
678                  * not match '.' or '..' since these are not included in the
679                  * directory cache.
680                  *
681                  * This means that the pattern '[a-z.]*' does not find
682                  * '.file', which is consistent with NetBSD sh, NetBSD ksh,
683                  * bash, dash, csh and probably many other shells as well.
684                  */
685                 if (base[0] == '.' && pattern[0] != '.')
686                         continue;
687
688                 {
689                         char *fullName = isDot
690                             ? bmake_strdup(base)
691                             : str_concat3(dirName, "/", base);
692                         Lst_Append(expansions, fullName);
693                 }
694         }
695 }
696
697 /*
698  * Find the next closing brace in the string, taking nested braces into
699  * account.
700  */
701 static const char *
702 closing_brace(const char *p)
703 {
704         int nest = 0;
705         while (*p != '\0') {
706                 if (*p == '}' && nest == 0)
707                         break;
708                 if (*p == '{')
709                         nest++;
710                 if (*p == '}')
711                         nest--;
712                 p++;
713         }
714         return p;
715 }
716
717 /*
718  * Find the next closing brace or comma in the string, taking nested braces
719  * into account.
720  */
721 static const char *
722 separator_comma(const char *p)
723 {
724         int nest = 0;
725         while (*p != '\0') {
726                 if ((*p == '}' || *p == ',') && nest == 0)
727                         break;
728                 if (*p == '{')
729                         nest++;
730                 if (*p == '}')
731                         nest--;
732                 p++;
733         }
734         return p;
735 }
736
737 static bool
738 contains_wildcard(const char *p)
739 {
740         for (; *p != '\0'; p++) {
741                 switch (*p) {
742                 case '*':
743                 case '?':
744                 case '{':
745                 case '[':
746                         return true;
747                 }
748         }
749         return false;
750 }
751
752 static char *
753 concat3(const char *a, size_t a_len, const char *b, size_t b_len,
754         const char *c, size_t c_len)
755 {
756         size_t s_len = a_len + b_len + c_len;
757         char *s = bmake_malloc(s_len + 1);
758         memcpy(s, a, a_len);
759         memcpy(s + a_len, b, b_len);
760         memcpy(s + a_len + b_len, c, c_len);
761         s[s_len] = '\0';
762         return s;
763 }
764
765 /*
766  * Expand curly braces like the C shell. Brace expansion by itself is purely
767  * textual, the expansions are not looked up in the file system. But if an
768  * expanded word contains wildcard characters, it is expanded further,
769  * matching only the actually existing files.
770  *
771  * Example: "{a{b,c}}" expands to "ab" and "ac".
772  * Example: "{a}" expands to "a".
773  * Example: "{a,*.c}" expands to "a" and all "*.c" files that exist.
774  *
775  * Input:
776  *      word            Entire word to expand
777  *      brace           First curly brace in it
778  *      path            Search path to use
779  *      expansions      Place to store the expansions
780  */
781 static void
782 DirExpandCurly(const char *word, const char *brace, SearchPath *path,
783                StringList *expansions)
784 {
785         const char *prefix, *middle, *piece, *middle_end, *suffix;
786         size_t prefix_len, suffix_len;
787
788         /* Split the word into prefix '{' middle '}' suffix. */
789
790         middle = brace + 1;
791         middle_end = closing_brace(middle);
792         if (*middle_end == '\0') {
793                 Error("Unterminated {} clause \"%s\"", middle);
794                 return;
795         }
796
797         prefix = word;
798         prefix_len = (size_t)(brace - prefix);
799         suffix = middle_end + 1;
800         suffix_len = strlen(suffix);
801
802         /* Split the middle into pieces, separated by commas. */
803
804         piece = middle;
805         while (piece < middle_end + 1) {
806                 const char *piece_end = separator_comma(piece);
807                 size_t piece_len = (size_t)(piece_end - piece);
808
809                 char *file = concat3(prefix, prefix_len, piece, piece_len,
810                     suffix, suffix_len);
811
812                 if (contains_wildcard(file)) {
813                         SearchPath_Expand(path, file, expansions);
814                         free(file);
815                 } else {
816                         Lst_Append(expansions, file);
817                 }
818
819                 /* skip over the comma or closing brace */
820                 piece = piece_end + 1;
821         }
822 }
823
824
825 /* Expand the word in each of the directories from the path. */
826 static void
827 DirExpandPath(const char *word, SearchPath *path, StringList *expansions)
828 {
829         SearchPathNode *ln;
830         for (ln = path->dirs.first; ln != NULL; ln = ln->next) {
831                 CachedDir *dir = ln->datum;
832                 DirMatchFiles(word, dir, expansions);
833         }
834 }
835
836 static void
837 PrintExpansions(StringList *expansions)
838 {
839         const char *sep = "";
840         StringListNode *ln;
841         for (ln = expansions->first; ln != NULL; ln = ln->next) {
842                 const char *word = ln->datum;
843                 debug_printf("%s%s", sep, word);
844                 sep = " ";
845         }
846         debug_printf("\n");
847 }
848
849 /*
850  * The wildcard isn't in the first component.
851  * Find all the components up to the one with the wildcard.
852  */
853 static void
854 SearchPath_ExpandMiddle(SearchPath *path, const char *pattern,
855                         const char *wildcardComponent, StringList *expansions)
856 {
857         char *prefix, *dirpath, *end;
858         SearchPath *partPath;
859
860         prefix = bmake_strsedup(pattern, wildcardComponent + 1);
861         /*
862          * XXX: Check the "the directory is added to the path" part.
863          * It is probably surprising that the directory before a
864          * wildcard gets added to the path.
865          */
866         /*
867          * XXX: Only the first match of the prefix in the path is
868          * taken, any others are ignored.  The expectation may be
869          * that the pattern is expanded in the whole path.
870          */
871         dirpath = Dir_FindFile(prefix, path);
872         free(prefix);
873
874         /*
875          * dirpath is null if can't find the leading component
876          *
877          * XXX: Dir_FindFile won't find internal components.  i.e. if the
878          * path contains ../Etc/Object and we're looking for Etc, it won't
879          * be found.  Ah well.  Probably not important.
880          *
881          * XXX: Check whether the above comment is still true.
882          */
883         if (dirpath == NULL)
884                 return;
885
886         end = &dirpath[strlen(dirpath) - 1];
887         /* XXX: What about multiple trailing slashes? */
888         if (*end == '/')
889                 *end = '\0';
890
891         partPath = SearchPath_New();
892         (void)SearchPath_Add(partPath, dirpath);
893         DirExpandPath(wildcardComponent + 1, partPath, expansions);
894         SearchPath_Free(partPath);
895 }
896
897 /*
898  * Expand the given pattern into a list of existing filenames by globbing it,
899  * looking in each directory from the search path.
900  *
901  * Input:
902  *      path            the directories in which to find the files
903  *      pattern         the pattern to expand
904  *      expansions      the list on which to place the results
905  */
906 void
907 SearchPath_Expand(SearchPath *path, const char *pattern, StringList *expansions)
908 {
909         const char *brace, *slash, *wildcard, *wildcardComponent;
910
911         assert(path != NULL);
912         assert(expansions != NULL);
913
914         DEBUG1(DIR, "Expanding \"%s\"... ", pattern);
915
916         brace = strchr(pattern, '{');
917         if (brace != NULL) {
918                 DirExpandCurly(pattern, brace, path, expansions);
919                 goto done;
920         }
921
922         /* At this point, the pattern does not contain '{'. */
923
924         slash = strchr(pattern, '/');
925         if (slash == NULL) {
926                 /* The pattern has no directory component. */
927
928                 /* First the files in dot. */
929                 DirMatchFiles(pattern, dot, expansions);
930                 /* Then the files in every other directory on the path. */
931                 DirExpandPath(pattern, path, expansions);
932                 goto done;
933         }
934
935         /* At this point, the pattern has a directory component. */
936
937         /* Find the first wildcard in the pattern. */
938         for (wildcard = pattern; *wildcard != '\0'; wildcard++)
939                 if (*wildcard == '?' || *wildcard == '[' || *wildcard == '*')
940                         break;
941
942         if (*wildcard == '\0') {
943                 /*
944                  * No directory component and no wildcard at all -- this
945                  * should never happen as in such a simple case there is no
946                  * need to expand anything.
947                  */
948                 DirExpandPath(pattern, path, expansions);
949                 goto done;
950         }
951
952         /* Back up to the start of the component containing the wildcard. */
953         /* XXX: This handles '///' and '/' differently. */
954         wildcardComponent = wildcard;
955         while (wildcardComponent > pattern && *wildcardComponent != '/')
956                 wildcardComponent--;
957
958         if (wildcardComponent == pattern) {
959                 /* The first component contains the wildcard. */
960                 /* Start the search from the local directory */
961                 DirExpandPath(pattern, path, expansions);
962         } else {
963                 SearchPath_ExpandMiddle(path, pattern, wildcardComponent,
964                     expansions);
965         }
966
967 done:
968         if (DEBUG(DIR))
969                 PrintExpansions(expansions);
970 }
971
972 /*
973  * Find if the file with the given name exists in the given path.
974  * Return the freshly allocated path to the file, or NULL.
975  */
976 static char *
977 DirLookup(CachedDir *dir, const char *base)
978 {
979         char *file;             /* the current filename to check */
980
981         DEBUG1(DIR, "   %s ...\n", dir->name);
982
983         if (!HashSet_Contains(&dir->files, base))
984                 return NULL;
985
986         file = str_concat3(dir->name, "/", base);
987         DEBUG1(DIR, "   returning %s\n", file);
988         dir->hits++;
989         hits++;
990         return file;
991 }
992
993
994 /*
995  * Find if the file with the given name exists in the given directory.
996  * Return the freshly allocated path to the file, or NULL.
997  */
998 static char *
999 DirLookupSubdir(CachedDir *dir, const char *name)
1000 {
1001         struct cached_stat cst;
1002         char *file = dir == dot
1003             ? bmake_strdup(name)
1004             : str_concat3(dir->name, "/", name);
1005
1006         DEBUG1(DIR, "checking %s ...\n", file);
1007
1008         if (cached_stat(file, &cst) == 0) {
1009                 nearmisses++;
1010                 return file;
1011         }
1012         free(file);
1013         return NULL;
1014 }
1015
1016 /*
1017  * Find if the file with the given name exists in the given path.
1018  * Return the freshly allocated path to the file, the empty string, or NULL.
1019  * Returning the empty string means that the search should be terminated.
1020  */
1021 static char *
1022 DirLookupAbs(CachedDir *dir, const char *name, const char *cp)
1023 {
1024         const char *dnp;        /* pointer into dir->name */
1025         const char *np;         /* pointer into name */
1026
1027         DEBUG1(DIR, "   %s ...\n", dir->name);
1028
1029         /*
1030          * If the file has a leading path component and that component
1031          * exactly matches the entire name of the current search
1032          * directory, we can attempt another cache lookup. And if we don't
1033          * have a hit, we can safely assume the file does not exist at all.
1034          */
1035         for (dnp = dir->name, np = name;
1036              *dnp != '\0' && *dnp == *np; dnp++, np++)
1037                 continue;
1038         if (*dnp != '\0' || np != cp - 1)
1039                 return NULL;
1040
1041         if (!HashSet_Contains(&dir->files, cp)) {
1042                 DEBUG0(DIR, "   must be here but isn't -- returning\n");
1043                 return bmake_strdup("");        /* to terminate the search */
1044         }
1045
1046         dir->hits++;
1047         hits++;
1048         DEBUG1(DIR, "   returning %s\n", name);
1049         return bmake_strdup(name);
1050 }
1051
1052 /*
1053  * Find the given file in "." or curdir.
1054  * Return the freshly allocated path to the file, or NULL.
1055  */
1056 static char *
1057 DirFindDot(const char *name, const char *base)
1058 {
1059
1060         if (HashSet_Contains(&dot->files, base)) {
1061                 DEBUG0(DIR, "   in '.'\n");
1062                 hits++;
1063                 dot->hits++;
1064                 return bmake_strdup(name);
1065         }
1066
1067         if (cur != NULL && HashSet_Contains(&cur->files, base)) {
1068                 DEBUG1(DIR, "   in ${.CURDIR} = %s\n", cur->name);
1069                 hits++;
1070                 cur->hits++;
1071                 return str_concat3(cur->name, "/", base);
1072         }
1073
1074         return NULL;
1075 }
1076
1077 static bool
1078 FindFileRelative(SearchPath *path, bool seenDotLast,
1079                  const char *name, char **out_file)
1080 {
1081         SearchPathNode *ln;
1082         bool checkedDot = false;
1083         char *file;
1084
1085         DEBUG0(DIR, "   Trying subdirectories...\n");
1086
1087         if (!seenDotLast) {
1088                 if (dot != NULL) {
1089                         checkedDot = true;
1090                         if ((file = DirLookupSubdir(dot, name)) != NULL)
1091                                 goto found;
1092                 }
1093                 if (cur != NULL &&
1094                     (file = DirLookupSubdir(cur, name)) != NULL)
1095                         goto found;
1096         }
1097
1098         for (ln = path->dirs.first; ln != NULL; ln = ln->next) {
1099                 CachedDir *dir = ln->datum;
1100                 if (dir == dotLast)
1101                         continue;
1102                 if (dir == dot) {
1103                         if (checkedDot)
1104                                 continue;
1105                         checkedDot = true;
1106                 }
1107                 if ((file = DirLookupSubdir(dir, name)) != NULL)
1108                         goto found;
1109         }
1110
1111         if (seenDotLast) {
1112                 if (dot != NULL && !checkedDot) {
1113                         checkedDot = true;
1114                         if ((file = DirLookupSubdir(dot, name)) != NULL)
1115                                 goto found;
1116                 }
1117                 if (cur != NULL &&
1118                     (file = DirLookupSubdir(cur, name)) != NULL)
1119                         goto found;
1120         }
1121
1122         if (checkedDot) {
1123                 /*
1124                  * Already checked by the given name, since . was in
1125                  * the path, so no point in proceeding.
1126                  */
1127                 DEBUG0(DIR, "   Checked . already, returning NULL\n");
1128                 file = NULL;
1129                 goto found;
1130         }
1131
1132         return false;
1133
1134 found:
1135         *out_file = file;
1136         return true;
1137 }
1138
1139 static bool
1140 FindFileAbsolute(SearchPath *path, bool seenDotLast,
1141                  const char *name, const char *base, char **out_file)
1142 {
1143         char *file;
1144         SearchPathNode *ln;
1145
1146         /*
1147          * For absolute names, compare directory path prefix against
1148          * the the directory path of each member on the search path
1149          * for an exact match. If we have an exact match on any member
1150          * of the search path, use the cached contents of that member
1151          * to lookup the final file component. If that lookup fails we
1152          * can safely assume that the file does not exist at all.
1153          * This is signified by DirLookupAbs() returning an empty
1154          * string.
1155          */
1156         DEBUG0(DIR, "   Trying exact path matches...\n");
1157
1158         if (!seenDotLast && cur != NULL &&
1159             ((file = DirLookupAbs(cur, name, base)) != NULL))
1160                 goto found;
1161
1162         for (ln = path->dirs.first; ln != NULL; ln = ln->next) {
1163                 CachedDir *dir = ln->datum;
1164                 if (dir == dotLast)
1165                         continue;
1166                 if ((file = DirLookupAbs(dir, name, base)) != NULL)
1167                         goto found;
1168         }
1169
1170         if (seenDotLast && cur != NULL &&
1171             ((file = DirLookupAbs(cur, name, base)) != NULL))
1172                 goto found;
1173
1174         return false;
1175
1176 found:
1177         if (file[0] == '\0') {
1178                 free(file);
1179                 file = NULL;
1180         }
1181         *out_file = file;
1182         return true;
1183 }
1184
1185 /*
1186  * Find the file with the given name along the given search path.
1187  *
1188  * If the file is found in a directory that is not on the path
1189  * already (either 'name' is absolute or it is a relative path
1190  * [ dir1/.../dirn/file ] which exists below one of the directories
1191  * already on the search path), its directory is added to the end
1192  * of the path, on the assumption that there will be more files in
1193  * that directory later on. Sometimes this is true. Sometimes not.
1194  *
1195  * Input:
1196  *      name            the file to find
1197  *      path            the directories to search, or NULL
1198  *
1199  * Results:
1200  *      The freshly allocated path to the file, or NULL.
1201  */
1202 char *
1203 Dir_FindFile(const char *name, SearchPath *path)
1204 {
1205         char *file;             /* the current filename to check */
1206         bool seenDotLast = false; /* true if we should search dot last */
1207         struct cached_stat cst; /* Buffer for stat, if necessary */
1208         const char *trailing_dot = ".";
1209         const char *base = str_basename(name);
1210
1211         DEBUG1(DIR, "Searching for %s ...", name);
1212
1213         if (path == NULL) {
1214                 DEBUG0(DIR, "couldn't open path, file not found\n");
1215                 misses++;
1216                 return NULL;
1217         }
1218
1219         if (path->dirs.first != NULL) {
1220                 CachedDir *dir = path->dirs.first->datum;
1221                 if (dir == dotLast) {
1222                         seenDotLast = true;
1223                         DEBUG0(DIR, "[dot last]...");
1224                 }
1225         }
1226         DEBUG0(DIR, "\n");
1227
1228         /*
1229          * If there's no leading directory components or if the leading
1230          * directory component is exactly `./', consult the cached contents
1231          * of each of the directories on the search path.
1232          */
1233         if (base == name || (base - name == 2 && *name == '.')) {
1234                 SearchPathNode *ln;
1235
1236                 /*
1237                  * We look through all the directories on the path seeking one
1238                  * which contains the final component of the given name.  If
1239                  * such a file is found, we concatenate the directory name
1240                  * and the final component and return the resulting string.
1241                  * If we don't find any such thing, we go on to phase two.
1242                  *
1243                  * No matter what, we always look for the file in the current
1244                  * directory before anywhere else (unless we found the magic
1245                  * DOTLAST path, in which case we search it last) and we *do
1246                  * not* add the ./ to it if it exists.
1247                  * This is so there are no conflicts between what the user
1248                  * specifies (fish.c) and what pmake finds (./fish.c).
1249                  */
1250                 if (!seenDotLast && (file = DirFindDot(name, base)) != NULL)
1251                         return file;
1252
1253                 for (ln = path->dirs.first; ln != NULL; ln = ln->next) {
1254                         CachedDir *dir = ln->datum;
1255                         if (dir == dotLast)
1256                                 continue;
1257                         if ((file = DirLookup(dir, base)) != NULL)
1258                                 return file;
1259                 }
1260
1261                 if (seenDotLast && (file = DirFindDot(name, base)) != NULL)
1262                         return file;
1263         }
1264
1265         /*
1266          * We didn't find the file on any directory in the search path.
1267          * If the name doesn't contain a slash, that means it doesn't exist.
1268          * If it *does* contain a slash, however, there is still hope: it
1269          * could be in a subdirectory of one of the members of the search
1270          * path. (eg. /usr/include and sys/types.h. The above search would
1271          * fail to turn up types.h in /usr/include, but it *is* in
1272          * /usr/include/sys/types.h).
1273          * [ This no longer applies: If we find such a file, we assume there
1274          * will be more (what else can we assume?) and add all but the last
1275          * component of the resulting name onto the search path (at the
1276          * end).]
1277          * This phase is only performed if the file is *not* absolute.
1278          */
1279         if (base == name) {
1280                 DEBUG0(DIR, "   failed.\n");
1281                 misses++;
1282                 return NULL;
1283         }
1284
1285         if (*base == '\0') {
1286                 /* we were given a trailing "/" */
1287                 base = trailing_dot;
1288         }
1289
1290         if (name[0] != '/') {
1291                 if (FindFileRelative(path, seenDotLast, name, &file))
1292                         return file;
1293         } else {
1294                 if (FindFileAbsolute(path, seenDotLast, name, base, &file))
1295                         return file;
1296         }
1297
1298         /*
1299          * Didn't find it that way, either. Sigh. Phase 3. Add its directory
1300          * onto the search path in any case, just in case, then look for the
1301          * thing in the hash table. If we find it, grand. We return a new
1302          * copy of the name. Otherwise we sadly return a NULL pointer. Sigh.
1303          * Note that if the directory holding the file doesn't exist, this
1304          * will do an extra search of the final directory on the path. Unless
1305          * something weird happens, this search won't succeed and life will
1306          * be groovy.
1307          *
1308          * Sigh. We cannot add the directory onto the search path because
1309          * of this amusing case:
1310          * $(INSTALLDIR)/$(FILE): $(FILE)
1311          *
1312          * $(FILE) exists in $(INSTALLDIR) but not in the current one.
1313          * When searching for $(FILE), we will find it in $(INSTALLDIR)
1314          * b/c we added it here. This is not good...
1315          */
1316 #if 0
1317         {
1318                 CachedDir *dir;
1319                 char *prefix;
1320
1321                 if (base == trailing_dot) {
1322                         base = strrchr(name, '/');
1323                         base++;
1324                 }
1325                 prefix = bmake_strsedup(name, base - 1);
1326                 (void)SearchPath_Add(path, prefix);
1327                 free(prefix);
1328
1329                 bigmisses++;
1330                 if (path->last == NULL)
1331                         return NULL;
1332
1333                 dir = path->last->datum;
1334                 if (HashSet_Contains(&dir->files, base))
1335                         return bmake_strdup(name);
1336                 return NULL;
1337         }
1338 #else
1339         DEBUG1(DIR, "   Looking for \"%s\" ...\n", name);
1340
1341         bigmisses++;
1342         if (cached_stat(name, &cst) == 0) {
1343                 return bmake_strdup(name);
1344         }
1345
1346         DEBUG0(DIR, "   failed. Returning NULL\n");
1347         return NULL;
1348 #endif
1349 }
1350
1351
1352 /*
1353  * Search for a path starting at a given directory and then working our way
1354  * up towards the root.
1355  *
1356  * Input:
1357  *      here            starting directory
1358  *      search_path     the relative path we are looking for
1359  *
1360  * Results:
1361  *      The found path, or NULL.
1362  */
1363 char *
1364 Dir_FindHereOrAbove(const char *here, const char *search_path)
1365 {
1366         struct cached_stat cst;
1367         char *dirbase, *dirbase_end;
1368         char *try, *try_end;
1369
1370         /* copy out our starting point */
1371         dirbase = bmake_strdup(here);
1372         dirbase_end = dirbase + strlen(dirbase);
1373
1374         /* loop until we determine a result */
1375         for (;;) {
1376
1377                 /* try and stat(2) it ... */
1378                 try = str_concat3(dirbase, "/", search_path);
1379                 if (cached_stat(try, &cst) != -1) {
1380                         /*
1381                          * success!  if we found a file, chop off
1382                          * the filename so we return a directory.
1383                          */
1384                         if ((cst.cst_mode & S_IFMT) != S_IFDIR) {
1385                                 try_end = try + strlen(try);
1386                                 while (try_end > try && *try_end != '/')
1387                                         try_end--;
1388                                 if (try_end > try)
1389                                         *try_end = '\0';        /* chop! */
1390                         }
1391
1392                         free(dirbase);
1393                         return try;
1394                 }
1395                 free(try);
1396
1397                 /*
1398                  * nope, we didn't find it.  if we used up dirbase we've
1399                  * reached the root and failed.
1400                  */
1401                 if (dirbase_end == dirbase)
1402                         break;  /* failed! */
1403
1404                 /*
1405                  * truncate dirbase from the end to move up a dir
1406                  */
1407                 while (dirbase_end > dirbase && *dirbase_end != '/')
1408                         dirbase_end--;
1409                 *dirbase_end = '\0';    /* chop! */
1410         }
1411
1412         free(dirbase);
1413         return NULL;
1414 }
1415
1416 /*
1417  * This is an implied source, and it may have moved,
1418  * see if we can find it via the current .PATH
1419  */
1420 static char *
1421 ResolveMovedDepends(GNode *gn)
1422 {
1423         char *fullName;
1424
1425         const char *base = str_basename(gn->name);
1426         if (base == gn->name)
1427                 return NULL;
1428
1429         fullName = Dir_FindFile(base, Suff_FindPath(gn));
1430         if (fullName == NULL)
1431                 return NULL;
1432
1433         /*
1434          * Put the found file in gn->path so that we give that to the compiler.
1435          */
1436         /*
1437          * XXX: Better just reset gn->path to NULL; updating it is already done
1438          * by Dir_UpdateMTime.
1439          */
1440         gn->path = bmake_strdup(fullName);
1441         if (!Job_RunTarget(".STALE", gn->fname))
1442                 fprintf(stdout, /* XXX: Why stdout? */
1443                     "%s: %s, %u: ignoring stale %s for %s, found %s\n",
1444                     progname, gn->fname, gn->lineno,
1445                     makeDependfile, gn->name, fullName);
1446
1447         return fullName;
1448 }
1449
1450 static char *
1451 ResolveFullName(GNode *gn)
1452 {
1453         char *fullName;
1454
1455         fullName = gn->path;
1456         if (fullName == NULL && !(gn->type & OP_NOPATH)) {
1457
1458                 fullName = Dir_FindFile(gn->name, Suff_FindPath(gn));
1459
1460                 if (fullName == NULL && gn->flags.fromDepend &&
1461                     !Lst_IsEmpty(&gn->implicitParents))
1462                         fullName = ResolveMovedDepends(gn);
1463
1464                 DEBUG2(DIR, "Found '%s' as '%s'\n",
1465                     gn->name, fullName != NULL ? fullName : "(not found)");
1466         }
1467
1468         if (fullName == NULL)
1469                 fullName = bmake_strdup(gn->name);
1470
1471         /* XXX: Is every piece of memory freed as it should? */
1472
1473         return fullName;
1474 }
1475
1476 /*
1477  * Search gn along dirSearchPath and store its modification time in gn->mtime.
1478  * If no file is found, store 0 instead.
1479  *
1480  * The found file is stored in gn->path, unless the node already had a path.
1481  */
1482 void
1483 Dir_UpdateMTime(GNode *gn, bool forceRefresh)
1484 {
1485         char *fullName;
1486         struct cached_stat cst;
1487
1488         if (gn->type & OP_ARCHV) {
1489                 Arch_UpdateMTime(gn);
1490                 return;
1491         }
1492
1493         if (gn->type & OP_PHONY) {
1494                 gn->mtime = 0;
1495                 return;
1496         }
1497
1498         fullName = ResolveFullName(gn);
1499
1500         if (cached_stats(fullName, &cst, false, forceRefresh) < 0) {
1501                 if (gn->type & OP_MEMBER) {
1502                         if (fullName != gn->path)
1503                                 free(fullName);
1504                         Arch_UpdateMemberMTime(gn);
1505                         return;
1506                 }
1507
1508                 cst.cst_mtime = 0;
1509         }
1510
1511         if (fullName != NULL && gn->path == NULL)
1512                 gn->path = fullName;
1513         /* XXX: else free(fullName)? */
1514
1515         gn->mtime = cst.cst_mtime;
1516 }
1517
1518 /*
1519  * Read the directory and add it to the cache in openDirs.
1520  * If a path is given, add the directory to that path as well.
1521  */
1522 static CachedDir *
1523 CacheNewDir(const char *name, SearchPath *path)
1524 {
1525         CachedDir *dir = NULL;
1526         DIR *d;
1527         struct dirent *dp;
1528
1529         if ((d = opendir(name)) == NULL) {
1530                 DEBUG1(DIR, "Caching %s ... not found\n", name);
1531                 return dir;
1532         }
1533
1534         DEBUG1(DIR, "Caching %s ...\n", name);
1535
1536         dir = CachedDir_New(name);
1537
1538         while ((dp = readdir(d)) != NULL) {
1539
1540 #if defined(sun) && defined(d_ino) /* d_ino is a sunos4 #define for d_fileno */
1541                 /*
1542                  * The sun directory library doesn't check for a 0 inode
1543                  * (0-inode slots just take up space), so we have to do
1544                  * it ourselves.
1545                  */
1546                 if (dp->d_fileno == 0)
1547                         continue;
1548 #endif /* sun && d_ino */
1549
1550                 (void)HashSet_Add(&dir->files, dp->d_name);
1551         }
1552         (void)closedir(d);
1553
1554         OpenDirs_Add(&openDirs, dir);
1555         if (path != NULL)
1556                 Lst_Append(&path->dirs, CachedDir_Ref(dir));
1557
1558         DEBUG1(DIR, "Caching %s done\n", name);
1559         return dir;
1560 }
1561
1562 /*
1563  * Read the list of filenames in the directory and store the result
1564  * in openDirs.
1565  *
1566  * If a path is given, append the directory to that path.
1567  *
1568  * Input:
1569  *      path            The path to which the directory should be
1570  *                      added, or NULL to only add the directory to openDirs
1571  *      name            The name of the directory to add.
1572  *                      The name is not normalized in any way.
1573  * Output:
1574  *      result          If no path is given and the directory exists, the
1575  *                      returned CachedDir has a reference count of 0.  It
1576  *                      must either be assigned to a variable using
1577  *                      CachedDir_Assign or be appended to a SearchPath using
1578  *                      Lst_Append and CachedDir_Ref.
1579  */
1580 CachedDir *
1581 SearchPath_Add(SearchPath *path, const char *name)
1582 {
1583
1584         if (path != NULL && strcmp(name, ".DOTLAST") == 0) {
1585                 SearchPathNode *ln;
1586
1587                 /* XXX: Linear search gets slow with thousands of entries. */
1588                 for (ln = path->dirs.first; ln != NULL; ln = ln->next) {
1589                         CachedDir *pathDir = ln->datum;
1590                         if (strcmp(pathDir->name, name) == 0)
1591                                 return pathDir;
1592                 }
1593
1594                 Lst_Prepend(&path->dirs, CachedDir_Ref(dotLast));
1595         }
1596
1597         if (path != NULL) {
1598                 /* XXX: Why is OpenDirs only checked if path != NULL? */
1599                 CachedDir *dir = OpenDirs_Find(&openDirs, name);
1600                 if (dir != NULL) {
1601                         if (Lst_FindDatum(&path->dirs, dir) == NULL)
1602                                 Lst_Append(&path->dirs, CachedDir_Ref(dir));
1603                         return dir;
1604                 }
1605         }
1606
1607         return CacheNewDir(name, path);
1608 }
1609
1610 /*
1611  * Return a copy of dirSearchPath, incrementing the reference counts for
1612  * the contained directories.
1613  */
1614 SearchPath *
1615 Dir_CopyDirSearchPath(void)
1616 {
1617         SearchPath *path = SearchPath_New();
1618         SearchPathNode *ln;
1619         for (ln = dirSearchPath.dirs.first; ln != NULL; ln = ln->next) {
1620                 CachedDir *dir = ln->datum;
1621                 Lst_Append(&path->dirs, CachedDir_Ref(dir));
1622         }
1623         return path;
1624 }
1625
1626 /*
1627  * Make a string by taking all the directories in the given search path and
1628  * preceding them by the given flag. Used by the suffix module to create
1629  * variables for compilers based on suffix search paths.
1630  *
1631  * Input:
1632  *      flag            flag which should precede each directory
1633  *      path            list of directories
1634  *
1635  * Results:
1636  *      The string mentioned above. Note that there is no space between the
1637  *      given flag and each directory. The empty string is returned if things
1638  *      don't go well.
1639  */
1640 char *
1641 SearchPath_ToFlags(SearchPath *path, const char *flag)
1642 {
1643         Buffer buf;
1644         SearchPathNode *ln;
1645
1646         Buf_Init(&buf);
1647
1648         if (path != NULL) {
1649                 for (ln = path->dirs.first; ln != NULL; ln = ln->next) {
1650                         CachedDir *dir = ln->datum;
1651                         Buf_AddStr(&buf, " ");
1652                         Buf_AddStr(&buf, flag);
1653                         Buf_AddStr(&buf, dir->name);
1654                 }
1655         }
1656
1657         return Buf_DoneData(&buf);
1658 }
1659
1660 /* Free the search path and all directories mentioned in it. */
1661 void
1662 SearchPath_Free(SearchPath *path)
1663 {
1664         SearchPathNode *ln;
1665
1666         for (ln = path->dirs.first; ln != NULL; ln = ln->next) {
1667                 CachedDir *dir = ln->datum;
1668                 CachedDir_Unref(dir);
1669         }
1670         Lst_Done(&path->dirs);
1671         free(path);
1672 }
1673
1674 /*
1675  * Clear out all elements from the given search path.
1676  * The path is set to the empty list but is not destroyed.
1677  */
1678 void
1679 SearchPath_Clear(SearchPath *path)
1680 {
1681         while (!Lst_IsEmpty(&path->dirs)) {
1682                 CachedDir *dir = Lst_Dequeue(&path->dirs);
1683                 CachedDir_Unref(dir);
1684         }
1685 }
1686
1687
1688 /*
1689  * Concatenate two paths, adding the second to the end of the first,
1690  * skipping duplicates.
1691  */
1692 void
1693 SearchPath_AddAll(SearchPath *dst, SearchPath *src)
1694 {
1695         SearchPathNode *ln;
1696
1697         for (ln = src->dirs.first; ln != NULL; ln = ln->next) {
1698                 CachedDir *dir = ln->datum;
1699                 if (Lst_FindDatum(&dst->dirs, dir) == NULL)
1700                         Lst_Append(&dst->dirs, CachedDir_Ref(dir));
1701         }
1702 }
1703
1704 static int
1705 percentage(int num, int den)
1706 {
1707         return den != 0 ? num * 100 / den : 0;
1708 }
1709
1710 /********** DEBUG INFO **********/
1711 void
1712 Dir_PrintDirectories(void)
1713 {
1714         CachedDirListNode *ln;
1715
1716         debug_printf("#*** Directory Cache:\n");
1717         debug_printf(
1718             "# Stats: %d hits %d misses %d near misses %d losers (%d%%)\n",
1719             hits, misses, nearmisses, bigmisses,
1720             percentage(hits, hits + bigmisses + nearmisses));
1721         debug_printf("#  refs  hits  directory\n");
1722
1723         for (ln = openDirs.list.first; ln != NULL; ln = ln->next) {
1724                 CachedDir *dir = ln->datum;
1725                 debug_printf("#  %4d  %4d  %s\n",
1726                     dir->refCount, dir->hits, dir->name);
1727         }
1728 }
1729
1730 void
1731 SearchPath_Print(const SearchPath *path)
1732 {
1733         SearchPathNode *ln;
1734
1735         for (ln = path->dirs.first; ln != NULL; ln = ln->next) {
1736                 const CachedDir *dir = ln->datum;
1737                 debug_printf("%s ", dir->name);
1738         }
1739 }