]> CyberLeo.Net >> Repos - FreeBSD/FreeBSD.git/blob - sys/kern/link_elf.c
MFC r366500:
[FreeBSD/FreeBSD.git] / sys / kern / link_elf.c
1 /*-
2  * SPDX-License-Identifier: BSD-2-Clause-FreeBSD
3  *
4  * Copyright (c) 1998-2000 Doug Rabson
5  * All rights reserved.
6  *
7  * Redistribution and use in source and binary forms, with or without
8  * modification, are permitted provided that the following conditions
9  * are met:
10  * 1. Redistributions of source code must retain the above copyright
11  *    notice, this list of conditions and the following disclaimer.
12  * 2. Redistributions in binary form must reproduce the above copyright
13  *    notice, this list of conditions and the following disclaimer in the
14  *    documentation and/or other materials provided with the distribution.
15  *
16  * THIS SOFTWARE IS PROVIDED BY THE AUTHOR AND CONTRIBUTORS ``AS IS'' AND
17  * ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE
18  * IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE
19  * ARE DISCLAIMED.  IN NO EVENT SHALL THE AUTHOR OR CONTRIBUTORS BE LIABLE
20  * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL
21  * DAMAGES (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS
22  * OR SERVICES; LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION)
23  * HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT
24  * LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY
25  * OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF
26  * SUCH DAMAGE.
27  */
28
29 #include <sys/cdefs.h>
30 __FBSDID("$FreeBSD$");
31
32 #include "opt_ddb.h"
33 #include "opt_gdb.h"
34
35 #include <sys/param.h>
36 #include <sys/systm.h>
37 #ifdef GPROF
38 #include <sys/gmon.h>
39 #endif
40 #include <sys/kernel.h>
41 #include <sys/lock.h>
42 #include <sys/malloc.h>
43 #ifdef SPARSE_MAPPING
44 #include <sys/mman.h>
45 #endif
46 #include <sys/mutex.h>
47 #include <sys/mount.h>
48 #include <sys/pcpu.h>
49 #include <sys/proc.h>
50 #include <sys/namei.h>
51 #include <sys/fcntl.h>
52 #include <sys/vnode.h>
53 #include <sys/linker.h>
54
55 #include <machine/elf.h>
56
57 #include <net/vnet.h>
58
59 #include <security/mac/mac_framework.h>
60
61 #include <vm/vm.h>
62 #include <vm/vm_param.h>
63 #ifdef SPARSE_MAPPING
64 #include <vm/vm_object.h>
65 #include <vm/vm_kern.h>
66 #include <vm/vm_extern.h>
67 #endif
68 #include <vm/pmap.h>
69 #include <vm/vm_map.h>
70
71 #include <sys/link_elf.h>
72
73 #ifdef DDB_CTF
74 #include <sys/zlib.h>
75 #endif
76
77 #include "linker_if.h"
78
79 #define MAXSEGS 4
80
81 typedef struct elf_file {
82         struct linker_file lf;          /* Common fields */
83         int             preloaded;      /* Was file pre-loaded */
84         caddr_t         address;        /* Relocation address */
85 #ifdef SPARSE_MAPPING
86         vm_object_t     object;         /* VM object to hold file pages */
87 #endif
88         Elf_Dyn         *dynamic;       /* Symbol table etc. */
89         Elf_Hashelt     nbuckets;       /* DT_HASH info */
90         Elf_Hashelt     nchains;
91         const Elf_Hashelt *buckets;
92         const Elf_Hashelt *chains;
93         caddr_t         hash;
94         caddr_t         strtab;         /* DT_STRTAB */
95         int             strsz;          /* DT_STRSZ */
96         const Elf_Sym   *symtab;                /* DT_SYMTAB */
97         Elf_Addr        *got;           /* DT_PLTGOT */
98         const Elf_Rel   *pltrel;        /* DT_JMPREL */
99         int             pltrelsize;     /* DT_PLTRELSZ */
100         const Elf_Rela  *pltrela;       /* DT_JMPREL */
101         int             pltrelasize;    /* DT_PLTRELSZ */
102         const Elf_Rel   *rel;           /* DT_REL */
103         int             relsize;        /* DT_RELSZ */
104         const Elf_Rela  *rela;          /* DT_RELA */
105         int             relasize;       /* DT_RELASZ */
106         caddr_t         modptr;
107         const Elf_Sym   *ddbsymtab;     /* The symbol table we are using */
108         long            ddbsymcnt;      /* Number of symbols */
109         caddr_t         ddbstrtab;      /* String table */
110         long            ddbstrcnt;      /* number of bytes in string table */
111         caddr_t         symbase;        /* malloc'ed symbold base */
112         caddr_t         strbase;        /* malloc'ed string base */
113         caddr_t         ctftab;         /* CTF table */
114         long            ctfcnt;         /* number of bytes in CTF table */
115         caddr_t         ctfoff;         /* CTF offset table */
116         caddr_t         typoff;         /* Type offset table */
117         long            typlen;         /* Number of type entries. */
118         Elf_Addr        pcpu_start;     /* Pre-relocation pcpu set start. */
119         Elf_Addr        pcpu_stop;      /* Pre-relocation pcpu set stop. */
120         Elf_Addr        pcpu_base;      /* Relocated pcpu set address. */
121 #ifdef VIMAGE
122         Elf_Addr        vnet_start;     /* Pre-relocation vnet set start. */
123         Elf_Addr        vnet_stop;      /* Pre-relocation vnet set stop. */
124         Elf_Addr        vnet_base;      /* Relocated vnet set address. */
125 #endif
126 #ifdef GDB
127         struct link_map gdb;            /* hooks for gdb */
128 #endif
129 } *elf_file_t;
130
131 struct elf_set {
132         Elf_Addr        es_start;
133         Elf_Addr        es_stop;
134         Elf_Addr        es_base;
135         TAILQ_ENTRY(elf_set)    es_link;
136 };
137
138 TAILQ_HEAD(elf_set_head, elf_set);
139
140 #include <kern/kern_ctf.c>
141
142 static int      link_elf_link_common_finish(linker_file_t);
143 static int      link_elf_link_preload(linker_class_t cls,
144                                       const char *, linker_file_t *);
145 static int      link_elf_link_preload_finish(linker_file_t);
146 static int      link_elf_load_file(linker_class_t, const char *,
147                     linker_file_t *);
148 static int      link_elf_lookup_symbol(linker_file_t, const char *,
149                     c_linker_sym_t *);
150 static int      link_elf_symbol_values(linker_file_t, c_linker_sym_t,
151                     linker_symval_t *);
152 static int      link_elf_search_symbol(linker_file_t, caddr_t,
153                     c_linker_sym_t *, long *);
154
155 static void     link_elf_unload_file(linker_file_t);
156 static void     link_elf_unload_preload(linker_file_t);
157 static int      link_elf_lookup_set(linker_file_t, const char *,
158                     void ***, void ***, int *);
159 static int      link_elf_each_function_name(linker_file_t,
160                     int (*)(const char *, void *), void *);
161 static int      link_elf_each_function_nameval(linker_file_t,
162                     linker_function_nameval_callback_t, void *);
163 static void     link_elf_reloc_local(linker_file_t);
164 static long     link_elf_symtab_get(linker_file_t, const Elf_Sym **);
165 static long     link_elf_strtab_get(linker_file_t, caddr_t *);
166 static int      elf_lookup(linker_file_t, Elf_Size, int, Elf_Addr *);
167
168 static kobj_method_t link_elf_methods[] = {
169         KOBJMETHOD(linker_lookup_symbol,        link_elf_lookup_symbol),
170         KOBJMETHOD(linker_symbol_values,        link_elf_symbol_values),
171         KOBJMETHOD(linker_search_symbol,        link_elf_search_symbol),
172         KOBJMETHOD(linker_unload,               link_elf_unload_file),
173         KOBJMETHOD(linker_load_file,            link_elf_load_file),
174         KOBJMETHOD(linker_link_preload,         link_elf_link_preload),
175         KOBJMETHOD(linker_link_preload_finish,  link_elf_link_preload_finish),
176         KOBJMETHOD(linker_lookup_set,           link_elf_lookup_set),
177         KOBJMETHOD(linker_each_function_name,   link_elf_each_function_name),
178         KOBJMETHOD(linker_each_function_nameval, link_elf_each_function_nameval),
179         KOBJMETHOD(linker_ctf_get,              link_elf_ctf_get),
180         KOBJMETHOD(linker_symtab_get,           link_elf_symtab_get),
181         KOBJMETHOD(linker_strtab_get,           link_elf_strtab_get),
182         KOBJMETHOD_END
183 };
184
185 static struct linker_class link_elf_class = {
186 #if ELF_TARG_CLASS == ELFCLASS32
187         "elf32",
188 #else
189         "elf64",
190 #endif
191         link_elf_methods, sizeof(struct elf_file)
192 };
193
194 typedef int (*elf_reloc_fn)(linker_file_t lf, Elf_Addr relocbase,
195     const void *data, int type, elf_lookup_fn lookup);
196
197 static int      parse_dynamic(elf_file_t);
198 static int      relocate_file(elf_file_t);
199 static int      relocate_file1(elf_file_t ef, elf_lookup_fn lookup,
200                     elf_reloc_fn reloc, bool ifuncs);
201 static int      link_elf_preload_parse_symbols(elf_file_t);
202
203 static struct elf_set_head set_pcpu_list;
204 #ifdef VIMAGE
205 static struct elf_set_head set_vnet_list;
206 #endif
207
208 static void
209 elf_set_add(struct elf_set_head *list, Elf_Addr start, Elf_Addr stop, Elf_Addr base)
210 {
211         struct elf_set *set, *iter;
212
213         set = malloc(sizeof(*set), M_LINKER, M_WAITOK);
214         set->es_start = start;
215         set->es_stop = stop;
216         set->es_base = base;
217
218         TAILQ_FOREACH(iter, list, es_link) {
219
220                 KASSERT((set->es_start < iter->es_start && set->es_stop < iter->es_stop) ||
221                     (set->es_start > iter->es_start && set->es_stop > iter->es_stop),
222                     ("linker sets intersection: to insert: 0x%jx-0x%jx; inserted: 0x%jx-0x%jx",
223                     (uintmax_t)set->es_start, (uintmax_t)set->es_stop,
224                     (uintmax_t)iter->es_start, (uintmax_t)iter->es_stop));
225
226                 if (iter->es_start > set->es_start) {
227                         TAILQ_INSERT_BEFORE(iter, set, es_link);
228                         break;
229                 }
230         }
231
232         if (iter == NULL)
233                 TAILQ_INSERT_TAIL(list, set, es_link);
234 }
235
236 static int
237 elf_set_find(struct elf_set_head *list, Elf_Addr addr, Elf_Addr *start, Elf_Addr *base)
238 {
239         struct elf_set *set;
240
241         TAILQ_FOREACH(set, list, es_link) {
242                 if (addr < set->es_start)
243                         return (0);
244                 if (addr < set->es_stop) {
245                         *start = set->es_start;
246                         *base = set->es_base;
247                         return (1);
248                 }
249         }
250
251         return (0);
252 }
253
254 static void
255 elf_set_delete(struct elf_set_head *list, Elf_Addr start)
256 {
257         struct elf_set *set;
258
259         TAILQ_FOREACH(set, list, es_link) {
260                 if (start < set->es_start)
261                         break;
262                 if (start == set->es_start) {
263                         TAILQ_REMOVE(list, set, es_link);
264                         free(set, M_LINKER);
265                         return;
266                 }
267         }
268         KASSERT(0, ("deleting unknown linker set (start = 0x%jx)",
269             (uintmax_t)start));
270 }
271
272 #ifdef GDB
273 static void     r_debug_state(struct r_debug *, struct link_map *);
274
275 /*
276  * A list of loaded modules for GDB to use for loading symbols.
277  */
278 struct r_debug r_debug;
279
280 #define GDB_STATE(s) do {                               \
281         r_debug.r_state = s; r_debug_state(NULL, NULL); \
282 } while (0)
283
284 /*
285  * Function for the debugger to set a breakpoint on to gain control.
286  */
287 static void
288 r_debug_state(struct r_debug *dummy_one __unused,
289               struct link_map *dummy_two __unused)
290 {
291 }
292
293 static void
294 link_elf_add_gdb(struct link_map *l)
295 {
296         struct link_map *prev;
297
298         l->l_next = NULL;
299
300         if (r_debug.r_map == NULL) {
301                 /* Add first. */
302                 l->l_prev = NULL;
303                 r_debug.r_map = l;
304         } else {
305                 /* Append to list. */
306                 for (prev = r_debug.r_map;
307                     prev->l_next != NULL;
308                     prev = prev->l_next)
309                         ;
310                 l->l_prev = prev;
311                 prev->l_next = l;
312         }
313 }
314
315 static void
316 link_elf_delete_gdb(struct link_map *l)
317 {
318         if (l->l_prev == NULL) {
319                 /* Remove first. */
320                 if ((r_debug.r_map = l->l_next) != NULL)
321                         l->l_next->l_prev = NULL;
322         } else {
323                 /* Remove any but first. */
324                 if ((l->l_prev->l_next = l->l_next) != NULL)
325                         l->l_next->l_prev = l->l_prev;
326         }
327 }
328 #endif /* GDB */
329
330 /*
331  * The kernel symbol table starts here.
332  */
333 extern struct _dynamic _DYNAMIC;
334
335 static void
336 link_elf_error(const char *filename, const char *s)
337 {
338         if (filename == NULL)
339                 printf("kldload: %s\n", s);
340         else
341                 printf("kldload: %s: %s\n", filename, s);
342 }
343
344 static void
345 link_elf_invoke_ctors(caddr_t addr, size_t size)
346 {
347         void (**ctor)(void);
348         size_t i, cnt;
349
350         if (addr == NULL || size == 0)
351                 return;
352         cnt = size / sizeof(*ctor);
353         ctor = (void *)addr;
354         for (i = 0; i < cnt; i++) {
355                 if (ctor[i] != NULL)
356                         (*ctor[i])();
357         }
358 }
359
360 /*
361  * Actions performed after linking/loading both the preloaded kernel and any
362  * modules; whether preloaded or dynamicly loaded.
363  */
364 static int
365 link_elf_link_common_finish(linker_file_t lf)
366 {
367 #ifdef GDB
368         elf_file_t ef = (elf_file_t)lf;
369         char *newfilename;
370 #endif
371         int error;
372
373         /* Notify MD code that a module is being loaded. */
374         error = elf_cpu_load_file(lf);
375         if (error != 0)
376                 return (error);
377
378 #ifdef GDB
379         GDB_STATE(RT_ADD);
380         ef->gdb.l_addr = lf->address;
381         newfilename = malloc(strlen(lf->filename) + 1, M_LINKER, M_WAITOK);
382         strcpy(newfilename, lf->filename);
383         ef->gdb.l_name = newfilename;
384         ef->gdb.l_ld = ef->dynamic;
385         link_elf_add_gdb(&ef->gdb);
386         GDB_STATE(RT_CONSISTENT);
387 #endif
388
389         /* Invoke .ctors */
390         link_elf_invoke_ctors(lf->ctors_addr, lf->ctors_size);
391         return (0);
392 }
393
394 extern vm_offset_t __startkernel, __endkernel;
395
396 static void
397 link_elf_init(void* arg)
398 {
399         Elf_Dyn *dp;
400         Elf_Addr *ctors_addrp;
401         Elf_Size *ctors_sizep;
402         caddr_t modptr, baseptr, sizeptr;
403         elf_file_t ef;
404         char *modname;
405
406         linker_add_class(&link_elf_class);
407
408         dp = (Elf_Dyn *)&_DYNAMIC;
409         modname = NULL;
410         modptr = preload_search_by_type("elf" __XSTRING(__ELF_WORD_SIZE) " kernel");
411         if (modptr == NULL)
412                 modptr = preload_search_by_type("elf kernel");
413         modname = (char *)preload_search_info(modptr, MODINFO_NAME);
414         if (modname == NULL)
415                 modname = "kernel";
416         linker_kernel_file = linker_make_file(modname, &link_elf_class);
417         if (linker_kernel_file == NULL)
418                 panic("%s: Can't create linker structures for kernel",
419                     __func__);
420
421         ef = (elf_file_t) linker_kernel_file;
422         ef->preloaded = 1;
423 #ifdef __powerpc__
424         ef->address = (caddr_t) (__startkernel - KERNBASE);
425 #else
426         ef->address = 0;
427 #endif
428 #ifdef SPARSE_MAPPING
429         ef->object = NULL;
430 #endif
431         ef->dynamic = dp;
432
433         if (dp != NULL)
434                 parse_dynamic(ef);
435 #ifdef __powerpc__
436         linker_kernel_file->address = (caddr_t)__startkernel;
437         linker_kernel_file->size = (intptr_t)(__endkernel - __startkernel);
438 #else
439         linker_kernel_file->address += KERNBASE;
440         linker_kernel_file->size = -(intptr_t)linker_kernel_file->address;
441 #endif
442
443         if (modptr != NULL) {
444                 ef->modptr = modptr;
445                 baseptr = preload_search_info(modptr, MODINFO_ADDR);
446                 if (baseptr != NULL)
447                         linker_kernel_file->address = *(caddr_t *)baseptr;
448                 sizeptr = preload_search_info(modptr, MODINFO_SIZE);
449                 if (sizeptr != NULL)
450                         linker_kernel_file->size = *(size_t *)sizeptr;
451                 ctors_addrp = (Elf_Addr *)preload_search_info(modptr,
452                         MODINFO_METADATA | MODINFOMD_CTORS_ADDR);
453                 ctors_sizep = (Elf_Size *)preload_search_info(modptr,
454                         MODINFO_METADATA | MODINFOMD_CTORS_SIZE);
455                 if (ctors_addrp != NULL && ctors_sizep != NULL) {
456                         linker_kernel_file->ctors_addr = ef->address +
457                             *ctors_addrp;
458                         linker_kernel_file->ctors_size = *ctors_sizep;
459                 }
460         }
461         (void)link_elf_preload_parse_symbols(ef);
462
463 #ifdef GDB
464         r_debug.r_map = NULL;
465         r_debug.r_brk = r_debug_state;
466         r_debug.r_state = RT_CONSISTENT;
467 #endif
468
469         (void)link_elf_link_common_finish(linker_kernel_file);
470         linker_kernel_file->flags |= LINKER_FILE_LINKED;
471         TAILQ_INIT(&set_pcpu_list);
472 #ifdef VIMAGE
473         TAILQ_INIT(&set_vnet_list);
474 #endif
475 }
476
477 SYSINIT(link_elf, SI_SUB_KLD, SI_ORDER_THIRD, link_elf_init, NULL);
478
479 static int
480 link_elf_preload_parse_symbols(elf_file_t ef)
481 {
482         caddr_t pointer;
483         caddr_t ssym, esym, base;
484         caddr_t strtab;
485         int strcnt;
486         Elf_Sym *symtab;
487         int symcnt;
488
489         if (ef->modptr == NULL)
490                 return (0);
491         pointer = preload_search_info(ef->modptr,
492             MODINFO_METADATA | MODINFOMD_SSYM);
493         if (pointer == NULL)
494                 return (0);
495         ssym = *(caddr_t *)pointer;
496         pointer = preload_search_info(ef->modptr,
497             MODINFO_METADATA | MODINFOMD_ESYM);
498         if (pointer == NULL)
499                 return (0);
500         esym = *(caddr_t *)pointer;
501
502         base = ssym;
503
504         symcnt = *(long *)base;
505         base += sizeof(long);
506         symtab = (Elf_Sym *)base;
507         base += roundup(symcnt, sizeof(long));
508
509         if (base > esym || base < ssym) {
510                 printf("Symbols are corrupt!\n");
511                 return (EINVAL);
512         }
513
514         strcnt = *(long *)base;
515         base += sizeof(long);
516         strtab = base;
517         base += roundup(strcnt, sizeof(long));
518
519         if (base > esym || base < ssym) {
520                 printf("Symbols are corrupt!\n");
521                 return (EINVAL);
522         }
523
524         ef->ddbsymtab = symtab;
525         ef->ddbsymcnt = symcnt / sizeof(Elf_Sym);
526         ef->ddbstrtab = strtab;
527         ef->ddbstrcnt = strcnt;
528
529         return (0);
530 }
531
532 static int
533 parse_dynamic(elf_file_t ef)
534 {
535         Elf_Dyn *dp;
536         int plttype = DT_REL;
537
538         for (dp = ef->dynamic; dp->d_tag != DT_NULL; dp++) {
539                 switch (dp->d_tag) {
540                 case DT_HASH:
541                 {
542                         /* From src/libexec/rtld-elf/rtld.c */
543                         const Elf_Hashelt *hashtab = (const Elf_Hashelt *)
544                             (ef->address + dp->d_un.d_ptr);
545                         ef->nbuckets = hashtab[0];
546                         ef->nchains = hashtab[1];
547                         ef->buckets = hashtab + 2;
548                         ef->chains = ef->buckets + ef->nbuckets;
549                         break;
550                 }
551                 case DT_STRTAB:
552                         ef->strtab = (caddr_t) (ef->address + dp->d_un.d_ptr);
553                         break;
554                 case DT_STRSZ:
555                         ef->strsz = dp->d_un.d_val;
556                         break;
557                 case DT_SYMTAB:
558                         ef->symtab = (Elf_Sym*) (ef->address + dp->d_un.d_ptr);
559                         break;
560                 case DT_SYMENT:
561                         if (dp->d_un.d_val != sizeof(Elf_Sym))
562                                 return (ENOEXEC);
563                         break;
564                 case DT_PLTGOT:
565                         ef->got = (Elf_Addr *) (ef->address + dp->d_un.d_ptr);
566                         break;
567                 case DT_REL:
568                         ef->rel = (const Elf_Rel *) (ef->address + dp->d_un.d_ptr);
569                         break;
570                 case DT_RELSZ:
571                         ef->relsize = dp->d_un.d_val;
572                         break;
573                 case DT_RELENT:
574                         if (dp->d_un.d_val != sizeof(Elf_Rel))
575                                 return (ENOEXEC);
576                         break;
577                 case DT_JMPREL:
578                         ef->pltrel = (const Elf_Rel *) (ef->address + dp->d_un.d_ptr);
579                         break;
580                 case DT_PLTRELSZ:
581                         ef->pltrelsize = dp->d_un.d_val;
582                         break;
583                 case DT_RELA:
584                         ef->rela = (const Elf_Rela *) (ef->address + dp->d_un.d_ptr);
585                         break;
586                 case DT_RELASZ:
587                         ef->relasize = dp->d_un.d_val;
588                         break;
589                 case DT_RELAENT:
590                         if (dp->d_un.d_val != sizeof(Elf_Rela))
591                                 return (ENOEXEC);
592                         break;
593                 case DT_PLTREL:
594                         plttype = dp->d_un.d_val;
595                         if (plttype != DT_REL && plttype != DT_RELA)
596                                 return (ENOEXEC);
597                         break;
598 #ifdef GDB
599                 case DT_DEBUG:
600                         dp->d_un.d_ptr = (Elf_Addr)&r_debug;
601                         break;
602 #endif
603                 }
604         }
605
606         if (plttype == DT_RELA) {
607                 ef->pltrela = (const Elf_Rela *)ef->pltrel;
608                 ef->pltrel = NULL;
609                 ef->pltrelasize = ef->pltrelsize;
610                 ef->pltrelsize = 0;
611         }
612
613         ef->ddbsymtab = ef->symtab;
614         ef->ddbsymcnt = ef->nchains;
615         ef->ddbstrtab = ef->strtab;
616         ef->ddbstrcnt = ef->strsz;
617
618         return (0);
619 }
620
621 static int
622 parse_dpcpu(elf_file_t ef)
623 {
624         int error, size;
625
626         ef->pcpu_start = 0;
627         ef->pcpu_stop = 0;
628         error = link_elf_lookup_set(&ef->lf, "pcpu", (void ***)&ef->pcpu_start,
629             (void ***)&ef->pcpu_stop, NULL);
630         /* Error just means there is no pcpu set to relocate. */
631         if (error != 0)
632                 return (0);
633         size = (uintptr_t)ef->pcpu_stop - (uintptr_t)ef->pcpu_start;
634         /* Empty set? */
635         if (size < 1)
636                 return (0);
637         /*
638          * Allocate space in the primary pcpu area.  Copy in our
639          * initialization from the data section and then initialize
640          * all per-cpu storage from that.
641          */
642         ef->pcpu_base = (Elf_Addr)(uintptr_t)dpcpu_alloc(size);
643         if (ef->pcpu_base == 0) {
644                 printf("%s: pcpu module space is out of space; "
645                     "cannot allocate %d for %s\n",
646                     __func__, size, ef->lf.pathname);
647                 return (ENOSPC);
648         }
649         memcpy((void *)ef->pcpu_base, (void *)ef->pcpu_start, size);
650         dpcpu_copy((void *)ef->pcpu_base, size);
651         elf_set_add(&set_pcpu_list, ef->pcpu_start, ef->pcpu_stop,
652             ef->pcpu_base);
653
654         return (0);
655 }
656
657 #ifdef VIMAGE
658 static int
659 parse_vnet(elf_file_t ef)
660 {
661         int error, size;
662
663         ef->vnet_start = 0;
664         ef->vnet_stop = 0;
665         error = link_elf_lookup_set(&ef->lf, "vnet", (void ***)&ef->vnet_start,
666             (void ***)&ef->vnet_stop, NULL);
667         /* Error just means there is no vnet data set to relocate. */
668         if (error != 0)
669                 return (0);
670         size = (uintptr_t)ef->vnet_stop - (uintptr_t)ef->vnet_start;
671         /* Empty set? */
672         if (size < 1)
673                 return (0);
674         /*
675          * Allocate space in the primary vnet area.  Copy in our
676          * initialization from the data section and then initialize
677          * all per-vnet storage from that.
678          */
679         ef->vnet_base = (Elf_Addr)(uintptr_t)vnet_data_alloc(size);
680         if (ef->vnet_base == 0) {
681                 printf("%s: vnet module space is out of space; "
682                     "cannot allocate %d for %s\n",
683                     __func__, size, ef->lf.pathname);
684                 return (ENOSPC);
685         }
686         memcpy((void *)ef->vnet_base, (void *)ef->vnet_start, size);
687         vnet_data_copy((void *)ef->vnet_base, size);
688         elf_set_add(&set_vnet_list, ef->vnet_start, ef->vnet_stop,
689             ef->vnet_base);
690
691         return (0);
692 }
693 #endif
694
695 #ifdef __arm__
696 /*
697  * Locate the ARM exception/unwind table info for DDB and stack(9) use by
698  * searching for the section header that describes it.  There may be no unwind
699  * info, for example in a module containing only data.
700  */
701 static void
702 link_elf_locate_exidx(linker_file_t lf, Elf_Shdr *shdr, int nhdr)
703 {
704         int i;
705
706         for (i = 0; i < nhdr; i++) {
707                 if (shdr[i].sh_type == SHT_ARM_EXIDX) {
708                         lf->exidx_addr = shdr[i].sh_addr + lf->address;
709                         lf->exidx_size = shdr[i].sh_size;
710                         break;
711                 }
712         }
713 }
714
715 /*
716  * Locate the section headers metadata in a preloaded module, then use it to
717  * locate the exception/unwind table in the module.  The size of the metadata
718  * block is stored in a uint32 word immediately before the data itself, and a
719  * comment in preload_search_info() says it is safe to rely on that.
720  */
721 static void
722 link_elf_locate_exidx_preload(struct linker_file *lf, caddr_t modptr)
723 {
724         uint32_t *modinfo;
725         Elf_Shdr *shdr;
726         uint32_t  nhdr;
727
728         modinfo = (uint32_t *)preload_search_info(modptr,
729             MODINFO_METADATA | MODINFOMD_SHDR);
730         if (modinfo != NULL) {
731                 shdr = (Elf_Shdr *)modinfo;
732                 nhdr = modinfo[-1] / sizeof(Elf_Shdr);
733                 link_elf_locate_exidx(lf, shdr, nhdr);
734         }
735 }
736
737 #endif /* __arm__ */
738
739 static int
740 link_elf_link_preload(linker_class_t cls,
741     const char* filename, linker_file_t *result)
742 {
743         Elf_Addr *ctors_addrp;
744         Elf_Size *ctors_sizep;
745         caddr_t modptr, baseptr, sizeptr, dynptr;
746         char *type;
747         elf_file_t ef;
748         linker_file_t lf;
749         int error;
750         vm_offset_t dp;
751
752         /* Look to see if we have the file preloaded */
753         modptr = preload_search_by_name(filename);
754         if (modptr == NULL)
755                 return (ENOENT);
756
757         type = (char *)preload_search_info(modptr, MODINFO_TYPE);
758         baseptr = preload_search_info(modptr, MODINFO_ADDR);
759         sizeptr = preload_search_info(modptr, MODINFO_SIZE);
760         dynptr = preload_search_info(modptr,
761             MODINFO_METADATA | MODINFOMD_DYNAMIC);
762         if (type == NULL ||
763             (strcmp(type, "elf" __XSTRING(__ELF_WORD_SIZE) " module") != 0 &&
764              strcmp(type, "elf module") != 0))
765                 return (EFTYPE);
766         if (baseptr == NULL || sizeptr == NULL || dynptr == NULL)
767                 return (EINVAL);
768
769         lf = linker_make_file(filename, &link_elf_class);
770         if (lf == NULL)
771                 return (ENOMEM);
772
773         ef = (elf_file_t) lf;
774         ef->preloaded = 1;
775         ef->modptr = modptr;
776         ef->address = *(caddr_t *)baseptr;
777 #ifdef SPARSE_MAPPING
778         ef->object = NULL;
779 #endif
780         dp = (vm_offset_t)ef->address + *(vm_offset_t *)dynptr;
781         ef->dynamic = (Elf_Dyn *)dp;
782         lf->address = ef->address;
783         lf->size = *(size_t *)sizeptr;
784
785         ctors_addrp = (Elf_Addr *)preload_search_info(modptr,
786             MODINFO_METADATA | MODINFOMD_CTORS_ADDR);
787         ctors_sizep = (Elf_Size *)preload_search_info(modptr,
788             MODINFO_METADATA | MODINFOMD_CTORS_SIZE);
789         if (ctors_addrp != NULL && ctors_sizep != NULL) {
790                 lf->ctors_addr = ef->address + *ctors_addrp;
791                 lf->ctors_size = *ctors_sizep;
792         }
793
794 #ifdef __arm__
795         link_elf_locate_exidx_preload(lf, modptr);
796 #endif
797
798         error = parse_dynamic(ef);
799         if (error == 0)
800                 error = parse_dpcpu(ef);
801 #ifdef VIMAGE
802         if (error == 0)
803                 error = parse_vnet(ef);
804 #endif
805         if (error != 0) {
806                 linker_file_unload(lf, LINKER_UNLOAD_FORCE);
807                 return (error);
808         }
809         link_elf_reloc_local(lf);
810         *result = lf;
811         return (0);
812 }
813
814 static int
815 link_elf_link_preload_finish(linker_file_t lf)
816 {
817         elf_file_t ef;
818         int error;
819
820         ef = (elf_file_t) lf;
821         error = relocate_file(ef);
822         if (error != 0)
823                 return (error);
824         (void)link_elf_preload_parse_symbols(ef);
825
826         return (link_elf_link_common_finish(lf));
827 }
828
829 static int
830 link_elf_load_file(linker_class_t cls, const char* filename,
831     linker_file_t* result)
832 {
833         struct nameidata nd;
834         struct thread* td = curthread;  /* XXX */
835         Elf_Ehdr *hdr;
836         caddr_t firstpage, segbase;
837         int nbytes, i;
838         Elf_Phdr *phdr;
839         Elf_Phdr *phlimit;
840         Elf_Phdr *segs[MAXSEGS];
841         int nsegs;
842         Elf_Phdr *phdyn;
843         caddr_t mapbase;
844         size_t mapsize;
845         Elf_Addr base_vaddr;
846         Elf_Addr base_vlimit;
847         int error = 0;
848         ssize_t resid;
849         int flags;
850         elf_file_t ef;
851         linker_file_t lf;
852         Elf_Shdr *shdr;
853         int symtabindex;
854         int symstrindex;
855         int shstrindex;
856         int symcnt;
857         int strcnt;
858         char *shstrs;
859
860         shdr = NULL;
861         lf = NULL;
862         shstrs = NULL;
863
864         NDINIT(&nd, LOOKUP, FOLLOW, UIO_SYSSPACE, filename, td);
865         flags = FREAD;
866         error = vn_open(&nd, &flags, 0, NULL);
867         if (error != 0)
868                 return (error);
869         NDFREE(&nd, NDF_ONLY_PNBUF);
870         if (nd.ni_vp->v_type != VREG) {
871                 error = ENOEXEC;
872                 firstpage = NULL;
873                 goto out;
874         }
875 #ifdef MAC
876         error = mac_kld_check_load(curthread->td_ucred, nd.ni_vp);
877         if (error != 0) {
878                 firstpage = NULL;
879                 goto out;
880         }
881 #endif
882
883         /*
884          * Read the elf header from the file.
885          */
886         firstpage = malloc(PAGE_SIZE, M_LINKER, M_WAITOK);
887         hdr = (Elf_Ehdr *)firstpage;
888         error = vn_rdwr(UIO_READ, nd.ni_vp, firstpage, PAGE_SIZE, 0,
889             UIO_SYSSPACE, IO_NODELOCKED, td->td_ucred, NOCRED,
890             &resid, td);
891         nbytes = PAGE_SIZE - resid;
892         if (error != 0)
893                 goto out;
894
895         if (!IS_ELF(*hdr)) {
896                 error = ENOEXEC;
897                 goto out;
898         }
899
900         if (hdr->e_ident[EI_CLASS] != ELF_TARG_CLASS ||
901             hdr->e_ident[EI_DATA] != ELF_TARG_DATA) {
902                 link_elf_error(filename, "Unsupported file layout");
903                 error = ENOEXEC;
904                 goto out;
905         }
906         if (hdr->e_ident[EI_VERSION] != EV_CURRENT ||
907             hdr->e_version != EV_CURRENT) {
908                 link_elf_error(filename, "Unsupported file version");
909                 error = ENOEXEC;
910                 goto out;
911         }
912         if (hdr->e_type != ET_EXEC && hdr->e_type != ET_DYN) {
913                 error = ENOSYS;
914                 goto out;
915         }
916         if (hdr->e_machine != ELF_TARG_MACH) {
917                 link_elf_error(filename, "Unsupported machine");
918                 error = ENOEXEC;
919                 goto out;
920         }
921
922         /*
923          * We rely on the program header being in the first page.
924          * This is not strictly required by the ABI specification, but
925          * it seems to always true in practice.  And, it simplifies
926          * things considerably.
927          */
928         if (!((hdr->e_phentsize == sizeof(Elf_Phdr)) &&
929               (hdr->e_phoff + hdr->e_phnum*sizeof(Elf_Phdr) <= PAGE_SIZE) &&
930               (hdr->e_phoff + hdr->e_phnum*sizeof(Elf_Phdr) <= nbytes)))
931                 link_elf_error(filename, "Unreadable program headers");
932
933         /*
934          * Scan the program header entries, and save key information.
935          *
936          * We rely on there being exactly two load segments, text and data,
937          * in that order.
938          */
939         phdr = (Elf_Phdr *) (firstpage + hdr->e_phoff);
940         phlimit = phdr + hdr->e_phnum;
941         nsegs = 0;
942         phdyn = NULL;
943         while (phdr < phlimit) {
944                 switch (phdr->p_type) {
945                 case PT_LOAD:
946                         if (nsegs == MAXSEGS) {
947                                 link_elf_error(filename, "Too many sections");
948                                 error = ENOEXEC;
949                                 goto out;
950                         }
951                         /*
952                          * XXX: We just trust they come in right order ??
953                          */
954                         segs[nsegs] = phdr;
955                         ++nsegs;
956                         break;
957
958                 case PT_DYNAMIC:
959                         phdyn = phdr;
960                         break;
961
962                 case PT_INTERP:
963                         error = ENOSYS;
964                         goto out;
965                 }
966
967                 ++phdr;
968         }
969         if (phdyn == NULL) {
970                 link_elf_error(filename, "Object is not dynamically-linked");
971                 error = ENOEXEC;
972                 goto out;
973         }
974         if (nsegs == 0) {
975                 link_elf_error(filename, "No sections");
976                 error = ENOEXEC;
977                 goto out;
978         }
979
980         /*
981          * Allocate the entire address space of the object, to stake
982          * out our contiguous region, and to establish the base
983          * address for relocation.
984          */
985         base_vaddr = trunc_page(segs[0]->p_vaddr);
986         base_vlimit = round_page(segs[nsegs - 1]->p_vaddr +
987             segs[nsegs - 1]->p_memsz);
988         mapsize = base_vlimit - base_vaddr;
989
990         lf = linker_make_file(filename, &link_elf_class);
991         if (lf == NULL) {
992                 error = ENOMEM;
993                 goto out;
994         }
995
996         ef = (elf_file_t) lf;
997 #ifdef SPARSE_MAPPING
998         ef->object = vm_pager_allocate(OBJT_PHYS, NULL, mapsize, VM_PROT_ALL,
999             0, thread0.td_ucred);
1000         if (ef->object == NULL) {
1001                 error = ENOMEM;
1002                 goto out;
1003         }
1004 #ifdef __amd64__
1005         mapbase = (caddr_t)KERNBASE;
1006 #else
1007         mapbase = (caddr_t)vm_map_min(kernel_map);
1008 #endif
1009         /*
1010          * Mapping protections are downgraded after relocation processing.
1011          */
1012         error = vm_map_find(kernel_map, ef->object, 0,
1013             (vm_offset_t *)&mapbase, mapsize, 0, VMFS_OPTIMAL_SPACE,
1014             VM_PROT_ALL, VM_PROT_ALL, 0);
1015         if (error != 0) {
1016                 vm_object_deallocate(ef->object);
1017                 ef->object = NULL;
1018                 goto out;
1019         }
1020 #else
1021         mapbase = malloc(mapsize, M_LINKER, M_EXEC | M_WAITOK);
1022 #endif
1023         ef->address = mapbase;
1024
1025         /*
1026          * Read the text and data sections and zero the bss.
1027          */
1028         for (i = 0; i < nsegs; i++) {
1029                 segbase = mapbase + segs[i]->p_vaddr - base_vaddr;
1030
1031 #ifdef SPARSE_MAPPING
1032                 /*
1033                  * Consecutive segments may have different mapping permissions,
1034                  * so be strict and verify that their mappings do not overlap.
1035                  */
1036                 if (((vm_offset_t)segbase & PAGE_MASK) != 0) {
1037                         error = EINVAL;
1038                         goto out;
1039                 }
1040
1041                 error = vm_map_wire(kernel_map,
1042                     (vm_offset_t)segbase,
1043                     (vm_offset_t)segbase + round_page(segs[i]->p_memsz),
1044                     VM_MAP_WIRE_SYSTEM | VM_MAP_WIRE_NOHOLES);
1045                 if (error != KERN_SUCCESS) {
1046                         error = ENOMEM;
1047                         goto out;
1048                 }
1049 #endif
1050
1051                 error = vn_rdwr(UIO_READ, nd.ni_vp,
1052                     segbase, segs[i]->p_filesz, segs[i]->p_offset,
1053                     UIO_SYSSPACE, IO_NODELOCKED, td->td_ucred, NOCRED,
1054                     &resid, td);
1055                 if (error != 0)
1056                         goto out;
1057                 bzero(segbase + segs[i]->p_filesz,
1058                     segs[i]->p_memsz - segs[i]->p_filesz);
1059         }
1060
1061 #ifdef GPROF
1062         /* Update profiling information with the new text segment. */
1063         mtx_lock(&Giant);
1064         kmupetext((uintfptr_t)(mapbase + segs[0]->p_vaddr - base_vaddr +
1065             segs[0]->p_memsz));
1066         mtx_unlock(&Giant);
1067 #endif
1068
1069         ef->dynamic = (Elf_Dyn *) (mapbase + phdyn->p_vaddr - base_vaddr);
1070
1071         lf->address = ef->address;
1072         lf->size = mapsize;
1073
1074         error = parse_dynamic(ef);
1075         if (error != 0)
1076                 goto out;
1077         error = parse_dpcpu(ef);
1078         if (error != 0)
1079                 goto out;
1080 #ifdef VIMAGE
1081         error = parse_vnet(ef);
1082         if (error != 0)
1083                 goto out;
1084 #endif
1085         link_elf_reloc_local(lf);
1086
1087         VOP_UNLOCK(nd.ni_vp, 0);
1088         error = linker_load_dependencies(lf);
1089         vn_lock(nd.ni_vp, LK_EXCLUSIVE | LK_RETRY);
1090         if (error != 0)
1091                 goto out;
1092         error = relocate_file(ef);
1093         if (error != 0)
1094                 goto out;
1095
1096 #ifdef SPARSE_MAPPING
1097         /*
1098          * Downgrade permissions on text segment mappings now that relocation
1099          * processing is complete.  Restrict permissions on read-only segments.
1100          */
1101         for (i = 0; i < nsegs; i++) {
1102                 vm_prot_t prot;
1103
1104                 if (segs[i]->p_type != PT_LOAD)
1105                         continue;
1106
1107                 prot = VM_PROT_READ;
1108                 if ((segs[i]->p_flags & PF_W) != 0)
1109                         prot |= VM_PROT_WRITE;
1110                 if ((segs[i]->p_flags & PF_X) != 0)
1111                         prot |= VM_PROT_EXECUTE;
1112                 segbase = mapbase + segs[i]->p_vaddr - base_vaddr;
1113                 error = vm_map_protect(kernel_map,
1114                     (vm_offset_t)segbase,
1115                     (vm_offset_t)segbase + round_page(segs[i]->p_memsz),
1116                     prot, FALSE);
1117                 if (error != KERN_SUCCESS) {
1118                         error = ENOMEM;
1119                         goto out;
1120                 }
1121         }
1122 #endif
1123
1124         /*
1125          * Try and load the symbol table if it's present.  (you can
1126          * strip it!)
1127          */
1128         nbytes = hdr->e_shnum * hdr->e_shentsize;
1129         if (nbytes == 0 || hdr->e_shoff == 0)
1130                 goto nosyms;
1131         shdr = malloc(nbytes, M_LINKER, M_WAITOK | M_ZERO);
1132         error = vn_rdwr(UIO_READ, nd.ni_vp,
1133             (caddr_t)shdr, nbytes, hdr->e_shoff,
1134             UIO_SYSSPACE, IO_NODELOCKED, td->td_ucred, NOCRED,
1135             &resid, td);
1136         if (error != 0)
1137                 goto out;
1138
1139         /* Read section string table */
1140         shstrindex = hdr->e_shstrndx;
1141         if (shstrindex != 0 && shdr[shstrindex].sh_type == SHT_STRTAB &&
1142             shdr[shstrindex].sh_size != 0) {
1143                 nbytes = shdr[shstrindex].sh_size;
1144                 shstrs = malloc(nbytes, M_LINKER, M_WAITOK | M_ZERO);
1145                 error = vn_rdwr(UIO_READ, nd.ni_vp, (caddr_t)shstrs, nbytes,
1146                     shdr[shstrindex].sh_offset, UIO_SYSSPACE, IO_NODELOCKED,
1147                     td->td_ucred, NOCRED, &resid, td);
1148                 if (error)
1149                         goto out;
1150         }
1151
1152         symtabindex = -1;
1153         symstrindex = -1;
1154         for (i = 0; i < hdr->e_shnum; i++) {
1155                 if (shdr[i].sh_type == SHT_SYMTAB) {
1156                         symtabindex = i;
1157                         symstrindex = shdr[i].sh_link;
1158                 } else if (shstrs != NULL && shdr[i].sh_name != 0 &&
1159                     strcmp(shstrs + shdr[i].sh_name, ".ctors") == 0) {
1160                         /* Record relocated address and size of .ctors. */
1161                         lf->ctors_addr = mapbase + shdr[i].sh_addr - base_vaddr;
1162                         lf->ctors_size = shdr[i].sh_size;
1163                 }
1164         }
1165         if (symtabindex < 0 || symstrindex < 0)
1166                 goto nosyms;
1167
1168         symcnt = shdr[symtabindex].sh_size;
1169         ef->symbase = malloc(symcnt, M_LINKER, M_WAITOK);
1170         strcnt = shdr[symstrindex].sh_size;
1171         ef->strbase = malloc(strcnt, M_LINKER, M_WAITOK);
1172
1173         error = vn_rdwr(UIO_READ, nd.ni_vp,
1174             ef->symbase, symcnt, shdr[symtabindex].sh_offset,
1175             UIO_SYSSPACE, IO_NODELOCKED, td->td_ucred, NOCRED,
1176             &resid, td);
1177         if (error != 0)
1178                 goto out;
1179         error = vn_rdwr(UIO_READ, nd.ni_vp,
1180             ef->strbase, strcnt, shdr[symstrindex].sh_offset,
1181             UIO_SYSSPACE, IO_NODELOCKED, td->td_ucred, NOCRED,
1182             &resid, td);
1183         if (error != 0)
1184                 goto out;
1185
1186         ef->ddbsymcnt = symcnt / sizeof(Elf_Sym);
1187         ef->ddbsymtab = (const Elf_Sym *)ef->symbase;
1188         ef->ddbstrcnt = strcnt;
1189         ef->ddbstrtab = ef->strbase;
1190
1191 nosyms:
1192
1193 #ifdef __arm__
1194         link_elf_locate_exidx(lf, shdr, hdr->e_shnum);
1195 #endif
1196
1197         error = link_elf_link_common_finish(lf);
1198         if (error != 0)
1199                 goto out;
1200
1201         *result = lf;
1202
1203 out:
1204         VOP_UNLOCK(nd.ni_vp, 0);
1205         vn_close(nd.ni_vp, FREAD, td->td_ucred, td);
1206         if (error != 0 && lf != NULL)
1207                 linker_file_unload(lf, LINKER_UNLOAD_FORCE);
1208         free(shdr, M_LINKER);
1209         free(firstpage, M_LINKER);
1210         free(shstrs, M_LINKER);
1211
1212         return (error);
1213 }
1214
1215 Elf_Addr
1216 elf_relocaddr(linker_file_t lf, Elf_Addr x)
1217 {
1218         elf_file_t ef;
1219
1220         KASSERT(lf->ops->cls == (kobj_class_t)&link_elf_class,
1221             ("elf_relocaddr: unexpected linker file %p", lf));
1222
1223         ef = (elf_file_t)lf;
1224         if (x >= ef->pcpu_start && x < ef->pcpu_stop)
1225                 return ((x - ef->pcpu_start) + ef->pcpu_base);
1226 #ifdef VIMAGE
1227         if (x >= ef->vnet_start && x < ef->vnet_stop)
1228                 return ((x - ef->vnet_start) + ef->vnet_base);
1229 #endif
1230         return (x);
1231 }
1232
1233
1234 static void
1235 link_elf_unload_file(linker_file_t file)
1236 {
1237         elf_file_t ef = (elf_file_t) file;
1238
1239         if (ef->pcpu_base != 0) {
1240                 dpcpu_free((void *)ef->pcpu_base,
1241                     ef->pcpu_stop - ef->pcpu_start);
1242                 elf_set_delete(&set_pcpu_list, ef->pcpu_start);
1243         }
1244 #ifdef VIMAGE
1245         if (ef->vnet_base != 0) {
1246                 vnet_data_free((void *)ef->vnet_base,
1247                     ef->vnet_stop - ef->vnet_start);
1248                 elf_set_delete(&set_vnet_list, ef->vnet_start);
1249         }
1250 #endif
1251 #ifdef GDB
1252         if (ef->gdb.l_ld != NULL) {
1253                 GDB_STATE(RT_DELETE);
1254                 free((void *)(uintptr_t)ef->gdb.l_name, M_LINKER);
1255                 link_elf_delete_gdb(&ef->gdb);
1256                 GDB_STATE(RT_CONSISTENT);
1257         }
1258 #endif
1259
1260         /* Notify MD code that a module is being unloaded. */
1261         elf_cpu_unload_file(file);
1262
1263         if (ef->preloaded) {
1264                 link_elf_unload_preload(file);
1265                 return;
1266         }
1267
1268 #ifdef SPARSE_MAPPING
1269         if (ef->object != NULL) {
1270                 vm_map_remove(kernel_map, (vm_offset_t) ef->address,
1271                     (vm_offset_t) ef->address
1272                     + (ef->object->size << PAGE_SHIFT));
1273         }
1274 #else
1275         free(ef->address, M_LINKER);
1276 #endif
1277         free(ef->symbase, M_LINKER);
1278         free(ef->strbase, M_LINKER);
1279         free(ef->ctftab, M_LINKER);
1280         free(ef->ctfoff, M_LINKER);
1281         free(ef->typoff, M_LINKER);
1282 }
1283
1284 static void
1285 link_elf_unload_preload(linker_file_t file)
1286 {
1287         if (file->pathname != NULL)
1288                 preload_delete_name(file->pathname);
1289 }
1290
1291 static const char *
1292 symbol_name(elf_file_t ef, Elf_Size r_info)
1293 {
1294         const Elf_Sym *ref;
1295
1296         if (ELF_R_SYM(r_info)) {
1297                 ref = ef->symtab + ELF_R_SYM(r_info);
1298                 return (ef->strtab + ref->st_name);
1299         }
1300         return (NULL);
1301 }
1302
1303 static int
1304 symbol_type(elf_file_t ef, Elf_Size r_info)
1305 {
1306         const Elf_Sym *ref;
1307
1308         if (ELF_R_SYM(r_info)) {
1309                 ref = ef->symtab + ELF_R_SYM(r_info);
1310                 return (ELF_ST_TYPE(ref->st_info));
1311         }
1312         return (STT_NOTYPE);
1313 }
1314
1315 static int
1316 relocate_file1(elf_file_t ef, elf_lookup_fn lookup, elf_reloc_fn reloc,
1317     bool ifuncs)
1318 {
1319         const Elf_Rel *rel;
1320         const Elf_Rela *rela;
1321         const char *symname;
1322
1323 #define APPLY_RELOCS(iter, tbl, tblsize, type) do {                     \
1324         for ((iter) = (tbl); (iter) != NULL &&                          \
1325             (iter) < (tbl) + (tblsize) / sizeof(*(iter)); (iter)++) {   \
1326                 if ((symbol_type(ef, (iter)->r_info) ==                 \
1327                     STT_GNU_IFUNC ||                                    \
1328                     elf_is_ifunc_reloc((iter)->r_info)) != ifuncs)      \
1329                         continue;                                       \
1330                 if (reloc(&ef->lf, (Elf_Addr)ef->address,               \
1331                     (iter), (type), lookup)) {                          \
1332                         symname = symbol_name(ef, (iter)->r_info);      \
1333                         printf("link_elf: symbol %s undefined\n",       \
1334                             symname);                                   \
1335                         return (ENOENT);                                \
1336                 }                                                       \
1337         }                                                               \
1338 } while (0)
1339
1340         APPLY_RELOCS(rel, ef->rel, ef->relsize, ELF_RELOC_REL);
1341         APPLY_RELOCS(rela, ef->rela, ef->relasize, ELF_RELOC_RELA);
1342         APPLY_RELOCS(rel, ef->pltrel, ef->pltrelsize, ELF_RELOC_REL);
1343         APPLY_RELOCS(rela, ef->pltrela, ef->pltrelasize, ELF_RELOC_RELA);
1344
1345 #undef APPLY_RELOCS
1346
1347         return (0);
1348 }
1349
1350 static int
1351 relocate_file(elf_file_t ef)
1352 {
1353         int error;
1354
1355         error = relocate_file1(ef, elf_lookup, elf_reloc, false);
1356         if (error == 0)
1357                 error = relocate_file1(ef, elf_lookup, elf_reloc, true);
1358         return (error);
1359 }
1360
1361 /*
1362  * Hash function for symbol table lookup.  Don't even think about changing
1363  * this.  It is specified by the System V ABI.
1364  */
1365 static unsigned long
1366 elf_hash(const char *name)
1367 {
1368         const unsigned char *p = (const unsigned char *) name;
1369         unsigned long h = 0;
1370         unsigned long g;
1371
1372         while (*p != '\0') {
1373                 h = (h << 4) + *p++;
1374                 if ((g = h & 0xf0000000) != 0)
1375                         h ^= g >> 24;
1376                 h &= ~g;
1377         }
1378         return (h);
1379 }
1380
1381 static int
1382 link_elf_lookup_symbol(linker_file_t lf, const char *name, c_linker_sym_t *sym)
1383 {
1384         elf_file_t ef = (elf_file_t) lf;
1385         unsigned long symnum;
1386         const Elf_Sym* symp;
1387         const char *strp;
1388         unsigned long hash;
1389         int i;
1390
1391         /* If we don't have a hash, bail. */
1392         if (ef->buckets == NULL || ef->nbuckets == 0) {
1393                 printf("link_elf_lookup_symbol: missing symbol hash table\n");
1394                 return (ENOENT);
1395         }
1396
1397         /* First, search hashed global symbols */
1398         hash = elf_hash(name);
1399         symnum = ef->buckets[hash % ef->nbuckets];
1400
1401         while (symnum != STN_UNDEF) {
1402                 if (symnum >= ef->nchains) {
1403                         printf("%s: corrupt symbol table\n", __func__);
1404                         return (ENOENT);
1405                 }
1406
1407                 symp = ef->symtab + symnum;
1408                 if (symp->st_name == 0) {
1409                         printf("%s: corrupt symbol table\n", __func__);
1410                         return (ENOENT);
1411                 }
1412
1413                 strp = ef->strtab + symp->st_name;
1414
1415                 if (strcmp(name, strp) == 0) {
1416                         if (symp->st_shndx != SHN_UNDEF ||
1417                             (symp->st_value != 0 &&
1418                             (ELF_ST_TYPE(symp->st_info) == STT_FUNC ||
1419                             ELF_ST_TYPE(symp->st_info) == STT_GNU_IFUNC))) {
1420                                 *sym = (c_linker_sym_t) symp;
1421                                 return (0);
1422                         }
1423                         return (ENOENT);
1424                 }
1425
1426                 symnum = ef->chains[symnum];
1427         }
1428
1429         /* If we have not found it, look at the full table (if loaded) */
1430         if (ef->symtab == ef->ddbsymtab)
1431                 return (ENOENT);
1432
1433         /* Exhaustive search */
1434         for (i = 0, symp = ef->ddbsymtab; i < ef->ddbsymcnt; i++, symp++) {
1435                 strp = ef->ddbstrtab + symp->st_name;
1436                 if (strcmp(name, strp) == 0) {
1437                         if (symp->st_shndx != SHN_UNDEF ||
1438                             (symp->st_value != 0 &&
1439                             (ELF_ST_TYPE(symp->st_info) == STT_FUNC ||
1440                             ELF_ST_TYPE(symp->st_info) == STT_GNU_IFUNC))) {
1441                                 *sym = (c_linker_sym_t) symp;
1442                                 return (0);
1443                         }
1444                         return (ENOENT);
1445                 }
1446         }
1447
1448         return (ENOENT);
1449 }
1450
1451 static int
1452 link_elf_symbol_values(linker_file_t lf, c_linker_sym_t sym,
1453     linker_symval_t *symval)
1454 {
1455         elf_file_t ef;
1456         const Elf_Sym *es;
1457         caddr_t val;
1458
1459         ef = (elf_file_t)lf;
1460         es = (const Elf_Sym *)sym;
1461         if (es >= ef->symtab && es < (ef->symtab + ef->nchains)) {
1462                 symval->name = ef->strtab + es->st_name;
1463                 val = (caddr_t)ef->address + es->st_value;
1464                 if (ELF_ST_TYPE(es->st_info) == STT_GNU_IFUNC)
1465                         val = ((caddr_t (*)(void))val)();
1466                 symval->value = val;
1467                 symval->size = es->st_size;
1468                 return (0);
1469         }
1470         if (ef->symtab == ef->ddbsymtab)
1471                 return (ENOENT);
1472         if (es >= ef->ddbsymtab && es < (ef->ddbsymtab + ef->ddbsymcnt)) {
1473                 symval->name = ef->ddbstrtab + es->st_name;
1474                 val = (caddr_t)ef->address + es->st_value;
1475                 if (ELF_ST_TYPE(es->st_info) == STT_GNU_IFUNC)
1476                         val = ((caddr_t (*)(void))val)();
1477                 symval->value = val;
1478                 symval->size = es->st_size;
1479                 return (0);
1480         }
1481         return (ENOENT);
1482 }
1483
1484 static int
1485 link_elf_search_symbol(linker_file_t lf, caddr_t value,
1486     c_linker_sym_t *sym, long *diffp)
1487 {
1488         elf_file_t ef = (elf_file_t) lf;
1489         u_long off = (uintptr_t) (void *) value;
1490         u_long diff = off;
1491         u_long st_value;
1492         const Elf_Sym* es;
1493         const Elf_Sym* best = NULL;
1494         int i;
1495
1496         for (i = 0, es = ef->ddbsymtab; i < ef->ddbsymcnt; i++, es++) {
1497                 if (es->st_name == 0)
1498                         continue;
1499                 st_value = es->st_value + (uintptr_t) (void *) ef->address;
1500                 if (off >= st_value) {
1501                         if (off - st_value < diff) {
1502                                 diff = off - st_value;
1503                                 best = es;
1504                                 if (diff == 0)
1505                                         break;
1506                         } else if (off - st_value == diff) {
1507                                 best = es;
1508                         }
1509                 }
1510         }
1511         if (best == NULL)
1512                 *diffp = off;
1513         else
1514                 *diffp = diff;
1515         *sym = (c_linker_sym_t) best;
1516
1517         return (0);
1518 }
1519
1520 /*
1521  * Look up a linker set on an ELF system.
1522  */
1523 static int
1524 link_elf_lookup_set(linker_file_t lf, const char *name,
1525     void ***startp, void ***stopp, int *countp)
1526 {
1527         c_linker_sym_t sym;
1528         linker_symval_t symval;
1529         char *setsym;
1530         void **start, **stop;
1531         int len, error = 0, count;
1532
1533         len = strlen(name) + sizeof("__start_set_"); /* sizeof includes \0 */
1534         setsym = malloc(len, M_LINKER, M_WAITOK);
1535
1536         /* get address of first entry */
1537         snprintf(setsym, len, "%s%s", "__start_set_", name);
1538         error = link_elf_lookup_symbol(lf, setsym, &sym);
1539         if (error != 0)
1540                 goto out;
1541         link_elf_symbol_values(lf, sym, &symval);
1542         if (symval.value == 0) {
1543                 error = ESRCH;
1544                 goto out;
1545         }
1546         start = (void **)symval.value;
1547
1548         /* get address of last entry */
1549         snprintf(setsym, len, "%s%s", "__stop_set_", name);
1550         error = link_elf_lookup_symbol(lf, setsym, &sym);
1551         if (error != 0)
1552                 goto out;
1553         link_elf_symbol_values(lf, sym, &symval);
1554         if (symval.value == 0) {
1555                 error = ESRCH;
1556                 goto out;
1557         }
1558         stop = (void **)symval.value;
1559
1560         /* and the number of entries */
1561         count = stop - start;
1562
1563         /* and copy out */
1564         if (startp != NULL)
1565                 *startp = start;
1566         if (stopp != NULL)
1567                 *stopp = stop;
1568         if (countp != NULL)
1569                 *countp = count;
1570
1571 out:
1572         free(setsym, M_LINKER);
1573         return (error);
1574 }
1575
1576 static int
1577 link_elf_each_function_name(linker_file_t file,
1578   int (*callback)(const char *, void *), void *opaque)
1579 {
1580         elf_file_t ef = (elf_file_t)file;
1581         const Elf_Sym *symp;
1582         int i, error;
1583
1584         /* Exhaustive search */
1585         for (i = 0, symp = ef->ddbsymtab; i < ef->ddbsymcnt; i++, symp++) {
1586                 if (symp->st_value != 0 &&
1587                     (ELF_ST_TYPE(symp->st_info) == STT_FUNC ||
1588                     ELF_ST_TYPE(symp->st_info) == STT_GNU_IFUNC)) {
1589                         error = callback(ef->ddbstrtab + symp->st_name, opaque);
1590                         if (error != 0)
1591                                 return (error);
1592                 }
1593         }
1594         return (0);
1595 }
1596
1597 static int
1598 link_elf_each_function_nameval(linker_file_t file,
1599     linker_function_nameval_callback_t callback, void *opaque)
1600 {
1601         linker_symval_t symval;
1602         elf_file_t ef = (elf_file_t)file;
1603         const Elf_Sym* symp;
1604         int i, error;
1605
1606         /* Exhaustive search */
1607         for (i = 0, symp = ef->ddbsymtab; i < ef->ddbsymcnt; i++, symp++) {
1608                 if (symp->st_value != 0 &&
1609                     (ELF_ST_TYPE(symp->st_info) == STT_FUNC ||
1610                     ELF_ST_TYPE(symp->st_info) == STT_GNU_IFUNC)) {
1611                         error = link_elf_symbol_values(file,
1612                             (c_linker_sym_t) symp, &symval);
1613                         if (error != 0)
1614                                 return (error);
1615                         error = callback(file, i, &symval, opaque);
1616                         if (error != 0)
1617                                 return (error);
1618                 }
1619         }
1620         return (0);
1621 }
1622
1623 const Elf_Sym *
1624 elf_get_sym(linker_file_t lf, Elf_Size symidx)
1625 {
1626         elf_file_t ef = (elf_file_t)lf;
1627
1628         if (symidx >= ef->nchains)
1629                 return (NULL);
1630         return (ef->symtab + symidx);
1631 }
1632
1633 const char *
1634 elf_get_symname(linker_file_t lf, Elf_Size symidx)
1635 {
1636         elf_file_t ef = (elf_file_t)lf;
1637         const Elf_Sym *sym;
1638
1639         if (symidx >= ef->nchains)
1640                 return (NULL);
1641         sym = ef->symtab + symidx;
1642         return (ef->strtab + sym->st_name);
1643 }
1644
1645 /*
1646  * Symbol lookup function that can be used when the symbol index is known (ie
1647  * in relocations). It uses the symbol index instead of doing a fully fledged
1648  * hash table based lookup when such is valid. For example for local symbols.
1649  * This is not only more efficient, it's also more correct. It's not always
1650  * the case that the symbol can be found through the hash table.
1651  */
1652 static int
1653 elf_lookup(linker_file_t lf, Elf_Size symidx, int deps, Elf_Addr *res)
1654 {
1655         elf_file_t ef = (elf_file_t)lf;
1656         const Elf_Sym *sym;
1657         const char *symbol;
1658         Elf_Addr addr, start, base;
1659
1660         /* Don't even try to lookup the symbol if the index is bogus. */
1661         if (symidx >= ef->nchains) {
1662                 *res = 0;
1663                 return (EINVAL);
1664         }
1665
1666         sym = ef->symtab + symidx;
1667
1668         /*
1669          * Don't do a full lookup when the symbol is local. It may even
1670          * fail because it may not be found through the hash table.
1671          */
1672         if (ELF_ST_BIND(sym->st_info) == STB_LOCAL) {
1673                 /* Force lookup failure when we have an insanity. */
1674                 if (sym->st_shndx == SHN_UNDEF || sym->st_value == 0) {
1675                         *res = 0;
1676                         return (EINVAL);
1677                 }
1678                 *res = ((Elf_Addr)ef->address + sym->st_value);
1679                 return (0);
1680         }
1681
1682         /*
1683          * XXX we can avoid doing a hash table based lookup for global
1684          * symbols as well. This however is not always valid, so we'll
1685          * just do it the hard way for now. Performance tweaks can
1686          * always be added.
1687          */
1688
1689         symbol = ef->strtab + sym->st_name;
1690
1691         /* Force a lookup failure if the symbol name is bogus. */
1692         if (*symbol == 0) {
1693                 *res = 0;
1694                 return (EINVAL);
1695         }
1696
1697         addr = ((Elf_Addr)linker_file_lookup_symbol(lf, symbol, deps));
1698         if (addr == 0 && ELF_ST_BIND(sym->st_info) != STB_WEAK) {
1699                 *res = 0;
1700                 return (EINVAL);
1701         }
1702
1703         if (elf_set_find(&set_pcpu_list, addr, &start, &base))
1704                 addr = addr - start + base;
1705 #ifdef VIMAGE
1706         else if (elf_set_find(&set_vnet_list, addr, &start, &base))
1707                 addr = addr - start + base;
1708 #endif
1709         *res = addr;
1710         return (0);
1711 }
1712
1713 static void
1714 link_elf_reloc_local(linker_file_t lf)
1715 {
1716         const Elf_Rel *rellim;
1717         const Elf_Rel *rel;
1718         const Elf_Rela *relalim;
1719         const Elf_Rela *rela;
1720         elf_file_t ef = (elf_file_t)lf;
1721
1722         /* Perform relocations without addend if there are any: */
1723         if ((rel = ef->rel) != NULL) {
1724                 rellim = (const Elf_Rel *)((const char *)ef->rel + ef->relsize);
1725                 while (rel < rellim) {
1726                         elf_reloc_local(lf, (Elf_Addr)ef->address, rel,
1727                             ELF_RELOC_REL, elf_lookup);
1728                         rel++;
1729                 }
1730         }
1731
1732         /* Perform relocations with addend if there are any: */
1733         if ((rela = ef->rela) != NULL) {
1734                 relalim = (const Elf_Rela *)
1735                     ((const char *)ef->rela + ef->relasize);
1736                 while (rela < relalim) {
1737                         elf_reloc_local(lf, (Elf_Addr)ef->address, rela,
1738                             ELF_RELOC_RELA, elf_lookup);
1739                         rela++;
1740                 }
1741         }
1742 }
1743
1744 static long
1745 link_elf_symtab_get(linker_file_t lf, const Elf_Sym **symtab)
1746 {
1747         elf_file_t ef = (elf_file_t)lf;
1748
1749         *symtab = ef->ddbsymtab;
1750
1751         if (*symtab == NULL)
1752                 return (0);
1753
1754         return (ef->ddbsymcnt);
1755 }
1756
1757 static long
1758 link_elf_strtab_get(linker_file_t lf, caddr_t *strtab)
1759 {
1760         elf_file_t ef = (elf_file_t)lf;
1761
1762         *strtab = ef->ddbstrtab;
1763
1764         if (*strtab == NULL)
1765                 return (0);
1766
1767         return (ef->ddbstrcnt);
1768 }
1769
1770 #if defined(__i386__) || defined(__amd64__) || defined(__aarch64__)
1771 /*
1772  * Use this lookup routine when performing relocations early during boot.
1773  * The generic lookup routine depends on kobj, which is not initialized
1774  * at that point.
1775  */
1776 static int
1777 elf_lookup_ifunc(linker_file_t lf, Elf_Size symidx, int deps __unused,
1778     Elf_Addr *res)
1779 {
1780         elf_file_t ef;
1781         const Elf_Sym *symp;
1782         caddr_t val;
1783
1784         ef = (elf_file_t)lf;
1785         symp = ef->symtab + symidx;
1786         if (ELF_ST_TYPE(symp->st_info) == STT_GNU_IFUNC) {
1787                 val = (caddr_t)ef->address + symp->st_value;
1788                 *res = ((Elf_Addr (*)(void))val)();
1789                 return (0);
1790         }
1791         return (ENOENT);
1792 }
1793
1794 void
1795 link_elf_ireloc(caddr_t kmdp)
1796 {
1797         struct elf_file eff;
1798         elf_file_t ef;
1799
1800         ef = &eff;
1801
1802         bzero_early(ef, sizeof(*ef));
1803
1804         ef->modptr = kmdp;
1805         ef->dynamic = (Elf_Dyn *)&_DYNAMIC;
1806         parse_dynamic(ef);
1807         ef->address = 0;
1808         link_elf_preload_parse_symbols(ef);
1809         relocate_file1(ef, elf_lookup_ifunc, elf_reloc, true);
1810 }
1811 #endif