]> CyberLeo.Net >> Repos - FreeBSD/stable/8.git/blob - contrib/file/file.h
MFC of 283079,tzdata8:
[FreeBSD/stable/8.git] / contrib / file / file.h
1 /*
2  * Copyright (c) Ian F. Darwin 1986-1995.
3  * Software written by Ian F. Darwin and others;
4  * maintained 1995-present by Christos Zoulas and others.
5  *
6  * Redistribution and use in source and binary forms, with or without
7  * modification, are permitted provided that the following conditions
8  * are met:
9  * 1. Redistributions of source code must retain the above copyright
10  *    notice immediately at the beginning of the file, without modification,
11  *    this list of conditions, and the following disclaimer.
12  * 2. Redistributions in binary form must reproduce the above copyright
13  *    notice, this list of conditions and the following disclaimer in the
14  *    documentation and/or other materials provided with the distribution.
15  *
16  * THIS SOFTWARE IS PROVIDED BY THE AUTHOR AND CONTRIBUTORS ``AS IS'' AND
17  * ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE
18  * IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE
19  * ARE DISCLAIMED. IN NO EVENT SHALL THE AUTHOR OR CONTRIBUTORS BE LIABLE FOR
20  * ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL
21  * DAMAGES (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS
22  * OR SERVICES; LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION)
23  * HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT
24  * LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY
25  * OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF
26  * SUCH DAMAGE.
27  */
28 /*
29  * file.h - definitions for file(1) program
30  * @(#)$File: file.h,v 1.119 2009/02/04 18:24:32 christos Exp $
31  */
32
33 #ifndef __file_h__
34 #define __file_h__
35
36 #ifdef HAVE_CONFIG_H
37 #include <config.h>
38 #endif
39
40 #include <stdio.h>      /* Include that here, to make sure __P gets defined */
41 #include <errno.h>
42 #include <fcntl.h>      /* For open and flags */
43 #ifdef HAVE_STDINT_H
44 #include <stdint.h>
45 #endif
46 #ifdef HAVE_INTTYPES_H
47 #include <inttypes.h>
48 #endif
49 #include <regex.h>
50 #include <sys/types.h>
51 #include <sys/param.h>
52 /* Do this here and now, because struct stat gets re-defined on solaris */
53 #include <sys/stat.h>
54 #include <stdarg.h>
55
56 #define ENABLE_CONDITIONALS
57
58 #ifndef MAGIC
59 #define MAGIC "/etc/magic"
60 #endif
61
62 #ifdef __EMX__
63 #define PATHSEP ';'
64 #else
65 #define PATHSEP ':'
66 #endif
67
68 #define private static
69 #ifndef protected
70 #define protected
71 #endif
72 #define public
73
74 #ifndef __arraycount
75 #define __arraycount(a) (sizeof(a) / sizeof(a[0]))
76 #endif
77
78 #ifndef __GNUC_PREREQ__
79 #ifdef __GNUC__
80 #define __GNUC_PREREQ__(x, y)                                           \
81         ((__GNUC__ == (x) && __GNUC_MINOR__ >= (y)) ||                  \
82          (__GNUC__ > (x)))
83 #else
84 #define __GNUC_PREREQ__(x, y)   0
85 #endif
86 #endif
87
88 #ifndef __GNUC__
89 #ifndef __attribute__
90 #define __attribute__(a)
91 #endif
92 #endif
93
94 #ifndef MIN
95 #define MIN(a,b)        (((a) < (b)) ? (a) : (b))
96 #endif
97
98 #ifndef MAX
99 #define MAX(a,b)        (((a) > (b)) ? (a) : (b))
100 #endif
101
102 #ifndef HOWMANY
103 # define HOWMANY (256 * 1024)   /* how much of the file to look at */
104 #endif
105 #define MAXMAGIS 8192           /* max entries in any one magic file
106                                    or directory */
107 #define MAXDESC 64              /* max leng of text description/MIME type */
108 #define MAXstring 32            /* max leng of "string" types */
109
110 #define MAGICNO         0xF11E041C
111 #define VERSIONNO       7
112 #define FILE_MAGICSIZE  200
113
114 #define FILE_LOAD       0
115 #define FILE_CHECK      1
116 #define FILE_COMPILE    2
117
118 union VALUETYPE {
119         uint8_t b;
120         uint16_t h;
121         uint32_t l;
122         uint64_t q;
123         uint8_t hs[2];  /* 2 bytes of a fixed-endian "short" */
124         uint8_t hl[4];  /* 4 bytes of a fixed-endian "long" */
125         uint8_t hq[8];  /* 8 bytes of a fixed-endian "quad" */
126         char s[MAXstring];      /* the search string or regex pattern */
127         unsigned char us[MAXstring];
128         float f;
129         double d;
130 };
131
132 struct magic {
133         /* Word 1 */
134         uint16_t cont_level;    /* level of ">" */
135         uint8_t flag;
136 #define INDIR           0x01    /* if '(...)' appears */
137 #define OFFADD          0x02    /* if '>&' or '>...(&' appears */
138 #define INDIROFFADD     0x04    /* if '>&(' appears */
139 #define UNSIGNED        0x08    /* comparison is unsigned */
140 #define NOSPACE         0x10    /* suppress space character before output */
141 #define BINTEST         0x20    /* test is for a binary type (set only
142                                    for top-level tests) */
143 #define TEXTTEST        0       /* for passing to file_softmagic */
144
145         uint8_t factor;
146
147         /* Word 2 */
148         uint8_t reln;           /* relation (0=eq, '>'=gt, etc) */
149         uint8_t vallen;         /* length of string value, if any */
150         uint8_t type;           /* comparison type (FILE_*) */
151         uint8_t in_type;        /* type of indirection */
152 #define                         FILE_INVALID    0
153 #define                         FILE_BYTE       1
154 #define                         FILE_SHORT      2
155 #define                         FILE_DEFAULT    3
156 #define                         FILE_LONG       4
157 #define                         FILE_STRING     5
158 #define                         FILE_DATE       6
159 #define                         FILE_BESHORT    7
160 #define                         FILE_BELONG     8
161 #define                         FILE_BEDATE     9
162 #define                         FILE_LESHORT    10
163 #define                         FILE_LELONG     11
164 #define                         FILE_LEDATE     12
165 #define                         FILE_PSTRING    13
166 #define                         FILE_LDATE      14
167 #define                         FILE_BELDATE    15
168 #define                         FILE_LELDATE    16
169 #define                         FILE_REGEX      17
170 #define                         FILE_BESTRING16 18
171 #define                         FILE_LESTRING16 19
172 #define                         FILE_SEARCH     20
173 #define                         FILE_MEDATE     21
174 #define                         FILE_MELDATE    22
175 #define                         FILE_MELONG     23
176 #define                         FILE_QUAD       24
177 #define                         FILE_LEQUAD     25
178 #define                         FILE_BEQUAD     26
179 #define                         FILE_QDATE      27
180 #define                         FILE_LEQDATE    28
181 #define                         FILE_BEQDATE    29
182 #define                         FILE_QLDATE     30
183 #define                         FILE_LEQLDATE   31
184 #define                         FILE_BEQLDATE   32
185 #define                         FILE_FLOAT      33
186 #define                         FILE_BEFLOAT    34
187 #define                         FILE_LEFLOAT    35
188 #define                         FILE_DOUBLE     36
189 #define                         FILE_BEDOUBLE   37
190 #define                         FILE_LEDOUBLE   38
191 #define                         FILE_BEID3      39
192 #define                         FILE_LEID3      40
193 #define                         FILE_INDIRECT   41
194 #define                         FILE_NAMES_SIZE 42/* size of array to contain all names */
195
196 #define IS_STRING(t) \
197         ((t) == FILE_STRING || \
198          (t) == FILE_PSTRING || \
199          (t) == FILE_BESTRING16 || \
200          (t) == FILE_LESTRING16 || \
201          (t) == FILE_REGEX || \
202          (t) == FILE_SEARCH || \
203          (t) == FILE_DEFAULT)
204
205 #define FILE_FMT_NONE 0
206 #define FILE_FMT_NUM  1 /* "cduxXi" */
207 #define FILE_FMT_STR  2 /* "s" */
208 #define FILE_FMT_QUAD 3 /* "ll" */
209 #define FILE_FMT_FLOAT 4 /* "eEfFgG" */
210 #define FILE_FMT_DOUBLE 5 /* "eEfFgG" */
211
212         /* Word 3 */
213         uint8_t in_op;          /* operator for indirection */
214         uint8_t mask_op;        /* operator for mask */
215 #ifdef ENABLE_CONDITIONALS
216         uint8_t cond;           /* conditional type */
217 #else
218         uint8_t dummy;
219 #endif
220         uint8_t factor_op;
221 #define         FILE_FACTOR_OP_PLUS     '+'
222 #define         FILE_FACTOR_OP_MINUS    '-'
223 #define         FILE_FACTOR_OP_TIMES    '*'
224 #define         FILE_FACTOR_OP_DIV      '/'
225 #define         FILE_FACTOR_OP_NONE     '\0'
226
227 #define                         FILE_OPS        "&|^+-*/%"
228 #define                         FILE_OPAND      0
229 #define                         FILE_OPOR       1
230 #define                         FILE_OPXOR      2
231 #define                         FILE_OPADD      3
232 #define                         FILE_OPMINUS    4
233 #define                         FILE_OPMULTIPLY 5
234 #define                         FILE_OPDIVIDE   6
235 #define                         FILE_OPMODULO   7
236 #define                         FILE_OPS_MASK   0x07 /* mask for above ops */
237 #define                         FILE_UNUSED_1   0x08
238 #define                         FILE_UNUSED_2   0x10
239 #define                         FILE_UNUSED_3   0x20
240 #define                         FILE_OPINVERSE  0x40
241 #define                         FILE_OPINDIRECT 0x80
242
243 #ifdef ENABLE_CONDITIONALS
244 #define                         COND_NONE       0
245 #define                         COND_IF         1
246 #define                         COND_ELIF       2
247 #define                         COND_ELSE       3
248 #endif /* ENABLE_CONDITIONALS */
249
250         /* Word 4 */
251         uint32_t offset;        /* offset to magic number */
252         /* Word 5 */
253         int32_t in_offset;      /* offset from indirection */
254         /* Word 6 */
255         uint32_t lineno;        /* line number in magic file */
256         /* Word 7,8 */
257         union {
258                 uint64_t _mask; /* for use with numeric and date types */
259                 struct {
260                         uint32_t _count;        /* repeat/line count */
261                         uint32_t _flags;        /* modifier flags */
262                 } _s;           /* for use with string types */
263         } _u;
264 #define num_mask _u._mask
265 #define str_range _u._s._count
266 #define str_flags _u._s._flags
267         /* Words 9-16 */
268         union VALUETYPE value;  /* either number or string */
269         /* Words 17-24 */
270         char desc[MAXDESC];     /* description */
271         /* Words 25-32 */
272         char mimetype[MAXDESC]; /* MIME type */
273         /* Words 33-34 */
274         char apple[8];
275 };
276
277 #define BIT(A)   (1 << (A))
278 #define STRING_COMPACT_BLANK            BIT(0)
279 #define STRING_COMPACT_OPTIONAL_BLANK   BIT(1)
280 #define STRING_IGNORE_LOWERCASE         BIT(2)
281 #define STRING_IGNORE_UPPERCASE         BIT(3)
282 #define REGEX_OFFSET_START              BIT(4)
283 #define CHAR_COMPACT_BLANK              'B'
284 #define CHAR_COMPACT_OPTIONAL_BLANK     'b'
285 #define CHAR_IGNORE_LOWERCASE           'c'
286 #define CHAR_IGNORE_UPPERCASE           'C'
287 #define CHAR_REGEX_OFFSET_START         's'
288 #define STRING_IGNORE_CASE              (STRING_IGNORE_LOWERCASE|STRING_IGNORE_UPPERCASE)
289 #define STRING_DEFAULT_RANGE            100
290
291
292 /* list of magic entries */
293 struct mlist {
294         struct magic *magic;            /* array of magic entries */
295         uint32_t nmagic;                        /* number of entries in array */
296         int mapped;  /* allocation type: 0 => apprentice_file
297                       *                  1 => apprentice_map + malloc
298                       *                  2 => apprentice_map + mmap */
299         struct mlist *next, *prev;
300 };
301
302 #ifdef __cplusplus
303 #define CAST(T, b)      static_cast<T>(b)
304 #else
305 #define CAST(T, b)      (b)
306 #endif
307
308 struct level_info {
309         int32_t off;
310         int got_match;
311 #ifdef ENABLE_CONDITIONALS
312         int last_match;
313         int last_cond;  /* used for error checking by parse() */
314 #endif
315 };
316 struct magic_set {
317         struct mlist *mlist;
318         struct cont {
319                 size_t len;
320                 struct level_info *li;
321         } c;
322         struct out {
323                 char *buf;              /* Accumulation buffer */
324                 char *pbuf;             /* Printable buffer */
325         } o;
326         uint32_t offset;
327         int error;
328         int flags;                      /* Control magic tests. */
329         int event_flags;                /* Note things that happened. */
330 #define                 EVENT_HAD_ERR           0x01
331         const char *file;
332         size_t line;                    /* current magic line number */
333
334         /* data for searches */
335         struct {
336                 const char *s;          /* start of search in original source */
337                 size_t s_len;           /* length of search region */
338                 size_t offset;          /* starting offset in source: XXX - should this be off_t? */
339                 size_t rm_len;          /* match length */
340         } search;
341
342         /* FIXME: Make the string dynamically allocated so that e.g.
343            strings matched in files can be longer than MAXstring */
344         union VALUETYPE ms_value;       /* either number or string */
345 };
346
347 /* Type for Unicode characters */
348 typedef unsigned long unichar;
349
350 struct stat;
351 protected const char *file_fmttime(uint32_t, int);
352 protected int file_buffer(struct magic_set *, int, const char *, const void *,
353     size_t);
354 protected int file_fsmagic(struct magic_set *, const char *, struct stat *);
355 protected int file_pipe2file(struct magic_set *, int, const void *, size_t);
356 protected int file_vprintf(struct magic_set *, const char *, va_list);
357 protected int file_printf(struct magic_set *, const char *, ...)
358     __attribute__((__format__(__printf__, 2, 3)));
359 protected int file_reset(struct magic_set *);
360 protected int file_tryelf(struct magic_set *, int, const unsigned char *,
361     size_t);
362 protected int file_trycdf(struct magic_set *, int, const unsigned char *,
363     size_t);
364 protected int file_zmagic(struct magic_set *, int, const char *,
365     const unsigned char *, size_t);
366 protected int file_ascmagic(struct magic_set *, const unsigned char *, size_t);
367 protected int file_ascmagic_with_encoding(struct magic_set *,
368     const unsigned char *, size_t, unichar *, size_t, const char *,
369     const char *);
370 protected int file_encoding(struct magic_set *, const unsigned char *, size_t,
371     unichar **, size_t *, const char **, const char **, const char **);
372 protected int file_is_tar(struct magic_set *, const unsigned char *, size_t);
373 protected int file_softmagic(struct magic_set *, const unsigned char *, size_t,
374     size_t, int);
375 protected struct mlist *file_apprentice(struct magic_set *, const char *, int);
376 protected uint64_t file_signextend(struct magic_set *, struct magic *,
377     uint64_t);
378 protected void file_delmagic(struct magic *, int type, size_t entries);
379 protected void file_badread(struct magic_set *);
380 protected void file_badseek(struct magic_set *);
381 protected void file_oomem(struct magic_set *, size_t);
382 protected void file_error(struct magic_set *, int, const char *, ...)
383     __attribute__((__format__(__printf__, 3, 4)));
384 protected void file_magerror(struct magic_set *, const char *, ...)
385     __attribute__((__format__(__printf__, 2, 3)));
386 protected void file_magwarn(struct magic_set *, const char *, ...)
387     __attribute__((__format__(__printf__, 2, 3)));
388 protected void file_mdump(struct magic *);
389 protected void file_showstr(FILE *, const char *, size_t);
390 protected size_t file_mbswidth(const char *);
391 protected const char *file_getbuffer(struct magic_set *);
392 protected ssize_t sread(int, void *, size_t, int);
393 protected int file_check_mem(struct magic_set *, unsigned int);
394 protected int file_looks_utf8(const unsigned char *, size_t, unichar *,
395     size_t *);
396 #ifdef __EMX__
397 protected int file_os2_apptype(struct magic_set *, const char *, const void *,
398     size_t);
399 #endif /* __EMX__ */
400
401
402 #ifndef COMPILE_ONLY
403 extern const char *file_names[];
404 extern const size_t file_nnames;
405 #endif
406
407 #ifndef HAVE_STRERROR
408 extern int sys_nerr;
409 extern char *sys_errlist[];
410 #define strerror(e) \
411         (((e) >= 0 && (e) < sys_nerr) ? sys_errlist[(e)] : "Unknown error")
412 #endif
413
414 #ifndef HAVE_STRTOUL
415 #define strtoul(a, b, c)        strtol(a, b, c)
416 #endif
417
418 #ifndef HAVE_VASPRINTF
419 int vasprintf(char **, const char *, va_list);
420 #endif
421 #ifndef HAVE_ASPRINTF
422 int asprintf(char **ptr, const char *format_string, ...);
423 #endif
424
425 #ifndef HAVE_STRLCPY
426 size_t strlcpy(char *dst, const char *src, size_t siz);
427 #endif
428 #ifndef HAVE_STRLCAT
429 size_t strlcat(char *dst, const char *src, size_t siz);
430 #endif
431
432 #if defined(HAVE_MMAP) && defined(HAVE_SYS_MMAN_H) && !defined(QUICK)
433 #define QUICK
434 #endif
435
436 #ifndef O_BINARY
437 #define O_BINARY        0
438 #endif
439
440 #ifndef __cplusplus
441 #ifdef __GNUC__
442 #define FILE_RCSID(id) \
443 static const char rcsid[] __attribute__((__used__)) = id;
444 #else
445 #define FILE_RCSID(id) \
446 static const char *rcsid(const char *p) { \
447         return rcsid(p = id); \
448 }
449 #endif
450 #else
451 #define FILE_RCSID(id)
452 #endif
453
454 #endif /* __file_h__ */