]> CyberLeo.Net >> Repos - FreeBSD/FreeBSD.git/blob - usr.bin/file/magic.5
This commit was generated by cvs2svn to compensate for changes in r57416,
[FreeBSD/FreeBSD.git] / usr.bin / file / magic.5
1 .\"
2 .\" @(#)$FreeBSD$
3 .\"
4 .\" install as magic.4 on USG, magic.5 on V7 or Berkeley systems.
5 .\"
6 .Dd September 3, 1994
7 .Dt MAGIC 5
8 .Os "Public Domain"
9 .Sh NAME
10 .Nm magic
11 .Nd file command's magic number file
12 .Sh DESCRIPTION
13 This manual page documents the format of the magic file as
14 used by the
15 .Xr file 1
16 command, version 3.22. The
17 .Nm file
18 command identifies the type of a file using,
19 among other tests,
20 a test for whether the file begins with a certain
21 .Em "magic number" .
22 The file
23 .Pa /usr/share/misc/magic
24 specifies what magic numbers are to be tested for,
25 what message to print if a particular magic number is found,
26 and additional information to extract from the file.
27 .Pp
28 Each line of the file specifies a test to be performed.
29 A test compares the data starting at a particular offset
30 in the file with a 1-byte, 2-byte, or 4-byte numeric value or
31 a string.  If the test succeeds, a message is printed.
32 The line consists of the following fields:
33 .Bl -tag -width indent
34 .It offset
35 A number specifying the offset, in bytes, into the file of the data
36 which is to be tested.
37 .It type
38 The type of the data to be tested.  The possible values are:
39 .Bl -tag -width indent
40 .It byte
41 A one-byte value.
42 .It short
43 A two-byte value (on most systems) in this machine's native byte order.
44 .It long
45 A four-byte value (on most systems) in this machine's native byte order.
46 .It string
47 A string of bytes.
48 .It date
49 A four-byte value interpreted as a unix date.
50 .It beshort
51 A two-byte value (on most systems) in big-endian byte order.
52 .It belong
53 A four-byte value (on most systems) in big-endian byte order.
54 .It bedate
55 A four-byte value (on most systems) in big-endian byte order,
56 interpreted as a unix date.
57 .It leshort
58 A two-byte value (on most systems) in little-endian byte order.
59 .It lelong
60 A four-byte value (on most systems) in little-endian byte order.
61 .It ledate
62 A four-byte value (on most systems) in little-endian byte order,
63 interpreted as a unix date.
64 .El
65 .El
66 .Pp
67 The numeric types may optionally be followed by
68 .Em &
69 and a numeric value,
70 to specify that the value is to be AND'ed with the
71 numeric value before any comparisons are done.  Prepending a
72 .Em u
73 to the type indicates that ordered comparisons should be unsigned.
74 .Bl -tag -width indent
75 .It test
76 The value to be compared with the value from the file.  If the type is
77 numeric, this value
78 is specified in C form; if it is a string, it is specified as a C string
79 with the usual escapes permitted (e.g. \en for new-line).
80 .It ""
81 Numeric values
82 may be preceded by a character indicating the operation to be performed.
83 It may be
84 .Em = ,
85 to specify that the value from the file must equal the specified value,
86 .Em < ,
87 to specify that the value from the file must be less than the specified
88 value,
89 .Em > ,
90 to specify that the value from the file must be greater than the specified
91 value,
92 .Em & ,
93 to specify that the value from the file must have set all of the bits 
94 that are set in the specified value,
95 .Em ^ ,
96 to specify that the value from the file must have clear any of the bits 
97 that are set in the specified value, or
98 .Em x ,
99 to specify that any value will match. If the character is omitted,
100 it is assumed to be
101 .Em = .
102 .It ""
103 Numeric values are specified in C form; e.g.
104 .Em 13
105 is decimal,
106 .Em 013
107 is octal, and
108 .Em 0x13
109 is hexadecimal.
110 .It ""
111 For string values, the byte string from the
112 file must match the specified byte string. 
113 The operators
114 .Em = ,
115 .Em <
116 and
117 .Em >
118 (but not
119 .Em & )
120 can be applied to strings.
121 The length used for matching is that of the string argument
122 in the magic file.  This means that a line can match any string, and
123 then presumably print that string, by doing
124 .Em >\e0
125 (because all strings are greater than the null string).
126 .It message
127 The message to be printed if the comparison succeeds.  If the string
128 contains a
129 .Xr printf 3
130 format specification, the value from the file (with any specified masking
131 performed) is printed using the message as the format string.
132 .El
133 .Pp
134 Some file formats contain additional information which is to be printed
135 along with the file type.  A line which begins with the character
136 .Em >
137 indicates additional tests and messages to be printed.  The number of
138 .Em >
139 on the line indicates the level of the test; a line with no
140 .Em >
141 at the beginning is considered to be at level 0.
142 Each line at level
143 .Em n+1
144 is under the control of the line at level
145 .Em n
146 most closely preceding it in the magic file.
147 If the test on a line at level
148 .Em n
149 succeeds, the tests specified in all the subsequent lines at level
150 .Em n+1
151 are performed, and the messages printed if the tests succeed.  The next
152 line at level
153 .Em n
154 terminates this.
155 If the first character following the last
156 .Em >
157 is a
158 .Em (
159 then the string after the parenthesis is interpreted as an indirect offset.
160 That means that the number after the parenthesis is used as an offset in
161 the file. The value at that offset is read, and is used again as an offset
162 in the file. Indirect offsets are of the form:
163 .Em (x[.[bsl]][+-][y]) .
164 The value of 
165 .Em x
166 is used as an offset in the file. A byte, short or long is read at that offset
167 depending on the 
168 .Em [bsl]
169 type specifier. To that number the value of
170 .Em y
171 is added and the result is used as an offset in the file. The default type
172 if one is not specified is long.
173 .Pp
174 Sometimes you do not know the exact offset as this depends on the length of
175 preceding fields. You can specify an offset relative to the end of the
176 last uplevel field (of course this may only be done for sublevel tests, i.e.
177 test beginning with 
178 .Em > Ns ).
179 Such a relative offset is specified using
180 .Em &
181 as a prefix to the offset.
182 .Sh BUGS
183 The formats 
184 .Em long ,
185 .Em belong ,
186 .Em lelong ,
187 .Em short ,
188 .Em beshort ,
189 .Em leshort ,
190 .Em date ,
191 .Em bedate ,
192 and
193 .Em ledate
194 are system-dependent; perhaps they should be specified as a number
195 of bytes (2B, 4B, etc), 
196 since the files being recognized typically come from
197 a system on which the lengths are invariant.
198 .Pp
199 There is (currently) no support for specified-endian data to be used in
200 indirect offsets.
201 .Sh SEE ALSO
202 .Xr file 1
203 .\"
204 .\" From: guy@sun.uucp (Guy Harris)
205 .\" Newsgroups: net.bugs.usg
206 .\" Subject: /etc/magic's format isn't well documented
207 .\" Message-ID: <2752@sun.uucp>
208 .\" Date: 3 Sep 85 08:19:07 GMT
209 .\" Organization: Sun Microsystems, Inc.
210 .\" Lines: 136
211 .\" 
212 .\" Here's a manual page for the format accepted by the "file" made by adding
213 .\" the changes I posted to the S5R2 version.
214 .\"
215 .\" Modified for Ian Darwin's version of the file command.