]> CyberLeo.Net >> Repos - FreeBSD/releng/9.2.git/blob - share/i18n/csmapper/APPLE/UCS%SYMBOL.src
- Copy stable/9 to releng/9.2 as part of the 9.2-RELEASE cycle.
[FreeBSD/releng/9.2.git] / share / i18n / csmapper / APPLE / UCS%SYMBOL.src
1 # $FreeBSD$
2
3 TYPE            ROWCOL
4 NAME            UCS/SYMBOL
5 SRC_ZONE        0x0000-0xF8FF
6 OOB_MODE        INVALID
7 DST_INVALID     0x100
8 DST_UNIT_BITS   16
9
10 BEGIN_MAP
11 #=======================================================================
12 #   File name:  SYMBOL.TXT
13 #
14 #   Contents:   Map (external version) from Mac OS Symbol
15 #               character set to Unicode 4.0 and later.
16 #
17 #   Copyright:  (c) 1994-2002, 2005 by Apple Computer, Inc., all rights
18 #               reserved.
19 #
20 #   Contact:    charsets@apple.com
21 #
22 #   Changes:
23 #
24 #       c02  2005-Apr-05    Change mappings for 0xBD, 0xE0. Update
25 #                           header comments. Matches internal xml <c1.2>
26 #                           and Text Encoding Converter 2.0.
27 #      b4,c1 2002-Dec-19    Update mappings for encoded glyph fragments
28 #                           0xBE, 0xE6-EF, 0xF4, 0xF6-FE to use new
29 #                           Unicode 3.2 characters instead of sequences
30 #                           involving corporate-use characters. Update
31 #                           URLs, notes. Matches internal utom<b4>.
32 #       b03  1999-Sep-22    Update contact e-mail address. Matches
33 #                           internal utom<b3>, ufrm<b3>, and Text
34 #                           Encoding Converter version 1.5.
35 #       b02  1998-Aug-18    Encoding changed for Mac OS 8.5; add new
36 #                           mapping from 0xA0 to EURO SIGN. Matches
37 #                           internal utom<b3>, ufrm<b3>.
38 #       n05  1998-Feb-05    Update to match internal utom<n5>, ufrm<n15>
39 #                           and Text Encoding Converter version 1.3:
40 #                           Use standard Unicodes plus transcoding hints
41 #                           instead of single corporate characters, also
42 #                           change mappings for 0xE1 & 0xF1 from U+2329
43 #                           & U+232A to their canonical decompositions;
44 #                           see details below. Also update header
45 #                           comments to new format.
46 #       n03  1995-Apr-15    First version (after fixing some typos).
47 #                           Matches internal ufrm<n4>.
48 #
49 # Standard header:
50 # ----------------
51 #
52 #   Apple, the Apple logo, and Macintosh are trademarks of Apple
53 #   Computer, Inc., registered in the United States and other countries.
54 #   Unicode is a trademark of Unicode Inc. For the sake of brevity,
55 #   throughout this document, "Macintosh" can be used to refer to
56 #   Macintosh computers and "Unicode" can be used to refer to the
57 #   Unicode standard.
58 #
59 #   Apple Computer, Inc. ("Apple") makes no warranty or representation,
60 #   either express or implied, with respect to this document and the
61 #   included data, its quality, accuracy, or fitness for a particular
62 #   purpose. In no event will Apple be liable for direct, indirect,
63 #   special, incidental, or consequential damages resulting from any
64 #   defect or inaccuracy in this document or the included data.
65 #
66 #   These mapping tables and character lists are subject to change.
67 #   The latest tables should be available from the following:
68 #
69 #   <http://www.unicode.org/Public/MAPPINGS/VENDORS/APPLE/>
70 #
71 #   For general information about Mac OS encodings and these mapping
72 #   tables, see the file "README.TXT".
73 #
74 # Format:
75 # -------
76 #
77 #   Three tab-separated columns;
78 #   '#' begins a comment which continues to the end of the line.
79 #     Column #1 is the Mac OS Symbol code (in hex as 0xNN)
80 #     Column #2 is the corresponding Unicode or Unicode sequence
81 #       (in hex as 0xNNNN or 0xNNNN+0xNNNN).
82 #     Column #3 is a comment containing the Unicode name.
83 #       In some cases an additional comment follows the Unicode name.
84 #
85 #   The entries are in Mac OS Symbol code order.
86 #
87 #   Some of these mappings require the use of corporate characters.
88 #   See the file "CORPCHAR.TXT" and notes below.
89 #
90 #   Control character mappings are not shown in this table, following
91 #   the conventions of the standard UTC mapping tables. However, the
92 #   Mac OS Symbol character set uses the standard control characters
93 #   at 0x00-0x1F and 0x7F.
94 #
95 # Notes on Mac OS Symbol:
96 # -----------------------
97 #
98 #   This is a legacy Mac OS encoding; in the Mac OS X Carbon and Cocoa
99 #   environments, it is only supported directly in programming
100 #   interfaces for QuickDraw Text, the Script Manager, and related
101 #   Text Utilities. For other purposes it is supported via transcoding
102 #   to and from Unicode.
103 #
104 #   The Mac OS Symbol encoding shares the script code smRoman
105 #   (0) with the Mac OS Roman encoding. To determine if the Symbol
106 #   encoding is being used, you must check if the font name is
107 #   "Symbol".
108 #
109 #   Before Mac OS 8.5, code point 0xA0 was unused. In Mac OS 8.5
110 #   and later versions, code point 0xA0 is EURO SIGN and maps to
111 #   U+20AC (the Symbol font is updated for Mac OS 8.5 to reflect
112 #   this).
113 #
114 #   The layout of the Mac OS Symbol character set is identical to
115 #   the layout of the Adobe Symbol encoding vector, with the
116 #   addition of the Apple logo character at 0xF0.
117 #
118 #   This character set encodes a number of glyph fragments. Some are
119 #   used as extenders: 0x60 is used to extend radical signs, 0xBD and
120 #   0xBE are used to extend vertical and horizontal arrows, etc. In
121 #   addition, there are top, bottom, and center sections for
122 #   parentheses, brackets, integral signs, and other signs that may
123 #   extend vertically for 2 or more lines of normal text. As of
124 #   Unicode 3.2, most of these are now encoded in Unicode; a few are
125 #   not, so these are mapped using corporate-zone Unicode characters
126 #   (see below).
127 #
128 #   In addition, Symbol separately encodes both serif and sans-serif
129 #   forms for copyright, trademark, and registered signs. Unicode
130 #   encodes only the abstract characters, so one set of these (the
131 #   sans-serif forms) are also mapped using corporate-zone Unicode
132 #   characters (see below).
133 #
134 #   The following code points are unused, and are not shown here:
135 #   0x80-0x9F, 0xFF.
136 #
137 # Unicode mapping issues and notes:
138 # ---------------------------------
139 #
140 #   The goals in the mappings provided here are:
141 #   - Ensure roundtrip mapping from every character in the Mac OS
142 #     Symbol character set to Unicode and back
143 #   - Use standard Unicode characters as much as possible, to
144 #     maximize interchangeability of the resulting Unicode text.
145 #     Whenever possible, avoid having content carried by private-use
146 #     characters.
147 #
148 #   Some of the characters in the Mac OS Symbol character set do not
149 #   correspond to distinct, single Unicode characters. To map these
150 #   and satisfy both goals above, we employ various strategies.
151 #
152 #   a) If possible, use private use characters in combination with
153 #   standard Unicode characters to mark variants of the standard
154 #   Unicode character.
155 #
156 #   Apple has defined a block of 32 corporate characters as "transcoding
157 #   hints." These are used in combination with standard Unicode
158 #   characters to force them to be treated in a special way for mapping
159 #   to other encodings; they have no other effect. Sixteen of these
160 #   transcoding hints are "grouping hints" - they indicate that the next
161 #   2-4 Unicode characters should be treated as a single entity for
162 #   transcoding. The other sixteen transcoding hints are "variant tags"
163 #   - they are like combining characters, and can follow a standard
164 #   Unicode (or a sequence consisting of a base character and other
165 #   combining characters) to cause it to be treated in a special way for
166 #   transcoding. These always terminate a combining-character sequence.
167 #
168 #   The transcoding coding hint used in this mapping table is the
169 #   variant tag 0xF87F. Since this is combined with standard Unicode
170 #   characters, some characters in the Mac OS Symbol character set map
171 #   to a sequence of two Unicodes instead of a single Unicode character.
172 #
173 #   For example, the Mac OS Symbol character at 0xE2 is an alternate,
174 #   sans-serif form of the REGISTERED SIGN (the standard mapping is for
175 #   the abstract character at 0xD2, which here has a serif form). So 0xE2
176 #   is mapped to 0x00AE (REGISTERED SIGN) + 0xF87F (a variant tag).
177 #
178 #   b) Otherwise, use private use characters by themselves to map
179 #   Mac OS Symbol characters which have no relationship to any standard
180 #   Unicode character.
181 #
182 #   The following additional corporate zone Unicode characters are
183 #   used for this purpose here:
184 #
185 #     0xF8E5  radical extender
186 #     0xF8FF  Apple logo
187 #
188 #   NOTE: The graphic image associated with the Apple logo character
189 #   is not authorized for use without permission of Apple, and
190 #   unauthorized use might constitute trademark infringement.
191 #
192 # Details of mapping changes in each version:
193 # -------------------------------------------
194 #
195 #   Changes from version c01 to version c02:
196 #
197 #   - Update mappings for 0xBD from 0xF8E6 to 0x23D0 (use new Unicode
198 #     4.0 char)
199 #   - Correct mapping for 0xE0 from 0x22C4 to 0x25CA
200 #
201 #   Changes from version b02 to version b03/c01:
202 #
203 #   - Update mappings for encoded glyph fragments 0xBE, 0xE6-EF, 0xF4,
204 #     0xF6-FE to use new Unicode 3.2 characters instead of using either
205 #     single corporate-use characters (e.g. 0xBE was mapped to 0xF8E7) or
206 #     sequences combining a standard Unicode character with a transcoding
207 #     hint (e.g. 0xE6 was mapped to 0x0028+0xF870).
208 #
209 #   Changes from version n05 to version b02:
210 #
211 #   - Encoding changed for Mac OS 8.5; 0xA0 now maps to 0x20AC, EURO
212 #   SIGN. 0xA0 was unmapped in earlier versions.
213 #
214 #   Changes from version n03 to version n05:
215 #
216 #   - Change strict mapping for 0xE1 & 0xF1 from U+2329 & U+232A
217 #     to their canonical decompositions, U+3008 & U+3009.
218 #
219 #   - Change mapping for the following to use standard Unicode +
220 #     transcoding hint, instead of single corporate-zone
221 #     character: 0xE2-0xE4, 0xE6-0xEE, 0xF4, 0xF6-0xFE.
222 #
223 ##################
224
225 0x0000 - 0x007F = 0x00 -
226 0x00A9 = 0xD3
227 #0x00A9+0xF87F = 0xE3
228 0x00AC = 0xD8
229 0x00AE = 0xD2
230 #0x00AE+0xF87F = 0xE2
231 0x00B0 = 0xB0
232 0x00B1 = 0xB1
233 0x00D7 = 0xB4
234 0x00F7 = 0xB8
235 0x0192 = 0xA6
236 0x0391 = 0x41
237 0x0392 = 0x42
238 0x0393 = 0x47
239 0x0394 = 0x44
240 0x0395 = 0x45
241 0x0396 = 0x5A
242 0x0397 = 0x48
243 0x0398 = 0x51
244 0x0399 = 0x49
245 0x039A = 0x4B
246 0x039B = 0x4C
247 0x039C = 0x4D
248 0x039D = 0x4E
249 0x039E = 0x58
250 0x039F = 0x4F
251 0x03A0 = 0x50
252 0x03A1 = 0x52
253 0x03A3 = 0x53
254 0x03A4 = 0x54
255 0x03A5 = 0x55
256 0x03A6 = 0x46
257 0x03A7 = 0x43
258 0x03A8 = 0x59
259 0x03A9 = 0x57
260 0x03B1 = 0x61
261 0x03B2 = 0x62
262 0x03B3 = 0x67
263 0x03B4 = 0x64
264 0x03B5 = 0x65
265 0x03B6 = 0x7A
266 0x03B7 = 0x68
267 0x03B8 = 0x71
268 0x03B9 = 0x69
269 0x03BA = 0x6B
270 0x03BB = 0x6C
271 0x03BC = 0x6D
272 0x03BD = 0x6E
273 0x03BE = 0x78
274 0x03BF = 0x6F
275 0x03C0 = 0x70
276 0x03C1 = 0x72
277 0x03C2 = 0x56
278 0x03C3 = 0x73
279 0x03C4 = 0x74
280 0x03C5 = 0x75
281 0x03C6 = 0x66
282 0x03C7 = 0x63
283 0x03C8 = 0x79
284 0x03C9 = 0x77
285 0x03D1 = 0x4A
286 0x03D2 = 0xA1
287 0x03D5 = 0x6A
288 0x03D6 = 0x76
289 0x2022 = 0xB7
290 0x2026 = 0xBC
291 0x2032 = 0xA2
292 0x2033 = 0xB2
293 0x2044 = 0xA4
294 0x20AC = 0xA0
295 0x2111 = 0xC1
296 0x2118 = 0xC3
297 0x211C = 0xC2
298 0x2122 = 0xD4
299 #0x2122+0xF87F = 0xE4
300 0x2135 = 0xC0
301 0x2190 = 0xAC
302 0x2191 = 0xAD
303 0x2192 = 0xAE
304 0x2193 = 0xAF
305 0x2194 = 0xAB
306 0x21B5 = 0xBF
307 0x21D0 = 0xDC
308 0x21D1 = 0xDD
309 0x21D2 = 0xDE
310 0x21D3 = 0xDF
311 0x21D4 = 0xDB
312 0x2200 = 0x22
313 0x2202 = 0xB6
314 0x2203 = 0x24
315 0x2205 = 0xC6
316 0x2207 = 0xD1
317 0x2208 = 0xCE
318 0x2209 = 0xCF
319 0x220D = 0x27
320 0x220F = 0xD5
321 0x2211 = 0xE5
322 0x2212 = 0x2D
323 0x2217 = 0x2A
324 0x221A = 0xD6
325 0x221D = 0xB5
326 0x221E = 0xA5
327 0x2220 = 0xD0
328 0x2227 = 0xD9
329 0x2228 = 0xDA
330 0x2229 = 0xC7
331 0x222A = 0xC8
332 0x222B = 0xF2
333 0x2234 = 0x5C
334 0x223C = 0x7E
335 0x2245 = 0x40
336 0x2248 = 0xBB
337 0x2260 = 0xB9
338 0x2261 = 0xBA
339 0x2264 = 0xA3
340 0x2265 = 0xB3
341 0x2282 = 0xCC
342 0x2283 = 0xC9
343 0x2284 = 0xCB
344 0x2286 = 0xCD
345 0x2287 = 0xCA
346 0x2295 = 0xC5
347 0x2297 = 0xC4
348 0x22A5 = 0x5E
349 0x22C5 = 0xD7
350 0x2320 = 0xF3
351 0x2321 = 0xF5
352 0x239B = 0xE6
353 0x239C = 0xE7
354 0x239D = 0xE8
355 0x239E = 0xF6
356 0x239F = 0xF7
357 0x23A0 = 0xF8
358 0x23A1 = 0xE9
359 0x23A2 = 0xEA
360 0x23A3 = 0xEB
361 0x23A4 = 0xF9
362 0x23A5 = 0xFA
363 0x23A6 = 0xFB
364 0x23A7 = 0xEC
365 0x23A8 = 0xED
366 0x23A9 = 0xEE
367 0x23AA = 0xEF
368 0x23AB = 0xFC
369 0x23AC = 0xFD
370 0x23AD = 0xFE
371 0x23AE = 0xF4
372 0x23AF = 0xBE
373 0x23D0 = 0xBD
374 0x25CA = 0xE0
375 0x2660 = 0xAA
376 0x2663 = 0xA7
377 0x2665 = 0xA9
378 0x2666 = 0xA8
379 0x3008 = 0xE1
380 0x3009 = 0xF1
381 0xF8E5 = 0x60
382 0xF8FF = 0xF0
383 END_MAP