]> CyberLeo.Net >> Repos - FreeBSD/releng/10.0.git/blob - share/i18n/csmapper/APPLE/SYMBOL%UCS.src
- Copy stable/10 (r259064) to releng/10.0 as part of the
[FreeBSD/releng/10.0.git] / share / i18n / csmapper / APPLE / SYMBOL%UCS.src
1 # $FreeBSD$
2
3 TYPE            ROWCOL
4 NAME            SYMBOL/UCS
5 SRC_ZONE        0x00-0xFF
6 OOB_MODE        ILSEQ
7 DST_ILSEQ       0xFFFE
8 DST_UNIT_BITS   16
9
10 BEGIN_MAP
11 #=======================================================================
12 #   File name:  SYMBOL.TXT
13 #
14 #   Contents:   Map (external version) from Mac OS Symbol
15 #               character set to Unicode 4.0 and later.
16 #
17 #   Copyright:  (c) 1994-2002, 2005 by Apple Computer, Inc., all rights
18 #               reserved.
19 #
20 #   Contact:    charsets@apple.com
21 #
22 #   Changes:
23 #
24 #       c02  2005-Apr-05    Change mappings for 0xBD, 0xE0. Update
25 #                           header comments. Matches internal xml <c1.2>
26 #                           and Text Encoding Converter 2.0.
27 #      b4,c1 2002-Dec-19    Update mappings for encoded glyph fragments
28 #                           0xBE, 0xE6-EF, 0xF4, 0xF6-FE to use new
29 #                           Unicode 3.2 characters instead of sequences
30 #                           involving corporate-use characters. Update
31 #                           URLs, notes. Matches internal utom<b4>.
32 #       b03  1999-Sep-22    Update contact e-mail address. Matches
33 #                           internal utom<b3>, ufrm<b3>, and Text
34 #                           Encoding Converter version 1.5.
35 #       b02  1998-Aug-18    Encoding changed for Mac OS 8.5; add new
36 #                           mapping from 0xA0 to EURO SIGN. Matches
37 #                           internal utom<b3>, ufrm<b3>.
38 #       n05  1998-Feb-05    Update to match internal utom<n5>, ufrm<n15>
39 #                           and Text Encoding Converter version 1.3:
40 #                           Use standard Unicodes plus transcoding hints
41 #                           instead of single corporate characters, also
42 #                           change mappings for 0xE1 & 0xF1 from U+2329
43 #                           & U+232A to their canonical decompositions;
44 #                           see details below. Also update header
45 #                           comments to new format.
46 #       n03  1995-Apr-15    First version (after fixing some typos).
47 #                           Matches internal ufrm<n4>.
48 #
49 # Standard header:
50 # ----------------
51 #
52 #   Apple, the Apple logo, and Macintosh are trademarks of Apple
53 #   Computer, Inc., registered in the United States and other countries.
54 #   Unicode is a trademark of Unicode Inc. For the sake of brevity,
55 #   throughout this document, "Macintosh" can be used to refer to
56 #   Macintosh computers and "Unicode" can be used to refer to the
57 #   Unicode standard.
58 #
59 #   Apple Computer, Inc. ("Apple") makes no warranty or representation,
60 #   either express or implied, with respect to this document and the
61 #   included data, its quality, accuracy, or fitness for a particular
62 #   purpose. In no event will Apple be liable for direct, indirect,
63 #   special, incidental, or consequential damages resulting from any
64 #   defect or inaccuracy in this document or the included data.
65 #
66 #   These mapping tables and character lists are subject to change.
67 #   The latest tables should be available from the following:
68 #
69 #   <http://www.unicode.org/Public/MAPPINGS/VENDORS/APPLE/>
70 #
71 #   For general information about Mac OS encodings and these mapping
72 #   tables, see the file "README.TXT".
73 #
74 # Format:
75 # -------
76 #
77 #   Three tab-separated columns;
78 #   '#' begins a comment which continues to the end of the line.
79 #     Column #1 is the Mac OS Symbol code (in hex as 0xNN)
80 #     Column #2 is the corresponding Unicode or Unicode sequence
81 #       (in hex as 0xNNNN or 0xNNNN+0xNNNN).
82 #     Column #3 is a comment containing the Unicode name.
83 #       In some cases an additional comment follows the Unicode name.
84 #
85 #   The entries are in Mac OS Symbol code order.
86 #
87 #   Some of these mappings require the use of corporate characters.
88 #   See the file "CORPCHAR.TXT" and notes below.
89 #
90 #   Control character mappings are not shown in this table, following
91 #   the conventions of the standard UTC mapping tables. However, the
92 #   Mac OS Symbol character set uses the standard control characters
93 #   at 0x00-0x1F and 0x7F.
94 #
95 # Notes on Mac OS Symbol:
96 # -----------------------
97 #
98 #   This is a legacy Mac OS encoding; in the Mac OS X Carbon and Cocoa
99 #   environments, it is only supported directly in programming
100 #   interfaces for QuickDraw Text, the Script Manager, and related
101 #   Text Utilities. For other purposes it is supported via transcoding
102 #   to and from Unicode.
103 #
104 #   The Mac OS Symbol encoding shares the script code smRoman
105 #   (0) with the Mac OS Roman encoding. To determine if the Symbol
106 #   encoding is being used, you must check if the font name is
107 #   "Symbol".
108 #
109 #   Before Mac OS 8.5, code point 0xA0 was unused. In Mac OS 8.5
110 #   and later versions, code point 0xA0 is EURO SIGN and maps to
111 #   U+20AC (the Symbol font is updated for Mac OS 8.5 to reflect
112 #   this).
113 #
114 #   The layout of the Mac OS Symbol character set is identical to
115 #   the layout of the Adobe Symbol encoding vector, with the
116 #   addition of the Apple logo character at 0xF0.
117 #
118 #   This character set encodes a number of glyph fragments. Some are
119 #   used as extenders: 0x60 is used to extend radical signs, 0xBD and
120 #   0xBE are used to extend vertical and horizontal arrows, etc. In
121 #   addition, there are top, bottom, and center sections for
122 #   parentheses, brackets, integral signs, and other signs that may
123 #   extend vertically for 2 or more lines of normal text. As of
124 #   Unicode 3.2, most of these are now encoded in Unicode; a few are
125 #   not, so these are mapped using corporate-zone Unicode characters
126 #   (see below).
127 #
128 #   In addition, Symbol separately encodes both serif and sans-serif
129 #   forms for copyright, trademark, and registered signs. Unicode
130 #   encodes only the abstract characters, so one set of these (the
131 #   sans-serif forms) are also mapped using corporate-zone Unicode
132 #   characters (see below).
133 #
134 #   The following code points are unused, and are not shown here:
135 #   0x80-0x9F, 0xFF.
136 #
137 # Unicode mapping issues and notes:
138 # ---------------------------------
139 #
140 #   The goals in the mappings provided here are:
141 #   - Ensure roundtrip mapping from every character in the Mac OS
142 #     Symbol character set to Unicode and back
143 #   - Use standard Unicode characters as much as possible, to
144 #     maximize interchangeability of the resulting Unicode text.
145 #     Whenever possible, avoid having content carried by private-use
146 #     characters.
147 #
148 #   Some of the characters in the Mac OS Symbol character set do not
149 #   correspond to distinct, single Unicode characters. To map these
150 #   and satisfy both goals above, we employ various strategies.
151 #
152 #   a) If possible, use private use characters in combination with
153 #   standard Unicode characters to mark variants of the standard
154 #   Unicode character.
155 #
156 #   Apple has defined a block of 32 corporate characters as "transcoding
157 #   hints." These are used in combination with standard Unicode
158 #   characters to force them to be treated in a special way for mapping
159 #   to other encodings; they have no other effect. Sixteen of these
160 #   transcoding hints are "grouping hints" - they indicate that the next
161 #   2-4 Unicode characters should be treated as a single entity for
162 #   transcoding. The other sixteen transcoding hints are "variant tags"
163 #   - they are like combining characters, and can follow a standard
164 #   Unicode (or a sequence consisting of a base character and other
165 #   combining characters) to cause it to be treated in a special way for
166 #   transcoding. These always terminate a combining-character sequence.
167 #
168 #   The transcoding coding hint used in this mapping table is the
169 #   variant tag 0xF87F. Since this is combined with standard Unicode
170 #   characters, some characters in the Mac OS Symbol character set map
171 #   to a sequence of two Unicodes instead of a single Unicode character.
172 #
173 #   For example, the Mac OS Symbol character at 0xE2 is an alternate,
174 #   sans-serif form of the REGISTERED SIGN (the standard mapping is for
175 #   the abstract character at 0xD2, which here has a serif form). So 0xE2
176 #   is mapped to 0x00AE (REGISTERED SIGN) + 0xF87F (a variant tag).
177 #
178 #   b) Otherwise, use private use characters by themselves to map
179 #   Mac OS Symbol characters which have no relationship to any standard
180 #   Unicode character.
181 #
182 #   The following additional corporate zone Unicode characters are
183 #   used for this purpose here:
184 #
185 #     0xF8E5  radical extender
186 #     0xF8FF  Apple logo
187 #
188 #   NOTE: The graphic image associated with the Apple logo character
189 #   is not authorized for use without permission of Apple, and
190 #   unauthorized use might constitute trademark infringement.
191 #
192 # Details of mapping changes in each version:
193 # -------------------------------------------
194 #
195 #   Changes from version c01 to version c02:
196 #
197 #   - Update mappings for 0xBD from 0xF8E6 to 0x23D0 (use new Unicode
198 #     4.0 char)
199 #   - Correct mapping for 0xE0 from 0x22C4 to 0x25CA
200 #
201 #   Changes from version b02 to version b03/c01:
202 #
203 #   - Update mappings for encoded glyph fragments 0xBE, 0xE6-EF, 0xF4,
204 #     0xF6-FE to use new Unicode 3.2 characters instead of using either
205 #     single corporate-use characters (e.g. 0xBE was mapped to 0xF8E7) or
206 #     sequences combining a standard Unicode character with a transcoding
207 #     hint (e.g. 0xE6 was mapped to 0x0028+0xF870).
208 #
209 #   Changes from version n05 to version b02:
210 #
211 #   - Encoding changed for Mac OS 8.5; 0xA0 now maps to 0x20AC, EURO
212 #   SIGN. 0xA0 was unmapped in earlier versions.
213 #
214 #   Changes from version n03 to version n05:
215 #
216 #   - Change strict mapping for 0xE1 & 0xF1 from U+2329 & U+232A
217 #     to their canonical decompositions, U+3008 & U+3009.
218 #
219 #   - Change mapping for the following to use standard Unicode +
220 #     transcoding hint, instead of single corporate-zone
221 #     character: 0xE2-0xE4, 0xE6-0xEE, 0xF4, 0xF6-0xFE.
222 #
223 ##################
224
225 0x00 - 0x7F = 0x0000 -
226 0xA0 = 0x20AC
227 0xA1 = 0x03D2
228 0xA2 = 0x2032
229 0xA3 = 0x2264
230 0xA4 = 0x2044
231 0xA5 = 0x221E
232 0xA6 = 0x0192
233 0xA7 = 0x2663
234 0xA8 = 0x2666
235 0xA9 = 0x2665
236 0xAA = 0x2660
237 0xAB = 0x2194
238 0xAC = 0x2190
239 0xAD = 0x2191
240 0xAE = 0x2192
241 0xAF = 0x2193
242 0xB0 = 0x00B0
243 0xB1 = 0x00B1
244 0xB2 = 0x2033
245 0xB3 = 0x2265
246 0xB4 = 0x00D7
247 0xB5 = 0x221D
248 0xB6 = 0x2202
249 0xB7 = 0x2022
250 0xB8 = 0x00F7
251 0xB9 = 0x2260
252 0xBA = 0x2261
253 0xBB = 0x2248
254 0xBC = 0x2026
255 0xBD = 0x23D0
256 0xBE = 0x23AF
257 0xBF = 0x21B5
258 0xC0 = 0x2135
259 0xC1 = 0x2111
260 0xC2 = 0x211C
261 0xC3 = 0x2118
262 0xC4 = 0x2297
263 0xC5 = 0x2295
264 0xC6 = 0x2205
265 0xC7 = 0x2229
266 0xC8 = 0x222A
267 0xC9 = 0x2283
268 0xCA = 0x2287
269 0xCB = 0x2284
270 0xCC = 0x2282
271 0xCD = 0x2286
272 0xCE = 0x2208
273 0xCF = 0x2209
274 0xD0 = 0x2220
275 0xD1 = 0x2207
276 0xD2 = 0x00AE
277 0xD3 = 0x00A9
278 0xD4 = 0x2122
279 0xD5 = 0x220F
280 0xD6 = 0x221A
281 0xD7 = 0x22C5
282 0xD8 = 0x00AC
283 0xD9 = 0x2227
284 0xDA = 0x2228
285 0xDB = 0x21D4
286 0xDC = 0x21D0
287 0xDD = 0x21D1
288 0xDE = 0x21D2
289 0xDF = 0x21D3
290 0xE0 = 0x25CA
291 0xE1 = 0x3008
292 #0xE2 = 0x00AE+0xF87F
293 #0xE3 = 0x00A9+0xF87F
294 #0xE4 = 0x2122+0xF87F
295 0xE5 = 0x2211
296 0xE6 = 0x239B
297 0xE7 = 0x239C
298 0xE8 = 0x239D
299 0xE9 = 0x23A1
300 0xEA = 0x23A2
301 0xEB = 0x23A3
302 0xEC = 0x23A7
303 0xED = 0x23A8
304 0xEE = 0x23A9
305 0xEF = 0x23AA
306 0xF0 = 0xF8FF
307 0xF1 = 0x3009
308 0xF2 = 0x222B
309 0xF3 = 0x2320
310 0xF4 = 0x23AE
311 0xF5 = 0x2321
312 0xF6 = 0x239E
313 0xF7 = 0x239F
314 0xF8 = 0x23A0
315 0xF9 = 0x23A4
316 0xFA = 0x23A5
317 0xFB = 0x23A6
318 0xFC = 0x23AB
319 0xFD = 0x23AC
320 0xFE = 0x23AD
321 END_MAP