跳转到内容

ISO/IEC 8859

出自维基百科,自由个百科全书

ISO/IEC 8859,是国际标准化组织(ISO)搭国际电工委员会(IEC)联合制订个一系列8字符编码。去脱弃置个ISO/IEC 8859-12,箇套标准拢共有得15隻部分。

ISO/IEC 8859-1到4本生是Ecma International个标准ECMA-94。

保养箇套标准个ISO工作组已经解散,保养工作停止。ISO箇歇精力侪摆拉ISO/IEC 10646高头。

引言

[编辑]

ASCII 95隻“可印字符”,畀现代英语用是抨足了。但是,别个使用拉丁字母个语言需要额外个符号,ASCII朆收足。像煞德语个ß、西班牙语个ñ、北欧语言个å搭匈牙利语个ő。ISO/IEC 8859想办法用足8位字节里个8位,箇恁就好再摆落128隻字符。但是要摆个字符远远叫超过128隻,单一个8位字符编码行弗落,个咾研发仔靠十種拉丁字母映射表。

字符

[编辑]

ISO/IEC 8859标准弗是为仔印刷设计个,而是为仔信息好可靠个交换。

估计假使一隻字符朆广泛用于数据处理字集、该语言个打字机键盘浪也朆渠个键位,个么隻字符就弗收。个咾一眼欧洲语言用个带方向个双引号«搭 »收了,英语搭别个语言用个带方向个双引号“ 搭” 朆收。法语缚拢个œ搭Œ也朆收,因为好打成功拆开个“oe”。只用于全文大写个Ÿ也厾脱。不过,箇些儿字符后首搭新个欧圆符号€一淘收进ISO/IEC 8859-15。荷兰语个ij搭IJ、罗马尼亚语个Ș/ș搭Ț/ț后首也收进ISO/IEC 8859-16。

多数ISO/IEC 8859标准备仔欧洲样样式式用拉丁字母个语言个加符字符。还有眼标准备仔非拉丁字母字符,譬方 希腊字母、基里尔字母、希伯来字母泰字阿拉伯字母。都可以使用这个形式来储存及表示。不过,标准朆搭东亚文字备字符,因为表意文字需要几千隻码点。越南语虽然罗马化哉,码点仍旧弗够。



[编辑]
ISO/IEC 8859各部分对照
两进制 八进制 十进制 十六进制 1 2 3 4 5 6 7 8 9 10 11 13 14 15 16
1010 0000 240 160 A0 非断空格 (NBSP)
1010 0001 241 161 A1 ¡ Ą Ħ Ą Ё     ¡ Ą ¡ Ą
1010 0010 242 162 A2 ¢ ˘ ĸ Ђ   ¢ ¢ Ē ¢ ¢ ą
1010 0011 243 163 A3 £ Ł £ Ŗ Ѓ   £ Ģ £ Ł
1010 0100 244 164 A4 ¤ Є ¤ ¤ Ī ¤ Ċ
1010 0101 245 165 A5 ¥ Ľ   Ĩ Ѕ   ¥ Ĩ ċ ¥
1010 0110 246 166 A6 ¦ Ś Ĥ Ļ І   ¦ Ķ ¦ Š
1010 0111 247 167 A7 § Ї   § §
1010 1000 250 168 A8 ¨ Ј   ¨ Ļ Ø š
1010 1001 251 169 A9 © Š İ Š Љ   © Đ ©
1010 1010 252 170 AA ª Ş Ē Њ   ͺ × ª Š Ŗ ª Ș
1010 1011 253 171 AB « Ť Ğ Ģ Ћ   « Ŧ « «
1010 1100 254 172 AC ¬ Ź Ĵ Ŧ Ќ ، ¬ Ž ¬ ¬ Ź
1010 1101 255 173 AD 软连接号 (SHY) SHY
1010 1110 256 174 AE ® Ž   Ž Ў     ® Ū ® ź
1010 1111 257 175 AF ¯ Ż ¯ Џ   ¯ Ŋ Æ Ÿ ¯ Ż
1011 0000 260 176 B0 ° А   ° ° °
1011 0001 261 177 B1 ± ą ħ ą Б   ± ą ± ±
1011 0010 262 178 B2 ² ˛ ² ˛ В   ² ē ² Ġ ² Č
1011 0011 263 179 B3 ³ ł ³ ŗ Г   ³ ģ ³ ġ ³ ł
1011 0100 264 180 B4 ´ Д   ΄ ´ ī Ž
1011 0101 265 181 B5 µ ľ µ ĩ Е   ΅ µ ĩ µ µ
1011 0110 266 182 B6 ś ĥ ļ Ж   Ά ķ
1011 0111 267 183 B7 ˇ ˇ З  
1011 1000 270 184 B8 ¸ И   Έ ¸ ļ ø ž
1011 1001 271 185 B9 ¹ š ı š Й   Ή ¹ đ ¹ ¹ č
1011 1010 272 186 BA º ş ē К   Ί ÷ º š ŗ º ș
1011 1011 273 187 BB » ť ğ ģ Л ؛ » ŧ » »
1011 1100 274 188 BC ¼ ź ĵ ŧ М   Ό ¼ ž ¼ Œ
1011 1101 275 189 BD ½ ˝ ½ Ŋ Н   ½ ½ œ
1011 1110 276 190 BE ¾ ž   ž О   Ύ ¾ ū ¾ Ÿ
1011 1111 277 191 BF ¿ ż ŋ П ؟ Ώ   ¿ ŋ æ ¿ ż
1100 0000 300 192 C0 À Ŕ À Ā Р   ΐ   À Ā Ą À
1100 0001 301 193 C1 Á С ء Α   Á Į Á
1100 0010 302 194 C2 Â Т آ Β   Â Ā Â
1100 0011 303 195 C3 Ã Ă   Ã У أ Γ   Ã Ć Ã Ă
1100 0100 304 196 C4 Ä Ф ؤ Δ   Ä Ä
1100 0101 305 197 C5 Å Ĺ Ċ Å Х إ Ε   Å Å Ć
1100 0110 306 198 C6 Æ Ć Ĉ Æ Ц ئ Ζ   Æ Ę Æ
1100 0111 307 199 C7 Ç Į Ч ا Η   Ç Į Ē Ç
1100 1000 310 200 C8 È Č È Č Ш ب Θ   È Č Č È
1100 1001 311 201 C9 É Щ ة Ι   É É
1100 1010 312 202 CA Ê Ę Ê Ę Ъ ت Κ   Ê Ę Ź Ê
1100 1011 313 203 CB Ë Ы ث Λ   Ë Ė Ë
1100 1100 314 204 CC Ì Ě Ì Ė Ь ج Μ   Ì Ė Ģ Ì
1100 1101 315 205 CD Í Э ح Ν   Í Ķ Í
1100 1110 316 206 CE Î Ю خ Ξ   Î Ī Î
1100 1111 317 207 CF Ï Ď Ï Ī Я د Ο   Ï Ļ Ï
1101 0000 320 208 D0 Ð Đ   Đ а ذ Π   Ğ Ð Š Ŵ Ð
1101 0001 321 209 D1 Ñ Ń Ñ Ņ б ر Ρ   Ñ Ņ Ń Ñ Ń
1101 0010 322 210 D2 Ò Ň Ò Ō в ز     Ò Ō Ņ Ò
1101 0011 323 211 D3 Ó Ķ г س Σ   Ó Ó
1101 0100 324 212 D4 Ô д ش Τ   Ô Ō Ô
1101 0101 325 213 D5 Õ Ő Ġ Õ е ص Υ   Õ Ő
1101 0110 326 214 D6 Ö ж ض Φ   Ö Ö
1101 0111 327 215 D7 × з ط Χ   × Ũ × × Ś
1101 1000 330 216 D8 Ø Ř Ĝ Ø и ظ Ψ   Ø Ų Ø Ű
1101 1001 331 217 D9 Ù Ů Ù Ų й ع Ω   Ù Ų Ł Ù
1101 1010 332 218 DA Ú к غ Ϊ   Ú Ś Ú
1101 1011 333 219 DB Û Ű Û л   Ϋ   Û   Ū Û
1101 1100 334 220 DC Ü м   ά   Ü   Ü
1101 1101 335 221 DD Ý Ŭ Ũ н   έ   İ Ý   Ż Ý Ę
1101 1110 336 222 DE Þ Ţ Ŝ Ū о   ή   Ş Þ   Ž Ŷ Þ Ț
1101 1111 337 223 DF ß п   ί ß ฿ ß
1110 0000 340 224 E0 à ŕ à ā р ـ ΰ א à ā ą à
1110 0001 341 225 E1 á с ف α ב á į á
1110 0010 342 226 E2 â т ق β ג â ā â
1110 0011 343 227 E3 ã ă   ã у ك γ ד ã ć ã ă
1110 0100 344 228 E4 ä ф ل δ ה ä ä
1110 0101 345 229 E5 å ĺ ċ å х م ε ו å å ć
1110 0110 346 230 E6 æ ć ĉ æ ц ن ζ ז æ ę æ
1110 0111 347 231 E7 ç į ч ه η ח ç į ē ç
1110 1000 350 232 E8 è č è č ш و θ ט è č č è
1110 1001 351 233 E9 é щ ى ι י é é
1110 1010 352 234 EA ê ę ê ę ъ ي κ ך ê ę ź ê
1110 1011 353 235 EB ë ы ً λ כ ë ė ë
1110 1100 354 236 EC ì ě ì ė ь ٌ μ ל ì ė ģ ì
1110 1101 355 237 ED í э ٍ ν ם í ķ í
1110 1110 356 238 EE î ю َ ξ מ î ī î
1110 1111 357 239 EF ï ď ï ī я ُ ο ן ï ļ ï
1111 0000 360 240 F0 ð đ   đ ِ π נ ğ ð š ŵ ð đ
1111 0001 361 241 F1 ñ ń ñ ņ ё ّ ρ ס ñ ņ ń ñ ń
1111 0010 362 242 F2 ò ň ò ō ђ ْ ς ע ò ō ņ ò
1111 0011 363 243 F3 ó ķ ѓ   σ ף ó ó
1111 0100 364 244 F4 ô є   τ פ ô ō ô
1111 0101 365 245 F5 õ ő ġ õ ѕ   υ ץ õ ő
1111 0110 366 246 F6 ö і   φ צ ö ö
1111 0111 367 247 F7 ÷ ї   χ ק ÷ ũ ÷ ÷ ś
1111 1000 370 248 F8 ø ř ĝ ø ј   ψ ר ø ų ø ű
1111 1001 371 249 F9 ù ů ù ų љ   ω ש ù ų ł ù
1111 1010 372 250 FA ú њ   ϊ ת ú ś ú
1111 1011 373 251 FB û ű û ћ   ϋ   û ū û
1111 1100 374 252 FC ü ќ   ό   ü   ü
1111 1101 375 253 FD ý ŭ ũ §   ύ LRM ı ý   ż ý ę
1111 1110 376 254 FE þ ţ ŝ ū ў   ώ RLM ş þ   ž ŷ þ ț
1111 1111 377 255 FF ÿ ˙ џ       ÿ ĸ   ÿ

0xA0位置总归是是“非断空格”。0xAD位置多数是“软连字号”(换行个辰光再用)。

黄颜色个是ISO/IEC 8859-7:2003搭ISO/IEC 8859-8:1999 加出來个。LRM表示“从左望右记认”(U+200E)、RLM表示“从右望左记认”(U+200F)。

绿颜色个是朆定义个位置。

0x00-0x1F、0x7F、0x80-0x9F此字集朆定义。控制符由ISO/IEC 6429定义。

ISO 8859搭ISO-8859个关系

[编辑]

ISO/IEC 8859-n里向,国际标准化组织每个字集顶多定义仔96隻字符(位于0xA0-0xFF)。

ISO-8859-n(ISO搭8859当中有隻连接号)是IANA根据ISO/IEC 8859-n所定义个码表。渠除脱ISO/IEC 8859-n个字符外,还包括ASCII(0x20-0x7E)字符及65个控制符(0x00-0x1F及0x7E-0x9F)。

类似ISO 8859个编码

[编辑]

ISO 8859-12隻编号本生是留畀印度天城文个,但最终朆用。印度有仔自家个编码——ISCII。

JIS X 0201日语片假名字集标准,搭ISO 8859兼容。

VISCII越南语侨民顶常用个字集标准。但越南语罗马字字母超过一百隻,搭ISO 8859弗兼容。越南另外有隻符合ISO8859标准个字集,但需要字符組合,像泰文恁介。

ISO 6438是非洲语言字集,弗大采纳。


ISO/IEC 8859搭Unicode、UCS个关系

[编辑]

1991起,Unicode协会搭ISO、IEC一淘先后研发Unicode标准搭ISO/IEC 10646: 通用字集(UCS)。箇个两隻标准一开始是用16位编码来统一ISO/IEC 8859各部分个字符个。

新版ISO/IEC 8859用Unicode/UCS里向个名字搭U+nnnn注法表达字符。Unicode/UCS开头256隻字符搭ISO/IEC-8859-1一样个。

发展状况

[编辑]

保养箇套标准个工作组ISO/IEC JTC 1/SC 2/WG 3已经解散,保养工作停止,标准弗再更新。ISO(WG 2)箇歇精力侪摆拉ISO/IEC 10646高头。

参阅

[编辑]