ISO/IEC 646
ISO 646 je ISO standard, který od roku 1972 má specifikovaný 7-kousl kód znaku od kterého několik národních norem je odvozeno.
Od porce ISO 646 sdílený všemi zeměmi (“neměnný soubor”) specifikoval jen ty dopisy používané v základní moderní latinské abecedě, používání jiných zemí latinka s rozšířeními potřebovala vytvořit národní varianty ISO 646 být schopný používat jejich rodné jazyky. Od univerzálního přijetí 8 kousku bajt neexistoval v té době, národní povahy musely být dělán k záchvatu uvnitř omezení 7 kousků, znamenat to některé charaktery, které objeví se v ASCII se neobjeví v jiných národních variantách ISO 646.
Nepřehlédněte: Tato stránka obsahuje strojový překlad textu z anglické encyklopedie Wikipedia. Pokud budou některé pasáže špatně srozumitelné, zkuste se podívat i na text v originále, který najdete pod odkazem ISO/IEC 646. Překlad byl vytvořen pomocí překladače Eurotran.
ISO/IEC 646 byl také ratifikován ECMA jako ECMA-6.
Historie
ISO/IEC 646 a jeho předchůdce ASCII (ANSI X3.4) velmi podporuje existování cvičit pozorovat encodings charakteru v průmyslu telekomunikace.
Během šedesátých lét, tam byla debata o zda charakter kódovat standardy (u jeden národní nebo mezinárodní úrovně) pro počítače by měly následovat 1) existující praxe v průmyslu telekomunikace (který byl velmi papír-páska založila, ale který byl obyčejně předán on-line digitálně přes dráty), nebo naopak, 2) existující praxe v děrný-karta část počítačového průmyslu, jehož dědictví bylo obzvláště offline ukládání druhé světové války-electro éry-mechanický děrný-stroje karty předcházet elektronické počítače. Pro corporate-důvody historie pozorovat Hollerith děrné štítky, IBM sousedil s děrný-charakter karty encodings, ztělesněný EBCDIC, zatímco mnoho jiných počítačových výrobců sousedilo s telekomunikačním průmyslovým charakterem encodings.
Kvůli nekompatibilitě různých národních variant, mezinárodní odkazová verze (IRV) ISO/IEC 646 byl představen. Původní verze (ISO 646 IRV) lišil se od ASCII jediný v tom v bodě kódu 0024, ASCII je dolarové znaménko ($) byl nahrazený mezinárodním měnovým symbolem (¤). Finále 1991 verze kódu je totožná k ASCII.
ISO 8859 série standardů řídící 8-bitové charakterové encodings nahradí ISO 646 mezinárodní úrovně a jeho národní varianty. ISO 10646 standardu, přímo příbuzný Unicode, nahradí všechny ISO 646 a ISO 8859 souborů národní-charakter varianty encodings se pravděpodobně jedním sjednoceným souborem charakteru encodings.
Nákres kódové stránky
Následující stůl ukazuje ISO/IEC 646 znakové sady. Každá postava je ukazována s jeho dekadickým kódem a jeho ekvivalentem unikóda. Šedé zastiňované buňky ukážou body kódu se glyphs charakteru, které se liší od oblasti k oblasti. Tito jsou diskutováni v detailu dole.
Národní varianty
Některé národní varianty ISO 646 být:
|
|
Jiné vlastnické standardy schválily později pro mezinárodní použití některými standardními výbory:
|
|
Specifika změn pro některé tyto varianty jsou dávány v této tabulce:
| Kódy | Znaky pro každý ISO 646 slučitelného charset | |||||||||||||||||||||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| binární | desetina | hexa | INV | Nás | T.61 | JA | JA-O | KR | CN | IRV | GB | DK | Ne | Ne-2 | SE | SE-C | DE | Hu | FR | FR-0 | CA-1 | CA-2 | IE | Je | ita | por | PT | esp | ES | CU | MT | Yu |
| 010 0010 | 34 | 22 | ” ” ” ” ” ” ” ” ” ” ” ” ” ” ” ” ” ” ” ” ” ” ” ” ” ” ” ” ” ”||||||||||||||||||||||||||||||
| 010 0011 | 35 | 23 | # | # | # | # | # | # | # | ? | # | # | § | # | # | # | # | ? | ? | # | # | ? | # | ? | # | ? | # | # | # | # | # | |
| 010 0100 | 36 | 24 | $ | ¤ | $ | $ | $ | ? | $ | $ | $ | $ | $ | ¤ | ¤ | $ | ¤ | $ | $ | $ | $ | $ | $ | $ | $ | $ | $ | $ | ¤ | $ | $ | |
| 010 1001 | 39 | 27 | ' | ' | ' | ' | ' | ' | ' | ” ” ” ” ” ” ” ” ” ” ” ” ” ”' | ” ” ” ” ” ” ” ”||||||||||||||||||||||
| 010 1100 | 44 | 2C | , | , | , | , | , | , | , | , | , | , | , | , | , | , | , | , | , | , | , | , | , | , | , | , | , | , | , | , | , | , |
| 010 1101 | 45 | 2D | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - |
| 010 1111 | 47 | 2F | / | / | / | / | / | / | / | / | / | / | / | / | / | / | / | / | / | / | / | / | / | / | / | / | / | / | / | / | / | / |
| 100 0000 | 64 | 40 | @ | @ | @ | @ | @ | @ | @ | @ | @ | @ | @ | @ | É | § | Á | ? | ? | ? | ? | Ó | ? | § | § | ´ | § | · | @ | @ | Ž | |
| 101 1011 | 91 | 5B | [ | [ | [ | [ | [ | [ | [ | [ | ? | ? | ? | Ä | Ä | Ä | É | ° | ° | â | â | É | ? | ° | ? | ? | ? | ? | ? | ? | Š | |
| 101 1100 | 92 | 5C | \ | ? | ? | ? | \ | \ | \ | ? | ? | ? | Ö | Ö | Ö | Ö | ç | ç | ç | ç | Í | \ | ç | Ç | Ç | ? | ? | ? | ż | Đ | ||
| 101 1101 | 93 | 5D | ] | ] | ] | ] | ] | ] | ] | ] | ? | ? | ? | ? | ? | Ü | Ü | § | § | ? | ? | Ú | ? | é | ? | ? | ? | Ç | ] | ? | Ć | |
| 101 1110 | 94 | 5E | ^ | ^ | ^ | ^ | ^ | ? | ? | ? | ? | ? | ? | Ü | ? | ? | ^ | ? | î | É | Á | Ö | ? | ? | ? | ? | ? | ? | ? | Č | ||
| 101 1111 | 95 | 5F | _ | _ | _ | _ | _ | _ | _ | _ | _ | _ | _ | _ | _ | _ | _ | _ | _ | _ | _ | _ | _ | _ | _ | _ | _ | _ | _ | _ | _ | _ |
| 110 0000 | 96 | 60 | ` | ` | ` | ` | ` | ` | ` | ` | ` | ` | é | ` | á | µ | µ | ô | ô | ó | ? | ? | ` | ` | ` | ` | ` | ? | ž | |||
| 111 1011 | 123 | 7B | { | { | { | { | { | { | { | ? | ? | ? | ä | ä | ä | é | é | é | é | é | é | ? | ? | ? | ? | ° | ´ | ´ | ? | š | ||
| 111 1100 | 124 | 7C | | | | | | | | | | | | | | | | | ? | ? | ? | ö | ö | ö | ö | ? | ? | ? | ? | í | | | ? | ç | ç | ? | ? | ? | Ż | đ | |
| 111 1101 | 125 | 7D | } | } | } | } | } | } | } | ? | ? | ? | ? | ? | ü | ü | ? | ? | ? | ? | ú | ? | ? | ? | ? | ç | ç | [ | ? | ć | ||
| 111 1110 | 126 | 7E | ~ | ? | ? | ~ | ? | ? | ? | ? | | | ? | ü | ß | ˝ | ¨ | ¨ | ? | ? | á | ö | ? | ° | ? | ? | ¨ | ¨ | ? | č | |||
V tabulce nahoře, buňky s barevným pozadím zdůrazní rozdíly od americké varianty používané v základní latinské podmnožině ISO/IEC 10646 a unikód.
Charaktery vystavené v buňkách s červeným pozadím mohly být používány jako spojující se diakritika, když předcházel nebo následoval se špatným krokem C0 kontrola (tato metoda kódování je kritizovaná nebo je ne doporučený jak to byla část některých stáhnutých národních norem). Bez takového komplexního kódování, oni jsou ne odlišný od symbolů používaných v USA varianta (ačkoli glyph varianty jsou ještě možné, obzvláště na uvozovkách a obráceném háčku nebo symboly tilde).
Pozdnější, když 8 bitových znakových sad získalo více přijetí, ISO 8859-1, ISO 8859-2, a ISO 8859-3 se stal přednostní metodou kódovací většiny z těchto variant.
Varianty ASCII to není ISO 646
Tam jsou také někteří 7-kousl znakové sady, které nejsou oficiálně díl ISO 646 standardu. Příklady obsahují:
- 7-kousl Řeka, ELOT 927. Řecká abeceda je mapována k pozicím 0x61 – 0x71 a 0x73 – 0x79, nad latinskými malými písmeny. Toto mapování s vysokým bitovým souborem je ISO 8859-7.
- 7-kousek Cyrillic, KOI-7 nebo krátký KOI. Cyrilická písmena jsou mapována k pozicím 0x60 – 0x7E, nad latinskými malými písmeny. Nahrazený KOI-8 varianty.
- 7-hebrejština kousku, Si 960. Hebrejská abeceda je mapována k pozicím 0x60 – 0x7A, nad malými latinskými dopisy (a tupý přízvuk pro aleph). 7-hebrejština kousku byla vždy uložena ve vizuálním pořádku. Toto mapování s vysokým kouskem zapadlo, tj. s hebrejskými dopisy v 0xE0 – 0xFA, ISO 8859-8.
- 7-arabština kousku, ASMO 449. Arabská abeceda je mapována k pozicím 0x41 – 0x5A a 0x60 – 0x6A, nad oběma uppercase a malé latinské dopisy. Toto mapování s vysokým bitovým souborem je ISO 8859-6.
Viz též
- ASCII
- Prodloužený ASCII
- EBCDIC
- ISO/IEC 2022
- ISO 8859
- ISO 10646
- Unikód
- C Trigraph
- ISO/IEC 6937 (ANSI)
Externí odkazy
- Zeichensatz nach ISO 646 (ASCII) (v němčině)
- Historie u GNU Aspell internetových stránek
- Stoly charakteru Koichi Yasuoka (vidět domácí ISO646 charakterové stoly a kvazi-ISO646 charakterové stoly)
- Turecký text Deasciifier nástroj (založený na statistické pentagram analýze tureckého jazyka) který se vrátí ASCII'fied Turecký text tím, že stanoví vhodný (ale dvojznačný) diakritika normálně potřebovala v turečtině ale míjení v USA-ASCII soubor.