Kezdőlap (Unicode)

 Informatika 

Tudod-e, hogy mi mi? MiMi az útmutató tudástár.
  » »
 
   

Unicode

Informatika  UMTS  Univerzális soros busz

A unicode-bidi tulajdonság
Az írás irányának meghatározását végző algoritmus működését befolyásolja a tulajdonság. A szóban forgó algoritmus leírását a tankönyv nem tartalmazza. A CSS2 szabványban megtalálható.
A tulajdonság lehetséges értékei: ...


A Unicode egy ennél sokkalta bonyolultabb szabvány. A különféle egzotikusabb betűírásokon (cirill, héber, arab stb.) túl tartalmazza a kínai, japán, koreai (ezeket együtt szokták angolul CJK-nak rövidíteni) írásjeleket, és számos vezérlő karaktert, ...

Unicode A Unicode -- az ASCII és leszármazottaival (ISO Latin-1, ISO Latin-2) ellentétben -- egy 16 bites karakterkészlet -- amelybe sok nyelv karakterkészletét belevették. Ez azt jelenti, hogy összesen 216=65536 karaktert képes ábrázolni.

Unicode:
Unicode (ejtsd: junikód) az egyik elterjedt megoldás a természetes nyelvekben megtalálható különböző írásjelek egységes kódtáblába foglalására.

Unicode
Az ASCII-nál jóval szélesebb karakterválasztékot kínáló szabvány.
Universal Plug'n'Play (UPnP) ...

~: 16 bites, így 65536 karakter megjelenítésére alkalmas. 0-127: ugyanaz a karakterkészlet, mint az ASCII táblában; 128-től a karaktereket szegmensekbe osztották, amelyek a különböző írásrendszerek (latin, görög, cirill, héber...) karakterkészletének megfelelőek.
Legfontosabb fogalmak: ...

~ code set - ~ kódszó-készlet
unidirectional - egyirányú
unidirectional error - egyirányú hiba ...

~
1987-ben a XEROX cég egy új 16 bites kód fejlesztésébe kezdett. Az ~ kódrendszer a világ összes írott ABC-jének kódolását tartalmazza.
A digitális átvitel lehet: ...

~
Terjedőben levő nemzetközi szabvány a karakterek számítógépes kódolására. A ~ 16 bites kódokat használ, így a 7 vagy 8 bites ASCII korlátozott lehetőségeivel szemben szinte az emberiség által használt valamennyi írásjel leírható vele.

# ~ #
[ejtsd: junikód vagy magyarosan: unikód]
Terjedőben levő nemzetközi szabvány a karakterek számítógépes kódolására. A ~ 16 bites kódokat használ, így a 7 vagy 8 bites ASCII korlátozott lehetőségeivel szemben szinte az emberiség által használt valamennyi írásjel leírható vele.

8-bit ~ Transformation Format
Egy veszteségmentes, változó hosszúságú karakterkódolási eljárás. Az UTF-8 egy ~ jel kódolására 1-4 bájtot használ, a jel elhelyezkedésétől függően.

~
A ~ rendszerben a karakterek ábrázolása 2 bájton történik, így 65.536 karakter megkülönböztetését teszi lehetővé.
Logikai műveletek ...

~
16 bites karaktertáblázat az ISO 10646 szerint. 256 bájtos blokkokra van felosztva a különböző nyelvek részére.
UNIX ...

â†' A ~ szabvány kifejezetten tiltja a dekódolók számára a szükségesnél hosszabb kódszekvenciák elfogadását, mert ezekkel esetleg ki lehetne játszani az UTF-8 szövegre alkalmazott szűrőket. Például az 11000000 10111100 és a 00111100 is a bináris 00111100 ASCII-kódú 'XSS támadások ellen), ...

A megoldást a ~ Standard szolgálja. Az 1.0 verzió 1991-ben jelent meg, jelenleg (2011) a 6.0 verziónál tartunk. A ~ rendszerben a karakter absztrakt fogalom és a neve egyedileg azonosítja, amely nem változtatható.

Van még egy fontos fogalom, amiről szót kell ejtenünk, ez a ~. Eredetileg volt az (amerikai) angol nyelv és csak ezen íródtak a programok. Ekkor még elég volt 256 lehetőség 1 karakter ábrázolására. Az eredeti kódkiosztás 1 bájton elfért.

(0-255 között). A magyar ékezetes karaktereket a 852-es kódlap tartalmazza.

~ KÓDTÁBLA
Nemzetközileg egységes 16 bites karakterkódolási szabvány. Valamennyi nép valamennyi jelét tartalmazza. (65536 lehetséges jel) ...

A karakterek, sztringek ~ formában vannak tárolva.
A könyvtárak "hordozható" interfészeket tartalmaznak. Pl. van egy abstract Window class és ennek implementációi UNIX-ra, Windows-ra és Macinosch-ra.
4. Architektúra semleges (Architecture-Neutral) ...

Időközben szabványosítást nyert a 16-bites ~ karakter- kódolási eljárás, amellyel gyakorlatilag a világ összes nyelvének karakterkészlete kódolható;
=>ASCII; =>ISO 8859-2; =>SMTP; =>ESMTP; =>~; =>MIME; =>UUENCODE; =>HTML-mail =>X.400; =>freemail; =>v-mail; =>web-based e-mail; ...

A Java nyelv és az XML között van egy érdekes hasonlóság: a Java a futtatható formában hordozható programok nyelve, míg az XML a hordozható adat készítésének az eszköze.
Az XML dokumentumok (hasonlóan a Java forráskódhoz) ~ alapú szöveges karaktersorozatok, ...

A Notepad a Wordpad-del ellentétben a szövegeket nyers ASCII illetve ~ formátumban tárolja, és nem képes semmilyen szövegformázás végrehajtására.
Nyomtatható verzió
Kapcsolódó fogalmak ...

=>ASCII; =>ISO 8859-2; =>SMTP; =>ESMTP; =>~; =>MIME; =>UUENCODE; =>HTML-mail =>X.400; =>freemail; =>v-mail; =>Web-based e-mail;
elektronikus postafiók címe
az Interneten használatos postafiók címe;
összetevői: felhasználói név, @ írásjel, részterület (domain) neve; ...

A "TNTmips" támogatja a ~ szabványt és a speciális, billentyűzetről történő beviteli módszereket. Ezek segítségével akár kínai vagy japán írásjeleket is lehet használni a rendszerben.

Nemzetközi szabvány az eredeti ASCII kódkészleten kívüli karakterek (köztük a magyar ékezetes betűk) 8 biten való kódolására. Jelenleg még ez a legelterjedtebb kódrendszer, de idővel az ~ váltja majd fel, melynek az ~ egy részhalmaza.
ISO9660 ...

Ezért hoztak létre a későbbiekben több különböző kódtáblát is. (Ami sajnos kompatibilitási gondokhoz vezetett) Manapság inkább a ~ táblázatot használjuk, amelynek célja, hogy a különböző írásrendszerek karaktereit egy táblázatba gyűjtse össze.

Lásd még: Lásd még: Mit jelent Karakter, Számítógép, Információ, Hálózat, ASCII?

◄ UMTS   Univerzális soros busz ►
 
RSS Mobile