Írásrendszerek

A több nyelvű üzenetek és elemek olyan nyelvű szöveget tartalmazhatnak, melyek különböző írásrendszereket igényelnek. Egyetlen írásrendszer használatával számos nyelv jeleníthető meg.

A latin vagy római írásrendszer például rendelkezik karakterformákkal – jelekkel – az angol ábécé 26 betűje számára (kis- és nagybetűkre egyaránt), de ékezetes (bővített) karaktereket is tartalmaz az egyéb nyugat-európai nyelvek hangjai számára.

A latin írásrendszer rendelkezik a legtöbb európai – és néhány egyéb – nyelvben előforduló összes karakter megjelenítéséhez szükséges jellel. Más európai nyelvek esetében – mint a görög vagy az orosz – vannak olyan karakterek, melyekhez nincsenek jelek a latin írásrendszerben; ezek a nyelvek saját írásrendszerrel rendelkeznek.

Néhány ázsiai nyelv ideografikus írásrendszert használ, melynek jelei a kínai karaktereken alapulnak. Más nyelvek, mint a thai és az arab, olyan írásrendszert használnak, melynek jelei számos kisebb jelből tevődnek össze, illetve olyan jelekből, melyek másképp alakulnak a szomszédos karakterektől függően.

Az egyszerű szöveg tárolásának gyakori módja, hogy minden egyes karaktert egy bájt képvisel. Minden egyes bájt értéke egy numerikus index – vagy kódpont – egy karaktertáblázatban; egy kódpont egy karakternek felel meg a számítógép alapértelmezett kódlapján, melyen a szöveges dokumentumot létrehozzuk. A 189 decimális bájtérték (a 189 decimális érték kódpontja) például különböző kódlapokon különböző karaktereket jelenít meg.

Legutóbbi frissítés: 2023. 10. 18. 11:20