Számítógépes szövegkezelési problémák: mellékjeles karakterek, kódolások

Szövege furcsa karaktereket tartalmaz? Nem találja a szavakat?

Mindannyian találkoztunk már azzal a jelenséggel, hogy a számítógép értelmes szöveg helyett "hieroglifákat", helytelen betűket vagy egyenesen értelmezhetetlen karaktersorokat jelenít meg a böngészőben, az e-mailjeinkben vagy a szövegszerkesztőnkben. Ez bármilyen szoftver használata közben előfordulhat, és nemcsak a megértést zavarhatja, hanem megakadályozhatja a szoftver normális működését is. A keresés és/vagy csere parancsot például nem tudjuk futtatni, ha a szövegünkben ilyen hibák vannak, és a nyelvészeti szoftvereink (például a konkordancia-programunk) sem lesznek képesek megfelelő eredményt produkálni. Ez az oldal a jelenség megértésében segít, és megoldást is kínál egyes esetekre.

Írásrendszerek

Kódlapok

Megoldások

A webböngészők (pl. Mozilla Firefox) és a levelező kliensprogramok (pl. Mozilla Thunderbird) menüje tartalmaz a karakterkódolás beállítására alkalmas parancsot. Általában működik a karakterkódolás automatikus felismerése, de ha mégis problémával találkozunk, keressük meg ezt a menüpontot (általában a Nézet vagy az Eszközök menüben), és állítsuk be a megfelelő kódlapot.

Ha egyszerű szövegfájlt (.txt) kell kezelnünk, vagy olyan fájlformátumú szöveget, amely nem a szövegszerkesztőnk saját formátumában készült (pl. a MS Word esetében .doc(x)), de amelyet egyébként a program képes kezelni, megnyitáskor a Word rákérdez a kódolásra, és a megjelenő párbeszédpanelen a szövegből látható egy minta, melyen ellenőrizhetjük, hogy jó kódolást választottunk-e ki. Ez visszafelé is működik: ha egy Wordben írott dokumentumunkat egyszerű szövegként akarjuk elmenteni, ugyanilyen párbeszédpanel bukkan fel, ahol kiválaszthatjuk a szövegünk karaktereinek megfelelő kódolást. Ha nem megfelelőt akarnánk választani, a mintában a Word pirossal kiemeli az adott kódlap szerint helyesen nem kódolható karaktereket. A Wordöt tehát ily módon - bizonyos határok között, több lépésben - a különféle forrásokból (pl. a webről) származó szövegeink szükség szerinti átkódolására is használhatjuk.

A szövegfájlok átkódolhatók (például, ha egy egységesen kódolt korpuszt akarunk kialakítani) a WebKeySoft Simple Text Encoding Converter nevű egyszerű programjával, mely az alanti linkről is letölthető (zip formátumú tömörített állomány, kitömörítés után rögtön futtatható).

Figyelem: konverzió előtt melegen ajánlott biztonsági másolatot készíteni a fájljainkról!

Csatolmány

Legutóbbi frissítés: 2023. 10. 18. 14:17