Új hozzászólás Aktív témák

  • Taci

    addikt

    válasz SUPREME7 #20511 üzenetére

    Közben találtam más kódolással is forrásfájlt, a logban egyből szemet szúrt a sok kérdőjel:
    ISO-8859-2
    Kell még számítanom másféle kódolásra is? Mert akkor úgy készítem fel a szkriptet.

    Amit találtam róla:
    Megszületett az ISO-8859-1 (más néven Latin-1) karakterkészlet, amely a magyar nyelvből az ő és ű betűket nem tartalmazza, így alkalmatlan magyar szöveg ábrázolására. Megszületett az ISO-8859-2 (Latin-2), amely az összes magyar ékezetet tartalmazza, tehát lényegesen jobb, de a magyar tipográfiának megfelelő nagykötőjel és idézőjelek, valamint sok egyéb fontos szimbólum ebből is hiányzik. Születtek egyéb ISO-8859 kódlapok, a DOS által használt kódlapok (cp437, cp850, cp852 stb.), a Windows karakterkészletei (Windows-1250, Windows-1252 stb.) és sok-sok egyéb is.

    Ez alapján számítanom kell rá, hogy más is fel fog még bukkanni.

    Az angolszász, majd az európai országokból kiindulva az ASCII után először az úgynevezett Latin-1 kódolás terjedt el, ami tartalmazza az összes angol nyelvhez szükséges betűt, illetve számos európai nyelv betűit, de például a magyar „ő” és „ű” betűket nem (ezek helyett – helytelenül – gyakran használják a hullámos illetve a kalapos betűket: û ô vagy õ). Magyarhoz lehet azonban a Latin-2 (közép-európai) kódolást is használni, ami ismeri az ő és ű betűinket, de nem ismer más fontos betűket, például a cirill, görög, vagy például az örmény, indiai, arab és héber betűket, a kínai írásjegyeket és a japán kanákat. A Unicode és az UTF-8 kódolás egyszerre támogatja mindezen karakterek megjelenítését, és így minden nyelv egységes kódolást tud használni, megelőzve a betűk nem tervezett „átalakulását”.

    Ezek alapján akkor talán az UTF-8 és az ISO-8859-2. Vagy van olyan "bátor" magyar oldal, aki bepróbálkozik a Latin-1-gyel? ISO-8859-1 (gyakran használják a hullámos illetve a kalapos betűket: û ô vagy õ --> Láttam már ilyeneket.)

    Még valami más esetleg? (Notepad pl. UTF-16-ba is enged menteni.)
    Inkább leprogramozom most, mintsem később (újra) meglepjen.

    @Mike: Köszönöm, ezt nem is néztem, de UTF-8-on van, most ellenőriztem gyorsan.

    Köszi!

Új hozzászólás Aktív témák