Miért nem UTF-32?
"Mindig is első szerettem volna lenni!" - II. János Pál pápa
Miért nem UTF-32?
"Mindig is első szerettem volna lenni!" - II. János Pál pápa
Jaj.
Egyébként pedig nem 4 byte-on tárol az UTF-8.
4 byte-ot nem vittata senki
"Mindig is első szerettem volna lenni!" - II. János Pál pápa
Azt szomorú látni, hogy a PHP dokumentációjában erről nem szólnak
Merthogy miért szólnának egy szkriptnyelv doksijában arról, hogy a DB mit nem tud?
I did nothing, the pavement was his enemy!
#1:
Az UTF-8-ban például az egyszerű latin karakterek tárolásához csak 1 bájt kell, míg az UTF-32-ben ezek lefoglalják a teljes 4 bájtot.
#4:
Azért szerintem a mysqli (ami egy DB driver expliciten MySQL-hez) set_charset methodjánál elférne megjegyzésben, ha a legtöbb ember a charset-et úgyis erre állítaná át, vagyis a 4 bájtos variánsra, és hogy ne kelljen máshonnan rájönni.
Azt nem is neked írtam, csak arra, ami az eredeti szövegben volt: "a MySQL féle utf8 nem is rendes 4 bájtos UTF-8 kódolás, hanem annak 3 bájton tárolt variánsa".
bejegyzés MySQL: utf8 vs. utf8mb4