2024. június 20., csütörtök

Gyorskeresés

Útvonal

Cikkek » Házimozi rovat

Viszlát, FLAC!

Veszteségmentes vagy pszichoakusztikus tömörítés? Megvizsgáltam a kódolási veszteségeket.

[ ÚJ TESZT ]

Episode C64

Megvizsgáltam, hogyan viszonyul a pszichoakusztikus tömörítés a leginkább méréshez használt, függvénygenerátor által előállított, szögletes jelalakokhoz.
Ezeket tökéletesen csak végtelen számú és frekvenciájú szinusz felhasználásával tudnánk előállítani. Apropója, hogy a Commodore 64 hangelőállító áramköre alapvetően ilyen termékekkel alkot zenét, melyek bizonyos körökben manapság reneszánszukat élik.
Nem is feltétlen az a lényeg, hogy a szóban forgó 6581 SID miféle fűrész, háromszög és négyszög formát hoz létre, hanem hogy a veszteséges tömörítés hogyan viszonyul az ilyesmikhez.

Ha szinuszról van szó, annak a nagyon magas reprodukálhatósági fokú, veszteséges tömörítése nem okoz gondot, mint azt már korábban kifejtettem.
Így néz ki egy 20 – 20'000 között emelkedő szinusz spektrogram képe. Azért ér véget a félút alatt, mert 48 kHz-es felső határfrekvenciával dolgoztam.

Ezzel szemben egy fűrészjel rengeteg szinuszos összetevőből áll, egy szintén 20 – 20'000 Hz között emelkedő jel így fest. Látható, hogy frekvenciától függetlenül, a teljes rendelkezésre álló 48 kHz sávszélességet kitölti, méghozzá érdemi hangnyomású komponensekkel.

Ez végtelen felső határfrekvenciáig így menne.
A tömörítő algoritmust azonban még nehezebb kihívás elé állítottam, mivel 4 kHz-es fűrészjel és 3 kHz-es négyszögjelből készítettem egy hangfájlt. Jelalakokból a harmadikról van szó, és alatta a spektro képe.

Az eredeti, monó jelről lévén szó, az MP3 esetén csatornánként adtam meg a bitrátát, tehát a "313 kbps" sztereóban a 640-es MP3 lenne.

Ez kifejezetten rosszul néz ki, a kérdés, mi az oka.
Lényegében az, hogy a PCM jel bármilyen jelalakot képes tárolni, akkor is, ha az sem 48 kHz-es szinuszokkal, sem MHz-es összetevőkkel nem írható le. Egyedüli határának a kvantálási felbontása tekinthető.
Az MP3 viszont nem így működik, hiszen első dolga, hogy 20 kHz fölött lényegében mindent eldob. Ezért az eredeti hanganyagból eltávolítottam ezen frekvencia fölötti összetevőket. Az alsót kaptam eredményül.

Ez az, amivel már érdemes ilyen jellegű összehasonlítást végezni. Balról a már csak 20 kHz alatti összetevőket tartalmazó eredeti, jobbról rajta a két fajta MP3.

Mint látható, létrejött a papírforma szerinti kiváló eredmény. A szúrópróba-szerűen elvégzett többi formátum is a megszokottak szerint teljesített.

Felmerül a kérdés, hogy mennyire jó ez így, hiszen az eredeti, kiindulási jelalakhoz ez szemre egyáltalán nem hasonlít. Két szempont szerint érdemes erre választ adni.
Egyfelől megfelelő digitális-analóg konverzió esetén nem szabadna, hogy hallható eltérést okozzon az, hogy ha eltávolításra kerül a 20 kHz fölötti tartomány, mint arra korábban, több irányból, részletesen kitértem. Arról nem beszélve, hogy megszólaltatni sem lehet olyan magashangszóróval, aminek az átvitele véget ér 20 – 40 kHz környékén. (Amire egyébként is csak egyéb, elektromechanikai okokból van szükség.)

Másfelől, tudomásom szerint, konkrétan a Commodore hangáramköre – 1 MHz-es mivoltának köszönhetően – sokkal finomabb léptékben képes megkezdeni egy hullámforma nullpontját. Ezáltal az összegzett jelalakok végösszege is nagyobb felbontással alakítható, mint például amit a 44.1 kHz-es mintavételezési frekvencia lehetővé tesz. (Ami természetesen nem tömörítő algoritmus, hanem mintavételezés függő.) Viszont azt gondolom, hogy ez a végső jelalakra gyakorolt hatása révén nem fog – a 20 kHz fölött még mindig nem érzékelő emberi fül számára – eltérő hangot eredményezni.

Ami miatt ebben az esetben megfontolásra kerülhet a veszteségmentes tárolás alkalmazása, az a 20 kHz-es vágás ellenére is rengeteg érdemi összetevőt tartalmazó hanganyag.

Azonban nagyon erősen, akár végletesen árnyalja a képet, hogy egy C64 által előállított, illetve ilyen mezsgyén készített zene nem így szokott kinézni, sokkal kevesebb összetevőt tartalmaz.
De maradjunk ennél a hanganyagnál, ilyen eltérés van a monó, 137 kbps MP3 esetén. Mondhatni nem jelentéktelen, tipikusan tárolási hely problémákra utal.

Bár kétséges, hogy ezt ki lehessen hallani, akár összehasonlító teszttel, de ilyen jellegű, sztereó zenénél ez a bitráta 274 kbps, ami már rokon a CBR 320-as MP3-al.
Ami viszont jelen esetben mégis feleslegessé teszi a Commodore 64 zenéinek veszteségmentes tárolását, az, hogy monó 313 kbps MP3 esetén a füllel érzékelhető eltérés nem létező jelenség.
A LAME konverter 320 kbps beállítás esetén, a monó sávból ilyen bitrátás, mindenhol lejátszható eredményt ad.

Számomra ismét bebizonyosodott, hogy még ilyesfajta kihívásokkal szemben is kitűnően veszi az akadályokat a pszichoakusztikus tömörítés algoritmusa, a megengedett határokon belül maradva.
Az apró hibák ilyen jellegű sztereó zene esetén fordulhatnak elő a bitráta korlátjából fakadóan, nagyon ritkán, és ezek kihallhatósága, ha egyáltalán lehetséges, akkor csakis összehasonlító teszten képzelhető el.

Hirdetés

Copyright © 2000-2024 PROHARDVER Informatikai Kft.