Opus 1.2: rychlejší, kvalitnější
Já jsem si před časem dělal vlastní srovnání Opusu 1.2 na bázi alfa/beta verzí s Ogg Vorbis (poslední implementace) a posledním LAME 3.99.x. Opět po letech mi z toho vyšlo MP3 jako nejhorší (to neberte jako kritiku, pouhé konstatování logického faktu vycházejícího ze stáří formátu), stejně jako Opus jako nejkvalitnější, zejména pro záznamy z diktafonu a zvuk z vlastních videí točených bezzrcadlovkou i smartphonem.
Momentálně tak osobně komprimuji zvuk už jen do Opusu a video do trojkombinace x265+opus/mkv, vyhlížejíce přitom toužebně AV1 (otázkou je, kam míří Daala). Například mono záznamy z diktafonu encoduji typicky s datovým tokem ±18kbit/s VBR jen proto, že jsem líný hledat nižší poslouchatelný limit (přestože nepochybně existuje), adekvátně tomu stereo zvukovou stopu videí.
Opus 1.2 není na našich stránkách novinkou, věnoval jsem se mu již v testovacích verzích, pročež vás s podrobnostmi odkáži na příslušný tag:
Tisková zpráva konkrétně hovoří o tom, že v průběhu vývoje verze 1.1 a nynější 1.2 se podařilo posunout kvalitu encodingu hudby tak, že celkem dobrá je i při datovém toku 48 kbit/s (tam, kde ostatní formáty v podobné kvalitě končí na 64 či dokonce 96 kbit/s). Samozřejmě jsou slyšet nějaké kompresní artefakty, ale pokud potřebujete šetřit místo na hostingu / datové přenosy, tak prý většinou neruší a mělo by to být na běžný poslech OK. Ostatně tvůrci se nyní již nějakou dobu snaží vylepšit kvalitu encodingu tak, aby bylo dobře použitelné i 32kbit/s fullband stereo (!), což zní vpravdě neuvěřitelně.
Velkou novinkou je chování při VBR encodingu o nízkých datových tocích. Zatímco verze 1.1.1 v tomto ještě byla poměrně konzervativní, 1.2 na to jde trochu ostřeji, neboť se během vývoje experimentálně prokázalo, že je možné do datového toku sáhnout trochu více. Výsledkem je (jak je zmíněno výše) použitelné VBR až po 32 kbit/s s tím, že další vývoj probíhá.
Stejně tak došlo k vylepšení kvality encodingu záznamů hlasu (tam, kde Opus navazuje na původní projekt SILK od Skype). Nový hybridní full-band speech režim kódování umí jít až na 16 kbit/s. Novinky v CELT části formátu se týkají vylepšené psychoakustiky. Celkovým výsledkem je, že oproti Opus 1.0, kde bylo nutné opouštět full-band stereo už kolem 29 kbit/s (Opus 1.1.x kolem 21 kbit/s), udrží Opus 1.2 full-band stereo až do 14 kbit/s.
Výsledkem cílené snahy, ale také pouhým doprovodným jevem některých kompresních optimalizací je skutečnost, že Opus 1.2 je rychlejší, přestože produkuje kvalitnější výstup. Obsahuje jak optimalizace pro x86 / SSE, tak optimalizace specifické pro ARM (převážně Neon), což je třeba pro mě zajímavé, jelikož Opusy čas od času pouštím na Androidím telefonu.
Opus byl standardizován už před několika lety. Mezitím se našlo pár drobností, které bylo nutné opravit, takže původní standard definovaný v RFC 6716 bude aktualizován (u IETF momentálně leží draft nové specifikace). Opus 1.2 zatím tyto nové úpravy nepoužívá, jelikož proces standardizace ještě neproběhl. Pokud je budete chtít použít, je potřeba v konfiguračním skriptu použít volbu --enable-update-draft
.
Pokud si chcete sami ověřit výše uvedená tvrzení, vše potřebné (ukázky pro poslechové testy hudby i mluveného slova, grafy srovnávající rychlost, popis aktualizace standardu) najdete v podrobném článku / tiskové zprávě.
- Ke stažení: Opus 1.2
Opus