X4L - wzmacniacz z DSP z serii X
Biznes „nagłośnieniowy” – w porównaniu z innymi dziedzinami techniki (np. przemysłem samochodowym, czy ...
Od kiedy człowiek pierwszy raz nagrał dźwięk, a potem odtworzył to nagranie, nieustannie trwają prace nad coraz lepszym, wierniejszym, dokładniejszym odwzorowaniem naturalnych źródeł dźwięku za pomocą właśnie urządzeń rejestrujących i odtwarzających zarejestrowane dźwięki.
Od kiedy zaś na „scenę” wkroczyły komputery i technika cyfrowa, postęp w niemalże każdej dziedzinie, również audio, stał się lawinowy.
Nie ma się więc co dziwić, że po latach eksperymentowania i udoskonalania kolejnych analogowych systemów surround skierowano wzrok właśnie w kierunku „cyfryzacji”, mając nadzieję, i słusznie, na uzyskanie efektów do tej pory niedostępnych za pomocą techniki analogowej. Oczywiście firma Dolby Inc. ruszyła ostro do boju, czego wynikiem było powstanie pierwszego cyfrowego systemu surround, który zwał się, jak łatwo się domyślić,
choć z tą nazwą to może nie tak do końca jest prawda. Dźwięk w filmowym cyfrowym surroundzie umieszczony jest pomiędzy perforacją taśmy filmowej, powstała więc konieczność opracowania systemu kompresji danych audio, zwłaszcza przy – jak zakładano od samego początku – przenoszeniu sześciu niezależnych sygnałów. Taki system powstał, oparty na algorytmie zwanym AC-3, i tak też na początku nazywano cały system surround. Jednak obecnie używaną i obowiązującą nazwą jest Dolby Digital.
Jak więc już wiemy w Dolby Digital do kompresji i kodowania sygnału audio stosuje się system Audio Coding w jego wersji nr 3 (stąd też skrót i nazwa AC-3). Warto więc kilka słów o tym kodowaniu wspomnieć
W systemie tym pracuje się z 20-bitową rozdzielczością oraz częstotliwościami próbkowania 32, 44.1 i 48 kHz. Stopień kompresji można dobierać w zakresie przepływności od 32 kbps (kilobits-per-second – kilobitów na sekundę) do 640 kbps, przy czym w zapisie na taśmie filmowej standardowo przyjmuje się przepływność 320 kbps, natomiast w kinie domowym typowa przepływność to 384 kbps (oznacza to, że współczynnik kompresji wynosi ok. 13).
Wejściowy sygnał (a jest to, przypomnijmy, strumień danych cyfrowych) jest transformowany w dziedzinę częstotliwości. Pierwotnie dokonywano tego za pomocą banku filtrów, dzieląc całe pasmo na wąskie podpasma, odpowiadające szerokościom od 3 do 1 szerokości pasma krytycznego. Pasmo krytyczne jest to pasmo, w którym słuch ludzki analizuje sygnał niezależnie i bez związku z przebiegami sygnałów w innych pasmach. Każdemu pasmu krytycznemu odpowiada pewien odcinek na błonie podstawnej ślimaka, równy 1.3 mm. Pasma te nie są bynajmniej równe – do 500 Hz podział jest regularny co 100 Hz, powyżej 500 Hz szerokość każdego następnego pasma krytycznego jest o 20% większa niż szerokość poprzedniego.
Obecnie zamiast banku filtrów stosuje się MDCT, czyli zmodyfikowaną dyskretną transformację kosinusową (ang. Modified Discrete Cosine Transform) z 50-procentową zakładką.
Sygnał użyteczny o dużym poziomie maskuje szum kodowania w paśmie bardzo bliskim jego częstotliwości. W tych obszarach, gdzie nie ma sygnału użytecznego zdolnego do zamaskowania szumu kodowania stosuje się algorytmy filtrujące. Czy opis wydaje się znajomy? Oczywiście, wszak system AC-3 jest klasycznym przykładem kodowania percepcyjnego (czyli takiego samego, jak popularny MP3 – diabeł, czyli różnica między nimi, tkwi tylko w szczegółach), opartego na maskowaniu szumu, dynamicznej gospodarce bitami, które rozdzielane są pomiędzy pasma filtrów, zależnie od widma częstotliwościowego i dynamiki nagrania (tzw. dynamiczna alokacja bitów). Wróćmy jednak do systemu Dolby Digital.
Jednym z najpoważniejszych atutów Dolby Digital jest jego uniwersalność. W swojej podstawowej formie, wykorzystywanej w projekcjach filmowych i kinie domowym, pracuje z wykorzystaniem sześciu niezależnych kanałów pracujących w konfiguracji:
– przednie – lewy (L), prawy (R) i centralny (C);
– surround – lewy (Sl) i prawy (Sr),
– kanał efektów niskoczęstotliwościowych (LFE – Low Frequency Effects)
Pięć pierwszych kanałów przenosi pełne pasmo akustyczne w zakresie od 3 Hz do 20 kHz, natomiast kanał LFE zakres 3 Hz-20 Hz, stąd nazwa systemu „5.1”.
Do zalet systemu Dolby Digital należą: pełna separacja kanałów, dająca większą przestrzenność dźwięku, możliwość precyzyjnej lokalizacji źródła dźwięku, stereofoniczne kanały surround, które umożliwiają efektywniejsze operowanie efektami specjalnymi i podnoszą realizm wydarzeń. Niezależność kanałów powoduje, że każdy z nich może przenosić dowolny sygnał, co daje możliwość kształtowania kierunkowego pola dźwiękowego oraz tworzenia wielu obrazów źródeł dźwięku, w zależności od akcji na ekranie (w Dolby Pro Logic istniała możliwość wytworzenia tylko jednego źródła dominującego).
Nie koniec na tym, jeśli chodzi o pomysły rodzące się w Dolby Laboratories, skoro już jesteśmy przy tej firmie. Kolejnym bowiem krokiem ku wierniejszemu odwzorowaniem rzeczywistego pola dźwiękowego był system zwany
Opiera się on na systemie Dolby Digital 5.1, jednak dotychczasowy system przetwarzania i wysyłania sygnału na pięć głośników wzbogacono o jeszcze jeden dodatkowy, umieszczony centralnie za słuchaczem. Do tego głośnika podawany jest zsumowany, odpowiednio zakodowany sygnał, powstały z „wyłowienia” z kanałów tylnych efektowych (rysunek 2a). Dzięki zastosowaniu matrycowej (jak w Dolby Pro Logic) metodzie kodowania ilość danych nie zwiększa się mimo wzrostu informacji i jako podstawa służy technika 5.1-kanałowa. Jednak dość szybko okazało się, że wprowadzenie za plecy słuchacza głośnika centralnego może powodować pojawianie się niestabilnego pola dźwiękowego. Dźwięk może pojawiać się nie z tyłu, lecz w środku, a nawet z przodu głowy słuchającego. Dlatego pojawił się ósmy kanał i technika 7.1 (rysunek 2b). Oprócz istniejących pięciu głośników (i szóstego subwoofera) dodano dwa tylne, które zasilane są, jak w systemie 6.1, sygnałem powstałym z sumowania matrycowego. Zamiana uwzględnia zachowanie kompatybilności wstecz, co oznacza, że posiadacze odtwarzacza Dolby Digital mają możliwość prawidłowego odtwarzania płyt nagranych już w systemie DD EX. Odtwarzacze z opcją 6.1 i 7.1 zaś wyposażone są w dodatkową macierz dekodującą.
System Dolby Digital nie tylko wszedł do użytku w systemach kina domowego, ale również (jeśli nie przede wszystkim) w „normalnym” kinie, oczywiście w tym przypadku jeden głośnik tylny jest „rozszczepiony” na kilka (przeważnie cztery, zależnie od wielkości sali), podobnie jak to ma miejsce z bocznymi głośnikami surround.
Jak to jednak bywa, przynajmniej „w szerokim świecie”, gdzie jest duża kasa do zgarnięcia, tam też jest i duża konkurencja. O ile w kinach królują systemy firmy Dolby Inc. (Dolby Digital albo Dolby Digital EX), o tyle w segmencie kina domowego systemy te mają groźnego rywala, ukrywającego się pod skrótem
A tak po prawdzie to firma Dolby Inc. ma rywala, w postaci firmy NuOptix Inc. (tak się wtedy nazywała), twórcy systemu DTS. Przyjrzyjmy się mu zatem bliżej. Skrót DTS pochodzi od słów Digital Theater System, co też jest nazwą firmy, która powstała z przekształcenia firmy NuOptix Inc., a która obecnie zajmuje się rozwijaniem (i oczywiście sprzedażą) systemu DTS i pochodnych. Głównym argumentem przetargowym projektantów DTS jest maksymalne zbliżenie odtwarzanego dźwięku do oryginału, dzięki zastosowaniu mniejszego stopnia kompresji.
Co prawda DTS nie zajęło takiej pozycji w kinach, jak Dolby Digital czy DD EX (przynajmniej w Polsce), jednak jego „ród” wywodzi się właśnie z zastosowań kinowych, a dopiero później został zaadaptowany do potrzeb kina domowego (podobnie zresztą, jak to miało miejsce z systemami Dolby). Opracowując układy DTS dla potrzeb kinowych zdecydowano się na rozdzielenie nośników obrazu od nośników audio w postaci cyfrowej. Ścieżki audio są zapisane więc na płytach (a obraz oczywiście tradycyjnie na taśmie filmowej 35 mm lub 70 mm). Ścieżki DTS odczytywane są w specjalnym odtwarzaczu, wyposażonym w trzy napędy, i następnie podawane na wejście wzmacniaczy kanałowych sterujących zespołami głośników.
Pomimo pełnej informacji audio umieszczonej na płytach nie zrezygnowano ze ścieżek dźwiękowych bezpośrednio na taśmie. Filmy zrealizowane w technice DTS zawierają także optyczne, analogowe ścieżki dźwiękowe, co daje kompatybilność ze starszymi urządzeniami kinowymi oraz zabezpiecza w przypadku awarii dekodera DTS lub utraty synchronizacji. Proces przełączania na odczyt ze ścieżek analogowych przebiega automatycznie. Z powodu zastosowania niezależnych nośników obrazu i dźwięku konieczne stało się rozwiązanie problemu synchronizacji. Na taśmie 35 mm umieszczono pomiędzy śladami analogowymi a klatkami filmowymi specjalną ścieżkę z kodem czasowym. Każda ramka taśmy zawiera kod czasowy DTS, dlatego też podkład dźwiękowy ściśle odpowiada obrazowi, nawet jeśli zastosowano cięcia taśmy lub zmieniono porządek klatek. Na taśmie filmowej umieszcza się także unikatowy kod charakterystyczny dla danego filmu, a dekoder DTS sprawdza jego zgodność z płytami umieszczonymi w napędach, automatycznie blokując odtwarzanie płyt z kodami niezgodnymi. Dodatkową zaletą zastosowania oddzielnego nośnika dźwięku jest możliwość rozpowszechniania filmów w różnych wersjach językowych, bez konieczności zmian na taśmie optycznej.
To w kinie, a jak wygląda DTS w zastosowaniach komercyjnych, czyli w kinie domowym? Ano, jeśli chodzi o konfigurację, to podobnie jak w Dolby Digital, czyli standardowe „5.1”: trzy kanały przednie – L, C, R (pracujące w pełnym paśmie 20 Hz-20 kHz), dwa kanały surround – LS, RS (z nieco obciętym od dołu pasmem 80 Hz-20 kHz) oraz kanał efektów niskoczęstotliwościowych – LFE (20-80 Hz). Teraz już widzimy dlaczego kanały surround mają pasmo zaczynające się od 80 Hz. Po prostu aby je odciążyć i wzmocnić wrażenie efektów „niskich” (wybuchy, trzęsienia ziemi itp.), sygnał na głośnik LFE jest zmiksowany w obu kanałach surround, a ich rozdzielenie następuje w układzie zwrotnicy o częstotliwości podziału 80 Hz.
A co z kodowaniem? Na samym początku, opracowując system stricte kinowy, jako nośnik dźwięku wybrano płytę CD-ROM. Kierowano się większą ilością miejsca, jaką można wykorzystać dla umieszczenia informacji (pamiętajmy, że w kinie w Dolby Digital dźwięk cyfrowy umieszczony jest w przerwach pomiędzy perforacją taśmy filmowej, dlatego wymagał aż tak wielkiej kompresji – 13:1). Dla dźwięku DTS umieszczonego na płycie CD-ROM wybrano o wiele mniejszy stopień kompresji – ok. 4:1 – z systemem kompresji akustycznego kodowania koherentnego
co właśnie po angielsku znaczy Coherent Acoustic Coding. Głównymi cechami tego systemu są:
– możliwość pracy na 1-8 kanałach audio,
– częstotliwość próbkowania 8-192 kHz,
– długość słowa PCM 16-24 bitów,
– zakres kompresji od 1:1 do 40:1,
– przepływność binarna danych wejściowych kodera od 32 kb/s do 4.096 Mb/s,
– bezstratny tryb kodowania (zmienna przepływność),
– miksowanie w dół z n kanałów do n-1, n-2 itp.,
– wbudowana kontrola zakresu dynamiki,
– wtórna korekcja (reequalization) każdego z kanałów niezależnie,
– synchronizacja kanałów audio i video,
– wbudowane dane czasowe i dane użytkownika.
Pierwowzorem CAC był system apt- X100, stosowany w systemach kinowych. System ten nie jest kodowaniem perceptualnym, takim jak MPEG, ponieważ redukcja przepływności w tym przypadku jest niewielka (4:1). Dlatego też sięgnięto po inne metody kompresji, oparte na zmniejszaniu redundancji (czyli nadmiarowości) w cyfrowych danych audio. Drugim „patentem” na zmniejszenie przepływności jest zastosowania kwantyzacji adaptacyjnej ADPCM, w której przedziały kwantowania nie są jednakowe, ale szerokość ich zależy od dynamiki sygnału.
Natomiast CAC, jako skalowalny system (o rozpiętości kompresji od 1:1 do 40:1, czyli o przepływnościach od 4 Mbit/ s do 32 kbit/s), jest kombinacją dwóch systemów. Pierwszy, dla małych stopni kompresji (a więc dla dużych przepływności), działa podobnie jak w przypadku apt-X100, tj. w oparciu o predykcję LPC i kwantowanie ADPCM, z tym że w CAC podział pasma następuje na 32 podpasma. Jeśli jednak wymagana jest większa kompresja (a więc mała przepływność), konieczne staje się sięgnięcie do sposobów sprawdzonych w kodowaniu percepcyjnym, tak więc po podzieleniu pasma na 32 podpasma sygnał w każdym z nich jest analizowany i obliczany jest próg maskowania zgodnie z modelem psychoakstycznym. Później następuje dynamiczna alokacja bitów, zaś na końcu stosuje się kodowanie o zmiennej przepływności binarnej.
Następnie firma DTS wprowadziła dwa kolejne systemy. Pierwszy z nich był odpowiedzią na wprowadzenie przez Dolby systemu DD EX, a jest nim
System ten jest rozbudowany o dodatkowy tylny głośnik surround (6.1), jednak zapis na nośniku jest w dalszym ciągu w formacie 5.1. Dzieje się tak dlatego, iż w procesie kodowania następuje zmiksowanie 3 kanałów surround (Ls, Cs i Rs) do dwóch bocznych (Lst i Rst), w którym to miksie jest też zawarta informacja o sygnale Cs (rysunek 3). W najczęściej spotykanych rozwiązaniach sygnał Cs jest zredukowany o 3 dB i dodany do sygnałów Ls i Rs.
Kolejna rozbudowa systemu DTS to zwiększenie częstotliwości próbkowania i rozdzielczości bitowej. I tak powstał system
Jak łatwo się domyślić, system ten pracuje z sygnałami o częstotliwości próbkowania 96 kHz i 24-bitowej rozdzielczości.
Do tej pory obracaliśmy się w problematyce „poszerzania” pola dźwiękowego od dwuwymiarowego, „płaskiego” stereo po różne próby odwzorowania trójwymiarowego, zbliżonego do realnego pola dźwiękowego. Punktem wspólnym tych rozwiązań jest stosowanie „naturalnych” metod rozszerzania pola dźwiękowego, za pomocą dodawania kolejnych źródeł dźwięku (głośników), które miały w sposób fizyczny otaczać nas dźwiękiem.
Systemy te całkiem nieźle sprawdzały się w salach kinowych, gdzie duże rozmiary sali, w połączeniu z duża liczbą głośników efektowych, pozwalały na dość dobre kreowanie pola dźwiękowego otaczającego widza (słuchacza). Gorzej sprawa wygląda w systemach kina domowego. W tym przypadku mamy do czynienia z dwoma (system 5.1) ewentualnie czterema (7.1) głośnikami surround, co nie jest wystarczającą liczbą do „wyprodukowania” rozproszonego i ściśle otaczającego widza pola dźwiękowego. Cóż więc pozostało twórcom systemów home theatre? Zaprząc do współpracy elektronikę „wyższą”, opartą na DSP, aby „wymodelować” taką przestrzeń dookoła nas, jaką zapragniemy (przynajmniej w teorii). W firmie Yamaha zaczęło się to jeszcze w czasach popularności Dolby Pro Logic, w którym to systemie – jak może pamiętamy – kanał surround był monofoniczny (dwa głośniki – lewy i prawy – grały ten sam sygnał, a więc dość ubogi system dookólny). Dzięki DSP możliwe stało się lepsze otoczenie słuchacza dźwiękiem, tak aby miał wrażenie przebywania w sali kinowej lub dowolnej innej, której parametry zostały zapisane w pamięci urządzenia. System Pro Logic w zasadzie jednak to już przeszłość odkąd pojawił się w pełni cyfrowy i dysponujący o wiele większymi możliwościami system Dolby Digital. Z nim też Yamaha weszła w komitywę, jeszcze bardziej rozszerzając jego możliwości za pomocą
U podstaw tego systemu leży twierdzenie wynikające z pomiarów dźwięku występującego w kinie, mówiące, że można wyróżnić trzy pola dźwiękowe oddziałujące na widza: przednie, lewe tylne i prawe tylne. Pozostało więc dopasować działanie DSP do kinowych założeń. Tak właśnie powstał projekt Tri-Field Cinema DSP, kreujący przedni plan z dialogami, muzyką, przednimi efektami, oraz dwa silne, niezależne pola efektowe, lewe i prawe, ulokowane za słuchaczem.
Sercem układu jest DSP, który współpracuje z oprogramowaniem dzielącym rodzaje odbić akustycznych na bezpośrednie oraz wielokrotne, o dłuższym czasie opóźnienia. W zależności od zaprogramowania procesora użytkownik ma możliwość ustalenia czy chce uzyskać wrażenie przebywania w salach o małej kubaturze (gdzie w rzeczywistości mamy do czynienia prawie wyłącznie z odbiciami bezpośrednimi), czy w odmiennym brzmieniowo pomieszczeniu, gdzie za tworzenie się charakterystycznego brzmienia odpowiadają wielokrotne odbicia (hala koncertowa, stadion).
Czas rozszyfrować kolejny skrót. Kolejny skrót to kolejny system i kolejna firma, nie mniej znana niż Yamaha, której nie mogło zabraknąć w tak ważnej obecnie dziedzinie przetwarzania sygnałów audio. Digital Cinema Sound (bo tak rozszyfrowujemy skrót DCS) to system przetwarzania 5.1, pozwalający na modelowanie akustyki pomieszczeń przy pogorszonych warunkach odsłuchowych. Zgodnie z opracowanymi parametrami i techniką przetwarzania pozwala ona wierniej odtworzyć atmosferę kinową i tworzyć wirtualne obrazy przestrzenne za pomocą mniejszej liczby głośników.
System wirtualnego dźwięku przestrzennego opracowany przez koncern Sony, podobnie jak w przypadku DSP Yamahy, opiera się na wykorzystaniu cyfrowego DSP, który modyfikuje rozkodowany sygnał audio uzyskany z systemów DD AC-3 lub DTS. Inżynierowie Sony zwrócili uwagę, że w instalacjach domowych najmniej naturalnie reprodukowane są efekty za słuchaczem. Dlatego właśnie na tym aspekcie skupiła się ich praca. W kinie za widzem pracuje wiele głośników, tworząc odpowiednie pole akustyczne, podczas gdy w domu są tylko dwa głośniki efektowe (przynajmniej w systemie 5.1). Ale można temu zaradzić stosując odpowiednie obliczenia dokonywane przez DSP.
I to by było na tyle, jeśli chodzi o bardzo poglądowe i skrótowe zaprezentowanie najważniejszych zagadnień związanych z techniką cyfrową, które warto – a czasem wręcz trzeba – wiedzieć, pracując z dźwiękiem. Mam nadzieję, że choć trochę „oświeciłem” tych, którzy dotąd bali się jak ognia wszystkiego, co z „cyfrą” ma wspólnego, lub ugruntowałem wiedzę tych, którym poruszane w kilkunastu artykułach tematy nie są obce. A głodnych szerszej wiedzy zapraszam do lektury fachowych książek z zakresu poruszanej przez nas tematyki, których na rynku jest kilka, nawet w naszym ojczystym języku.
Jan Erhard
Jan Erhard z wykształcenia jest informatykiem i specjalistą od sieci cyfrowych, zaś z zamiłowania muzykiem. Zajmuje się też realizacją dźwięku, stąd jego zainteresowania i duża wiedza na temat cyfrowego przetwarzania sygnałów.