Ulubiony kiosk PRZEJRZYJ ONLINE LISTOPADOWE WYDANIE Live Sound PRZESYŁKA GRATIS

Prezentacje

AES50. SuperMAC i HyperMAC

AES50. SuperMAC i HyperMAC

W lipcu 2005 roku szacowne gremium o nazwie Audio Engineering Society opublikowało AES50-2005, opisując metodę wielokanałowej transmisji digital audio, wykorzystującą okablowanie komputerowe w standardzie 100 Mbit/s CAT5.

 

Jestem przekonany, że po tym zdarzeniu wiele osób zachodziło w głowę, zadając sobie pytanie: „cóż w tej metodzie może być innowacyjnego, że wzbudza nagłe zainteresowanie”? Należy w tym miejscu dodać, że wówczas funkcjonowało już niemało technik umożliwiających przesyłanie audio z wykorzystaniem skrętki CAT5.

NIECO HISTORII


W tle opublikowanego, otwartego standardu AES50 stoi opracowana przez Sony Pro-Lab w Oxfordzie technologia określana mianem Super MAC. Sony poczyniło też pierwsze kroki w kierunku promowania owej technologii, proponując dla innych producentów licencję pozwalającą na jej swobodne i powszechne wykorzystanie. W efekcie tych działań kilka firm wystąpiło o uzyskanie takiej licencji, skutkiem czego pojawiły się na rynku urządzenia wyposażone w połączenia AES50. Nie było to jednak na owe czasy nic znaczącego w rozumieniu komercyjnego zastosowania nowej technologii.

Sytuacja zmieniła się diametralnie dopiero wtedy, gdy Midas podjął decyzję o wykorzystaniu nowej technologii transmisji audio oraz transferu danych dla urządzeń wchodzących w skład cyfrowego, koncertowego systemu miksującego XL8. Niestety, niedługo po uzyskaniu standaryzacji formatu potwierdzonego przez Audio Engineering Society oraz wprowadzeniu na rynek systemu Midas XL8 korporacja Sony podjęła decyzję o wystawieniu na sprzedaż oddziału Sony Oxford Pro-Lab.

Przemiany, które nastąpiły w związku z przekształceniem Sony Pro-Lab, przyczyniły się z oczywistych powodów do znacznego spowolnienia procesu upowszechniania standardu. Technologia Super MAC została wykupiona przez firmę Klark Teknik i gdy tylko wszystkie sprawy formalne zostały doprowadzone do końca, a sytuacja stała się w pełni klarowna, wdrażanie standardu zastosowanego w kolejnych urządzeniach marki Klark Teknik/Midas ruszyło naprzód ze zdwojoną energią.

 

DLACZEGO WŁAŚNIE AES50?


Jak wspomniałem na wstępie, kiedy opublikowano w 2005 roku nową metodę transferu audio, wykorzystującą komercyjny standard okablowania komputerowego CAT5, podobnych metod funkcjonowało na rynku już dość sporo. Kluczowe znaczenie w powyższym stwierdzeniu ma określenie „podobnych”, bo owe podobieństwo jest jedynie pozorne – do czego zresztą za chwilę dojdziemy.

Otóż znakomita większość sieci, z komercyjnego punktu widzenia mających znaczenie w przemyśle pro audio, korzysta z przemysłowych standardów komputerowych, opartych głównie na stworzonym w latach 70-tych protokole TCP/IP (Transmission Control Protocol/Internet Protocol). Mówiąc w dużym uproszczeniu, metoda ta polega na wiązaniu zebranych sampli w pakiety o stałej długości. Jedynym wyjątkiem jest ostatnia część informacji, której długość może być mniejsza od pozostałych. Pakiety zostają następnie zaopatrzone w nagłówki, które zawsze mają tę samą długość – bez względu na liczbę przesyłanych w danym pakiecie danych. Nagłówki zawierają wszelkie informacje, których zadaniem jest umożliwienie pakietom dotarcie z punktu źródłowego do punktu docelowego, umożliwienie sprawdzenia w węzłach sieci poprawności zawartych w pakiecie danych, a punktom docelowym umożliwienie właściwego zestawienia oraz odtworzenia podzielonej „przesyłki”. W nagłówku zatem – w zależności od organizacji sieci – znajdują się najczęściej następujące informacje: adres źródłowy i docelowy, numer pakietu, wskaźnik ostatniego pakietu, a także identyfikator zawartej w pakiecie informacji. Z uwagi na fakt, że każdy z pakietów może podążać do celu zupełnie inną ścieżką, niż pozostałe pakiety, informacje zawarte w nagłówkach mają w tym przypadku szalenie istotne znaczenie dla prawidłowego działania transmisji. Tak przygotowane informacje zostają przesłana poprzez standardową sieć, a następnie są dekodowane w punkcie docelowym.

Niewątpliwą zaletą opisanej metody jest możliwość wykorzystania szerokiej gamy standardowego sprzętu sieciowego, jakim są na przykład urządzenia węzłowe (huby i switche), które łączą ze sobą wiele sygnałów i urządzeń danego segmentu sieci.

Niewątpliwą i zarazem nieakceptowaną wadą tej metody jest natomiast to, że cechy wszelkich urządzeń sprzętowych zostały zoptymalizowane pod kątem ogólnych wymagań dotyczących transferu danych w ruchu teleinformatycznym, w którym zakres tolerowanego opóźnienia transmisji jest nie do przyjęcia w przypadku wykorzystania dla przesyłu sygnałów audio.

Oto przykład. Jeżeli z Internetu pobierany jest plik dużych rozmiarów, to faktycznie istotnym dla pobierającego jest jedynie całkowity czas potrzebny do jego pobrania. Jeśli podczas pobierania pliku transfer zatrzyma się całkowicie – na powiedzmy 10 milisekund – nie ma to dla pobierającego dane żadnego znaczenia. Przerwy w transferze są wynikiem tendencji komercyjnych urządzeń sieciowych do buforowania danych do rozmiaru ekonomicznych pakietów, w celu dopasowania się do globalnego ruchu w sieci, by jak najefektywniej wykorzystać jej możliwości. Jeżeli teraz rozpatrzymy ten sam przypadek pod kątem transmisji audio, to po zatrzymaniu transferu na 10 milisekund – przy próbkowaniu 96 kHz – tracimy 960 próbek. Aby więc zapewnić płynność transferu audio, systemy oparte na protokole TCP/IP zazwyczaj muszą buforować pewną liczbę danych, aby zapewnić sobie kompensację różnic występujących w poszczególnych segmentach sieci. Skutkiem takiego procesu jest wzrost latencji danego transferu lub ogólne opóźnienie w działaniu danego systemu.

Niektóre systemy działające w oparciu o protokół TCP/IP mogą zapewniać kilka kanałów o niskiej latencji dla transferu audio, ale jest to osiągane kosztem znacznego zmniejszenia dostępnej przepustowości. Wynika to z samej struktury formowanych pakietów, gdzie – o czym wcześniej wspomniałem – właściwe dane poprzedzają nagłówki, informacje, sprawdzanie błędu, itp., stanowiące stałą określoną wielkość każdego pakietu. Jeśli nawet wysyłanych jest zaledwie kilka bitów audio, to i tak większość przepustowości „marnowana” jest na przesyłanie stałej wielkości nagłówków.


AES50 oparty jest na zupełnie odmiennej koncepcji, wykorzystującej tylko fizyczną warstwę Ethernetu, a ściślej mówiąc jedynie kable oraz to, co znajduje się na obu ich końcach, czyli transceivery. Przesyłane sygnały nie opierają się tu jednak na protokole TCP/IP, ale wykorzystują deterministyczny protokół, który w gruncie rzeczy jest multipleksowaniem z podziałem czasu (Time-Division Multiplexing) zachodzącym na poziomie sprzętowym. Jest to – mówiąc w uproszczeniu – ustalony szablon transferu danych, powielany w powtarzalny sposób. Przesyłane sygnały dzielone są na części, którym później przypisywane są czasy transmisji, tzw. szczeliny czasowe. Z uwagi na fakt, że ustanowione połączenie służy jedynie do transferu danych AES50 pomiędzy dwoma punktami, a nie ogólnemu przesyłowi danych teleinformatycznych poprzez globalną sieć, podzielone na części i uporządkowane w ramkach dane audio nie wymagają przesyłania i dekodowania nagłówka zawierającego wiele złożonych informacji.

Ramki natomiast mają działający z wyprzedzeniem program umożliwiający sprawdzanie i korekcję błędu pojedynczych bitów w miejscu docelowym. Dane „kodowane” są w taki sposób, że sąsiednie bity powiązane z różnymi próbkami wykorzystywane są do pełnej korekty lokalizowanych błędów. Oznacza to również, że kiepska jakość linku – wynikająca na przykład z uszkodzonych kabli czy zewnętrznych interfejsów – może być identyfikowana przez odbiorcę podczas trwania pełnej transmisji audio.

AES50, SUPERMAC I HYPERMAC


Są to pojęcia, z którymi dość często można się spotkać w materiałach dotyczących opisu urządzeń pro audio, głównie tych, na których umieszczone jest logo Klark Teknik lub Midas. Co kryje się za każdą z nazw? Chyba warto rzec kilka słów wyjaśnienia na ten temat. Określenie AES50 odnosi się do standardu ustanowionego przez Audio Engineering Society. Jako taki definiuje on sygnał w połączeniu pomiędzy dwoma elementami sprzętu. Jest to otwarty standard i każdy może wykonać sprzęt, który będzie z nim zgodny, nie odnosząc się w żaden sposób do konstrukcji pozostałych producentów.

SuperMAC odnosi się natomiast do konkretnego wdrożenia AES50, opracowanego przez Sony, a obecnie będącego własnością Klark Teknik/Midas. Zazwyczaj jest on używany jako „zamknięta paczka”, dostarczająca kod dla programowanych układów scalonych o budowie matrycy (FPGA), które są zintegrowane z urządzeniami danego producenta.

HyperMAC jest „bliskim krewnym” AES50. W istocie ma on podobną koncepcję interfejsu, z tą różnicą że opiera się na Gigabitowym, a nie 100-megabitowym Ethernecie. Może być transportowany poprzez sieć kablową w standardzie CAT5e i CAT6 lub światłowodami. Zamieszczona tabela przedstawia relację pomiędzy AES50, SuperMAC i HyperMAC. Należy zwrócić uwagę, że wszystkie połączenia są dwukierunkowe i zawierają tę samą liczbę kanałów w obu kierunkach.

DODATKOWE ZALETY – FUNKCJE KONTROLNE


Niezależnie od transmisji audio formaty te zapewniają kanał dla transferu danych kontrolnych, który przeplata się z transferem audio. Umożliwia to kontrolowanie sprzętu na odległość, bez konieczności tworzenia dodatkowej sieci. Należy tu zauważyć, że AES50 nie ma zdefiniowanego dla niego protokołu czy też języka określającego ściśle transfer danych kontrolnych. Nie ma przykładowo czegoś takiego, jak polecenie w sensie „ustaw gain na -2 dB” itp. AES50 jedynie udostępnia ścieżkę do przesłania pakietów kontrolnych do zdalnie kontrolowanego sprzętu. U podstaw takiego rozwiązania legło proste założenie, które mówi, że najprawdopodobniej różni producenci będą i tak używać w sieci własnych protokołów kontrolnych dla produkowanego sprzętu. Z uwagi na to sprzęt różnych producentów może ze sobą współdziałać z punktu widzenia audio – zakładając, że ma tę samą częstotliwość próbkowania. Natomiast wszelkie dane kontrolne będą po prostu ignorowane.

DYSTRYBUCJA ZEGARA


Opisane formaty umożliwiają również łatwą dystrybucję zegara synchronizującego system i utrzymującego precyzyjnie zgodność fazową sygnału. Super- MAC wykorzystuje w tym celu dodatkową parę skrętki CAT5. HyperMAC natomiast osadza znaczniki czasowe w przepływającym strumieniu danych. W jednym i drugim przypadku zapewnia to niezawodne, w pełni zsynchronizowane taktowanie zegarów w odbiornikach przez zegar nadajnika. Z uwagi na fakt, że w świecie produkcji muzycznych analogowe urządzenia łączone są z systemami cyfrowymi oraz że różne urządzenia cyfrowe wciąż łączone są za pomocą analogowych kabli, możliwość dostarczenia wysokiej jakości sygnału synchronizującego zaczyna nabierać w wielu przypadkach coraz bardziej krytycznego znaczenia.

LATENCJA


Formaty AES50 i HyperMAC charakteryzują się bardzo niską latencją. Jej wartość nie przekracza 70 mikrosekundy na link. Uzyskanie tak doskonałych parametrów stało się możliwe dzięki naturze połączeń opartych na TDM. Nigdy nie udałoby się uzyskać takiej wartości, opierając się na protokole TCP/IP, zwłaszcza przy przesyłaniu dużej liczby kanałów audio.

Tu może nasunąć się następujące pytanie: czy rzeczywiście uzyskane parametry mają jakiekolwiek znaczenie w sytuacji, gdzie wartość latencji oscylująca w okolicach 1 milisekundy uznawana jest za akceptowalną? Odpowiedź brzmi następująco: nie mają najmniejszego znaczenia... i dodajmy od razu, że odpowiedź ta jest prawdziwa jedynie przy pewnym założeniu. Otóż nie mają one najmniejszego znaczenia tak długo, jak długo mamy do czynienia z pojedynczym połączeniem od punktu do punktu. W momencie kiedy użytkownik zaczyna tworzyć prawdziwą sieć, dodając kolejne urządzenia, łącząc je pomiędzy sobą skrętką CAT5, latencja zaczyna się bardzo szybko powiększać. W prostym systemie ścieżka sygnału może wyglądać następująco: mikrofon (jako źródło sygnału), następnie splitter z modułem wejściowym, a po nim router. Dalej mamy DSP i ponownie router oraz moduł wyjściowy, za którym są głośniki lub systemy IEM. Jeżeli weźmiemy pod uwagę tylko cztery połączenia sieciowe, to przy latencji rzędu 1 milisekundy na link jej wartość wynosiłaby już 4 milisekundy, powodując na przykład uciążliwym korzystanie z systemów IEM.

Zamierzając wykorzystać maksymalnie potencjał, jaki niesie technologia cyfrowa, problemu latencji nie można po prostu ignorować.

ROUTERY


Jeżeli przyjrzeć się bliżej formatom opartym na protokole TCP/IP, zauważyć można bez trudu, że ich niewątpliwie znaczącą przewagą jest możliwość wykorzystania popularnych urządzeń sieciowych, ogólnie dostępnych w każdym sklepie komputerowym. W praktyce okazuje się jednak, że nie wszystko jest tak proste, jak na pozór się wydaje. W przypadku audio, aby zapewnić niezakłócony transfer przekazu potrzebne są urządzenia dobrej jakości, a także pewien zasób doświadczenia, by poprawnie przygotować je do pracy. Poza tym urządzenia te – o czym było wspomniane wcześniej – są zoptymalizowane na standardowy ruch sieciowy, wykorzystujący pakiety, w których nie ma możliwości separacji audio od pozostałych danych.


W przeciwieństwie do opisanej sytuacji AES50 i SuperMAC wymagają specjalnych routerów, dedykowanych wyłącznie dla tego typu zastosowań. Stwarza to pewne ograniczenie, które może być przez niektóre osoby uznane za swego rodzaju wadę. Pozytywną stroną tej sytuacji jest fakt, że zdecydowanie lepiej spełniają one swoją rolę w przypadku sieci transportujących sygnały audio. Router tego typu nie tylko rozsyła pojedyncze sygnały audio na zasadzie „jeden do wielu”, ale spełnia też funkcję konwencjonalnego urządzenia sprzętowego typu switch dla transferu danych kontrolnych, traktując je rozdzielnie od sygnałów audio. Routery AES50 wykorzystywane są zazwyczaj w systemie również jako źródło zegara lub urządzenie „slave”, zapewniając dużą elastyczność działania oraz eliminując potrzebę stosowania zewnętrznych systemów dystrybucji Wordclock.

Niewątpliwą zaletą routerów stosowanych dla AES50 jest też to, że korzystanie z nich nie wymaga specjalistycznej wiedzy z zakresu budowy i działania sieci, itp. Jedyne czynności, które należy wykonać – oprócz włączenia zasilania – to podłączenie połączeń AES50 oraz wybór źródła zegara.

PODSUMOWANIE


Jednym z kluczowych czynników, który skłonił firmę Klark Teknik/Midas do zaadaptowania AES50, było przekonanie, że w miarę coraz głębszego wchodzenia przemysłu pro audio w świat cyfryzacji potrzebny będzie wspólny otwarty standard. Tak jak odbywało się wszystko wcześniej, w domenie analogowej, gdzie zakończony złączem XLR kabel z sygnałem wpięty do wejścia konsolety powodował, że to po prostu działało. Nikt nie przywiązywał przecież wówczas wagi do tego, kto wyprodukował daną konsoletę lub splitter.


W sumie przyznajcie sami, czy życie nie byłoby przyjemniejsze, gdyby również w przypadku urządzeń cyfrowych nie trzeba było na przykład zwracać uwagi na to, kto jest producentem danej konsolety i która z wersji oprogramowania jest na niej aktualnie zainstalowana?

Czy nie byłoby prościej bez konieczności zwracania uwagi, z jakich urządzeń budujemy system i czy zechcą one ze sobą współdziałać w sposób, jakiego oczekujemy, bez odprawiania nad nimi kilkudziesięciominutowych „egzorcyzmów”, które i tak kończą się niekiedy jedynie połowicznym sukcesem?


Przy poczynionych przed laty założeniach konstruktorzy tandemu Klark Teknik/Midas trwają konsekwentnie do dziś. Nie zamierzają uczynić z AES50 bezpośredniego źródła zysków czerpanych za udostępnianie licencji. Zarabiają na budowaniu wysokiej klasy sprzętu, a AES50, no właśnie... Wprowadzając na rynek DN9652 Dual Network Bridge poczynili ukłon w stronę producentów, którzy w swoich urządzeniach wykorzystują inne standardy sieciowe. Czy gest ten zostanie właściwie zinterpretowany przekonamy się z czasem sami. Jeśli chodzi o mnie, to muszę przyznać, że mój optymizm w tej materii jest niestety mocno umiarkowany. Życie udowadniało bowiem wielokrotnie, że uzyskanie porozumienia pomiędzy producentami sprzętu w kwestii ujednolicenia standardów jest długim i żmudnym procesem.

Marek Witkowski