Wprowadzenie
PDM jest akronimem słów Pulse-Density Modulatation (Modulacja gęstości impulsów). Biorąc pod uwagę fakt, że zasadniczo modulacja ta jest niczym innym, jak próbkowaniem sygnału 1 bitowego z bardzo wysoką częstotliwością, możemy posłużyć się nazwą “nadpróbkowany sygnał jednobitowy”, która lepiej podsumowuje i opisuje cały ten proces.
Z innej strony wiele obecnych cyfrowych systemów audio do reprezentacji sygnału wykorzystuje wielobitowy sygnał PCM (Pulse-Code Modulation). Jest to metoda łatwiejsza w obsłudze, pozwalająca na przeprowadzenie wielu operacji na strumieniu audio, takich jak miksowanie, filtrowanie i korekcja.
Porównując, wykorzystywany w PDM model jednobitowy jest prostszy w koncepcji i wykonaniu od PCM. Z tego względu format ten stał się popularny w przesyle sygnału z mikrofonów do procesora urządzeń mobilnych, zapewniając niski poziom szumów, brak zakłóceń i niski koszt produkcji. Niniejszy artykuł obejmuje podstawy PDM: sposób generacji, przesyłu i manipulacji.
Podstawowe definicje
- DAC (Digital to Analog Converter) - Urządzenie konwertującę sygnał cyfrowy na sygnał analogowy.
- LSB (Least Significant Bit) - Najmniej znaczący bit - bit o najmniejszej wadze w słowie maszynowym, znajdujący się na miejscu skrajnie wysuniętym w prawo.
- MSB (Most Significant Bit) - Najbardziej znaczący bit - bit o największej wadze w słowie maszynowym, znajdujący się na miejscu skrajnie wysuniętym na lewo.
- PCM (Pulse Code Modulation) - System reprezentujący spróbkowany sygnał jako serię słów wielobitowych. Technologia stosowana m.in. w płytach audio CD.
- PDM (Pulse Dynamic Modulation) - System reprezentujący spróbkowany sygnał jako strumień pojedynczych bitów.
- Częstotliwość próbkowania - Częstotliwość z jaką sygnał jest próbkowany w celu utworzenia sygnału dyskretnego w dziedzinie czasu.
- Długość słowa maszynowego - Liczba bitów używanych do reprezentacji próbki.
- Kwantyzacja - Proces polegający na przypisaniu do każdej próbki sygnału (powstałej w procesie próbkowania) wartości poziomu kwantowania.
- Dithering - Proces polegający na implementacji w strumień dźwiękowy, niskopoziomowego szumu redukującego zakłócenia.
- Linearyzacja - Proces polegający na łagodzeniu degradacji sygnału spowodowanego kwantyzacją sygnału.
- Modulacja szumu - Niepożądana zmiana poziomu szumu, spowodowana konwersją sygnału.
PCM
Zanim zajmiemy się opisem PDM, przyjrzymy się w pierwszej kolejności PCM - wielobitowej metodzie reprezentacji sygnału cyfrowego. W PCM sygnał reprezentowany jest poprzez serię sampli, posiadających różną długość słów. O wydajności systemu decydują dwa czynniki:
- Częstotliwość próbkowania: określająca przepustowość systemu. Częstotliwość próbkowania (Fs) determinuje pasmo przenoszenia sygnału audio, gdzie najwyższa częstotliwość, która może zostać przekonwertowana bez zniekształceń wynosi F=Fs/2
- Długość słowa maszynowego: determinujący stosunek sygnału do szumu (SNR) systemu. Stosunek ten określany jest wzorem (6.02N + 1.76) dB, gdzie N określa długość słowa
16 bitowy system powinien charakteryzować się SNR równym 98dB. W praktyce Dhiterning, służący do linearyzacji sygnału i eliminowania modulacji szumu, zwiększa stosunek SNR o 4 dB. Korzystając z powyższego wzoru, 1-bitowa modulacja posiadałby SNR na poziomie 8 dB, co oczywiście jest nie do przyjęcia dla żadnego systemu audio. Co więcej, ze względu na to, że Dithering wymaga dwóch najmniej znaczących bitów (2-LSD), metoda 1-bitowa nie pozwala na jego zastosowanie.
Ponieważ system nie może zostać poprawnie wygładzony, na pierwszy rzut oka wydaje się on być, niemożliwym do wdrożenia. Kluczem do rozwiązania powyższych problemów jest zrozumienie techniki kształtowania szumu i nadpróbkowania.
Kształtowanie szumu
Rozważmy typowy sygnał PCM, będący 24-bitową reprezentacją sygnału sinusoidalnego. W jaki sposób przedstawić go za pomocą systemu posiadającego rozdzielczość 1-bitową, znając problematykę związaną ze wspomnianymi wcześniej zniekształceniami i niskim stosunkiem SNR?
Rozpocząć można od odrzucenia wszystkich bitów za wyjątkiem MSB, skutecznie ustawiając próg oscylujący wokół punktu zerowego. Taki proces zmieni sygnał sinusoidalny, w falę kwadratową, zmieniającą wartość w punktach zerowych. Taka sytuacja wprowadzi ogromną ilość zniekształceń - przekraczającą 40%. Powstałe zniekształcenia są spowodowane brakiem zastosowania Ditheringu. Proces kwantyzacji zawsze powoduje, powstanie błędów, ale za sprawa ditheringu błędy te pojawiają się w postaci białego szumu tła nie skorelowanego z sygnałem. W sygnale bez ditheringu powstałe błędy powodują zniekształcenia sygnału.
Redukcja do 1-bitowej rozdzielczości z zachowaniem MSB, nie jest zatem rozwiązaniem. Wszyscy jednak znamy przykład takiej redukcji, która działa poprawnie. Jest to raster, używany od lat do reprodukcji obrazów w druku.
W rastrze, obrazy z ciągłymi tonami (np. te przedstawiane w skali szarości) są konwertowane na serię występowania i braku czarnych kropek. Innymi słowy, słowa maszynowe zostały zredukowane do jednego bitu, w którym jego wartość determinuje obecność lub brak kropki. Nie jest to operacja odbywająca się na zasadzie prostego progowania, lecz poprzez rozłożenie powstałego błędu na skutek progowania, pomiędzy sąsiadującymi pikselami, które nie zostały jeszcze poddane temu procesowi. Proces ten nosi nazwę błędu rozmycia - error diffusion.To jak drastyczny jest efekt rozproszenia błędu, zostało zaprezentowane na poniższej grafice.
Powodem, dla którego użycie rozproszenia błędu powoduje, znaczący wzrost jakości obrazu jest fakt, iż zabieg ten spełnia dwie funkcje. Pierwszą jest zmiana zniekształceń powstałych poprzez progowanie w strukturę podobną do szumu tła, natomiast druga, jest kreowanie tego szumu w ten sposób by możliwie zredukować jego występowanie w zakresie niższych częstotliwości przestrzennych, na rzecz częstotliwości wyższych. W kontekście obrazu taki zabieg ma sens, ponieważ większość informacji niesionej przez obraz zawarta jest w niższym zakresie częstotliwości przestrzennej. Wyższe częstotliwości zostają odfiltrowane przez nasze oko, więc dopóki “kropki” pozostają wystarczająco małe lub obraz jest w dostatecznej odległości, szum wysokoczęstotliwościowy nie zostanie przez nas zarejestrowany.
W rezultacie to co początkowo wprowadzało znaczne zniekształcenia obrazu, zmieniło się w łagodny szum w górnym paśmie częstotliwości przestrzennej. Poprzez łagodny szum, rozumiemy tutaj fakt, że jego występowanie jest na poziomie akceptowalnym, chociaż ze względu na brak procesu ditheringu, szum ten nie jest szumem progowym. Pozostaje on wciąż skorelowany z sygnałem, powodując powstanie artefaktów. Jednakże, stan wizualny obrazu jest dobry.
Przykładem kształtowania szumu jest technika zwana rastrowaniem. Zniekształcenia powstające na skutek zmiany długości słowa maszynowego są kształtowane, co powoduje przeniesienie ich z rozłożenia wzdłuż całego pasma, w stronę wyższych częstotliwości.
Generalnie systemy kształtujące szum nie muszą ograniczać się do 1-bitowej długości słowa, a szum nie musi zostać przeniesiony w zakres wyższych częstotliwości, jednak w wielu przypadkach, w tym w systemach PDM, używa się właśnie takich wartości.
Oversampling
Poziom szum spowodowany redukcją długości słowa maszynowego jest znaczący. Jego wartość w systemach 1-bitowych jest około 90 dB wyższa niż dla systemu 16-bitowego. Kształtowanie szumu przenosi jego wartość w zakres wyższych częstotliwości, jednak zabieg ten nie redukuje całkowicie jego wartości. W przypadku obrazów gdzie większość rejestrowanej informacji znajduje się w niższym zakresie częstotliwości, operacja taka nie stanowi problemu. Dla dźwięku średni i wysoki zakres częstotliwości stanowi ważną część przenoszonej informacji, dlatego w tym przypadku zabieg kształtowania szumu w powyższej formie nie może zostać zastosowany.
Rozwiązaniem tego problemu jest zwiększenie częstotliwości próbkowania sygnału. Pozwoli to na zwiększenie pasma sygnału, a co za tym idzie stworzenie “przestrzeni” będącej poza zakresem percepcji ucha ludzkiego. To właśnie ta przestrzeń zostanie wykorzystana w procesie kształtowania szumu, pozwalając na jego przesunięcie w zakres częstotliwości nie rejestrowanych przez nasze uszy.
Użycie wyższej częstotliwości próbkowania, może zostać zrealizowane na dwa sposoby:
- Poprzez użycie wysokiej częstotliwości próbkowania, od razu w procesie digitalizacji sygnału. Ten rodzaj używany jest w mikrofonach PDM gdzie typowa częstotliwość próbkowania wynosi 3 MHz.
- Poprzez interpolację istniejącego sygnału cyfrowego, zdigitalizowanego ze standardową prędkością próbkowania - np. 44,1 kHz. Takie rozwiązanie stosowane jest w przypadku wielu przetworników cyfrowo analogowych, w których sygnał wyjściowy reprezentowany jest poprzez sygnał PDM.
Przyjrzyjmy się teraz dokładnie obu metodom.
Mikrofony PDM
Mikrofony PDM, nazywane również mikrofonami cyfrowymi, składają się z następujących części:
- Mikrofon - najczęściej jest to konstrukcja elektrowa
- Przedwzmacniacz analogowy
- Modulator PDM
- Interfejs logiczny
Sygnał analogowy zebrany przez membranę mikrofonu jest początkowo wzmacniany, próbkowany z wysoką częstotliwością, a nastepnie kwantowany w module PDM. Modulator łączy operacje kwantyzacji i kształtowania szumu - tworząc na wyjściu sygnał pojedynczych bitów z wysoką częstotliwością próbkowania. Kształtowanie szumu sprawia, że jego poziom występujący w słyszalnym paśmie sygnału jest relatywnie niewielki, w stosunku do jego zawartości w paśmie niesłyszalnym. Interfejs logiczny jest odpowiedzialny za akceptację zegara i transmisję bitową próbek.
Sygnał zegara dostarczany jest do zestawu mikrofonu, poprzez podłączone do niego urządzenie zewnętrzne. Taktowanie definiuje zarówno częstotliwość próbkowania całego systemu, jak i częstotliwość przenoszenia bitu w sygnale cyfrowym. Chociaż nie występuje żadna znormalizowana wartość, najczęściej stosunek nadpróbkowania jest równy 64. Zatem by osiągnąć pasmo sygnału równe 24 kHz porównywalne dla systemu PCM z częstotliwością próbkowania 48kHz, wartość ta musi wynosić 3,072 MHz.
Bity w ciągu danych przesyłane są na obu zboczach głównego zegara. Większość mikrofonów PDM wspiera tę operację stosując dwa mikrofony, w których każdy odpowiedzialny jest za konkretne zbocze. Sygnał ten może w prosty sposób zostać połączony, a następnie poprzez odbiornik PDM odseparowany na dwie ścieżki informacji.
Konwersja sygnału PCM na PDM
Wspomniany wcześniej drugi przypadek nadpróbkowania, dotyczy m.in. komercyjnych przetworników DAC, konwertujących sygnał analogowy lub sygnał PCM na PDM. W tym przypadku sygnał został już poddany próbkowaniu o niższej częstotliwości niż w przypadku PDM. By zwiększyć tę częstotliwość i umożliwić efektywne kształtowanie szumu, sygnał musi zostać interpolowany. Następnie długość słowa zredukowana jest do jednobitowej wartości.
Interpolacja jest operacją cyfrowej filtracji, w której generowane są dodatkowe próbki sygnału, pomiędzy już istniejącymi, tak by zwiększyć częstotliwość próbkowania sygnału.
Modulacja PDM
Modulacja PDM odpowiedzialna jest za produkcję jednobitowego sygnału z możliwie niskim poziomem szumu. Złożoność tego modułu jest wyrażana w formie jego rzędu.
Rząd modulacji jest równy liczbie integratorów (węzłów akumulujących) - im wyższy rząd tym szum kształtowany jest agresywniej z pasma przepustowego w kierunku pasma zaporowego, poprawiając stosunek szumu w sygnale. Konstrukcja modulatorów wyższych rzędów jest jednak bardziej złożona. Dodatkowo są one bardziej podatne na niestabilności w określonych warunkach pracy, a maksymalny poziom nie wprowadzający przeciążenia jest niższy.
Chociaż nie istnieje żaden przemysłowy standard - typowe modulatory używane w mikrofonach PDM są czwartego rzędu. Taka konstrukcja oferuje optymalny kompromis pomiędzy złożonością modelu a jego osiągami.
Poniższe grafiki przedstawiają wykresy sygnału wyjściowego z 4-rzędowego modulatora dla dziedziny czasu i częstotliwości w przypadku, gdy bodźcem pobudzającym układ jest sygnał sinusoidalny. W domenie czasowej sygnał zmienia się pomiędzy dwoma poziomami. W dziedzinie częstotliwości na osi x ukazane zostało pasmo przepustowe sygnału rozłożone pomiędzy wartościami 0 - 0,5 fs (częstotliwość próbkowania). Powyżej tej wartości znajduje się pasmo powstałe poprzez nadpróbkowanie, w którym widać zdecydowany wzrost poziomu szumu. Dodatkowo widoczna jest wysoka wartość zniekształcenia dla 3 harmonicznej - odpowiadającej wartości 0,06 fs
Przesył oraz konwersja sygnału PDM
Sygnał PDM jest sekwencją binarną zmieniającą swoją wartość w częstotliwości ok. 3 MHz. Z tego powodu, tak samo jak w przypadku innych cyfrowych formatów (np. SPDIF), należy zadbać by przesył odbył się przy pomocy wysokiej jakości przewodów oraz by został odpowiednio przetworzony.
Docelowo żeby zostać usłyszanym, sygnał PDM wymaga konwersji na sygnał analogowy. Dla innych urządzeń w celu przetwarzania lub analizy, sygnał PDM powinien zostać przekonwertowany na PCM.
Koncepcja konwersji z sygnału PDM na analogowy jest stosunkowo prosta. W procesie tym należy zastosować filtr dolnoprzepustowy, dzięki któremu pasmo niesłyszalne, zawierające szum zostanie odfiltrowane, przekazując jedynie użyteczny nie zakłócony sygnał.
W praktyce, charakterystyka sygnału PDM wymaga starannego zaprojektowania etapów filtracji sygnału, jednak w zamian otrzymujemy wysokiej jakości sygnał analogowy.
Konwersja sygnału PDM na PCM jest procesem bardziej skomplikowanym. Liczba próbek powstałych podczas nadpróbkowania, musi zostać zredukowana. Operacją pozwalającą na tę redukcję jest Decymacja, będąca odwrotnością wcześniej opisanej interpolacji. Należy zwrócić uwagę by szum zawarty w 1-bitowej reprezentacji sygnału znad pasma słyszalnego nie wywołał aliasingu w paśmie słyszalnym. Filtry decymacyjne powinny zostać zaprojektowane w ten sposób by przefiltrować sygnał zawierający szum i zachować jedynie słyszalny sygnał audio. W rezultacie po konwersji, sygnał przyjmuje postać PCM, z częstotliwością próbkowania odpowiadającej “nie nadpróbkowanemu” sygnałowi. Zazwyczaj w konsekwencji filtrowania, z jednobitowych słów maszynowych, otrzymujemy 24 bitową sekwencję.
Wyniki
Pomimo wielu zalet modulacja PDM posiada również swoje ograniczenia. W szczególności, brak możliwości dodania wystarczającego Ditheru, nie pozwala na pełną linearyzację i elimancję szumu modulacji. Jednakże pomimo tych ograniczeń modulacja PDM pozwala na replikację dźwięku w wysokiej jakości.
Wydajność modulatorów PDM zależy od ich projektu. W analizatorach Audio Precision moduł PDM, wykorzystuje 4-rzędowy oraz 5-rzędowy modulator delta-sigma, w połączeniu z wielostopniowymi filtrami decymacji/interpolacji. Specyfikacja modułu PDM została przedstawiona poniżej (decymator 5-rzędu, interpolacja 256x):
Maksymalny poziom wejściowy: -9,8 dBFS
SNR @1 kHz, 9,8 dBFS, DC - 0,45 fs,bez ważenia 127 dB
DNR @1 kHz, 0dBFS, fs=48kHz, na AES17: 137 dB
Płaskość widma, DC - 0,45 fs > +/- 0,001 dB
Wszystkie modulatory PDM wyższego rzędu mają maksymalny poziom wejściowy, w pewnym sensie poniżej całkowitej skali. Przekroczenie tego poziomu będzie powodować przeładowanie modulatora, skutkując zniekształceniami w sygnale. W celu uniknięcia przeładowania, oprogramowanie APx500 wyświetla odpowiedni komunikat, w momencie przekroczenia dopuszczalnego poziomu.
Dla modulatorów 5-rzędu, wartości THD+N zdominowane są przez szum progowy. Dla modulatorów 4-rzędu zaobserwować można wzrost zniekształceń dla 3 harmonicznej. Zniekształcenia te powstają z powodu braku ditheringu.
Podsumowanie
Modulacja PDM jest efektywnym i niedrogim sposobem przesyłu sygnałów mono i stereo w parach “clock/data” (informacja zegara i dane). Pomimo nieodłącznych ograniczeń, związanych z jednobitową reprezentacją danych, ostrożne zaprojektowanie systemu, pozwala na uzyskanie wysokiej jakości sygnału audio. Audio Precision wraz z specjalnie przystosowanym modułem APx PDM, pozwala na dokładną analizę projektowanych modułów, skracając czas i zwiększając osiągi całego systemu.
Bibliografia
- A Brief Introduction to Sigma Delta Conversion, Intersil Application Note AN9504, May 1995. Retrieved from https://www.intersil.com/data/an/an9504.pdf.
- Principles of Sigma-Delta Modulation for Analog-to-Digital Converters, Motorola Application Note APR8/D Rev. 1, 1990. Retrieved from https://www.numerix-dsp.com/appsnotes/APR8-sigma-delta.pdf.
- Delta-Sigma Data Converters: Theory, Design, and Simulation, by Steven Norsworthy, Richard Schreier, and Gabor Temes, Wiley-IEEE Press, 1996.
- Understanding Delta-Sigma Data Converters, by Richard Schreier and Gabor Temes, Wiley-IEEE Press, 2004.
Artykuł opracował:
Robert Maćkowiak
Inżynier produktu
Jeśli potrzebujesz pomocy w wyborze odpowiedniej aparatury do pomiarów akustycznych - umów się na darmową, telefoniczną konsultację.
Postaramy się wybrać dla Ciebie odpowiednie rozwiązania.