DSP v životě muzikanta

Jakub Angelis, 31. 5. 2004

Digitální technologie se do hudby dostávají mnohem častěji, než si vůbec stíháme uvědomovat. A proto není divu, že se tak často mluví o DSP. DSP najdeme v efektech, počítačích, klávesách, ale i kytarách. Málokdo však za touto magickou zkratkou vidí její pravý význam. A to je také důvod, proč jsme v tomto čísle zvolili DSP jako téma měsíce.

Kořeny DSP

DSP (Digital Signal Processing - číslicové zpracování signálu) je jedna z nejmocnějších technologií, která bude utvářet vědu a konstruktérství v 21. století. Revoluční změny již zasáhly spoustu odvětví: komunikace, zdravotnictví, radar a sonar, hi-fi hudbu, hledání ropy... A samozřejmě ani média (hudbu nevyjímaje) nemohla zůstat mimo. V každé z těchto oblastí se vyvinula velmi propracovaná DSP technologie, se svými vlastními algoritmy, vlastní matematikou a zvláštními technikami. Tato kombinace šířky a hloubky prakticky znemožňuje, aby jeden člověk zvládnul kompletní DSP technologii.

DSP odlišuje od jiných oblastí počítačové vědy unikátní typ dat, která používá - signály. Ve většině případů tyto signály vznikají jako data od senzorů z reálného světa: seismické vibrace, zvukové vlny, vizuální obrázky atd. DSP je matematika, algoritmy a techniky k úpravě těchto signálů poté, co jsou převedeny do digitální (číslicové) podoby. Toto zahrnuje široké spektrum cílů jako: zlepšení obrazu, rozpoznávání a generování řeči, komprese dat pro ukládání a přenos atd. Předpokládejme, že k počítači připojíme AD (analog/digital) převodník a použijeme ho k získání nějakých dat z reálného světa. DSP nám odpoví na otázku: Co dál?

Kořeny DSP sahají do šedesátých a sedmdesátých let, kdy poprvé digitální (číslicové) počítače byly dostupné. V této době byly počítače drahé a DSP bylo omezeno pouze na pár kritických aplikací. Průkopnické úsilí bylo ve čtyřech hlavních oblastech: radar a sonar, kde byla v sázce národní bezpečnost (USA); hledání ropy, kde se dá vydělat velký balík peněz; průzkum vesmíru, kde data jsou nenahraditelná; a zobrazování v medicíně, kde mohou být zachráněny lidské životy. Revoluce osobních počítačů (PC) v osmdesátých a devadesátých letech způsobila rozšíření DSP do velkého množství nových aplikací. Spíše než motivováno potřebami vlád a vojáků, bylo DSP najednou ovládáno potřebami trhu. Kdokoli, kdo si myslel, že může vydělat velké peníze v prudce rostoucím segmentu, se najednou stal obchodníkem s DSP. DSP se dostalo k veřejnosti v takových výrobcích jako mobilní telefony, CD přehrávače, elektronická hlasová pošta atd.

Zpracování hudby

Dva hlavní lidské smysly jsou zrak a sluch. Obdobně - hodně z technologie DSP se dotýká zpracování obrazu a zvuku. DSP udělalo revoluční změny v poslechu obou oblastí: hudby i hovoru.

Hudba

Cesta, která vede od hudebníkova mikrofonu/nástroje do audiofilova - "měniče" (tedy reprobedny) - je pozoruhodně dlouhá. Číslicová reprezentace dat je důležitá k zabránění degradace obyčejně spojené s analogovým zpracováním a ukládáním. Toto je známé lidem, jež porovnávali kvalitu hudby nahranou na kazetě a CD. Podle klasického scénáře je hudební "kus" nahrán multikanálově, nebo vícestopě. V některých případech toto dokonce zahrnuje nahrávání jednotlivých nástrojů a zpěvů odděleně. To proto, aby měl zvukař větší volnost ve vytváření výsledného produktu. Tento komplexní proces kombinování jednotlivých stop do finálního produktu se jmenuje mixdown. DSP dokáže zastat několik důležitých funkcí během mixdownu včetně: filtrování, odečítání a přičítaní signálu (stop), editování signálu (stop) atd.

Jednou z nejzajímavějších DSP aplikací v přípravě hudby jsou umělé reflexe (artificial reverb). Pokud jsou jednotlivé stopy jednoduše přidány k sobě, výsledek zní slabě a zředěně, skoro jako by hudebníci hráli venku - na volném prostranství. To je způsobeno tím, že posluchači jsou velmi ovlivněni ozvěnou (echo) nebo odrazy (reverberation), složkami hudby, které jsou obvykle ve studiu potlačeny. DSP umožňuje dodatečně přidat umělé ozvěny a odrazy při míchání, a tím docílit iluze různých poslechových prostor. Ozvěna s několika stovkami milisekund bude posluchači dávat dojem, že je v katedrále. Pokud se přidají ozvěny se zpožděním 10-20 milisekund, bude mít posluchač dojem daleko skromnějších prostor.

Vzorkování signálu

Při vzorkování analogových signálů je klíčovou otázkou stanovení minimálního počtu vzorků pro získání úplné informace o vzorkovaném signálu. Z měřeného signálu se odebírají v pravidelných intervalech délky Ts (s - sampling) vzorky. Tyto vzorky se následně převedou na čísla a dále zpracují. Původní analogový signál z nich můžeme získat, byl-li při vzorkování splněn tzv. vzorkovací teorém. Je-li vzorkován signál s největší frekvencí m v pravidelných intervalech Ts=1/ s, pak můžeme původní signál zrekonstruovat, je-li splněna podmínka s > 2 . m (tj. vzorkovací frekvence musí být minimálně dvojnásobná než maximální frekvence daného signálu). Není-li toto splněno, dochází k tzv. aliasingu.

Vnímání zvuku

Vjem souvislého zvuku, jako např. noty z hudebního nástroje, je často rozdělen na tři části: hlasitost, výšku, barvu.

Hlasitost je míra intenzity zvukové vlny

Rozdíl mezi nejhlasitějším a nejslabším zvukem, který dokáže lidské ucho rozlišit, je okolo 120 dB, rozdíl jednoho milionu v amplitudě. Posluchači dokáží poznat rozdíl v hlasitosti, pokud je signál změněn o zhruba 1 dB (12 % změna v amplitudě). Jinak řečeno, je pouze 120 úrovní hlasitosti, jež mohou být vnímány od nejslabšího šepotu po nejhlasitější burácení.

Citlivost ucha je neuvěřitelná - pokud posloucháte velmi slabé zvuky, ušní bubínek vibruje méně, než je velikost jedné molekuly!

Vnímání hlasitosti je přibližně vztaženo k třetí odmocnině intenzity zvuku. Například: pokud zvýšíte intenzitu zvukové vlny desetkrát, posluchačům se bude zdát, že jste zvýšil hlasitost dvakrát. Toto je problém při eliminaci nežádoucích zvuků, například "ohulené" stereo v místnosti vedle. Předpokládejme, že pečlivě pokryjete 99 % zdi perfektním zvukotěsným materiálem, 1 % kvůli dveřím, rohům atd. Přestože je intezita zvuku utlumena na 1 % své původní hodnoty, budete mít dojem, že hlasitost je snížena na nějakých 20 %.

Rozsah vnnímání lidského sluchu se uvažuje od 20 Hz do 20 kHz, ale je daleko citlivější na zvuky mezi 1 kHz and 4 kHz. Například: posluchači mohou zjistit zvuk tak malý jako 0 dB SPL - hladina akustického výkonu při 3 kHz, ale potřebují 40 dB SPL při 100 Hz (rozdíl 100 v amplitudě). Posluchači dokáží říci, že dva tóny se liší, pokud jejich frekvence se liší o víc jak 0,3 % při 3 kHz. Toto se zvyšuje až na 3 % při 100 Hz. Pro srovnání, sousední klávesy u piána se liší přibližně o 6 % ve frekvenci.

Výška

Výška je frekvence základní (první harmonická) ve zvuku, tj. frekvence, s níž se zvuková vlna opakuje.

Zatímco v hlasitosti a výšce je přesný efekt jednoznačně odvoditelný od snadno kvantizovatelných fyzikálních veličin, barva (témbr) je komplikovanější, protože je určena harmonickým obsahem signálu.

Rozdíl mezi těmito dvěma vlnovými průběhy je, že vlnový průběh (b) má vyšší frekvenci před sečtením invertovanou.

Neboli, třetí harmonická (3 kHz) má fázový posun o 180 stupňů v porovnání s první harmonickou (1 kHz).

Přestože je veliký rozdíl mezi těmito vlnami v časové oblasti, signály znějí stejně. To je způsobeno tím, že poslech je založen na amplitudách jednotlivých frekvencí, ale není citlivý na jejích fázích. Tvar vlny v časové oblasti má jen nepřímý vztah ke slyšení, který se obvykle v audio systémech neuvažuje.

Nicméně nemůžeme tvrdit, že lidské ucho je úplně necitlivé na fázi. To proto, že změna fáze může přeuspořádat časovou sekvenci zvukového signálu. Jako příklad může sloužit "Chirp system", měnící impuls do signálu, jenž je daleko delší. Přestože se liší pouze fází, ucho dokáže mezi těmito signály rozlišit, protože je rozdíl v trvání. Ve většině případů je to výjimka, ne něco, co se stává v normálním poslechovém prostředí.

Pokud je nota zahrána na jiném nástroji, tvar vlny bude vypadat jinak; ačkoli ucho stále uslyší frekvenci o 220 Hz plus vyšší harmonické.

Protože tyto nástroje produkují stejnou základní frekvenci pro tuto notu, znějí stejně a říkáme, že mají stejnou výšku. Protože se liší relativními amplitudami jednotlivých harmonických, neznějí identicky a říkáme, že mají různou barvu.

Často se říká, že barva zvuku je určena tvarem vlny. Toto je pravda, ale trochu zavádějící. Vnímání barvy zvuku vychází z principu, jakým ucho detekuje harmonické. Zatímco obsah harmonických je určen tvarem vlny, neschopnost ucha vnímat fáze dělá tento vztah jednostranným. To znamená: určitý tvar vlny bude mít pouze jednu barvu zvuku, ale jedna určitá barva zvuku bude mít nekonečně mnoho možných tvarů vlny.

Ucho je navyklé poslouchat základní plus harmonické. Pokud je posluchačům podána kombinace 1 kHz a 3 kHz sinusových vln, bude jim zvuk připadat příjemný a přirozený. Pokud jsou použité 1 kHz a 3,1 kHz sinusové vlny, výsledný zvuk bude nepříjemný.

Kvalita zvuku vs datový tok

Hi-Fi hudební systémy vzorkují celkem rychle (44,1 kHz) a s dostatečnou přesností (16 bit), takže umožňují zachytit skoro každý zvuk? jaký je ucho schopné slyšet. Toto je vykoupeno velkým datovým tokem, 44,1 kHz . 16 bits = 706 kb/s.

Zatímco hudba vyžaduje šířku pásma 20 kHz, přirozeně znějící hovor vyžaduje pouze něco kolem 3,2 kHz. Přestože rozsah frekvencí je zredukován na pouze 16 % (3,2 kHz z 20 kHz), signál stále obsahuje 80 % původní zvukové informace (8 z 10 oktáv). Telecomunikační systémy obvykle pracují s vzorkovací frekvencí okolo 8 kHz, což umožňuje přirozeně znějící hovor, ale velmi redukuje kvalitu hudby.

Hi-fi audio

Audiofilové vyžadují co nejvyšší kvalitu zvuku a všechny ostatní faktory jsou podružné. Raději než vyrovnat limity sluchu, jsou tyto systémy navrženy, aby je překonaly. Je to jediná cesta, jak zajistit, že reprodukováná hudba je původní. Digitální systémy byly představeny světu kompaktními disky. Toto způsobilo revoluci v hudbě - kvalita zvuku CD systému zdaleka překonává starší systémy jako desky nebo kazety. DSP bylo na čele této technologie.

Digital signal processor (číslicový signální procesor)

Číslicový signální procesor Processor (DSP) je specializovaný mikroprocesor navržený speciálně na (real-time) zpracovávání číslicových (digitálních) signálů. DSP sice také umožňují -všeobecné počítání (general-purpose computation), nicméně nejsou pro to navrženy.

Spíše než pro všeobecné počítání mají DSP obvykle instrukční sadu optimalizovanou pro následující operace:

- Multiply-accumulate (MAC) operace (Výhodné pro všechny druhy maticových operací).

- Hluboké zřetězení instrukcí (Deep pipelining).

- DMA zpracování (Direct memory access - přímý přístup do paměti)

Současné obecně zaměřené procesory jsou ovlivněny a převzaly nějaké myšlenky z DSP, jako např. rozšíření MMX na Intel IA-32 architektuře.

Real-time

Operace ve větším dynamickém systému se nazývá realtimeová, pokud čas potřebný pro reakci a operaci dané úlohy je kratší, než maxilmální možné zpoždění, které je dovoleno z pohledu okolností vně operace. Realtimeová operace nemusí nutně být rychlá, pomalé systémy mohou umožňovat pomalé real-time operace. Toto se vztahuje na všechny typy dynamicky se měnící systémy. Opak real-time operací je dávkové zpracování.

Typickým příkladem by mohl být počítačem řízený brzdný systém v autě. Pokud řidič (systém) dokáže zastavit auto dříve, než auto narazí do zdi, operace byla real-time; pokud auto do zdi narazí, tak nebyla. Hodně strojů vyžaduje real-time ovládání, aby se vyhnuly "nestabilitě", která by mohla vést k nechtěnému poškození nebo zničení systému, objektů, dále ke zranění či zabití lidí.

Von Neumannova architektura

Von Neumannova architektura je model pro výpočetní stroje, který používá jednotný paměťový prostor pro uložení i souboru instrukcí, jak provést výpočet, i dat, potřebných nebo vytvořených tímto výpočtem.

John von Neumann pomohl uvést tento model jako příklad univerzálního výpočetního stroje. Tím, že se stroj chová stejně k instrukcím i datům, stroj může jednoduše měnit instrukce. Jinými slovy: stroj je reprogramovatelný.

Protože stroj nerozlišuje mezi instrukcemi a daty, je možné, aby se program sám replikoval nebo modifikoval. Tyto vlastnosti jsou zneužívány počítačovými viry, když přidávají své kopie do existujícího programového kódu.

Harvardská architektura

Pojem Harvardská architektura původně znamenal počítačové architektury, které používaly fyzicky oddělené zařízení pro instrukce a data (narozdíl od von Neumannovy architektury). Všechny počítače se primárně sestávají ze dvou částí: CPU (centrální procesorová jednotka, zpracovávající data) a paměti (data uchovávající). Paměť k tomu přidává dva aspekty: data samotná a místo, kde se nacházejí - známé jako adresy. Oboje je pro CPU velmi důležité, protože mnoho obvyklých instrukcí se dá zjednodušeně popsat jako "vezmi data na této adrese a přičti je k datům na tamté adrese" (bez znalosti, co vlastně jednotlivá data znamenají).

V posledních letech rychlost CPU vzrostla mnohonásobně v porovnání s rychlostí paměti, do níž CPU přistupuje, takže se daleko více hledí na množství přístupů do paměti. Například, pokud každá instrukce spuštěná v CPU vyžaduje přístup do paměti, počítač nezíská nic na rychlosti, pokud se zvýší rychlost CPU.

Paměť může být udělána daleko rychlejší, ale jen při zvýšení výrobních nákladů. Řešení je poskytnout malé množství velmi rychlé paměti, známé jako "cache". Vyladění cache je velmi důležitý aspekt návrhu počítačů.

Harvardská architektura se vztahuje k jednomu řešení tohoto problému. Instrukce a data jsou uloženy v oddělených cacheích ke zvýšení výkonu. Ačkoli to má nevýhodu v půlení množství cache dostupného pro každé z těchto (instrukce, data), takže nejlépe pracuje, pouze pokud CPU čte instrukce a data přibližně stejně často. Toho se často využívá ve specializovaných DSP nebo DSP obvykle používaných při zpracovávání audia a videa.

Zpracování zvuku na osobních počítačích

Poté, co jsme si přiblížili, jakým způsobem fungují DSP procesory, můžeme se z vod šedé teorie podívat do praxe. Následující řádky by vám měly pomoci pochopit, jakým způsobem zpracovávají počítače audio. Samozřejmě, aby to nebylo příliš jednoduché, je cest zpracování hned několik. Liší se podle operačního systému a podle typu aplikací, které je využívají.

Operační systém Windows používá takzvaný Waveform Audio systém. Standardním formátem zvukových dat tohoto systému je 8bitový neznaménkový nebo 16bitový znaménkový formát PCM (Pulse Code Modulation) s prokládaným ukládáním vzorků. To znamená, že nejprve je uložen první vzorek prvního kanálu, následuje první vzorek druhého kanálu, až první vzorek n-tého kanálu. Potom je uložen druhý vzorek prvního kanálu, druhý vzorek druhého kanálu, atd.

Dále existují systémy založené na grafu filtrů. Tyto systémy jsou moderní verzí multimediálních systémů pro osobní počítače. Nejznámějšími zástupci jsou DirectSound (součást DirectX) a JMF2 (Java Media Framework).

Java Media Framework

Vyvinuto firmami Sun Microsystems, IBM, Silicon Graphics a Intel.

JMF je kompletní systém pro přehrávání, zpracovávání a ukládání multimediálních dat. Princip JMF spočívá v použití samostatných procesů pro generování, zpracovávání a prezentování multimediálních i jiných typů dat. Umožňuje libovolně kombinovat datové toky mezi těmito procesy. Na tyto cesty/spoje mezi procesy (uzly) lze nahlížet jako na graf - odtud název.

Protože je tento systém velmi univerzální, je jeho použití pro profesionální zpracovávání audia v reálném čase velmi problematické, zejména kvůli velmi vysokému nároku na výpočetní výkon a velkému zpoždění - data nejsou mezi procesy přenášena přímo, ale přes subsytém. Takovým subsystémem může být třeba VST.

VST

Virtual Studio Technology (VST) byl vyvinut firmou Steinberg a poprvé představen v roce 1996. VST vytváří kompletní profesionální studiové prostředí na PC nebo Macu.

VST umožňuje propojovat virtuální efektové procesory a nástroje do vašeho digitálního audio prostředí. Toto mohou být softwarové "předělávky" hardwarových efektů nebo nástrojů nebo nově vymyšlené efektové části. Vše je jednoduše zabudováno do hostitelské aplikace.

Protože tato propojení jsou virtuální, není potřeba žádné kabeláže. VST moduly mají kvalitu zvuku srovnatelnou s nejlepšími hardwarovými jednotkami, ale jsou daleko flexibilnější. Všechny funkce VST efektového procesoru nebo nástroje je možné ovládat přímo a automatizovat buď myší, nebo pomocí externího hardwarového kontroléru (jako například Houston od firmy Steinberg). VST také umožňuje integrovat externí vybavení, takže si můžete "ušít" systém přesně podle vašich potřeb.

Oproti jiným systémům plug-in modulů založených na grafu filtrů, jako JMF nebo DirectX, není tento tak univerzální, což má velký vliv na efektivnost zpracování a na zátěž procesoru. Omezuje se pouze na zpracování zvukových signálů, ale obsahuje všechny potřebné vlastnosti kladené na takový systém.

Systém VST neumí sám o sobě zachytávat nebo přehrávat zvukové signály. Při takovýchto požadavcích je nutno jej zkombinovat s jiným systémem, nejčastěji ASIO, také od firmy Steinberg.

Audio Streaming Inputs/Outputs (ASIO) architektura tvoří páteř pro VST aplikace. ASIO podporuje různé bitové hloubky a vzorkovací frekvence, vícekanálové operace a synchronizaci. Výsledkem je velmi malé zpoždění, vysoký výkon a flexibilita.

Celý systém je kontrolovatelný a nabízí kompletní a okamžitý přístup ke všem schopnostem zvukového sytému.

VST aplikace sice DSP vůbec nevyžadují, ale mohou je využít například v podobě akceleračních karet, které využívá pro zvýšení výkonu.

Akcelerační karty

Akcelerační karty pro pluginy jsou komponenty osazené výkonnými DSP čipy. Jejich funkce je omezená jen na výpočet operací efektů, takže se hodí jen pro profesionální užití. Je to jako byste měli stavební firmu, která disponuje kupříkladu bagrem. Svou práci (výkop) udělá bagr (akcelerační karta) ve zlomku vteřiny perfektně, ale k ničemu dalšímu se už nehodí. Jako firma si tedy budete pořizovat bagr pouze tehdy, když hodláte dělat výkopy často, jinak vám bude rezivět v garáži.

Nejznámějším akceleračním systémem je PowerCore firmy TC Works. Je možné ho připojit buď přes PCI, nebo Firewire. Systém dynamicky rozděluje zátěž na jednotlivé DSP procesory, podle potřeby. Tento systém, jak jsem naznačil, nemůže pracovat jako samostatný, ale pouze v kombinaci s jiným systémem, např. ASIO.

Na podobném principu pracuje i UAD-1 firmy Universal Audio (Mackie), ta své pole působnosti navíc (kromě PC a Maců) rozšířila na HD rekordéry Roland, pro které vyvíjí zásuvné karty.

Vedle akceleračních karet, které dopomáhají tzv. nativním systémům, jsou na trhu i kompletní studiová řešení, která nabízejí ucelený audio systém na bázi DSP. Tento přístup částečně přežívá z minulosti, kdy výpočetní síla počítačů nebyla dostatečná na to, aby utáhla vícestopou audio aplikaci. Někteří současní vývojáři nativních aplikací (Steinberg, Magix) sice tvrdí, že se v dnešní době bez DSP lehce obejdete, nicméně mezi profesionály jsou řešení s DSP stále velice populární a nedají na ně dopustit.

Digidesign Pro Tools

Systém Pro Tools americké firmy Digidesign (součást korporace AVID), je dlouhá léta standardem ve zpracování zvuku. Jádro současného systému Pro Tools|HD tvoří PCI karta se 64bitovým rozhraním s DSP čipy. K němu se potom přidávají další zařízení, například akcelerační karta pro pluginy HD Accel, další audio rozhraní, synchronizační zařízení, MIDI interface...

Výpočetní síla DSP se v případě Pro Tools dá jednoduše rozšiřovat pomocí dalších karet (toto řešení je ovšem velice nákladné - Pro Tools|HD stojí v základu přes čtvrt milionu korun).

Počítač, na němž systém běží, se vůbec nestará o žádné složité výpočty, slouží pouze jako úložiště audio záznamu a jako ovladač pro audio aplikaci, která systém využívá (standardně to je software Pro Tools od Digidesignu nebo třeba Emagic Logic).

Creamware

Jiný úhel pohledu nabízí německá firma Creamware. Její Systém je řešen PCI kartami (Pulsar, Luna II...), jež jsou založeny na SHARC DSP od firmy Analog Devices. Tyto karty jsou vybaveny vlastním operačním systémem Scope, který běží pod Windows nebo MacOS. Scope vlastně funguje jako spojovník hardwaru a prakticky libovolné audio aplikace, ty jeho pomocí navíc můžete propojovat mezi sebou. Karty Creamwaru jsou ULLI (tedy Ultra Low Latency Interface) se zpožděním do 1 ms. Stejně jako Pro Tools hardware, můžete i DSP karty Creamwaru mezi sebou libovolně propojovat a znásobovat tak výpočetní výkon.

To vše dělá z Creamwaru vcelku zajímavé a cenově dostupné řešení.

Závěr

Co se týče budoucnosti DSP, ta je velmi růžová. Možná se setřou nějaké rozdíly mezi současnými procesory pro osobní počítače a DSP, např. nějaké vlastnosti, které jsou dostupné pouze s DSP se dostanou i do obyčejných CPU, jako se např. stalo s multimediálními rozšířeními pro Pentia (MMX, 3Dnow, atd.). Ostatně v současné době se setkáváme s velikým množstvím elektroniky, které je na DSP závislé a aplikací založených na číslicovém zpracování, kde je použití DSP nutností, narůstá závratnou rychlostí - digitální televizní vysílání, digitální rozhlas, HDTV atd. Toto jsou aplikace, které se začínají dostávat mezi "koncové uživatele" a tím drastickým způsobem ovlivňují rychlost vývoje a cenu DSP čipů. Stačí si vzít jako příklad rozmach mobilních telefonů. Před deseti lety to byl neslýchaně drahý luxus a dnes má mobilní telefon téměř každý.

Jakub Angelis

Jedním z vývojářů DSP produktů pro profesionální užití je i německá firma Creamware, která je na trhu už od roku 1992. O problematice jsme si popovídali s jejím zakladatelem a hlavním vývojářem v jedné osobě - Frankem Hundem.

Kde vidíte pro a proti v užívání DSP?

Otázka navozuje dojem, že vždy existuje alternativa k DSP. Ale ona neexistuje "jedna" alternativa. Existuje hodně aplikací, kde jednoduše není rozumná alternativa k DSP, možná až na vrácení se zpět k analogovým zařízením. Jedním příkladem by mohla být kytara (např. amp modelling) efektový pedál. Jiným příkladem by mohla být mixážní sekce založená na Pro Tools, která by nemohla běžet na "obyčejných" počítačích, kvůli zpoždění, alespoň ne v reálném provozu. V každé aplikaci s DSP jsou různá pro a proti v používání DSP čipů v porovnání s jakýmikoli jinými alternativami, pokud existují.

Například, jak bys odpověděl na otázku: Jaká jsou pro a proti v použití letadla?

Tvoje odpověď by hodně závisela na tom, kam chceš cestovat, kolik jsi ochotný zaplatit, kolik máš na cestu času atd. - ve zkratce, za jakým účelem. Můžeš odpovědět "žádná pro a hodně proti" pokud se rozhodneš cestovat ráno do práce, nebo školy. Můžeš odpovědět "samá pro a žádné proti" - neexistuje alternativa, pokud budeš cestovat na Nový Zéland.

Myslíte si, že současné procesory pro PC (CPU) nedokáží nahradit DSP?

Určitě, v nějakých případech dokáží současné procesory nahradit DSP, technicky. Důkaz je zřejmý, většina lidí používá audio software na počítačích pouze s CPU.

Ale je hodně aplikací, kde DSP nemůže být nahrazeno, nebo kde tato náhrada nedává smysl. Představte si živý koncert bez DSP, uskutečněný jen pomocí CPU. Nejen, že by to nebylo možné, ale ani žádoucí. Myslíte si, že kytarista zahodí svůj multiefekt jen proto, že může použít na scéně laptop?

95 % by to určitě neudělalo, už jen proto, že řešení založená na laptopu by byla daleko komplikovanější, daleko dražší a i méně spolehlivá.

Nemyslím si, že hodně "muzikantů" by se staralo o tuto otázku. Toto je čistě technická záležitost. Pro většinu muzikantů je technologie španělská vesnice - chtějí nástroje, které znějí super. A nechtějí s nimi mít žádné problémy.

Výrobci se samozřejmě zaměřují na řešení integrovaná do počítačů. Ale potom nikdo nebude žádat uživatele počítačů, aby nepoužili CPU. Hodně vývojářů přidává DSP do svých počítačů, protože chtějí "více". Není to "buď a nebo", je to používání různých technologií v jednom čase, protože často nejlepší řešení spočívá v kombinaci obou. Opět, Pro Tools je dobrý příklad.

Jaké DSP používáte ve svých produktech a proč?

Používáme SHARC DSP od firmy Analog Devices, protože se zaměřujeme na řešení, na která CPU nestačí. Pokud si přidáte jeden z našich produktů založených na DSP do svého počítače, otevřou se před vámi úplně nové obzory co do možností a nového zvuku. To je náš byznys. Není naší věcí nahrazovat CPU, jak by nějací lidé mohli navrhovat.

Jaký nárůst výkonu můžu očekávat pokud použiji DSP?

Myslíš, když přidáš DSP systém do počítače?

Když se podíváme na naše produkty, tak výkonový skok při přidání 6čipové DSP karty by se dal vyjádřit jako "mírný", zatímco při přidání 15čipové karty by se dal dal nazvat "masivní"

Důležité je, že vždy je to víc výkonu než předtím. A ještě důležitější jsou jedinečné funkce, které DSP nabízí a nejsou vztažené k výkonu. Například funkčnost bez zpoždění je velice důležitá vlastnost ve velkém množství DSP aplikací.

Jste přesvědčeni o nutnosti použití DSP v Digital Audio Workstation?

Otázka zní "pro koho"?

V zásadě nepotřebujete žádné DSP, abyste provozovali velmi "nabušenou" pracovní audio stanici. Můžeš být ten člověk, co bude navždy spokojený s takovou konfigurací. Potom není vůbec žádný důvod uvažovat o upgradu na systém s DSP. Toto je pravda pro většinu současného trhu.

Potom existují lidé se specifickými potřebami (jako například s potřebami přidání externího boxu zaručujícího provoz bez zpoždění). Tito lidé potřebují DSP řešení jako Pro Tools nebo Scope prostě proto, že dnes není dostupná žádná alternativa bez DSP.

Nemohli jsme nevyužít faktu, že i u nás máme odborníky na problematiku DSP. Lubor Přikryl (LP) a Jiří Schimmel (JS) vyvíjejí ve firmě DSound efekty jak pro "nativní" aplikace, tak pro DSP karty. A tak jsme jim položili pár otázek.

V čem vidíte výhody a nevýhody v užívání DSP?

(JS): Hlavní výhodou DSP systému jako TC Powercore je to, že přebírá část výpočtů a odlehčuje CPU počítače (stejně např. akcelerátory grafických karet). U DSP systémů s přímou vazbou na převodníky (Pro Tools nebo Scope Fusion) je další výhodou možnost dosažení velmi nízké latence a přesné synchronizace.

(LP): Já bych ještě doplnil, že existuje jakýsi kompromis mezi nativním a hardwarovým zpracováním audia: to je využití vektorových jednotek moderních procesorů. Pentium v PC a PowerPC v Macích mají speciální jednotky, které umožňují použití podobných postupů jako signálový procesor. Do původních PowerPC, navržených původně v IBM, vektorové zpracování přidala Motorola, tedy firma vyrábějící nejznámější a nejrozšířenější DSP. Snad proto má AltiVec, tedy vektorová jednotka v G4 a G5 Macích, mnoho předností před Intelovským řešením v Pentiu a umožňuje několikanásobně větší nárůst výkonu. Díky slabšímu výkonu G4 bylo také nutné tuto technologii častěji využít.

Na rozdíl od hardwarových řešení si zde nemůže uživatel vybrat, záleží to jen na vývojářích efektů, jestli použijí vektorové technologie, na krabici nebo splash screenu se to pozná podle označení SSE, SSE2, AltiVec nebo Velocity Engine.

Myslíte, že současné CPU mohou nahradit výkon DSP?

(JS): Ano i ne. V počítačových aplikacích mají dnešní procesory se superskalární a RISC architekturou zejména díky jejich vysokému taktovacímu kmitočtu dostatečný výkon pro zpracování zvukových signálů v reálném čase i při špatném poměru počtu vykonaných operací za sekundu k taktovacímu kmitočtu. V hardwarových aplikacích jsou stále výhodnější signálové procesory díky jejich nízké ceně, vysoké efektivitě, malé spotřebě energie a tím i nízkým tepelným ztrátám, díky nimž nejsou potřeba robustní chladiče jako u procesorů do osobních počítačů.

(LP): To se pro uživatele projeví překvapivým množstvím současně pracujících efektů, i když se na první pohled zdá, že například taktovací kmiočty DSP chipů nejsou nijak závratné. DSP totiž může být zatíženo na 100 % a nedojde k přetížení, zatímco hlavní počítačový procesor musí mít stále velkou rezervu, aby mohl fungovat při naprosto nevyrovnaném zatížení, způsobeném zpracováním více úloh současně.

Jsou DSP pro audio jiné než standardní DSP?

(JS): Standardní signálové procesory určené do průmyslových aplikací používají malou šířku datového slova, většinou 16 bitů. Signálové procesory určené pro zpracování zvukových signálů používají minimálně 24bitová datová slova a mají speciální architekturu aritmeticko-logické jednotky umožňující pracovat s alespoň dvojnásobnou přesností. Také se liší strukturou paměti (samostatné paměti dat a paměť programu), architekturou jednotky generování adres a speciálními instrukčními sadami umožňujícími efektivní a rychlé provádění úloh typických pro zpracování hudebních signálů, např. konvoluce.

Myslíte, že pro DAW (Digital Audio Workstation) jsou DSP nezbytné?

(JS): Podle mého názoru se profesionální systémy v současné době bez použití signálových procesorů neobejdou. Výkon totiž neznamená všechno. Velkou nevýhodou počítačových systémů je asynchronní činnost vyplývající z principu operačních systémů s preemptivním multitaskingem a samozřejmě nespolehlivost některých operačních systémů. V synchronním provozu, jaký používají systémy signálových procesorů, nehrozí drop-outy, jittering a lze dosáhnout velmi nízkých latencí.

(LP): Čtenáři si jistě se slzou v oku vzpomenou na pokusy začlenit signálový procesor do počítače. ¨Například Atari Falcon 030 nebo počítače NeXT měly tentýž DSP, jako má dnes PowerCore. Vzhledem k tomu, že hlavní procesor těchto počítačů, tedy Motorola 68030, byl nesrovnatelně pomalejší než dnešní Pentium nebo PowerPC (a to i kdyby běžel na stejné taktovací frekvenci), byla to tehdy vynikající myšlenka. Dnes se asi nejčastěji muzikant setká s DSP kartami PowerCore od TC Electronic, dále od Universal Audio a od Digidesignu. Digidesign tak udržuje dva vlastní formáty, TDM s hardwarovým a RTAS s nativním zpracováním signálu. Přístup TC je promyšlenější, používá mírně upravený standard VST.

Je rozdil, při vývoji pluginu, jestli bude spouštěn na počítači s nebo bez DSP procesoru?

(LP): Grafika, ovládání, otevírání plug-inu v aplikaci, to všechno je stejné. Naprosto odlišná je ale část, která zpracovává vlastní signál. Pro systémy s hardwarovým DSP musíme umět napsat kód v assembleru pro daný signálový procesor, ten je pak pomocí speciálních funkcí přenesený do paměti DSP čipu, což se stane až při otevření efektu. O přenos audio dat mezi počítačem a například PowerCore se stará zvláštní procesor PowerPC, běží na 264 MHz (pro zajímavost, je to téměř stejný procesor, jako měly úplně první iMacy).

Jak si vybíráte, jestli plug-in uděláte jako nativní nebo využívající hardwarový DSP?

(LP): To záleží jednak na náročnosti algoritmu a také na stavu trhu. DSP čipy jsou vhodnější pro náročné efekty a softwarové nástroje. Pokud bychom převedli pro DSP například naše kytarové krabičky, zabralo by předávání dat mezi DSP a počítačem víc výkonu než samotné procesování. Ale pro složité reverby nebo simulace je to úplně jiná situace.

Na trhu je mnoho pluginů, které ještě nikdo nenapsal pro hardwarové DSP karty - přece jen je to o něco složitější. Zde je tedy často jednodušší se prosadit, jestliže jsme tyto technologie už jednou zvládli.

Ale pro hardwarové DSP je stále k dispozici nesrovnatelně méně pluginů než nativních...

(LP): Ano, to je sice pravda, ale záleží, co chcete dělat. Pokud někdo chce donekonečna experimentovat, asi ho množství efektů a nástrojů pro DSP karty neuspokojí. Rozumné využití dnešních technologií podle mě vypadá jinak. Pokud máte složitější projekt, potřebujete do každé stopy určité základní efekty, jako je úprava dynamiky, ekvalizér, individuální reverb a podobně. Pro všechny tyto efekty jsou k dispozici pluginy běžící na hardwaru, takže hlavní část zpracování se odehrává na DSP. A jestli kromě toho potřebujete další, pouze nativní pluginy, není jich už tolik, aby přetížily CPU.

Psáno pro časopis Muzikus

4/2004

Tagy

DSP