Antares Autotune 3.0 - DirectX

Richard Markuzy, 9. 8. 2002

Antares Autotune 3.0 - DirectX plug-in určený ke

Nikdo nepochybuje o tom, že Beatles dobře zpívali. Jen bubeník Ringo na tom byl o malinko hůř, což mu ostatní spoluhráči občas dávali najevo. Nakonec z toho vznikl song, jehož úvodní sloka se dá přeložit jako:"Když budu zpívat falešně, nebudete už se mnou hrát?" Známe to všichni - muzikanti si stěžují na zpěváky, že zpívají falešně, a zpěváci zase na muzikanty, že to mají moc nahlas a tím pádem oni nic neslyší.

Také jsme před pár lety usilovně hledali zpěváka. Jeden z nich zpíval tak děsně, že to sám poznal. Docela nás odrovnal tím, když nakonec prohlásil, že pokud si dá čaj, bude to pak naprosto super. Od té doby piju čaj taky, ale výsledek se (zatím) nedostavil. Až do minulého týdne... To jsem si totiž nainstaloval Autotune.

Autotune je když...

Mnou testovaná verze Autotune 3.0 je software určený pro PC, sloužící ke korekci intonačních nepřesností a k modifikaci výšky jednotlivých tónů. Detekuje výšku vstupního mono signálu a koriguje ji buď automaticky v reálném čase, nebo v grafickém režimu, kde můžeme přednastavit korekci třeba jen jednotlivých úseků a zbytek nechat původní. Jedná se o plug-in, můžeme jej spustit v jakémkoliv hudebním programu podporujícím DirectX v 6.1. a vyšší, jako je například Sound Forge, Cakewalk apod. V mém případě to byla Cubase VST.

Rozpoznávání výšky tónu

Nejdůležitější úlohou je správná detekce výšky vstupního signálu - pokud ji program špatně určí, bude samozřejmě výsledek jinde, než bychom chtěli. Na začátku jsem psal, že Autotune pracuje s mono signálem, ale přesněji se jedná o mono zvuk sólového jednohlasého nástroje nebo zpěvu. Proč to tak je? K vysvětlení bude potřeba trochu teorie:

Každý zvuk vzniká chvěním, ať už hlasivek, strun nebo elektronicky. Právě rychlost tohoto chvění určuje výšku tónu, kterou my vnímáme. Graficky to lze zobrazit jako křivku složenou z bodů představujících jednotlivé hodnoty naměřené při samplování. Nejjednodušším zvukem je sinusoida, tu umí vygenerovat každý syntezátor nebo zvukový chip počítače, prostě takový bezbarvý tón. Vypadá asi takhle:

Pokud již jde o zvuk nějakého jednohlasého nástroje nebo hlasu, který má svoje charakteristické zabarvení, je průběh složitější, protože vzniká skládáním více takovýchto jednoduchých křivek. Právě simulace tohoto skládání je základem zvukové syntézy. S původní sinusoidou má však i tato křivka něco společného, a tím je periodické opakování určité části křivky (již zmíněné chvění). Právě z rychlosti tohoto opakování Autotune určuje výšku daného tónu.

Když však znějí třeba jen dva nástroje unisono, dochází již k jejich nepravidelnému drobnému rozlaďování, což má za následek ztrátu opakování křivky. Lidské ucho je v tomto případě stále schopno rozpoznávat výšku tónu, ale Autotune již takovýto signál nezpracuje. Vstupní signál tedy musí splňovat výše popsaná omezení.

Rychlost opakování určité části křivky se vyjadřuje v hertzech (Hz), což představuje počet kmitů za jednu sekundu. Program tedy měří rychlost opakování stejných segmentů a porovnává ji s kmitočty tónů v současnosti používaných stupnic.

Opakování je schopen rozpoznat již po několika cyklech, které ještě nestačí rozkmitat membránu reproduktoru - tedy ještě dříve, než zvuk slyšíme. A i když připočteme zhruba 10 ms nutných ke zpracování signálu, máme stále rozumnou rychlost na zprocesování v reálném čase.

Automatické dolaďování

Už na začátku jsem zmínil, že si můžeme vybrat buď automatické dolaďování v reálném čase, nebo grafický mód. V prvním případě hodně záleží na nastavení jednotlivých parametrů, takže se na ně pojďme podívat podrobněji.

Úplně v levém horním rohu okna nastavujeme samplovací frekvenci v rozmezí 44,1 - 96 kHz. Ta musí být shodná s frekvencí hostitelského programu, jinak dojde k chybnému určení výšky tónů.

Rozsah rozpoznávání je určen nastavením Input Type, kde můžeme vybírat z možností Soprán, Alt, Tenor a pěvecký bas. Posledním nastavením je Bass, kde nejnižší měřitelný kmitočet je 25 Hz. Pro srovnání - prázdná struna E na baskytaře má kmitočet zhruba 41 Hz, takže rozsah je dostatečný.

Autotune si poradí i se stereo signálem, v tom případě je však třeba vybrat buď levou nebo pravou stopu. K tomu slouží přepínač Select Pitch Reference.

Dvojice ovladačů Retune Speed a Tracking určují rychlost dolaďování a rozpoznávání výšky vstupního signálu. Když nastavíme Retune Speed na 0, dochází k okamžitému dolaďování, ale také k odstranění vibráta a dalších výrazových prostředků hlavně u vokálů. Naopak vysoké hodnoty nad 50 jsou vhodné až pro dlouhé tóny, protože software při kratších prostě nestačí zareagovat. Optimum je hodnota kolem 20 při zachování přirozenosti projevu. Hodnota Tracking 25 a vyšší znamená, že na vstupu počítáme s kvalitním signálem bez šumu a případnou změnu opakované části křivky již můžeme považovat za jiný tón. Nižší hodnoty používáme, když se jedná třeba o živou nahrávku s přeslechy, kde je třeba za stále ještě trvající tón považovat i úsek křivky s různými odchylkami od opakované části. Nejlepší ale je si přehrát daný úsek skladby a parametry upravit podle poslechu, protože pro rychlé pasáže je určitě lepší jiné nastavení než třeba pro jednotlivé hlasy doprovodných sborů.

Zprocesovaný signál můžeme ještě upravit vibrátem, kde nastavujeme tvar křivky (sin, square, sawtooth), hloubku (0 - 100 centů) a rychlost (0,1 - 10 Hz). Parametr Delay potom určuje, za jak dlouho od změny tónu a jeho doladění začne vibrato signál ovlivňovat. Přesně doladit, odstranit tím i původní vibrato a přidat ho zpět tady? Tak jednoduché to zase není. Přirozené vibrato totiž není jen cyklická změna výšky tónu, ale současně také hlasitosti a někdy i barvy. Když však tyhle věci nejsou synchronizovány, vyjde nám stejná chemie, jako při použití vibráta na dechy na levných klávesách. Další verze Autotune si s tím snad poradí, zatím však doporučuji používat sekci vibráta velmi opatrně.

Po nastavení parametrů rozpoznávání zbývá vybrat stupnici nebo vlastní skupinu tónů, ke kterým budeme dolaďovat. Celkem si můžeme vybrat z 29 přednastavených stupnic, z nichž durovou, mollovou a půltonovou asi budeme používat nejčastěji. Přiznám se, že většinu ostatních, jako třeba indonézskou, jsem ani předtím neznal. Základní tón dané stupnice potom vybereme nastavením hodnoty tlačítka Key Selection. Tím však možnosti nekončí. Uprostřed obrazovky je umístěn seznam tónů. Zde můžeme ještě kterýkoliv z nich zakázat - Remove, nebo neprocesovat - Bypass. K čemu je to dobré? Když potřebujeme doladit jen jednu notu, třeba D, a všechny ostatní jsou v pořádku, označíme je pomocí Bypass, a Autotune tak nechá beze změny. Pokud byl zpěv tak nízko, že místo D to bylo skoro C#, musíme C# zrušit tlačítkem Remove a D naopak nechat. Software tím pádem jako nejbližší notu vyhodnotí C#, ale protože je zakázána, doladí k druhé nejbližší, kterým je D.

Grafický mód

Většinou je to ale tak, že některé noty klidně i stejné výšky jsou v pořádku, ale některé ne. V tom případě je výhodnější použít grafický režim, kde můžeme přesně definovat, jak mají být jednotlivé úseky zprocesovány. Do tohoto režimu a zpět se přechází pomocí přepínače Correction Mode.

Korekce zde probíhá ve třech krocích:

1. Klikneme na tlačítko Correct Pitch a přehrajeme upravovaný úsek. Po skončení stiskneme stejné tlačítko znovu. Výsledkem je červeně vykreslená křivka znázorňující průběh naměřených výšek tónů.

2. Nyní máme dvě možnosti. Buď použijeme tlačítko Make Auto, které podle nastavení ovladačů Retune a Tracking vykreslí žlutou, opravenou křivku, nebo pomocí Make Curve vykreslíme křivku shodnou s původní. Potom už jen za pomoci myši a různých kreslících režimů opravíme vadná místa. Je možné také křivku nakreslit úplně znovu, ale pro zachování přirozenosti se mi osvědčilo raději posouvat původní části.

3. Aktivujeme tlačítko Correct Pitch a přehrajeme stejný úsek jako při načítání. Na výstupu už slyšíme úpravy podle toho, co jsme si nakreslili.

Použití MIDI

Má-li upravovaný zvuk jasně danou melodii, můžeme ji hrát na klávesách živě při přehrávání dolaďovaného materiálu, nebo pohodlněji nahrát do sekvenceru - v tomto případě Cubase - a pak spustit současně s dolaďováním. Autotune je pak řízen přes MIDI a přesně ví, kdy ke kterému tónu dolaďovat. Na stejném principu je založena známá popová skladba Believe, zpívaná Cher, kde do melodie vokálu byly uměle přidány tóny, které zpěvačka původně nezpívala. MIDI můžeme použít také k výběru tónů do stupnice. Nemusíme tak přemýšlet, jestli v melodii vokálu je D nebo není. Prostě ji přehrajeme, nezáleží na tom, jak rychle, a software si už nastaví, co je třeba.

Práce s Autotune

Autotune jsem používal s Cubase 5.0 běžící pod Windows 2000. Instalace proběhla bez problémů, v průběhu zkoušení program ani jednou nespadl ani nezamrzl.

Plug-in se používá jako insertovaný efekt, na každou stopu tak vlastně spouštíme další Autotune. Jejich celkový počet je omezen pouze výkonem počítače.

Zkoušel jsem dolaďovat nástroje i vokály. V obou případech se software chová podobně, jen se zpěvy je potřeba si dát větší práci, protože při větších korekcích se z nich rychle vytrácí přirozenost. Prostě platí pořád, že to, co nenatočíme rovnou dobře, se už pak dohání těžko. Ovládání je rychle zvládnutelné, v mnoha případech postačí rozumně nastavit parametry Auto módu a je to. K pochopení funkce programu autoři přiložili několik ukázek, které sice byly umístěny jinde a pod jiným jménem, než uváděl manuál, ale po jejich nahrání do Cubase jsem měl dojem, že už vím jak na to. Na obrázku je zvuk svým průběhem připomínající sirénu, nebo houkačku, ale s pomalejším průběhem.

Oválná část křivky je původní signál zobrazený v grafickém režimu. Schodovitá část jsou vlastně tóny, které Autotune přiřadí při nejrychlejší možné korekci (Retune Speed nastavíme na 0). Při výsledném poslechu už neslyšíme sirénu, ale stupnici hranou nahoru a zase dolů. Tak, jak zvětšujeme hodnotu Retune Speed, zaobluje se i korigovaná křivka. Při maximálním nastavení už vlastně k dolaďování nedochází a křivky jsou shodné.

Mně se osvědčila rychlost mezi 20 a 30, stejně tak i v grafickém režimu při automatickém vykreslení korekční křivky. Potom jsem umazával úseky bez nutných úprav, někde nechával automatické a někde - hlavně na konci slov - upravoval a překresloval ručně. Vibrato jsem nakonec kvůli nepřirozenému zvuku nepoužíval vůbec. V kombinaci s extrémním nastavením ostatních parametrů se ve spojení s ním dá experimentovat s výsledním zvukem, takže to pro někoho může být naopak výhodou.

Závěr

Autotune se uplatní ve všech digitálních nahrávacích studiích, ať již jako dolaďovací software nebo pro zvukové experimenty. Časově omezené plně funkční demo je k dispozici na http://www.antarestech.com, plná verze se prodává za 10 764 Kč.

Na stejných stránkách je uvedeno, že výrobce pod názvem Antares Vocal Producer nabízí pro živá vystoupení verzi do racku včetně simulací mikrofonů. Máme se tedy na co těšit.

Info:

Autotune 3.0 je DirectX plug-in určený ke korekci intonačních nepřesností a k modifikaci výšky jednotlivých tónů. Cena je 10 764 Kč.

Plus:

rychlost dolaďování

zvuk

jednoduché ovládání

dolaďování podle midi

Mínus:

vibrato

nepřesnosti v manuálu

Psáno pro časopis Muzikus

8/2002