L’8D… ai tempi del Coronavirus

È bene fare un po’ di ordine, per chi non conosce affatto il mondo dell’audio 3D o immersivo, per i neofiti del mestiere ma anche per musicisti e compositori che pensano di trovarsi di fronte all’invenzione del nuovo millennio.

L’8D… ai tempi del Coronavirus

di Davide Linzi

La particolarità di questo tempo sospeso che stiamo vivendo ha portato con sé degli episodi singolari: dalle performance stravaganti sui terrazzi, ai molti video casalinghi di musica condivisa in rete. Come i musicisti che hanno molto tempo da dedicare al loro strumento, anche noi tecnici cerchiamo di sfruttare questo tempo per poter rinfrescare, approfondire o coltivare nuove materie. Quando ci ritroveremo saremo tutti più bravi? Sicuramente speriamo che approfondiscano un po’ l’argomento tutte le persone che ci hanno scritto su Whatsapp facendoci ascoltare queste famigerate prodezze della tecnologia 8D.

È bene fare un po’ di ordine, sicuramente per chi non conosce affatto il mondo dell’audio 3D o immersivo, per i neofiti del mestiere ma anche per musicisti e compositori che pensano di trovarsi di fronte all’invenzione del nuovo millennio.
Nulla di tutto ciò. Anzi, parliamo di roba vecchia! Anche se c’è da dire che le tecnologie che abbiamo oggi a disposizione permettono di fare delle cose veramente affascinanti.

Partiamo con lo sviscerare il fattaccio: questo 8D alle orecchie di molti si presenta con dei brani di musica pop che “ruotano” attorno alla nostra testa mentre li ascoltiamo con le cuffie. Non si tratta di una ottava dimensione, bensì di una dimostrazione basica di cosa può fare un plug-in che manipola un comunissimo file stereo (o mono) tramite degli algoritmi HRTF (Head Related Transfer Function) ovvero come si comporterebbe tale sorgente (il nostro bel brano musicale) se venisse ripresa da un microfono binaurale (la classica testa Neumann) in un dato ambiente sonoro. È abbastanza ovvio che per gli addetti ai lavori che conoscono bene il mondo della registrazione binaurale, sentire un esempio del genere ha ben poco senso. La cosa si fa più interessante se si mixano le singole tracce di un brano musicale con questi plugin (sempre ovviamente nell’ottica di un ascolto in cuffia), facendo “muovere” attraverso automazioni i singoli elementi del mix con una logica musicale, oppure con un senso di ricerca di uno spazio che vada oltre alla stereofonia basica a cui siamo abituati (o forse ci stiamo più abituando al mono del nostro telefonino?). La novità è che Sennheiser ha realizzato questo plugin, Ambeo Orbit, che sfrutta l’algoritmo HRTF per divertirsi gratuitamente a fare questo tipo di operazioni. Ecco perché i meno esperti si sono lanciati in questo fantascientifico 8D che nella realtà dei fatti non vuol dire nulla! Tutto ciò esisteva già prima, ma era necessario acquistarlo. Infatti altri marchi come Wave Arts (Panorama), DearVR Pro, ecc… sono già sul mercato da diverso tempo, sono infatti dei tool che chi si occupa di audio immersivo, ad esempio per il gaming, utilizza da un po’.

Percezione di una sorgente nello spazio

Ordiniamo le idee. Sostanzialmente non sono un espertissimo della materia, ma da anni sono affascinato da come l’interazione tra sorgente e ambiente possa essere manipolata nel mondo della produzione in studio e da un po’ di tempo anche essere un oggetto nuovo di sviluppo nel mondo della musica live. 

La storia della ripresa binaurale risale agli anni ’70, ma se ricordo bene qualche interessante lezione all’università di Musicologia, si parlava di un certo Teatrofono (Théâtrophone), un sistema che nel 1881, tramite dei microfoni al carbonio installati lungo il bordo del palco dell’Opera di Parigi, permetteva di ascoltare lo spettacolo in una postazione remota tramite una cuffia attraverso un cablaggio simile a quello di una linea telefonica. In tempi meno paleolitici, Neumann ha realizzato la famosa testa, o Dummy Head, i cui microfoni risiedono dentro a due padiglioni uditivi in modo da riprodurre fedelmente ciò che l’orecchio umano percepisce se posto in un dato ambiente sonoro. Questo significa (e qua si spiega un po’ il concetto di HRTF) che una sorgente sonora arriva ai nostri due punti di ricezione (orecchio L e R) in tempi e livelli differenti in base alla propria posizione rispetto a noi ed è oltretutto influenzata dalle riflessioni dell’ambiente in cui ci ritroviamo. Senza sottovalutare il fatto che la nostra stessa testa maschera di per sé un orecchio dall’altro. L’ascolto in cuffia di una registrazione binaurale è sorprendente, perché la percezione dello spazio è assolutamente realistica e si ha la sensazione di immergersi pienamente nell’ambiente sonoro reale da dove è stata tratta la registrazione; ovviamente, se viene riprodotta in un tradizionale sistema L/R, si otterrà una perfetta stereofonia in cui i due microfoni della Dummy saranno gli estremi del nostro pan della traccia stereo registrata. 

La musica classica e contemporanea del secolo scorso ha visto un grande uso di tale tecnica di ripresa, peraltro ancor oggi utilizzata. Anche la discografia moderna si è avvalsa di tale tecnica: Pink Floyd credo per primi, oppure il bellissimo Binaural dei Pearl Jam che credo tutti conoscano. Negli anni ’90 si parlò anche di Qsound, essenzialmente un algoritmo di filtraggio che, manipolando i valori di tempo, ampiezza e risposta in frequenza, riproduceva una sorta di immagine binaurale. Non vorrei dire sciocchezze, ma uno dei plugin di Waves, ovvero l’S1 stereo enhancer, utilizza tale algoritmi. Anni ’90! Ma andiamo oltre, perché lo step successivo è legato al mondo del video VR. Da quando infatti la tecnologia video a 360 gradi è diventata economicamente alla portata di tutti, si è ben pensato di fare in modo che il concetto binaurale si spostasse in tempo reale con lo spostamento del nostro punto di vista. Da qui nasce il mondo Ambisonic B-Format: lo spazio acustico diventa una sfera uniforme 3D che può essere codificata, in soldoni, in un ascolto binaurale che si muove in tempo reale con il movimento fisico della nostra testa. Più avanti torneremo con un esempio che in molti conoscono. 

Beck Sound_Vision VR recording

Facebook sta investendo un sacco di soldi per perseguire questa tecnologia, non a caso uno dei plugin di codifica audio VR, ormai standard di Pro Tools, è appunto Facebook360, un sistema molto complesso e ancora un po’ alle prime armi, il quale gestisce sorgenti mono, stereo, multicanale per realizzare video VR a 360 gradi. Sostanzialmente si possono legare delle sorgenti audio a degli elementi video automatizzando il movimento nello spazio. Esperienza ancor più interessante, in cui il fruitore non solo è immerso in un ambiente acustico, ma lo può vedere tramite un visore VR (Oculus) e muovendosi in questo ambiente anche la provenienza delle sorgenti si muove di conseguenza, con tutte le implicazioni acustiche che abbiamo descritto prima. Un esperimento molto interessante che si può reperire in rete è quello di Sound&Vision, una performance 360° di Beck, dove 160 elementi di una super orchestra, posizionati in un ambiente circolare, vengono ripresi da una camera 360° (un cluster di sei GoPro) e una “custom Dummy head” con otto coppie di “microfoni a padiglione uditivo” ed altre quattro teste Neumann posizionate in corrispondenza dei quattro punti cardinali del palco: un mix di sorgenti binaurali per creare una quanto più dettagliata sfera sonora. Quello che prima si faceva con sistemi combinati di multimicrofonazione (poco trasportabili e ovviamente scomodi a montarsi) oggi si fa con appositi microfoni multicapsula (Sennheiser Ambeo, Rode NT-SF1, Zylia…) che possono essere pure ricodificati con appositi plugin (SoundField, Ambeo, Waves…) per un ascolto multicanale (5.1, 7.1…) o semplicemente stereo L/R. Personalmente ho fatto qualche prova e devo dire che tali microfoni diventano molto interessanti per un ambience di un live anche se in un mix stereo base. Queste soluzioni nascono per la necessità di avere anche un microfono sferico che occupi poco spazio nell’ambiente, visto che sostanzialmente, nel caso di una ripresa video VR, va posizionato sopra o sotto la telecamera 360°. Waves ha sviluppato tutta una serie di prodotti mirati al formato Ambisonic e un tracker Bluetooth da posizionare sulle nostre cuffie per un duplice utilizzo: uno per monitorare un mix ambisonic (quindi capire cosa succede nella gestione dei nostri canali mentre muoviamo fisicamente la testa) e due per ricreare in cuffia la sensazione di utilizzare una coppia di monitor: muovendo la testa mentre mixiamo in cuffia, si ricrea la sensazione che avremmo inclinando la testa di fronte ai nostri nearfield. La cosa potrebbe sembrare poco utile ma nella realtà dei fatti, per chi non ha la possibilità di essere bene isolato nel suo studio ed è costretto a lavorare per parecchie ore in cuffia, la sensazione di ascolto è molto più naturale e meno affaticante. E questo è, secondo me, un concetto chiave un po’ di tutto il mondo audio 360. Poi ci torneremo, ma riprendiamo il nostro cammino. 

Forse per tanti il mondo del video VR risulta affascinante ma un tantino privo di scopo. In parte credo sia vero, ma è altrettanto vero che si stanno aprendo delle strade nuove verso la fruizione dei nostri archivi dei ricordi: registrare un video 360° dà la possibilità di rivivere in un certo modo un evento con una prospettiva molto più soggettiva di quella che potrebbe essere la semplice visione di una fotografia. Questo forse rende ancor più reale e presente un ricordo del passato. Ad oggi, come dicevo prima, il mondo del gaming è di certo il principale bacino di impiego di tali tecnologie: i videogiochi in soggettiva sfruttano l’audio 3D per dare al giocatore l’esperienza massima di coinvolgimento. Non è trascurabile nemmeno l’ambito pubblicitario e presto credo che la presentazione di un progetto in VR diventerà la normalità (far vivere all’artista la sensazione che vive lo spettatore al suo show potrebbe essere interessante durante la progettazione di un evento).

Dove tutto ciò si sposa con il mondo nostro del live? Ricordo che molti anni fa mi chiesero di realizzare attorno ad un’area fieristica un effetto audio che ricreasse il passaggio di una macchina di Formula 1 attorno tale area. Ad oggi ve la starete ridendo, pensando alla banalità della cosa, ma con i mezzi dell’epoca fu una sfida interessante; ma la cosa più interessante fu la riflessione su come la diffusione multicanale potesse far vivere un’esperienza particolarmente coinvolgente al pubblico. Già ovviamente si parlava di impianti in quadrifonia, mentre oggi si parla di audio immersivo dove il nostro sistema non è più il classico Dolby Surround, ma uno spazio d’ascolto con molti punti di diffusione quasi a voler ricreare una sfera tridimensionale attorno all’ascoltatore. A differenza di quanto scritto prima, la ripartizione della sorgente verso i vari punti di questa sfera è ovviamente deterministica e il come realizzarla è la nuova frontiera del mix già ovviamente realtà. 

Avere molti punti di diffusione permette un posizionamento sonoro molto più preciso dal momento che una sorgente viene “descritta” da più diffusori contigui nello spazio. Se pensiamo a un palcoscenico con un’orchestra e a un sistema di diffusione frontale con più punti di diffusione, il nostro panorama stereofonico diventa molto più dettagliato di un classico L/R, quindi, all’ascolto, riusciamo a ricollocare più facilmente un elemento dell’orchestra nella sua esatta posizione. Ricordate il concetto di “naturalezza”? Credo sia la chiave di tutto: trasmettere un messaggio chiaro e che possa essere recepito in maniera naturale dal ricevente facilita inevitabilmente la comunicazione. 

d&b Soundscape

Molti brand che tutti conosciamo si avvalgono di queste tecnologie che personalmente non ho avuto ancora modo di provare, cosa che spero di fare appena possibile. L-ISA di L-Acoustic, d&b Soundscape, il prossimo Meyer Spacemap, D3pth RCF… sono i brand che integrano software di controllo, hardware e ovviamente i loro sistemi di diffusione, mentre software come Astro Spatial Audio, Flux Spat Revolution oppure TiMax SoundHub sono soluzioni software stand-alone con eventuali matrici I/O hardware. Flux Spat, ad esempio, è un interessante plug-in interfacciabile con le console Avid S6L, mentre TiMax credo sia un dei primi sistemi utilizzati nel mondo live la cui peculiarità sia quella di integrare un sistema di tracking (dove lo spostamento di un oggetto nello spazio va a modificare le variabili di livello e delay verso gli output), un sistema di playback, la gestione del timecode e controlli OSC (Open Sound Control), quindi molto interessante, ad esempio, per musical o spettacoli teatrali. Con questi sistemi si può mixare su un ipotetico impianto quanto più vicino ai 360 gradi, creando quindi un ambiente per l’ascoltatore, oppure si può descrivere il suono proveniente da un palcoscenico su un panorama stereofonico a 180 gradi molto più organico (quest’ultimo è uno degli scenari più perseguiti nell’ultimo anno nelle grandi produzioni musicali) oppure si può essere creativi e automatizzare o mixare le sorgenti del palco in un sistema di diffusione complesso che diventa un po’ un’evoluzione di quello che fu il primordiale impianto in quadrifonia. In questa direzione si sono mosse alcune produzioni come Björk o Imogene Heap. 

Digico Klang.

Un buon esempio di come si siano fuse alcune delle tecnologie sopra citate, e di come il mondo dell’audio 3D sia utilizzabile nel settore live, è il sistema Klang: si tratta di un sistema di monitoring in cui il musicista può posizionare le varie sorgenti di input (gli strumenti sul palco) non solo nel canonico panorama stereofonico dei propri in-ear ma in un ascolto binaurale circolare con un front e un back. Il tutto grazie ad un sistema di tracking (al momento grazie al giroscopio del proprio cellulare in cui è installata l’app di controllo del personal mix) si sposta in base al luogo verso il quale rivolgiamo il nostro sguardo. Risultato? Immaginiamo di essere il frontman della band e avere la chitarra di stage-right posizionata a ore 15: quando ci giriamo a stage-left per imprecare contro lo sventurato fonico di palco la nostra chitarra la sentiremmo alle nostre spalle. Credo che sia un modo molto più naturale di vivere una performance live su un palcoscenico indossando delle cuffie in-ear.

Spero non si interpreti ciò come una pubblicità gratuita per uno o l’altro brand. Ho cercato di fare, per quanto possibile, il punto di quello che è oggi il mondo dell’audio tridimensionale, dell’audio riprodotto in una cuffia con dei piccoli trucchi per renderlo avvolgente nel vero senso della parola, dell’audio riprodotto attraverso un sistema molto articolato di diffusori. 

Il divertente pretesto dell’8D, che ha fatto così chiacchierare in questo periodo, spero sia spunto di ricerca per un mondo affascinante e creativo che esiste già da un bel po’ di tempo e che credo sarà sempre più utilizzato e perfezionato. 


Clicca qui per accedere alla galleria fotografica
(5 Foto)