La captation de son multicanal

PREAMBULE

Ce travail sur les Techniques de Prises de Son Multicanal(1) liées à l’Image est issu d’une réflexion avec des preneurs de son, des monteurs son, des mixeurs (2).
Son but est de mettre l’eau à la bouche de nos collègues, mais aussi de tenter une clarification sur les méthodes et de proposer des solutions pour leur mise en œuvre. Ce document n’est pas un mémoire de fin d’études mais plutôt une tentative d’ouverture d’un certain nombre de portes, jusque là fermées.

Nous sommes partis d’une idée simple :

« Dis-moi quelle est ta post-production, je te dirai ce que tu peux expérimenter comme système de captation ».
ou formulé différemment :
« Donne moi les conditions de diffusion, de mixage et de montage ainsi que les moyens alloués et je te dirai quel type de micros tu pourrais utiliser ! »

L’idée n’est pas de faire un comparatif scientifique afin de savoir si tel micro est supérieur à tel autre ; nous n’en avons ni les moyens, ni le temps. Nous avons juste rassemblé les points de vue de nos pratiques personnelles. Le but est de maîtriser la chaîne de fabrication, car l’utilisation de nos prises de son s’inscrit (sur le plan professionnel) dans un processus.
C’est donc, un objet assez ouvert puisqu’il devrait pouvoir s’enrichir de l’apport et de l’expérience des uns et des autres.
En espérant avoir collecté un certain nombre de clefs, ouvrons les portes.

(1) Multicanal s’entend comme l’utilisation simultanée de plusieurs fois « un canal » et non pas de la somme de ceux-ci. Nous emploierons donc ce terme de façon invariable : diffusion multicanal, des micros multicanal etc…
(2) Groupe de travail initié à Tapages, par Olivier Binet et Jean Marc L’Hôtel avec Klaus Blasquiz, Thierry Lebon, François De Morant, William Lamonica et une aide précieuse de Yvan Maucuit et Philippe Vandendriessche.

Menu

INTRODUCTION
ENJEUX
DE L’INTÉRÊT DE LA DIFFUSION MULTICANAL
LA PREMIÈRE DES QUESTIONS : LE CHEMINEMENT DE LA POST PRODUCTION
a) LE STUDIO DE MIXAGE SOUHAITE RECEVOIR DES FICHIERS « DISCRETS »
b) LE STUDIO DE MIXAGE SOUHAITE PRENDRE EN CHARGE LE DÉMATRIÇAGE OU LE DÉCODAGE DES FICHIERS
c) PRODUCTION DE « FLUX »
LE CHOIX DES MICROS
A LES MICROS DISCRETS NON COINCIDENTS
A.1 LES COMPACTS
a) L’HOLOPHONE
b) DOUBLE AB ET CROIX IRT
c) MAIS QU’EST-CE QUE L’ON FAIT DU CANAL CENTRAL ?
A.2 QUAND DANS LA FAMILLE : ON N’ARRETE PAS DE GRANDIR …
a) L’ATMOS 5.1
b) L’ARBRE DECCA/DPA
c) L’OCT 1
d) L’OCT 2
A.3 LE KFM 360
B LES MICROS COINCIDENTS
B1 LES MICROS MATRICES : LE DOUBLE MS
B2 LES MICROS CODES : LE SOUNDFIELD ST 350 ET L’AMBISONIQUE
L’EPINE DANS LE PIED
CONCLUSION
REFERENCES

INTRODUCTION

La norme de diffusion multicanal, et en l’occurrence le 5.1 récemment associé à la HD pour la télévision, a fait naître chez les producteurs quelques questions dont celle-ci qui a été à la base de notre travail :

« Maintenant que nous devons diffuser en 5.1, conseillez-moi le micro 5.1 le mieux adapté pour y arriver ? »

La première réaction à cette question était de se dire que, comme par le passé, il n’était pas nécessaire d’avoir des enregistrements faits avec un micro stéréo pour fabriquer un programme stéréo, il n’est pas plus nécessaire d’avoir des micros multicanal pour faire du 5.1. Mais il faut reconnaître que l’apport de prises de sons stéréo ou multicanal, en particulier pour les ambiances, enrichit réellement le travail du montage son. Alors, même si un micro multicanal ne s’impose pas pour toute captation à diffusion multicanal, à quel moment est-il pertinent ?

ENJEUX
On assiste aujourd’hui à plusieurs mouvements :

Le Développement historique du format 5.1 au cinéma (puis peut-être 7.1): mais avec la contrainte majeure de pouvoir faire entendre à un maximum de spectateurs les qualités d’un son spatialisé.

Le Développement de la télévision HD : les diffuseurs qui escomptent un plus en terme de qualité d’image, vont être amenés également à proposer (on espère) un plus en terme de qualité de son. Les contraintes concernent pour l’instant les canaux de transmission et obligent pour « passer » les 6 signaux, un codage en Dolby E, mais le standard 5.1 semble définitivement pérennisé.

Le Développement du DVD : certes pour l’instant la capacité des supports oblige à utiliser le plus souvent des formats compressés mais la facilité de pouvoir proposer plusieurs types de mixage (stéréo /AC3 / DTS) et plusieurs langues, est réelle et semble à elle seule, exiger la production de mixages multicanal si l’on veut justifier le fleurissement des enceintes dans les salons des particuliers.

Si tous ces éléments concourent à un essor du son multicanal ; il n’est pas sûr, pour autant, que les attentes de chacun des secteurs soient identiques.

De même ; et c’est l’objet de ce document, les pratiques, et donc la réflexion sur la chaîne de production (gestion complète), ne sont pas exactement similaires dans les 3 domaines.

Dans ce vaste cercle, nous ne tentons pas de réinventer l’eau tiède. Nous cherchons juste à mettre à jour les enjeux et les possibilités des différentes solutions pour la captation d’événements sonores en multicanal quand celle-ci est liée à l’image.

Des études et comparatifs plus poussés, ont déjà été effectués par le passé :

– Comparaison de quelques systèmes multicanal à l’AES en 2000

– Considérations générales sur la prise de son multicanal Joerg Wuttke à l’AES en 2000

– Le mémoire de Benjamin Rudio sur le le son surround en 2002 pour la SAE

– les séances d’écoutes et les réflexions de l’AFDERS en 2002 et 2003

Nous tenterons dans un premier temps de discuter la pertinence d’une prise de son « réaliste », c’est-à-dire la possibilité de capturer les éléments d’une réalité et ce, à l’aide d’un microphone principal, face à la possibilité d’une recréation sonore totale en postproduction.

En effet, nous sommes le plus souvent des preneurs de sons « itinérants » et notre réalité quotidienne est que nos outils doivent être compacts, transportables et rapides à mettre en œuvre.

Parce que dans notre travail, le transport, voire le déplacement micro à la main est notre réalité.

Parce que le fait d’être lié à l’image nous oblige souvent à être invisible, aussi bien pour le téléspectateur (la caméra) que pour le spectateur.

Parce que si on ne veut plus entendre la ritournelle : « on attend encore le son », il va falloir être aussi invisible dans notre mise en œuvre.

Nous partons avec 2 éléments :

– la prise en compte du caractère non-régulier du standard 5.1 qui, en privilégiant la stabilité de la scène frontale, rend délicat par le grand écart entre HPs la réalisation d’images fantômes stables sur les cotés et à l’arrière.

– et également, le fait, que, comme pour la stéréo, le goût actuel est plutôt d’avoir une sensation d’enveloppement, donc de privilégier les systèmes non coïncidents qui ont pour remédier à l’irrégularité de la diffusion en 5.1, une tendance à prendre des dimensions de plus en plus importantes.

(Retour au menu)

III. DE L’INTÉRÊT DE LA DIFFUSION MULTICANAL

Nous ne répondrons pas à toutes les questions que soulève l’approche d’un son multicanal, mais au moins nous les poserons:

– Q : est-ce que cela à un sens de plonger le spectateur dans un espace sonore cohérent alors que l’écran est devant lui ?

– Q : est-il pertinent de placer des informations sonores significatives sur les côtés et à l’arrière ?

– Q : est-ce possible d’être réaliste avec une disposition de haut-parleurs non- régulière ?

– Q : n’est-il pas préférable d’avoir 2 zones distinctes l’une à l’avant et l’autre à l’arrière ?

– Q : est-ce important de tenter de capter avec un certain « réalisme » un univers multidirectionnel ? Une recréation virtuelle en postproduction, ne serait-elle préférable ?

Comme on le voit, un vaste débat…

Dans la recherche d’une plus haute définition du son, l’augmentation des points de diffusion (passer de 2 à 5 enceintes) permettra aux composantes latérales et arrière du son de ne pas s’additionner aux informations sonores des 2 HP de face, ce qui permet une plus grande « lisibilité » en éclaircissant l’image stéréophonique. Tout comme l’élargissement des effets au mixage, rend ce qui est au centre plus compréhensible.

Augmenter le confort d’écoute est une chose. Augmenter le plaisir d’écoute en est une autre, encore moins contestable. Ce n’est pas parce qu’une bonne prise de son mono vaut mieux qu’une mauvaise en stéréo que l’on va s’interdire de chercher à réaliser une bonne prise de son en stéréo. Être enveloppé par une ambiance sonore nous parait, un véritable saut qualitatif. L’idée d’un bain sonore, dans lequel on barbotte, semble pour l’instant, une image assez juste. Notre envie est de placer le spectateur à un endroit précis pour qu’il puisse ressentir le lieu comme si il y était. Doit-il être réaliste ou inventé ?

Ce sont certainement les critères économiques qui le diront. La captation d’ambiances raccords n’a jamais été remise en cause en stéréo ; malgré l’importance des sonothèques disponibles, elle sert toujours de trame lors du mixage.

En multicanal, enregistrer la véracité d’un lieu, en prendre son empreinte sonore sera toujours un point de départ même lors d’une recréation totale. Si la vraisemblance est une des composantes du plaisir d’écoute, alors le souci de la cohérence doit guider notre captation.

Même si nous disposons d’outils pour une spatialisation : processeurs pour un positionnement en 3D, réverbérations artificielles ou pan-pots, il nous faut quand même de la matière première. C’est un peu comme en cuisine ; la réalisation d’un très beau plat dépend bien souvent de la qualité des ingrédients de base.

Aujourd’hui, avec l’engouement pour les processeurs à convolution, la captation des signatures sonores de nos lieux de tournages, va peut-être même devenir une obligation. Car reprendre des IR (réponses impulsionnelles) existantes, c’est bien, mais fournir nos propres IR, c’est encore mieux. C’est là, une belle ouverture pour, allécher nos producteurs, s’il fallait encore le faire, sur l’intérêt de s’occuper sérieusement de captations multi canal sur nos tournages. La convolution, bien que liée à notre propos

est néanmoins un domaine à part. La lecture de l’excellent article « Viva la Convolution ! » écrit par Wolfen dans AudioFanzine en 2005 en est une très bonne approche.

Et puis, très prosaïquement, si notre métier de preneur de son de directs persiste ; c’est bien parce que cela demeure plus rapide et donc moins cher que de refaire toute une création en post-production. Donc toute démarche qui fera gagner du temps de postproduction devrait être bienvenue.

De ce point de vue, on peut noter que les méthodes de travail ne sont pas identiques dans les 3 univers que nous tentons d’appréhender : « cinéma », « flux » et « documentaire ». La méthodologie « cinéma » de recréer 2 blocs cohérents ne se préoccupe pas forcément de recréer une ambiance réaliste alors que « flux » et « documentaire » se rejoignent plutôt sur leur volonté de capter des espaces réalistes.

LA PREMIÈRE DES QUESTIONS : LE CHEMINEMENT DE LA POST-PRODUCTION

Assurer une captation est une chose. S’assurer que tout cela arrivera à bon port et que nos sons seront traités comme ils le devraient, en est une autre. Le choix de tel ou tel système de captation n’a de sens que si l’on a les moyens de suivre la chaîne jusqu’au bout.

L’objet de ce document est donc de tenter de réaliser un inventaire des difficultés que l’on rencontre lorsque l’on veut amener à bien, un projet avec prise de son multicanal.

LE STUDIO DE MIXAGE SOUHAITE RECEVOIR DES FICHIERS « DISCRETS »

Argument : le studio de mixage coûte cher ; ce n’est ni le lieu ni le moment pour effectuer un travail de montage. La fabrication de fichiers monophoniques, puis la constitution des fichiers discrets, nous semble être assimilable à du montage son. Or si nous sommes dans une logique « broadcast » ou « docu », le métier de monteur son a disparu, il va y a avoir une charge de travail supplémentaire a effectuer. La question est de savoir : qui va le prendre en charge ?

Nous sommes partis de 2 présupposés :

Le premier est que : en l’absence d’un monteur son, c’est sûrement la personne qui a capté les sons qui est la mieux placée pour décoder ou dématricer suivant les systèmes choisis, les fichiers et surtout c’est la seule personne capable de pouvoir valider la cohérence du travail fait.

Le deuxième est que : étant donné qu’individuellement nous allons être amenés à nous équiper: « pourquoi dépenser plus pour avoir moins bien » (comme dit Jean-Marc Duchenne). Donc, pour ce faire, nous sommes partis à la recherche d’un logiciel de montage et mixage permettant le travail en multipistes, simple, en évolution, acceptant les plugins VST ; car pour l’instant le plugin double MS de Schoeps n’est dématricé que par un VST. L’ensemble tournant sous Windows XP de façon à être utilisé par le plus grand nombre.

Or comme nous voulions pouvoir comparer tous les systèmes choisis sur un même logiciel, ces contraintes sont devenues notre point de départ. Notre choix s’est porté sur le logiciel Reaper de chez Cockos, les utilisateurs de Vegas y retrouvent forcement leurs petits, et ceux de Protools ne semblent pas perdus. Chic et pas cher, il est en constante évolution et c’est pour l’instant, bien plus qu’un programme, cela ressemble à une petite communauté. C’est un magnifique hôte à VST et 64 entrées et 64 sorties… La version 2.0 est arrivée.

On a aussi à sa disposition suivant ses goûts et ses moyens : Podium, Tracktion, Cubase, Nuendo, N-Track Studio et Bidule ou Audiomulch pour les hôtes VST … Il faut également souligner le magnifique travail réalisé par Jean-Marc Duchenne sur ses sites : http://acousmodules.free.fr/ et http://multiphonie.free.fr/index.htm qui nous offre, en plus, les plugins de mixage surround pour tous les logiciels qui ne les possèdent pas.

Le plus difficile par la suite a été, comme bien souvent, une suite d’incompatibilités informatiques pour faire travailler de façon stable : -un ordinateur portable – une carte son comportant au moins 6 sorties – des drivers Asio et un système caisson de basses-ampli -enceintes satellites. Cette solution pour l’équipement nécessaire à l’écoute et au « montage » des prises de sons, a l’avantage d’être légère et économique, à défaut de puissance.

Donc au mixage, 2 options s’offrent à nous :

– graver les fichiers discrets et les apporter au mixage,

– ou venir avec un portable et sa carte son pour rentrer dans la console. Il est possible de lire les fichiers en direct pour qu’ils soient enregistrés par le système de montage (mais la qualité dépendra de la qualité de la carte son) ou le système de montage viendra se servir dans le disque dur externe (et la qualité dépendra du programme de mixage sur le portable).

De ce fait, plus de problèmes de compatibilité entre les systèmes des studios de mixage et les formats des fichiers sons.

Il est donc possible d’aller mixer n’importe où.

LE STUDIO DE MIXAGE SOUHAITE PRENDRE EN CHARGE LE DÉMATRIÇAGE OU LE DÉCODAGE DES FICHIERS

Il se peut que le mixeur pense que c’est plutôt à lui d’effectuer les choix de directivité, de focus et autres possibilités offertes par les programmes prévus à cet effet. Ce en quoi on ne peut pas lui donner tort, étant donné que tout dépend de ce que l’on va mélanger avec.

Le format des sons est :

en double MS

– solution 1 : fabriquer à « l’arrache » avec la console ou des plugins 1 MS avant et 1 MS AR. le centre, reste à la

discrétion de chacun

– solution 2 : travailler avec des VST, et utiliser le plugin SCHOEPS. La version TDM n’existe pas.

– solution 3 : louer pour la séance, 2 modules dématriceurs VMS 5 U de Schoeps ou un MDMS U. qui seront gérés comme des périphériques externes (niveau ligne accepté).

en Format B

– solution 1 : travailler avec des TDM, et utiliser le plugin SurroundZone TDM ; la version de démo est gratuite un mois, après il faut l’acheter

– solution 2 : travailler avec des VST, et acheter le plugin SurroundZone VST. La version de démo ne fonctionne pas

– solution 3 : travailler avec des VST, mais sans investir. On peut, en commençant prudemment, utiliser le Visual

Virtual Microphone VST de David Mc Griffy et Angelo Farina et fabriquer le canal sub à l’aide de

Bass_Management_1 du même A.Farina

– solution 4 : ce même Visual Virtual Microphone de David Mc Griffy et A. Farina existe aussi en version .exe et lit très bien les fichiers BWF , avec en plus un exemple 5.1 tout prêt.

2 autres players sont également possibles

– BfPlayer

– AmbisonicsPlayer

– solution 5 : louer, pour la séance, le module hardware décodeur SP 451 de Soundfield qui est géré comme un périphérique externe.

– solution 6 : les possesseurs de Mac OS X pourront, quant à eux, utiliser les décodeurs B2G de Daniel Courville en version VST ou Audio Unit. Il faudra peut-être installer SonicBirth pour que cela fonctionne

– solution 7 : les curieux ne manqueront pas d’aller voir les plug-ins VST de l’Université de York

en canaux discrets de micros non coïncidents

– pas de problèmes, utilisation habituelle

– Pour les double AB fabrication ou non d’un canal central.

PRODUCTION DE « FLUX »

– Avec post-production

Pas de différence d’avec le paragraphe B, car c’est une situation de mixage. et il est possible de faire tourner seulement pour le monitoring, un Protools, un Pyramix, voire même un Reaper. Avec les drivers Asio les temps de latences sont faibles et restent toujours en dessous des temps de traitements des régies vidéo actuelles. De toute façon, un décodeur de format B SP 451 peut se louer et le dématriceur hard DMS porte la référence MDMS U.

En situation de direct

Le soft choisi pourra éventuellement tourner pour un décodage en temps réel (avec calcul des temps de latence) mais on préférera les solutions hardware.

Ainsi quelque soit le choix de micros envisagés, nous avons différentes solutions à notre disposition .A nous d’en vérifier la faisabilité. On n’a rien sans rien Et la prise de son multicanal ne peut s’envisager sans un budget supplémentaire.

Même si les choix proposés sont relativement économiques, il faut y dépenser du temps donc de l’argent et cet élément sera difficilement perçu à une période où la HD est vendue moins chère que le SD.

LE CHOIX DES MICROS

Même si c’est la première question qui nous vient en tête, c’est le système de post-production qui doit guider notre réflexion et nos choix.

Comme pour la stéréo, on a toujours les inconvénients de ses avantages. Deux visions sont perceptibles : d’un coté ceux qui souhaitent obtenir une sensation d’enveloppement agréable et de l’autre, ceux qui souhaitent obtenir une meilleure localisation du son dans l’espace. En jouant sur les mots c’est plutôt le terme « pouvoir » qui serait à utiliser, plutôt que « vouloir ». Toujours est-il que l’une ou l’autre approche est déjà une nette amélioration par rapport à la stéréo. Pour faire simple les micros non coïncidents (en jouant sur Di (différence d’intensité) et Dt (différence de temps)) donnent une meilleure impression spatiale mais semblent moins performants que les micros coïncidents pour assurer une bonne localisation. Est-ce que l’on parviendra à obtenir une bonne localisation avec 5 enceintes ? Rien de moins sûr. Est-ce pour autant une piste à abandonner ? Sûrement pas ; même s’il semble que l’on doive, pour l’instant choisir entre sensation et précision.

LES MICROS DISCRETS NON COINCIDENTS

Les prises de son en Dt et Di reposent sur ce qui parait- être une évidence : 5 enceintes de diffusion donc 5 micros axés en fonction de l’orientation des HP. De nombreuses recherches, de nombreuses possibilités de configurations mais avec une tendance actuelle à l’élargissement des systèmes car les résultats semblent plus probants en introduisant un retard entre le couple arrière et le système avant. Cette recherche de la décorrélation des signaux avant-arrière, rend, parfois, les systèmes très difficiles à manipuler dans une configuration itinérante. Il n’en demeure que l’éloignement des capsules rend problématique la réduction stéréo sauf à effectuer un mixage spécifique.

LES COMPACTS

L’HOLOPHONE

La tête de 6 PO (19 cm par 15cm) dans laquelle sont placées 7 capsules (en plus des 5 et du Sub, il y a une capsule Top).

C’est pour l’instant le représentant de la tendance « compacte » chez les non coïncidents. Comme dit Laurent Givernaud : «il ne repose sur aucune théorie ». Ce n’est pas pour autant que cela ne fonctionne pas. C’est semble-t-il assez« simple » à l’usage mais un peu flou dans le rendu et un peu pincé. Au nom de ce principe de simplicité de mise en œuvre, c’est pour l’instant une direction souvent empruntée par les prestataires pour la télévision française. Un connecteur =un microphone =un canal.

Malgré tout quelques précautions sont à prendre :

– le H2 est câblé L-R-C-Sub-SL-SR et le H4 (son très petit frère qui est enfin arrivé) est câblé L-R-SL-SR-C-Sub c’est détectable grâce au Sub mais parfois on ne l’enregistre pas.

– la protection anti-vent du H2 appelée par nous « casque de Dark Vador » est carrément pénible à l’usage. Le H4 peut quant à lui être recouvert d’une W 20, et là ça marche.

– 6 pistes, pour un micro, cela commence à devenir pénalisant en portable. Pour le même encombrement de pistes d’enregistrement on peut s’offrir 2 DMS ou un Soundfield plus un couple, voire 2 micros en format B si l’on n’enregistre pas la composante Z.

– L’absence de suspension n’est pas trop préjudiciable, vu le manque de graves

Pour les avantages :

– comme souvent un inconvénient peut se transformer en avantage et le caractère moins précis de la localisation permet de le mélanger assez facilement avec d’autres sources

– Le H4 de part son très faible encombrement, pourra être installé partout ou une totale discrétion s’impose. Il faudra là également un rouleau de « gaffer » pour « assurer » les connecteurs qui ne sont pas vérouillables. Lors de nos tests la sortie proposée LTRT ne fonctionnait pas.

b.DOUBLE AB et CROIX IRT

Comme quoi, les vieilles recettes ne sont pas forcement les plus mauvaises. Avec ou sans arbre Decca / DPA, les couples stéréo sont des systèmes que l’on maîtrise depuis un moment. Et si l’on n’a pas les moyens supplémentaires pour s’offrir des capsules spécifiques et une chaîne de post- production particulière, on peut donner libre court à son ingéniosité. Cette technique semble intéressante parce qu’elle génère 2 images sonores AV et AR, bien localisées. On ne lui reconnaît pas de qualité à fabriquer des images fantômes latérales stables, pourtant dans certains systèmes (croix IRT par exemple) l’écartement latéral est le même que l’écartement AR ou frontal. Je pense donc que l’on est plutôt en train de juger notre système de diffusion. Et puis, cette technique peut répondre à l’objection du resserrement de l’image avant, causé par la présence du canal central, si l’on n’injecte rien dans ce canal.

Installer 4 capsules cardioïdes régulièrement espacées, puis en prenant les abaques, les écarter entre 20 et 27 cm, et l’on se retrouve avec ce qui semble bien être le système de base.

Avant

Pour nos tests, nous avons repris la suggestion de Pierre Olivier Boulant (qui lui-même devait le tenir de …) d’ouvrir un petit peu le couple AR et on a essayé de reproduire sa proposition de:

Par la suite, au mixage ; si l’on souhaite améliorer les images latérales, l’introduction d’un décalage de temps ou de niveau entre AV et AV, ouvre encore de nombreuses possibilités. En extérieur, il faudra ajouter les bonnettes et un rouleau de gaffer pour solidariser tout cela.

MAIS QU’EST-CE QUE L’ON FAIT DU CANAL CENTRAL ?

Là encore, on se retrouve face à 2 écoles. Y a-t-il un brouillage entre l’enceinte centrale et l’image fantôme créée par les haut-parleurs G et D? Les uns disent que, si le second arrive plus de 20 ms après le premier, il est assimilé à une réflexion .Les autres répondent que l’on se trouve encore en dessous des limites de l’effet d’antériorité. Déjà que l’on manque un peu d’enceintes ; essayons d’en faire quelque chose.

QUAND DANS LA FAMILLE : ON N’ARRETE PAS DE GRANDIR …

La diffusion 5.1 posant quelques soucis, pour respecter la théorie des angles de pointage et des distances entres capsules, on tente de plus en plus d’introduire un décalage de temps entre les micros. Alors, de partout chacun reprend ses connaissances sur la stéréo et cherche. Les curieux ne manqueront pas les abaques de Bernard Lagnel. Mais c’est à partir de ce moment là que les systèmes commencent à s’agrandir.

Nous reprendrons parfois, les explications de Laurent Givernaud puisque l’on commence, un petit peu, à sortir du cadre que l’on s’était fixé car nous n’avons, pour l’instant, pas testé tous ces micros.

a) L’ATMOS 5.1

Brauner propose un produit tout en un, composé de 5 microphones à directivités variables et d’un processeur ASM5 (Adjustable Surround Microphone). Les microphones avant sont placés aux sommets d’un triangle rectangle et espacés de 17.5 cm du centre d’enregistrement. Chaque microphone AR est positionné à 60 cm avec un angle de 60° par rapport à l’axe médian. Tout ou presque étant réglable c’est un outil aux possibilités étendues.

L’obligation du processeur rend, néanmoins, le système intransportable.

b) L’ARBRE DECCA/DPA

Pour la zone frontale de captation, 3 micros omnis espacés entre eux de 1.5m à 2m. Le fameux triplet. Deux microphones placés à l’arrière servent à alimenter les enceintes arrière. La distance séparant les microphones arrières des avants, permet d’ajuster l’image subjective de la prise de son. Ce système donne de bons résultats quant aux critères de spatialisation et de renforcement de l’image centrale.

Le Fukada-tree est une variante de ce système qui reprend l’agencement des microphones en remplaçant les capsules omnidirectionnelles par des cardioïdes. La localisation est ainsi améliorée au détriment d’une moindre réponse aux basses fréquences inhérente aux capsules directives.

La variante DPA permet, à partir d’un kit de base de mettre en oeuvre la plupart des configurations proposées par les « chercheurs » .On peut donc tout tenter , tout tester et en plus on est guidé . Il faudra juste vérifier si l’encombrement et le temps de mise en oeuvre sont compatibles avec nos tournages. A noter l’intégration des câbles à l’intérieur du système.

c) L’OCT 1

On ne peut pas reprocher à Schoeps de ne pas proposer différents procédés d’enregistrement. La solution OCT propose pour la captation latérale, 2 capsules hypers à 90 ° de l’axe éloignées de 40à 80 cm. Et pour l’avant un cardio, en général. Si la source est placée vers l’avant droit, elle ne sera pas captée par le micro de gauche car on est dans sa zone d’annulation au niveau de la directivité. Ce procédé assure une localisation correcte en frontal, on pourra y associer à l’arrière 2 cardios éloignés de 20 cm de plus que ceux de l’avant et éloignés de 40cm du triplet avant pour la version simple ou la croix de l’IRT pour améliorer la spatialisation. Comme, il est question de l’éloigner de quelques mètres, on se retrouve avec 2 systèmes et du coup ; on commence à abandonner notre objectif de : « micro transportable »

Reprenons, afin d’en cerner les attentes, ce qu’en disent ses « inventeurs » : « les canaux surrounds doivent être simplement ressentis. Il serait gênant de les percevoir comme sources distinctes, et l’auditeur doit se sentir comme enveloppé par le son »- « capable de produire une illusion relativement crédible ». Et de tenter d’adopter un autre point de vue, consistant à : « remplacer la restitution fidèle de l’original par une sensation de bien-être par l’évènement sonore pour compenser l’absence de direct » et d’ajouter que si la stéréo se caractérise par sa capacité à localiser avec précision des sources fantômes, le son surround doit offrir plus ; comme étendre la zone dans laquelle l’écoute procure du plaisir, moyennant quoi la localisation peut-être moins précise. Et de terminer en se demandant si un bon microphone principal multicanal existe vraiment.

d) L’OCT 2

Les abaques du programme Image Assistant dans sa version 2.O conduisent à avancer le micro central de 32 cm par rapport à l’OCT 1. Un comparatif intéressant des différents systèmes a été établi sur le site du projet multi média Verdi

Le KFM 360

Bruck a commercialisé avec Schoeps, une sphère de 18 cm de diamètre (plus petite que la KFM 6) afin d’y loger de part et d’autre deux capsules bidirectionnelles. Ces deux capsules supplémentaires mixées avec les capsules omnidirectionnelles effleurant la sphère (comme pour du M-S) permettent de créer 4 canaux audio discrets. Le canal central est fabriqué à partir des signaux gauches et droits à l’aide d’un matriçage emprunté à l’ambiophonie. Ce microphone nous autorise, comme pour le M-S à modifier les directivités pour modeler le rendu à son goût. Ce micro est à notre disposition depuis une dizaine d’années et produit de très belles ambiances très aériennes. C’est le plus compact dans la famille grands espaces.

Une fois résolu le problème de la suspension, il est presque transportable (Mode d’emploi du KFM360).

Résumé

La préférence pour les systèmes non-coïncidents en dit plus sur nos goûts et nos habitudes psycho-acoustiques que sur les systèmes eux-mêmes. La notion de plaisir est aussi une notion culturelle, et il n’est pas étonnant qu’au pays du « couple ORTF » on aime les grandes sensations sonores.

L’image employée par Jorg Wuttke d’une différence comparable à celle entre la bière et le vin, pour expliquer la différence des 2 points de vue (coïncidents /non-coïncidents), peut-être traduite par moi en images visuelles. J’ai, en écoutant les différents systèmes, la même impression qu’en voyant le film de J.J. Annaud : les ailes du courage sous ses 2 versions. En Imax ; je volais par-dessus les paysages. Dans sa version en relief, tout paraissait plus petit mais j’avais l’impression d’être au milieu des personnages.

LES MICROS COINCIDENTS

Je me répète ; mais on a toujours les inconvénients de ses avantages. Certes, les micros coïncidents sont compacts, mais du coup ils pâtissent d’une résistance psychologique. Pendant des années, on s’est demandé comment un micro directif pouvait ne pas très allongé et maintenant on se demande si un bon micro « surround » peut-être petit.

Leur taille, leur poids, leur compacité, leurs accessoires et les plugins de post-production font que ce sont les seuls micros multicanal à pouvoir être considérés comme « perchables »

Néanmoins pas de surprises ; comme pour la stéréo, le point fort des techniques Di (différence d’intensité) est la bonne localisation, au moins pour les images frontales. Le point faible, et c’est un peu écrit dessus c’est que comme toutes les capsules sont au même endroit, la séparation entre les canaux est assez faible. La source sonore étant captée par tous les micros, si l’on considère un micro cardioïde comme la somme d’un bi et d’un huit, nous captons au moins 50 % du signal de façon redondante. De plus, avec seulement 2 HP à l’arrière, si on n’arrive pas à jouer sur la directivité des micros, l’image spatiale est un peu appauvrie. Ce que l’on arrive à améliorer, en retardant les signaux arrière. Et en théorie, çà ne s’arrange pas lorsque l’auditeur n’est plus au centre du dispositif.

1.LES MICROS MATRICES : le DOUBLE MS

C’est la direction la plus empruntée par le cinéma français au nom d’un autre principe de « simplicité ». La chaîne de production ayant mis plus de 10 ans à maîtriser le MS, sans grands bouleversements, elle pourra passer maintenant au double MS.

Bien que reposant sur les mêmes fondements théoriques que le Soundfield, le rendu à l’écoute est diamétralement opposé. Autant le rendu du Soundfield pourrait presque paraître plat et sans effet, autant l’impression auditive lorsqu’on plonge ses oreilles au milieu d’un bain de DMS procure des sensations étranges. Le qualificatif de : « faire tourner les têtes » peut-être entendu à double sens .Il n’empêche que la zone d’écoute optimale est assez étroite et que des déplacements dans celle-ci entraînent des sensations de déphasage.

Les avantages sont néanmoins réels :

– compatibilité avec la stéréo (elle-même compatible avec la mono)

– possibilité de zoom et de rotation de l’image sonore

– compacité en nombre de pistes utilisées, seulement 3 contre 5 pour les micros « discrets »

– compacité en encombrement

– accessoirisassions à la hauteur de la réputation de la marque SCHOEPS

Le dématriçage peut se faire de façon classique, voire par exemple les tableaux Excel de Bernard Lagnel, mais le plug-in donne beaucoup plus de possibilités et une gestion du canal central beaucoup plus fine.

Toujours est-il que, en général, on reste dans une utilisation très classique de ce procédé d’enregistrement ; à savoir 1 bloc avant et 1 bloc arrière que l’on retarde plus ou moins pour donner une impression d’éloignement

LES MICROS CODES

SOUNDFIELD ST 350 et l’AMBISONIQUE

Même si c’est une somme de recherches théoriques ; la question qui nous importe avant tout est : « est-ce que ça marche ? »

On va commencer, peut-être, par le : « comment ça marche ? ».

A la suite des travaux d’Alan Blumlein (1930), puis de Michael Gerzon, puis en ayant fait un passage par la quadraphonie, on se retrouve aujourd’hui avec une tête qui nous délivre 4 signaux.

L’idée, radicalement différente, est de capturer l’espace sonore à un endroit précis et lui donner ses différentes composantes directionnelles afin de reproduire l’évènement sonore en 3 D. On a donc le codage suivant appelé format B :

– un signal W : la somme des informations sonores

– un signal X : qui nous en donne la composante latérale AV-AR

– un signal Y : qui nous en donne la composante latérale G-D

– un signal Z : qui nous en donne la composante verticale Haut-Bas

Ce codage est fabriqué à la sortie d’un préampli, alimenté par une batterie de type NP1, qui nous délivre non seulement les signaux W-X-Y-Z au niveau ligne, mais qui dispose d’une sortie stéréo sur laquelle on peut jouer sur la directivité des micros ainsi que sur la largeur de notre image. C’est cette sortie qui peut être envoyée en témoin sur les caméras.

C’est en repassant tout cela dans un décodeur : hardware ou software, que l’on recomposera notre scène ; en stéréo, en multicanal sur un plan horizontal en utilisant W, X, Y, ou en multicanal tridimensionnelle en utilisant W, X, Y et Z. Il n’y a donc plus de lien direct entre les systèmes de captations et les dispositifs de haut-parleurs employés. L’approche ambisonique se montre au contraire tout à fait disposée à une restitution “à géométrie variable », tout en ne nécessitant la transmission que de 3 (W, X, Y) ou 4 canaux (on garde le Z pour effectuer des modifications d’axe du micro) contre 5 ou 6. Cela représente une ouverture sur tous les développements futurs et nous permet d’utiliser nos captations quelque soit le système de restitution.

Toujours est-il que la diffusion suivant le standard 5.1, n’est pas vraiment sa tasse de thé. Cela fait parti des systèmes irréguliers et les systèmes ambisoniques ne jurent que par les systèmes réguliers. Après quelques recherches on trouve néanmoins plusieurs possibilités de décodage.

En dehors du plug-in SurroundZone qui lui est payant, mais à qui l’on peut demander beaucoup, c’est du coté de David Mc Griffy, d’Angelo Farina et du Visual Virtual Microphone que l’on peut se retourner pour faire ses premières expériences en décodage de format B. Il est démontré et confirmé, lire l’article de Angelo Farina sur la question, que les plugin Emigrator de Gerzonic est « broken »en 5.1, comme dit Daniel Courville.

Donc avant de s’aventurer comme lui dans un décodage avec 3 plugins B-Mic, il est plus simple de commencer avec SurroundZone , Visual Virtual Microphone ou Visual Virtual Microphone VST. Nous disposons également de : Décopro de Michael Gerzon qui est payant et de Wigware Ambisonique Decoder que je n’ai pas réussi à faire tourner (cela me produit 2 sons) et surtout du travail des université York et de Zurich : l’Université de York et Hochschule für Musik Winterthur Zürich accompagné du Swiss Center for Computer Music.

Les possesseurs de Mac OS X pourront, eux, utiliser les décodeurs B2G de Daniel Courville en version VST ou Audio Unit. Il faudra peut-être installer SonicBirth pour que cela fonctionne.

Avec ces décodeurs nous pouvons jouer sur :

– le nombre de micros créés, en fait le nombre de HP

– la directivité de ces micros crée, ce qui nous autorise de nombreuses configurations.

– la focalisation

– la position de ces micros recréés. Nous pouvons effectuer des rotations ou changer l’élévation. La composante Z devient nécessaire.

– la gestion du canal de sub

Petite remarque, le fait de pouvoir changer la directivité des micros crées, nous autorise même à transformer le Soundfield en micro à « fortes sensations » en choisissant des directivités en 8 par exemple. C’est une des caractéristiques majeures de ce système : pouvoir reconstituer en post-production, tout type de capsules, tout type de directivités.

A l’écoute ; les résultats sont très satisfaisants, le réalisme est certain. Homogénéité et transparence sont là. Une remarque cependant; nous arrivons à entendre un peu la localisation même en dehors du cercle des haut-parleurs. Peut-être parce que le son arrive sur tous les haut-parleurs en même temps.

En revanche, certaines remarques formulées sur la couleur du timbre de ce micro ne nous semblent pas vraiment fondées. Nous y trouvons nous, équilibre et richesse de graves incroyable. D’ailleurs, à ce propos, si l’on ne veut pas utiliser les coupe-bas lorsque l’on perche, il faudra, si possible, améliorer le système de suspension.

Quelques pistes néanmoins pour le développement futur de notre décodage en 5.1. : Cela se passe parfaitement bien quand les sources sont dans l’axe des HP ; un peu moins bien quand elles sont hors de l’axe. Ce qui curieusement produit un effet secondaire curieux, on retrouve à l’écoute plus d’énergie dans la zone ou il y a le moins de haut-parleurs, c’est à dire l’arrière.

Il faut donc faire attention à diminuer un peu la puissance dans une diffusion 5.1, vers ces HP Surround tout en essayant de rester cohérent dans la localisation. Il y a une autre piste, mais c’est une option personnelle pour chacun de ramener un peu vers l’avant les enceintes arrière (cf. les articles de Jean-Marc Duchenne et de Wendy Carlos)

Les « objets » en mouvement sont plus difficiles à rendre que les « objets » fixes. Cela dit on « pinaille » parce que les micros coïncidents se font les champions de la localisation.

La technologie ambisonique nous apparaît donc comme le secret le mieux gardé de la planète prise de son. A notre grand étonnement, cette solution est très peu employée en France par les « professionnels de la profession ». Cela tient peut-être à sa réputation d’ésotérisme, et nous avons essayé de l’en débarrasser.

Mais nous ne pourrons constamment invoquer le spectre de Margaret Thatcher ou la puissance des laboratoires Dolby. Voir à ce sujet l’article de François Gouget publié il y a déjà une quinzaine d’années. Il faudra bien, à un moment, se poser la question de notre capacité à expérimenter de nouvelles approches. La vérité c’est que c’est bien souvent une question de rencontres et d’étincelles qui se produisent ou non.

L’EPINE DANS LE PIED

Un point demeure délicat dans notre pratique : le monitoring. Pour faire simple ; il semblerait que nous soyons obligés de travailler en aveugle, car jusqu’à présent nous n’avons pas trouvé de solution satisfaisante pour, à l’écoute au casque, se rendre compte des qualités et défauts de nos enregistrements.

Nous ne pouvons, pour l’instant, que mettre sur la table, quelques « trucs » :

Notre point de départ actuel est que : le bon positionnement d’un micro multicanal est sûrement l’endroit où nous aurions placé notre couple stéréo. Donc si nous arrivons à résoudre la question de l’écoute des 2 zones AV et AR, nous avons progressé.

Pour les micros discrets :

L’affaire n’est pas impossible, quelque soit l’enregistreur on doit pouvoir se fabriquer des paires G-D et AR G-AR D. Donc exit le centre ; mais c’est une problématique qui nous est quotidienne que d’avoir une écoute localisée sur chaque oreille au lieu d’entendre les projections des 2 ou 3 enceintes qui seront devant nous.

Pour le DMS :

Il semblerait que le Cantar soit assez malin pour fabriquer 2 monitorings MS. Lire à ce sujet la doc du Cantar V 178 pp 25.Il nous reste néanmoins nos petites mains pour effectuer un 180 ° et écouter ainsi l’arrière.

Pour le Soundfield :

La sortie stéréo fabriquée par le préampli dispose d’une sortie casque, mais pas de panoramique de rotation pour écouter ce que l’on capte sur les cotés, et les switchs « invert » et « end »qui gèrent l’axe du micro ne nous aideront pas dans cette tâche.

On cherche toujours compliqué alors que l’évidence mise à jour par Daniel Courville saute aux yeux. Pour avoir une bonne idée, on peut écouter à partir du préampli : soit deux cardioïdes à 180 degrés (donc W et Y pour audition stéréo égale à l’avant et à l’arrière) soit deux supercardioïdes (0,67) à 120 degrés (W, X et Y pour une biais frontal).

Sinon sur l’enregistreur nous écouterons la piste W (somme des informations) pour savoir si la captation est problématique ou la piste X pour estimer la direction, et contrôler le niveau des infra-graves (pour les bruits de perche).

Il demeure que comme toujours, concernant le monitoring, le problème est un peu plus compliqué qu’il n’y parait. En prise de son itinérante, il nous est impossible de nous affranchir de la source, alors notre volonté d’avoir une maîtrise totale de la situation …!

VII. CONCLUSION (provisoire)

Et maintenant qu’est-ce qu’on fait ?

Et bien on va devoir se retrousser les manches, parce que çà ne va pas tomber tout cuit. Chacun doit identifier ses besoins et peut-être rejoindre l’amicale des joyeux utilisateurs du multicanal lié à l’image (toute autre suggestion de nom sera bienvenue). L’idée est, qu’au-delà du partage d’expérience et de la résolution de nos problèmes liés à l’exploitation de nos captations multicanale, nous ayons un lieu avec le matériel nécessaire à la réalisation de notre opération de cuisine. Il sera à ce moment là assez bien vu de pratiquer des « échanges » : de temps, de réalisation, de formation.

VIII. REFERENCES

Voici quelques publications qui m’ont mis l’eau à la bouche :

– le mémoire de Daniel Courville qui devait être en culotte courte en 1993

– la thèse de Jérôme Daniel et surtout sa présentation PowerPoint qui me réjouit. Je me souviens d’un glorieux passé, où c’était du coté des télécoms que la recherche avançait.

– le site de Frank Ernoud qui nous entrouvre la porte de la 3 D

– déjà cité mais plein de ressources le site Duanrevig

– les activistes de Hauptmikrofon qui sont les maîtres de l’OCT

– le site de Claudre Gendre parce qu’il sait se souvenir. De Rémy Lafaurie en particulier, à qui l’on doit beaucoup

– les sites de Jean-Marc Duchenne, véritables puits sans fin: http://acousmodules.free.fr/ et

http://multiphonie.free.fr/index.htm

– Il ne faudrait pas oublier l’IRCAM qui pratique depuis de nombreuses années et sa médiathèque majestueuse

– Le grenier à son pour ses liens de qualité

– La très active bande de jeunes maoïstes d’Audio Fanzine

– La non moins active bande de passionnés de SoundDesigner.Org qui essayent de donner de la tenue à leurs forums.

Septembre 2007

DERNIERES NOUVELLES

On note l’apparition d’une espèce de « dictaphone multicanal» le H2 de Zoom (curieux d’avoir le même nom que le micro Holophone !) qui enregistre sur 4 canaux avec les 4 capsules internes montées en double XY. Pour moins de 200 euros, l’affaire mérite d’être testée, d’autant que Daniel Courville vient de développer un plug-in, le Zoom2Five, qui permet de transcoder la sortie surround du H2 en format 5.1.

La société Euphonia, présente depuis un moment sur le son 3D, propose une série de plugins au format VST, utilisables sur plateformes Windows et Mac OSX, destinés à manipuler les signaux en situation de production ou de post-production :

– Encodeur A-format vers B-format, très utile pour utiliser le DPA-4

– Outil de manipulation de la matrice B-format (rotation autour de 3 axes, déformation)

– Décodeur B-format vers haut-parleurs (configurations pré-établies dont 5.1 et configurations librement programmables)

– Décodeur B-format vers binaural, pour l’écoute au casque, présentant donc les qualités d’externalisation propre à ce type d’écoute (externalisation : les sons ne semblent plus se former à l’intérieur du crâne, ainsi une source mono ne sera plus entendue en haut du crâne mais sera localisée à sa place autour de l’auditeur, suivant son positionnement dans la matrice B format).

– Un encodeur B-format sera également proposé, de manière à pouvoir « panoramiser » des sources mono dans un mixage B format, puisque l’idée sous-tendue par tout le projet est bien celle d’aller vers ce format en raison de sa qualité d’universalité, au risque de lâcher un mot qui fait peur.

Octobre 2007

« les cahiers techniques de TAPAGES »

RELATED ARTICLES

Articles populaires

Catégories populaires

Informations

Étiquettes