ATELIER SON 3 D Compte-rendu AFSI

94
Jean-Marc L'HOTEL et Matthieu Parmentier à France Télévisions

ATELIER AFSI DU 24 SEPTEMBRE 2011

La WFS et quelques autres solutions à notre disposition pour un son en 3D

 

Ce fut une belle journée de septembre, au cœur d’un été indien éclatant, qui vit se réunir la crème des ingénieurs du son à l’image, une cinquantaine de passionnés, dans les locaux de France Télévisions. L’accueil fut chaleureux, dans le hall devant la petite salle de projection (où Vincent Goujon faisait pleuvoir café et madeleines), tandis qu’elle se remplissait lentement. Ce fut tout à fait le cas sur les coups de dix heures. L’initiateur de cet atelier et premier intervenant, Jean-Marc L’Hotel prit alors la parole devant une assemblée impatiente d’en savoir plus sur l’avenir de cette évolution, peut-être décisive pour le monde de l’audiovisuel. Première entrée autour des nouvelles technologies et perspectives du son en trois dimensions pour le cinéma : la diffusion cube.

DIFFUSION CUBE ET SON EN RELIEF

Après un rapide retour sur l’histoire des dimensions sonores, de la stéréophonie au 5.1, stade actuel de l’évolution, en passant par la notion de profondeur de champ, Jean-Marc L’Hotel a établi sa volonté de restituer des images fantômes, aussi bien à l’arrière que sur les côtés. Évoquant une citation d’André Kertész, « Ce n’est pas le sujet qui fait la photographie, mais le point de vue du photographe. », il a rappelé l’importance, à ses yeux, d’asseoir le spectateur dans un espace sonore cohérant à 360°.

Comme une suite logique, ses recherches se sont portées vers une utilisation de la composante verticale du son. Pourquoi ne pas placer des enceintes aux quatre coins de l’écran ? Naturellement, cette nouvelle surface sonore, cohérente avec celle de la projection créait la possibilité d’en reproduire une, identique, à l’arrière du spectateur. C’est ainsi que le cube, solution simple et économique, fut imaginé, et avec lui la possibilité d’un son triaxial. Dès lors, c’est bien de la création d’une matière sonore dont il s’agit, plus seulement autour du spectateur mais à l’intérieur de l’enceinte des haut-parleurs, introduisant un véritable saut qualitatif et de nouvelles options de créativité.

Pour illustrer son propos, le vice-président de l’AFSI nous présenta ensuite un extrait (d’une dizaine de minutes) de Je vous écris du Havre… de Françoise Poulin-Jacob, documentaire qui fut projeté pour la première fois en relief sonore, dans le cadre de la Semaine du son 2010. Voici ce que la réalisatrice confiait, pour l’occasion, au sujet de sa collaboration avec son ingénieur du son :

« Quand j’ai proposé à Jean-Marc L’Hotel de travailler sur ce film, il m’a très vite parlé de son en relief. J’avoue avoir été frileuse au départ car je ne voulais pas transformer ce projet en expérience technique. Mais il a su me convaincre et je lui ai donné carte blanche. Mercredi 19 janvier au 6B à Saint-Denis, j’ai redécouvert mon film avec le son en relief. J’avoue que mes craintes se sont envolées. Pas de violence ni d’agression dans la spatialisation du son mais quelque chose de doux et d’enveloppant qui vous place au centre de la narration. J’avais lors de la préparation du film, passé beaucoup de temps à « penser » le son, les ambiances, les éléments ponctuels, les interventions, la voix off et la musique. Tout cela devait s’imbriquer de façon à former un récit sonore à part entière. »

Jean-Marc L’Hotel avait dit son ambition de dissiper les craintes et réticences autour de ces avancées technologiques (peur que la bande son fasse sortir le spectateur de l’histoire, qu’il soit distrait, qu’elle deviennent envahissante, que le sweet spot se retrouve trop réduit…). Cette projection fut donc l’occasion de le faire.

SOMMES-NOUS DES ACOUSMATES ?

Après une franche séance de questions réponses, l’assemblée fut invitée à se déplacer vers le hall. Un dispositif les y attendait, composé de dix-sept enceintes disposées, aussi bien au sol qu’en hauteur, autour et parmi une quarantaine de chaises. 11h30, c’était le moment pour Jean-Marc Duchenne d’intervenir.

Après des études musicales et universitaires au Conservatoire et à l’Université de Dijon, il entre en 1981 dans la classe de composition acousmatique de Denis Dufour, au CNR de Lyon. Il en sort avec une médaille d’or en 1984. Adjoint d’enseignement en composition acousmatique au CNR de Lyon, de 1988 à 1998, il donne également des cours de réalisation de bande son, d’histoire de la musique et d’audionumérique au GRIM de 1994 à 2001. Il enseigne l’informatique musicale à l’Université Jean Monnet de Saint-Étienne depuis 1996, ainsi qu’à l’Université de Lyon-II, depuis 1998. Son travail comporte des œuvres acousmatiques et des installations.

C’est ainsi qu’il introduit celle de ce jour : « La projection sonore seule, sans projection d’image ou jeu scénique, est un merveilleux terrain de liberté, où le son haut-parlant peut vivre sa vie sans autre contrainte que de devoir partager son espace avec des auditeurs. La « véritable 3D du son » est mon quotidien depuis la fin des années 80, mais la liberté n’est pas toujours rose… Après le détournement un peu laborieux d’outils pour façonner sons et espaces, j’ai fini par en fabriquer moi-même, et finalement aussi à développer mes moyens de diffusion. »

Jean-Marc Duchenne a donc eu l’amabilité de venir, en cette fin de matinée, présenter aux représentants de la profession, ses réflexions, qu’il porte en professeur, en artiste, en avant-gardiste, depuis de nombreuses années. Après une rapide remise en contexte, il fit entendre à l’assemblée trois de ses pièces sonores. D’abord, un extrait de « Scènes de la réalité plus ou moins quotidienne » (créée 1993), suivi de « La tour aux éclats de miroir » (2010) et de la première partie de « Histoires fantacousmatiques » (L’horloger solitaire, 2006). Ces diffusions laissèrent une impression forte, le sentiment de se faire surprendre à chaque instant par une nouvelle source sonore, des impressions spatiales uniques, notamment verticales, comme provenant d’étages supérieurs.

LA SOLUTION WFS SONIC EMOTION

Après une pause consacrée au déjeuner, les participants se retrouvèrent à nouveau installés dans la salle de projection, vers quatorze heures et des poussières,  pour assister à la présentation attendue de la technologie WFS Sonic Emotion. C’est sous la forme d’un work in progress, particulièrement adapté à la forme de l’atelier, qu’Arnault Damien (d’Euphonia) s’est lancé dans une première explication du logiciel et de la logistique qu’il met en œuvre. Il permet de gérer en temps réel, une multiplicité de sources sonores virtuelles. La démonstration, enthousiasmante, ne laissa pas indifférent ; et l’on vit Thierry Lebon sauter le pas et mettre les mains dans le moteur.

La Wave Field Synthesis propose, sur la base d’un réseau de haut-parleurs, la construction d’un champ sonore, non pas en adoptant une perspective particulière, mais en déployant des sources virtuelles synthétisées autour des auditeurs. Le résultat étant que le champ sonore est perçu comme stable par l’ensemble de l’auditoire. Cantonnée, il y a peu, aux seuls laboratoires de recherche, la technique acquiert aujourd’hui une maturité qui la propulse en situation de production. Initiée à l’Université de Delft, aux Pays-Bas, au cours des années 80, elle requiert au départ un grand nombre de haut-parleurs placés sur une ligne ou qui ceinturent l’auditoire, principalement contrôlés du point de vue temporel. Le projet Carrouso qui, au débuté des années 2000, a impliqué l’IRCAM et son Équipe d’acoustique des salles, entre autres laboratoires de recherche européens, a permis de grandes avancées dans la maîtrise de ces techniques.

L’architecture matérielle et logicielle récemment développée par Sonic Emotion résout les difficultés liées à la multiplication des canaux de diffusion (synchronisation des signaux audio et des données, traitement distribué), tout en garantissant des résultats probants sur un nombre raisonnable de haut-parleurs.

Alors que la stéréophonie, ainsi que le multicanal (5.1 et assimilés), utilisés au cinéma, risquent de confiner les événements sonores à proximité des points de diffusion, la WFS, en assumant l’augmentation du nombre de haut-parleurs (23 dans cette installation), leur donne corps. Le signal audio est filtré et retardé avant d’être envoyé à chacun des points alignés de façon à synthétiser les vibrations telles qu’elles seraient émises par une ou plusieurs sources. Quelle que soit la position des auditeurs, la distinction spatiale ainsi réalisée permet une singularisation accrue, en présence, localisation et relief, des objets à entendre.

L’offre WFS de Sonic Emotion s’articule autour du processeur Wave 1 qui permet d’agrandir la zone d’écoute pour les mixages surround traditionnels. Avec les systèmes conventionnels, seuls les auditeurs placés au point focal d’écoute (sweet spot) bénéficient d’une image sonore satisfaisante. Le Sonic Wave 1 permet de créer des sources en mouvement, en temps réel à l’aide de plugins compatibles avec les logiciels audio courants. Jusqu’à 24 haut-parleurs peuvent être traités par un seul processeur. Grâce à sa flexibilité en matière de positionnement des haut-parleurs, le Sonic Wave 1 peut s’adapter à la plupart des installations existantes.

Des recherches actuellement menées à l’Ircam prolongent le système en fournissant des outils de production pour la représentation et la manipulation de l’espace sonore.

TRINNOV

Dans la foulée de cette présentation et des questions qu’elle souleva, ce fut au tour d’Arnaud Laborie d’évoquer la solution Trinnov, société dont il est le Président Directeur Général. Trinnov Audio est une jeune entreprise innovante, spécialisée dans le développement de logiciels de haute résolution spatiale pour les systèmes audio.  » En quelque sorte, nous travaillons sur l’avenir de l’audio et la relève de la stéréo. «  Diplômé de l’Efrei (École d’ingénieur informatique) et d’un 3e cycle en traitement du signal, Arnaud Laborie fonde Trinnov Audio en 2000 avec deux amis rencontrés durant ses études.

Les problèmes acoustiques sont identifiés et pris en compte lors des enregistrements et mixages. Mais tant que l’acoustique de la pièce distord votre mixage, comment évaluer s’il est réellement transportable dans d’autres studios ? La société a mis en œuvre les résultats de ses recherches dans le domaine de l’acoustique haut-parleur/pièce pour créer une nouvelle génération de processeur d’enceinte. Le Trinnov Optimizer ambitionne une reproduction sonore de précision : il maximise la transportabilité des mixages.

FRANCE TELEVISIONS

Dernier intervenant individuel de la journée, Matthieu Parmentier, de France Télévisions, disserta, à partir de 16h15, de la nécessaire cohérence entre mixage audio 3D et production visuelle stéréoscopique. Il détailla les perspectives, à l’échelle du home cinéma, du son en relief, en évoquant, entre autres, les difficultés liées à la bonne situation des enceintes et les dernières recherches de son équipe et d’autres, japonaises des NHK Science & Technology Research Laboratories, notamment. Il a transmis son enthousiasme quant à l’avenir des technologies en matière de surround.

TABLE RONDE

L’atelier fut conclu, sur une note ouverte, pour envisager les nombreuses nouvelles perspectives, par une table ronde. Autour de Christian Hugonnet, et face au public, William Flageolet, Arnaud Laborie, Benjamin Bernard et Matthieu Parmentier ont chacun donné leur vision, leur définition du son en 3D, avant d’évoquer la manière dont ils envisageaient le futur de ce concept, de ces technologies qui réservent encore d’innombrables avancées potentielles.

En parallèle des divers interventions, plusieurs postes de travail étaient mis à disposition de tous, pour se familiariser, voir fonctionner et manipuler différents outils de spatialisation : Av-in et son casque Smyth Realiser A8, Longcat et H3D, Audiostage, Euphonia et son Gyrophonia, plugin de manipulation de la matrice B-format. A partir de 18h, chacun des intervenants et les professionnels curieux purent se retrouver, dans le hall, autour d’un apéritif final, et ainsi poursuivre les discussions.