Quelques propositions de l’AFSI pour un son 3D
Thèmes :
- 3D
- Article
- Presse
- Son en Relief
- Sonovision
Cette journée, organisée par l’AFSI et France Télévisions, a réuni une cinquantaine de professionnels passionnés dans le petit auditorium et le foyer de France Télévisions. Elle commençait par une intervention de Jean-Marc L’Hotel, qui présentait le système de son invention : le Cube.
Comme son nom l’indique, ce dispositif de restitution dispose huit enceintes au sommet d’un cube entourant l’auditoire. Rudimentaire ? « L’important n’est pas forcément de trouver les bonnes réponses, mais plutôt de poser les bonnes questions », rappelle Jean-Marc L’Hotel. Lequel, dans sa recherche de la création d’une composante sonore verticale, a eu l’idée de disposer quatre enceintes aux coins de l’écran et de les dupliquer derrière les spectateurs. Chacun étant, bien entendu, alimenté par son propre signal, élaboré à partir d’une prise de son au format B.
Il mixe debout
On obtient ainsi un son tridimensionnel, ou plutôt triaxial, assez enveloppant, avec un dispositif qui n’a
rien de l’usine à gaz. Application pratique avec une longue séquence tirée du film de Françoise Poulin- Jacob, « Je vous écris du Havre… », déjà projeté lors de la Semaine du son 2011. Son rythme lent, son absence de son synchrone évoquait davantage une fiction radiophonique agrémentée d’images. Le projet nous a toutefois semblé artistiquement réussi et le son capté par Jean- Marc avec son micro Soundfield, puis retravaillé, apportait incontestablement une dimension supplémentaire aux images. Cela, même si les fauteuils plutôt cossus de l’auditorium avaient tendance à masquer les sons diffusés par les enceintes du bas du dispositif de sonorisation. Quelques minutes passées debout nous ont donné un meilleur équilibre subjectif et un son encore plus immersif. Jean-Marc L’Hotel confiait à ce sujet que lorsqu’il mixe, il travaille debout, et qu’il est « loin de penser que c’est une mauvaise position pour mixer ». Son idée n’est pas de proposer LE système que tout le monde doit utiliser, mais bien de pousser une porte, par laquelle d’autres peuvent entrer…
Acousmonium portable
Cap sur le Foyer de France Télévisions, en compagnie de Jean-Marc Duchenne, pour une présentation écoute intitulée « Sommes-nous des Acousmates ? ». Dix-sept petites en- ceintes de modèles divers, un véritable acousmonium en miniature, étaient disposées au sol et en hauteur, pour diffuser quelques œuvres de Jean-Marc Duchenne, compositeur acousmatique de son état.
Dans ce répertoire musical, on sait que le dispositif de restitution/projection sonore est d’une importance primordiale, les œuvres étant souvent élaborées en fonction dudit dispositif. À la fin des années 80, Jean-Marc Duchenne travaille en octo- phonie plane. Il explore ensuite l’élévation, en seize canaux, dès 1993, ce qui n’a rien d’évident compte tenu des technologies disponibles à l’époque, même pour un acousmonium en place. Au début des années 2000, Jean-Marc Duchenne décide de développer son propre dispositif de projection sonore, portable, conçu pour de petites salles. Tout tient dans une valise, un sac à dos et un sac : amplificateurs, enceintes, câbles, ordinateur et carte son. L’écoute d’extraits de plusieurs de ses œuvres, adaptées après coup à son système ou composées pour lui, propulsait, là encore, dans une autre dimension sonore. En fermant les yeux, on se laissait surprendre par l’ampleur de l’image, l’apport d’une dimension verticale encore accentuée par les réflexions sur le plafond non traité du l’auditorium, l’inventivité de la mise en espace et la diversité des sources. Comme un cinéma pour l’oreille…
WFS avec 23 enceintes
L’après-midi commençait par un exposé sur la Wave Field Synthesis, signée Arnaud Damien, d’Euphonia, plus précisément sur la technologie Sonic Emotion. L’installation déployée autour de l’auditorium de France Télévisions comportait vingt-trois enceintes acoustiques large bande, de marques différentes à l’avant, sur les côtés et à l’arrière. Rappelons que ce procédé de restitution consiste en une véritable resynthèse du champ sonore, selon le concept de sources virtuelles reproduites par un certain nombre d’en- ceintes à chaque fois, avec utilisation extensive de retards temporels et de filtrages. On sort donc du paradigme « un canal, une enceinte ». Plusieurs exemples de déplacements d’instruments dans l’auditorium surprenaient par leur réalisme, et Arnaud Damien allait jusqu’à spatialiser « en direct » les voix des intervenants pour le reste de l’après-midi. Le principal avantage de la WFS réside dans la stabilité de l’image sonore restituée, où qu’on se trouve dans la salle.
Rien n’empêche de traiter en WFS les cinq canaux d’un mixage film multicanal : l’avantage est alors que le son se déploie librement, avec une sweetspot bien plus étendue qu’avec des enceintes ponctuelles traditionnelles.
On a ainsi pu écouter, grâce à Thierry Lebon, quelques extraits de films, où la restitution était convaincante, puis quelques mixages musicaux où, suite à l’utilisation de techniques transaurales au mixage pour augmenter la sensation d’immersion à l’arrière, l’image sonore « flottait » quelque peu. La preuve qu’il s’agissait d’un atelier d’écoute sans filet, où on n’hésite pas à se remettre en question et à prendre des risques ! Pour l’instant, l’élévation n’est pas encore bien prise en compte, mais c’est un domaine où la technologie WFS ne peut que progresser, des développements sont en cours.
Trinnov corrige l’auditorium
Suivait une présentation « Trinnov », assurée par Arnaud Laborie. La société française propose depuis plusieurs années déjà des outils d’optimisation sonore, basés sur une mesure des propriétés du local d’écoute et leur correction en temps réel par des algorithmes propriétaires. L’Optimizer était évidemment appliqué au système d’écoute déployé dans l’auditorium : calé en une heure de travail la veille au soir, il a considérablement amélioré la qualité de l’écoute. Utilisé en auditorium ou en studio, le système « gomme » les défauts de l’ensemble local-enceintes, et améliore la transportabilité des mixages. Matthieu Parmentier, hôte et co- organisateur de la journée atelier, fait partie, à France Télévisions, d’une commission s’intéressant à la télévision de demain. Pour une fois, l’audio n’y est pas réduit à la portion congrue, puisque la commission compte cinq spécialistes de l’image pour trois spécialistes du son. Matthieu Parmentier s’intéresse notamment à la cohérence entre mixage 3D et image stéréoscopique, notamment en home cinéma. Il évoquait, par exemple, la possibilité de diffuser des signaux au format B, adaptés à la réception au système en place.
Autres pistes, le binaural (avec des casques émulant une écoute en 5.1 sans devoir trop individualiser la réponse HRTF en fonction de chacun) et la WFS. Matthieu Parmentier rappelait à ce propos les essais de la NHK avec son format image Super Hi-Vision 8K, utilisant pour le son, autour d’un écran de 2 m de base, quatre systèmes WFS. Si le son est produit, pour ce format, en 22.2, la restitution n’est pas obligatoire- ment à ce format !
Table ronde
Venait l’heure de la table ronde, modérée par Christian Hugonnet. Lequel accueillait autour de lui, outre
Matthieu Parmentier, William Flageollet, Arnaud Laborie, Benjamin Bernard. L’occasion d’évoquer l’évolution de la perception des sons sur ces quinze dernières années, des techniques de spatialisation, de l’importance de l’enveloppement, de la psycho-acoustique…
William Flageollet signalait notamment le recrutement chez Dolby d’un ancien responsable de la recherche chez Audyssey, acteur majeur dans le domaine des algorithmes de correction/spatialisation. L’élévation est une dimension à découvrir à l’image, notamment en haute définition.
Matthieu Parmentier rappelait qu’à l’IFA récente, l’image 3D semblait en retrait au niveau des préoccupations des fabricants, qui se replient plutôt vers la HD et un «bon» son 3D, ainsi que sur un aspect « smart », convivial et facile à utiliser. Arnaud Laborie posait pour sa part qu’une image 3D, où l’effet le plus prisé est celui du jaillissement, ne demande pas forcément un son 3D où c’est la dimension d’élévation qui constitue l’aspect le plus novateur. De plus, il vaut mieux parler de son pour télé 3D que de son 3D pour la télé. Pour lui, passer en haute définition 4K ou 8K sera plus spectaculaire si le son est tridimensionnel, que d’avoir une image 3D.
William Flageollet redoute, lui, que si les systèmes futurs demandent une grande finesse sonore, ils ne soient fragilisés en salle ou chez les téléspectateurs, par erreur de reproduction.
Au final, une journée très intéressante, où on avait nettement l’impression de participer à un domaine où l’histoire est en train de s’écrire. Aucun système ne domine, la situation est très ouverte et l’esthétique reste à développer.