Le format multicanal 5.0, au centre en rouge le sweet spot.

Le son multicanal ou surround englobe une certaine quantité de formats qui se définissent par le nombre de pistes et le nombre de canaux ou voies de reproduction (HP ou famille de HP)[1],[2].

Le son englobe un éventail de techniques d'enregistrement, de mixage et de reproduction dit « surround » (« cerner », « encercler », « entourer », « environner »), c’est-à-dire, tout système de reproduction qui n'est ni monophonique ni stéréophonique.

Historique

Le son multicanal a commencé avec trois haut-parleurs, puis 4, 5, 6, 7, 8… jusqu'aux éphémères 425 haut-parleurs de Iannis Xenakis. Le son multicanal implique au moins la tentative d'un champ sonore (ou espace sonore ou encore champ acoustique) horizontal, quant à sa diffusion, de 360°. Certains autres systèmes tentent de gérer la verticalité, le Dolby Atmos ayant fait son apparition dans les salles en 2013 et arrivant sur les amplificateurs domestiques en 2014.

Vers les années 1950, le compositeur allemand Karlheinz Stockhausen expérimente des compositions électroniques (Gesang der Jünglinge et Kontakte (en)), celui-ci utilise des systèmes tournants et quadraphoniques avec l'aide de Herbert Eimert du studio Westdeutscher Rundfunk (WDR)[3].

En 1958 le Poème électronique pour bande magnétique d'Edgard Varèse, expérimente l'espace surround.

Iannis Xenakis explore également l'espace sonore avec 425 haut-parleurs utilisés pour déplacer le son dans l'espace. Il y a aussi de nombreux autres compositeurs d'avant-garde à la même époque qui ont créé des œuvres utilisant le son surround.

Fantasound

Fantasound a été en 1940 le premier procédé stéréophonique à trois canaux, développé par l'ingénieur du son William E. Garity et le mixeur John N. A. Hawkins pour Walt Disney en 1938-1940 pour le film Fantasia, qui sera le premier film commercial utilisant le son multicanal. Il a conduit à l'élaboration de ce qui est aujourd'hui connu comme le 5.1.

Production et post-production de son multicanal

Prise de son

Il y a un distinguo sémantique à ne pas perdre de vue :

L'enregistrement multicanal remet en question les techniques de prise de son classiques. Principalement, il doit prendre en compte l’espace sonore déployé autour du spectateur ou de l’auditeur; c’est pourquoi un système de prise de son 5.1 doit en capter les subtilités.

Comme à l'époque de la prise de son de musique classique, différentes écoles et systèmes s'affrontent; ceux-ci ne tiennent pas toujours compte des problématiques de mixage et de reproduction, lesquels possèdent chacun leurs propres contraintes.

Dans les années 2010, une multitude de systèmes se développent parallèlement à l’évolution des formats multicanal : MMAD, decca tree, OCT Surround, INA5, Soundfield, sphère Schoeps KFM360, carré Hamasaki, croix IRT, holophone H2pro, dpa S5, dpa 5100…

Mixage

Ces formats rendent plus complexe le travail du mixage. Ils apportent des concepts à revisiter ou à innover autour des effets (outils de localisation, outils de spatialisation, gestion du LFE, traitement dynamique, downmixing, upmixing), des notions nouvelles autour du format (le bass management, la gestion de bus multiples) et des codages utilisés).

D'autre part, le mixage multicanal a ses subtilités de rapports psychoacoustiques doit trouver une cohérence plausible entre le champ visuel déployé en frontal et le champ sonore qui s’installe tout autour de l’auditeur en gérant les principes de l’attention auditive. La réalisation artistique trouve de nouvelles possibilités d'expression dans cet espace qui peut être aussi apprivoisé par la radio (fictions, documentaires), la télévision, la musique…

Formats de mixage pour la diffusion et la restitution multicanal

Musique

Label distinctif des médias enregistrés en quadriphonie.

Cinéma et audiovisuel

LCRS

Format Dolby Surround analogique LCRS (4.1), le carré blanc indique une voie subwoofer ou renfort de basses facultative et minoritairement utilisée.

Le Dolby Stéréo est un format analogique. Quatre sources : gauche, centre, droite et arrière (surround) ou LCRS. En 1975, Dolby présente ce système analogique dérivé de la quadriphonie mais adapté à la reproduction sonore au cinéma en optique[5].

Matricé, dit 4.2.4

En plus du matriçage, le Dolby SR analogique utilise un autre procédé de réduction du bruit (« NR », pour « Noise Reduction ») d'« enregistrement/lecture » qui permet d'améliorer significativement la dynamique (rapport signal/bruit, entre les sons les plus forts et les sons les plus faibles).

Ce format multicanal analogique est toujours, en principe, utilisé au cinéma pour la diffusion des copies 35 mm (« chimiques ») en salle. À la fois pour les cinémas pas encore équipés en numérique ainsi qu'en tant que format de secours en cas de panne du format numérique[6].

Dolby Surround Mixer Left Right Center Surround
Left Total
Right Total

j = +90° phase-shift, k = -90° phase-shift

Mixage 5.1

Format 5.1 :
Le carré au centre est le canal .1 dit LFE[7]
Les autres sont les L,C,R,Ls,Rs.

Le format 5.1 a été le premier format multicanal numérique au cinéma. Plusieurs systèmes de codage sont en concurrence, certains disparaîtront au fur et à mesure des évolutions et des circonstances. Les deux systèmes les plus répandus sont le Dolby Digital et le DTS. Tous les systèmes utilisent la même configuration d'écoute.

Cinq enceintes entourent l'auditeur, accompagnées d’un subwoofer (le .1) qui diffuse les fréquences graves. Les cinq enceintes doivent être sur le même plan horizontal et identiques. Le subwoofer, alimenté par le canal LFE, est disposé le plus couramment devant, proche de l'enceinte centrale, sa bande-passante doit rester inférieure à 120 hertz. La disposition des enceintes est défini par l'UIT-R BS 775-1.

Au-delà du mixage 5.1

Format multicanal surround 6.1, les voies surround sont matricées LCR.

Mixage 3D, son immersif

Système 10.2

Avec l'éclosion de l'image 3D, une plus grande et meilleure gestion de l'« espace sonore » devient nécessaire. Une multitude de formats sonores apparaissent en devenir, notamment des formats gérant la verticalité.

Les formats suivants, destinés au cinéma numérique, prétendent ou tendent à gérer la verticalité de l'espace sonore :

Les techniques de codage qui accompagnent le 5.1 sont, pour le cinéma photochimique, le Dolby Digital et le DTS pour le DVD vidéo, le Dolby E et le Dolby Digital pour la TVHD (le Dolby E pour la production, Dolby Digital ou le He-AAC pour la diffusion vers les particuliers, ces formats permettant l'utilisation de metadonnées utiles pour le bon enchaînement des programmes sur une chaîne HD, une bonne gestion de la dynamique, des possibilités de downmix pour les compatibilités stéréo et mono). Le SACD et le DVD audio sont des supports prévus pour la musique en 5.1, mais on trouve de plus en plus fréquemment le DVD hybride (CD et DVD vidéo DTS ou Dolby Digital) moins coûteux à produire. Les supports HD DVD et Blu ray sont compatibles 5.1, mais sont prévus pour intégrer un son 7.1, accompagné des techniques Dolby Digital évoluées (Digital +, Digital true HD), DTS HD, DTS Master HD, PCM, DSD. On trouve des formats 5.1 compressés pour Internet notamment le mp3surround et le mpegsurround. Ils servent aujourd'hui notamment à la diffusion des radios HD 5.1.

Formats de supports et de transport

Article détaillé : Format de fichiers audio.

Dolby E

Le Dolby E n'est ni un format de mixage, ni un format de diffusion[9], c'est un format d'encodage et transport du signal dit de contribution (exemple : entre la régie TV chargée de capter un opéra en direct installée près du site de l’évènement et la régie de diffusion de la chaîne de télévision qui diffuse le programme).

Article détaillé : Dolby E.

Métadonnées

Article détaillé : Métadonnée (audio).

Pour l'audiovisuel, les métadonnées spécifiques sont toujours en voie avancée d'évolution et de normalisation[10].

Domaines d'application

Télévision, DVD et Blu Ray

Le sport est notamment le facteur décisif qui a porté la télévision en haute définition avec un son 5.1. Nombreuses sont les applications du son multicanal : la télévision haute définition, le cinéma, le film sur DVD vidéo et sur les nouveaux supports HDDVD et Blu ray, le jeu vidéo (DVD, HDDVD, Blu ray), la musique et les concerts (SACD, DVD audio, DVD vidéo), la radio HD, le DAB, Internet…

Jeux vidéo

Historiquement, au début du multimédia, les jeux sont longtemps restés en mono, pour les systèmes d'exploitation (OS), la piste sonore est secondaire, les premiers logiciels multimédias d'animation sont axés sur l'image, la synchronisation entre l'image et le son est encore problématique.

L'apparition du format multicanal a aussi été tardive (comparativement au cinéma), aux alentours de la fin des années 2000 toujours pour les mêmes raisons. La plupart des jeux vidéo sont en 5.1 (parfois en 7.1), à l’exception des consoles portables qui se contentent de la stéréo.

Salles de cinéma IMAX

Article détaillé : IMAX (pour l'image seulement).

Le système sonore de l'IMAX possède au moins six canaux discrets dont un disposé au plafond. Il gère donc l'espace sonore vertical.

Un autre système de contrôle permet de piloter ou d'adapter le niveau de diffusion de chaque piste sonore permet d'optimiser et d'adapter la reproduction aux particularités acoustiques de chaque salle du circuit.

Salles de cinéma numérique

La restitution sonore multicanal a accompagné le développement de la projection numérique en salle, avec le son 5.1, 7.1, Digital Imax, et plus récemment avec les débuts du son immersif Dolby Atmos.

Téléphones mobiles

Pour un téléphone portable, l'alternative est l'écoute au casque utilisant des systèmes d'écoute comme l'ambisonie via la technologie HOA Higher Order Ambisonics de 3D Sound Labs ou[12] l'holophonie.

Problématique de la diffusion multicanal

Le système d'écoute 5.1 est assez complexe à régler. Le niveau de travail préconisé est de 85 dBC SPL au cinéma et aux alentours de 79 dBC SPL pour la haute définition. Chaque enceinte doit restituer le même niveau. Il est aussi nécessaire d’accorder les cinq enceintes en fréquence ainsi qu’harmoniser avec le local d'écoute qui crée des premières réflexions. Le bass management qui consiste à redéployer les basses fréquences des enceintes principales dans le subwoofer, nécessite un réglage, on peut le trouver à différents points de la chaîne (processeur de monitoring 5.1, console numérique, logiciel audio…).

Ce qui différencie principalement la reproduction multicanal au cinéma, à la télévision et pour le DVD c'est d'abord le niveau d'écoute :

Image sonore multicanal

Le 5.1 prétend à l'immersion du spectateur ou de l'auditeur, celui-ci ne regarde plus l'évènement à travers une fenêtre comme il en a pris l'habitude avec la stéréo, qui n'est pas un « format » naturel. En multicanal, l'auditeur « vit » l'évènement, entouré par le champ sonore grâce notamment aux enceintes arrières, presque comme s'il était dans la salle de concert ou en situation réelle.

Pour revivre réellement les conditions du concert ou de l'évènement sportif, il faudrait néanmoins apporter davantage de directions sonores que celles proposées par le 5.1. C'est pourquoi apparaissent dans les années 2010 des formats supérieurs comme le 7.1, ou des formats qui apporte la notion de hauteur en ouvrant davantage l'image sonore : 10.2, le 22.2, ou encore la WFS

Lexique

Définition de certains termes techniques :

Notes et références

  1. le format 5.0 signifie 5 pistes et 5 canaux, 5.1 signifie 5 pistes et 6 canaux de reproduction, le « .1 » (ou le .2) précise que ce canal LFE est en fait mélangé sur un ou plusieurs des 5 pistes pour être extrait à la reproduction. On peut dire que ces systèmes sont encodés mais ce terme est trop vague car il désigne plusieurs procédés, d'ailleurs pouvant être utilisés conjointement.
  2. Le « sweet spot » est la zone d'écoute entre les haut-parleurs où l'auditeur entendra le mixage audio de la même façon que le mixeur
  3. Stockhausen et le studio de musique électronique de la WDR à Cologne - SoNHoRS
  4. appelé ultérieurement 4.0 (stéréo frontale + stéréo arrière - dérivé du format 70 mm)
  5. (en) Dolby : The Formula for Film Sound Success - Site officiel de Dolby
  6. Sur une copie de projection photochimique, il faut tenir compte de l'usure de la pellicule. Bien que très résistant au corrections d'erreur, le format Dolby Digital bascule automatiquement sur le SR optique analogique au-delà d'un certain taux d'erreurs mesurées de lecture, il retourne automatiquement en numérique quand il détecte que cela est redevenu possible.
  7. (en) en:Low-frequency effect
  8. la Géode et Cabasse
  9. Le Dolby E peut s'apparenter à un format de diffusion, bien qu'il ne soit qu'une partie intermédiaire.
  10. Dolby-volume
  11. (en) Site de l'Advanced Media Workflow Association (AMWA)
  12. (en) « 3D Sound Labs Announces the Availability of Ambisonics Solution for 360° VR Player / Virtual Reality Reporter », sur Virtual Reality Reporter, (consulté le ).
  13. « [Test] Casque audio 3D Sound One : du son spatialisé, oui, mais du « bon » son ? », sur KultureGeek.fr (consulté le ).

Articles connexes