GLOSSAIRE

 

Par Michel Chion

 

 

 

AUDIO-VISION ET ACOULOGIE

J’ai voulu dans le Glossaire ci-après rassembler par ordre alphabétique, avec leur définition, les notions créées, formulées - ou dans de rares cas reprises - par moi au long de mon travail. Une version anglaise de ce Glossaire (avec l’aide, pour la traduction, de Claudia Gorbman, elle-même historienne et théoricienne) est en cours de réalisation, et elle sera mise en ligne dès qu’elle aura été terminée.
Il en sera de même pour une traduction allemande, due à Falko Jahn, que je remercie également.
À la fin de chaque entrée figurent des renvois à certains de mes ouvrages où les notions se trouvent développées (titre en abrégé, voir ci-après), ainsi que des liens avec les autres notions ou concepts.
Quand il existe une traduction anglaise de la notion concernée, elle figure entre parenthèses.
La date donnée après chaque entrée correspond à l’année où cette notion a été formulée pour la première fois, dans un article, ou dans un livre.
M.C. , 14/10/06

__________________________________

ACOULOGIE (Schaeffer, 1967, redéfini par Chion, 1993)
Le néologisme d’acoulogie est de Pierre Schaeffer, qui l’a lancé avec générosité dans les pages de son Traité des Objets Musicaux
sans en faire quelque chose. Je me suis permis de le reprendre, vacant et abandonné, pour lui conférer un sens plus large que celui que lui donnait originellement son créateur (qu’on trouvera analysé dans mon Guide des Objets Sonores et sur lequel je reviens dans Le Son). Qu’y lit-on en effet: l’écoute et le logos, donc l’essentiel. L’acoulogie sera donc la discipline qui s’occupe en mots rigoureux des sons, de ce qu’on entend, sous tous ses aspects, ce que ne font ni l’acoustique (centrée sur des phénomènes vibratoires existant indépendamment de l’écoute), ni la mal-nommée psycho-acoustique (où il est moins question du psychisme que d’étudier certaines corrélations entre des stimulus physiques et des sensations sonores isolées, sans s’interroger sur le bien-fondé de ce qu’on appelle “son” au niveau auditif).

ACOUSMATE
Cas de fantôme sensoriel constitué par un son à source invisible qui, soit émane d’une cause située dans le champ, mais est dissimulée d’une façon ou d’une autre, soit émane d’une source hors-champ, mais existe dans le champ comme personnage invisible. Le personnage de Griffin, l’homme invisible dans le film de James Whale (à partir du moment où il se dépouille de ses vêtements visibles et parle avec la voix de Claude Rains) est l’acousmate parfait.
Le cinéma de terreur récent a beaucoup utilisé les acousmates en “hors-champ réel”, qu’on entend voyager dans l’espace de la salle (Les Autres/The Others, d’Alejandro Amenabar)
L’écoute d’un enregistrement de sons par des personnages de films, sur un magnétophone crée des acousmates, faisant exister dans l’air de l’écran des êtres et présences sonores acousmatiques extraites de leur milieu d’origine.
Certains sons symboliques, traces invisibles de la présence ou de l’activité d’un être, marquent certains films: la hache invisible dans Les Chevaux de feu, 1964, de Sergueï Paradjanov.
Voir: ACOUSMATIQUE, ACOUSMATISATION, DÉSACOUSMATISATION, FANTÔME SENSORIEL

ACOUSMATIQUE (Acousmatic) (Schaeffer, 1952)
La situation d’écoute acousmatique est celle où l’on entend le son sans voir
la cause dont il provient. Ce qui est par principe le cas avec les medias tels que le téléphone et le radio, mais aussi souvent dans le cinéma, la télévision, etc..., et bien sûr dans l’univers acoustique “naturel”, où un son peut nous parvenir sans la vision de sa cause (de derrière nous, de derrière un mur, dans le brouillard, dans un buisson ou un arbre -oiseau invisible -, etc...)
Les effets de de la perception acousmatique sont bien sûr différents si l’on a déjà vu ou non au préalable la source du son: dans le premier cas le son transporte avec lui une “représentation visuelle mentale” ; dans le second cas, le son résonne plus abstrait, et dans certains cas, il peut devenir une énigme.
Cependant, dans la plupart des cas, au cinéma comme ailleurs, les sons acousmatiques sont parfaitement identifié du point de vue causal, tout simplement par le contexte où on les entend.
VAC: p. 30-32 ; GOS: p. 18-20; A-V: p. 63-65, 105-111
Voir: ACOUSMATE, ACOUSMATISATION, DÉSACOUSMATISATION, HORS-CHAMP (SON), OFF (SON), VISUALISÉ (SON)

ACOUSMATISATION (Acousmatization) (Chion, 1982)
Procédé dramatique consistant à nous transporter à un moment crucial de l’action dans un lieu extérieur ou éloigné, ou simplement à changer d’angle, ne nous laissant plus que le son - devenu acousmatique - pour imaginer ce qui se passe. En d’autres termes, opération consistant à nous faire entendre sans voir, après nous avoir permis d’entendre et voir en même temps. On peut parler aussi d’”acousmatisation” le procédé consistant à maintenir hors-champ dès le début du film la source (humaine, animale, naturelle) de ce que nous entendons.
LS: p. 200-201; UAS: p. 187
Voir: ACOUSMATIQUE, ACOUSMÊTRE

ACOUSMÊTRE (Acousmêtre ) (Chion, 1982)
Personnage invisible que crée pour l'auditeur l'écoute d'une voix acousmatique hors-champ ou dans le champ mais dont la source est invisible, lorsque cette voix a suffisamment de cohérence et de continuité pour constituer un personnage à part entière - même si ce personnage n'est connu qu'acoustiquement, pourvu que le “porteur” de cette voix soit présenté comme susceptible à tout moment d’apparaître dans le champ. Dans le cadre du cinéma, l'acousmêtre - distinct de la voix-off clairement extérieure à l’image - est un personnage acousmatique se définissant par rapport aux limites du cadre, où il est sans cesse en instance d'apparaître, et tenant de cette non-apparition dans le champ les pouvoirs qu'il semble exercer sur le contenu de ce dernier (exemple : la mère d’Anthony Perkins dans Psychose, Mabuse dans Le Testament du Docteur Mabuse de Fritz Lang, etc.). À l’acousmêtre sont en effet couramment prêtés, dans l’imaginaire cinématographique, l’être-partout (ubiquité), le tout-voir (panoptisme), le tout-savoir (omniscience) et le tout-pouvoir (omnipotence).
Des cas intéressants et troublants sont représentés par l’acousmêtre à vision partielle, dont le savoir est incomplet et les pouvoirs limités, comme dans Fièvre sur Anatahan 1953, de Josef von Sternberg, ou La Tragédie d’un homme ridicule 1980, de Bernardo Bertolucci.
VAC: p. 29-59; A-V: p. 109-110; UAS: p. 163-164
Voir: ACOUSMATIQUE, DÉSACOUSMATISATION


AIMANTATION SPATIALE (DU SON PAR L’IMAGE) (Spatial Magnetization) (Chion, 1984)
Processus psycho-physiologique en vertu duquel, lorsque nous voyons une source sonore (être humain, animal, machine, objet, etc...) dans une certain point de l’espace et que, pour des raisons diverses (réflections diverses sur des parois, amplification électrique, dispositif de projection audio-visuelle, etc...), le son qui en émane ou est censé en émaner vient majoritairement d’une autre direction de l’espace, l’image de la source attire le son et nous fait situer ce dernier là où nous voyons cette source.
Par exemple, au cours d’une projection de film dans un voyage en avion, le son de la voix de l’acteur semble nous venir de l’écran, alors que le son nous arrive dans un casque d’écoute.
L’aimantation spatiale a rendu possible le cinéma parlant classique, dans lequel nous admettons qu’en monophonie les voix des personnages ne se déplacent pas réellement en correspondance avec leurs déplacements visuels, notamment sur l’axe latéral (entre gauche et droite). De même, les sons situés “hors-champ” ne le sont que mentalement, dans l’esprit du spectateur qui projette sur le son des déplacements observés visuellement (ce qui est un cas de “valeur ajoutée”, dans le sens de l’image vers le son). L’aimantation spatiale est “dérangée” et contrariée lorsque les sons se déplacent réellement dans l’espace de la salle, entre les haut-parleurs, alors qu’elle ne l’est pas si le son vient d’un haut-parleur situé en dehors de l’écran, mais sans changer de place.
A-V: p. 61-63; LS: 224-225; UAS: p. 221-22
Voir: CADRE SONORE DES SONS (IL N’Y A PAS DE), HORS-CHAMP RÉEL ,VALEUR AJOUTÉE

AMBIANT (SON) OU SON-TERRITOIRE (Ambient Sound, Territory Sound) (Chion, 1990)
Son d’ambiance englobante qui enveloppe une scène et habite son espace sans soulever la question obsédante de la localisation et de la visualisation de sa source: gazouillis d’oiseaux qui chantent, stridulation collective d’insectes, battement de cloches, animation de ville. On peut le dire aussi un son-territoire, parce qu’il sert à marquer un lieu, un espace particulier de sa présence continue et partout épandue.
Par opposition au son ambiant, les *éléments de décor sonore se définissent comme des sons intermittents et ponctuels signifiant un décor, un lieu.
A-V: p. 67
Voir: ÉLÉMENT DE DÉCOR SONORE, EXTENSION, HORS-CHAMP PASSIF

ANACOUSMÊTRE (Chion, 1982)
“Complexe” voix-corps formé par un personnage que nous voyons et entendons dans un film, et notamment par la reconstitution du tout voix-corps (désacousmatisation) - cela indépendamment du fait que la voix que nous entendons est réellement ou non celle de l’acteur qui joue dans l’image (doublage, post-synchronisation). La forme doublement négative de cette expression, et son allure compliquée (alors qu’il s’agit d’une situation éminemment banale) vise à exprimer le caractère instable, contradictoire, non fusionnel, de cette entité voix-corps.
VAC: p. 130-136
Voir: ACOUSMÊTRE, AUDIO-DIVISUEL, DÉSACOUSMATISATION, FANTÔME SENSORIEL

ANEMPATHIQUE (Anempathetic) (Chion, 1984)
Effet d’indifférence ostensible d’une musique - parfois d’un bruit - présents diégétiquement dans une scène, au caractère pathétique ou tragique de cette scène: piano mécanique, valse insouciante, musique légère, musique jouée sur un électrophone ou un lecteur de cassettes, chanson de rue, ronronnement d’un ventilateur, bruit rythmique d’une machine ou d’une meule, ressac indifférent de la mer pendant un meurtre, un viol, une une torture, etc. Le point commun des musiques et des bruits anempathiques est que, présents avant le drame, ils se continuent pendant ou reprennent après celui-ci sans en être affectés, comme si de rien n’était.
A-V: p. 11-12; MAC: p. 228-235; UAS: p. 187, 382-387
Voir: EMPATHIQUE

AUDIO-DIVISUEL (Audio-divisual) (Chion, 1998)
Néologisme désignant le rapport audio-(logo)-visuel considéré sous l’angle non d’une complémentarité se refermant sur elle-même et de la reconstitution d’une imaginaire totalité naturelle, mais d’une concomitance générant, en même temps que des effets audio-visiogènes d’association, de valeur ajoutée, portant sur le rendu, le phrasé audio-visuel, la scénographie etc. , des manques nouveaux, des effets en creux et des divisions diverses à l’intérieur de l’image et entre les sons. En d’autres termes le son, même réaliste, ne comble pas la question posée par l’image, une image qu’il divise, et réciproquement.
Par exemple un son qu’on entend rend d’autant plus sensible aux sons qu’on n’entend pas, et que l’image suggère. D’autre part, l’image divise l’ensemble des sons entendus en plusieurs zones (in, hors-champ, off), empêchant la constitution d’une bande-son.
LS: 232-233; UAS: p. 156-157, 162-164, 207
voir: AUDIO-VISION, BANDE-SON (IL N’Y A PAS DE), CONCOMITANCE, HORS-CHAMP, IN, OFF

AUDIO-LOGO-VISUEL (Audio-logo-visual) (Chion, 1990)
Expression proposée à la place d’”audio-visuel”, comme plus juste pour désigner celui-ci lorsqu’il inclut, ce qui est le cas le plus courant, du langage sous forme écrite et/ou parlée, sachant que le langage échappe à la sphère seulement visuelle ou sonore. Ce terme rappelle que la situation est le plus souvent triangulaire, et non duelle: ainsi un vidéo-clip combine, non de l’image et de la musique, mais des paroles, de la musique et des images.
A-V: p. 143-155
Voir: CONTRADICTION, CONTREPOINT, CREUSEMENT, SCANSION

AUDIO-VISION (Audio-vision) (Chion, 1990)
Désigne le type de perception propre au cinéma et à la télévision, mais souvent aussi vécu in situ
, dans lequel l'image est le foyer conscient de l'attention, mais où le son apporte à tout moment une série d'effets, de sensations, de significations qui souvent, par un phénomène de projection dit valeur ajoutée sont portés au compte de l'image et semblent se dégager naturellement de celle-ci. On peut également parler d'audio-vision - c'est-à-dire d'influence de la vision par l'écoute - dans la réalité quotidienne.
Si la projection de l’entendu sur le vu est, dans le cas du cinéma et de la télévision, beaucoup plus frappante et systématique que celle, réelle, du vu sur l’entendu, c’est à cause de la présence visible, investie en tant que scène, d’un cadre visible du visible qui est l’écran, préexistant à l’apparition de l’image et survivant à son extinction. Le haut-parleur, à supposer même qu’il soit visible, n‘est pas plus le cadre audible de l’audible, que l’objectif du projecteur n’est celui de l’image. A fortiori
plusieurs haut-parleurs, quand ceux-ci émettent des sons qui fusionnent.
A-V: p. 7-11; LS: p. 219-221
Voir: CADRE SONORE DES SONS (IL N’Y A PAS DE), VALEUR AJOUTÉE, VISU-AUDITION

BANDE-SON (IL N’Y A PAS DE) (Soundtrack as non-existent) (Chion, 1982)
Cette formule signifie que les différents sons figurant dans un film (paroles, bruits, musiques, sons divers), et qui concourent à son sens, sa forme et ses effets ne constituent pas par eux-mêmes, du seul fait d’appartenir à l’univers sonore, une entité globale solidaire et homogène. La présence d’une image les répartit et les divise (c’est l’audio-divisuel), et, en présence de cette image, les rapports de sens, de contrastes, de concordance ou de divergence que paroles, bruits et éléments musicaux sont susceptibles d’avoir entre eux
sont beaucoup plus faibles, voire inexistants, proportionnellement aux rapports que chacun de ces éléments sonores, pour son compte, entretient avec tel élément visuel ou narratif simultanément présent dans l’image.
Le fait qu’il n’y ait pas un cadre sonore des sons (cadre qui pourrait unifier les sons par leur commune présence en un lieu réel et symbolique) rend possible cette situation.
VAC: p. 16-18; UAS: p. 201-205
Voir: AUDIO-DIVISUEL, CADRE SONORE DES SONS (IL N’Y A PAS DE)

BI-SENSORIALITÉ (Chion, 1993)
Le son peut être considéré comme bi-sensoriel - donc avec un impact accru - par effet de redoublement sensoriel, à chaque fois qu’il s’adresse à la fenêtre d’écoute en même temps qu’il touche le corps par co-vibration, ce qui est le cas de très nombreux phénomènes audibles: les sons vocaux (éveillant des micro-réactions nerveuses au niveau du larynx de l’auditeur), les sons puissants avec de fortes basses, etc...
Il nous semble que cette formulation de la bi-sensorialité du son (de certains sons en tout cas) permet de lever des malentendus et des débats sans issue du genre: “entend-on ou n’entend-on pas avec “tout le corps”.
PE: p. 90; LS: p. 55-56
Voir: CO-VIBRATION, HÉTÉROGÉNÉITÉ DU SONORE

BRUIT FONDAMENTAL (Fundamental Noise) (Chion, 2003)
Désigne au cinéma le bruit continu et indifférencié dans lequel symboliquement tous les autres sons du film sont menacés de s’engloutir ou de se dissoudre, ou tendent à se résorber et à s’apaiser, soit que ce bruit recouvre à un moment donné tous ces autres sons, soit qu’il se dévoile comme le bruit de fond qu’on entend lorsque les autres sons se sont tus, et auquel ils vont retourner. Le bruit fondamental (qui est toujours de masse complexe, au sens schaefférien, c’est-à-dire sans hauteur précise) est souvent dans un film à la fois la métaphore du bruit de la projection et celle du bruit de fond de la vie.
UAS: p. 400-404
Voir: COMPLEXE (MASSE)

BRUITÉ (CINÉMA) (Chion, 2003)
Cinéma où le plaisir provient du fait que ce qui est bruité se donne comme tel, rappelant les jeux où l’enfant fournit lui-même par sa bouche les bruits de son avion, de sa voiture, de son petit camion: armes et vaisseaux spatiaux dans la Guerre des étoiles, mouvements de caméra et zooms dans de nombreux films d’action. Bien entendu, les bruitages dans ce cas correspondent, non pas à un objectif de reproduction ou de simulation du son réel, mais à un objectif de rendu (d’une énergie, d’une vitesse, d’une violence, etc.)
UAS: p. 127-129


CADRE SONORE DES SONS (IL N’Y A PAS DE) (Chion, 1990)
Il n’y a pas au cinéma de cadre sonore des sons, autrement dit rien de sonore qui les contienne en commun et leur assigne à la fois une limite spatiale avec des bords, et les structure par leur place même dans ce cadre, comme il en va au contraire pour l’image (puisqu’il y a un cadre visible, visuel, du visuel). Les sons ne sont éventuellement cadrés que par l’image elle-même, laquelle les localise (par l’effet d’aimantation spatiale), les ancre et les rattache ou non à un objet fini dans l’espace, ou bien inversement, en ne les incorporant pas, détermine leur existence sur une autre scène invisible ou dans un espace contigu hors-champ. D’autre part, contrairement à l’enfermement de l’image dans un cadre, les sons du film peuvent s’accumuler les uns sur les autres sans limite de quantité ou de complexité, et ils sont libres de toute loi réaliste: musique de film, textes de voice over, dialogues, bruits réalistes d’ambiance, etc..., peuvent se superposer dans un film.
A-V: p. 59-61; UAS: p. 201-202
Voir: AIMANTATION SPATIALE, BANDE-SON (IL N’Y A PAS DE)

CAUSALE (ÉCOUTE) (Causal listening) (Schaeffer, 1967)
Écoute qui s’intéresse, à travers le son, à tous les indices susceptibles de renseigner l’auditeur sur sa cause: quel est l’objet, le phénomène, la créature qui produit le bruit; où se trouve-t-il; comment il se comporte, se déplace, etc... L’écoute causale est une activité sujette à de nombreuses erreurs d’interprétation, tant elle est influençable par le contexte, et tant le son est généralement vague ou incertain non pas en lui-même, mais quant à la cause qu’il donne à deviner (flou narratif).
GOS: 33-34; A-V: 25-27
Voir: FLOU NARRATIF, RÉDUITE (ÉCOUTE), SÉMANTIQUE (ÉCOUTE)

CAUSALISME SONORE (Chion, 1993)
On peut parler de causalisme sonore (qui est une des formes du naturalisme sonore), lorsqu’il y a une réduction implicite du son à sa cause ou ses causes - que celles-ci soient ses causes réelles, supposées ou imaginées, ou bien qu’on désigne par là le lieu, les circonstances, le cadre de son émission, etc... Dans le cas du “ploc” de la grenouille, qui saute dans l’eau (sujet d’un haiku célèbre du poète Basho), la cause est aussi bien la grenouille, l’eau, la tête de la grenouille, l’ébranlement de l’air causé par la plongée de la grenouille (dit “onde sonore”), le fonctionnement du tympan humain, etc... Le causalisme peut être scientiste (lorsque le son est rabattu sur le phénomène physique qui lui a donné naissance), ou “commun” (quotidien, quand on parle de la cause naturelle), ou encore écologiste (quand on parle de “paysage sonore”). Dans tous les cas, ces causalismes, s’ils s’accompagnent d’une absence d’intérêt pour le son lui-même, lequel est toujours différent de sa cause, procèdent d’une méconnaissance, consciente ou non, calculée ou non, et souvent induite par le langage. Même quand on est en mesure d’en “prendre conscience”, elle est une question de catégorisation, donc de nomination, donc de mot.
En d’autres termes, on n’a encore rien dit sur un son, quand on a parlé d’un son d’eau ou de vent, d’un son d’ordinateur, d’un son de piano, etc...
Les bénéfices que beaucoup trouvent à maintenir, sur le plan social et psychologique, cette méconnaissance causaliste, sont évidents : elle épargne un effort d’attention (la cause, une fois identifiée est toujours plus facilement repérable et descriptible que ne l’est le son, en l’état actuel de la culture), effort que de toutes façons la société ne valoriserait pas, le son n’étant pour elle qu’un indice de cause ou un véhicule de sens. Elle dispense d’écouter, conforte les schémas établis, et enfin permet à certains créateurs de jouer sur ce qu’on peut appeler le chantage à la cause
(tel son est donné par eux comme exceptionnel parce qu’enregistré dans un lieu extraordinaire ou inaccessible, ou sur un objet extraordinaire).
Les effets négatifs de ce causalisme, en revanche, sur le plan de la connaissance, de la recherche et de la création, sont multiples: l’auditeur, le chercheur, le compositeur “ratent” la diversité des sons que leur cache l’unicité de la cause connue (le proverbe “qui n’entend qu’une cloche n’entend qu’un son” est sur ce plan tout à fait trompeur), et inversement ils méconnaissent l’identité d’autres sons par-delà le disparate de leurs origines. Ils n’écoutent plus en effet les sons qu’à travers leur connaissance de leurs causes - donc mal, puisque très souvent, sur le plan de la dimension et du déroulement, le son n’est pas le reflet ou le compte-rendu de son histoire causale. Une action circulaire ne produit pas un son circulaire, une source volumineuse ne déclenche pas forcément un son volumineux, un choc violent n’a pas forcément pour conséquence un bruit intense, etc., et ainsi de suite.
Au cours d’une séquence du Silence de Bergman, un char d’assaut isolé arrive en pleine nuit dans la rue déserte d’une grande ville, ralentit et stoppe deux minutes devant l’hôtel où logent les héroïnes, et repart ensuite, toujours aussi énigmatique. Bergman a subtilement introduit des différences entre le bruit du tank lorsqu’il arrive (bruit cahotant, entrecoupé, brinqueballant), et celui qu’il fait lorsqu’il repart (lisse, ronronnant). La plupart des étudiants à qui cette séquence est montrée pour un exercice d’observation sonore ne prennent pas garde à cette différence : littéralement, ils n’écoutent plus
le son du tank dès que celui-ci repart, persuadé que celui-ci ne peut être qu’identique à celui qu’il faisait en arrivant.
De même, voyant dans une séquence de Playtime, de Jacques Tati, un employé arriver de très loin du fond d’un couloir, avec le bruit régulier de ses pas, d’autres en déduisent automatiquement que le son des pas va en croissant au fur et à mesure qu’il s’approche - alors que le réalisateur a introduit de subtils flux et reflux du son. Ne jamais déduire ce que l’on entend de ce que l’on voit (considéré comme la cause de ce qui est entendu) est une des règles d’or d’une bonne observation sonore.
La récusation du causalisme sonore, et par ailleurs de l’idée de “bande-son” (qui est en soi causaliste elle-même, puisqu’elle se réclame de l’existence d’un support technique unique des sons pour méconnaître la disparité des sons qu’il contient) sont les deux bases d’une véritable recherche sur le rapport audio-visuel.
Même chose dans le cadre de la recherche musicale: une notion aussi répandue que celle de “timbre” (d’un instrument) est causaliste, et son emploi en recherche musicale est une absurdité.
GOS: p. 48-50; PE: 93, 101; LS: p. 99-131
Voir: CAUSALE (ÉCOUTE), NATURALISME SONORE, RÉDUITE (ÉCOUTE)

CHRONOGRAPHIQUE (ART) (Chronographic art) (Chion, 1987)
Peuvent être dits chrono-graphiques les arts qui, tels le cinéma sonore, la vidéo dite “mono-bande” ou la musique concrète travaillent sur le temps fixé à une vitesse exacte, ce qui leur permet de faire de ce temps fixé une dimension expressive. Tout ceci dans une marge d’approximation: d’une part, la projection cinématographique comporte un certain taux de pleurage (oscillation de vitesse, plus sensible dans le son que dans l’image, avec les anciens projecteurs ou les tables de montage cinéma), et parfois elle a longtemps été changée légèrement pour sa diffusion à la télévision (passage de 24 images à 25 images par seconde), ce qui accélère les mouvements, hausse les voix et raccourcit le film.
Rappelons que le cinéma muet était tourné aussi bien que projeté à une vitesse qui n'était pas exacte et normalisée, et qu'en ce sens, s'il était bien “cinématographique” (fixant et restituant le mouvement), il n’était pas chronographique.
A-V: p. 18-19; UAS: p. 99-100
Voir: FIXATION

CLAIR-OBSCUR VERBAL (Verbal chiaroscuro) (Chion, 1990)
Il y a clair-obscur verbal lorsqu’alternativement nous comprenons et ne comprenons pas ce que disent les personnages. Soit que ce clair-obscur soit organisé et employé comme un moyen d’expression, soit qu’il résulte intentionnellement des conditions de réalisation technique ou de défauts rendant le sens des dialogues moyennement intelligible.
Le clair-obscur verbal peut-être créé aussi volontairement par des prétextes diégétiques: mélange de conversations superposées, mélange de langues différentes (Fellini), brouillages ou parasites quand les personnages communiquent téléphoniquement, présence d’un son de l’environnement fonctionnant comme “masque”, déplacements des personnages qui éloignent ou perdent périodiquement leur voix, distance, etc...
A-V: p. 153-154; LS: p. 192-193
Voir: PAROLE-ÉMANATION, VERBO-DÉCENTRÉ

CLOISONNEMENT AUDITIF (Chion, 2003)
Il y a cloisonnement auditif quand nous n’entendons pas ce que des personnages entendent, ou quand symétriquement, ils n’entendent pas tout ce que nous entendons. Il y en a aussi lorsqu’ils n’entendent pas tous la même chose, et que nous sommes comme spectateurs associés ou non à l’écoute ou à la non-écoute d’un d’entre eux.
Le cloisonnement auditif peut utiliser des prétextes diégétiques comme la présence d’un téléphone et d’écouteurs individuels dans la scène, ou d’une vitre comme obstacle transparent à la propagation du son, mais il obéit aussi à des codes symboliques: dans bien des cas, les personnages ne sont pas censés entendre la musique de *fosse ou les voix-off et les voix-intérieures des autres personnages, d’où des effets de “gags de transgression” quand ils manifestent qu’il les entendent.
Sous les toits de Paris, 1930, de René Clair, La Nuit/La notte , 1961, d’Antonioni, et bien sûr Playtime, 1967, de Jacques Tati, utilisent beaucoup la vitre comme obstacle sonore créant des cloisonnements auditifs.
UAS: p. 275-276, 281-282
Voir: SYSTÈME D’ÉCOUTE

CLOISONNEMENT/POROSITÉ (Chion, 2003)
Il y a porosité entre les espaces réels et maginaires du film, lorsqu’il y a communication, circulation entre les différents niveaux. Par exemple lorsque la musique non-diégétique de fosse reprend les thèmes que l’on entend dans la musique diégétique d’écran, ou qu’elle étoffe orchestralement la musique diégétique (scènes de comédie musicale où un personnage qui joue du piano est accompagné d’un orchestre invisible). Ou bien lorsqu’il y a recherche d’un relatif continuum acoustique entre les éléments sonores, paroles, bruits, musique (utilisation d’une ou plusieurs dimensions-pivots).
Il y a cloisonnement lorsque l’on recherche le contraire. L’esthétique juxtapositionniste née dans les années 70 pratique souvent le cloisonnement: entre la musique non-diégétique et les bruits, entre les différents styles de musiques dans un même film (chansons d’un côté, “score” original de l’autre, sans unité stylistique, ni thème commun), etc... À l’opposé, une porosité maximale était souvent recherchée dans le cinéma classique, afin d’assurer fluidité, continuité et transparence.
LS: p. 199-215; UAS: p. 125-127, 182-185
Voir: DIMENSION-PIVOT, ÉCRAN (MUSIQUE D’), FOSSE (MUSIQUE DE)

CO-ÉCOUTE (Chion, 1998)
Écoute partagée consciemment ou inconsciemment entre deux personnages, ou entre un personnage et le spectateur par rapport à un autre personnage.
Un homme et une femme qui ne se sont pas encore rencontrés entendent sans le savoir le même son - un sifflet d’agent de police - alors qu’ils sont à une certaine distance l’un de l’autre, et cela crée pour nous un lien mystérieux entre eux, comme de regarder la même étoile (Playtime, de Jacques Tati).
L’acousmatisation partagée (un personnage entend des bruits sans voir la cause et nous sommes comme lui, qu’il s’agisse de Barton Fink - 1991, des frères Cohen - dans sa chambre d’hôtel, ou du héros d’Un condamné à mort s’est échappé, de Bresson, dans sa cellule de prison), crée une complicité et une identification par co-écoute entre spectateur et personnage du fait qu’ils peuvent se poser les mêmes questions (qu’est-ce que c’est?).
On peut au contraire cloisonner à l’extrême les écoutes (souvent chez Godard, deux personnages présents dans le même décor n’entendent pas la même chose).
UAS: p. 268-269, 281-282
Voir: ACOUSMATISATION, CLOISONNEMENT AUDITIF, SYSTÈME D’ÉCOUTE

COMPLEXE (MASSE) (Complex Mass) (Schaeffer, 1967)
Un son est de masse complexe quand il ne fait pas entendre de hauteur reconnaissable et précise. Les sons de masse complexe peuvent être situés plus ou moins dans le grave ou l’aigu, mais ne peuvent pas créer entre eux, ou entre eux et un son tonique un intervalle précis. Le bruit fondamental est toujours de masse complexe.
GOS: p. 120-121; LS: p. 251-252, 277-278
Voir: BRUIT FONDAMENTAL, TONIQUE (MASSE)

CONCOMITANCE AUDIO-VISUELLE (Chion, 2003)
Situation de perception simultanée de sons et d’images, qui donne lieu obligatoirement à des effets calculés, ou non. Le terme (qui désigne, littéralement, un rapport de simultanéité entre deux faits, deux phénomènes) nous semble être le meilleur pour désigner, dans sa neutralité, ce qu’on appelle souvent plutôt le rapport audio-visuel, une formule qui, elle, présuppose obligatoirement un intention
consciente de sens, de perception, de mise en contraste, de rencontre, etc. Cette intention peut être présente dans une concomitance, mais n’est pas nécessaire pour que se produisent des effets.
Voir: SYNCHRÈSE, VERTICAUX (RAPPORTS)

CONSISTANCE (Consistency) (Chion, 1990)
Terme descriptif désignant “la façon dont les différents éléments sonores du film - voix, musiques, bruits - sont plus ou moins pris dans une même pâte globale, une texture, ou au contraire entendus chacun séparément de manière très lisible.
” (M.C., L’Audio-vision, Nathan, p.160). Pour des raisons techniques (présence d’un fort bruit de fond, monophonie, utilisation des mêmes appareils pour enregistrer tous les sons), la “pâte sonore” est très consistante dans beaucoup des premiers films parlants; également dans les films classiques, mais pour des raisons esthétiques (recherche de continuité et de fusion). Depuis les années 70 et le Dolby, on cherche plutôt à détacher les sons les uns des autres, sur le plan technique comme sur le plan esthétique, malgré des exceptions marquantes (le son très “fusionnel” de Blade Runner, de Ridley Scott).
A-V: p. 160-161; UAS: p. 184

CONTRADICTION DIT-MONTRÉ (Chion, 2003)
Un des cinq rapports dit-montré, correspondant au cas où ce que raconte la voix-offf ou le narrateur est démenti par ce qu’on voit et qui est généralement censé représenter les choses telles qu’elles se sont passées en réalité (L’Homme qui ment, 1968, d’Alain Robbe-Grillet). Ce démenti vise souvent un effet comique: un personnage se vante, tandis que l’image suscitée par la voix iconogène le montre comme un couard ou un pitre.
UAS: p. 346-347
Voir: CONTRASTE, CONTREPOINT, CREUSEMENT, ICONOGÈNE DÉMENTIE (VOIX), SCANSION

CONTRASTE DIT-MONTRÉ (Chion, 2003)
Un des cinq cas de rapport dit-montré, lorsque ce que les personnages disent contraste avec ce qu’ils font ou vont faire, sans en être le contraire. Par exemple, ils parlent de choses triviales tout en s’embrassant langoureusement (Fenêtre sur cour, d’Hitchcock).
UAS: p. 345-346
Voir: CONTRADICTION, CONTREPOINT, CREUSEMENT, SCANSION

CONTRE-CHAMP ÉVITÉ (Chion, 2003)
Il y a contrechamp évité lorsque deux personnages parlent en se faisant face ou en étant côte à côte, et qu’on ne voit pendant toute la durée de la scène ou presque que l’un des deux interlocuteurs, tout en entendant l’autre (dialogue de l’infirmière et de la doctoresse au début de Persona, de Bergman, certaines scènes de Ten, d’Abbas Kiarostami). Les films de “caméra subjective” ( la première partie des Passagers de la nuit/Dark Passage, de Delmer Daves, La Dame du lac/The Lady in the Lake, de Robert Montgomery, Le Dossier 51, 1978, de Michel Deville, La Femme défendue, de Philippe Harel) reposent la plupart du temps sur des dialogues en contre-champ évité systématique.
Le contre-champ évité a pour effet et intérêt de focaliser l’attention du spectateur sur l’impact - ou le non-impact - des paroles dites par le locuteur hors-champ sur le visage de la personne montrée.
UAS: p. 317-318, 322

Voir: PAROLE-ÉCRAN

CONTREPOINT DIT-MONTRÉ
Un des cinq rapports dit/montré, correspondant au cas où ce que les personnages font et ce qu’ils disent, ou bien ce qu’ils disent et ce qui se passe autour d’eux sont parallèles sans que les actions ponctuent les dires, et sans qu’il y ait spécialement de contraste ou de contradiction.
Les plus beaux exemples se trouvent peut-être dans les films de Tarkovski.
UAS: p. 346

Voir: CONTRADICTION, CONTRASTE, CREUSEMENT, SCANSION

COULISSE (EFFET DE) (In-the-wings effect) (Chion, 1982)
Effet créé dans le cas du cinéma à son multi-pistes (Dolby) par un son en “hors-champ absolu”, positionné “réellement” dans l’espace concret de la salle en dehors de l’écran, sur sa gauche ou sur sa droite, et se prolongeant assez longuement pour créer l’impression d’une coulisse sonore de l’écran. Cet effet, très marqué dans certains des premiers films Dolby stéréo, notamment en France (Le Choix des Armes, de Corneau) sera manié avec beaucoup plus de prudence quelques années plus tard: on évite alors, d’une part dans l’installation même des salles de placer les haut-parleurs à une place trop éloignée de l’écran, et d’autre part dans le mixage des films de faire apparaître de manière trop prolongée un son de décor sonore ou d’’”entrée de champ” (voiture entendue avant son entrée dans le champ). L’effet réapparaît, systématique et revendiqué, très intéressant pour cela, dans les années 90, avec un film comme Mère et fils, 1997, d’Alexandre Sokourov, mais aussi dans plusieurs films de genre, notamment de terreur.
A-V: p. 74-75; UAS: p. 123-125
Voir: ACOUSMATE, HORS-CHAMP

CO-VIBRATION (Chion, 1989)
Peut désigner, en acoulogie, le phénomène en vertu duquel une partie de notre corps vibre par “sympathie” avec le son, notamment pour les fréquences graves et pour certaines fréquences de la voix (au niveau du larynx). La co-vibration concerne tout ce qui dans le son touche le corps, en dehors de la fenêtre auditive proprement dite. “Certaines fréquences graves dans certaines conditions d’intensité font résonner le corps de l’auditeur par co-vibration tout en dessinant dans la “fenêtre auditive” de notre oreille une image acoustique, tandis que d’autres sons, en raison de leur intensité plus modeste et de leur fréquence élevée, se contentent de s’inscrire dans la fenêtre en question.
“(Le Promeneur Ecoutant, p. 89). On pourrait même supposer que les sensations simultanées d’image acoustique et de co-vibration corporelle ne sont identifiées l’une à l’autre et désignées du même mot de “son” - alors qu’elles sont profondément différentes - , que parce qu’elles sont le fruit de mêmes causes et se produisent simultanément.
De la même façon, une sensation lumineuse spécifique qui serait systématiquement associée en synchronisme à une sensation sonore précise, l’une ne pouvant être séparée et isolée consciemment de l’autre, serait perçue comme “la même”. Ce qu’on appelle “le” son (un singulier qui demande à être mis en question) pourrait alors être, dans certains cas précis, bi-sensoriel (touchant deux sens à la fois), ce qui serait une des raisons pour lesquelles l’investissement physique du spectateur est plus immédiat par le son que par l’image (les autres raisons étant l’impossibilité de “détourner l’écoute” comme on détourne le regard, ainsi que le caractère non directionnel du son)...
PE: p. 88-90; LS: p. 54-57
Voir: BI-SENSORIALITÉ, FENÊTRE AUDITIVE, HÉTÉROGÉNÉITÉ DU SONORE, SYNCHRÈSE

CREUSEMENT DIT/MONTRÉ (Chion, 2003)
Un des cinq rapports dit/montré correspondant au cas où les dialogues (ou une voix-off) ne font pas d’allusion à un événement ou à un détail concret significatif dans l’environnement des personnages, ou leur arrivant.
UAS: p. 342-345
Voir: CONTRASTE, CONTRADICTION, CONTREPOINT, SCANSION

CREUX (SON EN) (Phantom sound) (Chion, 1982)
Un son en creux,
dans une séquence audio-visuelle, est un son que l’image suggère mais que l’on n’entend pas, tandis que d’autres sons associés à la scène sont audibles, ce qui contribue à faire plus “sous-entendre” (en tant qu’absents) les précédents. Chez Fellini, par exemple, on entend la voix des personnages qui parlent en marchant, mais non le bruit de leur pas; ou chez Tati, dans telle scène balnéaire des Vacances de Monsieur Hulot, le son de la mer, visible au second plan, ne se fait pas entendre alors qu’on perçoit les cris des baigneurs. Dans Les Oiseaux/The Birds, de Hitchcock, des oiseaux se rassemblent derrière l’héroïne, et on n’entend pas, quand ils volent ou s’agitent, le bruit de leurs ailes.
L’image en creux, inversement, est une image précise suggérée par le son mais qui n’a pas son correspondant visible. Par exemple, dans le même film de Tati, des enfants qui jouent ou s’interpellent, et qu’on ne voit jamais. Dans une autre scène des Oiseaux, on entend les volatiles attaquer (de l’intérieur d’une maison aux volets fermés) sans les voir.
Les sons en creux, fantômes sensoriels, sont à prendre en compte dans l’analyse audio-visuelle, et leur existence confirme qu’il n’y a pas de “bande-son” constituée de tous les sons en soi considérés séparément de l’image.
VAC: p. 105-109; UAS: p. 153-154
Voir: AUDIO-DIVISUEL, BANDE-SON (IL N’Y A PAS DE), FANTÔME SENSORIEL

DÉCENTRÉE (NARRATION) (Decentered narration) (Chion, 2003)
Il y a narration décentrée lorsque ce qui est raconté par la voix-off ne recoupe pas exactement ce qu’on voit et manifeste une connaissance des faits différente et désaxée par rapport au récit. Parfois, comme dans les deux longs-métrages de Terrence Malick, La Balade sauvage/Badlands et Les Moissons du ciel/Days of Heaven, cette narration est le fait d’un personnage latéral de l’histoire, compagnon ou compagne d’un(e) des protagonistes, qui ne saisit pas la gravité de ce qui a lieu; parfois, elle peut être aussi le fait d’une voix-off hétéro-diégétique (n’appartenant pas à un personnage de l’action) qui ne voit pas ce qui se passe sur l’écran et qui suit son chemin indépendamment d’elle (la scène des essayages de Joseph Cotten au début de La Splendeur des Amberson, 1942, de Welles).
VAC: p. 58-59
Voir: ICONOGÈNE (VOIX), OFF

DÉDOUBLEMENT TEMPOREL (Chion, 2003)
Dans une séquence de cinéma sonore qui est supposée dérouler une action en continu, sans ellipse - , la superposition, très fréquente, d’un son sans ellipse ni interruption à une séquence d’images découpée en plans crée en fait un double fil temporel, et non une seule temporalité. Celle de l’image laisse le soupçon d’ellipses temporelles et d’autre part suggère un “en même temps” par le montage parallèle, tandis que le son assure la successivité d’un indiscontinu.
Voir: INDISCONTINU, TEMPORALISATION

DÉFINITION (DU SON) (Chion, 1994)
Nous appelons “définition du son” ce qu’on nomme plus couramment, mais improprement “haute-fidélité”, terme inexact et relevant de la rhétorique publicitaire. En réalité, un son “reproduit” et enregistré comporte d’innombrables différences avec le son acoustique d’origine, notamment au niveau de l’espace et de la dynamique (contrastes d’intensité, qui sont par définition beaucoup plus resserrés et “écrétés” dans les enregistrements). Ce que l’on qualifie de fidélité, et qu’il faudrait mieux appeler la définition, consiste en l’appréhension de nombreux détails - des détails créés souvent par la proximité entre la source sonore et les micros, et qui sont d’ailleurs, comme Glenn Gould l’a bien analysé, inaudibles à l’auditeur en concert, sauf si l’instrument est sonorisé.
La définition d’un son entendu par haut-parleur est notamment fonction de sa bande passante
(plus grande si l’on monte plus haut dans les aigus et si l’on descend plus bas dans les graves) , de sa dynamique (richesse et étendue des contrastes d’intensité possibles, de la plus ténue à la plus puissante), et de son étalement spatial (deux pistes ou plus, permettant d’étaler le son dans l’espace et donc de percevoir plus distinctement un certain nombre de détails). En ce sens, la définition des enregistrements sonores a certainement augmenté considérablement depuis les débuts, mais non, forcément et linéairement, leur “fidélité”.
MMT: p. 76-77; LS: p. 210-212

DÉLIAISON ACOUSTIQUE (Chion, 1990)
Effet permis par les techniques sonores de captation, fixation, amplification, remodelage, etc..., lorsqu’elles amènent à isoler et à faire varier séparément les uns des autres des caractères du son autrefois corrêlés avec d’autres : par exemple, on peut toucher à l’intensité d’un son sans que varie comme autrefois, son timbre (déliaison des valeurs acoustiques) et ainsi de suite. Ou encore, dans le monde acoustique pré-technique, un son de forte intensité (un son d’instrument de musique, par exemple) possède des propriétés sonores indissolublement liées à cette intensité, un son qui s’éloigne change en “timbre” en même temps qu’en intensité, un son qui retentit fortement est coloré d’une certaine réverbération, etc. La déliaison acoustique créée par les machines permet d’isoler ces différentes variables, donnant naissance à des sons à la lettre “inouïs” avant l’ère technologique. (Audio-vision, p. 86). Inouïs non dans le sens de la bizarrerie, mais dans leur contradiction avec les lois acoustiques dites naturelles et jusque-là incontournables.
La déliaison acoustique est source d’effets dramatiques et musicaux nouveaux .
A-V: p. 86-88; MMT: 49-50
Voir: EFFETS TECHNIQUES DE BASE

DÉSACOUSMATISATION (De-acousmatization) (Chion, 1982)
Terme volontairement négatif désignant le processus par lequel un acousmêtre se matérialise visuellement en anacousmêtre dans le champ comme un corps fini dans l’espace, et, du même coup, perd généralement les pouvoirs d’ubiquité, de panoptisme, d’omniscience, d’omnipotence, qu’on lui prête. A moins que, comme dans Le Testament du Docteur Mabuse/Das Testament des Dr Mabuse, 1932, de Fritz Lang, la désacousmatisation ne révèle la présence, derrière le rideau qui cachait la source de la voix, d’un dispositif technique reconduisant - à l’infini - le moment de la reconstitution d’un anacousmêtre.
Cette formulation négative de ce qui pourrait sembler être un processus de révélation et d’achèvement vise, d’une part, à rappeler que dans le processus quelque chose est donné comme perdu, déchu (perte des pouvoirs liés au privilège acousmatique), mais aussi que ce qui est constitué n’est pas un être plein mais un être “en creux”, audio-divisé, voix et corps, son et image, apparaissant comme ce qui ne peut jamais se compléter et se refermer sur soi-même.
VAC: p. 38-39, 41-45, 129-136; A-V: p. 110-111
Voir: ACOUSMATE, ACOUSMATISATION, ACOUSMATIQUE, ACOUSMÊTRE, ANACOUSMÊTRE, AUDIO-DIVISUEL, HORS-CHAMP

DIMENSION-PIVOT (Chion, 1998)
Aspect commun appartenant à des éléments sonores considérés comme différents de nature (parole, musique, bruit), et permettant soit de passer progressivement de l’un à l’autre, soit de les faire ressembler l’un à l’autre.
Il n’y a que trois véritables dimensions-pivots: la hauteur
de son, le rythme, et accessoirement le registre.
Hauteur:
on peut enchaîner des bruits diégétiques et des sons de musique non-diégétique parce qu’ils chantent sur une note tonique proche ou commune: beaucoup d’enchaînements de comédies musicales reposent là-dessus (le numéro “By Myself” de Tous en scène/The Bandwagon, 1953, de Vincente Minnelli, où l’orchestre démarre sur un son de grincement ferroviaire de même tonalité). De même, dans l’errance urbaine et nocturne de Jeanne Moreau dans Ascenseur pour l’échafaud, de Louis Malle, la trompette de Miles Davis commence à sonner comme un klaxon de voiture (note non vibrée), pour se continuer, vibrer, et devenir une note tenue, départ d’un solo. La musique est sortie du réel.
Rythme
: on peut enchaîner à une musique orchestrale un bruit de machine parce que ce dernier conserve le même rythme à trois temps que la musique (début du Testament du Docteur Mabuse, de Fritz Lang).
Registre
: on peut se servir des registres extrêmes pour faire entendre comme très proches voire identiques, des sons suraigus ou des sons très graves appartenant à l’environnement sonore diégétique, ou à la musique (la musique symphonique de Max Steiner plongeant dans le grave de l’orchestre pour se fondre avec un ronronnement d’avion, dans Casablanca, de Michael Curtiz, les sons suraigus de violon évoquant à la fois un cri d’oiseau et un cri humain suraigu dans Psychose, de Hitchcock)
LS: p. 191-192
Voir: TONIQUE (MASSE)

DISCORDANCE (Chion, 2003)
Effet de superposition brève ou prolongée d’une musique de fosse et d’une musique d’écran qui ne sont pas dans la même tonalité et qui jurent l‘une avec l’autre. Exemple: la scène de French Connection, 1971, de William Friedkin, où Gene Hackman et Roy Scheider attendent dehors, dans la rue, cependant que les trafiquants qu’ils filent déjeunent dans un restaurant chic. Dans le montage alterné entre les policiers à l’extérieur et ceux qu’ils surveillent à l’intérieur, une musique non-diégétique stridente de Don Ellis coiffe l’ensemble de la séquence, mais quand on est à l’intérieur du restaurant une musique diégétique de piano-bar discordante avec les notes d’Ellis se fait entendre. On entend des effets similaires dans Sauve qui peut (la vie), de Jean-Luc Godard, et Le Patient anglais/The English Patient, 1996, d’Anthony Minghella.
Variante subtile: quelqu’un pianote délicatement diégétiquement une musique qui est un peu à côté de la musique non diégétique: Harrison Ford pianotant dans Blade Runner, 1982, de Ridley Scott; Adam Sandler esquissant des notes sur un harmonium dans Punch Drunk Love, 2003, de Paul-Thomas Anderson.
Dans le triste pique-nique donné par Kane et sa femme Susan, à la fin de Citizen Kane, 1941, de Welles, le cas est différent, puisque le blues chanté par la formation engagée pour la fête est volontairement discordant et sans mesure, le chanteur (qui répète “It cant’ be love”) étant faux par rapport aux instruments, en une sorte de chaos musical parodique, faisant écho aux représentations d’opéra mal chantées dans le même film.
Voir: ÉCRAN (MUSIQUE D’), FOSSE (MUSIQUE DE)

DISSONANCE AUDIO-VISUELLE (Chion, 1990)
Effet de contradiction diégétique entre un son ponctuel et une image ponctuelle, ou entre une ambiance sonore réaliste et le cadre dans lequel on l’entend. Par exemple, dans Prénom: Carmen, de Godard, les cris de mouettes et les sons de vagues marines que Godard fait entendre sur des images nocturnes du pont d’Austerlitz, ou, pour le héros et l’héroïne de la comédie fantastique de Patrick Schulmann, Rendez-moi ma peau, 1980, de Patrick Schulmann, l’inversion sexuelle des voix. Ou bien encore le contraste d’une voix énorme et rocailleuse sur un corps minuscule, comme Tex Avery s’est amusé plusieurs fois à le faire (The Cat that Hated People, dans lequel un chaton parle avec une voix rocailleuse et véhémente). Lorsque la contradiction porte sur la dimension, il ne semble pas se produire d’effet de dissonance, mais un effet plus proche d’une monstruosité.
Le terme de dissonance nous semble plus approprié que le terme employé mal à propos, dans ce cas, de contrepoint, qui en musique concerne une superposition de lignes. Remarquons que l’effet de dissonance audio-visuelle se limite presque toujours à des cas rhétoriques pré-codés (opposition de sexe, contraste voix/corps, opposition ville/nature chez Godard, nature/culture dans le Padre Padrone, de Paolo et Vittorio Taviani, passé/science-fiction avec le “Beau Danube Bleu” du 2001 de Stanley Kubrick), et qu’il est de surcroît difficile à obtenir en raison du peu d’exigence du spectateur quant à la “vraisemblance” des sons qu’il entend associés aux images, et aussi de la puissance du processus de synchrèse pour agréger ce qu’il entend à ce qu’il voit.
MAC: 206-207; LS: p. 233
Voir: SYNCHRÈSE

ÉCRAN (MUSIQUE D’) (Screen Music) (Chion, 1984)
Correspond à ce qu’on appelle souvent “musique diégétique”, émanant d’une source existant concrètement dans le monde diégétique du film, dans le présent de la scène.
Quand il y a un doute, notamment à propos d’une chanson dont il n’y a aucune assurance qu’elle soit entendue par les personnages à partir d’une auto-radio allumée, ou d’une ambiance musicale de lieu public - on parlera de musique ”on the air”.
MAC: p. 83-84
Voir: FOSSE (MUSIQUE DE), “ON THE AIR”

EFFETS AUDIO-VISIOGÈNES (Audio-visiogenic effects) (Chion, 1998)
Effets créés par des associations de sons et d’images, et souvent, en raison de l’effet de “valeur ajoutée”, projetés sur l’image et mis au compte de cette dernière.
Les effets audio-visiogènes peuvent être classés en :
- effets de sens, d’atmosphère, de contenu;
- effets de rendu et de matière (indices sonores matérialisants), créant des sensations d’énergie, de textures, de vitesse, de volume, de température, etc.;
- effets scénographiques
concernant la construction d’un espace imaginaire (notamment par le jeu de l’extension et de la suspension, du in, du hors-champ et du off);
- effets concernant le temps et la construction d’un phrasé temporel: jeu sur la temporalisation de l’image par le son, par la création de lignes de fuite temporelles, etc..; points de synchronisation marqués, alternant plus ou moins avec des parties déliées...
LS: p. 226-234
Voir: EXTENSION, INDICE SONORE MATÉRIALISANT, LIGNE DE FUITE TEMPORELLE, PHRASÉ AUDIO-VISUEL, POINT DE SYNCHRONISATION, RENDU, SUSPENSION, TEMPORALISATION, VALEUR AJOUTÉE

EFFET DEBUREAU (Debureau effect) (Chion, 1982)
Lorsqu’un personnage est muet ou mutique dans un film, ou que l’on n’a pas encore entendu sa voix, et que la révélation de sa voix produit un effet de surprise, de déception, de contraste, etc. Nous lui avons donné ce nom à cause de l’histoire authentique du mime Debureau, dont le film de Carné-Prévert Les Enfants du Paradis , 1945, adapte l’histoire. L’effet Debureau est utilisé avec une intention comique dans Chantons sous la pluie/Singin’ in the Rain , 1952, de Gene Kelly et Stanley Donen (la voix de Lina Lamont).
VAC: p. 98-101

EFFET “KEEP SINGING” (“Keep singing effect”) (Chion, 2003)
Lorsque la présence d’une musique d’écran - souvent un chant - semble provisoirement tenir à distance le mal, le chaos, comme une manière de charme: La Nuit du chasseur/The Night of the Hunter, 1955, de Charles Laughton (le cantique chanté par Lillian Gish), Les Oiseaux, 1963, d’Alfred Hitchcock (le chant des enfants pendant l’arrivée des oiseaux), Bullitt, 1968, de Peter Yates (la musique lancinante de Lalo Schifrin avant la poursuite), Love/Women in Love, 1970, de Ken Russell (Glenda Kackson et les taureaux). Le nom que nous avons donné à cet effet est une citation d’une réplique de Love.
UAS: p. 152-153
Voir: ÉCRAN (MUSIQUE D’)

EFFET PARLOIR (Chion, 2003)
Quand deux personnages qu’on voit ensemble dans l’écran se parlent par-delà un obstacle pour se voir et/où se toucher: vitre, paravent, couverture, grillage, etc... L’effet-parloir (ainsi baptisé car sa forme la plus connue est la scène de parloir de prison) redouble le principe du découpage cinématographique en champ/contrechamp, qui est susceptible de séparer visuellement des personnages qui sont contenus dans le même espace, et en le redoublant, il le symbolise.
UAS: p. 331-333

EFFET SHINING (Chion, 1998)
Du titre du film de Kubrick qui l’a mis en valeur de manière marquante, cet effet consiste à mettre en valeur le changement sonore qui se produit sous les pas d’un marcheur ou sous les roues d’un véhicule lorsque le sol change de nature. Par exemple, dans un des épisodes de Rêves, 1990, de Kurosawa, un militaire marche d’un pas régulier sur une route - il s’enfonce dans un tunnel, en ressort plusieurs centaines de mêtres plus loin à l’air libre, et le son de ses pas toujours égaux se colore de réverbérations et de réponses différentes.
Le film de Stanley Kubrick The Shining, 1980, comporte une scène qui suscite toujours une attention ravie: c’est celle où Danny, le petit garçon, dans sa voiture à pédales parcourt les couloirs sans fin de l’hôtel Overlook. La caméra le suit à sa hauteur, et lorsque sa voiture passe sur un tapis, le bruit de roulement change et s’assourdit, puis lorsqu’elle retrouve le parquet, il change de puissance et de timbre, et ainsi de suite. Dans le cinéma parlant, en raison du “double fil temporel” de l’image et du son, l’effet Shining, qui peut être soit diégétique, soit résulter d’un montage alterné, est, comme l’effet X 27, est une représentation de l’indiscontinuité.
LS: 89-92
Voir: INDISCONTINU

EFFET X 27 (Chion, 1995)
Baptisé par référence à un film où il a été employé de manière marquante au début du parlant, Agent X 27/Dishonored , de Josef von Sternberg), cet effet, repris depuis dans de très nombreux films, consiste à faire entendre une musique diégétique (jouée par des personnages, ou entendue par radio ou disque dans l’action) alternativement proche et lointaine, à l’intérieur où elle est jouée et à l’extérieur où on l’entend étouffée, selon le découpage, avec des sauts de présence qui n’interrompent pas la continuité de la musique. L’effet X 27 se trouve employé fugitivement dans le premier film 100% parlant, Les Lumières de New-York/Lights of New York, 1928, de Bryan Foy), et il est une expression de l’indiscontinu.
MAC: p. 101, UAS: p. 55
Voir: INDISCONTINU

EFFETS TECHNIQUES DE BASE (Chion, 1994)
Nous appelons ainsi les six effets permis par les machines qui sont venus, à partir de la fin du XIXe siècle, bouleverser la production, la nature et la diffusion des sons et plus spécialement de la musique, et que nous distinguons sous les noms de : captation, amplification/ désamplification, phono-fixation, télé-phonie, phono-génération et remodelage. Ces effets, indépendants dans leur principe, sont fréquemment confondus les uns avec les autres, à cause de leur apparition plus ou moins simultanée, et en raison du fait que certains d’appareils les cumulent et les permettent simultanément - mais aussi parce que certains n’ont pas toujours été nommés.
1) Captation
-premier des six effets, la captation - consiste “par l’intermédiaire d’un ou plusieurs microphones, à convertir une partie (forcément toujours une partie) d’une vibration dite sonore, par définition éphémère et complexe ,en une autre chose qui peut être aussitôt retransmise à distance en prenant la forme d’une oscillation électrique, ou bien d’abord fixée sur support.” (Musiques, Medias, Technologie, p. 13)
2) Télé-phonie
- second des six effets, la téléphonie est la retransmission des sons à distance. A ce titre, elle est distincte de la phono-fixation, avec laquelle on la confond souvent, cette dernière, nommée “enregistrement”, étant souvent culturellement et idéologiquement présentée comme une retransmission en différé de l’événement dans sa continuité (d’où la résistance culturelle, si bien analysée par Glenn Gould, de beaucoup de mélomanes à l’idée que la plupart des enregistrements de musique classique qu’ils imaginent être des documents enregistrés en continu sont montés en studio, et le refus d’en rien savoir)...
3) Phono-fixation -
- troisième des six effets techniques de base, plus couramment appelé “enregistrement”, et désignant le procédé consistant “non seulement à “fixer” les sons existants (concert, événements de la vie et de l’histoire), mais aussi à produire, lors d’un tournage sonore, des sons spécifiquement destinés à être gravés sur le support.” (MMT, p. 16). Il n’a fallu pas moins de cinquante ans (entre 1877, date de l’invention du phonographe et 1948, invention de la musique concrète), pour que la phono-fixation conduise, grâce à Pierre Schaeffer, à l’invention d’une musique conçue sur le principe même de la fixation, et qu’il a baptisée la musique concrète. Mais entre-temps, elle était utilisée, surtout à partir de 1927, par le “synchrono-cinématographe-audio-logo-visuel”, nommé plus couramment cinéma parlant, la plupart du temps dans une intention et un contexte narratifs.
4) Phono-génération
: quatrième des six effets, consistant dans la possibilité de créer des sons “ex nihilo” à partir du haut-parleur, et de processus électriques : générateurs des années 50, synthétiseurs des années 60 et 70, ordinateur, etc...
5) Amplification/désamplification
: cinquième des six effets, concernant la modification de l’échelle d’intensité d’un son fixé (phono-fixation) ou retransmis (télé-phonie), à l’occasion de son écoute reproduite ou retransmise. Dans les premiers temps de l’enregistrement sonore, le son était plutôt désamplifié, c’est-à-dire plus “petit que nature”, notamment lorsqu’il s’agissait de la voix des chanteurs ou du son des instruments. A partir des années 20, avec l’amplification électrique, il a été plus facile de le grossir. Cependant, lorsque nous écoutons un disque d’orchestre, c’est presque toujours un son en réduction que nous écoutons, et qui n’a rien à voir avec le plein volume du son lorsque l’orchestre est devant nous en “live”.
Le son en réduction est le phénomène créé par les moyens d’enregistrement sonore mécanique, mais aussi de nos jours et à moindre titre par le téléphone, ainsi que par certains système d’écoute (baladeur), en vertu duquel un son est entendu la fois proche et réduit en volume et en fréquences... (désamplification)
6) Remodelage
: le sixième des six effets techniques de base sur les sons. Souvent appelé à tort “manipulation”, le remodelage consiste en toute action remodelant de façon significative un son fixé, quel qu’il soit, en partant du signal inscrit sur le support, pour aboutir à un autre son fixé. La chaîne des remodelages est bien sûr infinie, tout son fixé étant susceptible de devenir par remodelage la “source” d’un autre son fixé, et ainsi de suite. En raison de la coupure causale théorisée par Pierre Schaeffer, on ne peut parler dans cette chaîne d’un son originel, qui serait le germe “naturel” des étapes successives. Tout son issu par remodelage d‘un autre est un nouveau son, et les formulations de “trucage”, de “son retravaillé”, sont donc non-pertinentes.Bien entendu, le remodelage peut être créé “en direct”, soit dans le travail en studio de réalisation d’une oeuvre concrète, soit pour l’exécution d’une oeuvre “à dispositif”.
MMT: p. 13-23; LS: 199-215
Voir: SYNCHRONO-CINÉMATOGRAPHE AUDIO-LOGO-VISUEL

ÉLÉMENTS DE DÉCOR SONORE (E-D-S) (Elements of Auditory Settings, EAS) (Chion, 1990)
Dans la scénographie audio-visuelle cette expression désigne, par opposition aux sons ambiants qui sont plus ou moins continus et prolongés, les sons de source plus ou moins ponctuelle et d’apparition plus ou moins intermittente qui contribuent à peupler et à créer l’espace par petites touches distinctes et localisées, et à situer le lieu de l’action ou sa périphérie: un aboiement de chien au loin, une sonnerie de téléphone dans un bureau, etc... Selon un principe de sur-détermination que l’on retrouve à tous les niveaux dans le langage cinématographique, un élément de décor sonore peut, en même temps qu’il identifie un lieu, apporter un effet d’extension s’il est lointain (effet audio-visiogène spatial), contribuer par le moment où il est monté à la scansion d’une scène, souligner une réplique, faire écho à un regard (effets audiovisiogènes de phrasé), etc.
Les éléments de décor sonore et les sons ambiants contribuent à différencier les uns des autres les décors de l’action, à les faire contraster, en relation ou non avec des différences visuelles, rythmiques, etc...
A-V: p. 48-49
Voir: AMBIANT (SON), EXTENSION, PHRASÉ AUDIO-VISUEL, SCANSION

EMBOÎTÉE (ÉCOUTE)
Nous pouvons parler d’une écoute emboitée lorsqu’un personnage figurant dans un film écoute un son enregistré avec ou sans image, sur un magnétophone ou une table de montage, situation qui redouble celle où nous sommes devant le film. Cette écoute qui réactualise un autre temps et un autre lieu que ceux où se trouve le personnage, peut amener un retour en arrière qui n’en est pas un, qui est comme une réactualisation accompagnée ou non d’images et de visualisation (
La Dolce Vita, 1959, de Federico Fellini, La Nuit/La Notte , 1961, de Michelangelo Antonioni, Conversation secrète/The Conversation, 1974, de Francis Coppola, La Puritaine, 1986, de Jacques Doillon, La double vie de Véronique. 1990, de Krzysztof Kieslowski, etc...).

EMPATHIQUE (EFFET) (Empathetic effect) (Chion, 1984)
Effet créé par une musique qui est ou semble en harmonie avec le climat de la scène: dramatique, tragique, mélancolique, etc... Contraire: l’effet anempathique.
Cet effet empathique peut ne tenir aucunement à la musique en elle-même prise isolément, et ne se produire que dans le rapport particulier entre cette musique et la scène. Ainsi, une musique ni gaie ni triste, simplement légère et rythmée deviendra gaie associée à des images ensoleillées, et à son tour produira un effet empathique sur ces images.
A-V: p. 11-12; MAC: 228-235 ; UAS: p. 382-385
Voir: ANEMPATHIQUE (EFFET)

ERGO-AUDITION (Chion, 1993)
"Il y a (...) ergo-audition lorsque l’auditeur est en même temps, totalement ou partiellement, le responsable, conscient ou non, du son qu’il entend : jouant d’un instrument, commandant une machine ou un véhicule, émettant des bruits - de pas, de vêtements - dans ses déplacements ou ses actions, mais aussi lorsqu’il parle.
Dans cette situation se produit un feed-back particulier qui - sans un déconditionnement appris - est susceptible d’influencer l'émetteur sur la nature du son qu'il émet ou contrôle. Par exemple, on est souvent beaucoup moins conscient des bruits que l’on produit soi-même par ses déplacements et ses actions, que de ceux que produisent les autres (sauf dans la situation où l’on cherche à ne pas se faire entendre, ou au contraire où l’on cherche à attirer l’attention). Dans un cas de figure très fréquent, le conducteur d’un véhicule tend à sous-estimer le bruit que produit celui-ci.
Inversement, la situation où le son est le produit d’un effort physique direct et conscient, orienté vers la production sonore en elle-même, est source d’erreurs ou du moins de différences d’appréciation quant au résultat: ainsi le percussionniste débutant qui frappe plus fort est porté à croire que le son qui résulte de son geste est puissant, alors que c’est peut-être le contraire. De même, un chanteur novice pensera - à tort - produire un son qui porte plus loin s’il consacre plus d’effort physique à les faire sortir. Pour l’instrumentiste ou le chanteur, tout un apprentissage est nécessaire, avec l'aide de leur professeur, pour qu’ils apprennent à désolidariser leur oreille de leur main ou de leur gosier, afin de ne pas se laisser tromper par ce qu'ils font. Seules en effet l'aide d'une autre oreille, ou d'une auto-écoute critique patiemment acquise, d'une véritable éducation du rapport entre faire et entendre peuvent les en détromper.” (L.S., p. 84-85)
PE: p. 98, LS: p. 79-98
Voir: CAUSALE (ÉCOUTE)

ÉTENDUE INCERTAINE DU CHAMP D’AUDITION (Chion, 2003)
Entendant ou produisant un son, dans la réalité ou dans un film, nous ne sommes jamais certains de la portée de ce son, de la dimension de ce champ d’audition, c’est-à-dire de l’espace où il est audible. Le cinéma utilise souvent les effets dramatiques et poétiques produits par cette étendue incertaine (par exemple, lorsqu’un personnage entend une voix au téléphone, en présence d’autres personnages, et que nous ne savons pas précisément qui d’autre que lui et nous entend cette voix dans la scène)
Voir: POINT D’ÉCOUTE, TÉLÉPHÈME

EXTENSION (Extension) (Chion, 1990)
Effet audio-visiogène concernant l’espace diégétique plus ou moins large et ouvert que les sons d’ambiance et de décor sonore décrivent autour du champ visuel, comme constituant le cadre spatial géographique, humain, naturel dans lequel ce champ visuel est prélevé. Prenons un cas où le décor de l’action se limite à l’intérieur d’un lieu dont la caméra ne sort jamais ou rarement (Fenêtre sur cour, 1954, de Hitchcock, Un condamné à mort s’est échappé, 1956, de Bresson; Panic Room, 2002, de David Fincher): l’extension sera dite restreinte
lorsque les sons entendus sont uniquement ceux qui se produisent dans ce lieu fermé; plus large lorsqu’on entend hors-champ des bruits de palier ou de logements contigus, plus large encore si ceux de la rue interviennent, et toujours plus large si l’on entend des bruits lointains (sirènes de port, sifflets de train, etc...) - tout cela étant laissé au choix du réalisateur, du monteur-son, du mixeur, au fur et à mesure et selon les besoins de l’expression et de la scène. Toutes ces solutions sont assurées en effet d’être acceptées comme “naturelles” par le spectateur, mais elles contribuent à situer ce qu’il voit moment par moment par rapport à une réalité plus ou moins large, et à relier tel point de l’action à tel autre, dans un but formel narratif, expressif, dramatique, etc...
A-V: p. 76-78
Voir: HORS-CHAMP, SCÉNOGRAPHIE AUDIO-VISUELLE

EXTERNE/INTERNE (LOGIQUE) (External/Internal logic) (Chion, 1990)
On appellera logique externe
de l’enchaînement audio-visuel, par opposition à la logique interne, celle qui accuse dans les sons en particulier les effets de discontinuité, de rupture en tant qu’interventions externes au contenu représenté: montage, coupant le fil d’une image ou d’un son, ruptures, décrochements, changements brusques de vitesse, etc..., imputables à la mise en scène et aux décisions de l’instance narrative.
Par opposition, nous appelons logique interne
de l’enchaînement audio-visuel un mode d’enchaînement des images et des sons conçu pour paraître répondre à une sorte de processus organique souple de développement, de variation et de croissance, qui naîtrait de la situation même et des sons qu’elle inspire.. De nombreuses séquences de films jouent l’alternance entre logique externe et logique interne, pour des raisons de rythme et de phrasé, entre autres, car cette alternance donne au montage la même variété et la même souplesse expressive qu’en musique, l’alternance du “legato” (lié) et du “staccato” (détaché).
A-V: p. 41-42, 167

EXTRACTION UNI-SENSORIELLE (Chion, 1990)
Processus technologique par lequel les machines d’enregistrement et de reproduction visuelles et sonores, “isolent artificiellement des types de sensations (gustatives, acoustiques, etc.) qui autrefois se groupaient autour d’objets.
” (Le Promeneur écoutant., p. 178). On peut ainsi entendre un son comme isolat acoustique (le son de la mer proche) sans percevoir les sensations thermique, tactile, visuelle qui autrefois lui étaient le plus communément associées (le son de la mer proche + une certaine odeur + une certaine fraîcheur, etc..) Bien entendu, ce concept vise seulement à décrire, non à juger et encore moins à condamner (au nom d’une hypothétique solidarité “naturelle” des sensations que l’on aurait perdue) un phénomène rendu très courant par les machines.
Le principe de l’extraction uni-sensorielle se retrouve aussi dans le processus de déliaison acoustique.
P-E: p. 178; LS: p. 213-213
Voir: DÉLIAISON ACOUSTIQUE, ISOLAT ACOUSTIQUE

FANTÔME SENSORIEL (Merleau-Ponty, 1945)
Ce qui ne tombe que sous un seul sens, dans un contexte où cela pourrait toucher deux sens en même temps: dans le cinéma sonore, un objet ou un être qui bouge à l’intérieur d’une image et qui n’émet aucun son, ou un son diégétique acousmatique dont la source n’est pas visible; sont des fantômes sensoriels. Le filmage audio-visuel sauvage (caméra-vidéo avec micro incorporé) produit très communément une superposition de deux fantômes sensoriels.
A-V: p. 105-107; PE: p. 49-50; UAS: 162-164
Voir: ACOUSMATE, ACOUSMATIQUE, AUDIO-DIVISUEL, EN CREUX (SON)

FENÊTRE D’ÉCOUTE ou FENÊTRE AUDITIVE (Chion, 1988)
La “fenêtre d’écoute” est le cadre dans lequel une vibration de l’air ou de l’eau est susceptible de produire une sensation acoustique localisée dans l’oreille, sensation réifiable se signalant par des qualités acoustiques propres de hauteur, de masse, de matière, d’intensité, sans obligatoirement s’accompagner de co-vibrations dans le corps. Certains sons de fréquence medium-aigu et d’intensité moyenne, tels que les emploient des musiques classiques et certaines musiques électroacoustiques, ont pour caractéristique de ne s’adresser qu’à la fenêtre auditive et de n’éveiller aucune co-vibration, faute de basses. Ce sont des sons que les sourds ne peuvent pas ressentir. L’actrice sourde Emmanuelle Laborit parle des sons du violon comme impossibles à percevoir par elle : il s’agit donc de sons qui toucheraient spécifiquement et uniquement la fenêtre auditive.
LS: p. 53-55
Voir: BI-SENSORIALITÉ, CO-VIBRATION, HÉTÉROGÉNÉITÉ DU SONORE

FIGURATIVE (ÉCOUTE) (Chion, 1993)
Schaeffer ne fait pas la distinction entre ce qu’il appelle l’écoute causale et ce que nous qualifierions plutôt d’écoute figurative
- une écoute qui semble identique à la précédente, mais ne s’occupe pas tant de ce qui cause le son que de ce que celui-ci représente. Ainsi, écoutant des pas ou un bruit de vague que nous savons avoir été créés par un synthétiseur, nous pouvons y reconnaître la forme, le schème d’un bruit de pas ou d’un son de vague, sans être dupes de la cause réelle.
PE: 89-90; LS: p. 121-124
Voir: CAUSALE (ÉCOUTE), CAUSALISME

FIXATION DES SONS, OU SONO-FIXATION (Chion, 1988)
Plus couramment appelée enregistrement, la fixation est le “terme qui nous sert à désigner tout procédé consistant non seulement à fixer les sons existants (concert, événements de la vie et de l’histoire), mais aussi à produire, lors d’un tournage, des sons spécifiquement destinés à être gravés sur le support. La fixation du son n’a pas seulement bouleversé la musique, mais elle a aussi bouleversé le cinéma le jour où on a développé un système de synchronisation du cinématographe et de l’enregistrement phonographique. Ce qui obligeait à stabiliser la vitesse de déroulement du film à la prise de vues comme à la projection, et donc faisait du cinéma un art chronographique. Cela a donné, à partir de 1927, un genre nouveau que nous définissons comme un “synchrono-cinématographe-audio-logo-visuel”, qu’on appelle plus couramment cinéma parlant.
PE: 141-166; UAS: 202-207
Voir: CHRONOGRAPHIQUE (ART), DÉLIAISON ACOUSTIQUE, SYNCHRONO-CINÉMATOGRAPHE AUDIO-LOGO-VISUEL

FLOU NARRATIF DU SON ACOUSMATIQUE (Chion, 1998)
La plupart du temps, un son ne donne par lui-même qu’une information faible ou floue, voire dans certains cas nulle, sur sa cause - ce qui permet, dès lors qu’il est acousmatique et non-identifié, de créer des énigmes acousmatiques et des devinettes sonores. D’autre part, des événements ou causes très différents peuvent créer des sons très voisins, voire identiques. Le flou narratif n’est donc pas imputable, ou pas seulement, aux capacités limitées de détection de notre écoute, selon notre milieu d’éducation et notre expérience, mais aussi aux conditions mêmes dans lesquelles se produisent les sons, qui sont créés par des événements spécifiques, affectant une partie des objets qui les “causent”, et non pas ces objets eux-mêmes, dont le son ne peut pas donner un portrait. Dans une forêt, le grincement produit par des troncs d’arbre que le vent balance ou fait frotter les uns contres les autres (si les troncs sont rapprochés, ou si le tronc d’un arbre abattu repose contre les branches d’un autre arbre) peut être étonnamment proche du grincement d’un hamac, et le son de l’un peut très bien servir à bruiter l’autre.
PE: 112-118
Voir: ACOUSMATIQUE, CAUSALE (ÉCOUTE)

FOSSE (MUSIQUE DE) (Pit Music) (Chion, 1984)
Par opposition à la musique d’écran
, la musique de fosse (dite aussi “musique non-diégétique”) est la musique perçue comme émanant d’un lieu et d’une source en dehors du temps et du lieu de l’action montrée à l’écran.
Il y a très fréquemment passage de musique d’écran à musique de fosse, collaboration de l’un à l’autre, et souvent jeu avec l’interprétation du spectateur, amené à prendre pour musique de fosse ce qui s’avèrera rétroactivement être une musique d’écran, etc.., et à émettre des hypothèses variables.
A-V: 71-72; MAC: 189-191; UAS: 55-56, 365
Voir: ÉCRAN (MUSIQUE D’), “ON THE AIR”

HÉTÉROGÉNÉITÉ DU SONORE (Chion, 1988)
Le terme de “son”, ainsi que l’idée qu’il existe un organe réservé à l’écoute des sons, c’est-à-dire l’oreille, amène l’idée implicite que le son constituerait un domaine homogène, et que tous les éléments du son relèveraient d’un domaine de perception fermé sur lui-même et uni.
Cette idée - explicite ou implicite dans la plupart des travaux acoustiques, cognitivistes, et psychologiques sur le son - est basée sur des pré-supposés causalistes, et sur quelques autres préjugés divers. En réalité, tout dans l’acoulogie nous suggère une hétérogénéité du sonore : d’une part, par l’oreille - et le corps - passent de nombreuses perceptions trans-sensorielles
(c’est-à-dire qui ne sont d’aucun sens en particulier, comme le verbal ou le rythme) et d’autres spécifiquement auditives, comme la perception des hauteurs. D’autre part, certains sons sont en fait bi-sensoriels. L’étude du son, ou acoulogie, ne doit pas présupposer une sorte d’harmonie préétablie et de similarité ou de complémentarité naturelles entre les caractéristiques des sons, ce qui amène à conclure à une non-hétérogénéité du sonore.
PE: p. 87-88 ; LS: p. 56
Voir: CAUSALISME, CO-VIBRATION, TRANS-SENSORIALITÉ

HORIZONTAUX (RAPPORTS)
Peuvent être dits horizontaux (par opposition à verticaux) les aspects du rapport audio-visuel qui concernent la perception de sons et d’images en évolution et en mouvement à travers une certaine durée, et qui supposent que chaque élément soit considéré dans son développement temporel, notamment dans ses éventuelles lignes de fuite temporelle.
A-V: 33-37
Voir: LIGNES DE FUITE TEMPORELLE, TEMPORALISATION, VERTICAUX (RAPPORTS)

LIEU D’IMAGES ET DES SONS (UN) (Chion, 1984)
Le dispositif cinématographique peut être défini par la formule: “un lieu d’images et des sons”, formule qui, dans sa brièveté et son peu d’éclat, dit des choses précises :
1) Un
lieu d'images, et pas plusieurs. Quand on est dans le cas de projections multiples ou d'installations vidéo qui proposent des lieux d'images divers, ce n'est plus du cinéma proprement dit, c'est du multi-media, expression artistique valable mais ne répond plus à la définition du cinéma, lequel est investissement d'un lieu privilégié.
2) Un lieu
d'images, et ce terme de lieu, très courant, est ce qui pose le plus de questions. Qu'est-ce qu'un lieu, sinon une notion symbolique? Il y a un lieu pour l'homme, à partir d'un tout-partout qui est celui de la confusion, s'il peut d'abord investir des zones de façon privilégiée par rapport à d'autres : zones du corps de l'autre, zones du corps propre, zones distinctes sur ce corps, notion d'extérieur du corps discriminé par rapport à son extérieur, etc... Cela à partir d'un magma originel que nous ne pouvons définir lui-même que rétroactivement et en termes négatifs... . Du reste, le dictionnaire Robert donne du lieu une définition déjà bien formelle, le posant comme "portion déterminée de l'espace, considérée de façon générale et abstraite". Le lieu ne se réduit pas à ce qu'il enferme. Ainsi, le lieu du film ne se réduit pas au contenu des images qui défilent en lui.
Le lieu du film n'est pas non plus l'espace matériel de l'écran sur lequel le film vient à être projeté ; il est chose mentale, "cosa mentale" et il existe comme le même quelle que soit l'échelle de la projection (écran minuscule de télévision portative, ou écran géant de grande salle), se définissant en tant que proportion ( format de l'image) et en tant que découpage d'espaces réels filmés.
3) Un lieu d'images
, qui à la limite peut ne pas être habité. Dans les cas célèbres d'écran noir (comme le film de Marguerite Duras L'Homme atlantique, 1981), il reste toujours visible pour le spectateur en tant que rectangle de la projection dessiné sur l'écran par la lampe du projecteur, à travers le cadre de la pellicule noire non impressionnée.
Il n'est pas obligatoire non plus que ces images soient animées. Un autre cas-limite du cinéma est en effet le défilement d'images fixes successives , comme dans La Jetée, 1963, de Chris Marker ). Il faut et il suffit que ces images soient inscrites dans le temps d'une projection, d'un dévidement de pellicule. C'est la différence entre une photographie qu'on tient dans ses mains et un film qui serait constitué uniquement d'une projection de cette photographie pendant un temps déterminé. Nous n'aurions pas seulement l'objet photographié, mais aussi l'acte, la représentation de sa projection pendant un temps déterminé. Ensuite, autant que l'image projetée, nous aurions ce lieu de la projection, cette fenêtre, disent certains, dans laquelle, même si nous voyons toujours la même chose, par principe n'importe quoi d'autre pourrait toujours apparaître immédiatement après.
C'est assez dire que, dans la formule un lieu d'images
, l'idée de lieu est aussi importante que celle d'images venant l'occuper.
4) Un lieu d'images et
des sons; le "et", désignant une concomitance, est choisi de préférence à des termes comme : par rapport à, avec, combiné avec, etc.... , parce que justement il ne préjuge pas du type de rapport établi, et peut impliquer aussi bien la coexistence inerte, la combinaison ou l'interréaction active, l'inclusion totale du son dans l'image, etc...
5) Un lieu d’images et des sons:
la formule “des sons” indique le caractère indéfini, ouvert de la partie sonore proprement dite, non unie en une entité homogène qu’on pourrait qualifier de “bande sonore”, et non renfermée en un “cadre sonore”, puisqu’il n’y a pas de cadre sonore des sons. En raison des fluctuations variables de l’aimantation du son par l’image, selon ce que cette dernière montre ou non, et en raison de la liaison diégétique entre eux ou de la liaison par simple synchrèse - le son est, du point de vue de la localisation, dans un rapport constamment instable par rapport à l’image : soit il est inclus, soit il inclut, soit encore - troisième possibilité - il “rôde à la surface” - de sorte que l’on peut dire que le son au cinéma, est “ce qui cherche son lieu”.
Et cela se joue, pour chaque son, d’une manière spécifique - rarement globalement pour tous les sons entendus en même temps.
Voir: AIMANTATION SPATIALE, BANDE-SON (IL N’Y A PAS DE), CADRE SONORE DES SONS (IL N’Y A PAS DE), CONCOMITANCE, SYNCHRÈSE

LIGNE DE FUITE TEMPORELLE (Temporal vanishing lines) (Chion, 1998)
On peut parler de ligne de fuite temporelle
lorsqu’un certain nombre d’éléments sonores et/ou visuels sont superposés et constitués d’une manière qui laisse anticiper leur croisement, leur rencontre ou leur collision dans un certain délai de temps plus ou moins prévisible. Cette anticipation est ensuite réalisée ou évitée, et les croisements peuvent se produire plus tôt ou plus tard qu’on ne les a fait attendre. Bien entendu, il faut qu’un son ou une chaîne sonore durent un temps suffisant pour créer une ligne, une anticipation. Un son en crescendo ou en decrescendo, une mélodie avec une courbe montante ou descendante, un rythme qui s’accélère ou se ralentit de façon progressive, une phrase prononcée dont on attend le dernier mot créent des lignes de fuite temporelle.
A-V: p. 49-50; MAC: p. 208-210; LS: 231-232; UAS: 238-239
Voir: TEMPORALISATION

LINÉARISATION TEMPORELLE DES IMAGES PAR LES SONS (Linearization) (Chion, 1984)
Effet audio-visiogène concernant le sentiment d’enchaînement temporel, et constituant un phénomène de valeur ajoutée propre au cinéma parlant et à la situation d’audio-vision: des images successives, qui, dans le cinéma muet pourraient être perçues comme des aperçus divers, non successifs dans le temps, d’un même processus global (par exemple chez Eisenstein, des gros plans successifs d’ouvriers riant dans une réunion), prennent, lorsqu’ils sont accompagnés d’un son réaliste, ici celui des rires, le sens d’actions successives - le personnage du plan n°2 est perçu alors comme riant ou regardant après le personnage du plan n°1, etc...
Notre hypothèse est que la linéarisation se surimpressionne à la perception antérieure, non-chronologique, du découpage, sans la supprimer, ce qui entraîne un dédoublement temporel (l’effet en même temps/après).
A-V: p. 21; UAS: p. 235-238
Voir: DÉDOUBLEMENT TEMPOREL, VALEUR AJOUTÉE, VECTORISATION

MASQUE
Un son en gêne l’écoute d’un autre, ou suggère que sans lui on entendrait tel autre son suggéré par l’image mais non-entendu. L’effet de masque permet de créer des effets de sons en creux et des fantômes sensoriels, et aussi de faire de certains sons des bruits fondamentaux. Tout son serait suspect d’en masquer un autre.
Voir: BRUIT FONDAMENTAL, EN CREUX, FANTÔME SENSORIEL

MONTAGE VERTICAL (MYTHE DU)
Mythe théorique issu des spéculations d’Eisenstein et Poudovkine, et concernant l’effet de montage que pourraient produire une image et un son simultanés.
La superposition d’une image qui montre quelque chose et d’un son qui fait entendre autre chose ne produit pas un effet analogue à celui du montage entre les images, pour trois raisons au moins:
- il y a superposition et non succession, rendant impossible la perception séparée et la non-contamination perceptive des éléments, et créant des effets de valeur ajoutée;
- il y a absorbtion partielle des sons et des images dans un même espace-temps;
- les sons et les images sont de nature trop différentes pour être commensurables.
Le manifeste des Trois Russes avait préconisé la confrontation entre quelque chose que l’on voit et quelque chose que l’on entend simultanément, et qui est différent. Le problème n’est pas qu’on ait jeté cette idée aux orties, et qu’on en soit resté à une permanente redondance audio-visuelle, comme beaucoup le disent encore; il est plutôt que le “montage vertical,” si tant est que cette expression soit juste, est au contraire tellement pratiqué et banalisé que plus personne ne s’aperçoit de son emploi. N’importe quel téléspectateur qui suit le dialogue d’une série télévisée, tout en admirant le décor et le physique des personnages, ne pense pas une seconde que déjà à ce simple niveau, ce qu’il entend ne peut aucunement se déduire de ce qu’il voit, et vice-versa.
UAS: p. 192-195
Voir: REDONDANCE

NATURALISME SONORE (Chion, 1989)
Doctrine implicite dans la plupart des discours actuels et dans les pratiques techniques, culturelles, sociales, etc.., le naturalisme sonore considère le son comme une sorte de donné naturel entretenant une relation également “naturelle” avec son milieu d’origine. Notamment, par le mythe de la narrativité spontanée du son - qui raconterait de lui-même sa ou ses causes, transporterait et reflèterait l’environnement dont il est issu, et dont il existerait un état “naturel” ou authentique - acoustique -, dont le son enregistré (que nous appelons pour ce qui nous concerne fixé) serait une “trace” “truquée” ou “déformée”.
L’acoulogie ne peut se fonder qu’en critiquant radicalement le naturalisme sonore...
PE: p.94-98; LS: p. 27-28
Voir: CAUSALISME, FLOU NARRATIF DU SON ACOUSMATIQUE

ICONOGÈNE DÉMENTIE (VOIX) (Chion, 2003)
Lorsque l’image dément la voix iconogène, l’effet visé est souvent comique (Chantons sous la pluie/Singin’ in the Rain, 1952, de Gene.Kelly et Stanley Donen, mais pas toujours: comme, dans Hiroshima mon amour, 1959, d’Alain Resnais, le “tu n’as rien vu à Hiroshima” répété par la voix de l’amant japonais, cependant que l’on voit les images de l’horreur.
UAS: p. 346-347
Voir: CONTRADICTION, ICONOGÈNE (VOIX), PAROLE-TEXTE

IDENTIFIÉE/NON IDENTIFIÉE (ÉCOUTE) (Chion, 1991)
L’écoute acousmatique identifiée est celle qui, par la vision, la nomination, la déduction logique ou tout autre moyen d'identification offre à l'auditeur le moyen de reconnaître (ou de croire reconnaître) la source du son qu'il écoute lorsqu’elle s’accompagner d’une information supplémentaire non sonore (vision, information verbale, connaissance du contexte, etc.). L'écoute acousmatique non identifiée (exemple : un son à la radio et dont la source est inconnue de l'auditeur; ou un correspondant téléphonique anonyme) est bien sûr le contraire.
Cette différence est importante à poser, parce que l’'écoute causale du son est fondamentalement différente selon l'un ou l'autre cas. Dans le premier, elle projette sur le son les connaissances ou les suppositions qui lui viennent d‘une autre source que ce son lui-même (j’entends un pas dans la chambre à côté; logiquement, ce ne peut être que la personne qui partage l’appartement avec moi; j’entends donc le pas de cette personne et la visualise mentalement). Dans le second, l’écoute est livrée aux seuls indices sonores, et s’avère souvent être à la fois très précise sur certains plans (repérant de menues variations dans une activité de frottement) et très imprécise sur d’autres (elle ignore totalement quoi frotte sur quoi).
Nous nous trouvons beaucoup plus fréquemment dans un contexte d’écoute identifiée que non identifiée, ce qui ne nous permet pas, dans les conditions habituelles, de “tester” l’écoute causale pure non identifiée.
LS: p. 118-120
Voir: CAUSALE (ÉCOUTE)

“IN”
Dans un rapport audio-visuel, désigne, selon l’acception particulière que nous avons donnée à cette expression, le rapport où se trouve un son dont la source concrète est visible en même temps dans l’écran, et correspond à une réalité diégétique présente et visible.
UAS: 223-234
Voir HORS-CHAMP, OFF

INDISCONTINUITÉ (Chion, 2003)
Néologisme à négation double (comme “acousmêtre” ou “désacousmatisation”) désignant le rendu de la continuité (continuité de temps, d’action, de perception) par son interruption même ou par son intermittence, notamment dans les sons.
UAS: p. 55, 305
Voir: EFFET X 27, EFFET SHINING

INDICES SONORES MATÉRIALISANTS, M.S.I. (Materializing Sound Indices, M.S.I.) (Chion, 1990)
Désigne un aspect d'un son, quel qu'il soit, qui fait ressentir plus ou moins précisément la nature matérielle de sa source et l'histoire concrète de son émission: sa nature solide, aérienne ou liquide, sa consistance matérielle, les accidents survenant dans son déroulement, etc... Un son comporte plus ou moins d’indices sonores matérialisants, et à la limite pas du tout. Pour un son de voix (parole, sons vocaux non verbaux), l’i.s.m. peut consister dans la présence d’une respiration audible entre les phrases (Stalker, 1979, de Tarkovski, L’humanité, 1999, de Bruno Dumont), d’un raclement de gorge avant de parler (le personnage de Victor dans Le Sacrifice/Offret, 1986, du même réalisateur), dans une raucité de la voix ou un voile (films italiens), de bruits de bouche, etc...
Pour un bruit, l’i.s.m. peut consister en détails de crissements, froissements, raclements, à-coups, etc. (films de Bresson, de Tarkovski, mais aussi d’action et de science-fiction comme Alien, 1979, de Ridley Scott).
Pour une musique, il peut consister en notes fausses sur un piano, en présence du souffle de l’instrumentiste pour les instruments à vent, en irrégularités et “défauts” d’exécution, en petites bruits de fonctionnement (impact des ongles d’un pianiste sur les touches du clavier, claquement des clefs sur une flûte traversière, glissement des doigts sur les cordes dans la guitare dite sèche, etc...).
L’accent mis ou non sur des i.s.m. commande notamment l’interprétation que fait le spectateur sur le statut d’une musique acousmatique comme “hors-champ” (non-diégétique), s’il y en a beaucoup, ou “off” (non-diégétique) s’il n’y en a pas.
A-V: p. 98-100; LS: p. 102-103, 228; UAS: p. 219-220
Voir: HORS-CHAMP, RENDU

IN SITU (ÉCOUTE) / SUR ENREGISTREMENT (ÉCOUTE) (Chion, 1989)
L’écoute “in situ” est l’écoute de sons dans les lieux et le moment où ces sons se produisent pour la première fois, et notamment en présence et éventuellement en association avec la vision de leur cause acoustique. Cette écoute possède certaines caractéristiques qui la rendent différente d’une écoute sur enregistrement : d’une part elle n’est pas répétable (les sons s’évanouissant au fur et à mesure); d’autre part, elle est influencée par l’ensemble du contexte (situation, vision, déplacements et actions de l’auditeur). Troisièmement elle ne peut pas appréhender tous les éléments sonores comme un tout, comme un tableau et en une seule fois, et elle demeure toujours ponctuelle. Notamment, elle est le plus souvent inattentive à la rumeur de fond, et enfin elle se “promène” entre les différents éléments sonores. Il est psycho-physiologiquement impossible, en écoute in situ, de “totaliser” notre écoute, ou si l’on veut d’écouter tout à la fois en même temps, en plan général.
Sauf peut-être dans le cas de la musique - et encore d’une musique qui lui est familière -, l’écoute “in situ” ne s’intéresse jamais à plus d’un son à la fois, et elle est inattentive aux simultanéités. D’ailleurs, il est plus facile de “totaliser” une musique qu’on écoute dans le cadre d’une audition de disque (ou radiophonique) que dans la salle de concert, in situ.
A l‘inverse, l’écoute du son sur enregistrement
- à condition qu’elle reste acousmatique et qu’elle ne soit pas replacée dans un cadre audio-visuel (cinéma) qui l’influencerait visu-auditivement - devient plus sensible au rapport figure/fond, en même temps qu’elle peut s’attacher aux détails puisque l’enregistrement permet une multi-écoute, et de revenir sur tel moment du son...
La mise en évidence que nous faisons des différences entre l’écoute in situ
et l’écoute sur enregistrement fait apparaître la faiblesse de toutes les démarches et recherches (comme celles de Muray Shafer) qui prétendent s’intéresser au son, le décrire et le recréer, sans préciser dans quel cas de figure on se trouve - ce qui témoigne qu’elles assimilent implicitement, comme “pareilles”, l’écoute in situ et l’écoute sur enregistrement. Ces démarches (souvent d’inspiration écologiste) scotomisent les effets liés à la fixation et à la retransmission, ne veulent rien savoir de ce qui est profondément changé lorsqu’on n’est plus dans l’écoute in situ, et elles font “comme si” le son enregistré était une trace fiable du perçu sonore de l’événément.
PE: p. 80-86; LS: p. 312-313

Voir: FIXATION

INSUBSTANTIALITÉ DU SON (Chion, 1989)
Le son, à part de rares cas où il est un phénomène stable et constant, est un élément entièrement lié au temps et changeant constamment en intensité, fréquences, qualités spatiales, etc... de sorte que parler du son comme d’une matière douée de propriétés stables telles qu’une certaine hauteur, une certaine intensité, est insatisfaisant. “Substantialiser le son, en faire une matière dotée de propriétés diverses selon ses différentes zones de fréquences (les graves auraient tel effet et les aigus tel autre), ainsi que le prétendent des médecins, musicothérapeutes ou psychologues réputés, est une position simplificatrice. Car il semble que ce ne soit pas tant la substance du son qui compte, en l’affaire, que ses modulations, sa palpitation, sa courbe kinétique, ses informations, etc., Toutes choses qui, se définissant comme des variations dans le temps et l’espace, peuvent être considérées comme transposables au moins partiellement dans d’autres cadres sensoriels.
” (Le Promeneur écoutant, p. 81). Le son n’est comparable à une substance que dans certains cas bien précis, que ceux-ci soient naturels (celui d’un son permanent - un torrent - entendu dans des conditions également permanentes - par quelqu’un qui ne bouge pas), ou culturels (certaines musiques créant une “matière sonore” statistiquement continue). Quoi qu’il en soit, ces cas restent largement minoritaires dans notre expérience auditive.
PE: p. 80-86
Voir: HÉTÉROGÉNÉITÉ DU SONORE

INTERNE (OBJECTIF, SUBJECTIF) (SON)
Se dit des sons entendus réellement ou imaginairement par un personnage et par lui seul, sans que les autres personnages éventuellements présents soient censés les entendre.
On peut distinguer les sons internes objectifs (respirations des personnages, battements de coeur), et les sons internes subjectifs (voix mentales, son-réminiscence, conversations imaginées, comme dans Psychose, de Hitchcock).
Le propre des sons internes-objectifs est que nous n’avons pas de repères précis sur leur audibilité par les autres personnages: dans Elephant Man, de David Lynch, le docteur Treves entend-il aussi fort que nous la respiration angoissée de l’homme-éléphant sous sa cagoule? Cette application de l’étendue incertaine du champ d’audition, amenant un trouble de la distinction interne/externe, monde réel/monde subjectif, est propre au cinéma.
A-V: 67
Voir: CLOISONNEMENT AUDITIF, ÉTENDUE INCERTAINE DU CHAMP D’AUDITION

ITÉRATIF (SON) (Pierre Schaeffer, 1967)
Se dit d’un son caractérisé par la répétition rapide de sons brefs distincts (ou “impulsions”) formant comme une ligne de pointillés sonores.
GOS: p. 119; LS: p. 247-248; UAS: p. 45-46


LIEU D’IMAGES ET DES SONS (UN) (Chion, 1984)
Le dispositif cinématographique peut être défini par la formule: “un lieu d’images et des sons”, formule qui, dans sa brièveté et son peu d’éclat, dit des choses précises :
1) Un
lieu d'images, et pas plusieurs. Quand on est dans le cas de projections multiples ou d'installations vidéo qui proposent des lieux d'images divers, ce n'est plus du cinéma proprement dit, c'est du multi-media, expression artistique valable mais ne répond plus à la définition du cinéma, lequel est investissement d'un lieu privilégié.
2) Un lieu
d'images, et ce terme de lieu, très courant, est ce qui pose le plus de questions. Qu'est-ce qu'un lieu, sinon une notion symbolique? Il y a un lieu pour l'homme, à partir d'un tout-partout qui est celui de la confusion, s'il peut d'abord investir des zones de façon privilégiée par rapport à d'autres : zones du corps de l'autre, zones du corps propre, zones distinctes sur ce corps, notion d'extérieur du corps discriminé par rapport à son extérieur, etc... Cela à partir d'un magma originel que nous ne pouvons définir lui-même que rétroactivement et en termes négatifs... . Du reste, le dictionnaire Robert donne du lieu une définition déjà bien formelle, le posant comme "portion déterminée de l'espace, considérée de façon générale et abstraite". Le lieu ne se réduit pas à ce qu'il enferme. Ainsi, le lieu du film ne se réduit pas au contenu des images qui défilent en lui.
Le lieu du film n'est pas non plus l'espace matériel de l'écran sur lequel le film vient à être projeté ; il est chose mentale, "cosa mentale" et il existe comme le même quelle que soit l'échelle de la projection (écran minuscule de télévision portative, ou écran géant de grande salle), se définissant en tant que proportion ( format de l'image) et en tant que découpage d'espaces réels filmés.
3) Un lieu d'images
, qui à la limite peut ne pas être habité. Dans les cas célèbres d'écran noir (comme le film de Marguerite Duras L'Homme atlantique, 1981), il reste toujours visible pour le spectateur en tant que rectangle de la projection dessiné sur l'écran par la lampe du projecteur, à travers le cadre de la pellicule noire non impressionnée.
Il n'est pas obligatoire non plus que ces images soient animées. Un autre cas-limite du cinéma est en effet le défilement d'images fixes successives , comme dans La Jetée, 1963, de Chris Marker ). Il faut et il suffit que ces images soient inscrites dans le temps d'une projection, d'un dévidement de pellicule. C'est la différence entre une photographie qu'on tient dans ses mains et un film qui serait constitué uniquement d'une projection de cette photographie pendant un temps déterminé. Nous n'aurions pas seulement l'objet photographié, mais aussi l'acte, la représentation de sa projection pendant un temps déterminé. Ensuite, autant que l'image projetée, nous aurions ce lieu de la projection, cette fenêtre, disent certains, dans laquelle, même si nous voyons toujours la même chose, par principe n'importe quoi d'autre pourrait toujours apparaître immédiatement après.
C'est assez dire que, dans la formule un lieu d'images
, l'idée de lieu est aussi importante que celle d'images venant l'occuper.
4) Un lieu d'images et
des sons; le "et", désignant une concomitance, est choisi de préférence à des termes comme : par rapport à, avec, combiné avec, etc.... , parce que justement il ne préjuge pas du type de rapport établi, et peut impliquer aussi bien la coexistence inerte, la combinaison ou l'interréaction active, l'inclusion totale du son dans l'image, etc...
5) Un lieu d’images et des sons:
la formule “des sons” indique le caractère indéfini, ouvert de la partie sonore proprement dite, non unie en une entité homogène qu’on pourrait qualifier de “bande sonore”, et non renfermée en un “cadre sonore”, puisqu’il n’y a pas de cadre sonore des sons. En raison des fluctuations variables de l’aimantation du son par l’image, selon ce que cette dernière montre ou non, et en raison de la liaison diégétique entre eux ou de la liaison par simple synchrèse - le son est, du point de vue de la localisation, dans un rapport constamment instable par rapport à l’image : soit il est inclus, soit il inclut, soit encore - troisième possibilité - il “rôde à la surface” - de sorte que l’on peut dire que le son au cinéma, est “ce qui cherche son lieu”.
Et cela se joue, pour chaque son, d’une manière spécifique - rarement globalement pour tous les sons entendus en même temps.
Voir: AIMANTATION SPATIALE, BANDE-SON (IL N’Y A PAS DE), CADRE SONORE DES SONS (IL N’Y A PAS DE), CONCOMITANCE, SYNCHRÈSE

LIGNE DE FUITE TEMPORELLE (Temporal vanishing lines) (Chion, 1998)
On peut parler de ligne de fuite temporelle
lorsqu’un certain nombre d’éléments sonores et/ou visuels sont superposés et constitués d’une manière qui laisse anticiper leur croisement, leur rencontre ou leur collision dans un certain délai de temps plus ou moins prévisible. Cette anticipation est ensuite réalisée ou évitée, et les croisements peuvent se produire plus tôt ou plus tard qu’on ne les a fait attendre. Bien entendu, il faut qu’un son ou une chaîne sonore durent un temps suffisant pour créer une ligne, une anticipation. Un son en crescendo ou en decrescendo, une mélodie avec une courbe montante ou descendante, un rythme qui s’accélère ou se ralentit de façon progressive, une phrase prononcée dont on attend le dernier mot créent des lignes de fuite temporelle.
A-V: p. 49-50; MAC: p. 208-210; LS: 231-232; UAS: 238-239
Voir: TEMPORALISATION

LINÉARISATION TEMPORELLE DES IMAGES PAR LES SONS (Linearization) (Chion, 1984)
Effet audio-visiogène concernant le sentiment d’enchaînement temporel, et constituant un phénomène de valeur ajoutée propre au cinéma parlant et à la situation d’audio-vision: des images successives, qui, dans le cinéma muet pourraient être perçues comme des aperçus divers, non successifs dans le temps, d’un même processus global (par exemple chez Eisenstein, des gros plans successifs d’ouvriers riant dans une réunion), prennent, lorsqu’ils sont accompagnés d’un son réaliste, ici celui des rires, le sens d’actions successives - le personnage du plan n°2 est perçu alors comme riant ou regardant après le personnage du plan n°1, etc...
Notre hypothèse est que la linéarisation se surimpressionne à la perception antérieure, non-chronologique, du découpage, sans la supprimer, ce qui entraîne un dédoublement temporel (l’effet en même temps/après).
A-V: p. 21; UAS: p. 235-238
Voir: DÉDOUBLEMENT TEMPOREL, VALEUR AJOUTÉE, VECTORISATION

MASQUE
Un son en gêne l’écoute d’un autre, ou suggère que sans lui on entendrait tel autre son suggéré par l’image mais non-entendu. L’effet de masque permet de créer des effets de sons en creux et des fantômes sensoriels, et aussi de faire de certains sons des bruits fondamentaux. Tout son serait suspect d’en masquer un autre.
Voir: BRUIT FONDAMENTAL, EN CREUX, FANTÔME SENSORIEL

MONTAGE VERTICAL (MYTHE DU)
Mythe théorique issu des spéculations d’Eisenstein et Poudovkine, et concernant l’effet de montage que pourraient produire une image et un son simultanés.
La superposition d’une image qui montre quelque chose et d’un son qui fait entendre autre chose ne produit pas un effet analogue à celui du montage entre les images, pour trois raisons au moins:
- il y a superposition et non succession, rendant impossible la perception séparée et la non-contamination perceptive des éléments, et créant des effets de valeur ajoutée;
- il y a absorbtion partielle des sons et des images dans un même espace-temps;
- les sons et les images sont de nature trop différentes pour être commensurables.
Le manifeste des Trois Russes avait préconisé la confrontation entre quelque chose que l’on voit et quelque chose que l’on entend simultanément, et qui est différent. Le problème n’est pas qu’on ait jeté cette idée aux orties, et qu’on en soit resté à une permanente redondance audio-visuelle, comme beaucoup le disent encore; il est plutôt que le “montage vertical,” si tant est que cette expression soit juste, est au contraire tellement pratiqué et banalisé que plus personne ne s’aperçoit de son emploi. N’importe quel téléspectateur qui suit le dialogue d’une série télévisée, tout en admirant le décor et le physique des personnages, ne pense pas une seconde que déjà à ce simple niveau, ce qu’il entend ne peut aucunement se déduire de ce qu’il voit, et vice-versa.
UAS: p. 192-195
Voir: REDONDANCE

NATURALISME SONORE (Chion, 1989)
Doctrine implicite dans la plupart des discours actuels et dans les pratiques techniques, culturelles, sociales, etc.., le naturalisme sonore considère le son comme une sorte de donné naturel entretenant une relation également “naturelle” avec son milieu d’origine. Notamment, par le mythe de la narrativité spontanée du son - qui raconterait de lui-même sa ou ses causes, transporterait et reflèterait l’environnement dont il est issu, et dont il existerait un état “naturel” ou authentique - acoustique -, dont le son enregistré (que nous appelons pour ce qui nous concerne fixé) serait une “trace” “truquée” ou “déformée”.
L’acoulogie ne peut se fonder qu’en critiquant radicalement le naturalisme sonore...
PE: p.94-98; LS: p. 27-28
Voir: CAUSALISME, FLOU NARRATIF DU SON ACOUSMATIQUE

NON-ICONOGÈNE (VOIX OU RÉCIT) (Chion, 2003)
Il y a voix ou récit non-iconogène quand un récit est fait dans un film par un personnage, qu’on ne montre que le narrateur et son auditoire, et qu’aucune autre image ne vient “illustrer” ce récit ou en prendre la suite, alors même que le cinéma donne cette possibilité et en use abondamment. Le récit non-iconogène correspond souvent dans les films au “moment de vérité”, ou renvoie à une scène fondatrice pour les personnages, celle qui se transmet par le langage seule.
UAS: p. 354-358
Voir: ICONOGÈNE (VOIX), PAROLE-TEXTE

OBJET-SON ou SON-OBJET (Chion, 1993, d’après “objet sonore”, Schaeffer; années 50)
Terme proposé pour désigner ce que Schaeffer appelle “objet sonore”, (c’est-à-dire une unité sonore quelconque perçue pour elle-même dans une écoute réduite, indépendamment de sa cause et de son sens, et qualifiée par des critères sonores), tout en étendant le sens de cette expression. Ce terme d’objet-son pourrait permettre de poser que c’est le son qui est ici l’objet et que la dimension du sonore n’est pas un “prédicat” de cet objet (comme le suggère la forme substantif/adjectif choisie par Schaeffer). D’autre part, l’objet-son est défini comme objet commun des différents types d’écoute (causale, réduite, sémantique, etc...) et pas seulement comme l’objet de la seule écoute “réduite”, ce qui est le cas de l’objet sonore schaefferien.
LS: p. 312-315

Voir: RÉDUITE (ÉCOUTE)

OFF
Dans un rapport audio-visuel, désigne, selon l’acception que nous avons introduite, un son dont la source non seulement n’est pas visible en même temps sur l’écran, mais en même temps est supposée appartenir à un autre temps et un autre lieu, réel ou imaginaire, que la scène montrée à l’écran. Les cas les plus fréquents de sons “off” sont les voix de narrateurs ou de commentateurs parlant après
les évènements montrés, ainsi que la musique d’accompagnement du film dite “de fosse”. Les sons off sont non-diégétiques et acousmatiques.
UAS: p. 234
Voir: ACOUSMATIQUE, FOSSE (MUSIQUE DE), IN, HORS-CHAMP

“ON THE AIR” (SONS, MUSIQUES) (Chion, 1990)
Dans une fiction audio-visuelle, voire une séquence de film documentaire, on appellera sons “on the air” (“sur les ondes”) les sons présents dans une scène mais supposés être retransmis électriquement, par radio, téléphone, interphone, amplification électrique, etc..., ce qui les fait échapper aux lois mécaniques (dites naturelles) de propagation du son, et franchir librement l’espace, tout en restant situés dans le temps réel de la scène. Ils peuvent alors voyager librement, quand il s’agit de la musique et plus particulièrement d’une chanson, d’une position d’écran à une position de fosse. Le jeu consiste souvent à faire émettre au spectateur des hypothèses changeantes au cours de la scène, en jouant sur la présence plus ou moins forte de la chanson, son autonomie plus ou moins grande par rapport au montage, à l’espace diégétique. Cette chanson - spécule le spectateur durant le téléphème entre Louise et Jimmy dans Thelma et Louise, 1991, de Ridley Scott - vient probablement d’une radio dans la pièce (hypothèse 1)? Non, se dit-il, elle est plutôt “off” puisque je l’entends sur le montage parallèle des deux personnages se parlant à distance au téléphone (hypothèse 2). Tiens, ne serait-elle pas entendue par un tiers personnage, Thelma, dans son baladeur, quand elle se détend au bord d’une piscine (hypothèse 3). Non finalement elle est une chanson non-diégétique puisque je l’entends au premier plan, et que je n’entends plus aucun son de l’action (hypothèse 4).
L’important est de voir qu’ici aucune hypothèse nouvelle n’annule rétroactivement les précédentes; toutes sont successivement vraies, puisqu’on nous les a fait justement émettre à tel moment.
A-V: p. 68-70
Voir: ÉCRAN (MUSIQUE D’), FOSSE (MUSIQUE DE), TÉLÉPHÈME

PAROLE-CAMERA (Chion, 1999)
Parole émise par un personnage qui regarde en face la caméra, et s’adresse verbalement “à nous”, à travers ou non la médiation d’un auditoire diégétique, voire d’une caméra elle-même présente dans l’action.. La parole-caméra sans prétexte diégétique s’est répandue dans le cinéma: LHeure du loup, 1968, de Bergman, Stalker, 1979, de Tarkovski (la tirade de la femme du Stalker), La Femme d’à côté, 1981, de François Truffaut, Vers le sud, 2006, de Laurent Cantet, Dans Paris, 2006, de Christophe Honoré, etc.
UAS: p. 318-320
Voir: PAROLE-ÉCRAN

PAROLE-ÉCRAN (Chion, 1999)
Parole acousmatique adressée depuis le off ou le hors-champ à un personnage qui est dans l’écran, et qu’elle interpelle ou commente, parfois ironiquement ou agressivement, ou bien comme pour influencer son comportement. Cette parole peut venir d’un personnage de la diégèse, ou d’un personnage “off”. Le parti pris de la caméra subjective, quand il est généralisé à tout un film (de La Dame du Lac/The Lady in the Lake, 1948, à La Femme défendue, 2000, de Philippe Harel) crée de nombreuses situations de parole-caméra.
UAS: p. 318-320
Voir: PAROLE-CAMÉRA

PAROLE-ÉMANATION (Emanation speech) (Chion, 1990)
La parole-émanation correspond au cas où le dialogue est une sorte de sécrétion des personnages, un aspect complémentaire de leur façon d’être ou un élément de leur silhouette, mais aussi où il n’est pas ce qui contribue à faire avancer le film et ne commande pas le découpage cinématographique, lequel néglige d’en renforcer les divisions et les points forts, la succession des plans se produisant selon une logique extérieure aux propos tenus.
Dans le cas de la parole-émanation, les propos ne sont souvent que partiellement intelligibles. Mais la parole-émanation peut être créée par d’autres procédés que la semi-intelligibilité: chez Fellini ou Tarkovski, par exemple, les mots sont généralement compréhensibles de bout en bout mais ils ne sont pas renforcés par le découpage (grosseur de plan, cadrage, montage), ou par le jeu des acteurs (jeux de scène), etc., ce qui suffit à faire un cinéma qu’on peut appeler verbo- et voco-décentré.
La parole-émanation fait apparaître la parole comme une expression parmi d’autres du monde sensoriel, que ce soit par des partis pris de découpage, de cadrage, de montage, qui décentrent l’attention en la partageant entre les dialogues et d’autres éléments significatifs qui ne renforcent pas la perception du texte (chez Fellini ou Tarkovski), ou que ce soit par diverses techniques de “mise à distance” du texte, plus ou moins partiellement inintelligible ou - ce qui revient au même - polyglotte (Tati, Iosseliani, Ophuls, parfois Visconti). En aucun cas, contrairement à un cliché répandu, la parole-émanation, dans la plupart des films qui l’utilisent, n’implique que les mots prononcés sont un bruit et n’ont pas d’importance.
A-V: p. 149-153; UAS: 46-47, 65-66
Voir PAROLE-TEXTE, PAROLE-THÉÂTRE, VERBO-DÉCENTRÉ

PAROLE-TEXTE (Textual speech) (Chion, 1990)
La parole-texte correspond au cas où le son des paroles a une valeur de texte en soi, capable de mobiliser, par le simple énoncé d’un mot ou d’une phrase, les images ou même les scènes de ce qu’il évoque. Ce niveau de texte est généralement réservé à des voix-off de narration, mais il peut arriver aussi qu’il sorte de la bouche de personnages en action, cette parole iconogène tendant à nier la consistance même de l’univers diégétique cinématographique, qui ne deviendrait plus qu’images qu’on feuillette au gré des phrases et des mots le cinéma parlant, qui été fasciné au début par ses possibilités, s’est mis par la suite à l’employer, sauf exceptions célèbres (Le Roman d’un tricheur, 1936, de Guitry) de manière prudente et limitée : la parole-texte n’y règne que quelques minutes à chaque fois dans un film. Les années 90 ont vu un retour spectaculaire de la parole-texte (Toto le héros, 1991, de Jako van Dormaël, Les Affranchis/Goodfellas, 1990, de Martin Scorsese, The Usual suspects, 1995, de Bryan Singer, Le fabuleux destin d’Amélie Poulain, 2001, de Jean-Pierre Jeunet).
A-V: p. 145-148; UAS: p. 65-70
Voir ICONOGÈNE (VOIX), PAROLE-ÉMANATION, PAROLE-THÉÂTRE

PAROLE-THÉÂTRE (Theatrical speech) (Chion, 1990)
La parole-théâtre
est le plus classique et le plus répandu des trois cas d’’implication de la parole au cinéma. On peut parler de parole-théâtre lorsque les personnages échangent des dialogues entendus intégralement par le spectateur, qui sont significatifs par rapport à l’action, en même temps qu’ils révèlent humainement, socialement, affectivement, etc., ceux qui les prononcent, serait-ce par le biais du mensonge, du silence ou de la dissimulation, mais sans que ces paroles aient pouvoir sur la réalité montrée. Dans la plupart des films, ce dialogue est à ce point central que ses articulations organisent le découpage filmique. La parole-théâtre se trouve aussi bien dans le cinéma verbo-centré que dans le cinéma verbo-décentré.
A-V: p. 144; UAS: p. 64
Voir PAROLE-ÉMANATION, PAROLE-TEXTE, VERBO-CENTRÉ (CINÉMA), VERBO-DÉCENTRÉ (CINÉMA)

PHRASÉ AUDIO-VISUEL (Audio-visual phrasing) (Chion, 1990)
Tout ce qui dans une séquence de film concerne le découpage du temps et du rythme - par respirations, points d’attention, ponctuations, repos, cristallisations temporelles, lignes de fuite temporelles, anticipations, détentes - construit ce qu’on peut appeler le phrasé audio-visuel. Ce phrasé audio-visuel est notamment déterminé par :
- la temporalisation, la linéarisation et la vectorisation de l’image par le son;
- la détermination et la répartition des éventuels points de synchronisation, le rythme des liaisons et des déliaisons entre son et image, alternativement noués et dénoués, parallèles ou divergents;
- la construction des lignes de fuite temporelle et le jeu des anticipations.
Le phrasé audio-visuel se combine avec la scénographie audio-visuelle (construction d’un espace) pour construire un espace-temps signifiant.
A-V: p. 33-58; UAS: p. 235-249
Voir: LIGNE DE FUITE TEMPORELLE, LINÉARISATION, POINT DE SYNCHRONISATION, SCÉNOGRAPHIE AUDIO-VISUELLE, TEMPORALISATION, VECTORISATION

PISTE SONORE
Terme adopté ici pour désigner le support technique, quel qu’il soit, des sons du film lorsque ce dernier est terminé et synchronisé avec le film: selon les époques, c’est un disque, une piste optique le long de l’image, des pistes magnétiques couchées le long de la pellicule, un disque CD lu en synchronisation avec la pellicule, etc... De l’existence d’une piste sonore- souvent multi-piste -, il ne découle pas qu’il y ait une bande-son.
Voir: BANDE-SON (IL N’Y A PAS DE)

PLURI-CAUSALITÉ DU SON (Chion, 1990)
Notion acoulogique destinée à rappeler qu’un son est souvent le produit non d’une cause, mais de deux objets ou éléments en collision ou plus - et que lorsque le poète japonais Basho parle du “bruit de l’eau” (mizu no oto
), plutôt que du “bruit de la grenouille”, au moment où un grenouille saute dans un marais, c’est en raison d’un choix poétique. De fait, le bruit dont il s’agit dans ce célèbre haiku peut être considéré, suivant l’intention du promeneur, du pêcheur de grenouiles ou de l’artiste, comme l’un ou l’autre, et dans les faits, il est le bruit des deux.
La plupart des langues entretiennent et entérinent, en revanche, le mythe d’une mono-causalité du son, et ce refoulement culturel de la question du son comme bi-causal ou multi-causal doit être analysé dans ses aspects idéologiques et symboliques.
PE: p. 92-93, 112; LS: p. 124-126
Voir: CAUSALE (ÉCOUTE), CAUSALISME

POINT D’ÉCOUTE (Point of audition) (Chion, 1984)
Dans une séquence audio-visuelle cette notion, telle que nous la reformulons, désigne:
1) Le point à partir duquel il nous semble pouvoir dire que nous entendons un son comme proche ou lointain de nous, point qui soit concorde avec la place de la caméra, soit en est différent (cas fréquent du personnage éloigné dans l’image et de sa voix entendue proche) . C’est alors le point d’écoute au sens spatial.

2) Le personnage par les oreilles duquel il est suggéré que nous entendons un son (par exemple, s’il parle au téléphone, et que nous entendons distinctement son interlocuteur comme lui-même est censé l’entendre). C’est alors le point d’écoute au sens subjectif.
Une scène d’Agent X 27/Dishonored, 1930, de Sternberg, utilise la contradiction entre le point d’écoute spatial et le point d’écoute subjectif : le son d’un piano jouant dans la pièce à côté est amorti au moment où un personnage s’éloigne devant la caméra (qui reste fixe) et passe derrière un rideau, comme si nous entendions “par ses oreilles”, alors que nous ne le suivons pas dans l’espace.
Ces deux sens peuvent coïncider ou correspondre à des cas différents ou contradictoires (notamment dans le cas des téléphèmes).
L’analyse de cette question complexe montre qu’elle ne peut pas être mise en parallèle avec la notion de “point de vue”, en raison des différences profondes entre le son et l’image, ainsi qu’entre la vision et l’audition.
A-V: p. 79-82; UAS: 263-265
Voir: TÉLÉPHÈME

POINT DE SYNCHRONISATION
Nous appelons point de synchronisation, dans une chaîne audio-visuelle, un moment plus saillant de rencontre synchrone entre un moment sonore et un moment visuel concomitants, autrement dit un moment où l’effet de synchrèse est plus marqué et plus accentué, créant un effet de soulignement et de scansion. La fréquence et la disposition des points de synchronisation dans la durée d’une séquence contribuent à lui donner son phrasé et son rythme, mais aussi à créer des effets de sens.
Le point de synchronisation peut se produire aussi bien entre une image et un son à l’intérieur d’un plan,
qu’entre une coupe visuelle (changement de plan) et une coupe sonore, ou une réplique du dialogue.
Pour qu’il y ait point de synchronisation, il ne suffit donc pas qu’il y ait synchronisme. En d’autres termes, une scène de dialogue filmé comportant beaucoup de synchronisme labial ne comprend pas pour autant des points de synchronisation. Ceux-ci se définissent comme des moments plus saillants et significatifs
, émergeant en fonction de critères aussi variables que : l’importance de la rupture perceptive (coupe simultanée dans le son et l’image), la présence d’un effet de renforcement visuel (gros plan) et sonore (son plus spécialement rapproché ou puissant), l’importance affective ou dramatique du détail synchrone. Le contexte joue aussi un rôle : ainsi par exemple, la première rencontre synchrone entre un mot prononcé et la vision de face du locuteur, au bout d‘une longue période de désynchronisation (par exemple, après de longs plans sur quelqu’un qui écoute, le locuteur demeurant hors-champ), se met en évidence comme un point de synchronisation. Ce dernier peut être aussi souvent préparé et créé comme un aboutissement de lignes de fuite temporelle.
La notion de point de synchronisation, basée sur l’idée d’un impact temporel spécifique de certaines rencontres image/son, est un pur effet de forme, mais qui n’a pas par lui-même de signification fermée et codée: puisqu’il peut être pertinent, soit au niveau de la structure de la séquence, soit au niveau du phrasé audio-visuel (dimension rythmique et musicale), soit au niveau du sens. Il peut l’être aux trois niveaux simultanés, et c’est même le cas le plus courant.
L’expérience très simple à faire consistant à créer une superposition aléatoire entre une musique quelconque prise sur un disque, et une séquence audio-visuelle quelconque (empruntée à une vidéo-cassette), met en évidence la façon dont le spectateur que nous sommes est avide de synchronisation, et dont il guette les moindres points de synchronisation et les fabrique à toute occasion. Elle met en évidence le besoin d’une scansion et d’une ponctuation d’une séquence audio-visuelle, et aussi la tendance à trouver du sens et de l’intentionnalité dans toute concomitance audio-visuelle.
A-V: p. 52-55; UAS: 239-241
Voir: CONCOMITANCE, LIGNE DE FUITE TEMPORELLE, PHRASÉ AUDIO-VISUEL, SYNCHRÈSE

REDONDANCE (ILLUSION DE) (Chion, 1982)
Illusion créée par la valeur ajoutée, qui donne à croire que certains sons ne sont que la répétition des images sur lesquelles on les perçoit, et vice-versa. L’exemple le plus banal que l’on invoque comme cas de redondance - un dialogue filmé et entendu - n’en est justement pas un. Sauf en effet pour un sourd entraîné à lire sur les lèvres (et encore, dans les seuls cas où il s’agit d’une version originale et où les visages des acteurs sont de face), le son ne peut aucunement être déduit de l’image, et le texte prononcé de ce que l’on voit. Symétriquement, les visages des personnages, leur habillement et souvent le cadre où ils se trouvent, leurs gestes, etc.., ne peuvent être que rarement détectés à partir du son seul. Il ne peut donc y avoir par principe de véritable redondance audio-visuelle, y compris dans le cas de la musique empathique, et cette notion est à la fois une illusion audio-visiogène, fruit de la valeur ajoutée, et, dans la théorie, une idée reçue qui masque la spécificité et la complexité du rapport audio-visuel.
UAS: p. 191-192
Voir: EMPATHIQUE, SYNCHRÈSE, VALEUR AJOUTÉE

REDOUBLEMENT SENSORIEL (Chion, 1998)
Effet se produisant lorsqu’un événement visuel est accompagné en synchronisme par un phénomène sonore - ou l’inverse - aboutissant à une sensation mieux établie. Le redoublement sensoriel fait appel à la synchrèse pour donner un poids de réalité, un impact spécifique à la situation, à l’objet, au moment, au signifiant, etc..., concernés. Il peut n’avoir d’autre sens que de détacher, de souligner plus spécialement un moment, une action, un mot, etc. et de produire ainsi tout à la fois un effet de sens et un effet de point de synchronisation (phrasé audio-visuel). Un redoublement sensoriel ponctuel peut aussi servir à mettre en valeur, par contraste, un effet de fantôme sensoriel qui se produira un peu plus tard.
Voir: FANTÔME SENSORIEL, POINT DE SYNCHRONISATION, SYNCHRÈSE

RÉDUITE (ÉCOUTE) (Reduced Listening) (Schaeffer, 1967)
L’écoute réduite,
telle que l’auteur du Traité des Objets Musicaux, la définit, est celle qui fait volontairement et artificiellement abstraction de la cause et du sens (et nous ajoutons : de l'effet), pour s'intéresser au son considéré pour lui-même, dans ses qualités sensibles non seulement de hauteur et rythme, mais aussi de grain, matière, forme, masse et volume.
Tout le monde pratique un écoute réduite inconsciente et sauvage (au cinéma, notamment), mais surtout pour fournir aux deux autres écoutes, l’écoute causale et l’écoute sémantique, des éléments d’interprétation et de déduction. L’écoute réduite spontanée se passe de mots, et ne franchit donc pas un certain seuil de finesse et de développement inter-subjectif. Le seul aspect du son où l’écoute réduite est pratiquée couramment est celui de la hauteur, pour les sons avec une auteur précise (sons toniques). La hauteur, qualité propre au son lui-même, est en effet appréciée indépendamment de la source du son, et du sens dont il est porteur.
L’écoute réduite n’est pas une activité de censure: elle ne nous oblige pas à refouler, encore moins à nier nos associations figuratives, affectives. Il s’agit simplement de placer temporairement celles-ci en dehors d’un champ de nomination et d’observation.
L’écoute réduite ne peut pas s’apprendre seul; elle doit comporter au début des exercices menés sous la conduite d’un maître, en observant une certaine procédure.
GOS: 30-35; A-V: 28-31; LS: 271-272, 278-279
Voir CAUSALE (ÉCOUTE), COMPLEXE (MASSE), SÉMANTIQUE (ÉCOUTE), TONIQUE (MASSE)

RÉEL DIÉGÉTIQUE, RÉEL CINÉMATOGRAPHIQUE (Chion, 2003)
Le réel diégétique dans un film est ce qui vivent les personnages, ce qui leur arrive (ou même, ce qui arrive à un objet, un paysage, un anilmal, etc...). Le réel cinématographique, c’est cet autre réel qui est sur l’écran, dans le cadre, dans les enchaînements de plans, dans les raccords.
Par exemple, dans une conversation téléphonique de type 4 (voir Téléphème): dans le réel diégétique les personnages ne se voient pas alors que dans le réel cinématographique, leurs regards, par le jeu du découpage, peuvent se croiser. Dans le réel diégétique, ils sont loin l’un(e) de l’autre, dans le réel cinématographique, ils sont proches, etc. Exemple inverse, dans L’Opinion publique de Chaplin: une femme téléphone d’une cabine publique à un homme dans une maison, loin de là. Dans le réel diégétique, peu importent leurs positions réciproques, mais dans le réel cinématographique, ils se “tournent le dos”, puisqu’ils sont tous deux montrés orientés vers la droite de l’écran.
Dans une scène de Scream, de Wes Craven, une jeune fille se trouve chez elle terrorisée par un appel téléphonique: dans le réel diégétique, elle a de l’espace pour s’enfuir, mais dans le réel cinématographique, elle est cadrée et filmée de telle façon qu’elle semble acculée et sans direction ou fuir.
Deux personnages se parlent: dans le réel diégétiique ils sont proches l’un(e) de l’autre; dans le réel cinématographique, le cadrage et le montage peuvent les séparer, en s’arrangeant pour qu’ils ne figurent jamais dans le même plan.
La distinction des deux réels permet de mieux comprendre le double jeu sur lequel repose une grande partie du langage cinématographique. Il n’y a pas en effet à choisir entre l’un ou l’autre; tous deux sont importants, dans leur rapport même.
UAS: p. 324-325
Voir: TÉLÉPHÈME

RENDU (Rendering) (Chion, 1987)
Rendu signifie que “le son est reconnu par le spectateur comme vrai, efficace et adapté, non s’il reproduit
le son que fait dans le réel le même type de situation ou de cause, mais s’il rend (c’est-à-dire traduit, exprime) les sensations, pas spécifiquement sonores (...) associées à cette cause ou à la circonstance évoquée dans la scène “ ( M.C., L’Audio-vision, Nathan, 1990, p.94).
Insistons, dans cette définition, sur les mots: “pas spécifiquement sonores”.
L’utilisation du son comme moyen de rendu (et non de reproduction) est facilitée par sa souplesse en terme d’identification causale (flou narratif). Le son est, en d’autres termes, facilement vraisemblable, ou si l’on veut le spectateur est extrêmement tolérant au fait qu’un son ne ressemble pas à ce qu’on entendrait dans la réalité, puisqu’il n’existe pas de loi rigide qui unisse un son à sa ou ses cause(s).
Comme exemples de rendu, c’est-à-dire d’un son qui traduit non un autre son mais une vitesse, une force, etc..., on peut citer les effets sonores qui ponctuent les scènes d’action dans les films (sifflement des épées ou des glaives dans les films d’arts martiaux, traduisant l’agilité), les bruits de chutes des corps dans les scènes où quelqu’un tombe, traduisant la violence subie par le personnage (alors que la même chute dans la réalité peut ne faire aucun bruit), le son des coups dans les films de boxe, etc. , mais aussi, tous les sons destinés à donner des impressions de matière ou d’immatérialité, de fragilité ou de résistance, de sensualité ou d’austérité, de creux ou de plénitude, de poids ou de légèreté, de vétusté ou de flambant neuf, de luxe ou de misère, etc, et qui sont créés dans ce but plutôt que dans celui de reproduire le son réel de l’objet ou du personnage en question. Le rendu est toujours le rendu de quelque chose.
Rappelons aussi que le rendu dont nous parlons ici est créé dans le cadre d’une relation audio-visuelle. Ce rendu est alors projeté sur l’image, et ressenti illusoirement comme exprimé directement par ce qu’on voit (d’où l’illusion de redondance).
A-V: p. 94-104; UAS: p. 219-220
Voir: FLOU NARRATIF, REDONDANCE (ILLUSION DE), VALEUR AJOUTÉE

RITUALISÉ (CINÉMA)
Forme cinématographique où des actions simples et le plus souvent répétitives d’exécution ou de déplacement: ouvrir une porte de voiture, monter un escalier, se rendre quelque part, traverser une route, exécuter une tâche, prennent le caractère d’un rituel plus ou moins répétitif, où la durée précise des actions, leur tempo, joue un rôle significatif. On peut appliquer ce terme notamment à plusieurs films de Bresson, mais aussi à certains films policiers ou d’angoisse de Jean-Pierre Melville ou Brian de Palma.
UAS: p. 103-105

SCANSION DIT-MONTRÉ
Une des cinq formes du rapport dit-montré, correspondant au cas où ce que fait ou ne fait pas un personnage tout en parlant, ou encore un événement dans le décor sonore (son de klaxon, cri animal) ou le décor visuel (passage de voiture) ont pour effet de scander, de ponctuer le discours, et aident à le faire écouter par le spectateur. La scansion du dit par le montré est un des procédés favoris du cinéma verbo-centré.
Par exemple, un personnage, qui s’est servi à boire tout en parlant, interrompt son geste de porter le verre à sa bouche, soit en disant soit en entendant quelque chose, et plus tard il boit “cul-sec” après une phrase déterminante, etc... On en a d’innombrables exemples dans Casablanca.
Certains cinéastes refusent ou limitent cette scansion, comme Eric Rohmer ou Manoel de Oliveira. Jean-Luc Godard, en quelque sorte, l’exacerbe et la détruit en l’exacerbant (dialogue hyper-ponctué, par exemple dans Une femme est une femme, 1960, où la musique non-diégétique de Michel Legrand est un des nombreux moyens de scansion).
UAS: p. 70-73, 342
Voir: CONTRADICTION, CONTRASTE, CONTREPOINT, CREUSEMENT, VERBO-CENTRÉ (CINÉMA)

SCÉNOGRAPHIE AUDIO-VISUELLE (Chion, 2003)
Relève de la scénographie audio-visuelle tout ce qui, dans une conjonction de sons et d’images, concerne la construction d’une scène diégétique et fantasmatique par le jeu du in, du off et du hors-champ; notamment par le jeu des entrées et sorties de champ sonore (personnage ou véhicule entrant dans le champ visuel et annoncé par le son), par le contraste ou l’identité entre extension sonore et cadrage visuel, par la comparaison entre la taille des personnages dans le champ visuel, et, pour l’oreille, la proximité ou l’éloignement de leurs voix et plus généralement des sons qu’ils émettent.
Sur ce dernier point, lil convient de noter que la perspective sonore reproduit très rarement la perspective visuelle, ou bien qu’elle le fait de manière très approximative et timide.
Citons ici deux exemples de scénographie audio-visuelle empruntés à des films connus.
Dans Blade Runner, 1982, de Ridley Scott, le décor et les personnages sont visuellement montrés en plans le plus souvent rapprochés, tandis que leur environnement est acoustiquement décrit ou sugggéré par des sons à l’extension large. On assiste à une sorte de complémentarité et de compensation entre la vision en gros plan et l’écoute en plan général.
Dans le Satyricon, 1969, de Fellini, à l’inverse, plusieurs scènes (celle, par exemple, du théâtre de Vernacchio) combinent une scénographie visuelle basée sur le vide et sur le décentrage des personnages (ils sont montrés souvent en plan général, ou dans le bas d’un gigantesque cadre de Cinémascope) à une scénographie sonore où les voix de ces mêmes personnages sont proches, envahissantes, intimes, nous parlent à l’oreille, et ne sont pas à la même distance que les corps qui les “émettent”.
Voir: AMBIANT (SON), EXTENSION, IN, HORS-CHAMP, OFF

SÉMANTIQUE (ÉCOUTE) (Semantic Listening) (Schaeffer, 1967)
Pierre Schaeffer nomme “sémantique” l’écoute qui, dans des contextes particuliers où elle a affaire à un signal sonore codé (dont l’exemple le plus courant est le langage parlé, mais peut être aussi du morse ou un code entre prisonniers), s’intéresse à décoder ce signal, pour atteindre le message. Nous préférerions parler, pour désigner la même chose, d’écoute codale, mais choisissons de conserver la terminologie schaefférienne pour ne pas brouiller la question.
Notons que les deux écoutes causale et sémantique peuvent s’exercer simultanément sur les mêmes sons. Par exemple, on écoute ce qu’un inconnu vous dit au téléphone = écoute sémantique; on cherche à savoir comment il est (sexe, âge, corpulence, état de santé) d’après sa voix = écoute causale.
Le cinéma sonore joue souvent du décalage entre notre écoute sémantique et celle d’un des personnages de la diégèse. Celui-ci “entend” directement ce que dit un code morse, un code de prisonnier, ou un langage extra-terrestre ou robotique. Dans la saga de La Guerre des Étoiles, Luke Skywalker “entend” le langage de bips électroniques du petit robot D2R2, et Han Solo les gémissements pour nous toujours semblables du géant velu Chewbacca. C’est un exemple courant de cloisonnement auditif.
A-V.: p. 27-28; LS: p. 238-239 (sous le nom d’”écoute codale”)
Voir CAUSALE (ÉCOUTE), CLOISONNEMENT AUDITIF, RÉDUITE (ÉCOUTE)

SENSORI-NOMMÉ (SON OU IMAGE) (Chion, 2003)
Le personnage de film n’est pas censé nommer ce qu’il voit et entend en commun avec nous - seulement nommer ses sentiments, des personnages, etc... D’où un effet particulier, faussement redondant, quand il les nomme et nous fait confronter ce qu’il dit entendre avec ce que nous entendons ou avons entendu, ce qu’il voit avec ce que nous voyons ou avons vu (nomination des sons dans l’évasion d’Un condamné à mort s’est échappé, de Bresson, ou dans Un jeu brutal, 1982, de Jean-Claude Brisseau, des couleurs dans Les Ailes du désir, 1987,de Wim Wenders).
UAS: p. 344-345

SONS-IMMÉDIATEMENT-RECONNAISSABLES (DICTIONNAIRE DES) (Chion, 1993)
Répertoire des sons dont la source ou la catégorie de source est identifiée nettement et de manière irréfutable par des individus appartenent à une certaine communauté, sans que cette identification causale soit induite verbalement ou visuellement (écoute visualisée) et par le contexte in situ.
Des expériences d’écoute “aveugle” (acousmatique) auprès de groupes à qui on fait écouter des séquences sonores non identifiées permettent de repérer un certain nombre de ces sons (ex : la goutte d’eau, les cloches, la porte qui claque). Il faut tout de même constater que certains de ces “archétypes sonores” sont familiers bien plus par leur emploi constant dans le cinéma et la télévision que par leur présence dans l’environnement quotidien du sujet. De jeunes téléspectateurs qui ne connaissent que le traitement de texte ou la machine à écrire électrique reconnaissent immédiatement et facilement, dans un enregistrement, le crépitement d’une machine à écrire mécanique, parce que ce dernier est un bruit familier des films et des séries policières qu’ils regardent.
PE: p. 67, 96; LS: p. 120
Voir: CREUSEMENT, REDONDANCE (ILLUSION DE)

SUPPORT (EFFETS DE) (Chion, 1988)
Effets propres aux arts de support, comme la peinture, le cinéma, la vidéo ou la musique concrète, et qui consistent à accuser la présence du support par la présence d’une texture, d’un matière affichant les limites et les défauts de ce support : le plus banal étant, pour l’image, le jeu sur le grain de la pellicule, les rayures, etc, et pour le son le jeu sur la distorsion, le pleurage, les “bruits de surface”. Ces effets apparaissent souvent involontairement lorsque ce support devient daté par l’apparition de nouveaux supports d’images ou de sons qui, sans être meilleurs en soi, n’ont pas les mêmes caractéristiques, et ensuite, il est fréquent qu’ils soient recréés artificiellement, afin de donner une touche caractéristique à une image ou à un son.
PE: p. 161-162
Voir: EFFETS TECHNIQUES DE BASE

SURGISSEMENT ACOUSMATIQUE (Chion, 2003)
Ce qui se produit lorsque quelqu’un, par sa voix ou des sons qu’il cause, se révèle subitement dans le hors-champ comme étant déjà là dans le lieu de l’action, sans que les autres personnages aient repéré sa présence. Ainsi, dans Le Corbeau, 1943, d’Henri-Georges Clouzot, la voix d’Héléna Manson, dans le rôle d’une bonne soeur revèche: “Ne parlez-pas ainsi dans la maison du Seigneur”, surprend deux femmes et un homme se disputant dans une église.
UAS: p. 42
Voir: ACOUSMATIQUE, HORS-CHAMP

SUSPENSION (Chion, 1990)
Effet dramatique audio-visiogène consistant, dans une scène de fiction dont le cadre suppose, pour nos habitudes audio-visuelles, la présence de certains bruits d’ambiance (naturels, urbains etc. ), à interrompre ces bruits voire à les éliminer dès le départ, alors que les causes de ces sons continuent d’exister dans l’action et même dans l’image. L’effet ressenti est souvent celui d’un mystère ou d’une menace, parfois d’une sorte de suspension poétique ou de déréalisation du monde. Par exemple, la promenade amoureuse à la fin des Nuits de Cabiria/I Notte di Cabiria , 1957, de Fellini: un coucher de soleil, une nature merveilleuse et des arbres, mais où l’on n’entend aucun chant d’oiseau, crée un climat sourdement angoissant, par l’absence de tout son naturel: on apprendra plus tard que l’homme veut tuer la petite prostituée qu’il a emmenée au bord de la falaise.
Dans Rencontres du troisième type/Close Encounters of the Third Kind, 1977, de Spielberg, les bruits de la nuit se taisent un moment après une première manifestation des E-T. Dans Rêves, 1990, de Kurosawa, la tempête de neige, toujours visible dans l’image par des myriades de flocons, cesse d’être entendue quand l’alpiniste au bord de l’épuisement voit se pencher vers lui une femme à la longue chevelure.
A-V: p. 111-113; LS: p. 229-230; UAS: p. 266

SYNCHRÈSE (Synchresis) (Chion, 1990)
Nom forgé que nous donnons à un phénomène psycho-physiologique spontané et réflexe, universel, dépendant de nos connexions nerveuses, et ne répondant à aucun conditionnement culturel, et qui consiste à percevoir comme un seul et même phénomène se manifestant à la fois visuellement et acoustiquement la concomitance d’un évènement sonore ponctuel et d’un évènement visuel ponctuel, dès l’instant où ceux-ci se produisent simultanément, et à cette seule condition nécessaire et suffisante.
La synchrèse, phénomène incontrôlable, amène donc à établir instantanément un rapport étroit d’interdépendance et à rapporter à une cause commune, même s’ils sont de nature et de source complètement différentes, des sons et des images qui n’ont souvent que peu de relation dans la réalité. Le cinéma utilise abondamment cet effet, qui permet notamment la post-synchronisation et le bruitage.
A-V: p. 55-57; MAC: 206-207; UAS: p. 40-42, 192-194
Voir: POINT DE SYNCHRONISATION, REDOUBLEMENT SENSORIEL

SYNCHRONO-CINÉMATOGRAPHE AUDIO-LOGO-VISUEL (Chion, 2000)
Expression descriptive proposée pour nommer le nouveau cinéma qui est apparu à la fin des années 20 et qui s’est généralisé ensuite sous le nom de “cinéma parlant” : un cinéma où le son et l’image en mouvement (“cinéma”), ainsi que le langage dont ils sont très fréquemment les véhicules (“logo”) sont inscrits sur des supports (“graphe”) synchronisés entre eux (“synchrono”) à une vitesse temporelle stabilisée (“chrono-graphie”).
UAS: p. 210-211
Voir: AUDIO-LOGO-VISUEL, CHRONOGRAPHIE

SYSTÈME D’ÉCOUTE
On peut appeler système d’écoute dans un film la logique créée par les cloisonnements et les porosités entre les écoutes d’une part, et par le rapport plus ou moins conscientisé et verbalisé, plus ou moins actif ou passif, que les personnages entretiennent avec les sons dont ils sont ou non les émetteurs. Dans ce système d’écoute rentrent donc en ligne de compte:
-
la plus ou moins grande conscience que les personnages ont des sons; leur action sur eux; la verbalisation par eux de ces sons (sensori-nomination);
- la conscience (verbalisée ou non) que les personnages peuvent avoir d’être écoutés, et qui se sent plus ou moins dans leur voix (modulation de l’écoute par le ton de voix); la façon dont ils en tiennent compte, et dont ils s’en servent éventuellement pour leurrer; s’ils verbalisent ou non cette écoute;
- la conscience que le spectateur peut avoir des sons et des silences, de certains sons, ou de notre écoute;
- le rôle du son ou de l’absence de son dans l’action (sons qui encouragent, sons qui leurrent, sons qui masquent, sons qui disparaissent et rendent ainsi audibles d’autres sons jusque-là “masqués”);
- le jeu de cloisonnements ou d’écluses entre les différentes écoutes signalées plus haut;
la différenciation des personnages entre eux: un hyper-acousique, un discret, un bruyant inconscient de ses sons, une hyper-acoustique et un qui-ne-veut-rien-entendre, etc...;
- l’association de certains personnages à un son-emblême: sonnette, canne, moteur de chaise roulante, etc.., plus ou moins conscientisé par eux ou les autres;
- le jeu variable de l’acousmatique et du visualisé.
- la présence d’une “machine à écouter”; d’un relais d’écoute, d’un animal, d’un détecteur.
Voir: ACOUSMATIQUE, CLOISONNEMENT AUDITIF, SENSORI-NOMMÉ


TÉLÉPHÈME
Scène de conversation téléphonique dans un film (le mot n’a pas été inventé par nous, mais proposé par un journaliste dans une revue du début du XXe siècle, pour désigner l’”unité de conversation téléphonique”).
Nous classons les types de téléphèmes en plusieurs types conventionnement numérotés:
a) type 0: propre au cinéma muet, il nous montre alternativement les deux locuteurs/trices, mais nous n’entendons pas ce qu’ils/elles se disent .
b) type 1: nous voyons alternativement les deux locuteurs et en même temps que nous voyons chacun(e) d’entre eux - nous entendons celui-ci/celle-ci.
c) type 2: nous voyons (et entendons) seulement l’un(e) des deux locuteurs/trices, en restant avec lui/elle tout au long du téléphème, sans entendre ce que dit l’autre.
Une variante du type 2 est celle où nous entendons la voix de l’interlocuteur, mais minuscule et à la limite de l’audible, comme si nous étions dans la pièce aux côtés du personnage.
d) type 3: nous voyons et entendons un(e) seul(e) des deux locuteurs/trices, mais nous entendons en voix filtrée l’autre interlocuteur, que nous ne voyons pas.
e) type 4: nous voyons tantôt l’un et tantôt l’autre, et entendons les voix tantôt avec l’image du/de la locuteur/trice, tantôt dans l’écouteur de son interlocuteur/trice.
f) type 5: c’est l’effet de “split-screen: l’écran est divisé en deux, et nous voyons et entendons les deux locuteurs/trices, sans que la voix d’aucun(e) des deux soit filtrée.
g) type 6: divers plus ou moins délibérément aberrants ou paradoxaux provenant souvent d’un croisement entre les types précédents. Dans Mon oncle, 1958, de Tati (le coup de téléphone d’Arpel à son beau-frère Hulot), le son acousmatique de l’endroit où le directeur joint son beau-frère (une ambiance d’accordéon populaire) envahit le bureau directorial en passant par le haut-parleur extérieur du téléphone, mais la voix d’Hulot à l’autre bout du fil n’est pas entendue. Dans Lost Highway, 1997, de David Lynch, le héros téléphone chez lui à un homme qui est censé être le même que celui qui est en face de lui, et nous entendons la voix filtrée en type 3; etc...
Le type dont relève un téléphème peut varier au cours de celui-ci et ce changement participe de la construction de la scène: dans Le Testament du Docteur Mabuse, 1933, de Fritz Lang, la conversation entre le commissaire Lohmann et Hofmeister commence en type 1, et elle se termine en type 3.
Les téléphèmes sont souvent l’occasion de confronter réel diégétique et réel cinématographique, et de jouer de leur superposition.
UAS: p. 324-331
Voir: ACOUSMATIQUE, RÉEL DIÉGÉTIQUE/RÉEL CINÉMATOGRAPHIQUE

TEMPORALISATION (Temporalization) (Chion, 1990)
Effet audio-visiogène constituant un cas de valeur ajoutée, dans lequel le son donne de la durée à des images qui n’en possèdent pas par elles-mêmes (images totalement fixes, comme dans La Jetée, de Chris Marker, ou montrant un décor vide ou des personnages immobiles, comme au début de Persona, de Bergman, dans la scène de la morgue), ou bien influence et contamine la durée propre d’images comportant des mouvements, lesquels sont indicateurs de durée. La temporalisation repose notamment sur la présence ou non dans le sonde lignes de fuite temporelle. Le son peut en particulier imposer une durée linéaire et successive à des images qui en elles-mêmes ne présupposent pas dans leur enchaînement une idée de succession temporelle (linéarisation des images par le son
), et enfin vectoriser les plans, c’est-à-dire les orienter dans le temps, leur imprimant un caractère d’attente, de progression, d’avancée, d’imminence, etc... qu’ils ne possèdent pas par eux-mêmes (vectorisation).
Au début du Testament du Docteur Mabuse, de Lang, la caméra balaie l’intérieur d’une cave encombrée d’objets. Sans le son, cette exploration par un panoramique de gauche à droite apparaît désintéressé, objective, au fur et à mesure. Avec le son, qui est celui d’une puissante pulsation de machine hors-champ, le plan est comme tendu, orienté vers un but imminent: la découverte de la source.
A-V: p. 16-22; LS: 230; UAS: 235-249
Voir: DÉDOUBLEMENT TEMPOREL, LIGNE DE FUITE TEMPORELLE, LINÉARISATION TEMPORELLE, VALEUR AJOUTÉE, VECTORISATION

TONIQUE (MASSE) (Schaeffer, 1967)
Se dit d’un son qui fait entendre une hauteur précise, par opposition aux sons dits complexes ou de masse complexe.
Le ton tonique sert souvent de dimension-pivot entre parole, musique, et bruit; il permet aussi l’effet de discordance. Enfin, il émerge particulièrement au milieu d’un contexte de sons complexes.
GOS: p. 119-120 ; LS: p. 193-194, 250-252

Voir: COMPLEXE (MASSE), DIMENSION-PIVOT, DISCORDANCE

TOURNAGE SONORE (Chion, 1988)
Désigne l’opération consistant à créer ou à diriger intentionnellement des sons ou des séquences sonores par n'importe quel moyen, devant un ou plusieurs micros, en vue de les fixer par enregistrement, et d’en faire ensuite usage dans une musique concrète, un film ou une oeuvre vidéo, etc... Cette opération est souvent nommée improprement "prise de son", une expression technique qui ne souligne pas son caractère intentionnel et créateur.
ASF: p. 6-10
Voir: FIXATION

TRANS-SENSORIELLES (PERCEPTIONS) (Trans-sensoriality) (Chion, 1990)
Nous appelons trans-sensorielles
les perceptions qui ne sont d’aucun sens en particulier, mais peuvent emprunter le canal d’un sens ou d’un autre, sans que leur contenu et leur effet soit enfermé dans les limites de ce sens. Exemple: tout ce qui concerne le rythme, mais aussi un certain nombre de perceptions spatiales, ainsi que la dimension verbale. Un mot lu ou un mot entendu relèvent de la sphère du langage, même si les modalités de leur transmission (graphisme de l’écriture, timbre de la voix, etc...) touchent parallèlement des dimensions propres à chaque sens.
Le rythme
est la dimension trans-sensorielle de base, puisque c’est une perception prénatale, ressentie notamment par des variations de pression autour de la paroi corporelle, rythmées sur le double rythme du coeur du foetus et du coeur de la mère. Le rythme est partout - autrefois, par exemple, la nuit, avant la lumière électrique, il se trouvait présent dans la lumière palpitante des chandelles et des bougies, et cette lumière est une variation sensorielle que nous avons perdue et devons remplacer par d’autres (notamment par la télévision avec ses sautes de lumière!).
La texture et le grain sont une autre catégorie de perception trans-sensorielle.
A-V: p. 116-117; PE: p. 82-84; LS: p. 56-62; UAS: p. 207

TRESSAGE (Chion, 2003)
Il y a tressage des éléments sonores entre eux, ou d’un élément sonore de nature verbale, musicale, etc..., avec tout ou partie de l’image, quand il y a réponse entre l’un et l’autre, transfert, impression que l’un est continué et relayé (même sous forme de démenti) par l’autre - ce qui se produit notamment dans certaines formes particulières du rapport dit/montré (scansion, contraste, voire contradiction).
Le cinéma parlant classique verbo-centré pratique souvent le tressage entre paroles prononcées et jeu de scènes: le cinéma dit “moderne” semble au contraire l’éviter (Eric Rohmer, Jean Eustache). Mais chaque film est un cas particulier.
Eyes Wide Shut de Kubrick est un film qui évite tout tressage entre ce qui est évoqué verbalement par les personnages et ce qu’on voit, du fait qu’il ne donne jamais aucun indice visuel et matériel de ce qui est dit, ni non plus aucun démenti (cinéma détressé).
Voir: CONTRASTE, CONTRADICTION, SCANSION, VERBO-CENTRÉ (CINÉMA)

VALEUR AJOUTÉE (Added Value) (Chion, 1984)
Valeur sensorielle, informative, sémantique, narrative, structurelle ou expressive qu’un son entendu dans une scène nous amène à projeter sur l’image, jusqu’à créer l’impression que nous voyons dans celle-ci ce qu’en réalité nous y “audio-voyons”. Cet effet, utilisé très couramment, est la plupart du temps inconscient pour ceux qui le subissent.
La valeur ajoutée est partiellement bi-latérale (l’image influençant en retour la perception que nous avons du son), mais en raison de la polarisation consciente du spectateur de film ou du téléspectateur sur l’écran et sur le visible, c’est en définitive sur l’image
que le résultat de ces influences de sens contraire est le plus souvent, au cinéma comme à la télévision, globalement reprojeté.
En revanche, en situation culturelle de visu-audition
, par exemple au concert, dans lequel par tradition culturelle l’attention consciente est portée sur l’écoute, la valeur ajoutée fonctionne principalement dans l’autre sens. Par exemple, la vision d’un geste énergique de l’instrumentiste nous fera entendre un son plus puissant.
A-V: p. 8-24; MAC: P. 205-206; LS: p. 221-222; UAS: p. 191-195
Voir: AUDIO-VISION, VISU-AUDITION

VECTORISATION DES IMAGES PAR LE SON (Chion, 1990)
Processus audio-visiogène de temporalisation par lequel un son imprime un “sens dans le temps” à des images certes mobiles, mais qui nous montrent une action sans devenir particulier, ou réversibles dans le temps, ce qui est le cas de beaucoup de phénomènes visibles (on peut par exemple inverser le sens de défilement d’une image où l’on voit quelqu’un parler sans que le spectateur s’en aperçoive, les mouvements de la parole n’étant pas vectorisés pour l’oeil). Exemple, une campagne où les arbres sont agités par le vent : rien dans ce qu’on voit n’indique un sens du temps précis, ni un devenir à moyen terme. On entend une voiture s’approcher: tout s’inscrit dans une durée d’attente, orientée vers le futur. Les sons sont en effet beaucoup plus souvent que les phénomènes visibles orientés dans le temps.
A-V: p. 20-21; LS: p. 230
Voir: TEMPORALISATION, VALEUR AJOUTÉE

VERBO-CENTRÉ (CINÉMA) (Verbo-centered cinema) (Chion, 1990)
Formule du cinéma parlant dit classique dans laquelle la mise en scène, le jeu des acteurs, la conception des sons et des images sont consciemment ou inconsciemment orientés dans le but général de faire écouter les dialogues (généralement abondants) comme de l’action, en en faisant le centre - souvent invisible - de jeux de scènes, d’effets de montage, d’éclairage, etc.., destinés à en faciliter l’écoute et à en dramatiser l’enjeu, tout en effaçant la perception du dialogue comme tel. Le spectateur - consentant - du cinéma classique verbo-centré ne se surprend pas en train d’écouter un flot de dialogues autour duquel tout s‘organise : il est convaincu d’assister à une action complexe où les dialogues ne constitueraient qu’une partie, qu’il prendrait presque pour négligeable.
Le cinéma verbo-centré utilise souvent le tressage et la scansion dit/montré.
LS: 225-226; UAS: p. 70-73
Voir: SCANSION, TRESSAGE

VERBO-DÉCENTRÉ (CINÉMA) (Verbo-decentered cinema)
Par opposition au cinéma verbo-centré, peuvent être rangés dans le cas des cinémas verbo-décentrés :
- les cas, apparemment paradoxaux, où les dialogues sont nombreux et importants, mais où leur abondance n’est pas dissimulée, ou absorbée par la mise en scène, et se donne à percevoir comme telle, faute que l’écoute en soit facilitée par le reste des éléments cinématographiques; entre autres par la gestuelle des acteurs : cela va des films d’Eric Rohmer (qui refusent le principe des “jeux de scène” ponctuant l’écoute des dialogues) à ceux de Manoel de Oliveira (tableaux fixes parlants de Francisca, 1981) ou de Tarkovski (verbiage des personnages confronté à leur impuissance face à la nature et à leur sobriété de gestes, dans Stalker, 1979), en passant par beaucoup de scènes collectives chez Fellini. On a aussi le même principe dans l’épIsode central de la prison de THX 11 38, 1970, de George Lucas.
- plus spécifiquement, les cas où le style visuel et sonore du film relativise la parole et la traite comme parole-émanation.
Le cinéma verbo-décentré évite souvent le tressage et en revanche utilse volontiers, mais pas obligatoirement, la parole-émanation.
UAS: p. 225-226
Voir : PAROLE-ÉMANATION, TRESSAGE, VERBO-CENTRÉ (CINÉMA)

VERTICAUX (RAPPORTS)
Peut se dire, par analogie avec le vocabulaire musical traditionnel, des relations qui s’établissent entre deux phénomènes simultanés, par exemple un son et une image. Par opposition, les rapports horizontaux
sont ceux qui se créent dans la succession temporelle. On peut dire alors que souvent dans la superposition des chaînes audio et visuelles, les rapports verticaux (son sur image) tendent à prédominer sur les rapports horizontaux (ceux qu’on découvre en suivant la chaîne sonore, et la chaîne visuelle chacune de son côté), sauf dans certains cas, par exemple lorsqu’il y a jeu sur les lignes de fuite temporelle.
Voir: HORIZONTAUX (RAPPORTS), LIGNE DE FUITE TEMPORELLE, SYNCHRÈSE

VISUALISÉ (SON) (Visualized Sound) (Chion, 1990)
Peut se dire au cinéma de l'écoute d'un phénomène sonore qui s'accompagne de la vision partielle ou complète sur l’écran de sa source réelle ou présumée; par opposition à l’"écoute acousmatique"
A-V: p. 64-65
Voir: ACOUSMATIQUE (SON)

VISU-AUDITION (Visu-audition) (Chion, 1990)
Symétrique de la situation d’audio-vision, le terme de visu-audition s’applique à un type de perception audiovisuelle qui est consciemment concentré sur l'auditif (comme dans le cas du concert ou d’une scène de film montrant une exécution musicale, mais aussi lorsqu’on est attentif aux propos tenus par quelqu’un), et où l'audition est accompagnée, renforcée, aidée ou au contraire déformée ou parasitée, mais en tout cas transformée par un contexte visuel
qui l'influence et peut amener à projeter sur elle certaines perceptions.
LS: p. 219-221
Voir: AUDIO-VISION

VOCOCENTRISME (Vococentrism) (Chion, 1982)
Processus par lequel, dans un ensemble sonore, la voix attire et centre notre attention, de la même façon que pour l’oeil, dans un plan de cinéma, le visage humain.
Le voco-centrisme, au niveau du son, peut être barré ou atténué par des procédés particuliers: dans les films de Jacques Tati, par exemple, les fluctuations de niveau sonore et d’intelligibilité du texte - mais aussi, le soin que le réalisateur met à établir que ces dialogues ne sont pas essentiels à l’action
proprement dite (tout en étant importants à un autre niveau), ainsi que, bien sûr, la façon dont sa caméra met à distance les personnages, sont autant de procédés destinés à empêcher notre attention de s’attacher aux voix.
Cela ne veut pas dire que dans les films classiquement voco-centristes, les autres sons, les bruits et la musique, ne sont “pas importants”. Ils ont au contraire un rôle aussi important. Seulement ce rôle agit à un niveau moins conscient, comme, dans un quatuor à cordes ou un choeur mixte à quatre voix, les parties dites intermédiaires (celles de ténor et d’alto, autrement dit les parties qui ne sont ni au-dessus, ni à la basse). Ce n’est que lorsque ces parties sont absentes ou différentes que l’on ressent que “quelque chose a changé”, bien que la mélodie à laquelle on prête consciemment attention soit la même.
VAC: p. 18-20; A-V: p. 9-10
Voir: PAROLE-ÉMANATION

VOIX-JE (Chion, 1982)
Type de présence de la voix dans un film ou une vidéo - généralement, mais pas obligatoirement une voix de narrateur/trice off -; quand elle parle dans une proximité maximale avec l’oreille du spectateur (proximité sensible par des indices sonores particuliers) et dans un espace volontairement mat et sans réverbération. En effet, une voix prolongée par une réverbération est susceptible de “créer le sentiment d’un espace où elle serait englobée”
(La Voix au cinéma, p. 48), alors que la voix-Je, qui résonne en nous comme nôtre, “doit être à elle-même son propre espace”. La voix-Je est généralement dépourvue des indices sonores matérialisants (respirations, bruits de bouche) qui font sentir le corps derrière elle.
VAC: p. 53-59
Voir: INDICES SONORES MATÉRIALISANTS

 

(c) Michel Chion

 

sommaire