Book Title

Aspects temporels de l’expérience quotidienne d’un nouveau-né : quelques réflexions concernant la musique

Daniel N. STERN

Faculté de Psychologie, Université de Genève

Introduction

Je suggérerai que certaines expériences fondamentales du temps et de la forme, qui sont communes à notre rencontre avec la musique, sont aussi communes aux interactions ordinaires, quotidiennes, socio-affectives d’un nouveau-né. Dès les premières semaines de sa vie, le bébé vit dans un environnement sonore humain qui est unique et qui est approprié aux échanges intimes, nécessaires à sa croissance et à son développement. Cet environnement, auquel il contribue lui aussi, possède des affinités avec le monde de la musique. La question qui se pose est de savoir dans quelle mesure cette expérience première établit des bases pour l’appréhension ultérieure et la création de formes musicales, ou dans quelle mesure la musique, en tant que forme culturelle, définit les premiers échanges entre parent et nouveau-né. Est-ce que tous deux sont simplement les manifestations des mêmes tendances expressives humaines, qui s’influencent mutuellement ? Puisque nous ne connaissons pas de réponse, nous pouvons du moins esquisser quelques parallèles qui rendront ces questions plus accessibles.

Capacités précoces d’un nouveau-né à expérimenter le temps et la forme

Avant d’envisager les similarités entre les aspects temporels de l’interaction parent/enfant et la musique ou d’autres formes artistiques, il est nécessaire d’expliquer de quelle manière les nouveau-nés sont sensibles aux formes et aux structures temporelles des événements qui les entourent.

La nature semble avoir destiné les nouveau-nés à posséder des capacités très précoces pour identifier et distinguer les éléments de la structure temporelle de leur monde social et émotionnel. Ce fait ne devrait pas nous étonner, puisque la communication intime naturelle à notre espèce est fortement structurée dans le temps, dès le début de la vie. Par conséquent, si le nouveau-né n’était pas si doué, il ne serait pas capable de lire les signaux sociaux intégrés dans un mouvement, de décoder les changements d’expressions faciales, d’apprendre un langage à partir d’un flot de sons, bref, il serait incapable de devenir un animal social fonctionnel.

1. Capacités précoces à percevoir divers éléments temporels

Dès les premières semaines de leur vie, les nourrissons semblent être prédestinés à identifier et distinguer : différentes durées temporelles brèves, différents tempos et différents rythmes simples.

Ces affirmations semblent extraordinaires et difficiles à prouver à ceux pour qui ce domaine n’est pas familier. Durant les dernières décades, nous avons développé plusieurs techniques pour répondre à des questions telles que : est-ce qu’un nouveau-né peut distinguer un tempo ou une durée ? Les réponses à ces questions sont basées sur la capacité d’un nouveau-né à s’habituer à un stimulus répété. Par exemple, si l’on fait écouter un rythme régulier à un nouveau-né ; dans un premier temps, il le trouve nouveau, et donc intéressant. Il s’oriente dans sa direction et son pouls ralentit pendant plusieurs secondes, retournant graduellement à sa fréquence d’avant le stimulus, alors qu’il “s’habitue” à ce rythme, c’est-à-dire, qu’il ne le trouve plus ni nouveau ni intéressant. Si, dans un deuxième temps, le rythme était ralenti ou accéléré, et si le bébé était capable de se rendre compte du changement, il se réorienterait vers la nouvelle pulsation, et le montrerait par une seconde décélération de sa fréquence cardiaque. Ce qui revient à dire qu’il se déshabituerait à la deuxième pulsation. Si, d’autre part, il avait été incapable de détecter une quelconque différence entre les deux pulsations, il ne se déshabituerait pas et son pouls n’indiquerait aucun changement.

Au lieu d’utiliser le changement de fréquence cardiaque comme indicateur des capacités des nouveau-nés à identifier différents événements temporels, on peut aussi employer les changements du rythme de succion du nouveau-né (sur une sucette branchée sous écoute électrique), ou la durée de sa fixation visuelle sur des objets choisis.

En utilisant ces techniques, on peut poser de nombreuses questions aux nourrissons, en ce qui concerne les distinctions qu’ils peuvent effectuer par rapport à la durée d’intervalles temporels, la fréquence des pulsations et le motif rythmique (Lewkowicz 1992).

Une autre approche suggère que les nouveau-nés sont préprogrammés pour identifier et réagir différemment à divers contours temporels du son (Tomkins 1962). Par exemple, si l’intensité d’un son, n’importe quel son, augmente très rapidement, tous les nourrissons (et les adultes) vont sursauter. Si elle augmente un peu moins rapidement, mais toujours vite, elle évoquera la peur. Si elle augmente encore moins rapidement, elle évoquera l’intérêt. Si l’intensité augmente puis décroît, on éprouvera du plaisir, etc. Ces réponses, observables chez les nouveau-nés, nous semblent innées, mais leur présence présuppose la sensibilité du nouveau-né à la forme ou au motif des changements temporels de l’intensité du son.

De même, on admet aujourd’hui qu’un foetus dans l’utérus, auquel on fait écouter à maintes reprises une forme de son pendant le dernier trimestre de la grossesse, se souviendra de ce son après la naissance (DeCasper et Fifer 1980). Ces expériences ont été réalisées par une mère lisant un certain poème ou de la prose (au foetus dans son ventre), plusieurs fois par jour, pendant trois mois. Après la naissance du bébé, on lui a fait écouter un enregistrement de la voix de sa mère, lisant le texte familier, ou celle d’une autre femme lisant le même texte, (chacune ayant la même hauteur de voix et la même intensité), ou encore celle de sa mère lisant un autre texte, etc. En employant les techniques mentionnées ci-dessus, à savoir la fréquence de succion non-nutritive, il est apparu que des nourrissons de deux jours pouvaient non seulement distinguer la lecture familière de celle qui ne l’était pas, mais encore qu’ils étaient capables de distinguer la voix de leur mère de celle d’une autre femme lisant le même texte. Pour ce faire, le nouveau-né doit posséder des capacités considérables pour différencier les qualités vocales ainsi que différentes formes de son. Ces deux tâches requièrent des capacités précoces de traitement temporel.

2. Capacités précoces à se représenter le temps et la forme

Une des plus grandes surprises de la recherche récente sur les nouveau-nés a été de découvrir que les bébés n’ont besoin ni de mots ni de symboles pour se représenter différentes formes sonores, visuelles ou tactiles, comme on le pensait auparavant. De plus, ils sont capables de transposer directement une forme d’une modalité à l’autre, sans expérience préalable.

Prenons comme premier exemple la transposition d’une forme tridimensionnelle de la modalité tactile à la modalité visuelle. Meltzoff et Borton (1979) ont bandé les yeux à des nouveau-nés de trois semaines et leur ont donné une sucette. Celle-ci avait une forme bizarre et unique, que le nouveau-né n’avait jamais rencontrée auparavant. Après que le bébé l’eut sucée pendant un moment, on la lui retira de la bouche et elle fut placée devant lui à une distance visuelle optimale. A côté, on en plaça une autre, également inhabituelle, qu’il n’avait pas sucée, ni vue avant. Ensuite on retira les bandeaux. D’après le modèle des fixations visuelles du nouveau-né vers les deux sucettes, il était clair que le bébé avait reconnu celle qu’il avait sucée. En fait, il s’était créé une certaine représentation d’un objet qu’il avait expérimenté dans le mode tactile, et l’avait tout de suite reconnu lorsqu’il lui avait été présenté dans le mode visuel. Cette correspondance transmodale a été effectuée sans aucun essai d’apprentissage. C’était un échange transmodal “intuitif”.

Un deuxième exemple comporte le transfert modal d’une forme temporelle. Lewkowicz (1992) présenta un motif rythmique simple, comme (- – . . – - . . etc.) à des nouveau-nés. Après qu’ils se furent familiarisés avec ce motif, on leur montra deux dessins, l’un présentant l’analogue visuel du motif rythmique qu’ils avaient entendu, l’autre indiquant une variante, par exemple (-. –. –. –. etc.). D’après la répartition des fixations visuelles des bébés sur les deux dessins, il était clair qu’ils avaient reconnu la traduction du nouveau motif sonore sans avoir eu besoin d’aucune forme d’apprentissage.

On admet maintenant assez bien que les enfants en bas âge sont capables d’effectuer le transfert des formes temporelles du mode auditif au visuel et vice-versa, et celui des formes physiques du mode tactile au visuel, comme mentionné ci-dessus. Ils peuvent aussi transférer l’intensité, en tant que qualité, du mode auditif au visuel (Lewkowicz et Turkewitz 1980). En bref, le nouveau-né est muni très tôt d’un bon moyen de se représenter des formes, y compris des formes temporelles, dans un certain format supra-modal, de telle sorte qu’une expérience quelconque (toucher, vision, mouvement), impliquant une forme temporelle, peut avoir un correspondant sonore. A la lumière du sujet de notre colloque, “temps et forme”, le bébé est prédestiné pour gérer ces qualités premières de l’expérience, et pour les traduire librement dans les diverses modalités de présentation. (L’intensité devrait être ajoutée à cette liste de qualités premières.) Le bébé naît, prêt à gérer le temps et la forme, même si c’est à un niveau primitif.

Pourquoi un bébé a-t-il besoin de ces capacités ?

On pense que l’esprit humain traite plusieurs sensations simultanément. Chaque sensation est probablement traitée séparément, voire enregistrée dans des parties quelque peu différentes du cerveau. Ces diverses informations restent partiellement indépendantes l’une de l’autre. Ce phénomène est appelé “traitement distribué parallèlement”, ce qui le décrit bien. Un problème fondamental survient lorsqu’il s’agit de déterminer comment ces différentes sensations sont “réunies” pour former une perception globale d’un événement, qu’il s’agisse d’un événement social, où les composantes séparées sont visuelles, auditives, tactiles et kinesthésiques, etc., ou d’un événement purement sonore, où les composantes séparées peuvent être la hauteur, le tempo, l’intensité, la qualité de l’instrument, la diversité des sources spatiales, etc. Ce problème est appelé “agglomération”. Actuellement, on pense que le cerveau procède à l’agglomération en envoyant plusieurs fois par seconde un signal aux différentes parties du cerveau, où les diverses informations sont traitées. Ces signaux synchronisés testent ce qui ce passe pendant un très bref laps de temps dans toutes les parties du cerveau, qui, lorsqu’elles sont regroupées, constituent un “maintenant”. Il y aurait donc plusieurs “maintenants” chaque seconde. Sans un tel mécanisme, il serait impossible d’avoir des expériences cohérentes, intégrées et totales (Damasio 1994).

Nous supposons que les bébés sont dotés d’un mécanisme similaire, dès le début de leur vie, de sorte qu’eux aussi peuvent avoir des expériences cohérentes, y compris les expériences sonores. Cependant, ce processus dépend de capacités de minutage raffinées et précoces.

Le bébé doit aussi être muni de certaines capacités innées pour traiter les formes et les traduire d’une modalité à l’autre. Sans cette capacité, il n’y aurait pas de résonance empathique. Et, de plus en plus, nous en venons à considérer l’empathie comme indispensable pour les relations humaines affectives. Sans une capacité quelconque – telle que l’imitation – à pénétrer empathiquement les manifestations des sensations subjectives d’autrui, la résonance ou contagion émotionnelle et l’identification n’existeraient pas. Et tous ces phénomènes dépendent de la capacité d’opérer des transferts modaux de la forme. Par exemple, si un bébé veut imiter quelqu’un qui tire la langue, ce qu’il peut faire dès les premières semaines de sa vie, il est nécessaire qu’il voie la forme (le motif visuel) d’un visage exécutant le geste facial, ensuite il doit traduire cette forme dans un mode kinesthésique impliquant les muscles de son propre visage, (qu’il ne voit pas et qu’il n’a jamais vu). Sans ce genre de transfert modal, l’imitation ne peut se produire. De même, à trois mois, le bébé peut reproduire fidèlement plusieurs notes vocalisées, une mélodie simple (Papousek et Papousek 1979). Pour exécuter cette imitation sonore, l’enfant doit transposer un motif sonore entendu en un motif kinesthésique exécuté par ses cordes vocales et perçu kinesthésiquement, avec le retour sonore, bien sûr.

C’est en grande mesure grâce à ces transferts modaux d’information de forme et de mesure du temps, de l’autre à soi, que nous pouvons comprendre émotionnellement ce que c’est que d’être l’autre et que nous pouvons nous identifier à lui. Dans un certain sens, nos systèmes nerveux peuvent être “captivés” par les expressions de vitalité qui émanent des autres, ou qui proviennent de la musique. C’est de cette façon que la musique, elle aussi, est traitée et “pénètre” dans l’esprit et le corps de l’auditeur pour ravir ses sentiments.

L’environnement sonore des nouveau-nés

Si l’on se place du point de vue du nourrisson, il ne faut pas oublier que celui-ci ne comprend pas ce que ses parents disent, il ne comprend pas non plus avec une grande précision de nombreux gestes qu’ils exécutent. Par conséquent, il est baigné dans un environnement de son et de mouvement, où sa première tâche est d’analyser ces courants de stimulation en des unités de plus en plus chargées de sens. Ses parents lui facilitent la tâche en s’engageant intuitivement dans des variations du comportement social normal, qui ont été élucidées par les bébés. “Le langage de bébé” en est l’exemple le plus évident. Lorsqu’ils parlent à un bébé, presque tous les adultes, et même les enfants plus âgés, modifient leur discours normal : ils haussent la hauteur de leur voix, exagèrent la ligne mélodique, ralentissent le tempo, simplifient les phonèmes choisis, etc. Cet ajustement aux bébés semble être universel (Ferguson 1964). Les parents effectuent également des variations temporelles correspondantes dans leurs gestes et expressions faciales (Stern 1977).

Ces modifications semblent destinées à mieux permettre au bébé d’analyser et de créer du sens à partir de son environnement sensoriel. Après tout, le bébé comprend la musique bien avant de comprendre les paroles d’une chanson. En fait, sa capacité à apprendre le langage est en grande partie facilitée par sa compréhension préexistante de la prosodie.

Pendant la première année, la tâche principale des parents est de réguler les états du nouveau-né : états de faim, de sommeil, d’activité, d’éveil, de joie, de curiosité, etc. Il y a plusieurs façons de le faire, mais elles impliquent toutes la manipulation du temps et de la forme.

Avant que le langage ne fasse son entrée en scène, pendant la première année de la vie du bébé, la mère et le bébé s’entendent par le biais de formes temporelles non-verbales et non-symboliques. Il s’agit d’un monde différent. C’est une façon d’être ensemble qui n’a jamais été formellement enseignée ou apprise. Elle repose sur l’intuition de la mère, sur sa lecture des signaux, sur la façon dont elle sent ce qu’il faut faire et comment elle va le faire, plus que sur son savoir. Les exemples suivants présentent chacun une dimension nouvelle de l’emploi que font les parents du temps et de la forme pour réguler l’interaction socio-affective.

L’exemple de l’apaisement

La mère peut agir comme régulateur pour moduler le taux ou le tempo d’activité du nouveau-né. Par exemple, si le bébé pleure, dans un état d’éveil et d’activité élevés, sa mère va probablement s’adresser à lui dans un discours qui a un tempo aussi rapide, voire un peu plus rapide, que celui de son activité. Elle va dire quelque chose comme : « hey. hey. hey. hey. » Quand sa vitesse correspond à ou dépasse celle du bébé, celui-ci va sans doute se taire un instant. La mère l’a accroché à son tempo. Ensuite, elle va progressivement ralentir son tempo, faisant ralentir celui du bébé avec le sien. Beaucoup de berceuses fonctionnent de cette manière. Si les boîtes à musique que l’on remonte et qui jouent des berceuses fonctionnent, c’est aussi parce elles s’arrêtent en ralentissant progressivement. Cet usage du tempo pour donner le rythme peut aussi fonctionner pour augmenter le niveau d’éveil du bébé. C’est une des façons les plus simples employées par les parents pour réguler les nouveau-nés.

L’exemple de la nourriture

Lorsqu’un bébé affamé saisit la tétine ou le sein et commence à téter, la mère (sans y penser) reste remarquablement calme et immobile. Pendant la première phase du repas, qui dure une à deux minutes, le bébé boit avec une grande avidité et ingurgite beaucoup de lait, avec un travail de succion extrêmement sérieux. Pendant ces premières minutes, la plupart des mères ne parlent pas, ne bougent pas, ne changent pas de position ni ne secouent leur sein ou le biberon. Elles ne font rien qui puisse déranger l’intense travail du nouveau-né ou interrompre sa consommation.

Puis, après un moment, lorsque la phase initiale se termine, le bébé commence à se relaxer physiquement. La succion se ralentit. Il commence parfois à regarder autour de lui. A ce moment débute la seconde phase du repas. Il commence à être rassasié et il est prêt à regarder, écouter et toucher pendant qu’il continue à se nourrir à un rythme moins élevé. La mère ressent intuitivement ce changement de rythme et de tonus dans le repas du bébé. Ses actes changent. Elle agit comme si elle devait à présent jouer un rôle plus actif pour maintenir sa consommation de lait. Quand le bébé commence à relâcher sa succion, ou à être trop attiré par le monde autour de lui, ou s’il commence à devenir “paresseux” voire endormi, la mère ajoute automatiquement quelque chose ou varie sa stimulation pour inciter son système nerveux et le recentrer sur la tâche de succion. Elle va peut-être secouer son mamelon ou le biberon. Ce geste provoque habituellement un nouvel élan de succion vigoureuse. Mais si cela ne fonctionne pas, ou échoue à la deuxième ou troisième tentative, elle doit recourir à un niveau plus élevé de stimulation pour attirer à nouveau l’attention du bébé, le recentrer sur son travail et faire redémarrer la succion. Elle peut donc commencer à lui parler, ou faire gentiment rebondir de haut en bas le bras qui lui maintient la tête.

La mère agit comme un chef d’orchestre, (parfois c’est l’enfant qui est le chef d’orchestre). Elle fait intervenir différents instruments dans son jeu (secouer, rebondir, parler, etc.) et elle réajuste le volume si nécessaire, pour garder le bébé au bon niveau d’éveil et d’attention. Et si cela ne fonctionne pas et qu’elle est convaincue qu’il va (et doit) boire plus de lait, elle va augmenter la mise en introduisant les percussions. Elle va se lever de son siège, parler au bébé, secouer le biberon et faire rebondir son bras simultanément. Dans la phase finale du repas, le bébé a presque terminé et il tète très légèrement, par intermittence. Il est à la limite entre la nourriture et le sommeil. Si la mère sent qu’il peut encore boire un peu plus, elle va moduler son état d’éveil d’une façon plus fine et plus douce, en employant des stimulations qui ne soient pas d’une force à le réveiller en sursaut, en le faisant probablement pleurer, ni d’une faiblesse à n’avoir aucun effet sur le bébé, qui va simplement s’endormir. Elle n’a besoin que d’un violon. A ce moment, elle va probablement saisir une de ses mains dans la sienne, alors qu’elle lui donne encore le sein. Elle commence ensuite une danse des mains très calme, très lente avec le bébé, une sorte de pas de deux ou duo pour doigts. Sans y penser, elle offre une stimulation douce, constamment variée, juste suffisante pour maintenir le bébé somnolent dans un état d’éveil suffisant pour qu’il termine son repas. Et lorsque c’est fait, elle s’arrête, et reste à nouveau calme et immobile pendant un moment, comme au début du repas, alors que le bébé sombre dans un profond sommeil. Alors seulement elle le prend et le met au lit pour qu’il fasse la sieste.

Ce que nous avons décrit est un événement tout à fait commun, simplement un des nombreux repas de la journée. Mais il s’agit également d’un chef-d’œuvre d’interaction humaine, orchestré avec finesse, qui se produit en grande partie inconsciemment. Souvent, lorsqu’on observe un tel repas, on pense à certains compositeurs, comme Beethoven, qui utilisent si bien la reprise d’une phrase avec des variations de volume ou de couleur, pour retenir l’attention de l’auditeur et l’emmener avec lui.

L’exemple du jeu

Le plus frappant avec le jeu, pendant les six premiers mois de la vie, est le fait qu’il n’a pas de but pratique. Il n’y a pas de lait à boire. Il n’y a pas de langes à changer. Le seul but est de s’amuser, et pour ce faire, il faut improviser. (Il est vrai que le meilleur moyen d’instruire un nouveau-né est par le biais du jeu. Mais apprendre n’est pas le but du “jeu libre”, ce n’est qu’un effet secondaire désirable.) A cause de ce manque de but concret, le jeu est une activité des plus inhabituelles. C’est à la fois la chose la plus simple à faire au monde et aussi la plus difficile. Il ne faut pas oublier qu’à cet âge, le bébé ne peut pas parler, ne peut pas encore manipuler des objets, ne peut pas se déplacer et ne comprend pas les mots qu’on lui dit. Cela limite le jeu à des sons qui peuvent être émis ensemble, des expressions faciales qui peuvent être échangées, des regards qui se croisent et se détournent, des mouvements et des gestes, et le partage d’émotions et d’excitation. Le jeu est limité à l’essentiel de l’interaction humaine. C’est une activité simple, pure et non-réfléchie. C’est de l’improvisation, sans encombre.

Cependant, cette improvisation parent/enfant nécessite quelques contraintes pour fonctionner. Les bébés “s’habituent” très rapidement à une stimulation répétée, c’est-à-dire qu’ils perdent vite de leur intérêt, si une chose identique est reproduite deux ou trois fois successivement. La présentation des stimuli (les sons ou expressions faciales qui sont composés) doit varier constamment et légèrement pour maintenir le même niveau d’intérêt, d’excitation et de plaisir chez le nourrisson. A l’opposé, si chaque stimulation successive est très différente et sans lien avec la précédente, on risque de perdre la continuité. Il en résulte que le parent est amené à utiliser une forme de thème et variations.

Les parents le font intuitivement. Par exemple, si la mère et son bébé de trois ou quatre mois se retrouvent face à face, pendant qu’elle le change, ou après que le bébé se soit réveillé, ou n’importe quand, se regardant simplement l’un l’autre pendant un moment, la mère va probablement dire : « Hi honey »1, une salutation qui invite à commencer un jeu. Le visage du bébé va s’illuminer un peu. Le thème a été énoncé, il s’agit de l’environnement sonore qui englobe le mot “honey”. La phrase « Hi honey » a pour fonction d’intéresser et de plaire au bébé. La mère va ensuite énoncer une série de variations comme :

« Hi honey »

« Yeah, hiya honey »

« You are my honey »

« Aren’t cha honey »

« My little honey »

Chaque phrase est formée sur le moment pour ajuster le niveau de stimulation au mieux afin d’engager le bébé dans un échange social et de moduler son niveau d’animation selon ses réponses à la phrase précédente. Tout cela est fait sans trop y réfléchir. C’est de l’improvisation sociale autour d’un thème sonore, de la sorte la plus fondamentale. C’est à la fois banal et extrêmement subtil.

Un autre exemple peut nous être utile pour illustrer le développement de ces thèmes et variations. Cette fois-ci, il concerne un jeu, en fait l’un des plus populaires parmi les jeux de bébés qui sont joués sur toute la planète : « I’m gonna getcha » (« Je vais t’attraper »), Il fonctionne ainsi. Le bébé est couché sur le dos. La mère introduit le thème principal. Elle se penche sur le bébé, promenant ses doigts sur son ventre et sa poitrine, en direction du cou et, lorsqu’elle commence à promener ses doigts, elle dit : « Je vais t’attraper ». (“Attraper” signifie bien sûr saisir le cou sous le menton.) Le bébé réagit immédiatement avec plaisir. La mère répète ensuite le thème une seconde plus tard. Les bébés sont très doués pour mesurer de brefs intervalles de temps. Donc, après la seconde fois, il “sait” que sa mère va promener ses doigts sur son ventre pour la troisième fois dans environ une seconde. (Il regarde la préparation de sa mère pour la promenade de doigts suivante.) Mais cette fois-ci, la mère introduit une première variation. Elle retarde son geste d’environ 1/2 seconde et rallonge la phrase « Jeeee vais t’attraaaaaper ! » L’attente du bébé est accrue et, avec elle, son niveau de suspense et d’excitation augmente. Le bébé attend maintenant la prochaine promenade de doigts 1 1/2 seconde après la dernière. La mère introduit par conséquent une nouvelle variation. Elle attend, retenant la prochaine promenade de doigts pendant une seconde entière, de telle sorte que le bébé doit attendre deux secondes avant que sa mère ne dise : « Jeeee vaiiiiiiis t’aaaaattraaaapeeer ! » avec une voix encore plus aiguë qu’auparavant et avec encore plus de suspense. Le bébé gigote de plaisir avec une vive impatience. A ce moment, il pense que sa mère va accroître l’échéance un peu plus à chaque fois – une sorte de jeu de violations temporelles augmentant progressivement. (On peut se demander comment un bébé peut faire tout cela, mais c’est remarquablement simple. Fondamentalement, ce n’est guère différent que de garder un rythme. A tout âge, nous sommes extrêmement sensibles à un quelconque changement de rythme ou à n’importe quelle inexactitude, qu’elle soit en avance ou en retard par rapport à la pulsation, ce qui est le cas ici.) Donc, le bébé estime que la cinquième promenade de doigts débutera environ trois secondes après la dernière et il commence à se préparer. C’est alors, avant que le bébé ne soit vraiment prêt, que la mère introduit la dernière variation qui donne du piquant au jeu. Elle entame sa dernière promenade une seconde après la précédente, bien avant que le bébé ne se soit imaginé qu’elle arrive. Le jeu se termine lorsqu’elle lui chatouille le cou en disant : « ATTRAPÉ !!! ». Cette variation viole l’attente du bébé en raccourcissant le temps d’attente plutôt qu’en le rallongeant comme les autres fois. Le bébé, dont tout le système nerveux a été tendu au maximum d’excitation positive éclate de rire, lorsqu’il a été attrapé. Et les deux rient ensemble. (Si le summum était arrivé beaucoup plus tôt, le bébé aurait été surpris et se serait probablement mis à pleurer. S’il était arrivé beaucoup plus tard, il aurait perdu de sa force.) Le jeu, un jeu de variations temporelles qui régule l’état du bébé, s’est achevé et un moment magnifique a été partagé.

Dans ce cas, l’improvisation fonctionne dans une structure connue et attendue, à l’intérieur de laquelle il y a beaucoup de place pour jouer avec l’inexorable marche vers le summum anticipé.

Improvisation

La plupart des interactions avec les bébés requièrent l’improvisation, soit parce qu’elles n’ont pas de but spécifique mais seulement un processus, comme les jeux libres, ou soit parce qu’il y a un but mais aucun moyen n’est spécifié pour y parvenir. En fait, il y a un macro-but, par exemple manger ou s’amuser. Et il y a des micro-buts qui forment un “processus de passage” permettant de parvenir au macro-but. L’improvisation se produit au cours de ce “processus de passage”. Il consiste en des régulations constantes, des ruptures, des continuités, et des moments d’affectivité accrue (Lachmann et Beebe 1996). Il comprend aussi le réajustement constant ou la redécouverte du but vers lequel le système est généralement dirigé. L’interaction dyadique est extrêmement complexe, comportant de nombreuses parties indépendantes et semi-indépendantes (actions, expressions, affects, etc.). On le comprend mieux en termes d’un système dialogique dynamique, qui change très rapidement. Il s’agit là des systèmes que la théorie des systèmes dynamiques tente de comprendre (par exemple pour le développement : Thelen et Smith 1994).

De tels systèmes créent des “propriétés émergentes” qui sont des états nouveaux, surgissant pendant l’interaction dynamique, intrinsèque au système. Un exemple en serait le moment où les actions et les sentiments des deux partenaires atteignent un point où, tout à coup, pour des raisons qui ne sont pas très claires, les deux éclatent de rire ensemble. Ce nouvel état dyadique (le rire) n’était pas nécessairement prévisible juste auparavant. Et même si le fait de s’amuser était l’un des macro-buts, la combinaison exacte des événements qui déclenchent le rire et le moment exact de détente ne sont jamais prévisibles. C’est dans ce sens que le rire conjugué est une propriété émergente.

La capacité de tolérer et de rester dans un “processus de passage” qui soit essentiellement une improvisation, est un des aspects les plus essentiels, sinon difficiles, des interactions nonverbales entre parent et nouveau-né. De la part des parents, il demande beaucoup de spontanéité et de capacité à vivre le moment présent. Mais lors de l’accomplissement de tels moments, le bébé a reçu une leçon et s’est familiarisé avec le procédé d’improvisation. Une familiarité qui est probablement généralisable à tout autre forme d’improvisation, musicale ou autre.

Représenter les états d’esprit

En psychologie, et en particulier en psychanalyse, on tend à penser que les événements et les sentiments qui se produisent momentanément au présent, prennent forme après le fait, lorsqu’ils sont (re) construits symboliquement ou verbalement – l’“après coup”. Chez les nouveau-nés à un stade pré-verbal et présymbolique, la nécessité de construire un après coup est absente ou minimale pendant longtemps. Cela renforce la mise en forme d’une expérience pendant son déroulement. Pour permettre ce changement de focalisation, nous avons besoin d’une notion plus développée du “moment présent” que celle qui était nécessaire lorsque l’après coup supportait la plus grande part de la structuration de l’expérience. Cependant, de telles notions ont été bien plus développées en philosophie et en musicologie que cela n’a été le cas en psychanalyse.

Il y a une longue tradition philosophique de l’exploration du temps subjectif et de la recherche d’un “présent” ayant une extension structurée, de Saint-Augustin à Husserl et Heidegger. De même, il a été nécessaire pour les musicologues de penser en termes d’un présent subjectif qui a une certaine “épaisseur” et qui contient une unité de sens dynamique, révélée au moment présent (Darbellay 1992). Une notion similaire est nécessaire pour l’expérience d’interaction interpersonnelle non-verbale des nourrissons.

Nous avons tenté de la développer au moyen du concept “d’enveloppe proto-narrative” (Stern 1995). L’idée de base est que l’expérience interpersonnelle continue est découpée grâce à la capacité de pensée narrative. On suppose que la pensée narrative est un moyen universel par lequel tout le monde, y compris les nouveau-nés, perçoivent et réfléchissent sur le comportement humain (Bruner 1992). Elle comporte deux aspects simultanés et corrélés : une intrigue et une ligne de tension dramatique (Labov 1972).

L’intrigue est l’unité qui relie le “qui, où, pourquoi, quoi, quand et comment ?” de l’activité humaine. Elle tourne autour de la perception du comportement humain en tant que motivé et dirigé vers un but. Chez le nouveau-né, le sens de l’intrigue peut être relativement rudimentaire, comportant des actions motivées qui tendent vers une échéance et puis qui se résolvent.

La ligne de tension dramatique, l’autre aspect de la structure narrative, est le contour des sentiments, tels qu’ils émergent au moment présent. Nous avons appelé cela la “forme temporelle des sentiments” d’une expérience. C’est très proche de ce que la philosophe Susan Langer a appelé “les formes de sentiments”, qui sont évoquées par la musique (Langer 1967). Ces formes temporelles de sentiment perçoivent les sensations en tant que telles : accélération, décélération, augmentation, crise atteinte, etc. Ces formes temporelles subjectives fournissent à la fois les limites du moment présent et offrent à ce dernier l’épine dorsale sur laquelle l’intrigue se déroule et est révélée.

Nous supposons que ces enveloppes proto-narratives sont les fondements de la connaissance implicite contenue dans la connaissance humaine relationnelle. Ce qui est intéressant, à la lumière de ce colloque, est le fait que les unités subjectives les plus petites (les moments présents), desquelles dépend l’appréciation affective de la musique, sont d’un concept très similaire aux unités subjectives de base sur lesquelles est construite une compréhension des relations interpersonnelles non-verbales.

Conclusion

Bien que le temps et la forme en musique sont, sous bien des aspects, uniques, ils partagent néanmoins quelques caractéristiques fondamentales avec les interactions non-verbales qui constituent nos premières relations. Il semble que nous ayons affaire à quelques tendances humaines communes, qui sont utilisées et réutilisées de diverses façons, avec des variantes culturelles différentes, dès le début de notre vie, dans toutes les formes d’expressivité humaine.

Références

Damasio, A. R. (1994), Decartes Error. New York, Grosset/Putnam.

Darbellay, E. (1995), « Continuité, cohérence et formes de temps. A propos des Night Fantasies d’Elliott Carter », Saggiatore Musicale, 2, 297-327 [version révisée de : « La composante de la temporalité comme critère d’analyse des Night Fantasies d’Elliot Carter. » (1992)].

DeCasper, A. J. and Fifer, W. P. (1980), « Of human bonding. Newbom’s prefer their mother’s voices », Science, 208, 1178-76.

Bruner, J. (1990), A et.s of Meaning. Cambrige, Harvard University Press.

Ferguson, C. A. (1964), « Baby talk in six languages », in The Ethnography of Communication. Eds. J. Gumpers and D. Hymes, 66, 104-14.

Labov, W. (1972), Language in the Inner City. Philadelphia, University of Pennsylvania Press.

Lachmann, F. M. and Beebe, B. A. (1996), « Three principles of salience in the organization of patient-analyst interaction », Psychoanalytic Psychology, 13 (1), 1-22.

Langer, S. K. (1967), Mind. An essay on human feelings. Baltimore Md., Johns Hopkins Universities Press, vol. I.

Lewkowicz, D. J. (1967), « The development of temporally based intersensory perception in human infants », in Time, action and cognition. Eds F. Macar [et al.], The Netherlands, Kluwer Academie Publishers, 33-43.

Lewkowicz, D. J. and Turkewitz, G. (1980), « Cross-modal équivalence in early infancy. Audio-visual intensity matching », Developmental Psychology, 16, 597-607.

Meltzoff, A. N. and Borton, W. (1979), « Intermodal matching by human neonates », Nature, 282, 403-4.

Meltzoff, A. N. and Moore, M. K. (1977), « Imitation of facial and manual gestures by human neonates », Science, 198, 75-8.

Papousek, H. and Papousek, M. (1981), « Musical éléments in the infant’s vocalization. Their significance for communication, cognition and creativity », in Advances in Infant Research. Ed. L. P. Lipsitt, Norwood, N. J., Ablex.

Stern, D. N. (1977), The First Relationship. Infant and Mother. Cambridge, Harvard University Press.

Stern, D. N. (1985), The Interpersonal World of the Infant. New York, Basic Books.

Stern, D. N. (1995), The Motherhood Constellation. A unified view of parent-infant therapy. New York, Basic Books.

Thelen, E. and Smith, L. B. (1994), A Dynamic Systems Approach to the Development of Cognition and Action. Cambridge, M.I.T. Press.

Tomkins, S. S. (1962), Affect, imagery and consciousness. The positive affects. New York, Springer, vol. 1.

Discussion après la conférence de Daniel Stern

Question  ?

Réponse Quand la mère fait quelque chose, l’enfant en perçoit le contour immédiatement. Pensez qu’à dix jours, l’enfant reconnaît le pattern de l’allaitement. Nous avons fait des expériences en échangeant les infirmières qui le font. Au moment du changement, l’enfant est dérangé. Il est possible de comparer cette expérience à celle qui touche aux styles d’improvisation : j’ai vu des enfants qui improvisaient au piano sans avoir jamais fait de musique par exemple. Certains de ces enfants, – c’est absolument passionnant – ont ce je-ne-sais-quoi qui leur est personnel, c’est leur manière de s’exprimer. La mère, quand elle allaite l’enfant ou quand elle joue, est en train d’aider l’enfant à se représenter sa manière de faire les choses. Je crois que les enfants ont clairement conscience de ces changements.

Question (Jean-Pierre Boon) Vous avez dit que l’enfant peut reconnaître graphiquement un rythme qu’il a perçu de façon sensorielle ; comment est-ce que vous représentez le rythme pratiquement ?

Réponse Avec des traits et des points.

Question (J.-P. B.) Et il le reconnaît ?

Réponse Oui, absolument. C’est archi-simple.

Question (J.-P. B.) Vous avez dit qu’il y a une interaction, un jeu d’attente comblé ou déçu, avec le graphique que vous avez fait ici, entre la mère et l’enfant. Selon les stimulations qui sont données à un certain intervalle, l’enfant va attendre que cela se reproduise dans le même intervalle. Est-ce que cette attente est déjà créée après deux stimulations ?

Réponse Oui, deux stimulations suffisent, parce que l’enfant, comme nous, doit prévoir l’avenir. Il faut savoir ce qui va se passer : à chaque moment l’enfant forme une hypothèse sur l’avenir immédiat, qui est confinnée ou non. Si elle n’est pas confirmée, c’est fascinant ; mais si elle est trop “non-confirmée”, ça dérange. Il y a ainsi une échelle dans laquelle c’est acceptable, et au-delà de laquelle c’est trop ou trop peu.

Question J’aimerais en venir à un autre point. Vous donnez une bouteille à un bébé qui a les yeux bandés, puis vous lui en montrez deux. Est-ce que l’enfant va remarquer qu’elles sont différentes ?

Réponse Ce sont les qualités primaires des objets qui sont conservées : le temps, la forme, la quantité. Ce ne sont que ces trois choses qu’on peut transférer facilement entre les modèles, mais pas le goût.

Question J’ai cru comprendre qu’entre deux biberons, l’enfant reconnaissait celui qu’il avait sucé les yeux bandés ?

Réponse Oui. Les deux biberons ne sont pas identiques. L’enfant ne les a jamais vus. On lui en donne un qu’il suce. Il reconnaît l’autre. C’est un grand mystère. Je ne puis vous dire combien d’expériences sont actuellement conduites en psychologie expérimentale pour mieux comprendre ce qui se passe. Beaucoup ont été disqualifiées parce qu’incroyables, pour de nombreuses raisons. Nous réalisons, et l’enfant réalise avec nous, cette capacité d’utiliser correctement l’imitation. Et je la compare à l’exemple de la variation en musique parce que l’expérience de l’imitation est proche de celle qui tente de comprendre la variation musicale. Ce que l’enfant fait en touchant un objet, est parallèle à l’imitation d’une personne. C’est sa manière d’explorer les liens entre l’objet et lui-même. Nous étudions également ces transformations par rapport aux quantités, en comparant par exemple l’intensité lumineuse et sonore. Ce qui est passionnant est la nécessité d’une certaine sorte de “matching” absolu selon la quantité. Nous avons réalisé avec des adultes des expériences de comparaison (“matching”) de quantité entre deux expériences, de son et de lumière : la question était : « quel niveau de son correspond à quel niveau de lumière », et, connaissant la réponse, nous reportions l’expérience sur les enfants.

Question Les informations que vous donnez sont-elles basées sur une quantité importantes de données ?

Réponse Oui. Il existe des statistiques assez importantes ainsi que de nombreuses études. Un des grands problèmes est la fragilité de ces expériences, qu’il faut donc multiplier. Le fait est qu’aujourd’hui, nous connaissons mieux les premières années que tout le reste de la vie de l’enfant.

Question On a parlé de l’improvisation de la mère. Est-ce que l’enfant reste silencieux lorsqu’elle improvise ?

Réponse Non, absolument pas. Il participe activement avec son visage. C’est un duo.

Question Mais il n’y a pas d’expériences qui montre qu’un dialogue sonore s’établit ?

Réponse Si. Après trois mois, le bébé commence à bafouiller. Un petit jeu de duo s’installe et on peut observer cette interaction.

Question (Hervé Thys) Ce qu’on connaît du babil de l’enfant est expérimenté sans la présence de la mère. La situation est là totalement différente de celle que vous décrivez. Il babille dans son berceau, et cesse dès que la mère intervient. Il “improvise”…

Réponse Je ne saisis pas bien la différence entre “exploration” (avec la main par exemple) et “improvisation”…

Question Vous évoquez des situations très fines d’interaction entre la mère et l’enfant. Ce n’est donc pas à la portée de chacun de les réaliser. Peut-on dire que la mère est “précâblée” pour réussir cette interaction ?

Réponse Oui, elle l’est en partie. Cette interaction mère-enfant est très fine, subtile. C’est un phénomène dynamique, donc sujet à évolution, essais, ruptures et erreurs. Les ruptures doivent être réparées. La mère sait comment le faire, comment improviser pour y parvenir. Toutefois la chose est souvent assez difficile pour les deux. Dans ce sens, la mère n’est en quelque sorte, pas plus “précâblée” que l’enfant. Elle apprend. Elle est seulement “précâblée” pour réaliser intuitivement un schéma de thème et variations, dans lequel elle a le pouvoir de “régler” l’enfant par des changements de temps et de son. Une soif de nouveauté est innée chez tous les enfants.

[La suite de la discussion (peu intelligible dans l’enregistrement) porte sur la nature de cette évaluation du temps chez l’enfant, son appréhension d’une échéance, sa capacité – postulée par D. Stem – de reconnaître une forme globale de temps dans l’expérience. D. S. évoque une expérience conduite dans un pensionnat pour “autistes” en Roumanie où les enfants, qui ne manifestaient aucune réaction, se sont tout de suite mis à sourire et à réagir au jeu « attrape-moi », ce qui montre leur préparation innée à cette saisie du rythme.]

Question Est-ce qu’on peut dire qu’il y a une corrélation univoque entre, d’un côté, ce type de contour affectif et, de l’autre, un type d’organisation temporelle au sens strict, qui permettrait d’établir une correspondance régulière entre un modèle rythmique par exemple, et un contour affectif ? Pourrait-on considérer cela comme un type d’organisation intermodale ?

Réponse Dans la plupart de cas, il ne semble pas que cela soit vrai. Pourtant, il y a des “styles personnels” qui sont assez marqués. On peut reconnaître quelqu’un de dos à sa démarche par exemple. Ces modes d’être personnels jouent un rôle fondamental dans la structure des interactions intimes et sont reconnus. Dans ces interactions affectives et sociales, le temps subjectif est structuré.

Question Ces interactions sont-elles les mêmes pour filles et garçons ?

Réponse Statistiquement non. En majeure partie, la régulation chez les filles est plus large dans les changements que chez les garçons. Mais surtout il existe des différences entre les termes traditionnels du père et de la mère : même si c’est le père qui s’occupe de l’enfant, la mère perçoit avec beaucoup plus de finesse cette relation : c’est un autre cadre d’intensité et de changements. Il y a aussi certaines différences de modalités selon le sexe du bébé : si c’est un fille qui suscite la réaction des parents, il est probable que leur réponse se fera par un son ; si c’est un garçon, cette réponse sera physique : toucher, bouger, sentir les choses.

____________

1 Le texte du jeu est difficilement traduisible en français sans qu’il ne perde de sa musicalité ; c’est pourquoi, je le laisse en anglais. La traduction française donne quelque chose comme : « Bonjour chéri, oui, salut mon chéri, tu es mon chéri, n’est-ce pas mon chéri, mon petit chéri ». (NdT)