IA et Magritte, ou comment le KMSKA a redonné vie à la voix du peintre iconique

Jusqu’au 22 février, les visiteurs peuvent s’immerger dans l’univers de l’artiste moderne avec Magritte. La ligne de vie. L’exposition s’appuie sur une conférence unique que le peintre lui-même a donnée au KMSKA en 1938. L’intéressante plongée dans les pensées de Magritte sur l’art et la société n’est cependant pas seulement illustrée par une importante sélection de son œuvre. Des citations de sa conférence, récitées par la voix reconstruite du surréaliste belge, accompagnent également la visite.
Comment commencer un projet aussi innovant ?
Pour créer la voix IA, nous avons utilisé ElevenLabs, une plateforme spécifiquement dédiée aux applications audio basées sur l’IA. À partir de fragments audio existants, un modèle de voix est créé, qui permet ensuite de convertir ses propres textes — dans ce cas, sa conférence — en audio. Plus le matériau source est de qualité, meilleur est le résultat.
Qu’est-ce que cela signifiait dans le cas de Magritte ?
Nous avons reçu un interview existant de lui datant de 1965. Les segments dans lesquels Magritte parlait ont été extraits puis téléchargés sur ElevenLabs. En réalité, le premier modèle vocal était immédiatement utilisable, car l’interview originale était de qualité suffisamment claire.
Curieux de réécouter l’interview originale ? Vous pouvez l’écouter à nouveau ici.
Des défis inattendus surgissent-ils également lors d’un tel processus ?
Nous avons constaté que, dans ce cas, la majeure partie du temps a été consacrée aux éléments dits prosodiques de la parole. Ces éléments comprennent des aspects tels que le rythme, l’intonation et l’accentuation. Ils ont été vérifiés et ajustés tout au long de la conférence lorsque cela était nécessaire. Par exemple, lorsque Magritte parle d’une œuvre, la prononciation de Il peint "Le Chant d’amour" diffère de celle de Il peint le chant d’amour.
Et qu’en est-il de la langue ? Peut-on faire confiance à l’IA pour cela ?
Avec l’aide de collègues et de guides, nous avons écouté la conférence générée en français par l’IA et fourni des retours chaque fois qu’un ajustement de la prononciation était nécessaire. Avec l’aide d’un stagiaire, nous avons également ajouté manuellement de nombreuses courtes pauses tout au long de la conférence. Cela évite que le discours ne se déroule d’un seul tenant, ce qui le rend plus compréhensible pour les visiteurs.
Il s’agit du deuxième projet du KMSKA utilisant l’IA et la reconnaissance vocale. Auparavant, une assistance intelligente pour les visiteurs avait également été développée dans l’atelier de restauration Studio Rubens. Pour en savoir plus, consultez cet article.

Exemple de reconstruction de phrase dans ElevenLabs.



