Retranscrire à la main de longs procès-verbaux de réunions est parfois un casse-tête. Mais grâce à de nouvelles technologies, ce processus peut aujourd’hui être entièrement automatisé. En Suisse, la start-up Recapp IT AG surfe sur cette vague depuis plusieurs années, au point d’avoir créé un outil de reconnaissance vocale capable de retranscrire notamment tous les dialectes alémaniques!

Recapp IT AG est née de la frustration ressentie par David Imseng alors qu’il menait des recherches sur la reconnaissance vocale à l’institut de recherche Idiap à Martigny. «A l’époque, je me sentais coincé dans l’univers de la recherche. Je ne faisais que publier des rapports et construire des modèles qui ne voyaient pas le jour concrètement.» C’est alors qu’en 2013, le jeune ingénieur construit «pour s’amuser» le premier système capable de retranscrire le dialecte alémanique valaisan, considéré comme l’un des plus difficiles à comprendre. «Cette année-là, il n’existait pas encore de système capable de déchiffrer les différents dialectes parlés en Suisse, d’où la nécessité d’agir», explique David Imseng.

Cette première expérience est un succès et, en 2014, il cofonde, avec sa femme Erika, Recapp IT. Aujourd’hui, la société, basée à Viège en Valais, a considérablement développé sa technologie et compte parmi ses clients de nombreux parlements cantonaux, des médias, des étudiants et des particuliers. Grâce à l’intelligence artificielle, le système mis au point est capable de reconnaître les quatre langues nationales, de distinguer les différents dialectes alémaniques ainsi que l’anglais.


Différentes fonctions disponibles

Il suffit d’enregistrer les discussions verbales d’une séance ou d’une interview pour que le logiciel conçu par Recapp IT puisse retranscrire les échanges. Cerise sur le gâteau, une segmentation claire des tours de parole ainsi que la ponctuation et la mise en forme sont automatiquement intégrées au texte. L’outil permet, par ailleurs, de procéder à des recherches par mot clé ou d’indexer des archives audio ou vidéo.

Encore plus loin

Pour fonctionner, la reconnaissance vocale utilise des techniques d’apprentissage automatique, telles que les réseaux neuronaux, afin d’apprendre de quoi est fait le langage. «Le système doit apprendre comment les sons que nous produisons à l’intérieur des mots sont façonnés et comment le langage est structuré. Pour «apprendre» à la machine ces deux caractéristiques, vous devez l’alimenter en données. Elle doit s’instruire à partir d’exemples. Elle réussira alors à déterminer qu’un mot est plus fréquent qu’un autre dans tel ou tel contexte. Elle l’apprendra parce qu’elle le «verra» plusieurs fois», explique Virginie Holm, linguiste informaticienne.

Pour cette spécialiste du langage informatique, nous ne sommes qu’au début du développement de la reconnaissance vocale. Selon elle, la technique a encore un fort potentiel d’évolution. «Je pense que la reconnaissance vocale n’est qu’une étape vers la compréhension même du langage. Les machines devront un jour être non seulement capables de retranscrire des mots, mais aussi de comprendre leur signification et de retransmettre leur message intrinsèque. Il reste encore beaucoup à faire dans cette direction.» De quoi donc bien occuper Recapp IT pour les années à venir.