A peine entrée dans le showroom de l’Idiap à Martigny un avatar, censé me représenter, s’affiche sur grand écran. Je me déplace, le petit bonhomme fait de même. Tel un reflet dans un miroir, il reproduit mes mouvements. Mieux encore, il semble parler dès que je prends la parole. Les huit microphones et quatre caméras qui quadrillent cette salle traquent mes faits et gestes et les retransmettent à un algorithme de détection de personne.

«Les caméras mémorisent la salle et se concentrent uniquement sur les éléments considérés comme nouveaux», explique Flavio Tarsetti, ingénieur en informatique à l’Idiap. C’est un peu comme la Wii (ndlr: la console intuitive de Nintendo), à la différence près que l’utilisateur n’a pas à rester au même endroit. Cette technologie pourrait donner naissance à une nouvelle génération de jeux ou permettre de détecter des bagages laissés sans surveillance dans une gare ou un aéroport. Un abandon de valise serait automatiquement signalé.»

Autre exemple amusant que l’on découvre au sein de cette vitrine destinée à présenter de manière ludique quelques-unes des technologies de l’Idiap: le casseur de briques sans souris. Il suffit de bouger la tête de gauche à droite pour déplacer le curseur et renvoyer la balle. A la fin de la partie, il est demandé: «Rejouer à nouveau?»

Je fixe la phrase quelques secondes et une nouvelle partie se met en marche. «Un système de détection du visage remplace la manette, le clavier ou la souris», explique Flavio Tarsetti. L’Idiap cherche à donner un sens à l’information visuelle et sonore. «Nous aimerions combiner les capacités du cerveau humain aux capacités de calcul des ordinateurs», souhaite Flavio Tarsetti.

Ecrans tactiles avec mini-films de présentation et démonstrations interactives, la salle «vitrine» de l’Idiap, inaugurée en 2009, présente également des technologies de traitement de la parole.

Flavio Tarsetti présente sur un écran deux modèles sonores différents. L’un retranscrit la parole et l’autre le bruit. Le signal vocal d’un discours, par exemple, est transformé par des chaînes d’algorithmes. L’information non pertinente, à l’exemple des silences ou du bruit, est supprimée. Le signal est alors comparé à un modèle de la voix préalablement enregistré.

A partir de tel outil, l’institut a développé, en collaboration avec la start-up Klewel et l’Etat du Valais, un système permettant de rechercher une intervention parlementaire en fournissant le nom de l’intervenant ou/et le sujet de l’intervention. Une partie des sessions parlementaires du Grand Conseil valaisan de 2009 ont été préalablement enregistrées et archivées.