Intelligence artificielle pour tous

 

Avec « Project Oxford » Microsoft propose à tous les développeurs de rendre leurs applications plus intelligentes. Sur Windows, Mobile ou Web, elles pourront être capables de comprendre le contenu d’une image, identifier des personnes, reconnaitre une voix ou comprendre les intentions des utilisateurs…

technology-791030_960_720

Longtemps l’intelligence artificielle a été loin d’approcher ses promesses. Mais les Big Data, les infrastructures réparties grâce au Cloud, les progrès algorithmiques ont fini par engendrer des avancées significatives. Avec les assistants comme Siri, Cortana et Google Now, les sciences de la compréhension de la voix (et du déchiffrage du sens des phrases) ont progressé.

Reste que les sciences de l’intelligence artificielle demeurent complexes à appréhender et incorporer sa propre IA dans son application relève du défi… C’est dans ce sens que le Projet Oxford Microsoft Re-search a souhaité rendre cela possible. Introduit en mai dernier à la conférence Build 2015, il offre un ensemble de services « intelligents » regroupés en quatre thématiques.

La reconnaissance des visages
: vérifier s’il s’agit de la même personne sur une photo, bien que l’âge, le rasage ou la coiffure diffère. En soumettant une image, un document JSON comprenant les coordonnées des éléments de l’image, nous revient.

Le traitement vocal : implanter du Speech-to-text (reconnaissance de la voix) ou Text-to-speech (synthèse vocale) dans l’application. L’intérêt est de faire en sorte que le moteur de recherche reconnaisse les voix dans des contextes particuliers : des environnements bruyants par exemple.

La compréhension linguistique : comprendre les intentions derrière ce que l’utilisateur prononce ou saisit. Les développeurs peuvent concevoir un modèle adapté à leur domaine, par exemple pour comprendre un jargon médical ou juridique.

La compréhension visuelle : caractériser et hiérarchiser autour de 86 concepts qui permettent de définir s’il s’agit d’une photo de paysage, d’un animal, d’une foule… l’outil sert surtout à alerter lorsque le contenu d’une image viole la politique d’utilisation du développeur.

Toutes les API sont actuellement en Bêta et ouvertes à tous les développeurs. Evidemment, certains outils similaires sont déjà disponibles sur le marché sous d’autres  La documentation et la simplicité de mise en œuvre permettent une prise en main quasi instantanée des outils présentés, ce qui fait sa popularité.