Robots
Des Talking-Heads à Aibo
Trois questions à Frédéric Kaplan, chercheur au laboratoire d'intelligence artificielle de Sony basé à Paris (SCSL) qui travaille actuellement sur un prototype de recherche d'Aibo.
RFI: Le premier Aibo (Artificial Intelligence Robot) se limitait à jouer avec une balle, gambader, et apprécier les caresses. Sur quoi portent vos recherches ?
Frédéric Kaplan: Aujourd'hui, les Aibos qui sont dans le commerce n'ont pas des capacités d'apprentissage très élevées. Nos recherches actuelles portent sur la communication entre les hommes et les robots. Sur ce prototype de recherche, on essaye de voir comment on pourrait apprendre au robot de Sony un certain nombre de mots pour nommer les objets qu'il voit, pour apprendre des parties de son corps ou désigner certains de ses comportements. L'ensemble des fonctions d'interactions supplémentaires que l'on a construites pour Aibo sont dans un ordinateur séparé qui communique avec le robot par une liaison radio. Ce système permet de développer rapidement des nouvelles capacités au robot, sans avoir à travailler directement sur lui.
RFI: L'apprentissage de la parole par Aibo s'est inspiré largement du projet Talking Heads, des machines capables de communiquer. Pouvez-vous nous expliquer la méthodologie utilisée ?
Frédéric Kaplan: L'objectif du projet Talking-Heads (Têtes parlantes) était de créer un embryon de dialogue entre des êtres artificiels. Pour cette expérience, des robots ont observé un objet, puis en ont construit une représentation simplifiée de sa couleur et de sa forme et ont ensuite associé cette représentation à des mots. De la même manière, l'Aibo associe les objets qu'il voit à des mots. Equipé d'une caméra, de microphones et de censeurs de toucher, de distance et d'équilibre, Aibo peut nommer des parties de son corps. Par exemple, dans le cas où je lui caresse la tête, il associe le mot «head» avec la partie de son corps qui a été activée. Je peux également lui apprendre un comportement complexe fait de comportements de base qu'il aura appris précédemment. Par exemple, je lui apprends à marcher, s'asseoir, se coucher, puis tourner. Une fois acquises toutes ces brides de base, je lui donne une définition abstraite selon laquelle une certaine danse consiste à s'avancer, puis tourner à gauche, à droite et s'avancer de nouveau. Sans lui montrer, juste en lui disant, il pourra exécuter cette danse.
RFI: Concrètement comment se fait l'acquisition du vocabulaire par Aibo ?
Frédéric Kaplan: Pour apprendre à Aibo à nommer des objets, on lui montre par exemple, un objet rouge: une balle et on lui dit «look ball». Le robot se demande alors ce que c'est une balle. La balle, est-ce tous les objets ? On lui montre alors un autre objet qui est rouge, mais qui n'est pas une balle. Il affine ainsi sa notion de ce qu'est une balle. L'idée est de multiplier les tentatives pour que le robot puisse voir l'objet sous des angles différents. Lorsqu'il rencontre l'objet en question, il calcule les probabilités et devine le sens du mot en question en cherchant dans sa mémoire ce qu'il a enregistré précédemment. Quand on lui pose la question: «what is ûit?», s'il reconnaît dans cet objet rouge: une balle, il va redire ce mot «ball». Aujourd'hui on a fait des expériences avec une quinzaine d'objets seulement et une dizaine de comportements. Dans le futur, on veut améliorer sa connaissance des adjectifs, puis lui faire acquérir des bases de grammaire.
Frédéric Kaplan: Aujourd'hui, les Aibos qui sont dans le commerce n'ont pas des capacités d'apprentissage très élevées. Nos recherches actuelles portent sur la communication entre les hommes et les robots. Sur ce prototype de recherche, on essaye de voir comment on pourrait apprendre au robot de Sony un certain nombre de mots pour nommer les objets qu'il voit, pour apprendre des parties de son corps ou désigner certains de ses comportements. L'ensemble des fonctions d'interactions supplémentaires que l'on a construites pour Aibo sont dans un ordinateur séparé qui communique avec le robot par une liaison radio. Ce système permet de développer rapidement des nouvelles capacités au robot, sans avoir à travailler directement sur lui.
RFI: L'apprentissage de la parole par Aibo s'est inspiré largement du projet Talking Heads, des machines capables de communiquer. Pouvez-vous nous expliquer la méthodologie utilisée ?
Frédéric Kaplan: L'objectif du projet Talking-Heads (Têtes parlantes) était de créer un embryon de dialogue entre des êtres artificiels. Pour cette expérience, des robots ont observé un objet, puis en ont construit une représentation simplifiée de sa couleur et de sa forme et ont ensuite associé cette représentation à des mots. De la même manière, l'Aibo associe les objets qu'il voit à des mots. Equipé d'une caméra, de microphones et de censeurs de toucher, de distance et d'équilibre, Aibo peut nommer des parties de son corps. Par exemple, dans le cas où je lui caresse la tête, il associe le mot «head» avec la partie de son corps qui a été activée. Je peux également lui apprendre un comportement complexe fait de comportements de base qu'il aura appris précédemment. Par exemple, je lui apprends à marcher, s'asseoir, se coucher, puis tourner. Une fois acquises toutes ces brides de base, je lui donne une définition abstraite selon laquelle une certaine danse consiste à s'avancer, puis tourner à gauche, à droite et s'avancer de nouveau. Sans lui montrer, juste en lui disant, il pourra exécuter cette danse.
RFI: Concrètement comment se fait l'acquisition du vocabulaire par Aibo ?
Frédéric Kaplan: Pour apprendre à Aibo à nommer des objets, on lui montre par exemple, un objet rouge: une balle et on lui dit «look ball». Le robot se demande alors ce que c'est une balle. La balle, est-ce tous les objets ? On lui montre alors un autre objet qui est rouge, mais qui n'est pas une balle. Il affine ainsi sa notion de ce qu'est une balle. L'idée est de multiplier les tentatives pour que le robot puisse voir l'objet sous des angles différents. Lorsqu'il rencontre l'objet en question, il calcule les probabilités et devine le sens du mot en question en cherchant dans sa mémoire ce qu'il a enregistré précédemment. Quand on lui pose la question: «what is ûit?», s'il reconnaît dans cet objet rouge: une balle, il va redire ce mot «ball». Aujourd'hui on a fait des expériences avec une quinzaine d'objets seulement et une dizaine de comportements. Dans le futur, on veut améliorer sa connaissance des adjectifs, puis lui faire acquérir des bases de grammaire.
par Propos recueillis par Myriam Berber
Article publié le 19/01/2001