L’intelligence artificielle peut apprendre comme un enfant

En quelques années seulement, les enfants passent du statut de bébé hurlant à celui d’interlocuteurs étonnamment éloquents. Vous développez étape par étape vos connaissances du langage et de l’environnement en reliant les stimuli perçus. La situation est généralement complètement différente avec les systèmes d’IA. Afin de fournir des connaissances à l’intelligence artificielle, les entreprises alimentent les algorithmes avec de gigantesques réserves de données que les logiciels peuvent ensuite exploiter. Des chercheurs de l’Université de New York se sont demandé s’il existait une autre solution. Dans le cadre d’un étude Sous la direction du spécialiste des sciences cognitives Wai Keen Vong, ils ont étudié si une intelligence artificielle était capable d’acquérir des connaissances comme un petit enfant.

Pour ce faire, ils ont placé une caméra frontale sur un enfant à intervalles réguliers pendant de courtes périodes au cours de la première année et demie de sa vie. De cette manière, les scientifiques ont pu enregistrer de manière aléatoire comment il observe son environnement et quelles vocalisations il perçoit afin d’établir des connexions pour l’acquisition du langage. À l’âge d’un an et demi, les enfants peuvent généralement comprendre jusqu’à 300 mots sans instruction ciblée. Wai Keen Vong & Co. voulait savoir si une IA pouvait faire de même. Pour ce faire, ils ont divisé les 61 heures de matériel vidéo en 600 000 images individuelles et 37 500 vocalisations d’accompagnement et les ont utilisées pour entraîner un simple réseau neuronal. Malgré le matériel de base limité, qui reflète moins d’un pour cent des phases d’éveil de l’enfant, ils ont obtenu des résultats étonnants.

Presque aussi performant que l’IA entraînée de manière conventionnelle

Selon l’étude, l’IA a pu attribuer le mot correct aux images affichées dans 61 % des cas et reconnaître des objets comme une balle ou un chat. À titre de comparaison, les chercheurs ont utilisé une IA de reconnaissance d’image exploitée par le développeur ChatGPT OpenAI, qui avait été formée avec des millions de paires d’images et de textes. Dans le même test, il n’avait que cinq points d’avance. Cependant, l’IA des tout-petits n’a eu un tel succès que lorsque les images et les sons introduits étaient en corrélation les uns avec les autres. Si les chercheurs alimentaient le système en images non triées et en matériel audio aléatoire, le taux de réussite tombait à 26 pour cent et une balle était parfois reconnue comme un chat.

Selon l’étude, des conclusions peuvent en être tirées tant pour l’apprentissage automatique que pour l’apprentissage humain. Le résultat montre qu’une coexistence visuelle et verbale cohérente est cruciale pour que les humains et les machines puissent acquérir avec succès des connaissances. Pour faire simple : quiconque reçoit des informations inexactes et incorrectes établira inévitablement de faux liens. Particulièrement intéressant : sur la base des informations fournies par les tout-petits, l’IA a également pu identifier des images qui ne faisaient pas partie du matériel de formation. Les chercheurs en concluent qu’il n’est pas absolument nécessaire d’alimenter les systèmes d’IA avec d’énormes ensembles de données. Selon le rapport, les résultats actuels réfutent également une hypothèse issue de la recherche cognitive sur les jeunes enfants. Jusqu’à présent, on pensait que l’apprentissage classique des mots et des images était trop difficile et donc inefficace pour les bébés. Cependant, la recherche a montré que les enfants sont tout à fait capables d’apprendre de cette manière.