La version améliorée de ChatGPT enseigne les mathématiques et le flirt – mais elle a encore des ratés
OpenAI a dévoilé la dernière version de la technologie qui sous-tend son chatbot IA ChatGPT.Elle s’appelle GPT-4o et sera déployée auprès de tous les utilisateurs de ChatGPT, y compris les non-abonnés.
Elle est plus rapide que les modèles précédents et a été programmée pour paraître bavarde et parfois même coquette dans ses réponses aux invites. La nouvelle version peut lire et discuter d’images, traduire des langues et identifier les émotions à partir d’expressions visuelles. Il y a aussi de la mémoire pour pouvoir rappeler les invites précédentes. Elle peut être interrompue et le rythme de conversation est plus facile : il n’y a aucun délai entre la question et la réponse.
Défaillance
Lors d’une démonstration en direct utilisant la version vocale de GPT-4o, celle-ci a fourni des suggestions utiles sur la façon de résoudre une équation simple écrite sur un morceau de papier – plutôt que de simplement la résoudre. Elle a analysé du code informatique, traduit entre l’italien et l’anglais et interprété les émotions d’un selfie d’un homme souriant. Utilisant une voix féminine américaine chaleureuse, elle a salué ses animateurs en leur demandant comment ils allaient. Lorsqu’on lui faisait un compliment, elle répondait : « Arrête, tu me fais rougir ! ».
Ce n’était pas parfait : à un moment donné, elle a pris l’homme souriant pour une surface en bois et a commencé à résoudre une équation qui ne lui avait pas encore été montrée. Cela a involontairement démontré qu’il reste encore du chemin à parcourir avant que les problèmes et les hallucinations qui rendent les chatbots peu fiables et potentiellement dangereux puissent être résolus.
Mais ce que cela nous montre, c’est la direction à suivre pour OpenAI, qui, je pense, vise à ce que GPT-4o devienne la prochaine génération d’assistant numérique IA, une sorte de Siri suralimenté ou Hey, Google qui se souvient de ce qui lui a été dit dans le passé et peut interagir au-delà de la voix ou du texte.
Nous savons que l’IA est plus gourmande en énergie que les tâches informatiques traditionnelles, et que plus elle devient sophistiquée, plus elle nécessite de puissance de calcul. Il n’y a eu aucune mention de durabilité au cours de la soirée.
Démystifier
Nous avons vu des chatbots comme Grok et Pi d’Elon Musk, du co-fondateur de DeepMind Mustafa Suleyman, donner la priorité à la « personnalité » de leurs produits, mais la manière dont GPT-4o a géré de manière transparente la combinaison de texte, d’audio et d’images avec une réponse instantanée semble placer OpenAI en avance sur la concurrence.
Bien sûr, pour le moment, nous n’avons que la parole de l’entreprise : il s’agissait de leur démo, soigneusement organisée et gérée par eux. Il sera intéressant de voir comment GPT-4o s’adapte à grande échelle aux millions de personnes qui utilisent déjà ChatGPT lors de son déploiement. Mira Murati, directrice de la technologie d’OpenAI, a qualifié GPT-4o de « magique », mais a ajouté que l’entreprise « supprimerait ce mysticisme » avec le déploiement du produit.Un choix de mots intéressant et émouvant : même si cette technologie devient rapidement plus sophistiquée et de plus en plus convaincante en tant que compagnon, elle n’est ni sensible ni magique, il s’agit d’une programmation complexe et d’un apprentissage automatique.
Il y a eu des rumeurs sur un partenariat entre OpenAI et Apple et bien que cela n’ait pas encore été confirmé, il a été indiqué lors de la présentation que les produits Apple étaient utilisés partout. Un autre coup dur a été le timing de cet événement, 24 heures avant que son rival Google ne présente ses derniers développements en matière d’IA lors de sa conférence annuelle, Google IO.
www.bbc.com