Publicité

Google lance Gemini, son outil IA proclamé plus performant que ChatGPT

Demis Hassabis, qui dirige Google DeepMind, lance l'offensive contre OpenAI avec son nouveau modèle IA, Gemini. ©Bloomberg

Google lance Gemini, un modèle d’intelligence artificielle (IA) qui vise à surpasser ChatGPT de son rival OpenAI. Il devrait être disponible dans sa version la plus puissante au début 2024.

Gemini 1.0 est un modèle d’IA formé dès le départ non seulement au texte, mais aussi à d’autres types de données tels que l’audio, la vidéo, le code et les images. "Il comprend donc mieux les informations nuancées et peut répondre à des questions sur des sujets complexes. Il s’avère particulièrement doué pour expliquer les raisonnements sur des sujets complexes tels que les mathématiques et la physique", explique Demis Hassabis, le patron de Google DeepMind. Le modèle sera notamment utilisé comme cerveau de Bard, le concurrent de l’agent conversationnel ChatGPT.

Dans une démonstration vidéo, Gemini a commenté vocalement un dessin et un canard en jouet, avec une bonne dose d’humour. Il a également pu inventer un jeu établi à partir d'une carte du monde et y jouer avec l’utilisateur.

Publicité

Avec un score de 90%, Gemini Ultra serait le premier modèle à surpasser les experts humains dans un test portant sur une combinaison de 57 disciplines, dont les mathématiques, l’histoire, la physique, le droit, la médecine et l’éthique.

Dans une autre vidéo, Gemini a examiné des devoirs écrits à la main pour déterminer qu’une formule était correcte, mais qu’il y avait une erreur dans les calculs. Le modèle est également capable d’expliquer les devoirs et de suggérer de nouveaux exercices pour améliorer les points faibles de l’apprentissage, comme l’a montré Google dans une vidéo.

Gemini 1.0 est optimisé pour trois tailles différentes d’appareils: Ultra, Pro et Nano. Ultra est le plus compétent pour les tâches complexes et Nano le plus efficace pour les tâches effectuées sur un appareil tel qu’un smartphone.

Concurrence frontale avec OpenAI

Avec Gemini, Google veut clairement s’attaquer à son concurrent OpenAI qui a lancé ChatGPT il y a un an pour prendre ainsi la tête de l’IA générative, capable de générer du texte, des images, du code et de l’audio à partir d’instructions en langage clair.

Le nouveau modèle de Google DeepMind excellerait pour 30 des 32 critères de référence académiques largement utilisés pour les modèles d’IA. Avec un score de 90%, Gemini Ultra serait le premier modèle à surpasser les experts humains dans un test portant sur une combinaison de 57 disciplines, dont les mathématiques, l’histoire, la physique, le droit, la médecine et l’éthique. Et non pas seulement au niveau de ses connaissances, mais également pour sa capacité à résoudre des problèmes.

Publicité

Gemini peut utiliser sa capacité de raisonnement pour réfléchir plus attentivement avant de répondre à des questions difficiles. Comparé à GPT-4, qui est le modèle le plus performant d’OpenAI, Gemini Ultra obtient des résultats supérieurs de plusieurs points de pourcentage pour de nombreux tests, selon les données de Google DeepMind. Là où GPT-4 fait apparemment encore mieux, c’est dans l’utilisation du bon sens pour les "tâches quotidiennes".

Le système brille également dans l’écriture de codes informatiques. Une version spécialisée de Gemini a été utilisée pour créer AlphaCode 2 qui excelle, selon Google DeepMind, dans la résolution de problèmes de programmation de concours qui font également appel à des mathématiques complexes et à l’informatique théorique. On estime qu’AlphaCode 2 est plus performant que 85% des participants humains aux concours de programmation. Lorsque les programmeurs collaborent avec AlphaCode 2, les performances sont encore meilleures.

Sécurité soignée

Les concepteurs de Gemini soulignent qu’ils ont effectué les évaluations de sécurité les plus complètes pour le modèle, notamment pour les partis pris et la toxicité. Des essais approfondis sont encore en cours pour Gemini Ultra afin de vérifier la sécurité et la fiabilité. Un groupe limité d’utilisateurs y aura accès pour l’expérimenter avant que le système ne soit largement disponible au début de l’année prochaine.

C’est également à ce moment-là que sera lancé Bard Advanced, qui donnera accès aux meilleurs modèles, à commencer par Gemini Ultra. Cela dit, même si des progrès sont réalisés, il n’y aura toujours pas de garantie que le modèle d’IA sera toujours juste. Les modèles d’IA hallucinatoires sont "un problème de recherche non résolu", ont reconnu les concepteurs de Gemini lors d’une conférence de presse.

Gemini sera disponible dans d'autres produits et services Google tels que son moteur de recherche, ses annonces ou son navigateur web.

Bard, l’agent conversationnel de Google, dispose déjà d’une version de Gemini Pro. Pour l’instant, elle n’est disponible qu’en anglais et pas encore en Europe, où les autorités de régulation doivent d’abord être consultées. D’autres langues seront également disponibles. Bard Assistent est également en préparation et devrait exprimer pleinement les capacités de communication vocale et multimédia de Gemini. Reste à savoir si des formules payantes sont prévues pour les consommateurs.

Gemini sera installé sur le smartphone Pixel 8 Pro de Google. Il sera le premier à utiliser Gemini Nano. Dans les mois à venir, Gemini sera disponible dans davantage de produits et services Google tels que son moteur de recherche, ses annonces, son navigateur web Chrome et dans les applications bureautiques. 

Les développeurs et les entreprises clientes auront accès à Gemini Pro pour créer des applications à partir du 13 décembre. Google a également annoncé un nouveau matériel puissant pour le travail de l’IA dans le cloud.

Le résumé
  • Google DeepMind lance son modèle d'IA, Gemini, qui a été formé d'emblée sur toutes sortes de données telles que du texte, de l'audio et des images.
  • De nombreux tests auraient révélé que le modèle serait plus performant que le modèle GPT-4 de son concurrent OpenAI.
  • Google souligne qu'il met tout en œuvre pour assurer la sécurité de Gemini et pour exclure les préjugés et la toxicité.
  • Le système existe en plusieurs versions, de Ultra à Nano. Cette dernière sera également utilisée dans le smartphone Pixel 8 Pro et pour de nombreux produits et services de l'entreprise.
Dossier | Intelligence artificielle & ChatGPT

Toute l'actualité sur ChatGPT et les acteurs de l'intelligence artificielle. Infos, analyses et décryptages de cette révolution.

Publicité
Publicité
Messages sponsorisés