Ignorer et passer au contenu
BioCLIP 2 : Le modèle d’IA qui connaît le règne animal

BioCLIP 2 : Le modèle d’IA qui connaît le règne animal

Une IA capable de repérer un zèbre mieux qu'un zoologiste

Tout a commencé par un pari amical : un modèle d’IA pouvait-il reconnaître les zèbres individuellement plus rapidement qu’un zoologiste expérimenté ? La réponse fut positive, et cette victoire a donné naissance à une idée bien plus ambitieuse.

Tanya Berger Wolf, aujourd'hui directrice du Translational Data Analytics Institute et professeure à l'Université d'État de l'Ohio, a étendu ces travaux initiaux à l'ensemble du règne animal. Son équipe a développé BioCLIP 2, un modèle fondamental de grande envergure axé sur la biologie, qui révolutionne déjà la manière dont les scientifiques étudient la vie sur Terre.

BioCLIP 2 n'est pas un simple modèle de reconnaissance d'images. Il va bien au-delà de l'étiquetage d'une image comme oiseau ou plante. Il est capable de déceler des détails précis, tels que les caractéristiques d'une même espèce et même les liens de parenté entre espèces. Prenons l'exemple des pinsons de Darwin. Sans aucune indication de taille, le modèle a classé les images de pinsons par ordre de taille de bec, simplement en apprenant à partir des données.

C'est un point crucial, car la biologie de la conservation est confrontée à un problème majeur de données. Pour de nombreuses espèces, nos connaissances sont tout simplement insuffisantes. Même pour des animaux emblématiques comme les orques et les ours polaires, la taille des populations reste floue, voire inconnue. Si les données manquent pour ces figures emblématiques de la nature, la situation est encore plus préoccupante pour des organismes moins visibles comme les coléoptères et les champignons.

En exploitant d'immenses quantités de données visuelles, BioCLIP 2 contribue à combler cette lacune. Les chercheurs peuvent l'utiliser comme une sorte d'encyclopédie biologique, une boîte à outils scientifique et un assistant interactif capable de tirer des conclusions pertinentes sur les espèces et les écosystèmes.

BioCLIP 2 est un logiciel libre disponible sur Hugging Face, où il a été téléchargé plus de 45 000 fois en un seul mois. Il s'appuie sur le modèle BioCLIP original, qui a déjà remporté le prix du meilleur article étudiant à la conférence CVPR. Ce nouveau travail est présenté à NeurIPS, l'un des plus importants événements de recherche en intelligence artificielle.

Le plus grand ensemble de données d'images biologiques jamais créé

Pour enseigner à une IA la vie sur Terre, il faut une multitude d'exemples. L'équipe de Berger Wolf et ses collaborateurs ont justement créé un immense ensemble de données appelé TREEOFLIFE 200M. Il contient 214 millions d'images couvrant plus de 925 000 classes taxonomiques. En clair, cela représente une incroyable variété d'organismes, des singes aux vers de farine en passant par les magnolias, et bien d'autres encore.

La réalisation de ce projet a nécessité un véritable travail d'équipe. L'Institut d'Imageomique a collaboré avec des experts de la Smithsonian Institution issus de plusieurs universités et d'autres organisations. Ensemble, ils ont organisé et nettoyé cette immense collection, à l'image de la création du jeu de cartes de biologie ultime.

L’objectif n’était pas seulement de reconnaître les espèces individuelles. L’équipe souhaitait vérifier si une IA pouvait apprendre la structure même des écosystèmes et contribuer à faire évoluer la biologie de l’étude des organismes isolés à celle des systèmes interconnectés dans leur ensemble.

BioCLIP 2 a été entraîné pendant 10 jours sur 32 GPU NVIDIA H100. Cette puissance de calcul permet au modèle de développer des capacités étonnamment riches, telles que :

  • Repérer les différences au sein d'une même espèce, comme entre les animaux adultes et juvéniles.
  • Reconnaître les individus masculins et féminins à l'aide d'indices visuels
  • Relier des espèces apparentées sans instructions explicites, par exemple comment les zèbres, les chevaux et les ânes s'intègrent tous dans l'arbre phylogénétique des équidés

L'élément clé est que le modèle ne reçoit jamais de taxonomie écrite par un humain. Il observe plutôt les étiquettes présentes sur des millions d'images et commence à inférer la hiérarchie par lui-même. Les images de zèbres partagent une étiquette de genre. Les images d'équidés partagent une étiquette de famille. Au fil du temps, BioCLIP 2 apprend qu'il existe une structure reliant ces étiquettes à différents niveaux.

Ce modèle ne se contente pas de classifier ; il peut aussi détecter des signaux relatifs à la santé des plantes. Lors d'une expérience, il a appris à distinguer les feuilles saines de pommiers ou de myrtilliers de celles qui étaient malades. Il a même réussi à former des groupes distincts pour différents types de maladies sur un graphique de dispersion. Ce type de capacité pourrait alimenter des outils de diagnostic précoce en agriculture et en foresterie.

L'entraînement et l'exécution d'un modèle de cette envergure ne sont possibles qu'avec le calcul accéléré moderne. L'équipe a utilisé un cluster de 64 GPU NVIDIA Tensor Core pour l'entraînement, ainsi que des GPU Tensor Core individuels pour l'inférence. Berger Wolf souligne que des modèles fondamentaux comme BioCLIP n'existeraient tout simplement pas sans ce type d'accélération matérielle.

Création de jumeaux numériques pour la faune sauvage

BioCLIP 2 est déjà impressionnant, mais la prochaine étape pourrait bien s'apparenter à un livre d'illustrations de jeux vidéo. L'équipe travaille actuellement sur des jumeaux numériques dédiés à la faune sauvage, créant des mondes virtuels interactifs où espèces et environnements peuvent être simulés simultanément.

Grâce à ces jumeaux numériques, les scientifiques pourraient visualiser les interactions entre les animaux et avec leur environnement. Ils pourraient ainsi simuler différents scénarios en toute sécurité, sans perturber les écosystèmes réels. Vous voulez savoir ce qui se passe si un prédateur disparaît d'une région ou si les conditions climatiques changent ? Vous pouvez d'abord tester ces changements dans le jumeau numérique.

L’idée est de minimiser l’impact sur l’environnement tout en apprenant beaucoup sur le fonctionnement réel des écosystèmes.

Les jumeaux numériques offrent également une perspective inédite sur le monde naturel. Les chercheurs pourraient ainsi se mettre dans la peau d'une espèce spécifique au sein de la simulation. Imaginez observer un paysage de savane non pas depuis la caméra d'un drone, mais du point de vue d'un zèbre au sein du troupeau.

À l'avenir, des versions allégées de cette technologie pourraient apparaître en dehors des laboratoires. Imaginez visiter un zoo et utiliser une plateforme interactive pour découvrir l'habitat comme si vous étiez un animal. Vous pourriez voir à quoi ressemble le monde du point de vue d'une petite araignée sur un griffoir ou d'un autre membre du troupeau. Une simple visite se transforme alors en une expérience scientifique immersive.

Grâce à BioCLIP 2 et à l'immense base de données TREEOFLIFE 200M, la frontière entre la recherche en IA et la conservation sur le terrain s'estompe. Les modèles qui se contentaient auparavant d'identifier les animaux sur les photos apprennent désormais les hiérarchies de caractéristiques, les indicateurs de santé et les schémas écosystémiques. Si ces travaux continuent de se développer, ils pourraient devenir l'un des outils les plus puissants dont nous disposons pour comprendre et protéger la vie sur Terre.

Article et image originaux : https://blogs.nvidia.com/blog/bioclip2-foundation-ai-model/

Panier 0

Votre carte est actuellement vide.

Commencer à magasiner