NVIDIA NemoClaw et OpenClaw : Des agents IA toujours actifs et plus sû

Pourquoi les agents autonomes d’IA ont le vent en poupe

OpenClaw est passé d’un projet open source de niche à un phénomène de grande ampleur. En quelques mois seulement, il a dépassé les 250 000 étoiles GitHub, dépassant ainsi des projets appréciés de longue date comme React. La raison est simple. OpenClaw vous permet d’exécuter un agent d’IA persistant localement ou sur votre propre serveur sans dépendre des API cloud.

La plupart des outils d’IA actuels sont basés sur des invites. Vous posez une question, ils génèrent une réponse, puis s’arrêtent. Un agent de longue durée qu’OpenClaw appelle « claw » fonctionne différemment. Il vit en arrière-plan sur un battement de cœur. À intervalles réguliers, il se réveille, vérifie ses tâches, décide quoi faire, prend des mesures, puis attend le cycle suivant. Il ne vous apparaît que lorsqu’une décision humaine est nécessaire.

Ce comportement persistant ouvre la porte à des flux de travail puissants. Les agents peuvent surveiller les systèmes pendant la nuit, itérer sur des conceptions à travers des milliers de variations ou surveiller les sources de données et ne signaler que ce qui compte. Mais cela soulève également de sérieuses questions sur la sécurité et le contrôle. Si un agent d’IA peut appeler des API, écrire des fichiers ou toucher des systèmes de production, vous devez savoir qu’il fait exactement ce que vous aviez l’intention de faire.

NVIDIA est intervenu pour aider à renforcer le modèle de sécurité d’OpenClaw et, en même temps, a lancé NemoClaw, une implémentation de référence renforcée pour les entreprises qui souhaitent des agents toujours actifs fonctionnant sur du matériel GPU local.

Demande d’inférence et pourquoi le matériel local est important

L’IA a traversé des vagues qui arrivent de plus en plus vite à chaque fois. Nous avons commencé par l’IA prédictive pour des tâches comme les systèmes de recommandation. Puis l’IA générative a facilité la création de texte et d’images. L’IA de raisonnement a poussé l’utilisation des jetons encore plus loin avec une pensée multi-étapes plus complexe. Maintenant, les agents autonomes d’IA multiplient à nouveau la demande.

À chaque vague, la charge d’inférence explose. L’IA générative a déjà considérablement augmenté le nombre de jetons par rapport aux modèles prédictifs. L’IA de raisonnement a augmenté l’utilisation d’un ordre de grandeur supplémentaire. Les agents autonomes qui fonctionnent en continu et agissent sur de longs horizons temporels peuvent augmenter la demande d’inférence d’environ mille fois par rapport aux systèmes de raisonnement.

Cela a des implications majeures pour le matériel. Les agents qui fonctionnent en permanence peuvent devenir très coûteux et imprévisibles si vous comptez sur des API cloud distantes qui facturent par jeton. Cela soulève également des préoccupations en matière de confidentialité et de latence. Pour de nombreuses équipes, la réponse est d’amener les agents aussi près que possible des données et des utilisateurs, sur des GPU locaux dédiés.

C’est là qu’interviennent les plateformes de postes de travail et de bureau de NVIDIA. Des systèmes comme NVIDIA DGX Spark et NVIDIA DGX Station sont conçus pour l’inférence locale continue. Ils offrent des performances GPU de classe centre de données dans un facteur de forme qui s’adapte sous ou à côté d’un bureau. Les modèles s’exécutent dans votre propre environnement, de sorte que les données sensibles n’ont jamais à quitter votre réseau. Pour les charges de travail massives et lourdes en jetons qui s’exécutent toujours en arrière-plan, cette configuration locale peut être beaucoup plus prévisible et rentable que de solliciter constamment un point de terminaison cloud.

OpenClaw fonctionne déjà bien dans des environnements auto-hébergés. Le travail de NVIDIA sur NemoClaw reprend cette idée et ajoute des valeurs par défaut renforcées pour la mise en réseau, l’accès aux données et l’isolation, ce qui facilite le déploiement sécurisé de ces agents à grande échelle par les organisations.

Comment NemoClaw rend les agents toujours actifs plus sûrs

NVIDIA collabore directement avec le créateur d’OpenClaw, Peter Steinberger, et la communauté au sens large pour améliorer la sécurité de l’ensemble du projet. Cela inclut une meilleure isolation entre les modèles et le système hôte, un contrôle plus strict de l’accès aux données locales et des processus plus solides pour valider les contributions de code de la communauté.

NemoClaw s’appuie sur cette base en tant que déploiement de référence. Avec une seule commande, il installe OpenClaw, l’environnement d’exécution sécurisé NVIDIA OpenShell et les modèles ouverts NVIDIA Nemotron avec des paramètres par défaut axés sur la sécurité. Voici les idées principales derrière le déploiement responsable des agents autonomes.

Cadre ouvert et auditable : NemoClaw est basé sur le code sous licence MIT d’OpenClaw. Les organisations possèdent le harnais complet de l’agent. Elles peuvent inspecter, forker et modifier chaque couche de la pile, de la planification des tâches à l’exécution des actions. L’exécution de modèles open source comme NVIDIA Nemotron localement signifie que les charges de travail sensibles telles que les dossiers médicaux, les transactions financières ou la recherche propriétaire peuvent rester entièrement au sein de l’infrastructure de l’organisation. Les données de trace et les journaux restent sous votre propre contrôle.
Environnement d’exécution sécurisé : NemoClaw exécute les agents à l’intérieur d’OpenShell, un environnement sandbox qui définit exactement ce qu’un agent est autorisé à faire. Les autorisations sont explicites plutôt qu’implicites. Vous pouvez définir des limites claires quant aux fichiers qui peuvent être touchés, aux API qui peuvent être appelées et aux systèmes qui peuvent être mis à jour. Cela réduit le rayon d’action si un agent prend une mauvaise décision ou si quelque chose dans la pile est compromis.
Calcul local pour l’inférence continue : Les systèmes NVIDIA DGX Spark et DGX Station fournissent la puissance GPU nécessaire pour maintenir plusieurs agents autonomes en fonctionnement 24 heures sur 24. Parce que tout fonctionne sur du matériel local, la latence est faible et les coûts sont plus prévisibles. Vous ne payez pas par jeton ou par appel à un service distant. Au lieu de cela, vous utilisez vos propres GPU comme moteur d’inférence persistant.

Les cas d’utilisation réels couvrent déjà la finance, la découverte de médicaments, l’ingénierie et les opérations informatiques. Les agents peuvent surveiller en permanence les flux de marché et réglementaires, balayer les nouveaux articles scientifiques et mettre à jour les bases de données internes, tester des milliers de paramètres d’ingénierie pendant la nuit ou trier les incidents d’infrastructure. Dans certains environnements, une grande majorité des tickets ou des alertes peuvent être résolus de manière autonome, seuls les cas les plus difficiles ou les plus inhabituels étant transmis aux humains.

Au fur et à mesure que les équipes déploient ces agents et les exécutent en production, elles accumulent quelque chose de très précieux. Elles construisent des cadres de gouvernance fondés sur l’expérience, les journaux et les audits des charges de travail réelles et des agents qui absorbent progressivement le contexte spécifique de cette organisation. Au fil du temps, cela rend les agents plus précis, plus alignés et plus fiables.

Si vous souhaitez essayer cette pile vous-même, NVIDIA fournit un tutoriel étape par étape pour créer un agent local sécurisé et toujours actif avec NemoClaw sur DGX Spark, ainsi que du code open source sur GitHub et une communauté de développeurs active sur Discord. Pour toute personne disposant de matériel GPU local sérieux, NemoClaw offre un plan pratique pour exécuter des agents d’IA autonomes avec une sécurité et un contrôle renforcés.

Article et image originaux : https://blogs.nvidia.com/blog/what-openclaw-agents-mean-for-every-organization/

NVIDIA NemoClaw et OpenClaw : Des agents IA toujours actifs et plus sûrs sur votre propre matériel

Pourquoi les agents autonomes d’IA ont le vent en poupe

Demande d’inférence et pourquoi le matériel local est important

Comment NemoClaw rend les agents toujours actifs plus sûrs

GeForce NOW ajoute la puissance de la RTX 5080 et de nouveaux jeux majeurs en mai