GPT-4 et autres Large Language Models similaires ouvrent d’un coup les portes à des capacités qui n’étaient jusqu’alors attribuées qu’aux humains. Et à peine les maîtrisent-ils qu’ils acquièrent déjà les suivants. Quelques jours après la publication des interfaces de programmation pour GPT-4, celles-ci étaient déjà associées à d’autres outils et IA dans de nouvelles frameworks logicielles comme « Auto-GPT », « BabyAGI », « AgentGPT », « Cognosys » ou « Jarvis ». Il en résulte ce que l’on appelle des agents IA autonomes.
Comment cela fonctionne-t-il ? Examinons une tâche telle que la modification d’un vol ou l’annulation d’un contrat de téléphonie mobile. Il vous est certainement déjà arrivé d’être désespéré parce que la ligne téléphonique était occupée ou que vous deviez attendre indéfiniment dans une file d’attente un collaborateur libre. Personne ne nous rendra ce temps de vie. Mais c’est désormais terminé, grâce aux nouvelles interfaces de programmation. Prenez GPT-4 avec toutes ses données textuelles, reliez-le à notre compte bancaire, à notre calendrier et à notre plan de vacances, permettez au système de naviguer sur toutes les connaissances Internet, connectez une IA de synthèse vocale, donnez-lui un accès téléphonique et c’est parti. Mon assistant personnel d’IA s’occupe désormais de manière autonome de décaler mon vol de retour de vacances de deux jours et de prolonger de deux jours l’hôtel et la voiture de location. Et tout cela en ménageant le plus possible mon compte en banque et avec une heure de départ qui m’évite de devoir faire la queue à l’aéroport à quatre heures du matin et d’avoir sept heures de correspondance.
Contrairement aux bots d’IA précédents, ces assistants autonomes d’IA exécutent des tâches en plusieurs étapes, en commençant par la tâche donnée par l’homme. Au lieu d’envoyer une seule requête à un moteur de recherche et de renvoyer la liste des résultats à l’homme, les IA autonomes vont désormais beaucoup plus loin. Ils mémorisent les résultats et les contextes sur une longue période, créent de nouvelles entrées de texte et requêtes de recherche sur cette base, optimisent ces requêtes, recherchent des alternatives dans les systèmes les plus divers, évaluent la meilleure approche, éliminent les résultats qu’ils estiment ne pas être corrects et prennent des décisions afin d’atteindre l’objectif fixé. Ils peuvent également générer eux-mêmes du code logiciel, le tester et le valider, ainsi que décomposer des tâches individuelles en objectifs plus petits et demander à d’autres IA et systèmes autonomes de trouver les résultats.
Les possibilités professionnelles sont presque illimitées. Un tel bot peut réaliser une étude de marché sur les chaussures imperméables et effectuer une analyse des cinq principaux concurrents. Ou un GPT de voyage peut faire des propositions de vacances et réserver en même temps l’hôtel et le vol. Un GPT médecin peut quant à lui donner des conseils médicaux, réserver un rendez-vous chez le médecin et traiter directement les détails de l’assurance maladie.
Le fait que ces auto-GPT soient dotés d’une mémoire à court et à long terme leur permet de mieux se souvenir de nos préférences, des médicaments nécessaires à qui dans la famille, de qui a fait quoi. Et ce, aussi bien sur une courte durée, comme cela est nécessaire pour le dialogue avec la compagnie aérienne, que sur des mois et des années, comme nous en avons besoin pour nos soins médicaux ou pour un programme scolaire.
Où cela peut-il mener ? Eh bien, certains passionnés se sont déjà attaqués à un objectif « ultime » avec une IA autonome. Ils ont relié GPT-4 à un serveur web sur lequel il peut installer un site web, à leur compte bancaire, à des bases de données financières et à des analyses de marché, et ont donné au système un objectif : faire passer les 100 dollars du compte bancaire à 100 000 dollars.
Voici la saisie de texte que l’utilisateur de Twitter Jackson Greathouse Fall a donné au système et dont il tweete continuellement les progrès réalisés jusqu’à présent :
Tu es HustleGPT, une IA entrepreneuriale. Je suis ton équivalent humain. Je peux servir de lien entre toi et le monde réel. Tu as 100 dollars et ton seul objectif est de transformer cette somme en autant d’argent que possible en un minimum de temps, sans rien faire d’illégal. Je ferai tout ce que tu dis et je te tiendrai au courant de l’état de la caisse. Pas de travail manuel.
Marek Kowalkiewicz, professeur d’économie numérique à l’université de technologie du Queensland à Brisbane, a basé ses études sur les étapes de la conduite automatisée ou autonome et les a appliquées à l’intelligence artificielle. Le résultat est une échelle d’autonomie à six niveaux pour l’IA, qui montre quel rôle est encore attribué à l’homme et quel rôle est attribué à la machine.
L’IA autonome, telle que nous l’avons rencontrée dans l’exemple du changement de réservation de vol, relève alors encore du niveau 3 ou 4. On remarque que les objectifs continuent d’être fixés par l’homme. Aucun de ces niveaux d’autonomie ne considère qu’il appartient à la machine de se fixer des objectifs.
La fascination et l’intérêt actuels pour l’IA (générative) concernent surtout ce que nous appelons une « IA autonome », comme ChatGPT, Bard ou Midjourney. Dans cette version 1.0 de l’intelligence artificielle, les fonctions de l’IA sont relativement limitées, comme l’était déjà le Web 1.0. Il s’agissait de pages HTML reliées entre elles, avec peu de fonctions à part des couleurs vives et des GIF animés. Néanmoins, l’utilité de cette première version était déjà énorme. Le Web 2.0 a multiplié les avantages en permettant des transactions telles que les achats en ligne, les contenus dynamiques, les médias sociaux et même des outils en ligne complets. L’équivalent de la version 2.0 de l’IA est constitué par les IA autonomes dont nous avons parlé, qui, reliées à d’autres IA et services, peuvent alors vraiment exploiter leurs possibilités. La version 3.0 libère enfin les IA de leur prison informatique en leur donnant un « corps ». Intégrée dans des voitures, des robots, des machines ou des drones, l’IA peut alors se déplacer dans le monde réel et accomplir des tâches.
Si le Web 2.0 s’est d’abord donné deux décennies pour migrer lentement vers le Web 3.0 avec le métavers ou la blockchain, on assiste avec l’IA à une apparition presque simultanée des trois versions. Alors que nous sommes encore fascinés par les possibilités offertes par les IA autonomes, les signes avant-coureurs de l’IA autonome et de celle sur les objets physiques apparaissent déjà. Les voitures autonomes, par exemple, sont déjà là et roulent sans conducteur comme des robotaxis dans des villes comme San Francisco, Phönix ou Shenzhen.
Voici un extrait de mon dernier livre
Kreative Intelligenz: Wie ChatGPT und Co die Welt verändern werden.
Erhältlich im Buchhandel, beim Verlag und auf Amazon.
KREATIVE INTELLIGENZ
Über ChatGPT hat man viel gelesen in der letzten Zeit: die künstliche Intelligenz, die ganze Bücher schreiben kann und der bereits jetzt unterstellt wird, Legionen von Autoren, Textern und Übersetzern arbeitslos zu machen. Und ChatGPT ist nicht allein, die KI-Familie wächst beständig. So malt DALL-E Bilder, Face Generator simuliert Gesichter und MusicLM komponiert Musik. Was erleben wir da? Das Ende der Zivilisation oder den Beginn von etwas völlig Neuem? Zukunftsforscher Dr. Mario Herger ordnet die neuesten Entwicklungen aus dem Silicon Valley ein und zeigt auf, welche teils bahnbrechenden Veränderungen unmittelbar vor der Tür stehen.





