Autonome Agenten gehören zu den bedeutendsten Innovationen der generativen KI dieses Jahres. Diese Tools haben gezeigt, wie KI zur Erstellung, Priorisierung und Erledigung von Aufgaben im Internet ohne menschliche Aufsicht eingesetzt werden kann.
Mit einem autonomen Agenten kann man ein anfängliches Ziel oder eine Aufgabe in ein großes Sprachmodell (LLM) eingeben, woraufhin die Lösung als Teil einer kontinuierlichen Schleife die Aufgabe erledigt und Folgeschritte erstellt.
Dadurch können die KI-basierten Programme die Aufgaben wie das Erstellen von Inhalten, das Schreiben von Code, die Durchführung von Recherchen und Datenanalysen, das Zusammenstellen von Tasklisten, das Entwerfen von Websites oder sogar das Verwalten eines Social-Media-Kontos selbstständig erledigen.
Kurz gesagt, autonome KI-Agenten bieten Unternehmen eine breite Palette von Einsatzmöglichkeiten, auf die sie zurückgreifen können. Im Folgenden werden fünf der führenden autonomen KI-Agenten auf dem Markt vorgestellt.
Die 5 besten autonomen KI-Agenten
1. AutoGPT
Bei AutoGPT handelt es sich um einen von Toran Bruce Richards entwickelten autonomen Open-Source-KI-Agenten, der im März 2023 veröffentlicht wurde. Er soll mit GPT-4 und GPT 3.5 zusammenarbeiten können.
Nutzer geben ein Ziel oder eine Aufgabe in natürlicher Sprache ein, und AutoGPT zerlegt diese in Teilaufgaben, bevor er neue Agenten zur Realisierung dieser Aufträge einsetzt.
Diese können die Entwicklung einer Website, die Erstellung von Inhalten für soziale Medien, das Verfassen von E-Mails und Marketingtexten oder sogar das Übersetzen von Texten umfassen.
Es ist zu beachten, dass man für die Nutzung nicht nur AutoGPT und Docker lokal installieren muss, sondern auch über ein OpenAI-Konto mit der Möglichkeit der Erstellung von API-Schlüsseln verfügen muss.
2. BabyAGI
Das Python-Skript BabyAGI wurde von Yohei Nakajima entwickelt und im April 2023 eingeführt.
Es kann automatisch Teilaufgaben in Echtzeit erstellen, ausführen und priorisieren, indem es GPT-4 von OpenAI, die Vektorsuche von Pinecone und das Framework von LangChain verwendet.
Die Lösung funktioniert durch den Einsatz von drei Hauptagenten:
- Ein Agent für die Aufgabenausführung erledigt die erste Aufgabe in einer Aufgabenliste;
- Ein Agent für die Aufgabenerstellung generiert Teilaufgaben auf der Grundlage eines vordefinierten Ziels und des Ergebnisses der vorherigen Aufgabe;
- Ein Agent für die Priorisierung bestimmt die Reihenfolge der zu erledigenden Aufgaben.
In diesem Rahmen erzeugt, erledigt und ordnet GPT-4 Aufgaben nach Prioritäten. Pinecone speichert und ruft aufgabenbezogene Daten wie Beschreibungen und Ergebnisse ab.
LangChain ermöglicht es dem Agenten, datenbewusster zu sein und Aufgaben zu erledigen bzw. Entscheidungen effektiver zu treffen.
3. AgentGPT
AgentGPT ist ein Open-Source-Tool. Es wurde von Asim Shresta, Srijan Subedi und Adam Watkins entwickelt und im Juli 2023 veröffentlicht.
Das Programm bietet die Möglichkeit der Erstellung und des Betriebs autonomer KI-Agenten über einen Webbrowser. Diese können Teilaufgaben erzeugen und ausführen.
Bei der Programmierung von KI-Agenten über die Plattform von AgentGPT wird jedem Agenten ein Name und ein Ziel zugewiesen und die Verbindung zu GPT-4 und GPT-3.5 Turbo hergestellt.
Darüber hinaus kann AgentGPT die Aufgabenresultate abrufen, um daraus zu lernen. Dabei wird ein Verlauf der in der Open-Source-Vektordatenbank Weaviate gespeicherten Aufgabenausführung entwickelt.
Zwar ähnelt AgentGPT anderen autonomen Agenten wie AutoGPT, doch der wesentliche Unterschied besteht darin, dass es eine webbasierte Plattform ist, die nicht lokal betrieben wird. Das Modell lässt sich über den OpenAI-API-Schlüssel anpassen.
4. SuperAGI
SuperAGI ist ein Open-Source-Framework für autonome KI-Agenten. Es ermöglicht die Entwicklung und Verwaltung autonomer Agenten.
Mit SuperAGI können Agenten benutzerdefinierte Ziele und Anweisungen sowie bestimmte Tools und Open-Source-Modelle zur Verwendung zugewiesen werden.
Eine erwähnenswerte Funktion von SuperAGI ist die gleichzeitige Ausführung und Verwaltung mehrerer Agenten über eine Aktionskonsole. In der Aktionskonsole können User Eingaben machen und Berechtigungen konfigurieren.
Zudem gibt es eine Agenten-Feed-Seite, auf der man die von einem Agenten durchgeführten Aktivitäten in Echtzeit verfolgen kann.
Um SuperAGI nutzen zu können, benötigt man einen API-Schlüssel von einem LLM-Anbieter, muss Docker installieren und ein GitHub-Konto besitzen.
5. MicroGPT
MicroGPT ist ein von Sin Liang Lee entwickeltes vortrainiertes Sprachmodell, das auf einer RTX4060 8GB mit einem 6GB-Datensatz trainiert wurde und 82 Millionen Parameter hat.
Die leichtgewichtige Architektur von MicroGPT ist für die Verwendung von GPT-3.5 und GPT-4 zur Durchführung grundlegender Aufgaben konzipiert.
Dazu gehören die Analyse von Aktienkursen, die Durchführung von Netzwerksicherheits– oder Penetrationstests, die Erstellung digitaler Kunstwerke oder sogar die Bestellung von Pizza. Die Ergebnisse jeder Aufgabe können auf den Desktop des Benutzers übertragen werden.
Die geringe Anzahl von Parametern bedeutet, dass MicroGPT für größere, komplexere Aufgaben weniger geeignet ist. Außerdem benötigt man zur Installation des Programms Python, Git und einen Code-Editor.
Fazit
Das schnell wachsende Ökosystem der autonomen KI-Agenten hat gerade einen kleinen Anfang gemacht.
Bis zum Jahr 2024 werden zweifelsohne weitere Open-Source-Projekte entstehen.
Dennoch sollten Unternehmen, die mit autonomen KI-Agenten experimentieren möchten, vor der Einführung immer das Risiko abschätzen, um sicherzustellen, dass sie keine neuen Schwachstellen verursachen, die von Cyberkriminellen ausgenutzt werden können.