Verbesserung der kognitiven Fähigkeiten von AI durch Gedankenketten-Verknüpfung

DAS WICHTIGSTE IM ÜBERBLICK

Chain-of-Thought-Reasoning ist eine leistungsstarke Technik, die die kognitiven Fähigkeiten von KI-Modellen verbessert, indem sie komplexe Aufgaben in kleinere Schritte zerlegt. Dieser auf Eingabeaufforderungen basierende Ansatz verbessert die Interpretierbarkeit von Modellen, ermöglicht effektive Problemlösungen in verschiedenen Bereichen und hat das Potenzial, Bereiche wie mathematische Wortprobleme, logisches Denken und symbolische Manipulation zu revolutionieren. Durch die Nutzung der Gedankenkette können KI-Modelle stärkere kognitive Fähigkeiten aufweisen und wertvolle Einblicke in ihren Entscheidungsprozess geben.

In letzter Zeit hat die künstliche Intelligenz (KI) bemerkenswerte Fortschritte bei der Verarbeitung natürlicher Sprache (NLP) gemacht. Dies ist vor allem auf ihre Fähigkeit zurückzuführen, umfangreiche Modelle anhand von Textdaten zu trainieren. Mit der Entwicklung dieser Sprachmodelle wird die KI fit für Aufgaben wie Stimmungsanalyse, maschinelle Übersetzung, Texterstellung und Zusammenfassung.

Trotz dieser Fortschritte kämpft die KI jedoch weiterhin mit ihren kognitiven Fähigkeiten, wenn es darum geht, mehrstufige Argumentationsaufgaben wie mathematische Wortprobleme und symbolisches und vernunftbasiertes Denken zu bewältigen.

Dieser Artikel stellt die neueste Entwicklung vor, die als chain-of-thought (CoT) reasoning bekannt ist, eine auf Eingabeaufforderungen basierende Technik, die es KI-Modellen ermöglicht, kognitive Fähigkeiten zu zeigen.

Was ist ein Prompt?

Die Aufforderung ist eine Anweisung an das Modell, eine Antwort zu geben. Sie ist vergleichbar mit der Aufforderung an jemanden, einen Aufsatz zu einem bestimmten Thema zu schreiben. Ähnlich wie menschliche Schreiber verwenden KI-Modelle Prompts als Grundlage für das Schreiben von Aufsätzen oder das Generieren von Antworten.

Wir können Sprachmodelle wie ChatGPT mit einfachen Fragen wie “Wer ist der König des Vereinigten Königreichs?” bis hin zu komplexen Problemen mit detaillierten Aufgabenbeschreibungen auffordern. Selbst eine Aufforderung wie “Erzähl mir einen Witz” kann als offene Aufforderung betrachtet werden.

Wie funktioniert Prompt Engineering?

Prompt-Engineering befasst sich mit der Erstellung und Gestaltung von Prompts, die KI-Modelle in die Lage versetzen, bestimmte Aufgaben auszuführen. Während dieses Prozesses ist es wichtig, die Daten und das Format der Aufforderung sorgfältig auszuwählen, um sicherzustellen, dass das Modell sie effektiv für die Ausführung der Aufgabe nutzen kann.

Wenn wir zum Beispiel die Stimmung der Filmkritik “Don’t watch it” bestimmen wollen, können wir die Aufforderung “It is” an den Satz anhängen, so dass er zu “Don’t watch it. Er ist ____.” In diesem Fall würden wir erwarten, dass das Sprachmodell mit höherer Wahrscheinlichkeit “schrecklich” statt “großartig” generiert.

Das Ziel der Entwicklung von KI-Prompts ist es, qualitativ hochwertige Prompts zu generieren, die es dem KI-Modell ermöglichen, genaue Vorhersagen zu treffen.

Prompt-basiertes Lernen

Die Prompts können auch verwendet werden, um einem KI-Modell beizubringen, die gewünschten Ergebnisse zu erzielen. Bei dieser Technik, die als Prompt-basiertes Lernen bezeichnet wird, werden dem Modell Fragen gestellt und die richtigen Antworten gegeben, bevor es andere Fragen beantworten soll.

Wir können dem Modell zum Beispiel einige numerische Fragen und deren Antworten vorgeben und es dann bitten, andere Fragen zu lösen:

Q: In der Cafeteria gab es 23 Äpfel. Wenn sie 20 für das Mittagessen verwendet und 6 weitere gekauft haben, wie viele Äpfel haben sie dann?
A: 9Q: Es gibt 15 Schüler in einer Klasse. Wenn 7 weitere Schüler in die Klasse kommen, wie viele Schüler sind dann insgesamt in der Klasse?
A: ______

Es wurde jedoch festgestellt, dass einfache Aufforderungen, die nur aus einer Frage und ihrer Antwort bestehen, bei kognitiven Aufgaben wie mathematischen Wortproblemen, symbolischem Denken und logischem Denken oft zu falschen Ergebnissen führen.

Um diese Herausforderungen zu bewältigen, ist das Chain-of-Thought-Reasoning eine vielversprechende neue Technik, die speziell entwickelt wurde, um KI-Modelle in die Lage zu versetzen, diese kognitiven Aufgaben erfolgreich zu bewältigen.

Chain-Of-Thought Reasoning

Beim Standard-Prompting lernt das Modell aus Frage-Antwort-Beispielen und sagt dann die Antworten für neue Fragen voraus. Beim Chain-of-Thought Prompting hingegen wird das Modell angewiesen, komplexe Probleme in kleinere Schritte zu unterteilen und sowohl die dazwischen liegenden Denkschritte als auch die endgültige Lösung bereitzustellen.

Die Gedankenkette wurde vom arithmetischen Denken inspiriert, bei dem die natürliche Sprache zum Aufbau eines Arguments verwendet wird, das zur endgültigen Antwort führt. Dies hilft dem Modell, mehrstufige Probleme effektiver anzugehen, da es komplizierte Probleme in kleinere, einfach zu lösende Schritte zerlegen kann.

Da die Gedankenkette auf Sprache basiert, kann sie auf jede Aufgabe angewendet werden, die ein Mensch mit Hilfe von Sprache lösen kann. Ein Beispiel für eine Standard-Aufforderung im Vergleich zu einer Denkketten-Aufforderung ist unten dargestellt.

Beispiel für eine Standard-Eingabeaufforderung Beispiel für eine Aufforderung zu einer Gedankenkette
Frage Stellen Sie sich vor, Sie planen eine Autoreise mit Ihren Freunden. Sie möchten die Gesamtkosten für den Kraftstoff für die Reise berechnen. Die Entfernung zwischen Ihrem Start- und Zielort beträgt 500 Meilen, und die durchschnittliche Kraftstoffeffizienz Ihres Autos beträgt 30 Meilen pro Gallone. Der aktuelle Kraftstoffpreis beträgt $3,50 pro Gallone. Berechnen Sie die geschätzten Gesamtkosten des Kraftstoffs für die Fahrt. Stellen Sie sich vor, Sie planen eine Autoreise mit Ihren Freunden. Sie möchten die Gesamtkosten für den Kraftstoff für die Reise berechnen. Die Entfernung zwischen Ihrem Start- und Zielort beträgt 500 Meilen, und die durchschnittliche Kraftstoffeffizienz Ihres Autos beträgt 30 Meilen pro Gallone. Der aktuelle Kraftstoffpreis beträgt $3,50 pro Gallone. Berechnen Sie die geschätzten Gesamtkosten des Kraftstoffs für die Fahrt und erläutern Sie Ihre Berechnungen Schritt für Schritt.
Antwort $59.50.
  1. Um die Gesamtkosten für Kraftstoff zu berechnen, müssen wir die Gesamtzahl der für die Fahrt benötigten Gallonen Kraftstoff ermitteln.
  2. Berechnen wir zunächst, wie viele Gallonen Kraftstoff benötigt werden, um die gesamte Strecke zurückzulegen. Wir teilen die Gesamtstrecke von 500 Meilen durch die durchschnittliche Kraftstoffeffizienz des Autos von 30 Meilen pro Gallone: 500 Meilen / 30 Meilen pro Gallone = 16,67 Gallonen.
  3. Da wir keinen Bruchteil einer Gallone haben können, müssen wir auf die nächste ganze Zahl aufrunden. Daher benötigt das Auto für die gesamte Fahrt etwa 17 Gallonen Kraftstoff.
  4. Als Nächstes multiplizieren wir die Gesamtzahl der Gallonen (17) mit dem Preis pro Gallone (3,50 $), um die Gesamtkosten für Kraftstoff zu ermitteln: 17 Gallonen * 3,50 $ pro Gallone = 59,50 $.
  5. Daher belaufen sich die geschätzten Gesamtkosten für die Fahrt auf 59,50 $.

Vorteile der Chain-of-Thought-Technik

Die Gedankenkette bietet mehrere Vorteile, wenn es darum geht, die kognitiven Fähigkeiten von KI-Modellen zu verbessern:

  • Problem-Zerlegung: Die Denkkette ermöglicht es KI-Modellen, komplizierte Probleme in einfach zu handhabende Zwischenschritte zu zerlegen, so dass sie komplexe mehrstufige logische Probleme lösen können.
  • Interpretierbarkeit des Modells: Indem das KI-Modell in der Lage ist, Zwischenschritte mit Lösungen zu generieren, bietet eine Gedankenkette eine Möglichkeit, das Verhalten des Modells zu interpretieren, d.h. wie das Modell zu einer bestimmten Lösung gelangt ist. Auf diese Weise können wir potenzielle Fehler im Argumentationspfad erkennen und beheben.
  • Breite Anwendbarkeit: Das Denken in Gedankenketten hat sich bei verschiedenen Aufgaben als nützlich erwiesen, z. B. bei mathematischen Wortproblemen, beim Denken mit gesundem Menschenverstand und bei symbolischer Manipulation. Im Grunde kann es auf jede Aufgabe angewandt werden, die Menschen mit Hilfe von Sprache lösen können, was es zu einem vielseitigen Ansatz macht.
  • Einfache Integration: Die Gedankenkette kann leicht in die bestehenden sprachbasierten KI-Modelle integriert werden. Es sind keine zusätzlichen Rechenressourcen erforderlich, um die Modelle neu zu trainieren oder fein abzustimmen. Alles, was es braucht, sind einige Beispiele für Gedankenketten, die dem Modell vorgeben, wie es die Probleme zu lösen hat.

Die Verwendung von Gedankenketten hat gezeigt, dass die kognitiven Fähigkeiten von KI-Modellen in den unten genannten Bereichen wirksam verbessert werden können.

Arithmetisches Denken ist eine kognitive Fähigkeit, die die Fähigkeit beinhaltet, mathematische Wortprobleme durch mehrstufige Berechnungen zu lösen. Diese Fähigkeit hilft Schülern bei der Entwicklung von Problemlösungsstrategien, die zur Lösung mathematischer Probleme erforderlich sind. Die Forscher haben gezeigt, dass die Gedankenkette KI-Modellen beim Erlernen dieser kognitiven Fähigkeit hilft.

Der gesunde Menschenverstand ist eine wichtige kognitive Fähigkeit, bei der es darum geht, Fragen zu alltäglichen Szenarien zu beantworten, indem man Schlussfolgerungen aus allgemeinem Wissen zieht. Wissenschaftler haben festgestellt, dass KI-Modelle mit Hilfe der Gedankenkette diese Fähigkeit erlernen können und so in der Lage sind, alltägliche Situationen zu verstehen.

Symbolisches Denken ist eine grundlegende kognitive Fähigkeit, die den Umgang mit und die Bewertung von symbolischen Ausdrücken beinhaltet. Forscher haben festgestellt, dass die Denkkette KI-Modelle mit dieser Fähigkeit ausstattet, so dass sie in der Lage sind, in verschiedenen Bereichen effektiv symbolische Schlussfolgerungen zu ziehen.

Die Quintessenz

Die Gedankenkette ist ein vielversprechender Ansatz zur Verbesserung der kognitiven Fähigkeiten von KI-Modellen, insbesondere in Bereichen wie arithmetisches Denken, logisches Denken und symbolisches Denken.

Im Gegensatz zu einer einfachen Eingabeaufforderung wird das Modell bei einer Chain-of-Thought-Aufforderung angewiesen, komplexe Probleme in kleinere Schritte zu zerlegen, um neben der endgültigen Lösung auch Zwischenüberlegungen anzustellen.

Die Denkkette löst nicht nur kognitive Aufgaben, sondern bietet auch Einblicke in die innere Funktionsweise des Modells. Sie kann auch problemlos für verschiedene Aufgaben eingesetzt werden und erfordert keine zusätzlichen Rechenressourcen.

Durch die weitere Erforschung und Verfeinerung des Chain-of-Thought-Prinzips können wir KI-Modelle in die Lage versetzen, verbesserte kognitive Fähigkeiten zu demonstrieren.

Verwandte Begriffe

Dr. Tehseen Zia

Dr. Tehseen Zia hat einen Doktortitel und mehr als 10 Jahre Forschungserfahrung auf dem Gebiet der Künstlichen Intelligenz (KI) nach seiner Promotion. Er ist Assistenzprofessor und leitet die KI-Forschung an der Comsats University Islamabad und ist Mitbegründer des National Center of Artificial Intelligence Pakistan. In der Vergangenheit hat er als Forschungsberater für das von der Europäischen Union finanzierte KI-Projekt Dream4cars gearbeitet.