Im Kopf von ChatGPT: Wie entscheidet der KI Bot, was er sagt?

DAS WICHTIGSTE IM ÜBERBLICK

In einer Ära, in der KI immer stärker in unser tägliches Leben eingreift, wird das Verständnis für die Funktionsweise dieser intelligenten Systeme immer wichtiger. ChatGPT nimmt eine führende Position im Bereich der konversationellen KI ein und liefert Antworten, die eine bemerkenswerte menschenähnliche Qualität aufweisen. Lassen Sie uns den rätselhaften Prozess hinter ChatGPTs Entscheidungsfindung erkunden.

Nehmen wir an, Sie bitten ChatGPT, einen E-Mail-Entwurf zu überprüfen und dann zwei verschiedene Versionen für Sie zu schreiben.

Sie bitten um eine formelle E-Mail, die in Ton, Struktur und Sprache formell ist, während die andere eher gesprächig und luftig ist.

ChatGPT sendet die beiden E-Mail-Entwürfe genau so zurück, wie Sie es gewünscht haben. Außerdem ändert es seine Antwort, wenn Sie weitere Änderungen vorschlagen. Ist das nicht erstaunlich? Es ist, als ob Sie mit jemandem sprechen, der mitdenken und antworten kann und den Kontext aufnimmt, wenn Sie ihn später zum selben Thema befragen.

Sie fragen sich: “Wie wählt das Tool seine Worte? Und woher weiß der KI Bot, welche Worte einen bestimmten Ton und eine bestimmte Botschaft vermitteln?”

“Wie erinnert ChatGPT sich an den Kontext oder den roten Faden eines früheren Gesprächs?

Das wollen wir herausfinden.

Wie reagiert ChatGPT auf Eingaben?

ChatGPT verwendet zwei Methoden, um Antworten auf Ihre Eingaben zu finden – überwacht und unüberwacht.

Überwachtes Verfahren

Die überwachte Methode gibt eine konstante Antwort auf eine Frage vor, was es für ChatGPT weniger anstrengend macht, zu antworten.

Wenn Sie zum Beispiel fragen: “Wie setze ich das Passwort meines Gmail-Kontos zurück?”, ist die Antwort bereits vorgegeben und ChatGPT kennt sie. Alles was das Tool tut, ist die Antwort zurückzuschicken. Unkompliziert. Bei vielen solchen Anfragen kommt ChatGPT nicht ins Schwitzen.

Die größte Einschränkung bei dieser Methode ist jedoch, dass es unmöglich ist, Antworten auf alle Fragen, die ChatGPT gestellt werden können, zu programmieren.

Können Sie zum Beispiel eine Antwort auf eine Aufforderung wie “Erstellen Sie die Beschreibung einer fiktiven Figur, die auf einem fremden Planeten umherwandert, dort festsitzt und sich einsam fühlt und extremes Heimweh hat” schreiben?

Unüberwachte Methode

Beginnen wir die unbeaufsichtigte Methode mit der Analogie eines Kindes, das lernt, Vögel zu identifizieren.

Sie zeigen dem Kind Bilder von verschiedenen Vögeln, und das Kind lernt allmählich, die verschiedenen Teile eines Vogels zu identifizieren, z. B. Beine, Schnabel, Augen und Flügel.

Sie zeigen dem Kind immer wieder Bilder von verschiedenen Vögeln. Nach einiger Zeit erkennt das Kind nicht nur die Teile richtig, sondern auch verschiedene Vögel, so dass es zum Beispiel zwischen einem Adler und einem Eisvogel unterscheiden kann.

Es lernt auch Feinheiten wie z. B. dass alle Vögel Augen haben, aber nicht alle Tiere mit Augen Vögel sind.

Zeigen Sie nun das Bild eines Tigers und fragen Sie das Kind, ob das ein Vogel ist, und das Kind wird selbstbewusst genug sein, um die Frage zu verneinen.

ChatGPT durchläuft ein ähnliches Training. Sie füttern es kontinuierlich mit Daten über verschiedene Objekte, so dass ChatGPT die Muster, Zahlen und andere Details lernt.

Nach einiger Zeit kann ChatGPT, ähnlich wie ein Kind, das Objekt identifizieren. Die verschiedenen Lernmethoden sind bekannt als Clustering, Dimensionalität und Anomalie Reduktion.

Die unüberwachte Methode macht ChatGPT zu einem Wendepunkt. Anders als bei der überwachten Methode wird keine Ausgabe auf die Eingabe abgebildet, und es liegt an ChatGPT, die Informationen über das Objekt herauszufinden.

Ständiges Lernen, Clustering, Anomalieerkennung und Dimensionalität ermöglichen es ChatGPT, Prompts außerhalb des überwachten Lernens zu verstehen und entsprechend zu reagieren.

ChatGPT simuliert das menschliche Gehirn

Was bedeutet das für Sie? Die erstaunliche Fähigkeit von ChatGPT, Sätze und Wörter, die Menschen benutzen, zu verstehen, wird durch ein so genanntes neuronales Netzwerk ermöglicht.

Stellen Sie sich das neuronale Netzwerk als das Netzwerk aller Zellen des menschlichen Gehirns vor. Es ist eine unglaublich komplexe Struktur, die hochentwickeltes und komplexes Arbeiten ermöglicht. Denken Sie daran, wie Ihr Gehirn Informationen oder Reize verarbeitet und darauf reagiert.

Sätze und Wörter, wie sie in Gesprächen vorkommen, sind selten strukturiert und können für ein KI-Tool kryptisch sein.

Lassen Sie uns dies am Beispiel eines Vorstellungsgesprächs durchspielen.

Der Interviewer fragt: “Wie würden Sie einen Konflikt zwischen einem Produktmanager und einem Projektmanager über die Veröffentlichungstermine lösen?”

In diesem Fall würde Ihr Gehirn nach verfügbaren Informationen oder Erfahrungen aus der Vergangenheit suchen – vielleicht haben Sie in der Vergangenheit ähnliche Situationen gemeistert. Ihr Gehirn wird die verwendeten Techniken finden und ihre Anwendbarkeit in der aktuellen Situation bewerten. Außerdem wird es versuchen, die bewährten Verfahren anzuwenden, die Sie aus Ihren Erfahrungen und bewährten Verfahren gelernt haben.

Das neuronale Netzwerk, das die Lernfähigkeiten des ChatGPT steuert, tut etwas Ähnliches. Wenn Sie eine Frage stellen, deren Antwort noch nicht auf eine Ausgabe abgebildet ist, nutzt es seine umfangreichen Lernressourcen, findet Muster und Anwendbarkeit und erzwingt eine angemessene Antwort. All dies geschieht in wenigen Sekunden. Erstaunlich, nicht wahr?

Probleme mit ChatGPT-Antworten

So erstaunlich die Fähigkeit von ChatGPT, Antworten auszuwählen, auch sein mag, so hat es doch viele Einschränkungen.

Erstens kann es voreingenommene Antworten geben, was umstritten sein kann. Es ist an die Daten gebunden, die ihm für das Training zur Verfügung gestellt werden.

In einem Forbes-Artikel heißt es beispielsweise, dass ChatGPT sich weigerte, ein Gedicht über den amerikanischen Präsidenten Trump zu schreiben, aber ein Gedicht über Biden verfasste. Es kann auch Antworten halluzinieren. Es weiß nicht, was es nicht weiß, und kann trotzdem falsche Antworten geben, was gefährlich sein kann.

Und schließlich kann es die Feinheiten der menschlichen Kommunikation nicht verstehen, wie etwa Humor oder Satire in Gesprächen, die nicht immer offensichtlich sind.

Infolgedessen kann es schwierig sein, die von Ihnen erwarteten Antworten zu geben. Es kann sachlich korrekte Antworten geben, aber die Nuancen, die ein wesentlicher Bestandteil der menschlichen Kommunikation sind, übersehen.

Die Schlussfolgerung

Ungeachtet der Einschränkungen ist es erstaunlich, dass ein Tool oder eine Software versucht, das menschliche Gehirn zu imitieren. Es ist fantastisch zu sehen, dass ChatGPT den Kontext eines vorherigen Gesprächs aufgreifen und eine vernünftige Antwort geben kann. Wer hätte sich das noch vor zehn Jahren vorstellen können?

In seinem jetzigen Zustand ist ChatGPT bestenfalls ein Werkzeug, das sich noch in der Entwicklung befindet. Die Kontroversen und die Kritik an seinen Antworten lassen sich am besten durch die Weiterentwicklung des neuronalen Netzes bewältigen, das die Technologie steuert. Die Fähigkeit, bessere Wörter und Informationen auszuwählen, wird durch bessere Datensätze und eine schnellere Entwicklung des neuronalen Netzwerks gefördert. Bessere Datensätze bedeuten, dass ChatGPT bei der Beantwortung einer Aufforderung mehr geeignete Ressourcen zur Auswahl hat.

Verwandte Begriffe

Kaushik Pal

Kaushik ist technischer Architekt und Softwareberater und verfügt über mehr als 20 Jahre Erfahrung in den Bereichen Softwareanalyse, -entwicklung, -architektur, -design, -prüfung und -schulung. Er interessiert sich für neue Technologien und Innovationsbereiche. Er konzentriert sich auf Webarchitektur, Webtechnologien, Java/J2EE, Open Source, WebRTC, Big Data und semantische Technologien. Kaushik ist auch der Gründer von TechAlpine, einem Technologie-Blog/Beratungsunternehmen mit Sitz in Kolkata. Das Team von TechAlpine arbeitet für verschiedene Kunden in Indien und im Ausland. Das Team verfügt über Fachwissen in den Bereichen Java/J2EE/Open Source/Web/WebRTC/Hadoop/Big Data-Technologien und technisches Schreiben.