Transparenz

BloombergGPT: LLMs im Finanzsektor

DAS WICHTIGSTE IM ÜBERBLICK

FinTech hat das Finanzwesen mit Hilfe von Technologie umgestaltet und stützt sich dabei stark auf Textdaten für Anwendungen wie Stimmungsanalysen. KI spielt eine zentrale Rolle bei der Auswertung von Finanzdaten, steht aber aufgrund der Einzigartigkeit der Daten vor Herausforderungen. Große Sprachmodelle (Large Language Models, LLMs) beherrschen die Verarbeitung natürlicher Sprache und können an neue Abläufe anpasst werden. So glänzt z. B. BloombergGPT bei der Bewältigung finanzbezogener Aufgaben.

Die Überschneidung von Technologie und Finanzen hat eine lange Geschichte, die bis zur einfachen Rechenmaschine zurückreicht.

Im Laufe der Zeit hat sich diese Beziehung zu dem entwickelt, was heute als FinTech bezeichnet wird.

Dabei spielt die Technologie eine zentrale Rolle bei der Rationalisierung von Finanzoperationen, der Steigerung der Effizienz sowie der Optimierung von Entscheidungsprozessen.

In der modernen digitalisierten Finanzwelt stützt sich die Branche jedoch auf eine breite Palette von Informationsquellen, vor allem in Form von Textdaten.

Dazu gehören Finanznachrichten, Beiträge in sozialen Medien, Unternehmensberichte und vieles mehr.

Diese Textdaten können für eine Vielzahl von Funktionen im Finanzbereich eingesetzt werden, z. B. Stimmungsanalyse, Vorhersage von Anlagepreisen, Investitionsberatung, Aufdeckung von Betrug, Inflationsprognose.

Die Anwendung von künstlicher Intelligenz (KI) spielt bei der Analyse dieser Daten eine entscheidende Rolle.

Aufgrund der Einzigartigkeit von Finanzdaten und des Mangels an großen öffentlichen, beschrifteten Datensätzen steht die KI jedoch vor Herausforderungen, wenn sie sich in all diesen Anwendungen bewähren soll.

LLMs und Finanzmärkte

In der Zwischenzeit haben KI-basierte Large Language Models (LLMs), die auf umfangreichen Mengen von Webtexten trainiert wurden, ihre bemerkenswerten Fähigkeiten in einem breiten Spektrum von Aufgaben der Verarbeitung natürlicher Sprache (NLP) unter Beweis gestellt.

Diese Sprachmodelle zeigen eine außergewöhnliche Leistung bei Aufgaben wie Leseverständnis, Beantwortung offener Fragen sowie Textklassifizierung und liefern Ergebnisse mit bemerkenswerter Präzision.

Das Besondere an diesen Modellen ist ihr ausgeprägtes Verhalten. Dank der einzigartigen Fähigkeit können sie mit nur einer Handvoll Beispiele rasch neue Aufgaben bewältigen, wodurch sich das Spektrum der Funktionen, die sie beherrschen, erheblich erweitert.

So wird nicht nur ihre Vielseitigkeit erhöht, sondern auch der Bedarf an umfangreicher Datenbeschriftung erheblich reduziert.

Bloombergs Sprung in den LLM-Bereich

Bloomberg, ein globales Wirtschaftsunternehmen, hat das Potenzial von LLMs im Finanzsektor erkannt und sein eigenes LLM, BloombergGPT, vorgestellt.

Mit unglaublichen 50 Milliarden Parametern, trainiert auf einem Datensatz von 700 Milliarden Token, kombiniert dieses Modell Bloombergs proprietäre Daten mit öffentlichen Quellen.

Im Rahmen strenger Benchmark-Tests hat BloombergGPT seine Überlegenheit bei verschiedenen finanzbezogenen Aufgaben bewiesen.

Das Modell verfügt über zwei praktische Schlüsselfunktionen: die Fähigkeit, Bloomberg Query Language (BQL) zu generieren und Vorschläge für Nachrichtenschlagzeilen zu machen.

Trotz der bemerkenswerten Leistung hat BloombergGPT jedoch gewisse Einschränkungen. Es handelt sich um ein proprietäres Modell, d. h. der Zugang ist eingeschränkt, die Transparenz hinsichtlich der Datenerhebung, der Trainingsprotokolle und des Modells selbst ist begrenzt.

Bedarf an Open-Source-Alternativen

Diese Einschränkungen proprietärer Modelle unterstreichen die Bedeutung von Open-Source-Alternativen, die auf den Finanzsektor zugeschnitten sind.

Quelloffene Sprachmodelle für den Finanzsektor (FinLLMs) bieten eine Reihe einzigartiger Vorteile und schaffen ein Gleichgewicht:

1. Universeller Zugang: Open-Source-FinLLMs sind frei zugänglich und folgen dem Prinzip der Demokratisierung von Finanzsprachmodellen, indem die Macht und das Wissen nicht in den Händen einiger weniger gehalten wird.
2. Transparenz und Vertrauen: Open-Source-Modelle sind in Bezug auf ihre Codebasis transparent und fördern so das Vertrauen. In einer so kritischen Branche wie dem Finanzwesen stellt Transparenz eine wesentliche Voraussetzung für die Interessengruppen dar.
3. Beschleunigung von Forschung und Entwicklung: Die Quelloffenheit dieser Modelle treibt den Fortschritt in der KI-Forschung und -Entwicklung voran. Wissenschaftler können auf bestehenden Modellen aufbauen und so Innovationen und wissenschaftliche Entdeckungen fördern.
4. Gemeinschaftsbildung: Open-Source-Modelle unterstützen eine globale Community von Mitwirkenden. Dies gewährleistet die Dauerhaftigkeit und Wirksamkeit der Modelle auf lange Sicht.

FinGPT: ein Rahmen für die Entwicklung von Open-Source-FinLLMs

Kürzlich haben Forscher der Columbia und der New York University eine mögliche Lösung vorgestellt: ein Open-Source-Rahmenwerk namens FinGPT.

Dieser bezieht sich auf die Entwicklung von FinLLMs und bietet ein Gleichgewicht zwischen proprietären und Open-Source-Modellen. FinGPT besteht aus vier Schlüsselkomponenten:

1. Datenquellenschicht: Sie orchestriert die Sammlung umfangreicher Finanzdaten aus verschiedenen Online-Quellen und gewährleistet so eine umfassende Marktabdeckung.

Zu den Quellen für die Datensammlung gehören Finanznachrichten von renommierten Medien wie Reuters und CNBC, soziale Plattformen wie Twitter und Facebook, Websites von Finanzaufsichtsbehörden wie der SEC in den USA und großen Börsen wie NYSE, NASDAQ und der Shanghai Stock Exchange.

2. Datenverarbeitungsschicht: Diese Schicht verarbeitet NLP-Daten in Echtzeit, um das Rauschen herauszufiltern und relevante Informationen hervorzuheben und so die Herausforderungen zu bewältigen, die Finanzdaten mit sich bringen.

3. LLMs-Schicht: Diese ist ein Gateway für den Zugang zu vortrainierten Sprachmodellen über APIs. Darüber hinaus bietet FinGPT anpassungsfähige Modelle, mit denen man eine Feinabstimmung mit den eigenen Daten vornehmen kann, um diese Modelle auf spezifische Finanzanwendungen zuzuschneiden.

Außerdem bietet diese Schicht die Flexibilität, LLMs mit verschiedenen Techniken zu optimieren, einschließlich der Feinabstimmung über Reinforcement Learning from Human Feedback (RLHF).

Das Hauptaugenmerk bei dieser Ebene liegt auf der Aufrechterhaltung der Agilität. So soll sichergestellt werden, dass das Modell in der sich ständig weiterentwickelnden Landschaft der Finanzdaten aktuell und relevant bleibt.

4. Anwendungsschicht: Die letzte Komponente demonstriert die praktischen Anwendungen von FinGPT und bietet praktische Tutorials und Demos für verschiedene Finanzaufgaben, von Robo-Beratungsdiensten über quantitativen Handel bis hin zu Low-Code-Entwicklung.

Open-Source-FinLLMs können zwar die mit proprietären FinLLMs verbundenen Herausforderungen bewältigen, haben aber mit der mangelnden Zuverlässigkeit zu kämpfen, die sich aus dem Fehlen einer engagierten Entwicklung und Wartung durch ein erfahrenes Team von Experten ergibt.

Diese Modelle sind das Ergebnis von zufälligen Beiträgen der Community und werden nicht von einer ausgewählten Gruppe von Personen mit einem tiefgreifenden Verständnis für die Feinheiten der künstlichen Intelligenz sorgfältig ausgearbeitet und abgestimmt.

Außerdem fehlt es Unternehmen, die sich für Open-Source entscheiden, an maßgeschneidertem Support und Wartung.

Anwendungen von FinLLMs

FinLLMs haben ein breites Spektrum an potenziellen Anwendungen, darunter:

1. Persönlicher Berater: FinLLMs können individuelle Finanzberatung anbieten, wodurch sich die Notwendigkeit regelmäßiger persönlicher Konsultationen verringert.
2. Analyse der Finanzstimmung: FinLLMs können Stimmungen auf verschiedenen Finanzplattformen auswerten, um aufschlussreiche Anlageempfehlungen zu geben.
3. Erstellung von Inhalten: FinLLMs können hochwertige Finanzinhalte für Websites und Social-Media-Kanäle generieren, mit denen Unternehmen schneller und einfacher ein größeres Publikum erreichen können.
4. Lehrmittel: Open-Source-FinLLMs können als wertvolle Bildungsinstrumente dienen, mit denen sich Studenten und Forscher direkt mit den Feinheiten von Finanzsprachmodellen auseinandersetzen können, was das Lernen erleichtert.
5. Analyse von Finanzdaten: FinLLMs können die Auswertung von Finanzdaten demokratisieren, indem die Nutzer zur Ausführung komplizierter Datenanalyseaufgaben auf benutzerfreundliche Weise befähigt werden.
6. Übersetzung von Datenformaten: FinLLMs könnten die Übersetzung komplizierter Datenmuster erleichtern. BloombergGPT demonstriert ein Beispiel für diese Konvertierung durch die Generierung von Bloomberg Query Language (BQL) aus natürlicher Sprache.
7. FinLLM-gestützte Chatbots: Diese können rund um die Uhr mit Kunden interagieren und so die Online-Kommunikation verbessern.

Fazit

Der Schritt des Finanzsektors in die Welt der großen Sprachmodelle ist vielversprechend, wobei sowohl proprietäre als auch quelloffene Modelle ihre eigenen Stärken und Herausforderungen haben.

Die Zukunft hält zweifellos weitere Innovationen im Bereich der FinLLMs bereit, die die Kluft zwischen Technologie und Finanzen weiter überbrücken werden.

Unabhängig davon, ob es sich um proprietäre oder Open-Source-Modelle handelt, haben diese Modelle das Potenzial, den Umgang mit Finanzdaten durch die Bereitstellung von Einblicken, Orientierungshilfen und Unterstützung in bisher nicht gekannter Weise zu revolutionieren.

Es gilt, sich in dieser Landschaft zurechtzufinden, die Vor- und Nachteile abzuwägen und fundierte Entscheidungen zu treffen, die den individuellen Bedürfnissen von Finanzunternehmen und Stakeholdern gerecht werden.

Bei der weiteren Erforschung dieser spannenden Entwicklung können wir einen Wandel in der Finanzbranche erwarten, der durch die Leistungsfähigkeit von Sprachmodellen und künstlicher Intelligenz vorangetrieben wird.

Verwandte Begriffe

Dr. Tehseen Zia
Assistenz Professor an der Comsats Universität Islamabad

Dr. Tehseen Zia hat einen Doktortitel und mehr als 10 Jahre Forschungserfahrung auf dem Gebiet der Künstlichen Intelligenz (KI) nach seiner Promotion. Er ist Assistenzprofessor und leitet die KI-Forschung an der Comsats University Islamabad und ist Mitbegründer des National Center of Artificial Intelligence Pakistan. In der Vergangenheit hat er als Forschungsberater für das von der Europäischen Union finanzierte KI-Projekt Dream4cars gearbeitet.