xAI veröffentlicht Grok-2 Modell mit Bilderzeugung

Transparenz
Highlights

  • xAI hat die nächste Generation seines KI-Modells Grok angekündigt.
  • Das wichtigste Update ist die Fähigkeit, Bilder aus Text zu erzeugen.
  • Grok-2 und Grok-2 mini sind in der Beta-Version für X Premium+ und Premium-Nutzer verfügbar.

Das Grok-2 Modell von xAI enthält neue Funktionen zur Bilderzeugung für alle X Premium Abonnenten.

Elon Musks X steht derzeit in der Kritik, weil es Beiträge auf der Plattform nutzt, um seine KI-Modelle ohne deren Zustimmung zu trainieren. Das hat sein KI-Start-up xAI jedoch nicht davon abgehalten, die nächste Version des KI-Modells Grok zu veröffentlichen, die allen X-Premium-Abonnenten Bilderzeugung als neue Kernfunktion und eine neu gestaltete Chat-Oberfläche bietet.

Kürzlich hat xAI die nächste Generation der Grok-Modelle, Grok-2 und Grok-2 mini, als Beta-Version veröffentlicht. Diese Modelle sind jetzt für Nutzer der kostenpflichtigen Stufen von X verfügbar – allerdings können anscheinend nur Premium+ Nutzer das vollwertige Modell ausprobieren, während die mittlere Stufe auf die „Mini“-Version beschränkt ist.

Laut xAI weisen die neueren Modelle massive Verbesserungen gegenüber dem älteren Modell Grok-1.5 auf und schneiden in Bereichen wie naturwissenschaftliches Wissen auf Hochschulniveau (GPQA), Allgemeinwissen (MMLU, MMLU-Pro) und mathematische Wettbewerbsprobleme (MATH) im Vergleich zu anderen konkurrierenden Modellen gut ab.

Obwohl xAI das Gewicht der Trainingsdaten nicht preisgibt, ist davon auszugehen, dass sie die 314 Milliarden Parameter von Grok-1 übertreffen. In der Ankündigung behauptet das Unternehmen, dass die Testversion von Grok-2 auf dem LMSYS-Leaderboard, einer Crowdsourced-Plattform zur Bewertung von Chatbots, den GPT-4-Turbo von OpenAI und den Claude 3.5 Sonnet von Anthropic übertrifft.

Realistische Bilder und kein Problem mit Text

Die Bilderzeugungsfunktion wird von Flux unterstützt, einem neuen KI-Bilderzeugungsmodell von Black Forest Labs, das für seine realistischen Bilder bekannt ist.

Das Bild wurde mit Grok-2 mini unter Verwendung der Eingabeaufforderung erstellt: „Filmische Aufnahme in mittlerer Augenhöhe von Tänzern auf einer Party, beschwingt, energiegeladen, Ästhetik der 1920er Jahre.“ Credits: Tushar Mehta/Techopedia

Wie andere Text-Bild-Modelle ist Flux in der Lage, die Textur der menschlichen Haut zu reproduzieren. Das Besondere an Flux ist seine Fähigkeit, Text auf Anweisung zu schreiben, was für andere KI-Modelle schwierig ist.

Bild generiert mit Grok-2 mini, unter Verwendung der Aufforderung: „Junger Mann mit gewelltem Haar, Mode der 1940er Jahre, hält ein Transparent mit der Aufschrift ‘End The WAR’.“ Credits: Tushar Mehta/Techopedia

Neben der Bilderzeugung soll Grok auch in der Lage sein, die visuelle Wahrnehmung durch angehängte Bilddateien zu berücksichtigen. Dies wurde bereits mit der Veröffentlichung des Grok 1.5 Vision Modells angedeutet, obwohl die Funktionen noch nicht in den Chatbot für Nutzer integriert wurden. Darüber hinaus stellt xAI die neuen Modelle Entwicklern zur Verfügung, die sie über APIs in ihre Anwendungen und Plattformen integrieren können.

Tushar Mehta
Tech Journalist
Tushar Mehta
Tech Journalist

Tushar ist ein freiberuflicher Journalist, der seit fast einem Jahrzehnt über Verbrauchertechnologie berichtet. Zusätzlich zu Techopedia schreibt er für Digital Trends und Forbes Vetted und hat bereits für XDA und Android Central geschrieben.