Neueste Entwicklungen im Bereich der LLM

Veröffentlicht am 11 April 2024, 06:01 Uhr

 

Drei Updates von Sprachmodellen innerhalb von 24 Stunden

In den letzten 24 Stunden hat die Welt der KI und der Large Language Models (LLM) bemerkenswerte Fortschritte erlebt.

 

Hier ein Überblick über die spannendsten Entwicklungen:

Google hat die allgemeine Verfügbarkeit von Gemini Pro 1.5 angekündigt. Dieses Update für ihr GPT-4-Klassenmodell bietet nun eine Kontextgröße von 1 Million Token und steht in 180 Ländern zur Verfügung – Europa und das Vereinigte Königreich ausgenommen.

Besonders hervorzuheben ist die Einführung eines kostenlosen Tarifs, der bis zu 50 Anfragen pro Tag ermöglicht. Für weitere Anfragen werden Gebühren erhoben, die im Vergleich zu vorherigen Modellen leicht angepasst wurden. Außerdem unterstützt Gemini Pro jetzt auch Audioeingaben und Systemaufforderungen.

 

OpenAI hat die finale Version von GPT-4 Turbo vorgestellt, die GPT-4 Vision direkt integriert – eine Neuerung, denn bisher war dies ein separater Service. Die Vision-Funktion unterstützt jetzt sowohl Funktions- als auch JSON-Ausgaben für Bildinputs. Das Modell wurde laut OpenAI erheblich verbessert, wobei die genauen Verbesserungen noch nicht im Detail bekannt sind.

Mistral AI hat einen Link zu einem 281GB großen BitTorrent-Magnet von Mixtral 8x22B geteilt, ihrem neuesten offen lizenzierten Modell, das deutlich größer ist als das bisherige Spitzenmodell Mixtral 8x7B. Obwohl erste Tests noch ausstehen, sind die Erwartungen hoch, basierend auf der Leistung des Originalmodells Mixtral.

Zusätzlich erreichte das Modell Command R+ von Cohere, das ebenfalls offen lizenziert ist, den 6. Platz im LMSYS Chatbot Arena Leaderboard.

 

Diese Entwicklungen markieren einen signifikanten Fortschritt im Bereich der KI-Forschung und -Anwendung. Sie zeigen, wie schnell sich die Landschaft der Großsprachmodelle verändert und welche neuen Möglichkeiten sich dadurch eröffnen.