Zurück zu den Modellen

GPT-4 Vision

OpenAIOpenAI

Einführung

GPT-4 Vision ist das bahnbrechende multimodale Modell von OpenAI, das sowohl Text- als auch Bildeingaben verarbeiten kann. Es ermöglicht Benutzern die Interaktion mit komplexen visuellen und textuellen Aufgaben, wie z. B. der Analyse von Bildern, der Erstellung detaillierter Bildunterschriften oder der Lösung visueller Rätsel. Dieses Modell wird häufig in der Bildung, im kreativen Design und in der Datenanalyse eingesetzt.

1.8T
128,000 tokens
120 tokens/s
8000 tokens/s

Chat
Vision

Eingabe-Tokens128,000 tokens
Ausgabe-Tokens4,096 tokens
$0.00035/1K input, $0.0007/1K output

Release-Informationen

Veröffentlichungsdatum2024-04-23
Versiongpt4v