モデルリストに戻る

GPT-4 Vision

OpenAIOpenAI

簡介

GPT-4 Visionは、OpenAIの画期的なマルチモーダルモデルであり、テキストと画像の両方の入力を処理できます。ユーザーは、画像の分析、詳細なキャプションの生成、視覚パズルの解決など、複雑な視覚およびテキストタスクを操作できます。このモデルは、教育、クリエイティブデザイン、データ分析で広く使用されています。

1.8T
128,000 tokens
120 tokens/s
8000 tokens/s

チャット
画像認識

入力トークン128,000 tokens
出力トークン4,096 tokens
$0.00035/1K input, $0.0007/1K output

発表情報

発表日2024-04-23
バージョンgpt4v