← モデルリストに戻る

GPT-4 Vision

OpenAI

簡介

GPT-4 Visionは、OpenAIの画期的なマルチモーダルモデルであり、テキストと画像の両方の入力を処理できます。ユーザーは、画像の分析、詳細なキャプションの生成、視覚パズルの解決など、複雑な視覚およびテキストタスクを操作できます。このモデルは、教育、クリエイティブデザイン、データ分析で広く使用されています。

1.8T

128,000 tokens

120 tokens/s

8000 tokens/s

チャット

画像認識

入力トークン128,000 tokens

出力トークン4,096 tokens

$0.00035/1K input, $0.0007/1K output

発表情報

発表日2024-04-23

バージョンgpt4v

GPT-4 Vision を Lunabot で使用