모델 목록으로 돌아가기

GPT-4 Vision

OpenAIOpenAI

소개

GPT-4 Vision은 텍스트와 이미지 입력을 모두 처리할 수 있는 OpenAI의 획기적인 멀티모달 모델입니다. 사용자가 이미지를 분석하거나 자세한 캡션을 생성하거나 시각적 퍼즐을 푸는 등 복잡한 시각 및 텍스트 작업과 상호 작용할 수 있습니다. 이 모델은 교육, 창의적 디자인, 데이터 분석에 널리 사용됩니다.

1.8T
128,000 tokens
120 tokens/s
8000 tokens/s

대화
이미지 인식

입력 토큰128,000 tokens
출력 토큰4,096 tokens
$0.00035/1K input, $0.0007/1K output

출시 정보

출시일2024-04-23
버전gpt4v