GPT-4o API入門:OpenAI最新モデルの使い方と料金体系

GPT-4o API入門:OpenAI最新モデルの使い方と料金体系

AIを知りたい

OpenAIのGPT-4oって、GPT-4とは何が違うんですか?

AIエンジニア

GPT-4oの「o」は「omni(全て)」を意味し、テキスト・画像・音声を統合的に処理できるマルチモーダルモデルです。GPT-4よりも高速で安価、かつ性能も向上しています。特にAPI利用ではコストが半分以下になったのが大きな変更点です。

AIを知りたい

APIで使うにはどうすればいいですか?

AIエンジニア

OpenAIのAPIキーを取得し、HTTPリクエストまたは公式SDKで呼び出します。Python SDKなら「from openai import OpenAI; client = OpenAI(); response = client.chat.completions.create(model=”gpt-4o”, messages=[…])」で利用開始です。

GPT-4oはOpenAIの最新フラグシップモデルで、テキスト・画像・音声のマルチモーダル処理に対応し、GPT-4比で2倍高速・半額以下の料金で利用できます。

API経由で利用でき、Chat Completions API、Assistants API、Batch APIなど複数のインターフェースが用意されています。128Kトークンのコンテキストウィンドウを持ちます。

料金体系

AIを知りたい

GPT-4oのAPI料金はどれくらいですか?

AIエンジニア

GPT-4oは入力$2.50/1Mトークン、出力$10.00/1Mトークンです。GPT-4 Turbo(入力$10、出力$30)と比べて大幅に安くなりました。さらにコスト重視ならGPT-4o mini(入力$0.15、出力$0.60/1Mトークン)も選べます。

AIを知りたい

Batch APIを使うともっと安くなると聞いたのですが。

AIエンジニア

はい。Batch APIは24時間以内の非同期処理を前提に通常料金の50%割引で利用できます。リアルタイム応答が不要な大量処理(データ分類、翻訳、分析等)にはBatch APIが非常にコスパが良いです。

モデル 入力($/1M tokens) 出力($/1M tokens) コンテキスト
GPT-4o $2.50 $10.00 128K
GPT-4o mini $0.15 $0.60 128K
GPT-4 Turbo $10.00 $30.00 128K
o1 (推論) $15.00 $60.00 200K

主要なAPI機能

AIを知りたい

GPT-4o APIにはどんな機能がありますか?

AIエンジニア

主要な機能を紹介します。Function Callingで外部APIやデータベースとの連携、Structured OutputsでJSON形式の出力を保証、Visionで画像入力の処理、Streamingでリアルタイムのレスポンス表示ができます。Assistants APIを使えばRAGやコード実行も組み込めます。

AIを知りたい

Structured Outputsは便利そうですね。

AIエンジニア

非常に便利です。response_formatにJSON Schemaを指定すると、GPT-4oがそのスキーマに100%準拠したJSONを出力します。「名前、年齢、スキルのリストを含むオブジェクト」のような構造を保証できるので、プログラムからの後処理が格段に楽になります。

まとめ

GPT-4oは高速・低コスト・マルチモーダルの3拍子揃ったOpenAIのフラグシップモデルです。Function CallingやStructured Outputsで外部連携も容易で、Batch APIを使えばさらに50%のコスト削減が可能です。コスト重視ならGPT-4o mini、精度重視ならGPT-4oと使い分けましょう。

関連記事