GPT-4o API入門:OpenAI最新モデルの使い方と料金体系

AIを知りたい
OpenAIのGPT-4oって、GPT-4とは何が違うんですか?

AIエンジニア
GPT-4oの「o」は「omni(全て)」を意味し、テキスト・画像・音声を統合的に処理できるマルチモーダルモデルです。GPT-4よりも高速で安価、かつ性能も向上しています。特にAPI利用ではコストが半分以下になったのが大きな変更点です。

AIを知りたい
APIで使うにはどうすればいいですか?

AIエンジニア
OpenAIのAPIキーを取得し、HTTPリクエストまたは公式SDKで呼び出します。Python SDKなら「from openai import OpenAI; client = OpenAI(); response = client.chat.completions.create(model=”gpt-4o”, messages=[…])」で利用開始です。
GPT-4oはOpenAIの最新フラグシップモデルで、テキスト・画像・音声のマルチモーダル処理に対応し、GPT-4比で2倍高速・半額以下の料金で利用できます。
API経由で利用でき、Chat Completions API、Assistants API、Batch APIなど複数のインターフェースが用意されています。128Kトークンのコンテキストウィンドウを持ちます。
料金体系

AIを知りたい
GPT-4oのAPI料金はどれくらいですか?

AIエンジニア
GPT-4oは入力$2.50/1Mトークン、出力$10.00/1Mトークンです。GPT-4 Turbo(入力$10、出力$30)と比べて大幅に安くなりました。さらにコスト重視ならGPT-4o mini(入力$0.15、出力$0.60/1Mトークン)も選べます。

AIを知りたい
Batch APIを使うともっと安くなると聞いたのですが。

AIエンジニア
はい。Batch APIは24時間以内の非同期処理を前提に通常料金の50%割引で利用できます。リアルタイム応答が不要な大量処理(データ分類、翻訳、分析等)にはBatch APIが非常にコスパが良いです。
| モデル | 入力($/1M tokens) | 出力($/1M tokens) | コンテキスト |
|---|---|---|---|
| GPT-4o | $2.50 | $10.00 | 128K |
| GPT-4o mini | $0.15 | $0.60 | 128K |
| GPT-4 Turbo | $10.00 | $30.00 | 128K |
| o1 (推論) | $15.00 | $60.00 | 200K |
主要なAPI機能

AIを知りたい
GPT-4o APIにはどんな機能がありますか?

AIエンジニア
主要な機能を紹介します。Function Callingで外部APIやデータベースとの連携、Structured OutputsでJSON形式の出力を保証、Visionで画像入力の処理、Streamingでリアルタイムのレスポンス表示ができます。Assistants APIを使えばRAGやコード実行も組み込めます。

AIを知りたい
Structured Outputsは便利そうですね。

AIエンジニア
非常に便利です。response_formatにJSON Schemaを指定すると、GPT-4oがそのスキーマに100%準拠したJSONを出力します。「名前、年齢、スキルのリストを含むオブジェクト」のような構造を保証できるので、プログラムからの後処理が格段に楽になります。
まとめ
GPT-4oは高速・低コスト・マルチモーダルの3拍子揃ったOpenAIのフラグシップモデルです。Function CallingやStructured Outputsで外部連携も容易で、Batch APIを使えばさらに50%のコスト削減が可能です。コスト重視ならGPT-4o mini、精度重視ならGPT-4oと使い分けましょう。
