OpenAIに続いてグーグルも最新のAIモデルを発表しました。
新たな「Gemini 1.5 Pro」と「1.5 Flash」モデルは、Google AI StudioおよびVertex AIを通じて、200以上の国と地域で利用可能です。
「Gemini 1.5 Pro」は、翻訳、コーディング、推論などの主要なユースケースにおいて品質が向上しており、より広範で複雑なタスクに対応できるようになっています。一方、「1.5 Flash」は、応答時間の速さが求められる狭い範囲や高頻度のタスクに最適化されています。
これらのモデルは、100万トークンのコンテキストウィンドウを持ち、テキスト、画像、音声、ビデオを入力として組み合わせることができます。さらに、「1.5 Pro」は200万トークンのコンテキストウィンドウを持つプライベートプレビューも提供されます。
新しい開発者向け機能として、ビデオフレーム抽出と並列関数呼び出しが追加されました。これにより、複数の関数呼び出しを同時に返すことが可能になります。6月には、「Gemini 1.5 Pro」にコンテキストキャッシング機能が追加され、大きなファイルを一度だけモデルに送信することで、長いコンテキストがより有用かつ経済的になります。
価格は、Google AI Studioを通じて特定の地域で無料でGemini APIにアクセスできるほか、新しい従量課金制サービスのレート制限が引き上げられました。最新の価格情報はウェブサイトなどで確認できます。
また、Gemmaファミリーにも新たなモデルが追加されました。PaliGemmaは、画像キャプション、視覚的Q&A、その他の画像ラベリングタスクに最適化された初のビジョン・ランゲージオープンモデルです。さらに、Gemma 2が6月に登場し、27Bパラメータのインスタンスを持ち、GPUや単一のTPUホストで効率的に動作するということです。