Gemma 3: Googleの最先端オープンAIモデル
Gemini 2.0テクノロジーを基盤としたGoogleの最も優れたオープンモデル。
マルチモーダル機能と128Kコンテキストウィンドウで強力なAIアプリケーションを構築しましょう。
🚀 単一GPUで最先端のパフォーマンスを実現
Gemma 3の主な特徴
開発者向けの幅広い機能を備えたGoogleの最も強力なオープンモデル。
視覚-言語理解
マルチモーダルアプリケーション向けの高度な視覚的推論機能により、画像とテキストを共に処理します。
128Kトークンコンテキストウィンドウ
より包括的な文書分析や複雑な推論タスクを可能にする大容量入力処理に対応。
140以上の言語サポート
グローバルアプリケーションを構築するための広範な多言語機能を標準装備。
複数のモデルサイズ
ハードウェアとパフォーマンスのニーズに合わせて、1B、4B、12B、27Bパラメータバージョンから選択可能。
関数呼び出し
関数呼び出しと構造化された出力生成の組み込みサポートによりAI駆動のワークフローを作成。
量子化モデル
精度を維持しながら計算要件を削減するための公式量子化バージョンを活用。
Gemma 3のパフォーマンス
軽量かつ効率的なパッケージにおける最先端の性能。
サポート言語
140+
言語
コンテキスト長
128K
トークン
モデルバリエーション
4
サイズ
Gemma 3に関する開発者コミュニティのフィードバック
Googleの最も優れたオープンモデルを使って構築する開発者の声をお聞きください。
デイビッド・チェン
MLエンジニア
Gemma 3のマルチモーダル機能により、単一GPUで効率的に動作する視覚アシスタントを構築できました。このサイズのモデルにおける画像理解能力は驚くべきものです。
レイチェル・キム
AI研究者
私たちは研究論文全体を分析するために128Kコンテキストウィンドウを使用しています。一貫性を維持しながらこのような長いコンテキストを処理する能力は、科学的応用において革新的です。
マーカス・トンプソン
インディー開発者
個人開発者として、Gemma 3がローカル環境で実行できることを高く評価しています。4Bモデルは驚くほど有能で、多言語アプリケーションのプロトタイピングにおける私の最初の選択肢になりました。
ソフィア・ガルシア
NLPスペシャリスト
多言語機能が印象的です。追加の微調整なしで15の言語で動作するアプリケーションを構築し、すべての言語で一貫したパフォーマンスを発揮しています。
ジェームズ・ウィルソン
テックリード
Gemma 3の関数呼び出し機能は、AIワークフローの構築方法を変革しました。構造化されたAPI呼び出しを通じて既存のシステムとシームレスに統合するアプリケーションを作成しています。
アンナ・チャン
スタートアップ創業者
Gemma 3の量子化バージョンを本番環境にデプロイし、パフォーマンスとリソースの比率に驚きました。インフラコストを増やすことなくAI機能をスケールできるようになっています。
Gemma 3についてよくある質問
Googleの最先端オープンAIモデルについてさらに詳しく学びましょう。
Gemma 3とは何ですか?また、以前のバージョンとどう違いますか?
Gemma 3はGemini 2.0を動かすのと同じ技術に基づいたGoogleの最先端オープンAIモデルです。マルチモーダル機能(視覚とテキスト)、128Kトークンコンテキストウィンドウ、140以上の言語サポートを導入し、単一のGPUまたはTPUで実行するように最適化された複数のサイズ(1B、4B、12B、27B)で提供されます。
Gemma 3を実行するにはどのようなハードウェアが必要ですか?
Gemma 3は様々なハードウェアで効率的に実行できるように設計されています。1Bモデルは CPUやモバイルデバイスで実行でき、4Bモデルは一般的なGPUでうまく動作し、27Bモデルでさえ単一のNVIDIA GPUで実行できます。最適なパフォーマンスを得るには、NVIDIA GPU、Google Cloud TPU、またはROCmスタックを搭載したAMD GPUが推奨されます。
Gemma 3をプロジェクトでどのように始めればよいですか?
このページで設定なしで直接Gemma 3を無料でお試しいただけます。様々なアプリケーションやユースケースを示す豊富な例を提供し、すぐに始められるようサポートしています。また、プランをアップグレードしてGemma 3の最大パラメータバージョンを使用し、様々な作業やエンターテイメントタスクの効率を向上させることもできます!
このページでGemma 3を使用する際にパラメータを調整できますか?
Gemma 3はモデルの動作をカスタマイズするためのいくつかの調整可能なパラメータを提供しています:最大新規トークン(1-2048)は生成されるテキストの長さを制御し、温度(0.1-4.0)は応答のランダム性を調整し、Top-p(0.05-1.0)とTop-k(1-1000)はサンプリング戦略を微調整し、繰り返しペナルティ(1.0-2.0)は繰り返しコンテンツを減らします。これらの設定により特定のユースケースに合わせてモデルを最適化できます。
Gemma 3は特にどのようなタスクに優れていますか?
Gemma 3は質問応答、要約、推論、コード生成、画像理解、多言語処理、関数呼び出し機能を備えた構造化出力生成など、幅広いタスクに優れています。また、128Kコンテキストウィンドウは特に長い文書処理に適しています。
Gemma 3は他のオープンモデルと比較してどうですか?
Gemma 3はそのサイズに対して最先端のパフォーマンスを提供し、予備的な人間の好み評価ではLlama-405BやDeepSeek-V3などの大きなモデルよりも優れた性能を示しています。これを単一GPUのみで実現するため、多くの開発者や組織にとってよりアクセスしやすく、コスト効率が高くなっています。