米GOOGLEのgemini(ジェミニ―)新技術AIとは?驚きの性能が動画公開【動画あり】
米国のインターネット大手、GOOGLEは、人工知能(AI)の新技術「gemini」を発表しました。geminiは、自然言語処理(NLP)と画像認識(CV)の両方に優れたAIで、人間の言葉や画像を理解し、応答することができます。geminiの性能は、従来のAIよりもはるかに高く、驚くべき結果を示しています。
この技術の開発には、GOOGLEの研究者やエンジニアだけでなく、世界中の大学や研究機関との協力も重要な役割を果たしています。geminiは、深層学習や強化学習などの最先端のAI技術を組み合わせて構築されており、複雑なタスクに対応できる柔軟性と汎用性を持っています。
geminiの能力を実際に見ることができる動画「Hands-on with Gemini: Interacting with multimodal AI」が公開されました。この動画では、新しいマルチモーダルAIモデル「Gemini」の能力テストを行う様子を紹介しています。動画では、Geminiにさまざまな画像を見せて質問し、その反応や判断能力をテストしています。
Hands-on with Gemini: Interacting with multimodal AI」
この動画「Hands-on with Gemini: Interacting with multimodal AI」は、新しいマルチモーダルAIモデル「Gemini」の能力テストを行う様子を紹介しています。動画では、Geminiにさまざまな画像を見せて質問し、その反応や判断能力をテストしています。
geminiは、AIの新たな可能性を広げる技術
米グーグルのgeminiは、AIの新たな可能性を広げる技術として注目されています。geminiとは、自然言語処理と画像認識を組み合わせたモデルで、テキストや画像を入力として受け取り、それらに関連するテキストや画像を出力することができます。例えば、ある商品の説明文と写真を入力すれば、その商品のレビューや関連商品の提案を出力することが可能です。また、ある風景の写真を入力すれば、その風景についての詩や物語を出力することもできます。geminiは、従来のAIモデルよりも柔軟で創造的な応用が可能であり、マーケティングや教育、エンターテイメントなど様々な分野で活用されることが期待されています。
2023.12.8
AI大百科編集部