BLOG 研究員ブログ詳細

2023年12月21日 技術情報

Geminiとはなにか?メリットとデメリット、Chat-GPTとの違い

2023年12月6日、ついにGoogleより最新のAI「Gemini」がリリースされました。2023年に話題をさらったOpen AIのChat-GPTとはなにが違うのか、メリットとデメリットや各産業での使い方についてご紹介したいと思います。

目次

Geminiとはなにか?

Gemini(ジェミニ)とは、Google(alphabet)の子会社でグループのAIラボでもあるGoogle Deep Mind社から、2023年12月6日に発表された生成AIです。

生成系(予測や分類をするだけでなく、テキストなどのアウトプットを生成するAI)かつ大規模言語モデル (LLM) という意味では、2023年に大きく話題となったChat-GPTなどと同じカテゴリのものと言っていいでしょう。
実際、Google Deep Mindの公式ページにはChat-GPTとの性能比較表が掲載されており、先行するOpen AI × Microsoft連合を強く意識しているのではないかと思われます。

Geminiってなにができるの?Geminiの強みと特徴、メリット

執筆時点の発表を見る限り、Geminiの一番の特徴はマルチモーダル処理とオンデバイス処理にあると言えるでしょう。どういうことでしょうか。

<つまり、なにができるのか?>

最初から画像や文字を同時に扱うことを前提に開発したことで、人がしているような「総合的な判断」の実現にさらに近づいたと言えるでしょう。
例えば、「異音と、センサーの数値と、見た目の雰囲気と、臭いを総合的に判断して、ちょっとこの設備は様子がおかしいな」というような、異なるデータを総合した判断が可能になります。

また、Open AI × Microsoft連合と違い、GoogleはPixelシリーズなど自前のスマホを持っています。最初から、通信不要でデバイス内で処理を完結できるように設計したことは、Pixelシリーズに独自の機能を持たせることになるかもしれません。例えば記録した会話をその場で文字起こししたり、カメラをかざしたときに瞬時に笑顔に修正したりといった具合です。
Geminiを利用する会社も、類似のことを独自に開発できる可能性があります。

<特徴1: マルチモーダル処理とは >

マルチモーダル処理とは、画像・音声・文字など種類の異なるデータを同時に処理できる機能のことです。
これ自体はGeminiだけがもつ特徴ではありません。そもそもAIがこうした機能を手に入れたことで、生成系AIというジャンルが注目を浴びてきたわけです。
例えば、「文字の指示で絵を描く(例:ジブリ風の女の子が夏の日に田舎に立っている絵を描いて、など)」というのはまさにマルチモーダルな処理をしています。

しかし、Geminiはマルチモーダルな処理をすることを前提にゼロから開発したことが大きな特徴です。そのため、もともとChat(テキスト to テキスト)の形からスタートしたChat-GPTに対して処理速度や精度面で優位性を持っているというのがGoogle側の主張です。

↓ 下記のように画像と文章を上手く処理しています ↓

 

<特徴2: オンデバイス処理とは >

オンデバイス処理とは、文字通りデバイスの上(だけ)で処理をすることです。
通信をはさむと、どうしても処理速度は不安定になります。通信環境に処理が影響を受けてしまうからです。しかし、スマホをひらいたときにAIの処理待ちなどしてはストレスですし、自動運転などの分野では通信による処理の遅れが致命的になる場合もありえます。

GeminiはUltra、Pro、Nanoの3つのバージョンが展開されています。
イメージ的には、Ultraは研究開発用、Proはビジネス用、Nanoはオンデバイス用と考えていいでしょう。このNanoを利用することで通信なしで高度なAIを使用することができ、Googleのスマホの進化はもちろん、様々な企業が利用することでエッジコンピューティングの進歩が期待できるでしょう。

↓ Geminiの3つのバージョンを含む概要説明 ↓

 

Geminiにデメリットはあるのか?今後の成長性について

Google DeepMindの公式から発表されているデータによると、GPT-4と比較して、テキストの常識推論*を除くあらゆる側面でGeminiが優れていると主張されています。また利用料金についても、テキスト1000文字入力で$0.00025、1画像入力ごとに$0.0025で、1000文字出力ごとに$0.0005と格安といえる金額です。

これらの意味ではGeminiを利用することのデメリットはありません。しかし大規模言語モデル(LLM)であるがゆえの問題点は、GeminiもGPT-4同様にかかえています。
つまり、

  • 回答の情報そのものは正確かわからない
  • 他者の著作権に対して無許可に学習に利用している可能性
  • 学習されているデータが最新とは限らない
  • Geminiそのものは自分で改変できない

といった問題は共通して残っているものであり、デメリットとなるでしょう。
しかし様々な問題を抱えつつも、時代の流れはこのような学習済みモデルを「いかに活用して自分のビジネスに活かすか」を考えるようになっています。

おわりに

新たに登場したGoogleのAI Geminiについて、できること・特徴・メリットとデメリット・GPT-4との違いなど紹介してきました。

新技術応用推進基盤では、Geminiも含めたAIを活用する人材の育成支援を行っています。
研修や資格試験を通して、ぜひ最新のAIを使いこなして業務インパクトを発揮していただければと思います。

その他、ウェビナーでの技術解説や講演等もご相談ください。

今後とも当団体の活動をよろしくお願いいたします。

PROFILE
一般社団法人 新技術応用推進基盤

編集部

一般社団法人 新技術応用推進基盤では、人工知能(AI)をはじめとするデジタル技術や、企業の経営改革、新規事業の立ち上げなどにお役立ていただける情報発信を行っております。


『AIを活用する技術を学ぶ』発売中!

「人工知能プロジェクトマネージャー試験」
公式テキスト
- 分野別要点整理 【理解度チェック問題付き】 -

著者:谷村 勇平(新技術応用推進基盤 理事)
発売日:2023年12月22日(金)
販売価格:全分野収録版:2,980円(税込価格3,278円)
ページ数:A5版 330ページ
購入方法:
公式ページよりご購入ください。
https://rope.newtech-ma.com/

関連記事
  • 2024年1月5日

    技術情報

    アルゴリズムの仕組みと意味合いを理解する:相関系のアルゴリズム

  • 2023年12月21日

    技術情報

    Geminiとはなにか?メリットとデメリット、Chat-GPTとの違い

  • 2023年5月23日

    技術情報

    チャットGPTとは?メリットとデメリット、産業応用の可能性について

  • 2022年12月17日

    価値創造

    技術情報

    2023年のトレンドを読み解く3つのキーワード

  • 2022年11月7日

    技術情報

    データサイエンティストの最初の疑問「P値に関する疑問のあれこれ」

  • 2021年8月2日

    技術情報

    ヘルスケア産業に使われるアルゴリズムのトレンドとは?

  • 2021年5月25日

    技術情報

    いまさら解説する「教師あり学習」と「教師なし学習」の違い―それぞれの特徴と使い分けの勘所-

  • 2021年3月8日

    技術情報

    Goole Vision APIの精度とは?実際の利用方法を解説

  • 2019年10月20日

    技術情報

    【ニュース解説】因果推論 – 2019年ノーベル経済学賞の何がすごいのか? –