ChatGPTとGoogle Bard どう使い分ける?自然言語処理専攻の大学院生が解説!

この記事は、広島大学で自然言語処理を専攻しているNakata氏とLeon Lobayashiによる共同執筆記事です。
BardとChatGPTの違いを、学習データやモデルの観点でまとめていきます。
技術的な違いから、
それぞれの得意不得意なことを理解することで、
効率的に利用できると思います!
ぜひ最後までご覧くださいっ!

また、お時間がない方は、目次からまとめをクリック!
ぱっと概要を理解できるようにしています!

目次

ChatGPTについての概要

ChatGPTは、2022年11月に米国のOpenAI社によってリリースされたチャットAIです。
ChatGPTのベースは、GPT(Generative Pre-trained Transformer)と呼ばれるモデル。
これを用いることで、多くの自然言語タスクの性能が大幅に向上します。
利用可能なモデルは、無料版であれば「GPT-3.5」、有料版であれば「GPT-4」です。
ただし、使用には制限があり、3時間につき25メッセージまでとされています。
「ChatGPT」が注目を浴びた理由は、入力文に対して人間のように回答してくれるからです。
このベースモデルは膨大な情報を基に学習されているため、あらゆる質問に瞬時に回答することができます。

Google Bardについての概要

Bardは、2023年3月にGoogleが公表した新しい対話型AIサービスです。
ChatGPTと同様に、自然な文章で質問をすることができ、正確かつ自然な回答を提供してくれます。
ベースは大規模モデル「PaLM 2」。
2023年2月の発表以来、しばらく進展がなかったBardですが、5月に日本でも利用可能になりました。
BardはGoogleの検索機能を活用し、インターネット上の情報をもとに回答を生成します。
さらに、リアルタイムで情報が更新され、音声入力も可能です。

比較

モデルと学習データについて、それぞれ比較していきます。

モデルの違い

ChatGPTとBardはそれぞれ異なる特性を持つモデルを利用しています。
ChatGPTは、「GPTシリーズ」というベースモデルを使用しています。
このGPTシリーズは、「Transformer」モデルという高精度の機械学習モデルを元に作られた大規模言語モデルです。
GPTは、入力された文の続きを適切に生成する能力を学習しています。
これにより、次の単語の予測や文の生成といったタスクを得意としています。
GPTは、入力文に対して、その文の続きに相応しい文を、確率的に生成するように学習しています。
例えば、「むかしむかし」という入力文に対して、以下の2文のどちらが入力文の適切な続きでしょう?

  • 「あるところに」
  • 「今に至る」

多くの人が「あるところに」を選びますね。
このような判断は、GPTなどのモデルでは次文の生成確率として以下のように表現されます。

  • P(「あるところに」) = 0.8
  • P(「今に至る」) = 0.2

この場合、P(「あるところに」) > P(「今に至る」) となるため、1つ目の文が次の文として生成される確率が高いです。
従って、入力文「むかしむかし」の続きとして、「あるところに」が出力されやすいことを示します。
しかし、これは確率的なプロセスであるため、まれに2つ目の文が選ばれることもあります。
GPTでは、このようなタスクを学習しているので、主に次単語予測や文生成タスクなどを得意とします。

一方、Bardは「PaLM 2」というベースモデルを使用しています.
このPaLM 2は、GPTと同様の学習方法を使用しつつ、数学や多言語に対する学習も行っています。
これにより、Bardは文の生成だけでなく、高度なプログラミングタスクや多言語に対するタスクも得意としています。
なお、GoogleのAI開発では、最初に「LaMDA」というベースモデルが使用されていました。
LaMDAはその自然な会話生成能力から「心を持つAI」とも評されていましたが、現在では「PaLM」を経て「PaLM 2」が主流となっています。
LaMDA開発での蓄積がGoogle にあるので、「PaLM 2」も自然な会話生成能力は引き継いでいるはずです。

学習データの違い

また、ChatGPTとBardは、それぞれ異なる学習データを使用してモデルを訓練しています。
これらの学習データの違いは、各モデルのパフォーマンスや対応能力に影響を及ぼします。
ChatGPTのベースであるGPTは、WikipediaやCommon Crawl(Webサイトから収集されたデータ)などから集めた約45TBのテキストデータを用いて学習しています。
ただし、これらのデータは2021年9月までのものに限定されています。

一方、BardのベースとなるPaLM 2は、ウェブ上の文書やプログラムのコード、会話データなど、より多様なソースから大量のデータを学習しています。
特に、PaLM 2は大規模言語モデルの中でも非英語データの割合が高く、これがBardの多言語対応能力を高めています。
さらに、PaLM 2は学習データに最新情報を含んでおり、それをベースに返答ができます。
それに加え、PaLM 2はへイトスピーチを含む可能性のあるソースのデータを学習に使用しないよう制限しています。
これはAIの倫理的な使用を促進するための重要な措置であり、これによりBardはより安全で信頼性の高い対話を提供できます。

違いから、ChatGPTとBardの使い分けの提案

ChatGPTとBardは各々異なる特性と能力を持つため、どちらを使用するかは具体的な使用目的や状況によります。
以下に、それぞれの特性を考慮した使い分けの提案を行います。

特性選択するべきLLM理由
回答の速さBardBardはパラメータ数が比較的少なく、内部的な処理が速いため
規制の有無ChatGPTChatGPTは規制が比較的緩く、倫理的に反していると判断した質問にも答える可能性があるため
リサーチBard / ChatGPT(有料版)Bardは最新の情報を扱う能力があるため
有料版のChatGPTはプラグインを活用することで最新情報を取得可能。
推論ChatGPTGPTの方が学習データが大きく、言語の細かいニュアンスの理解、より自然な文章の生成が可能なため
文生成の精度
(英語)
ChatGPTChatGPTはパラメータ数も多く、大量の英語データで学習しているため
文生成の精度
(英語以外)
BardBardは多言語のデータで学習しているため
プログラミングの精度Bardプログラムコードに関するテキストを多く学習しているため

まとめ

BardとChatGPTは両方とも文章生成AIであり、
人間のように自然な文章を生成しますが、
それぞれのAIはモデルと学習データの点で異なる特性を持ちます。
その違いと使い分け方法を簡潔に説明します。

モデルの違い

  • ChatGPTはOpenAIが開発し、基本モデルは「GPT-3.5」(無料版)や「GPT-4」(有料版)。
    人間のように回答し、次の単語や文の予測が得意。
  • BardはGoogleが開発、基本モデルは「PaLM 2」。
    多言語や高度なプログラミングタスクに対応可能。

学習データの違い

  • ChatGPTは2021年9月までのWikipediaやCommon Crawl等から集めた約45TBのテキストデータを使用。
  • Bardはウェブ上の文書、プログラムコード、会話データなど多様なソースから学習。
    最新情報にも対応し、非英語データの割合が高い。

使い分け方法

使い分け方法に関して、改めて表を載せていますのでご確認ください。

特性選択するべきLLM理由
回答の速さBardBardはパラメータ数が比較的少なく、内部的な処理が速いため
規制の有無ChatGPTChatGPTは規制が比較的緩く、倫理的に反していると判断した質問にも答える可能性があるため
リサーチBard / ChatGPT(有料版)Bardは最新の情報を扱う能力があるため
有料版のChatGPTは、プラグインを活用することで最新情報を取得可能。
推論ChatGPTGPTの方が学習データが大きく、言語の細かいニュアンスの理解、より自然な文章の生成が可能なため
文生成の精度
(英語)
ChatGPTChatGPTはパラメータ数も多く、大量の英語データで学習しているため
文生成の精度
(英語以外)
BardBardは多言語のデータで学習しているため
プログラミングの精度Bardプログラムコードに関するテキストを多く学習しているため

これらの情報を基に、どちらのAIが自分のニーズに最も適しているか判断いただけると幸いです!

最後に

今回はBardとChatGPTの違いについて、モデルや学習データという観点からまとめました。
少しでも内部的なことを知った上で使ってもらうと、応用が効くかもしれません。
ぜひ、繰り返し読んでいただけると幸いです。

また、Google BardとChatGPTの活用記事もありますので、あわせてご覧ください!

あわせて読みたい
SNSでバズったChat-GPTのヤバい使い方10選 ChatGPTの概要やChatGPTの使い方を記事で解説しましたが、今回はTwitterで特に話題になった活用方法を紹介致します。 【ChatGPTのバズった活用方法】 しりとりをする ht...
あわせて読みたい
【Google Bard】伝説が始まりそうなヤバい使い方10選 今回のコラムでは、ついに日本でも利用可能になったGoogle Bardの活用事例を紹介します!Bardが気になっている方向けに、使ってみたいと思ってもらえるように記事にしま...

以上、株式会社SaaSis AIエバンジェリストLeonでした。

また、SaaSisでは、全体最適の視点でシステム提案から検証、導入、連携までワンストップで支援いたします。
「“ChatGPT × 社内データ“のAIチャットボットを作りたい」
「ChatGPTを使って、社内業務をどのように効率化できるか知りたい」
などChatGPT関連のご相談も承っております。
お気軽にご連絡くださいっ!

この記事を描いた人

Leon Kobayashi

必ずフォローすべきAIエバンジェリスト(自称)

=> 元東証一部上場ITコンサル

(拙者、早口オタク過ぎて性に合わず退社)<-イマココ

【好きなもの】官能小説・リコリコ・しゃぶ葉
宜しくおねがいします。

この記事を描いた人

Leon Kobayashi

自称: 必ずフォローすべきAIエバンジェリスト

=>元東証一部上場ITコンサル

(拙者、早口オタク過ぎて性に合わず退社)<-イマココ

【好きなもの】

官能小説・リコリコ・しゃぶ葉
宜しくおねがいします。

この記事を描いた人

Leon Kobayashi

必ずフォローすべきAIエバンジェリスト(自称)

=>元東証一部上場ITコンサル

(拙者、早口オタク過ぎて性に合わず退社)<-イマココ

【好きなもの】

官能小説・リコリコ・しゃぶ葉
宜しくおねがいします。

Recruit

現在、生成系AI事業急成長のため

積極的に人材採用を行なっています

ChatGPT講演会承っております!

  • URLをコピーしました!
目次