ChatGPTについて、飲み会レベルで「知ってるよ」と言うために前提となる知識をまとめる

2022年2月現在の話なので、この記事の内容は日に日に陳腐化していくとは思うが、現時点でわかっていることを書いてみる。ChatGPTにはあまりにも期待と噂が独り歩きしてしまっていて、「すごいよね〜笑」ぐらいしか返せない。聞きかじりにも程があるレベルで人々が情報交換をするので、何か違う技術ができあがっていっているように見える。きっとChatGPTの開発者もプレッシャーをひしひしと感じているところだろう。

さて、ChatGPTについて、まずおさえなければいけない点が１つある。ChatGPTとは、単なるアプリケーションという点である。自然な言葉を作ることができる基礎を「言語モデル」と呼ぶ。自然言語生成モデルと言えばかっこいいし間違いない。この初代が「GPT-1」で、2018年にOpen AI社から発表された。

Open AI社はGPTモデルを所有し、ビジネス化しようとしている。つまり、学者がどうこう言っている話ではなく、会社であり事業であるという点が重要だ。これまではGoogle社が「言語で検索する」ということについては寡占状態だったが、大きなライバルが出現したことになるし、それを見越してマイクロソフトが大型の出資をしたことは記憶に新しい。

さて、GPTというモデルは2018年に発表されたのだが、この時点ではまだ世の中を騒がせる品質には至っていなかった。そして、GPT-2が2019年、GPT-3が2020年に発表された。

この改良の内容について、一般の人がその内容を知る必要がないと思う。それはWindows 95と98、2000の差分を今更語るぐらい考古学的なものだ。

今知るべきは、GPT-4はまだ発表されていないということ。1、２、３と１年おきに発表されてきたのにGPT-3から4へは時間をかけている。GPT-4は、今年、2023年の前半には発表されるという噂がある。きっと、ChatGPTのブレークと、大型出資の決定で、ビジネスプロセスを整理しているんじゃないかな、なんて予想をしている。次の発表がターニングポイントになるというのは外野でも理解可能である。

さて、2020年のGPT-3だが、OpenAI社的にはいろいろと試行錯誤が行われていて、GPT-3.5なるモデルを生み出した。3と3.5の間に何が行われたかと言うと、最新の情報を飲み込ませたことと、チューニングされているのは間違いはない。だが論文はこれまでのGPT 1/2/3とは違って公開されていない。

だが、このGPT-3.5（をさらに改良したもの）を利用したWEBアプリケーション「ChatGPT」が公開されるや、その品質の高さに世界が驚き、今や世界の今後を変える技術の１つにまで上り詰めてしまった。

ただChatGPTのインパクトが凄すぎて、自然言語処理のことをなんでもかんでもChatGPTと世間が言うようになってしまってきっと、混乱が生じていると思う。社会が次に欲しいのは、ChatGPTのエンジンをAPI呼び出しで利用し、我が社のビジネスロジックやアプリケーションに取り込みたい、といったところだろう。

ところが、ChatGPT APIなるものはまだない。あまりにバズったので、OpenAI社もChatGPT APIという名前でリリースするようだ。

www.itmedia.co.jp

つまり、ChatGPTについては、2023年2月現在、APIなんかないが今の正解である。某社がChatGPTと連携し記事生成する、という表現は厳密には間違っている。

一方で、OpenAI社は、自動言語生成についてのAPIをすでに発表し有料で利用可能にしている。ホームページ上は4つのモデルが見えるが、右側の「Davinci（ダビンチ）」というのがGPT-3.5に近いモデルである（3.5そのものとは断言できない）。APIを呼び出せば呼び出しただけ課金さえるようになっており、その言葉の数で課金される。

きっと、企業がChatGPTと絡んだ機能を発表、といったときはきっとこのAPIのことを示していると思われるが、現状のこのAPIが利用しているモデルと、ChatGPTの中身のモデルは、差があるということをおぼえておいたほうがいいと思う。

そして、ChatGPT APIが登場したらきっと、ビジネス的にはもっとわかりやすくなり跳ねると思う。また、GPT-4が登場するときは、ChatGPT周りももっと、ポップになり、人々がわかりやすく使えるようになっていると思われる。それぐらいのお金が今、OpenAI社には降り注がれている。

さて、ここまでの基礎知識があれば、ある程度考察に入れる。

まず、１つの会社が、世界でも優秀で寡占的な言語モデルを手に入れたら、そのAI経由で情報が歪んでしまい、世の中の情報のやりとりが歪んでしまうのではという話。その懸念は今Google社が握っているので、もはや旧知の驚異である。そんなの、誰が受け持っても驚異なのである。

世界の問い合わせを受け切るインフラを持ち合わせているの？という懸念については、これはMicrosoft社の領域である。すでにGPTの開発にはAzureがゴリゴリ使われている。ビジネスのスケールアウトにはMicrosoft社のエンジニアがすでに参画していると思われる。お金を出すということはそういうことでもある。

このGPTというモデルの構築にあたっては、常に最新の情報を与え続けなければいけないので、今後もGPT-4、5とカウントアップされていくのは間違いない。その度ごとに利用者がバージョンを気にするのはナンセンスだ。Goole検索で、バージョンアップがあった話を聴くだろうか。

そのあたりをChatGPTという、わかりやすくポップなアイコンで消し込んでいくのではないかと思っている。ChatGPTにはバージョンアップはない。裏側のモデルは常に進化し続けるが利用者は気づかない。

だから、今ChatGPTができることに気が付き、感動している人は、まだWindows 3.1の世界に飛び込んだぐらいのレベルだ。GPT-4が近々登場するとともに、ChatGPT自体のビジネスが見えてくる。仕組みより「どう使うか」について人間の創造性を大いに刺激するに違いない。まだ、前夜であるということを知っておくと、飲み会レベルでもドヤれると思う。

orangeitems’s diary

40代ITエンジニアが毎日何か書くブログ

ChatGPTについて、飲み会レベルで「知ってるよ」と言うために前提となる知識をまとめる