orangeitems’s diary

40代ITエンジニアが毎日何か書くブログ

Googleが突如発表した新しいAI、Geminiがすごい

 

Googleから新AI、Gemini登場

Googleが突如、新しいAIを発表しました。

名前は「Gemini(ジェミナイ)」っていうようですが。

 


www.youtube.com

 

ChatGPTが、(現時点で)トロトロ答えを返すのとは別世界で、かなり強い競争相手が現れましたね。まぁ、あの遅さもしばらくしたら速くなりそうなものですが。

 

関連記事も紹介。

 

pc.watch.impress.co.jp

 Googleはこのほど、そのGeminiの凄さがよく分かる動画をYouTubeで公開した。約6分程度の動画だが、Geminiとの会話(やりとり)は音声で行なわれ、Geminiに対してカメラで手書きにの絵や物を見せたり、動画を見せたりし、それに対してGeminiが受け答えをしているシーンだ。

 

つまり、動画を、日本語の字幕も付けて見たらびっくりされると思います。AIとのインターフェースが音声ってところが素敵ですね。どうしてもキーボード入力はまどろっこしいところがあります。次はAIとWeb会議、ですかね。

もしかして、ドキュメント作成の仕事をしていて、Web会議で概要を伝えると短時間で作ってくれたりもしそうですね。

イマイチだった場合、また打ち合わせをして擦り合わせて、レビューしてってな具合で。

それは人なのか・・と。

 

そもそも、ChatGPT自体は、伝えたいことを「文字」「言語」にしないといけないところから、そんな人間いないやろってことだったわけです。いくら賢くったって、チャットでしか話しませんってなると、任せられる仕事が限られます。限られた仕事の中でも素晴らしい性能だったので世界から注目が集まったわけですが。

このGeminiだと、カメラで移してマイクで話せば、こんなに物事が伝えられるので、じゃあOfficeのドキュメントでも絵でも、インプットできちゃう。それって人間?。

 

 

詳細記事

で、概要がわかったところで詳細記事。

 

pc.watch.impress.co.jp

 Geminiの最初のバージョンは「Gemini 1.0」となり、高性能で最大のモデルとなる「Gemini Ultra」、中規模で多くのユーザーに適合する「Gemini Pro」、そしてスマートフォンのようなNPUを備えているデバイス上で利用するための「Gemini Nano」の3つのサイズが用意される。

 このうちGemini Nanoは、同社が提供するスマートフォン「Pixel 8 Pro」に最初に実装される計画だ。デバイス上のNPUを利用してローカルでのAI文字起こし機能を実現している「レコーダ-」の機能拡張などに使われる予定で、要約機能の実現が可能となる。

 このほかにもGBoardでのスマートリプライ機能(メッセージングアプリなどで迅速に返信ができるように返信を示唆してくれる機能)などにも、Gemini Nanoが利用される。

 

その他、詳しい情報は上記事を見て頂くとして、スマホでローカルで動くってのはかなり素敵なことなんじゃないでしょうか。今までは、アメリカに情報を送ってアメリカからデータが打ち返されたんでしょうから、まあ遅くて当然かと。

Googleのサービスは意識しなくても皆使っているでしょうから、どんどんAIが我々の近距離に入り込んでくるということです。

ああ、これこそがAIだなあって動画を見て思いました。今までのブームで色々なプロダクトを見ましたが、今一つ何か便利になっていないような感覚がありました。しかしこれは、色々見た中でも相当高いレベルでサービスインして来そうです。

なんだか、本命っぽいサービスだなぁ・・。注目しよう。