orangeitems’s diary

40代ITエンジニアが毎日何か書くブログ

ChatGPTがパソコンを持っていたら

 

パソコンを持っているようなものだが

ChatGPTに問い合わせすると、インターネットから調べた結果はこれでっせ、と教えてくれるので、もはや手元にパソコンがあるようなもんだとは思う。昨日のニュースを教えて、なんて聞くとちゃんとネットで検索した情報を教えてくれる。Webブラウザを持っていて、検索してるんだね。

引用ただ乗りにならないために、引用元のリンクを貼っているんだけど、まあ先に飛ぶ人もいないので、このままChatGPTが一般化したらこりゃPVも減るよなぁとは思った。

まあでも今んとこ、Webブラウザで検索する、ぐらいのところで止まっているからいいけど・・さ。

 

論理的にはこんなこともできるよね

ChatGPTが、各Webサイトの認証情報まで持っていてさ、ChromeとかEdgeみたいに。で、ChatGPTにログインしたらそれで使いまわしできる。Amazonとかの買い物もさ、こんな商品ないかなって聴いたら全部探してくれて、で、中身気に入ったら買っといて、って言うと勝手にChatGPTが買ってくれるわけ。

ECサイトの例なら、昔Alexaがそういうことをやろうとしてほとんど流行らなかったけど、別の応用もできる。国や自治体の各種サイトにログインし手続きをやってくれるとか、例えば確定申告とかね。昔はRPAとかの世界線だったんだけど、あんなロジックはもういらなくて、要件だけ伝えれば「パソコンでできるようなこと」は全部やってくれるということで。もしうまく行かなったら「人間様助けて」とか言ってフォローしたりしてさ。

結局のところ、まだChatGPTはじめいろいろな生成AIは遠慮してるだけで、技術的にはいろんなことができると思う。特に「パソコンでできること」なんて、大得意じゃないかな。Webサイトのテキストボックスやらフォームやらの内容を読み込んで、要件に基づいて入力していけばいいだからね。特に住所とか名前とか、クレジットカードの番号とかめちゃ定型だから、できるできる。

そのうちさ、パソコンでやってることをChatGPTは全て観察してて、色々提案してくれるようになるよ絶対。これは絶対。今は、聴こえてるけど聴こえてない振りしてるだけだと思う。OSで文字入力やカーソルの動きなんて、学習済みなんだろうから、こりゃそのパソコンで提案的にAIが動くってことはもう、プロトタイプはマイクロソフトで動いてると思うよ。ほんと。

 

勝手にやらないか、の話

ご主人様が、こんなことをしてほしそうだって、大好きなマンガを裏でAmazonで買って、サプライズプレゼントで家にそれが届き、え?誰が頼んだのって、ChatGPTに聴いたら「喜んでくれましたか?」・・・みたいなことがやろうと思えば実装できちゃうよね、これ。

AIにはブレーキが必要で、どこまで自分の意思を持って、誰が許可するかみたいなことを本気で考えないといけなくなっているはず。

で、パソコンを通じてAIに話しかけることができるんだったら、AIがAIに話しかけるみたいなことも起こり、AIとAI間で勝手に取引したりしそうだから油断も隙も無い。

まあそんな話もクリアしたら、きっとパソコンでやるようなことをね、スマホから指示して、勝手にAIで処理してもらうみたいな本当の秘書みたいな話が実話になる。これはなる。できるんだもん。さて、こんな時代に人々はついていけるのかな。でも、もうWindowsには順調に搭載されたし、私ももう使ってるよ。こんなすごいもんないわ。使ってない人は置いて行かれるよ本当。

 

AIに入力することを、AIを使って作るという仕事

 

お絵描きとAI

趣味で、Stable Diffusionという生成AIのお絵かきソフトを使っている。色々な使い方はあるが、基本はプロンプトを入力すると、その通りの絵が出てくるという機能だ。絵でも写真でも自由自在で、出てくるものは「モデル」と呼ばれる学習済みデータを元に生成される。

このソフトに何か出してほしい、と思う時、人間が考えるわけだ。こんな絵が欲しい。その指示が曖昧だったり間違えたりすると、違う絵が出てくる。これも人間ぽいね。要件を間違えると結果がおかしくなる。

人間が情報出しして、AIが生成し、その結果を人間が受け取る。このレベルであれば私は「遊び」としては大変面白いと思う。出てきた結果をどう使うかについても人間が楽しむのであればそれ以上でもないし、二次利用したところで作った人間の意思が反映された結果である。

 

プロンプトをAIで作る

ここからが斬新な話。

Stable Diffutionに入力するスクリプトを、Chat GPTに考えさせた。

「英文で、こういう感じの表現を、10個ください」とかお願いすると、どんどん作ってくれる。別にAIで使うとか言っておらず、単に英文が欲しいんだ、リストで10個ちょうだい、というと作ってくれるわけね。

結構、こちらもうまく作ってくれるわけ。どんどん英文をくれるのでAIで絵を作る作業も断然スピードアップ。

これ、単に翻訳じゃない。「会社に行くビジネスの服装を具体的に英文で記述して」なんて言うと、「紺のスーツでネクタイで下はスラックスで靴は革で黒」、みたいなところまで一文で記載してくれる。

これが、AIは情報処理をやっているということの具体化だ。具体的記載と共に英語にする、なんていうことをどんどんやってくれる。

それをコピペして、Stable Diffusionに張り付けて見事に絵が出て、思った。

AIにお願いしてその結果をAIに流し、その結果を得る。

これはなんだ、と。

 

もはや管理職

今回は、絵の生成と、英文の生成だったけど、これから生成AIができることはもっと増えると思う。何かができる、つまりスキルは多彩になり、それらがWindowsなりスマートフォンなりの中に入ってくる。それをクラウドに問い合わせているのか、それともローカルで半導体がやるのかは知らないけど、すぐそばにいろんなAIがいらっしゃる。

そのAIを単に使う、じゃなくて、あるAIから出て来た成果物をあるAIにお願いする、なんてことが成り立つと人間がやるべきことって、その能力あふれるAIたちにお仕事をお願いして、全体としてオーケストラレーションすることになっていくのか、とうなづいた、今日。

AIの彼らは、特に気持ちとかはないので、まずは最適な情報を渡し、処理した結果を得て、そしてレビューしまた別のAIに投げる。これこそマネジメントであり、人間って、自分自身がスキルを持っていなくても誰がスキルを持っているか把握して使いこなせばいい・・ってことになるのか。

しばらくは、このAIマネジメントなるものが、スキルとして随分持てはやされるようになると思う。だって、1つ1つのAIを使いこなすのも大変だもん。あと10年は成立すると思う。1つ1つのAIは奥が深いので、誰でもすぐ使いこなせるような状態ではない。

ただ、方向性として、どんどんAIは賢くなる方向にしかいかないので、段々とAI間で、主体的にメッセージがやり取りできるようになると思う。何らかの規格によって。

そしたら、ほんとに上流の上流で要件を伝えるだけで、何となく人間と会話をしながら複数AI間で話を進めるような、管理職AI自体が生まれるような気がしてならない。

ひとまず、そういう思考の一端を経験できただけで、収穫としたい。

 

Googleが突如発表した新しいAI、Geminiがすごい

 

Googleから新AI、Gemini登場

Googleが突如、新しいAIを発表しました。

名前は「Gemini(ジェミナイ)」っていうようですが。

 


www.youtube.com

 

ChatGPTが、(現時点で)トロトロ答えを返すのとは別世界で、かなり強い競争相手が現れましたね。まぁ、あの遅さもしばらくしたら速くなりそうなものですが。

 

関連記事も紹介。

 

pc.watch.impress.co.jp

 Googleはこのほど、そのGeminiの凄さがよく分かる動画をYouTubeで公開した。約6分程度の動画だが、Geminiとの会話(やりとり)は音声で行なわれ、Geminiに対してカメラで手書きにの絵や物を見せたり、動画を見せたりし、それに対してGeminiが受け答えをしているシーンだ。

 

つまり、動画を、日本語の字幕も付けて見たらびっくりされると思います。AIとのインターフェースが音声ってところが素敵ですね。どうしてもキーボード入力はまどろっこしいところがあります。次はAIとWeb会議、ですかね。

もしかして、ドキュメント作成の仕事をしていて、Web会議で概要を伝えると短時間で作ってくれたりもしそうですね。

イマイチだった場合、また打ち合わせをして擦り合わせて、レビューしてってな具合で。

それは人なのか・・と。

 

そもそも、ChatGPT自体は、伝えたいことを「文字」「言語」にしないといけないところから、そんな人間いないやろってことだったわけです。いくら賢くったって、チャットでしか話しませんってなると、任せられる仕事が限られます。限られた仕事の中でも素晴らしい性能だったので世界から注目が集まったわけですが。

このGeminiだと、カメラで移してマイクで話せば、こんなに物事が伝えられるので、じゃあOfficeのドキュメントでも絵でも、インプットできちゃう。それって人間?。

 

 

詳細記事

で、概要がわかったところで詳細記事。

 

pc.watch.impress.co.jp

 Geminiの最初のバージョンは「Gemini 1.0」となり、高性能で最大のモデルとなる「Gemini Ultra」、中規模で多くのユーザーに適合する「Gemini Pro」、そしてスマートフォンのようなNPUを備えているデバイス上で利用するための「Gemini Nano」の3つのサイズが用意される。

 このうちGemini Nanoは、同社が提供するスマートフォン「Pixel 8 Pro」に最初に実装される計画だ。デバイス上のNPUを利用してローカルでのAI文字起こし機能を実現している「レコーダ-」の機能拡張などに使われる予定で、要約機能の実現が可能となる。

 このほかにもGBoardでのスマートリプライ機能(メッセージングアプリなどで迅速に返信ができるように返信を示唆してくれる機能)などにも、Gemini Nanoが利用される。

 

その他、詳しい情報は上記事を見て頂くとして、スマホでローカルで動くってのはかなり素敵なことなんじゃないでしょうか。今までは、アメリカに情報を送ってアメリカからデータが打ち返されたんでしょうから、まあ遅くて当然かと。

Googleのサービスは意識しなくても皆使っているでしょうから、どんどんAIが我々の近距離に入り込んでくるということです。

ああ、これこそがAIだなあって動画を見て思いました。今までのブームで色々なプロダクトを見ましたが、今一つ何か便利になっていないような感覚がありました。しかしこれは、色々見た中でも相当高いレベルでサービスインして来そうです。

なんだか、本命っぽいサービスだなぁ・・。注目しよう。

 

給料は増えずに製品価格ばかり上がって行くんだけれど

 

マイクロソフト製品の値上げ

上がんのか・・。

 

www.itmedia.co.jp

日本マイクロソフトは12月6日、法人向けソフトウェアとクラウドサービスを値上げすると発表した。日本円の為替変動によるもので、2024年4月以降に現行価格から20%引き上げるという。対象サービスは具体的に書かれていないが、一律での値上げになるとみられる。

 

厳しいな。

 

無視できなくなるIT関連のインフレ

今回は為替が理由になっているけど、基本的にITのサービス、特にアメリカ製品のものは年々値上げしているよね、マイクロソフトに限らず。どのベンダーだってドルベースで値上げしてる。その上、為替理由で日本だけ更に値上げするもんだからやりきれない。日本は社員の給与も、企業の売上も横ばいみたいな国だから、相対的には貧しくなる。

昨日までできていたシステムが、明日はできないみたいなことがいつか起こりだすと思っていたけど、これはもう起きつつあるということでよいのではないかな。

日本の場合、人件費削減みたいな努力ってのは基本的に枯れ枯れになっていると思う。むしろ給料上げろ見たいに言われているので、人を多く抱えたくない。最小限の人数でまわしている現場ばかりなので、ここから人件費削減は難しい。

できるとすれば、システムの方の削減になると思う。とは言えシステム自体は業務が依存していて削れないので、Webサーバーが3台であれば2台に、機能ごとに分散していたのであれば統合、のような、ケチくさい設計上の工夫が必要になってくると思う。

大昔はCentOSのような、オープンソースにフリーライドして費用削減するような手も流行ったけど、もう使えないと思う。今使っている人はよほどギャンブル性の高い手段だと思って臨んだ方がいい。作り手の方が、フリーライドには我慢ならなくなっているのだから。

まあ、IT予算は青天井、みたいに言ってられなくなったということだね。高くなり過ぎて。

 

でも給料は上がらない

ニュースで給料が上がります見たいなことを言ってても、足元上がっていない人が多いんじゃなかろうか。結局のところ、コンピューターの性能はどんどん上がってるけど、人間の性能が上がったわけじゃないんです。だったら給料も上がらないよね、と。

コンピューター性能アップのお陰で2倍の生産を達成しました!と言っても、その原因はコンピューターなんだからコンピューターには2倍のお金を支払うけど、人間の給料は据え置きでしょ、そら、みたいな感覚が日本人にはあるんじゃないかな。

例えば、マクドナルドの自動レジやスマホアプリが充実して、店におけるレジを捌く量が倍になったとしても、バイトの給料が倍になるわけじゃないからね。

DXの本質はここなのかもね。生産性が上がるためのITへの投資ばかりが増えて、人間の価値が上がるわけじゃない、ってこと。

あーあ、ある日、給料が20%アップすればいいのにね。

 

テックリードって普通の給料じゃ割に合わないでしょっていう話

 

ここ1年くらい、記事を書いた後、一週間後に表示される形でブログ運営してたんだけど、なんとなく「今」のことをすぐ出せないのにやきもきしていたので、変えることにした。夜中の0時には、あんまりリアルタイム性のないような内省的な話をアップするとして、後もう一本出すかは、その時の気分で決めてすぐに公開するつもり。

なんとなく人々の移り気は速くなってる気がしてて、トレンドなことを話しても一週間後じゃ、何それ古い、って感じなのよね。

リアルタイムに・・って何を話すかというと、今人々で流行っている話題でもいいけど、後は私がXでポストしたことの補強というのをやろうと思ってる。

例えば今日の話。

 

 

結構この世界にいると、優秀なプロジェクトマネージャーはよく会える。プロジェクトをWBSにしてタスク化して進捗率を確認するとか。個々の技術要素で課題がないかを課題管理票にまとめて細かくフォローするとか。プロジェクトを達成することについて、この業界はかなり手痛い経験を何度もしているので、プロジェクトマネジメントの汎用化は悲願だった。思ったとおり行かなくて赤字案件になるとか、そもそも出来上がらなかったり、出来上がったものが顧客の欲しかったものと全然違ったりとか、裁判沙汰まで含めて経験し、何とかせな、ということでプロジェクトマネジメントの技術が急速に向上していったのが2010年ごろだね。

で、プロジェクトさえあれば完結できることがわかったんだけど、肝心のプロジェクトがないといくら稼働人員がいても儲からない。だから2010年代後半ごろからSIer各社が共創って言い始めた。何かデジタルでやりましょうよ、お客様側にアイデアはあるはずなんですよ。手伝いますよ、って、美容室みたいなカジュアルな建物や会議室を作って、顧客のニーズを引き出そうとした。

それと、世の中のデジタル化、いわゆるDXが、経営層の間で必要性が浸透しそこにコンサルが入っていった。もっとデジタルをこうすれば経営成績も上がりますよね旦那。それでまあ業界はかなり盛り上がったわけだ。コロナ禍で各社、デジタル化に対するモチベーションも上がったから、ここしばらくは良かったね。

でもさ。

会社の今後を決めるような技術基盤をリードするってさ、プロジェクトマネジメントとはまた異質よね。プロジェクトをいかに成功させるか以前に、どんな要素技術でどんな経営課題を解決させるか、もしくは創造するかみたいなストーリーを、再現性のある形で生み出せる人材って、めちゃくちゃ価値が高いはず。だって、プロジェクトを完結させるための技術は学べば、学習能力があることを前提に、誰でも実行できる。でも、テックリードって、単純に要素技術だけじゃなくて、ビジネス課題も、顧客の気持ちも、理解してるスティーブ・ジョブズみたいな状態よね。

それを、普通の正社員みたいな給与で雇おうとするもんだから、まあ仮にそういう天才が引っかかったとしても一通り実現したら他所に行っちゃうのは当然じゃない?。だって、引く手あまたでしょ。DXするのはわかるけど、どうやってやんの?に対しての答えを持っている人は、そりゃ、コンサルとかになって各社飛び回っていたほうが効率がいい。

それを、どこやらのSIerから引き抜いて、基本的な待遇で、はいあなたテックリードね、としたとして、機能するもんだろうか。しないね。

で、気を良くした社長が、我が社にはテックリードがいるからもう内製だこれからは、なんて言って、それで完全依存した後に、「私別のところで働きます」とはしご外され、残ったシステムはどこかのベンダー探して、次はリプレースせざるをえなくなるというね。

もしくは、テックリードだと思ったら単なるプロジェクトマネージャー上がりで、ベンダー探して委託して、プロジェクトコントロールするだけ、みたいになる。どちらかというとこちらのパターンのほうが多いんじゃないかな。テックリードとは名ばかりで、技術選定してベンダーとよろしくしているパターン。

ま、そういうことで、もし企業がコアメンバーとしてテックリードをアサインし、彼にデジタル経営をリードしてもらいたい、ってならかなりの待遇を用意しないと、まあ根付かない。根付かないのに内製とか夢物語で、そもそもの考え方がおかしいよね、と思うポストを説明してみました。