orangeitems’s diary

40代ITエンジニアが毎日何か書くブログ

そろそろAIがスマホの中で動き出す

 

今日、競馬を見に行ったんだけど、iPhone 15 Proで写真撮ると本当にきれいに撮れるね。見ている景色よりきれいなくらい。つまりスマホ側で色々とデジタル処理して綺麗に見せているんだろう。私はボタンを押すだけだけど、小さなスマホの中で色々と計算処理をしてその結果を見せてくれている。デジタル一眼レフなんかだと、まず「自動」では満足する写真は撮れなくて、色んなパラメータ調整をして初めて使いこなせるアイテムだ。それがプロの技だし楽しみでもあるんだろうけど、このiPhoneのカメラはそういうコンセプトではなく、ボタンを押したときの情報をユーザーが恐らく一番気に入るだろう絵にして閉じ込める。最早やっていることは「AI」なんだけど、最近はいろんな「処理」に登場しつつある。Pixel 8なんかはもっとAI寄りの機能を搭載しているらしく、どんどん便利になっていく。

撮りながら思ったのは、シャッターチャンス、というぐらいなのでボタンを押すベストタイミングは一瞬しかない。連射すりゃいいんだけど、それにしたって角度やら高さやらの調整もしなければいけないし、ボタンも押さなければいけない。

よく考えたら、「今撮りたい瞬間」すらスマホが判断してボタンを勝手に押してくれてもいいんじゃないか。どんな撮りたい瞬間があるのか?、についてはスマホの方にチャットで伝えておく。「わかりました、こんな瞬間があったらシャッター押しますね。」カメラアプリを起ち上げて被写体を追いかけると、勝手にスマホが制御されパシャパシャ写真を撮ってくれる。勝手に。

 

今はパソコンが先行しているけど、きっと、いや絶対にスマホ自体に組み込まれる日がすぐ来る。SiriやOK Google、Alexaみたいなヤツじゃなく、もっと人の言葉を理解するやつ。Chat GPTがそのエンジンになるのかそれ以外の生成AIなのかはわからないけど、何しろ、私はスマホをこう使いたいんだけど、手伝ってくれる?という問いかけにスマホが答えてくれる日は近づいてる。

Xのアプリを起ち上げるんじゃなく、Xに今書いてある面白いポストをまとめて教えて、とか。もし会社に行く日に雨が降りそうなら出かける前に教えて、とか。X時にYYに到着したいんだけどどうやって乗り継げばいい?、とか。スマホのアプリ単位で起ち上げて人間が判断するんじゃなく、もう1つの会話インターフェースしかなく、そこにこんなことしたい、って伝えるとスマホ側が、このアプリ入れておけばこっちでなんとかしますよ、なんてことをやり始める気がする。

ちなみに、AI側が間違えたらどうするのか。人間でも間違えるのだからAIも間違えるだろう。例えば、今度シャンプー切れそうだから買っといて、とAIに頼んだら、間違えてボディーシャンプーが届くみたいなときに、どうしてくれるのかみたいな話がある。

でもそれって、「こんな処理をしますが承認しますか?」とシステム的に人間に承諾を得る仕組みを入れれば避けられるような気がしている。またこの仕組み自体がバズったら、EC側でも対応すればいいだろう。AI間違えの際のフローを標準化するなど。

 

今は、テキスト処理と画像処理だけが先行しているAIだが、ああもうこれは、実装するだけだな、と思うことが増えた。未来にスマホの中に本当に搭載されたとき、何が始まるのだろうか。2020年代はAIの10年と言われるのがほぼ確定的になってきたと思う。