:hyuki: 記録・検索・要約、そしてAI

たとえば、私の中学高校時代のことを考えると、クラスメイトとしゃべった内容は具体的には覚えてなくて、もちろん、何か記録が残ってるわけでもなくて、「そういえばこんなこともあったなぁ」とぼんやり思い出すくらい。

でも、現代の中学生高校生は友達とのLINEのやりとりや、一緒に遊んだ動画などが残ってるわけで、それはずいぶん違う感覚じゃないかなと思います。

もちろん記録に残るのが良いかどうかは何とも言えないでしょうね。楽しかった経験が記録に残っているのはいいですけれど、そうじゃないことだってあるでしょうし、それに当時楽しかった記録でもその後見返してどういう気持ちになるかは何とも言えないわけですから。

善し悪しの判断はさて置いて、記録が残っているのと残ってないのとでは、ずいぶん「違う感覚」なのは確かだと思います。

それがどんなふうに違うのかは、両方を1人が経験することができない以上比較することも難しいですけれどね。

スマートフォンになって、気軽に写真を撮るようになり、たくさんの写真が手元にあります。一つ一つを吟味するのはもう無理じゃないかと思うくらいたくさんの写真があります。

そうなってくると適切な画像を「検索」することを考えたくなります。

最近の画像認識技術の進歩によって、「この人の写真」を探してきたり、「この画像と似た画像」を探してくることも普通にできますね。何だったら、複数の写真を集めて、適当なアルバムを作ってくれることもあります。

最近のAIの進歩を見ていると「要約」というのはとても大切だなと思います。適切に要約されたものを読むならば、人間の側の時間を大きく削減することができるからです。そういえば「検索」というのもある種の要約ですよね。

写真や動画や記録を見返して「そういえばこんなこともあったな」と振り返るのは、ある種の検索であり、要約だともいえます。

ただ、人間がそれを行う場合には、多くの場合「解釈」や「自己認識」が深く関わってくると思います。それは、偏りや偏見になる場合もありますけれど、それが今日を生きる推進力になる場合もきっとあるでしょうね。

後半の話に便乗して。

写真とか絵画ってその背後にある「文脈」がすごく大事だったりするよね。音楽もかな。文脈ってのはその人の内面(記憶とか認知とか)に依存していて,本来は共有できるものではないけど,文章や映像や音声などを通じて(一部だけでも)共有できてしまうというのが人の不思議なところ。これを再現しようとしてるのが LLM と考えると,これまた面白い。

でも, LLM もそうだけど,2010年代から台頭し始めた AI 技術はあくまで CRM (Customer Relationship Management; 顧客関係管理) の延長なんだよね。何故なら,それらは背後のクラウドにある「ビッグデータ」を処理するのが目的だから。

それを個人がコミュニケーションに使おうと思ったら,私たちの内面をクラウドに差し出さなければならない。そこが今の AI 技術が抱えている根本的な問題だと思う。

たとえばグレッグ・イーガンの『万物理論』に出てくる「シジフォス」のようなものを私たちが求めているなら CRM ではダメで,ドク・サールスの『インテンション・エコノミー』で言うところの VRM (Vendor Relationship Management; 企業関係管理) 的なものが必要だと思う。 [参照]

フォロー

CRM と VRM の根本的な違いは「文脈」を握ってるのが企業(国家でもいいけど)ではなく私たち個人の側にあるということ。

俗な喩えをするなら,今の AI 製品はデパートの「外商」みたいなものだ。外商を呼びつけてあれこれ注文するのは便利だけど,全ての情報を渡せるほど信用できるわけではない。

欲しいのは「外商」ではなく「執事」なんだよね,多分。ってな話を随分前に記事にしたのを思い出したのだった。

>AI アシスタントはユーザをアシストしない by @spiegel text.baldanders.info/remark/20

ログインして会話に参加
Fedibird

様々な目的に使える、日本の汎用マストドンサーバーです。安定した利用環境と、多数の独自機能を提供しています。