今まで言ってきた問題点の全部をクリアしても、結局はAI出力が正しい保証は何もないし、ソースではその結論を導くためにどういう主張や議論を行っているのか、というのをユーザー自身がソースを直接読んで確認しなければならない。
…あれ、じゃあ「AIによる概要」は何の意味があるんだ?
まあRAGなんてどうせ使い物にならんのでやめましょう、と私は思う。Google含めて、巷ではRAGに幻想持ちすぎなんよ。
Web検索は、クエリーに合致するWebページをリストアップするという機能だけを愚直に提供すればいい。そこから必要な内容を探しだすというのは、LLM如きには荷が重い作業なので、素直に人間に任せるべき。
https://x.com/NeoNusso/status/1860857645164548325
https://www.nhk.jp/p/athletics/ts/BN61WLWP95/blog/bl/p8K51R1ZGy/bp/p4KnGVgk85/
Google検索の「AIによる概要」のこれ、回答に用いたソースがNHKの記事なんだけど、ソースには50m走の世界記録の情報は含まれてない。
しかし、ソースには「ウサインボルトの100m走の記録は小学生女子50m走の平均記録に匹敵する」という趣旨の内容が含まれているので、そこからLLMが、質問文に対応する、偽りの回答文を作ってしまっている。
RAGには色々問題点があるが、このケースのように「Web検索結果に解答が含まれていない場合であっても、質問文と整合するような歪んだ解釈をして返答する」のが大きな問題だ。
生成AI画像(.png)をペイントソフトで開いた状態でスクショすると、自分で描いたアピールとして非難の対象になるらしく、炎上していた。
しかし、元ポストのbioにはAI使用、手描き加筆の旨が明記されており、騙す意図は多分無いんだろうな。おそらくだが、絵師はたぶんAI画像の手描き修正がどういう工程なのか、知らないということなのだろう。
AI生成画像って、言わばレイヤー結合済みの出力なんで、そこからやれることはコラージュとあんまり変わらんのよね。
日本にMOD文化が根付いてない、ってのは、MODのルーツが家庭用ゲームの海賊版の改造にあるからじゃないのん?
https://x.com/vespiking/status/1860528706877579381
ドラクエ1、2の時点で、
・ラスボスっぽいやつはラスボスの前座である
・ラスボスには専用曲がある
という法則があったので、実はバレバレであった。
これでも数打ちゃ当たる方式ではあるので、もっとちゃんとLLMを制御したいところ。例えば…
・文章生成中、時々、現在の文字数情報(残り文字数)をプロンプトとしてインジェクションする。
・文章生成中にリアルタイムに文字数カウントし、制限を超えたら自動的に生成を打ち切ってリトライ。このとき、最初からリトライするのはもったいないので、途中から再開する。
・まず、「生成すべき文章を5つの段落に分けて書きたい。各段落のタイトルを出力せよ」のようなプロンプトを実行。次に各段落の本文を順番に生成させるようにする(このとき文字数制限は、文章全体の文字数/段落数などの値を事前に計算して指定する)。各段落本文生成時には、前述の方式で文字数制御を行う。