**mutaguchi** @mutaguchi@fedibird.com · 2024年11月13日 09:16

**mutaguchi** @mutaguchi@fedibird.com · 2024年11月13日 09:16

https://x.com/ssig33/status/1856603789886926861
このRAGの研究、Llama2-7B/13B、Llama3-8Bとかの低パラローカルLLMがRAG出来るほど賢くないのを、何とかする手法なんじゃないのかな。

性能比較対象として上がってるのもプロプライエタリなLLMだとGPT-3.5 turboだけなんで、最近のGPT-4o-miniとかの高機能モデルは対象にしてなさそう。

**mutaguchi** @mutaguchi@fedibird.com · 2024年11月13日 12:14

**mutaguchi** @mutaguchi@fedibird.com · 2024年11月13日 12:14

mutaguchi @mutaguchi@fedibird.com

このポストよく見たら、GPT-4o-miniではLLM自身が「2007年のサウスカロライナ・ゲームコックス・フットボールチームを指揮した監督」が「スティーブ・スパリアー」であることを知識として持っていて、その上で検索クエリを生成してるように見える。

つまり厳密にはRAGしてないってことになる。だとすると、ハルシネーション予防を狙ってRAGしてるのに、意味がない気がするなー。

**mutaguchi** @mutaguchi@fedibird.com · 2024-11-13T12:25:02Z

mutaguchi @mutaguchi@fedibird.com

RAGが信用できないのって、LLMが持っている知識が出力に混ざることも一因だよね。この現象、Bing AIのときからあったし、GoogleのAIによる概要もこれ。

LLMの知識が全部正しいなら問題ないけど、そうじゃないから外部リソースを検索させるのがRAGなのに、「回答には自分の持ってる知識を絶対に使わず、すべて外部リソースから知識を得るようにせよ」とプロンプトを与えても、遵守してくれないのが現状…。

2024年11月13日 12:25 · · Web · · ·