フォロー

"カーネギーメロン大学助教授のマーテン・サップは、大規模言語モデルが好成績を収めることができた理由の1つとして、こうした心理テストは定着しているため、対象となったAIモデルの訓練データに含まれていた可能性が高いとの見方を示す(同助教授は今回の研究には関わっていない)。「誤信念テストを実施するにあたって、子どもはおそらく同じテストを目にしたことがないのに対し、言語モデルは(テストが)誤信念課題である可能性を認識していることが非常に重要です」と同助教授は言う" technologyreview.jp/s/336934/a

ログインして会話に参加
Fedibird

様々な目的に使える、日本の汎用マストドンサーバーです。安定した利用環境と、多数の独自機能を提供しています。