x.com/naotous/status/185470981
LLMが難しい試験問題を解けるというのは、LLMの能力を示すベンチマークの点数が良いということを意味するが、実用的な意味は別にないんだよな。

試験というのは、被験者に能力があるかどうかの確認作業であって、それが解けること自体に嬉しさはない。カンペ持ち込んで試験受けたら通った、という話になんの意味もないことは明らかだけど、カンペをLLMに置き換えたら分かると思う。

フォロー

LLMが難しい試験をパスして凄い、というの、もうそろそろ止めた方がいいんじゃないかと思ってる。難しい試験問題の解答集は、難しい試験問題を解けるから凄い、と言ってるのと大差ない。

ログインして会話に参加
Fedibird

様々な目的に使える、日本の汎用マストドンサーバーです。安定した利用環境と、多数の独自機能を提供しています。