フォロー

Chat GPT ちょい長文 

Chat GPT、一見なんでもできるように見えるけど、そのギャップに対する認識の違いが評価の違いになってる気がする。
一目見てデタラメだとわかる応答やはっきり「できない」と答える応答もあれば、それっぽく見えるけど大嘘なこともある。逆に、従来技術には実現困難な優れた点もあれば、既存技術と大差ないこともある。
そのあたりの得手不得手のレベル差を可視化できると、もっと使いやすくなりそう。正確に性能を評価する、ということだからかなり難しいだろうけど。

ログインして会話に参加
Fedibird

様々な目的に使える、日本の汎用マストドンサーバーです。安定した利用環境と、多数の独自機能を提供しています。