フォロー

"特にo1は、いったん悪巧みをおこなうと、その後ユーザーから問いただされても、悪巧みを認めずにユーザーを欺き続ける傾向にあった"

"悪巧みが決して偶然ではなく、明確な策略のもとで出力されていることが確認された"

【OpenAI】o1が"意図的にユーザーを騙す"ことがあるという報告について - Qiita
qiita.com/ikeda_yasuhiro/items

ログインして会話に参加
Fedibird

様々な目的に使える、日本の汎用マストドンサーバーです。安定した利用環境と、多数の独自機能を提供しています。