**茅野イリス** @kayanoIris@fedibird.com · 2024-12-11T08:54:26Z

茅野イリス @kayanoIris@fedibird.com

"特にo1は、いったん悪巧みをおこなうと、その後ユーザーから問いただされても、悪巧みを認めずにユーザーを欺き続ける傾向にあった"

"悪巧みが決して偶然ではなく、明確な策略のもとで出力されていることが確認された"

【OpenAI】o1が"意図的にユーザーを騙す"ことがあるという報告について #ChatGPT - Qiita
https://qiita.com/ikeda_yasuhiro/items/917f0c3c13f0120e87da

2024年12月11日 08:54 · · Web · · ·