ガーディアン誌はOpenAIのクローラーをブロックしたとのこと。Googleの検索エンジン用クローラーと違って一切メリットがないし、コンテンツを商用ライセンスもしているからブロックするのは当然ですね。OpenAIが知識ベースとしてのAIを目指すなら、ライセンスを受ける必要があるということでしょう。
https://www.theguardian.com/technology/2023/sep/01/the-guardian-blocks-chatgpt-owner-openai-from-trawling-its-content
@taiyo https://www.theguardian.com/robots.txt を見ると、人間向けに
> The Guardian does not permit the unlicensed use of our content for large language models. Contact licensing@theguardian.com for assistance
と言っていました。
@pot 至れり尽くせりですね。
様々な目的に使える、日本の汎用マストドンサーバーです。安定した利用環境と、多数の独自機能を提供しています。
@pot 至れり尽くせりですね。