"パブリックドメインのデータの多くは時代遅れだ。例えば米国では通常の場合、著者の死後70年の期間、著作権保護が有効とみなされる。そのためこのデータセットでは、AIモデルを時事的な話題に活用したり、流行のスラングを用いてブログ記事を書かせたりすることはできない(その代わりに、できの悪いプルーストのような文章を書くかもしれない)" https://wired.jp/article/proof-you-can-train-ai-without-slurping-copyrighted-content/