>(1)生成者が既存著作物を知っているか → 知っていれば依拠性あり、知らなければ(2)に
>(2)既存著作物が学習用データに含まれているか →含まれていなければ依拠性なし、含まれていれば(3)へ
>(3)当該学習用データ(画像)を学習過程で用いる際に、特定のテキストと、当該データ(画像)の表現上の本質的特徴が強固に結びついているか →結びついていなければ依拠性なし、結びついていれば(4)へ
>(4) 利用段階で(3)における「特定のテキスト」をプロンプトとして入力しているか →入力していれば依拠性あり、入力していなければ依拠性なし(独自創作)
https://www.bengo4.com/c_23/n_16133/
これを見ると ChatGPT のようなネット上のコンテンツをチャンポンし,かつ学習過程が分からないサービスは,知財権リスクという観点からは実用性がない,ということになる?
あるいは GitHub Copilot のように「オープンソース」のごった煮状態で個々のライセンスを無視したものは怖くて使えない,ということになりはしないか? 少なくとも AI が生成するコードに GNU GPL ライセンスのものが混じってたら拙いぢゃん