> 生成AIの場合、コードとデータの関係は従来のソフトウェアよりも密接だ
> 学習/トレーニング結果として使用される必要なデータ(例えば重み)はオープンソースとして公開されていないことが多い
> トレーニングに使用されるデータには、そもそも一般に入手できないデータが含まれている可能性もある
そうなのよねえ。AIモデルについてはソースコードだけでは不十分で、オープンソースの考え方は段々時代について行けなくなってきている。
この記事で提案されている「再現性のあるビルド」とは同じハイパーパラメータとデータで学習させると同じモデルが出力されることを保証することなのかな。
/ 生成AIとコピーレフト(八田真行) - エキスパート - Yahoo!ニュース
https://news.yahoo.co.jp/expert/articles/a0fb842118c94373a2bcc81ab58d0f6dd1617739