フォロー

> 生成AIの場合、コードとデータの関係は従来のソフトウェアよりも密接だ
> 学習/トレーニング結果として使用される必要なデータ(例えば重み)はオープンソースとして公開されていないことが多い
> トレーニングに使用されるデータには、そもそも一般に入手できないデータが含まれている可能性もある

そうなのよねえ。AIモデルについてはソースコードだけでは不十分で、オープンソースの考え方は段々時代について行けなくなってきている。

この記事で提案されている「再現性のあるビルド」とは同じハイパーパラメータとデータで学習させると同じモデルが出力されることを保証することなのかな。

/ 生成AIとコピーレフト(八田真行) - エキスパート - Yahoo!ニュース
news.yahoo.co.jp/expert/articl

ログインして会話に参加
Fedibird

様々な目的に使える、日本の汎用マストドンサーバーです。安定した利用環境と、多数の独自機能を提供しています。