**otomo** @nous@fedibird.com · 2022-12-16T11:58:48Z

otomo @nous@fedibird.com

RT @bioshok3@twitter.com

Googleやばすぎる仮説！
「勾配に基づく最適化と注意に基づくコンテキスト学習は等価である」
K個の勾配降下ステップ学習はK個の線形自己注意層を持つ学習済みTransformerと密接に整合。単一線形自己注意層から多層非線形モデルまで調査し類似。MLP追加でTransformer内での非線形回帰タスク解決可能！ https://twitter.com/_akhaliq/status/1603607592529498112

🐦🔗: https://twitter.com/bioshok3/status/1603676512946778112

ed7a0e9e15322d33.jpg

2022年12月16日 11:58 · · Mastodon Twitter Crossposter · · ·

ログインして会話に参加

トレンドタグ

リソース

開発者向け

Mastodon とは？

fedibird.com

さらに…