フォロー

『大規模言語モデルは新たな知能か ChatGPTが変えた知能』(岡野原大輔)

ChatGPTを初めとする大規模言語モデルの仕組みを、基礎技術から新たな萌芽技術まで幅広く紹介しながら、数式抜きで解説する。
知り合いに情報系の方々が多いのだが、彼らの話す言葉が年々わからなくなっていた(「逆誤差伝播法」とかね。「汎化」とかでさえ正確にはよくわかってないし、そもそも超重要らしい「シャノンの定理」からしてふんわりもわかってなかった)。大規模言語モデルの前身のディープラーニングからその前身のニューラルネットワークまでキーワードを丁寧に紐解いて通史的に書いた本書は、全体像を見通すのにうってつけの一冊だった。
ところで、本書を含む「岩波科学ライブラリー」は、私のデッキになかったが、ブルーバックスよりほどほどに高度っぽく、私はちょうどいい読者なのかもしれないと思った。
amzn.to/45hS6Xu

ログインして会話に参加
Fedibird

様々な目的に使える、日本の汎用マストドンサーバーです。安定した利用環境と、多数の独自機能を提供しています。