『大規模言語モデルは新たな知能か ChatGPTが変えた知能』(岡野原大輔) #読了 #よしざき読んだよ
ChatGPTを初めとする大規模言語モデルの仕組みを、基礎技術から新たな萌芽技術まで幅広く紹介しながら、数式抜きで解説する。
知り合いに情報系の方々が多いのだが、彼らの話す言葉が年々わからなくなっていた(「逆誤差伝播法」とかね。「汎化」とかでさえ正確にはよくわかってないし、そもそも超重要らしい「シャノンの定理」からしてふんわりもわかってなかった)。大規模言語モデルの前身のディープラーニングからその前身のニューラルネットワークまでキーワードを丁寧に紐解いて通史的に書いた本書は、全体像を見通すのにうってつけの一冊だった。
ところで、本書を含む「岩波科学ライブラリー」は、私のデッキになかったが、ブルーバックスよりほどほどに高度っぽく、私はちょうどいい読者なのかもしれないと思った。
https://amzn.to/45hS6Xu