**茅野イリス** @kayanoIris@fedibird.com · 2024-02-23T05:40:53Z

茅野イリス @kayanoIris@fedibird.com

大規模言語モデルを作る、拡張する - Speaker Deck
https://speakerdeck.com/stillpedant/da-gui-mo-yan-yu-moderuwozuo-ru-kuo-zhang-suru

とてもわかりやすい資料。リソースがあれば自分でやってみたい。

大規模言語モデルの作りかたを 1. 事前学習 (Pre-Training) 2. 事後学習 (Post-Training) 3. モデル選定・評価 (Model Selection / Evaluation) に分けてご紹介します。 https://dbsj.org/dbsj_lecture/ でのトーク内容です。

Speaker Deck

2024年2月23日 5:40 · · Web · · ·

**茅野イリス** @kayanoIris@fedibird.com · 2024年2月23日

**茅野イリス** @kayanoIris@fedibird.com · 2024年2月23日

2024年2月23日

茅野イリス @kayanoIris@fedibird.com

オープンなモデルもいろいろ出てきているけど、せめてChatGPT-3.5くらいには日本語で処理できるものがほしい。今のところ Karakuri LM が優れた性能を見せてくれるものの、手元で動かすには大きすぎる。

ログインして会話に参加

トレンドタグ

リソース

開発者向け

Mastodon とは？

fedibird.com

さらに…