とりあえずシステムプロンプト「あなたは優れた日本人アシスタントです。」した限りでは、日本語の意味の通る文章が辛うじて出力できるかな、レベルだった。
ただ、このFalcon3-10B-Instruct、4bit量子化とかではどんな性能かはまだ見てないから、まだBitNetによる性能劣化レベルについてはなんとも言えない。

**mutaguchi** @mutaguchi@fedibird.com · 2024年12月18日 05:55

**mutaguchi** @mutaguchi@fedibird.com · 2024年12月18日 05:55

2024年12月18日 05:55

mutaguchi @mutaguchi@fedibird.com

Falcon3-10B-Instruct-1.58bitはこんな感じ。まあ、想像通り、使い物になるレベルではない。
今、4bit量子化モデルを落としてきてるので、それも試してからBitNetの最終評価をしようと思う。

883c8855a4872036.png

**mutaguchi** @mutaguchi@fedibird.com · 2024年12月18日 06:04

**mutaguchi** @mutaguchi@fedibird.com · 2024年12月18日 06:04

2024年12月18日 06:04

mutaguchi @mutaguchi@fedibird.com

手元のバイナリではfalcon3が動かんから落としてきたらdefenderでマルウェア検出されて消された。うざすぎる。

**mutaguchi** @mutaguchi@fedibird.com · 2024年12月18日 06:05

**mutaguchi** @mutaguchi@fedibird.com · 2024年12月18日 06:05

2024年12月18日 06:05

mutaguchi @mutaguchi@fedibird.com

世の中うざすぎる

**mutaguchi** @mutaguchi@fedibird.com · 2024-12-18T06:08:35Z

mutaguchi @mutaguchi@fedibird.com

https://github.com/ggerganov/llama.cpp/issues/10768
これとは違うやつだが、b4351でもTrojan:Script/Sabsik.FL.A!mlというのが検出される。

2024年12月18日 06:08 · · Web · · ·

**mutaguchi** @mutaguchi@fedibird.com · 2024年12月18日 06:09

**mutaguchi** @mutaguchi@fedibird.com · 2024年12月18日 06:09

2024年12月18日 06:09

mutaguchi @mutaguchi@fedibird.com

また、ソースからビルドですかね…めんどくさいんだが

**mutaguchi** @mutaguchi@fedibird.com · 2024年12月18日 06:20

**mutaguchi** @mutaguchi@fedibird.com · 2024年12月18日 06:20

2024年12月18日 06:20

mutaguchi @mutaguchi@fedibird.com

https://github.com/ggerganov/llama.cpp/pull/10876
llama.cppのfalcon3サポート、バグがあったらしくて、差し戻されとる…なんてことだ。

**mutaguchi** @mutaguchi@fedibird.com · 2024年12月18日 06:20

**mutaguchi** @mutaguchi@fedibird.com · 2024年12月18日 06:20

2024年12月18日 06:20

mutaguchi @mutaguchi@fedibird.com

萎えたので、すべてを忘れて、何もかもなかったことにしよう…

**mutaguchi** @mutaguchi@fedibird.com · 2024年12月18日 06:30

**mutaguchi** @mutaguchi@fedibird.com · 2024年12月18日 06:30

2024年12月18日 06:30

mutaguchi @mutaguchi@fedibird.com

ここまでやったんだし、結局b4350をダウンロードして試した。

BitNet版と同じ、「あなたは優れた日本人アシスタントです。」というシステムプロンプトでFalcon3-10B-Instruct-q4_k_m.ggufを実行した結果はこう。まあ、そういうことだな…。

確かにFalcon3は日本語は得意ではない感じではあるが、それでもBitNet版との出力とは比較にならないね。

5c47c6680c1de627.png

**mutaguchi** @mutaguchi@fedibird.com · 2024年12月18日 06:34

**mutaguchi** @mutaguchi@fedibird.com · 2024年12月18日 06:34

2024年12月18日 06:34

mutaguchi @mutaguchi@fedibird.com

まあ…llama.cpp serverがモダンなUIに変わったことが知れたのは良かった。

**mutaguchi** @mutaguchi@fedibird.com · 2024年12月18日 06:40

**mutaguchi** @mutaguchi@fedibird.com · 2024年12月18日 06:40

2024年12月18日 06:40

mutaguchi @mutaguchi@fedibird.com

あと、llama.cppのfalcon3サポートのバグが治れば、推論の品質が改善される可能性はワンチャンあるので、そのときは改めて確認するとしよう。
とはいえ、BitNet版で劇的に性能が改善されるとも思えないが。

**mutaguchi** @mutaguchi@fedibird.com · 2024年12月18日 06:44

**mutaguchi** @mutaguchi@fedibird.com · 2024年12月18日 06:44

2024年12月18日 06:44

mutaguchi @mutaguchi@fedibird.com

llama.cppのバイナリがdefenderでマルウェア検出される問題は、zipにのみ反応して、解凍すると検出しなくなることを確認したので、誤検出と判断することにしました。

**mutaguchi** @mutaguchi@fedibird.com · 2024年12月18日 08:04

**mutaguchi** @mutaguchi@fedibird.com · 2024年12月18日 08:04

2024年12月18日 08:04

mutaguchi @mutaguchi@fedibird.com

https://huggingface.co/tiiuae/Falcon3-10B-Instruct-1.58bit
さて、改めてFalcon3-10B-Instruct-1.58bit（BitNet）のモデルカードを読んでたんだが、量子化には例のHFブログで上がってた方法（フルスクラッチ学習じゃなくてファインチューニング）を使ってるみたいだった。これね。
https://huggingface.co/blog/1_58_llm_extreme_quantization

この方法、llama3 8Bモデルで実験されたものが、既に公開されてるんだけど、性能は全然だった。BitNet、少なくとも既存モデルのファインチューニングではダメなのは確実だと思う。

Microsoftはいい加減に、フルスクラッチでちゃんと性能出てるBitNetモデルを公開すべき。