mutaguchi @mutaguchi@fedibird.com

テスカス (@model3yokohama) on Xx.com

https://x.com/model3yokohama/status/1869034153590878266
（私は自動車免許持ってないからハズしてる可能性もあるが）
これ過失はゼロかもしれないけど、減速するタイミングがかなり遅い気はする。先方で渋滞が目視できる状態では、徐々に減速せずいきなり減速したら、追突されるだろう…と人間なら考えるシーンだよね。

自動運転って他の自動車が全部自動運転なら、安全だと思うんだけど、他の自動車は人間が運転してる状況だと逆に危険なんじゃないかとずっと思ってる。

運転するときは周りの運転手はみんな気が狂ってると思え、みたいな教えがあるらしいけど、機械に人間の狂気が理解できる日は来るのか。

**mutaguchi** @mutaguchi@fedibird.com · + 2024年12月18日

**mutaguchi** @mutaguchi@fedibird.com · + 2024年12月18日

o1の言ってることはもう（俺には）理解できない、だからこいつは人類を超越した知能を持ってる存在だ！とかいうの、ほんとキツい。別に普通の人が言うのはいいと思うんだけどね…

**mutaguchi** @mutaguchi@fedibird.com · 2024年12月18日

**mutaguchi** @mutaguchi@fedibird.com · 2024年12月18日

2024年12月18日

最近は、死者の出た事故、事件、災害をバラエティ番組で消費するまで1年を切るようになったのか。スピード感あるな。（なんか見た）

**mutaguchi** @mutaguchi@fedibird.com · + 2024年12月18日

**mutaguchi** @mutaguchi@fedibird.com · + 2024年12月18日

LLMに会話っぽいことが出来るのは、会話文を学習したからだし、ステップ思考ぽいことが出来るのも、そういう文章を学習したからだ。そんなことはAI研究者、技術者には百も承知なのに、だからAIは思考しているのだ、みたいなことを言うのは本当にやめて欲しいんよな。

**mutaguchi** @mutaguchi@fedibird.com · + 2024年12月18日

**mutaguchi** @mutaguchi@fedibird.com · + 2024年12月18日

むしろ、現行の生成AIがもしAGI/ASIに到達したら、人間の知能って学習したデータを再現することだったんだ…と理解することになると思う。

私はそうはならんとは思ってるけど、もしそうなったら、そのときはとてもガッカリするだろうな。人間の知能って、そんな薄っぺらいもんだったんかってｗ

**mutaguchi** @mutaguchi@fedibird.com · + 2024年12月18日

**mutaguchi** @mutaguchi@fedibird.com · + 2024年12月18日

人工知能どころか、天然知能、つまり人間の知能だって、脳神経活動と意識や思考の具体的な関連とか、まだよく分かってないのだし、AI研究者の専門外だから仕方ない、というのは確かにあると思う。AI性能の客観的評価には、試験問題を解かせるみたいなベンチマークくらいしか無いのも分かる。

でも、試験勉強いっぱいさせたら試験でいい点取れるようになったという現象の、どこに科学があるんだと。こういう勉強をさせたらこういう問題ができるようになった、で終わらせずに、この問題が解けるようになったのは何故か？を考えるのが科学じゃないの？

生成AIは「覚えたことを再現しているだけ」ではなく、思考しているから問題を解けるのだ、という主張をするには、「何故、思考できるのか」に解を与える必要があると思う。なんせ、機械学習、ニューラルネットワーク、transformerとかの仕組みだけでは説明が付かないので。

生成AIが思考っぽいことができているように見える理由に解が与えられてない以上、今後、LLMに学習データをいくら喰わせても、学習データを超える出力が得られる見込みは無いんじゃないのか？どうしてAGI/ASIの登場を信じられるのか？
…というようなことを日々考えている。

**mutaguchi** @mutaguchi@fedibird.com · + 2024年12月18日

**mutaguchi** @mutaguchi@fedibird.com · + 2024年12月18日

生成AIは人類の叡智の結晶だと思ってるし、純然たるサイエンスだと思ってるんだけど、AIとしての能力評価になると途端に非科学的になるのなんなん、ってずっと思ってる。

別に一般人とかAI情報商材の人が、これはAGIだ人類は滅亡する、とか言っても別にいいと思うんだけど、AI研究者すら似たようなことを言ってるので頭が痛い。

**mutaguchi** @mutaguchi@fedibird.com · + 2024年12月18日

**mutaguchi** @mutaguchi@fedibird.com · + 2024年12月18日

これ以上何か言ってもアレだけど、Microsoftさんは色々何とかした方がいいんじゃないか

**mutaguchi** @mutaguchi@fedibird.com · + 2024年12月18日

**mutaguchi** @mutaguchi@fedibird.com · + 2024年12月18日

ああ、BitNet論文のファーストオーサーのJinheng Wang氏か。
この研究、Microsoft Research Asiaと北京大学の共同研究だったのね。

**mutaguchi** @mutaguchi@fedibird.com · + 2024年12月18日

**mutaguchi** @mutaguchi@fedibird.com · + 2024年12月18日

ちょっとBitNetのリポジトリを今更見てたんだけど、llama.cppのフォーク版が使われてるのは知ってたが、リポジトリのリンク先がMicrosoftではなくてEddie-Wang1120氏のもので、誰？となった。所属が北京大学となってるので、Microsoftの社員じゃなさそうなんよね。

**mutaguchi** @mutaguchi@fedibird.com · + 2024年12月18日

**mutaguchi** @mutaguchi@fedibird.com · + 2024年12月18日

tiiuae/Falcon3-10B-Instruct-1.58bit · Hugging Face

https://huggingface.co/tiiuae/Falcon3-10B-Instruct-1.58bit
さて、改めてFalcon3-10B-Instruct-1.58bit（BitNet）のモデルカードを読んでたんだが、量子化には例のHFブログで上がってた方法（フルスクラッチ学習じゃなくてファインチューニング）を使ってるみたいだった。これね。
https://huggingface.co/blog/1_58_llm_extreme_quantization

この方法、llama3 8Bモデルで実験されたものが、既に公開されてるんだけど、性能は全然だった。BitNet、少なくとも既存モデルのファインチューニングではダメなのは確実だと思う。

Microsoftはいい加減に、フルスクラッチでちゃんと性能出てるBitNetモデルを公開すべき。

We’re on a journey to advance and democratize artificial intelligence through open source and open science.

huggingface.co

**mutaguchi** @mutaguchi@fedibird.com · + 2024年12月18日

**mutaguchi** @mutaguchi@fedibird.com · + 2024年12月18日

llama.cppのバイナリがdefenderでマルウェア検出される問題は、zipにのみ反応して、解凍すると検出しなくなることを確認したので、誤検出と判断することにしました。

**mutaguchi** @mutaguchi@fedibird.com · + 2024年12月18日

**mutaguchi** @mutaguchi@fedibird.com · + 2024年12月18日

あと、llama.cppのfalcon3サポートのバグが治れば、推論の品質が改善される可能性はワンチャンあるので、そのときは改めて確認するとしよう。
とはいえ、BitNet版で劇的に性能が改善されるとも思えないが。

**mutaguchi** @mutaguchi@fedibird.com · + 2024年12月18日

**mutaguchi** @mutaguchi@fedibird.com · + 2024年12月18日

まあ…llama.cpp serverがモダンなUIに変わったことが知れたのは良かった。

**mutaguchi** @mutaguchi@fedibird.com · + 2024年12月18日

**mutaguchi** @mutaguchi@fedibird.com · + 2024年12月18日

ここまでやったんだし、結局b4350をダウンロードして試した。

BitNet版と同じ、「あなたは優れた日本人アシスタントです。」というシステムプロンプトでFalcon3-10B-Instruct-q4_k_m.ggufを実行した結果はこう。まあ、そういうことだな…。

確かにFalcon3は日本語は得意ではない感じではあるが、それでもBitNet版との出力とは比較にならないね。

**mutaguchi** @mutaguchi@fedibird.com · + 2024年12月18日

**mutaguchi** @mutaguchi@fedibird.com · + 2024年12月18日

萎えたので、すべてを忘れて、何もかもなかったことにしよう…

**mutaguchi** @mutaguchi@fedibird.com · + 2024年12月18日

**mutaguchi** @mutaguchi@fedibird.com · + 2024年12月18日

Revert "Add Falcon3 model support" by slaren · Pull Request #10876 · ggerganov/llama.cpp

https://github.com/ggerganov/llama.cpp/pull/10876
llama.cppのfalcon3サポート、バグがあったらしくて、差し戻されとる…なんてことだ。

Reverts #10864 Fixes #10875 Let's revert this until it can be fixed properly to stop gguf files with incorrect tokenizers being created and distributed.

github.com

**mutaguchi** @mutaguchi@fedibird.com · + 2024年12月18日

**mutaguchi** @mutaguchi@fedibird.com · + 2024年12月18日

また、ソースからビルドですかね…めんどくさいんだが

**mutaguchi** @mutaguchi@fedibird.com · + 2024年12月18日

**mutaguchi** @mutaguchi@fedibird.com · + 2024年12月18日

Misc. bug: Virus detected · Issue #10768 · ggerganov/llama.cpp

https://github.com/ggerganov/llama.cpp/issues/10768
これとは違うやつだが、b4351でもTrojan:Script/Sabsik.FL.A!mlというのが検出される。

Name and Version llama-b4297-bin-win-cuda-cu12.4-x64.zip Operating systems Windows Which llama.cpp modules do you know to be affected? Other (Please specify in the…

github.com