多くの既存の分散SNSの検索は、Mastodonの全文検索もそうですが、リモートサーバに検索リクエストできるのではなく、自分のサーバにキャッシュされた情報から検索します。

つまり、フォローしたり、その誰かがブーストしたり、リレーから受け取るなどして、検索を実行するサーバが既に持っている情報だけが対象です。

自分ひとりのサーバで、特にリレーに入っているのでもなければ、自分のフォローしている人の(検索を許可している人の)投稿だけが対象となります。

fedibird.comでは1億6千万件ほどの投稿をインデックスしていますが、nightly.fedibird.comでは3千8百万件ほどです。

インデックスした全ての投稿が検索対象になるのではなく、検索許可された投稿やリアクションした投稿だけが対象になるため、実際の検索対象は一部でしかありませんが、規模感の理解には繋がるかと思います。

ただし、一般にインデックスした投稿が多い方が有利ですが、必ずしも最適・万能ではありません。

目的にかなわない不要なもの、不快なもの、検索狙いのスパムなども多数含まれることになるため、最初から対象になっていない方がいいこともあります。

連合の繋がりによって内容に違いが出るというのは面白い、時に非常に有用な特性です。

フォロー

同じ検索条件で、複数のサーバーそれぞれのキャッシュの検索APIを叩くようなツールを作れば、複数サーバーまたいだ擬似Fediverse検索ができるのだろうか?
元投稿にあるように、目的にかなう便利なツールかどうかはともかく。

QT: fedibird.com/@noellabo/1111071
[参照]

のえる  
多くの既存の分散SNSの検索は、Mastodonの全文検索もそうですが、リモートサーバに検索リクエストできるのではなく、自分のサーバにキャッシュされた情報から検索します。 つまり、フォローしたり、その誰かがブーストしたり、リレーから受け取るなどして、検索を実行するサーバが既に持っている情報だけ...

@weaponll いくつか工夫が要るけど、それなりにいけるよ。

@noellabo なるほど。便利に使えることもありそうで良いですね。

ログインして会話に参加
Fedibird

様々な目的に使える、日本の汎用マストドンサーバーです。安定した利用環境と、多数の独自機能を提供しています。