多くの既存の分散SNSの検索は、Mastodonの全文検索もそうですが、リモートサーバに検索リクエストできるのではなく、自分のサーバにキャッシュされた情報から検索します。
つまり、フォローしたり、その誰かがブーストしたり、リレーから受け取るなどして、検索を実行するサーバが既に持っている情報だけが対象です。
自分ひとりのサーバで、特にリレーに入っているのでもなければ、自分のフォローしている人の(検索を許可している人の)投稿だけが対象となります。
fedibird.comでは1億6千万件ほどの投稿をインデックスしていますが、nightly.fedibird.comでは3千8百万件ほどです。
インデックスした全ての投稿が検索対象になるのではなく、検索許可された投稿やリアクションした投稿だけが対象になるため、実際の検索対象は一部でしかありませんが、規模感の理解には繋がるかと思います。
ただし、一般にインデックスした投稿が多い方が有利ですが、必ずしも最適・万能ではありません。
目的にかなわない不要なもの、不快なもの、検索狙いのスパムなども多数含まれることになるため、最初から対象になっていない方がいいこともあります。
連合の繋がりによって内容に違いが出るというのは面白い、時に非常に有用な特性です。
同じ検索条件で、複数のサーバーそれぞれのキャッシュの検索APIを叩くようなツールを作れば、複数サーバーまたいだ擬似Fediverse検索ができるのだろうか?
元投稿にあるように、目的にかなう便利なツールかどうかはともかく。
#fedibird
QT: https://fedibird.com/@noellabo/111107103288249627 [参照]
@noellabo なるほど。便利に使えることもありそうで良いですね。
@weaponll いくつか工夫が要るけど、それなりにいけるよ。