■ フレーズ検索 " "
例) "のえる"
Mastodonの全文検索は、日本語の対応について強化されているサーバ以外では、単語の分割が適切に行われないことがあります。
『のえる』と検索した際に、『の』と『え』と『る』がバラバラに扱われ、ほぼ無関係な投稿と一致してしまうことがあります。
この時に威力を発揮するのが『フレーズ検索』です。
そのまま一致させたい単語を " " で囲うことで分割されなくなります。
■ 除外指定 -
例) -虫
Mastodonの全文検索で、検索結果から除外したい単語がある場合、単語の前に - をつけて指定します。
例) -"のえる"
フレーズを除外指定することもできます。
■ 日本語の検索
例) 京都
分かち書きする言語、例えば英語では、文字を並べて単語を構成し、その単語と単語の間にスペースや改行が入るため、区切りがはっきりしています。
分かち書きしない言語、例えば日本語では、単語を空白などで区切らずそのまま並べて表現するので、単語を区切るために解析が必要です。(形態素解析)
単語を適切に区切って取り出すことで、期待する単語にマッチさせ、無関係な単語にマッチさせない、精度の高い検索が可能となります。
適切に分割されていない場合、『京都』の検索で『東京都』もマッチしてしまいます。
この形態素解析には、検索機能を提供するElasticsearchへ形態素解析を行う追加機能をインストールし、インデックスを作成しておく必要があります。
Mastodonの標準インストールではこれは行われないので、サーバ管理者がカスタマイズしている可能性の高い日本向けのMastodonサーバで検索するのがお勧めです。精度の高い検索結果が得られます。
なお、特定の文字列をマッチさせたい場合は、フレーズ検索と除外指定が便利です。
フレーズ検索
https://fedibird.com/@noellabo/111170008889524195