■ フレーズ検索 " "

例) "のえる"

Mastodonの全文検索は、日本語の対応について強化されているサーバ以外では、単語の分割が適切に行われないことがあります。

『のえる』と検索した際に、『の』と『え』と『る』がバラバラに扱われ、ほぼ無関係な投稿と一致してしまうことがあります。

この時に威力を発揮するのが『フレーズ検索』です。

そのまま一致させたい単語を " " で囲うことで分割されなくなります。

■ 除外指定 -

例) -虫

Mastodonの全文検索で、検索結果から除外したい単語がある場合、単語の前に - をつけて指定します。

例) -"のえる"

フレーズを除外指定することもできます。

フォロー

■ 日本語の検索

例) 京都

分かち書きする言語、例えば英語では、文字を並べて単語を構成し、その単語と単語の間にスペースや改行が入るため、区切りがはっきりしています。

分かち書きしない言語、例えば日本語では、単語を空白などで区切らずそのまま並べて表現するので、単語を区切るために解析が必要です。(形態素解析)

単語を適切に区切って取り出すことで、期待する単語にマッチさせ、無関係な単語にマッチさせない、精度の高い検索が可能となります。

適切に分割されていない場合、『京都』の検索で『東京都』もマッチしてしまいます。

この形態素解析には、検索機能を提供するElasticsearchへ形態素解析を行う追加機能をインストールし、インデックスを作成しておく必要があります。

Mastodonの標準インストールではこれは行われないので、サーバ管理者がカスタマイズしている可能性の高い日本向けのMastodonサーバで検索するのがお勧めです。精度の高い検索結果が得られます。

なお、特定の文字列をマッチさせたい場合は、フレーズ検索と除外指定が便利です。

フレーズ検索
fedibird.com/@noellabo/1111700

除外指定
fedibird.com/@noellabo/1111736

[参照]

ログインして会話に参加
Fedibird

様々な目的に使える、日本の汎用マストドンサーバーです。安定した利用環境と、多数の独自機能を提供しています。