新しいものを表示
のえる さんがブースト

申請のあったカスタム絵文字はだいたい通してますが、使用場面によって悪意と受け止められる内容ものも増えてきていますので、その点は十分ご留意ください。

特に絵文字リアクションにおいて不適切と判断される場合、厳しく対応します。

ここまで書いた検索TIPS、Fedibirdの拡張部分は全部省いて説明しているので、またそのうちFedibirdだとこういうことができますっていうのを説明します。

まあとりあえずここに全部かいてあるけど(ブログ)
blog.noellabo.jp/entry/fedibir

■ 全文検索対応サーバ

例)
mastodon.social
mastodon-japan.net
fedibird.com

全文検索はオプション機能で、全てのMastodonサーバが全文検索機能を備えているわけではありません。

Mastodonサーバの他に、別途、全文検索機能を提供するElasticsearchというサーバを設置する必要があるためです。

全文検索を利用したい場合、ご利用のサーバが対応しているかご確認ください。

設置の有無は、Elasticsearchサーバの設置・運用の難易度やコストの問題もありますが、サーバ管理者が必要と考えているかの差が大きいように思います。

国内の比較的大きなサーバのうち、現在、mstdn.jp, pawoo.net, best-friends.chatは全文検索に対応していません。

小規模なサーバでは、ホスティングサービスであるHostdonなどが日本語最適化した全文検索オプションを安価に提供しているため、むしろ導入が容易で、対応していることも多いです。

■ 日本語の検索

例) 京都

分かち書きする言語、例えば英語では、文字を並べて単語を構成し、その単語と単語の間にスペースや改行が入るため、区切りがはっきりしています。

分かち書きしない言語、例えば日本語では、単語を空白などで区切らずそのまま並べて表現するので、単語を区切るために解析が必要です。(形態素解析)

単語を適切に区切って取り出すことで、期待する単語にマッチさせ、無関係な単語にマッチさせない、精度の高い検索が可能となります。

適切に分割されていない場合、『京都』の検索で『東京都』もマッチしてしまいます。

この形態素解析には、検索機能を提供するElasticsearchへ形態素解析を行う追加機能をインストールし、インデックスを作成しておく必要があります。

Mastodonの標準インストールではこれは行われないので、サーバ管理者がカスタマイズしている可能性の高い日本向けのMastodonサーバで検索するのがお勧めです。精度の高い検索結果が得られます。

なお、特定の文字列をマッチさせたい場合は、フレーズ検索と除外指定が便利です。

フレーズ検索
fedibird.com/@noellabo/1111700

除外指定
fedibird.com/@noellabo/1111736

[参照]

■ 本文検索の対象

Mastodonの全文検索において、本文検索の対象となるテキストは、

・CW(警告文)
・本文から装飾を除いたプレーンテキスト
・アンケートの項目
・添付ファイルの説明文

です。

ハッシュタグの文字列も対象になりますが、隠れたハッシュタグはテキストに含まれないため対象になりません。

■ 検索範囲 in:

例) in:library

Mastodon v4.2 から、全文検索の対象に、公開検索を許可したユーザーの投稿が含まれるようになりました。

検索結果が充実して便利な反面、不快な投稿、不要な投稿、検索に紛れ込もうとする過剰な宣伝・スパムなど、ノイズも多くなります。

そこで、これまで同様、自分の投稿とリアクションしたものだけを対象にできるよう、対象範囲を選択するための指定です。

all すべての検索可能な投稿
library 自分のの投稿+リアクションした投稿

■ 属性指定検索 has: is:

例) has:image

Mastodonの全文検索で、投稿の属性によって絞り込みたいときの指定です。

image 画像
video 動画
audio 音声
media 添付ファイル
poll 投票
link プレビューカード付き(OGP等)
embed 埋め込みあり(YouTubeなど)
sensitive CWテキスト付き
reply 返信

hasとisはどちらを使っても結果は同じです。英語で意味が自然になる方を使うと良いでしょう。

除外指定(先頭に - をつける)を組み合わせて、かなり柔軟で強力な検索ができるようになっています。

■ 言語指定検索 language:

例) language:en

Mastodonの全文検索で、特定の言語による投稿だけを対象にする指定です。

ja 日本語
en 英語
fr フランス語
zh 中国語
ko 韓国語

などを指定します。

投稿時に言語指定できる最近のMastodon以外の投稿では、推定により間違った言語が指定されている場合や、言語が何も指定されていないケースがあるのでご注意ください。

■ ハッシュタグ検索 #

例) 新機能

Mastodonの全文検索で、特定のハッシュタグを含む投稿に絞り込みたいときの指定です。

先頭が # で始まる語句をハッシュタグとして検索します。

通常の本文検索でもハッシュタグの一部にマッチしますが、ハッシュタグとして検索すると、

一致するものだけマッチすること、本文に含まれないハッシュタグ(※)も対象となります。

※ 本文の中には語句が含まれないが、見えないハッシュタグがついている投稿もあります。

ウチのElasticsearch、たしか80GB超えだったはず……。

のえる さんがブースト
のえる さんがブースト

いつでも読めるように電子書籍版を手元に確保しておく、はあるよね。物理で持ってても。

えっと、業務連絡かな。

当サーバに登録した絵文字オーナーの方にご連絡です。

登録したカスタム絵文字、仕組みがいろいろ更新に向いていないので、今後、

古いモノをピッカーに出さない非表示扱いか、使用不可の設定にして、

新しいものをショートコード変えて追加する形で運用します。〜2とか。

ま、今回は上書きしちゃいましたが \(^o^)/

ほおずき、食用のものがあるんだねえ。ナスの仲間なのか。

古いものを表示
Fedibird

様々な目的に使える、日本の汎用マストドンサーバーです。安定した利用環境と、多数の独自機能を提供しています。