フォロー

スプラのキーワード購読のやり方の話 

スプラのキーワード購読は正規表現使ってこんな感じでやってます↓
#?(([^ァ-ヴ]|^)スプラ([^ァ-デ, ド-ヴ]|$)|splatoon)

意図はこんな感じ↓
・ハッシュタグ付いてるやつも付いてないやつも両方拾う(ハッシュタグ拾うのはフォローでやった方が良いらしいですが...)
・「スプラ」と「splatoon」を両方拾う
・「スプラ」で拾うと別の言葉が混ざってしまうのでなるべくそれを弾く

別の言葉を弾く方法ですが,以下の仮説を立ててみました.
・「スプラ」の後に「ト」以外のカタカナが続いていたら別の単語(例:スプライト,スプラッシュマウンテン,スプラッタ映画)
・「スプラ」の前に別のカタカナが続いていたら別の単語(例:アイスプラント)

結構上手く機能していると思うんですが,問題点が少しあって,
・「ウオオオスプラアアア」みたいな雄叫びは拾えない(?)
・「ベスプラ」(多分ベストプライスの略とか)の「ベ」が平仮名になってるのに気付かず投稿してる人が稀に引っかかる

という感じです.何かもっと良い方法があったら教えてください...


まさに「スプラチナ」とかと戦ってたんで助かりますわ

ログインして会話に参加
Fedibird

様々な目的に使える、日本の汎用マストドンサーバーです。安定した利用環境と、多数の独自機能を提供しています。