Oddbean new post about | logout
 ■ 日本語の検索

例) 京都

分かち書きする言語、例えば英語では、文字を並べて単語を構成し、その単語と単語の間にスペースや改行が入るため、区切りがはっきりしています。

分かち書きしない言語、例えば日本語では、単語を空白などで区切らずそのまま並べて表現するので、単語を区切るために解析が必要です。(形態素解析)

単語を適切に区切って取り出すことで、期待する単語にマッチさせ、無関係な単語にマッチさせない、精度の高い検索が可能となります。

適切に分割されていない場合、『京都』の検索で『東京都』もマッチしてしまいます。

この形態素解析には、検索機能を提供するElasticsearchへ形態素解析を行う追加機能をインストールし、インデックスを作成しておく必要があります。

Mastodonの標準インストールではこれは行われないので、サーバ管理者がカスタマイズしている可能性の高い日本向けのMastodonサーバで検索するのがお勧めです。精度の高い検索結果が得られます。

なお、特定の文字列をマッチさせたい場合は、フレーズ検索と除外指定が便利です。

フレーズ検索
https://fedibird.com/@noellabo/111170008889524195

除外指定
https://fedibird.com/@noellabo/111173602021462468

#Mastodon_検索TIPS [参照]