Telegramで日本語検索がうまくいかない理由

今日は本当は別の話を書こうとして、その中でTelegramで日本語検索がうまく動作しないことを例として挙げようとしていました。

で、そのうまくいかないしくみについて、どなたか詳しい方の解説を引用しようとしたんですが、ネット上を探しても全然見つからない。

これ誰か書いておいた方がいいんじゃないかなと思ったので、たたき台としてでもここに書き残しておくことにします。

自分は専門家ではないので、「それまちがってるよ!」ということがあればコメント欄でご指摘いただければ幸いです。

Telegramで日本語検索がうまくいかない理由

世にある全文検索システムは、“pen"で検索したときに"penguin"や"open"までヒットしてしまわないように、スペースで区切られた単語単位で文字列を探すようなしくみになっていることがあります。

でも日本語の文章は単語と単語の間にスペースを基本入れないので、日本語に対応した全文検索システムでは、スペースに頼らず「形態素解析」というむずかしい処理をおこなって単語をばらします。

なので、単語単位で探すタイプの全文検索システムが日本語の形態素解析にまったく対応していない場合、

今日は天気がいい。

という文章があったら、「今日は天気がいい。」で1つの単語だとみなしてしまいます。すると「今日」や「天気」で検索してもヒットせず、「今日は天気がいい。」と検索したときだけヒットするという挙動になってしまいます。

Telegramで日本語を検索したときの挙動はほぼこれ。

かろうじて「、」や「。」なんかは区切り文字だという認識はあるようで、そこが「ほぼ」とした理由です。Telegramだと「。」なしの「今日は天気がいい」でもヒットします。

「、」や「。」は韓国語や中国語でも使うことがあるからその影響かな?
(Telegramの純正アプリは、言語設定の選択肢に日本語や中国語はまだないけれど、韓国語はあります。)

国際ワークキャンプの説明会

3日前、「昔ワークキャンプに参加していた」みたいな話を見かけました。

「ワークキャンプ」ってなんなんやろ?と思って調べてみると、お金の支給されない版の海外青年協力隊みたいな活動のことのようです。

そんなんあるんやー。おもしろそうかも。

ちょうど昨日東京で対面の説明会が開催されるということで、お話を聞きに行ってきました。

東京での対面の説明会はかなりひさしぶりらしくて、しかも次の予定がまだ出ていないので、「たまたま知って2日後」というタイミングはけっこうミラクルだったみたいです。

ワークキャンプのスタイル

基本は現地集合・現地解散。行き帰りの航空券や保険も各自で手配。

なので、集合日より前に航空券が安くなるタイミングをねらって現地入りしたり、終わってからまっすぐ帰国せずに別のところに行ったりするのも自由。

各プロジェクトの参加枠に入れるかどうかに選抜試験などはなく、基本は早い者順。

参加費とかはかかるけれど、活動中の住まいや食事は提供してもらえたりするので、ある程度以上長期だと、ふつうに観光で現地に滞在し続けるよりはリーズナブルに暮らすことができそうに見えました。

まずは歯の治療が終わってから考えよう。

インラインスケートコース評価一覧を作る

インラインスケートコースのスコアづけをするとき、できるだけ評価軸がぶれないように、過去にどんなコースに何点つけたかを振り返りつつ整合性を取ってきたつもりなんですが、この振り返りがだんだんよくわからなくなってきました。

あと、スコアづけがまだなのがどこなのかも記憶があやふやになってきていたので、そのあたりを整理する一覧を作ってみました。

個人的な作業用メモですが、どこに滑りに行くかの参考にもなりそうなので公開します。このブログのプロフィール欄からもリンクを張っておきます。
(ルートマップから直接はこのブログにたどり着けないようにしておきたいので、ルートマップからはリンクを張らないようにしておきます。)

マウスピースは熱湯消毒してはいけない

2週間ほど前から毎晩寝るときにはマウスピースをつけていましたが、ときどき殺菌した方がいいと聞いていたので、いつも食器用に使っている酸素系漂白剤を使っていました。

これもし今後もずっとつけていないといけないとすると、長期の旅行のときにちょっとめんどうなことになりそう。

漂白剤は飛行機に持ち込めないし、似たような何かを持ち込めたとしてもいずれ現地調達しないといけなくなるけれど、こういうのってどこでも手に入るものなんやろか?

あ!熱湯消毒だったら消耗品の薬剤に頼らなくていいし、どこでもどうにかなりそうででいいかも。

ということで、コップにマウスピースを入れて、ティファールで沸かしたお湯を注いでみたんですが、みるみるうちに形が曲がってきてしまいました(>_<)
ちょっと縮んだかも?

少々形が変わっても、歯と歯同士が当たらなければなんでもいいかと思ったんですが、実際口に入れてみてこれは無理だと実感。

ということで、昨日歯医者さんに行ってきました。

保険適用でマウスピースが作れるのは半年に1回だけだそうなんですが、今回は特別に無償で作り直してくれることに。めっちゃ申し訳ないです(>_<)

ふだんは作るのに1週間かかるんですが、前回の型が残っていたので1日で作ってくれて、今日受け取りに行ってきました。お手数をおかけしました。

紙のノートに回帰する

今日はルーズリーフを買いに行きました。

メモ類は5年ぐらい前に旅行用含めデジタル運用に移行し終わっていて、

IMG20231113153041
紙のメモは、旅行のときにこのサイズのを予備でポケットに入れているだけです。治安のよくないところでスマホが出せないときに一時的に使ったり、ちぎって置き手紙にしたり。

今回ルーズリーフを買ったのは、中国語とかのお勉強のため。手書きしないと漢字の形が覚えられない(>_<)

あと、ひたすらに書きためてピンポイントで探し出せばいいタイプのメモだと、デジタルの方が断然使い勝手がいいけれど、書いたものをあっちこっち視線を動かして広く眺める用途だと、今はまだアナログの方が効率がいいと思ったので。

どんなやり方がいいのかは、いろいろ試行錯誤してみようと思います。

電子書籍のもどかしさの解消案

一方向にページをめくっていけばいい物語などを読む場合だと、今の電子書籍でも特に不満はないんですが、何度も行ったり来たりして参照する単語集とか教科書系はいろいろもどかしいです。紙の方が便利。

そのもどかしさは、アプリががんばればなんとか解消できると思ってるんですが、今こんな機能あればなあと思っているのが、全ページを平面に並べて遠くからズームしてこられるような機能。

たとえばGoogleマップって、寄ると細かい駅名とかまで見えるけれど、

引きの視点になっても主要な地名はわかるようにしてくれてます。

こんなふうに、たとえば400ページの本だと縦20ページ×横20ページで並べて、寄ると本文が読めて、引きの視点だと章タイトルや要約が表示されて、「あれってこのへんに書いてあったな」ぐらいのアナログ感で移動できるようになっているといいのになあと思いました。

紙でも見開き2ページまでしか同時に見られないので、うまくやれば紙より便利にできる可能性もありそう。表紙のかたい図鑑とか特に。

Kindleって、本家アプリでしか読めないようになっていて、より便利なサードパーティアプリとかも作れないようなので、どなたかAmazonに勤めている知人がいたら紹介してください(>_<)