Latest update on 2026年1月21日 (水) at 14:47:00.
【第1998回】 土曜日の代休にsumyの続き(2026年1月20日)
- 今日は土曜出勤の代休ということになっているが、いろいろやらねばならないことがあるので、名谷に出勤。
- 年末に着手したsumy導入の続き。一部発生していた文字列操作のエラーを"\n".join()で解決したところで、summarizer自体は動いたが、これでは一文が長いままで使い物にならない。どうしいても形態素解析は必須であることが判明した。けれども今更MeCabでもなかろうということで、コマンドプロンプトにpy -m pip install Janomeと打ってJanomeをインストールし、Janomeのanalyzerを使って形態素解析させることにした。リンク先のはてブロの先人に倣ってトライしてみる……
- 最初の方に入れるモジュール読み込み
- from janome.analyzer import Analyzer
- from janome.charfilter import UnicodeNormalizeCharFilter, RegexReplaceCharFilter
- from janome.tokenizer import Tokenizer as JanomeTokenizer # (sumyと被るので)
- from janome.tokenfilter import POSKeepFilter, ExtractAttributeFilter
- 要約機能実装部分の形態素解析として
- (ここが難しくてうまくいかない)
- 結局形態素解析がうまく動作しないので中断。一文が長いままで妥協した。が、これでとりあえず最近50回分くらいを更新してみる。
- 帰宅後、19:00-22:20頃まで国臨教の若手教員発表会オンラインを視聴。専門的すぎて詳細がわからない発表もあったが、大変刺激的であった。HS-AFMという顕微鏡の話で「針はテクニシャンが電顕を覗きながら削っています」という説明を聞いて、人間の能力って凄いなあと思った。
🦋 (list)
▼前【1997】(日常メモ(2026年1月19日)) ▲次【1999】(「囲う」と「囲む」(2026年1月21日)) ●Top
🦋 = Cite and link this article to post bluesky, if you have logged in bluesky.
Notice to cite or link here | [TOP PAGE]