KH Coderを試す

樋口耕一 社会調査のための計量テキスト分析
の著者によるもの。

とりあえずインストールから。サイトはこちら http://khcoder.net/
今回初めてgitによるcloneというものを恐る恐る試してみたら、意外とあっさり。
しかしインストールはこの本を読んでもよく分からなかったので、例によってgoogleで検索して適当な解説を探す。
こちらを見つけ。
Ubuntuでkhcoderを動かす
https://qiita.com/TakabayaP/items/81c05086dfe034714fb9

perlを初めて使ったが、何をやっているのかよく分からなかったけど、一応起動するようにはなった。

次いで、KH Coderで適当にテキストを読み込んでみたが、MySQLでエラーになる。
IDとパスワードの設定ができていないようだ。

こちらを参照したがよくわからない状態。(今日はこれまで)

MySQLのrootパスワードを設定 – Linux環境


CaboChaをインストールする

MeCabが形態素解析のためのソフトだが、CaboChaは同じ工藤氏の開発による構文解析のためのソフトウェアだ。

工藤氏のサイトによると、インストール手順は
1.MeCabをインストール
2.CRF++をインストール
3.CaboChaをインストール
すればよいようだ。http://taku910.github.io/cabocha/

他にも、Qiitaのこのあたりを参照する。
* https://qiita.com/nezuq/items/f481f07fc0576b38e81d
* https://qiita.com/ShingoOikawa/items/ef4ac2929ec19599a3cf
* https://symfoware.blog.fc2.com/blog-entry-1729.html
* http://kumagonjp2.blog.fc2.com/blog-entry-82.html
* http://app-li.info/?p=3444

予めどのようなエラーが出やすいのかを知っておくと、心の準備が出来る。肝試しのようなものだ。

MeCabのインストールはWindowsでさんざん苦労したのだが、Ubuntuはリポジトリからインストールすれば良いので簡単にできた(これが罠だった)。

““
sudo apt install mecab
““

次に、CRF++をインストール。
CRF++の解説はこちら。http://d.hatena.ne.jp/echizen_tm/20111206/1323180144

これも、CRF++をダウンロードして、
““
./configure
make
make install
““
でストレートに終わった。

さて、本体のかぼちゃのインストールで躓いた記録。

1.ダウンロードに失敗

解説されていたサイトのリンクと工藤氏のリンクとが違っていたようで、ダウンロード自体が旨く行かなかった。これは、工藤氏のサイトからのリンク先からダウンロードすることで解決。

2. コンパイルエラー

実質初めてのコンパイルで要領を得ない。
やっていることの意味が分かっていないので、とりあえず書いてあるとおりにする。

がない!
めかぶのインストールは旨く行っているのに、どうしてだろう。

Stackoverflowに助けを求めると一晩でお返事がいただけた。
https://ja.stackoverflow.com/questions/52970/ubuntu-18-04-bionic%e3%81%a7cabocha0-69%e3%81%ae%e3%82%b3%e3%83%b3%e3%83%91%e3%82%a4%e3%83%ab%e6%99%82%e3%81%ab%e3%82%a8%e3%83%a9%e3%83%bc%e3%81%8c%e5%87%ba%e3%81%be%e3%81%99

要すれば、リポジトリからMeCabをインストールしたために、ヘッダファイルlibmecab-devがインストールされていなかったようだ。これをインストールしたことで、このエラーは解決。

さて、次のエラーは、よくわからないが、コンパイル時に設定を変更した際には、最初のconfigureからやり直さなければならないことに気が付かなかったことによる。偶然に、最初からやってみたら旨く行った。

3. 実行時エラー

インストールは何とかできたのだが、今度はかぼちゃの実行をしてもライブラリが見つからないというメッセージが出る。
findで探すとライブラリは存在しているので、どうやらリンクが旨く行っていないらしい。このライブラリリンクにはかつて随分と悩まされたので、イメージがすぐに湧いた。

コチラを参照して、

““
himagine@ubuntu~/Downloads/cabocha-0.69$ ldconfig -p|grep -i ‘/usr/local/lib’
libcrfpp.so.0 (libc6,x86-64) => /usr/local/lib/libcrfpp.so.0
libcrfpp.so (libc6,x86-64) => /usr/local/lib/libcrfpp.so
himagine@ubuntu~/Downloads/cabocha-0.69$ sudo nano /etc/ld.so.conf
[sudo] naoharu のパスワード:
himagine@ubuntu~/Downloads/cabocha-0.69$ sudo ldconfig
himagine@ubuntu~/Downloads/cabocha-0.69$ ldconfig -p|grep -i ‘/usr/local/lib’
libcrfpp.so.0 (libc6,x86-64) => /usr/local/lib/libcrfpp.so.0
libcrfpp.so (libc6,x86-64) => /usr/local/lib/libcrfpp.so
libcabocha.so.5 (libc6,x86-64) => /usr/local/lib/libcabocha.so.5
libcabocha.so (libc6,x86-64) => /usr/local/lib/libcabocha.so
himagine@ubuntu
““

気になったのは、かぼちゃの記述が少ないこと。RMeCabの石田氏もRCaboChaの開発は休止しているようだし。
ディープラーニング関係のクラウドサービスが増えているので、あまり使われなくなったのだろうか。


PDFをプレゼンに使う

PDFファイルをプレゼンテーションに使うことは、特にフォントが特殊なものを使っていたり、数式のレイアウトが崩れたりしないためには、絶対に必要だ。
PDF Viewerを使って、全画面表示をすればプレゼンテーションモードにすることは出来るものの、次に喋ることが分からなかったりする不便さがあるので、ネットで探してみたところ、見つけた。

超便利!PDF用プレゼンツール pdfpc

githubのソースはこちら
マニュアルはこちら。

早速、インストールしてみたら何と137kbのダウンロードしかなかった!
使うことがあるかどうかは未知数だが、シンプルかつエコなパッケージを知っておけば、いざという時にすぐに使えるので助かる。

他にもマークダウン表記を使ったプレゼン資料の作成や、beamerを使ってPDFを作る方法など、シンプルかつ便利な方法はあるようなので、追々研究していこう。

—- 2019年1月14日追記 —-

なおPDFプレゼンテーションを作成するにあたって、パワポなどを使う必要はなく、テキストからプレゼンを作れるツールを用いる。
マークダウンを使ったプレゼンテーション資料作成には、RStudioのknitrだけでなく、Marpというツールもあるようだ。

Marpはこちら


OK Googleがついに日本語を話すように

Raspberry Piのシステムをアップデートしたら、恒例のエラーが発生したので、今回はシステムが新しくなっていることもあり、ディスクの焼付からやり直した。
最近OK Googleをしていないなということを、ふっと思い出して、日本語化に挑戦してみることにした。

クレウエタンさんのサイトを参考に、あれこれいじっていたら出来たのだが、実は設定を変えても何もないかのように英語をはなしていたが、あるところから突然日本語をしゃべりだしたので、何が有効だったのかはよくわからない。
ただ、一つ言えることは、タブレットでGoogle Assistantを起動してGoogleのサービス側(つまりサーバー側)の設定をいじることでなんとかなるということかな。つまり、ラズパイを触っても設定を変えることは出来ないがタブレットのメニュの中に話しかける言語や、応答言語を設定するところがあるので、それを使えば良い。