CaboChaは、SVMs/Support Vector Machines に基づく日本語係り受け解析器とのことで現時点では、C/C++/Perl/Rubyライブラリがあり、MeCab同様、奈良先端科学技術大学院大学ならびに工藤 拓氏、また、松本 裕治が、現在は、前者が開発者のよう?です。
PC−UNIX/*BSD/Linux系、よっておそらくmacOSでも、また、Windowsについてもインストール方法や利用サンプルなどはリンク先にある通りです。
ここでは、Debian GNU/Linuxを使います。
が、CRF++(CRFs/Conditional Random Fields/条件付き確率場(シーケンシャルデータの分割・ラベリング用)で汎用的に使えることを意図したオープンソース実装)についてはリンク切れになっているようなので同氏のCRF++公式ドキュメントらしきhttps://taku910.github.io/crfpp/にあるGoogleドライブからダウンロードします。
CRF++もCaboChaも、なぜか、Google Driveが、これでもかって言うほど、抵抗して、ごねまくって苦戦します。
が、ファイルを選択、ポップアップのファイルをクリックしたり、ダウンロードアイコンをクリックしたり、これを何度も繰り返したり、あれこれやってみて悪戦苦闘していると、そのうち新たなタブが表示され、見慣れたアプリで開くか、ダウンロードするかを選択実行するポップアップが表示されるので胸をなでおろしつつ、ダウンロードします。
CaboChaのインストールに伴い、前提としてCRF++の他、MeCabも必要となっているのは、なんでかと思ったら、普通のテキスト文字列をCaboChaに渡すことができ、この際に内部で形態素解析するためにMeCabを利用するということのようです。
CaboChaをmakeする前にCRF++: Yet Another CRF toolkitに沿ってtarballをダウンロードしてconfigure、make...でmake installしておき、それからCaboChaをconfigure...make...make installします。
CaboChaについては、UTF8専用とすべく、--with-charset=utf8と--enable-utf8-onlyオプション付きでconfigureしました。
何れもC++のビルドなのでmakeには、-jオプション(CPUコア・スレッドの2倍の値が目安)をつけるのが妥当でしょう。
CRF++とCaboChaを行ったり来たりしてしまい、makeに失敗して、あれこれやり直した場合は、特にmake前のmake cleanを忘れずに。
CaboChaをmake installした後、エラーが出た...、ドキュメンにはないし、なんじゃこりゃ...、でも、MeCabと作者も同じみたいだし、同じようなコマンドがあるはずとwhichしてみたら、まさにcabocha-configコマンドがあったのでmecab.confをcabocha.confにしてteeコマンドで投げ、ldconfigしてみたらいけました。
結果、こんな感じの出力を得ることができました。
pip/pip3でインストールするのは、cabocha-python3じゃなくてcabocha-pythonでした。