You are currently viewing OpenSearch Kuromojiに対応したDockerコンテナを作る

OpenSearch Kuromojiに対応したDockerコンテナを作る

OpenSearchで日本語を取り扱う場合、形態素解析に利用するために「Kuromoji」を導入するのが鉄板なような気がしています。
https://www.atilika.com/ja/kuromoji/

前回のエントリで紹介した、OpenSearch公式のDockerサンプルではKuromojiは導入できないようなので、今回はDockerファイルをちょっと改造してkuromojiを導入したいと思います。

Dockerファイルを新規作成する

kuromojiを導入したOpenSearchServiceを作成するためのDockerファイルを作成します。
Dockerファイルの内容は以下のようにしてみました。

FROM opensearchproject/opensearch:latest
RUN /usr/share/opensearch/bin/opensearch-plugin install analysis-kuromoji
RUN /usr/share/opensearch/bin/opensearch-plugin install analysis-icu

opensearch-pluginというコマンドでプラグインの管理ができるそうで、このコマンドを利用してkuromojiを導入してみました。
https://opensearch.org/docs/latest/install-and-configure/install-opensearch/plugins/

一緒に入れている「analysis-icu」はアジア圏での言語を取り扱う際に必要なプラグイン・・・らしい(未調査
日本語を取り扱うときはkuromojiとセットで導入することが多いそうなので、一緒に入れてみました。

docker-composeファイルもちょっと直して完成

docker-compose 内で先程作成したDockerファイルを読み込むように修正します。

version: '3'
services:
  opensearch-node1: # This is also the hostname of the container within the Docker network (i.e. https://opensearch-node1/)
    # image: opensearchproject/opensearch:latest # Specifying the latest available image - modify if you want a specific version
    build:
      context: .
      dockerfile: Dockerfile
    container_name: opensearch-node1

上記のように、buildの設定でcontextとdockerfileをしていするようにしました。
Dockerfileはdocker-composeと同じフォルダに置く想定の設定になっています。

以上

ひとまず以上の設定で、OpenSearchに黒文字を導入することができます。
実際の利用方法は、今後のエントリで紹介できればと思います。

コメントを残す