Apache-solr-indexing-data
Apache Solr-データのインデックス作成
一般に、*インデックス作成*は、ドキュメントまたは(他のエンティティ)の体系的な配置です。 インデックス作成により、ユーザーはドキュメント内の情報を見つけることができます。
- インデックス作成は、ドキュメントを収集、解析、保存します。
- インデックスを作成して、必要なドキュメントを見つけながら検索クエリの速度とパフォーマンスを向上させます。
Apache Solrのインデックス作成
Apache Solrでは、xml、csv、pdfなどのさまざまなドキュメント形式のインデックスを作成(追加、削除、変更)できます。 いくつかの方法でSolrインデックスにデータを追加できます。
この章では、インデックス作成について説明します-
- Solr Webインターフェースの使用。
- Java、PythonなどのクライアントAPIを使用する
- *投稿ツール*を使用します。
この章では、さまざまなインターフェイス(コマンドライン、Webインターフェイス、およびJavaクライアントAPI)を使用してApache Solrのインデックスにデータを追加する方法について説明します。
Postコマンドを使用してドキュメントを追加する
Solrの bin/ ディレクトリには post コマンドがあります。 このコマンドを使用すると、Apache SolrでJSON、XML、CSVなどのさまざまな形式のファイルにインデックスを付けることができます。
次のコードブロックに示すように、Apache Solrの bin ディレクトリを参照して、postコマンドの* –hオプション*を実行します。
上記のコマンドを実行すると、以下に示すように、* postコマンド*のオプションのリストが表示されます。
例
次の内容を持つ sample.csv という名前のファイルがあると仮定します( bin ディレクトリ内)。
Student ID | First Name | Lasst Name | Phone | City |
---|---|---|---|---|
001 | Rajiv | Reddy | 9848022337 | Hyderabad |
002 | Siddharth | Bhattacharya | 9848022338 | Kolkata |
003 | Rajesh | Khanna | 9848022339 | Delhi |
004 | Preethi | Agarwal | 9848022330 | Pune |
005 | Trupthi | Mohanty | 9848022336 | Bhubaneshwar |
006 | Archana | Mishra | 9848022335 | Chennai |
上記のデータセットには、学生ID、名、姓、電話、市などの個人情報が含まれています。 データセットのCSVファイルを以下に示します。 ここでは、スキーマに言及し、その最初の行を文書化する必要があることに注意する必要があります。
次のように post コマンドを使用して、 sample_Solr という名前のコアの下でこのデータにインデックスを付けることができます-
上記のコマンドを実行すると、指定されたドキュメントは指定されたコアの下でインデックス付けされ、次の出力が生成されます。
次のURLを使用してSolr Web UIのホームページにアクセスします-
コア Solr_sample を選択します。 デフォルトでは、リクエストハンドラは /select で、クエリは「:」です。 変更を行わずに、ページの下部にある ExecuteQuery ボタンをクリックします。
次のスクリーンショットに示すように、クエリの実行時に、JSON形式(デフォルト)でインデックス付けされたCSVドキュメントの内容を確認できます。
注-同様に、JSON、XML、CSVなどの他のファイル形式にインデックスを付けることができます。
Solr Webインターフェースを使用した文書の追加
Solrが提供するWebインターフェースを使用して、ドキュメントのインデックスを作成することもできます。 次のJSONドキュメントにインデックスを付ける方法を見てみましょう。
ステップ1
次のURLを使用してSolr Webインターフェースを開きます-
ステップ2
コア Solr_sample を選択します。 デフォルトでは、次のスクリーンショットに示すように、リクエストハンドラ、共通内、上書き、およびブーストの各フィールドの値は、それぞれ/update、1000、true、および1.0です。
次に、JSON、CSV、XMLなどから必要なドキュメント形式を選択します。 次のスクリーンショットに示すように、テキスト領域にインデックスを作成するドキュメントを入力し、[ドキュメントを送信]ボタンをクリックします。
JavaクライアントAPIを使用してドキュメントを追加する
以下は、Apache Solrインデックスにドキュメントを追加するJavaプログラムです。 このコードを AddingDocument.java という名前のファイルに保存します。
端末で次のコマンドを実行して、上記のコードをコンパイルします-
上記のコマンドを実行すると、次の出力が得られます。