Apache Solr-概要

*Solr* は、*検索アプリケーション*の構築に使用されるオープンソースの検索プラットフォームです。 *Lucene* （全文検索エンジン）の上に構築されました。 Solrはエンタープライズ対応で、高速で拡張性に優れています。 Solrを使用して構築されたアプリケーションは洗練されており、高いパフォーマンスを提供します。

2004年にCNET Networksの会社のWebサイトに検索機能を追加するためにSolrを作成したのは Yonik Seely でした。 2006年1月、Apache Software Foundationの下でオープンソースプロジェクトになりました。最新バージョンのSolr 6.0は2016年にリリースされ、並列SQLクエリの実行をサポートしています。

SolrはHadoopと一緒に使用できます。 Hadoopは大量のデータを処理するため、Solrはこのような大規模なソースから必要な情報を見つけるのに役立ちます。検索だけでなく、Solrは保存目的にも使用できます。他のNoSQLデータベースと同様に、これは*非リレーショナルデータストレージ*および*処理技術*です。

要するに、Solrは、大量のテキスト中心のデータを検索するように最適化された、スケーラブルですぐに展開できる検索/ストレージエンジンです。

Apache Solrの機能

SolrはLuceneのJava APIのラップです。したがって、Solrを使用すると、Luceneのすべての機能を活用できます。 Solrの最も顕著な特徴のいくつかを見てみましょう-

Restful API -Solrと通信するには、Javaプログラミングスキルは必須ではありません。代わりに、安らかなサービスを使用して通信できます。 XML、JSON、.CSVなどのファイル形式でSolrにドキュメントを入力し、同じファイル形式で結果を取得します。
全文検索-Solrは、トークン、フレーズ、スペルチェック、ワイルドカード、オートコンプリートなどの全文検索に必要なすべての機能を提供します。
エンタープライズ対応-組織のニーズに応じて、Solrはスタンドアロン、分散、クラウドなど、あらゆる種類のシステム（大規模または小規模）に展開できます。
柔軟で拡張可能-Javaクラスを拡張し、それに応じて構成することにより、Solrのコンポーネントを簡単にカスタマイズできます。
* NoSQLデータベース*-Solrは、クラスターに沿って検索タスクを分散できるビッグデータスケールのNOSQLデータベースとしても使用できます。
管理インターフェイス-Solrは使いやすく、使いやすい、機能を備えたユーザーインターフェイスを提供します。これを使用して、ログの管理、ドキュメントの追加、削除、更新、検索などの可能なタスクをすべて実行できます。
高度にスケーラブル-SolrをHadoopで使用しながら、レプリカを追加することで容量を拡張できます。
テキスト中心および関連性順に並べ替え-Solrは主にテキストドキュメントの検索に使用され、結果はユーザーのクエリとの関連性に従って順番に配信されます。

Luceneとは異なり、Apache Solrでの作業中にJavaプログラミングのスキルは必要ありません。 Luceneが提供していないオートコンプリート機能を備えた検索ボックスを作成するための、すぐに展開できるすばらしいサービスを提供します。 Solrを使用すると、大規模（ビッグデータ）アプリケーション向けに、インデックスのスケーリング、配布、管理を行うことができます。

検索アプリケーションのLucene

Luceneは、シンプルでありながら強力なJavaベースの検索ライブラリです。任意のアプリケーションで使用して、検索機能を追加できます。 Luceneは、実質的にあらゆる種類のテキストのインデックス作成と検索に使用される、スケーラブルで高性能なライブラリです。 Luceneライブラリは、 Indexing や Searching など、検索アプリケーションに必要なコア操作を提供します。

膨大な量のデータを含むWebポータルがある場合、膨大なデータのプールから関連情報を抽出するために、おそらくポータルに検索エンジンが必要になります。 Luceneは、検索アプリケーションの中心として機能し、インデックス作成と検索に関する重要な操作を提供します。

Apache-solr-overview

Apache Solr-概要

Apache Solrの機能

検索アプリケーションのLucene