Lucene-analyzer

提供:Dev Guides
移動先:案内検索

Lucene-アナライザー

Analyzerクラスは、ドキュメントを分析し、インデックスを作成するテキストからトークン/単語を取得します。 分析しないと、IndexWriterはインデックスを作成できません。

クラス宣言

以下は org.apache.lucene.analysis.Analyzer クラスの宣言です-

public abstract class Analyzer
   extends Object
      implements Closeable

クラスコンストラクター

次の表は、クラスコンストラクタを示しています-

S.No. Constructor & Description
1 protected Analyzer()

クラスメソッド

次の表は、さまざまなクラスメソッドを示しています-

S.No. Method & Description
1

void close()

このアナライザーが使用する永続リソースを解放します。

2

int getOffsetGap(Fieldable field)

getPositionIncrementGap(java.lang.String)と同様ですが、代わりにトークンオフセットを除きます。

3

int getPositionIncrementGap(String fieldName)

項目がそのフィールドに既に追加されている場合、Fieldableインスタンスにインデックスを付ける前に呼び出されます。

4

protected Object getPreviousTokenStream()

reusableTokenStreamを実装するアナライザーによって使用され、以前に保存されたTokenStreamsを取得して、同じスレッドで再利用します。

5

TokenStream reusableTokenStream(String fieldName, Reader reader)

同じスレッドがこのメソッドを呼び出した前回から再利用できるTokenStreamを作成します。

6

protected void setPreviousTokenStream(Object obj)

reusableTokenStreamを実装するアナライザーで使用され、後で同じスレッドで再利用できるようにTokenStreamを保存します。

7

abstract TokenStream tokenStream(String fieldName, Reader reader)

指定されたReaderのすべてのテキストをトークン化するTokenStreamを作成します。

継承されるメソッド

このクラスは、次のクラスからメソッドを継承します-

  • java.lang.Object