Gensim-using-lda-topic-model
提供:Dev Guides
Gensim-LDAトピックモデルの使用
この章では、潜在ディリクレ配分(LDA)トピックモデルの使用方法を理解します。
LDAモデルでのトピックの表示
上記で作成したLDAモデル(lda_model)を使用して、ドキュメントのトピックを表示できます。 それは次のスクリプトの助けを借りて行うことができます-
出力
計算モデルの複雑さ
上記で作成したLDAモデル(lda_model)を使用して、モデルの複雑さを計算できます。 モデルの良さ。 スコアが低いほど、モデルは優れたものになります。 それは次のスクリプトの助けを借りて行うことができます-
出力
コヒーレンススコアの計算
上記で作成したLDAモデル*(lda_model)*を使用して、モデルのコヒーレンススコアを計算できます。 トピック内の単語のペアワイズ類似度スコアの平均/中央値。 それは次のスクリプトの助けを借りて行うことができます-
出力
トピックキーワードの視覚化
上記で作成したLDAモデル*(lda_model)を使用して、生成されたトピックと関連するキーワードを調べることができます。 次のように pyLDAvis *パッケージを使用して視覚化できます-
出力
上記の出力から、左側のバブルはトピックを表しており、バブルが大きいほどそのトピックが一般的です。 トピックモデルは、チャート全体に散らばっている大きな重なり合っていないバブルがトピックモデルにある場合に適しています。