Internet-technologies-search-engines

提供:Dev Guides
移動先:案内検索

サーチエンジン

前書き

  • 検索エンジン*は、Webページ、ニュースグループ、プログラム、画像などのインターネットリソースの巨大なデータベースを指します。 World Wide Webで情報を見つけるのに役立ちます。

ユーザーは、キーワードまたはフレーズの形式でクエリを渡すことにより、任意の情報を検索できます。 次に、データベースで関連情報を検索し、ユーザーに返します。

internet_technologies_tutorial

検索エンジンのコンポーネント

一般的に、検索エンジンには次の3つの基本コンポーネントがあります。

  1. Webクローラー
  2. データベース
  3. 検索インターフェース

Webクローラー

  • スパイダー*または*ボット*とも呼ばれます。これは、Webを横断して情報を収集するソフトウェアコンポーネントです。

データベース

ウェブ上のすべての情報はデータベースに保存されます。 巨大なWebリソースで構成されています。

検索インターフェース

このコンポーネントは、ユーザーとデータベース間のインターフェースです。 ユーザーがデータベースを検索するのに役立ちます。

検索エンジンの動作

Webクローラー、データベース、および検索インターフェイスは、検索エンジンを実際に動作させる検索エンジンの主要なコンポーネントです。 検索エンジンは、ブール式AND、OR、NOTを使用して、検索結果を制限および拡大します。 以下は、検索エンジンによって実行される手順です。

  • 検索エンジンは、キーワードを検索するために直接Webにアクセスする代わりに、定義済みデータベースのインデックスでキーワードを検索します。
  • 次に、ソフトウェアを使用してデータベース内の情報を検索します。 このソフトウェアコンポーネントは、Webクローラーと呼ばれます。
  • Webクローラーがページを見つけると、検索エンジンは結果として関連するWebページを表示します。 これらの取得されたWebページには、通常、ページのタイトル、テキスト部分のサイズ、最初の数文などが含まれます。

'_これらの検索条件は、検索エンジンによって異なる場合があります。 検索された情報は、キーワードの頻度、情報の関連性、リンクなどのさまざまな要因に従ってランク付けされます。_

  • ユーザーは任意の検索結果をクリックして開くことができます。

建築

検索エンジンのアーキテクチャは、次の3つの基本層で構成されています。

  • コンテンツの収集と改良。
  • 検索コア
  • ユーザーとアプリケーションのインターフェース

internet_technologies_tutorial

検索エンジンの処理

インデックス作成プロセス

インデックス作成プロセスは、次の3つのタスクで構成されます。

  • テキスト取得
  • テキスト変換
  • インデックス作成

テキスト取得

インデックス付けのためにドキュメントを識別して保存します。

テキスト変換

ドキュメントをインデックス用語または機能に変換します。

インデックス作成

テキスト変換によって作成されたインデックス用語を受け取り、高速検索をサポートするデータ構造を作成します。

クエリプロセス

クエリプロセスは、次の3つのタスクで構成されます。

  • ユーザーインタラクション
  • ランキング *評価

ユーザーインタラクション

ユーザークエリの作成と改良をサポートし、結果を表示します。

ランキング

クエリとインデックスを使用して、ランク付けされたドキュメントのリストを作成します。

評価

有効性と効率を監視および測定します。 オフラインで行われます。

以下は、今日利用可能ないくつかの検索エンジンです。

Search Engine Description
Google It was originally called* BackRub. *It is the most popular search engine globally.
Bing It was launched in 2009 by* Microsoft. *It is the latest web-based search engine that also delivers Yahoo’s results.
Ask It was launched in 1996 and was originally known as* Ask Jeeves. *It includes support for match, dictionary, and conversation question.
AltaVista It was launched by* Digital Equipment Corporation* in 1995. Since 2003, it is powered by Yahoo technology.
AOL.Search It is powered by Google.
LYCOS It is top 5 internet portal and 13th largest online property according to Media Matrix.
Alexa It is subsidiary of Amazon and used for providing website traffic information.