Internet-technologies-search-engines
サーチエンジン
前書き
- 検索エンジン*は、Webページ、ニュースグループ、プログラム、画像などのインターネットリソースの巨大なデータベースを指します。 World Wide Webで情報を見つけるのに役立ちます。
ユーザーは、キーワードまたはフレーズの形式でクエリを渡すことにより、任意の情報を検索できます。 次に、データベースで関連情報を検索し、ユーザーに返します。
internet_technologies_tutorial
検索エンジンのコンポーネント
一般的に、検索エンジンには次の3つの基本コンポーネントがあります。
- Webクローラー
- データベース
- 検索インターフェース
Webクローラー
- スパイダー*または*ボット*とも呼ばれます。これは、Webを横断して情報を収集するソフトウェアコンポーネントです。
データベース
ウェブ上のすべての情報はデータベースに保存されます。 巨大なWebリソースで構成されています。
検索インターフェース
このコンポーネントは、ユーザーとデータベース間のインターフェースです。 ユーザーがデータベースを検索するのに役立ちます。
検索エンジンの動作
Webクローラー、データベース、および検索インターフェイスは、検索エンジンを実際に動作させる検索エンジンの主要なコンポーネントです。 検索エンジンは、ブール式AND、OR、NOTを使用して、検索結果を制限および拡大します。 以下は、検索エンジンによって実行される手順です。
- 検索エンジンは、キーワードを検索するために直接Webにアクセスする代わりに、定義済みデータベースのインデックスでキーワードを検索します。
- 次に、ソフトウェアを使用してデータベース内の情報を検索します。 このソフトウェアコンポーネントは、Webクローラーと呼ばれます。
- Webクローラーがページを見つけると、検索エンジンは結果として関連するWebページを表示します。 これらの取得されたWebページには、通常、ページのタイトル、テキスト部分のサイズ、最初の数文などが含まれます。
'_これらの検索条件は、検索エンジンによって異なる場合があります。 検索された情報は、キーワードの頻度、情報の関連性、リンクなどのさまざまな要因に従ってランク付けされます。_
- ユーザーは任意の検索結果をクリックして開くことができます。
建築
検索エンジンのアーキテクチャは、次の3つの基本層で構成されています。
- コンテンツの収集と改良。
- 検索コア
- ユーザーとアプリケーションのインターフェース
internet_technologies_tutorial
検索エンジンの処理
インデックス作成プロセス
インデックス作成プロセスは、次の3つのタスクで構成されます。
- テキスト取得
- テキスト変換
- インデックス作成
テキスト取得
インデックス付けのためにドキュメントを識別して保存します。
テキスト変換
ドキュメントをインデックス用語または機能に変換します。
インデックス作成
テキスト変換によって作成されたインデックス用語を受け取り、高速検索をサポートするデータ構造を作成します。
クエリプロセス
クエリプロセスは、次の3つのタスクで構成されます。
- ユーザーインタラクション
- ランキング *評価
ユーザーインタラクション
ユーザークエリの作成と改良をサポートし、結果を表示します。
ランキング
クエリとインデックスを使用して、ランク付けされたドキュメントのリストを作成します。
評価
有効性と効率を監視および測定します。 オフラインで行われます。
例
以下は、今日利用可能ないくつかの検索エンジンです。
Search Engine | Description |
---|---|
It was originally called* BackRub. *It is the most popular search engine globally. | |
Bing | It was launched in 2009 by* Microsoft. *It is the latest web-based search engine that also delivers Yahoo’s results. |
Ask | It was launched in 1996 and was originally known as* Ask Jeeves. *It includes support for match, dictionary, and conversation question. |
AltaVista | It was launched by* Digital Equipment Corporation* in 1995. Since 2003, it is powered by Yahoo technology. |
AOL.Search | It is powered by Google. |
LYCOS | It is top 5 internet portal and 13th largest online property according to Media Matrix. |
Alexa | It is subsidiary of Amazon and used for providing website traffic information. |