気の向くままに辿るIT/ICT/IoT
検索エンジン

検索エンジン

ホーム前へ次へ
検索エンジン・サーチエンジンとは?

検索エンジン

検索エンジンとは

 検索エンジンとは、点在した(多くの場合、膨大な)情報を探し当てる為のツールです。

検索(サーチ)エンジンの種類

 検索エンジンと呼ばれるものは、数多く存在しますが、検索手法から分類すると主にウェブページ検索とディレクトリ(カテゴリ)検索、イメージ画像検索などがあります。

インターネット上の任意検索とディレクトリ検索

 インターネット上の情報検索で代表的な検索エンジンにはGoogleやYahoo!、LiveSearch!(MSN)、gooなど、ディレクトリ検索にはGoogle Directory(dmoz)、Yahoo!カテゴリなどがあります。これら以外にも多くのディレクトリ検索サイトがあります。

 ディレクトリ(カテゴリ)検索は、このサービスを提供する検索エンジンのディレクトリにサイト単位で該当するディレクトリごとに階層化され、ファイルフォルダと同様に階層を辿って目指す情報を探すスタイルのもので多くの場合キーワードによるサイト内検索を行うことができるサイトが数多くあります。

 一方、ページ検索では、サイト単位ではなく、サイトを構成する各ページ単位で検索エンジンのウェブ巡回ロボット(クローラー)がインターネット上の膨大なホームページから各ページのキャッシュを取得し、各検索エンジンのアルゴリズムに沿ってキーワードごとに順位づけされ、一覧表示されるタイプで検索手法をキーワード検索、検索エンジンタイプをロボット型検索エンジンと呼ぶこともあります。

 ロボット型検索エンジンではインターネット上にホームページが公開されていれば(サイト運営者が拒否しない限り)クローラーと呼ばれる巡回ロボットが自動でインデックス(サイト内各ページのキャッシュを取得)してくれますが、より早く反映させたい場合には、各検索エンジンに登録申請するといいでしょう。また、RSS配信やGoogleではサイトマップを登録する事により早く反映させる事ができるでしょう。

ページ検索の仕組み

 ページ検索をする際には、膨大な情報の各ページから検索キーワードを探す為、全文検索を行い、当該キーワードが含まれるか否かを調べますが、日本語のように、欧米諸国の言語と異なり、文章記述にスペースを使う習慣がない場合には、単一または複数の単語をスペースで区切って検索される際にはよいですが、任意の(長い)文章をキーワードとした場合や熟語、合成語の場合、全く同じ文章または熟語、合成語が検索結果に現れることが望まれていない場合があります。

 この時、文章や熟語、合成語を形態素解析と呼ばれる自然語の最小単位に分割する考え方を利用してスペースがある場合と同じように検索抽出できる仕組みが採用されることがあります。また、「カテゴリ」と「カテゴリー」などいずれが検索された場合にいずれかを結果として出力するのかいずれも出力するのかといった「表記のゆれ」に対応する事もあります。「キーワード分割」「表記のゆれ」いずれの場合もするしないのオプションが用意されている事が多いでしょう。

検索アルゴリズム

 ページ検索における検索結果表示の仕組みは、各検索エンジンの心臓部と言える部分であり、個々に複数の判断基準を設けて自動判別で検索結果の表示順位付けがなされます。

 キーワードによるロボット型検索エンジンの検索結果でより上位に掲載されたいという多くのサイト運営者の願望からこの自動判別基準を検証、解析して検索エンジンに対して最適化し、上位表示されるようにする手法としてSEOという考え方が生まれてきました。

ホーム前へ次へ