C точки зрения простого обывателя любая поисковая система выглядит достаточно просто. Однако для того чтобы пользователь того или иного поискового сервиса имел возможность отыскать необходимую информацию на просторах интернета, в структуре поисковика задействуются несколько сложных программных компонентов.
Итак, из чего же состоит любая поисковая система?
Crawler. Это «блуждающий паук» поисковой системы. Его основной задачей является путешествие по Всемирной Сети и поиск новых web-документов, при обнаружении которых он дает команду следующему программному элементу поисковой системы, чтобы он скачал их на сервер поисковой системы.
Spider. Именно этот программный элемент поискового сервиса скачивает на его сервера все существующие в интернете web-документы, то есть страницы сайтов. Устроен Spider точно так же, как любой современный браузер, однако он не имеет оболочки и вид только код страниц web-сайтов.
Database. Данный неотъемлемый элемент поисковой системы необходим ей по той причине, что скачанные web-документы необходимо где-то хранить. Проще говоря, Database – это хранилище поисковика, куда помещаются все документы, скачанные ее предыдущим элементом.
Indexer. Это самый важный и неотъемлемый элемент любой поисковой системы. Именно он принимает решение относительно того, является ли тот или иной web-документ релевантным его поисковому запросу, а также принимает решение о его месте в поисковой выдаче.
Как должно быть понятно, именно в этот момент работы поисковой системы с web-документом в действие включаются ее алгоритмы, то есть оценивается качество важнейших и второстепенных элементов web-документа: его контента, структуры, навигации и так далее.
Кроме того, именно в это время происходит фильтрация новых страниц интернет-ресурсов.
Search Engine Results. Эту часть поисковой системы видел каждый ее пользователь. Основной задачей поисковой выдачи является показ пользователю поисковика страниц web-сайтов, которые наиболее точно соответствуют его поисковому запросу.