![]() |
|
|
|
![]() |
|
Принципы работы поисковых систем
Поисковые системы состоят из пяти отдельных программных компонент: Spider: Паук - это программа, которая скачивает веб-страницы. Он работает точно как ваш браузер, когды вы соединяетесь с веб-сайтом и загружаете страницу. Паук не имеет никаких визуальных компонент. То же действие (скачивание) вы можете наблюдать, когда просматриваете некоторую страницу и когда выбираете "просмотр HTML-кода" в своем браузере. Crawler: Как и паук скачивает страницы, он может "раздеть" страницу и найти все ссылки. Это его задача - определять, куда дальше должен идти паук, основываясь на ссылках или исходя из заранее заданного списка адресов. Indexer: Индексатор разбирает страницу на различные ее части и анализирует их. Элементы типа заголовков страниц, заголовков, ссылок, текста, структурных элементов, элементов BOLD, ITALIC и других стилевых частей страницы вычленяются и анализируются. Database: База данных - это хранилище всех данных, которые поисковая система скачивает и анализирует. Это часто требует огромных ресурсов. Search Engine Results Engine: О, самое сердце зверя. Именно система выдачи результатов решает, какие страницы удовлетворяют запросу пользователя. Это та часть поисковой системы, с который вы имеете дело, осуществляя поиск. Когда пользователь вводит ключевое слово и делает поиск, поисковая система отбирает результаты на основании постоянно меняющихся критериев. Алгоритмом называется метод, по которому она принимает решение. Профессиональные оптимизаторы (SEO) иногда употребляют термин "algos" - это и есть то, о чем мы говорим. Не смотря на то, что поисковые системы сильно изменились, большинство до сих пор отбирают результаты поиска на основании примерно следующих критериев:
Как видите, поисковой системе необходимо делать множество уточняющих запросов, используя скаченную страницу целиком. Это сокращенное описание функционирования поисковой системы. Источник: не установлен. |
|
|||||||||
| © 1999-2010 Global Site Group 8-800-200-7483(site) | |||||||||||
|
|
|||||||||||