Принцип работы поисковых систем

Отправлено 29 июн. 2014 г., 13:44 пользователем Неизвестный пользователь
Поисковые системы могут привести на Ваш сайт большое количество посетителей.  Но лишь в том случае, если  Ваш сайт  грамотно разработан  и Вы постоянно его оптимизируете.  Для того, чтобы правильно проводить оптимизацию своего сайта в поисковых системах, необходимо понимать принцип работы поисковиков.  Поисковых систем в мире насчитывается достаточно много, однако среди них выделяются  Google, Yahoo, Яндекс,  MSN Search. Каждый из поисковиков имеет свою базу данных и свои собственные алгоритмы поиска.  Все остальные поисковики в той или иной мере используют их данные и их наработки в своей деятельности. Среди указанных поисковиков первое место занимает Google - около 70% мирового поиска. Для русскоязычного интеренета популярным поисковиком является Яндекс. Для продвижения русскоязычных  и украиноязычных сайтов достаточно понять базовые принципы Гугл и Яндекс. Я  не буду подробно во всех деталях описывать организацию поиска в поисковых системах, а лишь остановлюсь на основных принципах работы поисковика.

Поисковый робот
После того, как создан новый сайт, нужно сообщить поисковой системе  о его появлении. Именно для этого и производится регистрация сайта в поисковых системах. Но даже если Вы сами не сообщите о новом сайте поисковой системе, она со временем найдет его при помощи ссылок. Регистрация позволит ускорить этот процесс.  

Поисковая система имеет специальную программу  - "Агент" (еще названия: "паук","поисковый робот", "бот"), которая периодически заходит на сайты и сканирует их содержимое. Любой сайт - это набор html страниц. И поисковик видит сайт как  набор документов, среди которых самым важным является главная страница сайта. Главная страница обладает наибольшим весом и появляется в результатах поисковой выдачи по наибольшему количеству запросов.  

На главной странице и на остальных страницах сайта обязательно должны присутствовать ключевые слова  и фразы - чтобы Ваш сайт находили Ваши потенциальные клиенты. После добавления сайта в поисковую систему Агент (поисковый робот) зайдет на новый сайт и отсканирует его содержимое.

Отдельный компонент общей системы - Индексатор (Indexer) , проанализирует страницы, разбивая ее на составные части. Выделяются и анализируются различные элементы страницы, такие как текст, заголовки, структурные и стилевые особенности, специальные служебные html-теги и т.д.

Индексация сайтов
Поисковый робот составляет для сайта расписание, когда он должен на него зайти в следующий раз, проверить старую информацию и добавить новые страницы, если таковые имеются. Каждая страница на сайте имеет свою дату создания и последнего изменения. Для каждого сайта в сети поисковая система ведет свою историю создания новых страниц и обновления уже существующих. Но она не спешит добавлять их в базу поиска (индексировать) при каждом обновлении сайта. Они индексируются только при значительном изменении контента (содержимого) страницы.

Надо знать, что поисковые боты (роботы) запрашивают серверы, на которых расположены сайты, есть ли на «подведомственных» сайтах что-нибудь новое? Если сервер, отвечает утвердительно, то боты начинают искать и скачивать новые страницы. Или измененные страницы, если Вы вносили на них изменения. Поэтому вносить изменения в уже опубликованные статьи не менее важно, чем писать новые: в глазах робота – это тоже новый контент. Отсюда, кстати, вытекает то, что надежность сервера, на котором Вы размещаете свой сайт, имеет первостепенное значение.

Поэтому  очень важным моментом для любого сайта является регулярное добавление информации на его страницы, создание новых страниц, которые соответствуют тематике сайта. Если значительного изменения информации на сайте не происходит, то поисковый робот будет заходить на сайт реже. А в это время Ваши конкуренты  будут активно работать со своими сайтами и, как следствие, опережать Вас в результатах поисковой выдачи.

Сканированное содержание сайта помещается в специальное хранилище - "Индекс" (еще: "Database" или База данных"). После того, как прошла индексация сайта или отдельных страниц, они появляются в основной выдаче поисковика и их можно найти по ключевым словам, присутствующим в тексте. Процесс индексации обычно происходит довольно быстро после того, как робот стянет информацию с Вашего сайта.

Поисковые машины ищут запрашиваемую пользователем информацию не в сети, а в созданном ими каталоге, т.е. в базе данных.
Принцип работы поисковых систем

Когда пользователь вводит поисковый запрос, включается в работу поисковый механизм (Search Engine Results Engine) или Система выдачи результатов. Данный блок занимается выбором страниц из базы поисковой системы. Этот компонент поисковой системы является одним из ключевых, он определят, какие страницы подходят под заданные пользователем критерии и в каком порядке их необходимо вывести. Для анализа запроса, поиска соответствующих страниц в базе данных и вывода полученной информации используются специальные базовым алгоритмам ранжирования поисковой системы.  Алгоритмы всех поисковых систем постоянно модифицируются и держатся в тайне, но именно они влияют на позиции сайта в выдаче.

Ранжирование сайтов – определение порядка вывода интернет-ресурса в поисковой выдаче. Другими словами, ранжирование сайта – это авторитетность, релевантность, респектабельность, ранг веб-ресурса, которые каждая поисковая система определяет по-своему, учитывая собственные принципы и факторы ранжирования.

Каждая поисковая система имеет свой алгоритм ранжирования , детальная реализация механизмов также может отличаться друг от друга, однако всем поисковым системам присущи описанные общие черты.


Если Вы еще не являетесь моим подписчиком и хотите регулярно получать полезные статьи о развитии сайта, советы по продвижению бизнеса при помощи веб-технологий, подпишитесь на бесплатную рассылку  "Как развивать свой сайт для увеличения продаж"