info@alextop.ru +7 (473) 258-56-65


Как правильно оптимизировать сайт

трафикДля грамотной и эффективной оптимизации сайтов просто необходимо знать, как работает поисковая система Яндекс. В частности многих СЕОшников и простых пользователей интересует, какие в ней используются технологии и алгоритмы ранжирования и благодаря чему, мы получаем ответ на заданный вопрос в течение пары секунд. По статистическим данным Liveinternet еще в 2012 году доля пользователей Яндекса на просторах Рунета составляла 60,5%, а за август месяц услугами портала воспользовалось 48,9 миллиона человек.

 

Алгоритмы работы Яндекса в первую очередь, пожалуй, интересны для блоггеров, ведь понимание построения анализа запросов позволяет эффективнее использовать ресурсы этого поисковика и, как результат, эффективнее продвигать свои блоги. Итак, рассмотрим основополагающие принципы работы одного из самых популярного поисковиков.

 

Как только человек сталкивается с необходимостью найти нужные ему сведения, у него может возникнуть вопрос «Как системе удается так быстро осуществлять поиск?» Ведь для того, чтобы найти нужный файл на жестком диске компьютера зачастую требуется секунд 10-20, а результат поиска по сети, объединяющей компьютеры со всего мира, мы получаем за пару секунд. Дело в том, что поиск в Яндексе можно сравнить с поиском нужного абонента в телефонном справочнике. Ведь построение фамилий в алфавитном порядке способствует максимально быстрому и эффективному поиску. Так и Яндекс раскладывает всю информацию сети в удобном для него виде еще до того, как посетитель ресурса задаст поисковый запрос. Рассмотрим подробнее, какие же процессы происходят за время от ввода запроса до вывода десятки подходящих ответов.

 

Индексирование Яндекса

 

Секрет мгновенного поиска Яндекс ру заключается в том, что этот ресурс собирает по сети всю информацию, до которой он только может дотянуться. С помощью специальных программ и оборудования производится мониторинг всего контента, включая графические изображения. Поиск осуществляется поисковой машиной, а сам процесс сбора – индексированием. Компьютерная система, лежащая в основе поисковой машины, именуется поисковым роботом. В его задачу входит постоянный обход проиндексированных сайтов и поиск на них нового контента, кроме того он еще определяет удаленнее страницы и убирает их из поиска.

 

Итак, рассмотрим, каким же образом поисковый робот ищет новые сайты? Во-первых, он использует ссылки, расположенные на других ресурсах. То есть, если на существующем проиндексированном сайте расположить ссылку на новый, то он будет также посещен поисковым роботом. Вторым способом является такой сервис как «аддурилка» (от add url – добавить ссылку) которую вы можете найти в Вебмастере Яндекса. В нем вы просто вводите ссылку на ваш сайт, и через некоторое время на него зайдет поисковый робот. И третьим способом индексирования является известный многим «Яндекс Бар» - небольшая надстройка, отслеживающая на какие сайты вы заходили со своего браузера.

 

Кстати, индексируются далеко не все страницы, ведь в Интернете наравне с полезной информацией можно найти огромное количество ненужного мусора. Причем по статистическим данным мусора там зачастую там намного больше. Поэтому при помощи специально разработанных алгоритмов поисковый робот проводит анализ каждого документа и определяет, есть ли в нем информация отвечающая запросам пользователей. Если ее там нет, то такие страницы просто не попадают в поиск.

 

После того, как информация собрана она попадает в хранилище поисковой машины, в котором все документы разбираются до самых основ. Html разметка убирается и текст превращается в таблицу, заполненную цифрами и буквами. Такая таблица и называется индексом. И даже если веб-ресурс будет удален или недоступен, то копия его страницы с полезной информацией будет еще некоторое время храниться в поиске. Индексы включают сведения о типах документов, языке и кодировке и вместе с копиями они составляют поисковую базу, которая периодически обновляется.

 

Подготовка ответа

 

После того как пользователь сформировал запрос, ему приходит на помощь система «Метапоиск» которая собирает такую информацию как: к какому классу можно отнести запрос, из какой страны и города пользователь, нет ли ошибок в запросе и т.д. Затем идет проверка на то, были ли уже запросы с такими параметрами. Если да, то вы получите заранее сохраненные результаты. В случае если вашего вопроса не находится, то Метапоиск обращается к данным индекса, расположенным в поисковой базе.

 

Затем наступает самый интересный этап – поиск в ячейках памяти информации, подходящей под ваши требования. Но так как иногда появляется много запросов, содержащих одинаковые слова, система не может каждый раз проходится по одним и тем же ячейкам, ибо это чревато лишними затратами времени. Поэтому все копии в индексе расположены на различных компьютерах. И после того, как вы подадите запрос, Метапоиск ищет по этим серверам именно ваш кусочек текста. Затем данные возвращаются на центральный компьютер, где они объединяются, и вы получаете десять наиболее подходящих ответов.

 

Также следует отметить тот факт, что запросы пользователей не всегда однозначны. Например, если вы введете в поиск слово «Наполеон», то, как системе определить что вы ищите, рецепт торта или информацию о французском императоре? Для этого была разработана технология Спектр, которая учитывает статистику поисковых запросов и на их основании определят потребности пользователей. Так из огромного количества запросов, поступающих в систему каждый день, Спектр выделяет такие объекты как названия фильмов, книг, модели телефонов и марки машин и т. д. и разбивает их по определенным категориям, которых на данный момент насчитывается около шестидесяти. С их помощью поисковая система и определяет, в каком контексте используется то или иное слово в запросе. На этой же технологии реализованы диалоговые подсказки, которые всплывают под строкой поиска и помогают вам указать, к какой категории относится данный запрос.