22 апреля в Мадриде на конференции WWW2009 Яндекс представил доклад о выявлении коммерческих ссылок. В статье на английском языке был описан новый метод идентификации платных ссылок. За перевод благодарим Дмитрия Бротского, автора блога HelpContext.ru
Платные ссылки действительно влияют на рейтинги в индексах поисковиков, но не считаются спамом, поскольку встречаются в основном на вполне приличных страницах наряду с другими полезными ссылками и часто указывают на ценные коммерческие сайты. Создание платных ссылок вручную — сложная и кропотливая работа, поэтому неудивительно, что в них действительно содержатся актуальные сведения о целевом сайте. Тем не менее, умение выявлять платные ссылки значительно повышает эффективность рейтингов
поисковых машин.
Для проверки алгоритма идентификации платных ссылок мы использовали две тестовых выборки. Первая включает в себя около 1700 полезных естественных ссылок и 1850 платных ссылок, отобранных вручную методом случайной выборки (точность алгоритма оценивалась только по естественным ссылкам). Мы смогли идентифицировать ссылки, принадлежащие одному сервису обмена ссылками, и получили таким образом подборку платных ссылок, которую использовали в качестве второго тестового образца. Из 300 миллионов ссылок, присутствующих
в нашем графе, алгоритм идентифицировал как платные 50 миллионов ссылок (17 %).
В результате тестирования было установлено, что точность описанных алгоритмов достигает 94 %, а эффективность — 97 %.
Идентификация платных ссылок позволяет оценивать релевантность ссылок для коммерческих и некоммерческих запросов независимо друг от друга. В первом случае, платные ссылки учитываются при вычислении коммерческого рейтинга, а во втором — игнорируются. Это делает формулу вычисления рейтингов более эффективной и повышает качество поиска, нейтрализуя влияние чрезмерной оптимизации на некоммерческие поисковые запросы и делая результаты поиска более разнообразными.
Далее в статье описывается метод выявления SEO-ссылок, который показал хорошие результаты при тестировании, но пока на основном поиске не работает. К обсуждению статьи можно присоединиться на форуме Searchengines.
Не стоит забывать о том, что для судеб SEO важно не только то, какими технологиями располагает Яндекс для борьбы с оптимизаторами. Важно то, насколько целесообразной с точки зрения бизнеса Яндекс считает эту борьбу на данном историческом этапе. Александр Садовский этой весной отметил, что отключить ссылки с бирж от ранжирования в Яндексе могут хоть сейчас – но это не стоит в списке приоритетных задач на ближайшее время.
То, как эта задача будет продвигаться по списку приоритетности, зависит и от оптимизаторов. Нужно стараться сделать свою работу как можно более экологичной. Нужно писать хорошие тексты, делать сайты «для людей» - все эти советы давно известны и повторяются настолько часто, что начинают пролетать мимо ушей, как пролетают в детстве требования мыть руки и не играть со спичками.
В большом SEO-бизнесе явно заметен тренд на «раскладывание яиц по разным корзинам». Например, компания «Текарт» давно продвигает идею сбора из разных источников, а не только поисковых систем, целевого трафика на сайт и конвертации его в клиентов. Недавно ключевой специалист «Текарта» Сергей Людкевич перешел работать в компанию BDBD, которая в качестве отдельной услуги продает привлечение поискового трафика. В других компаниях платные
ссылки тоже далеко не единственный инструмент продвижения. На "Объединенной конференции" было сразу несколько докладов о привлечении поискового трафика и конверсии его в посетителей. С сайта конференции можно скачать презентации Сергея Людкевича, Павла Мауруса и других докладчиков основной и дополнительной программ.
С другой стороны, механизм продвижения на основе привлечения поискового трафика на нашем рынке пока плохо разработан и непрозрачен. Существуют методы привлечения на сайт такого трафика, который ни во что хорошее конвертироваться не может. Ботнеты, дорвеи… Тем не менее, к альтернативным стратегиям и технологиям интернет-маркетинга пора присматриваться очень внимательно.
Вообще, за прошедшую неделю было много новостей, связанных с поисковыми технологиями. «Нигма» объявила о запуске нового индексирующего алгоритма:
Новый алгоритм индексации сайтов расщепляет содержимое web-страниц на информационные блоки. Затем блоки, содержащие информацию, связанную с запросом пользователя, подмешиваются в результаты поиска с более высоким приоритетом. Новая технология разработана и запущена в тестовом режиме – пока проиндексировано около одного миллиона страниц Рунета, к концу лета разработчики расширят инфоиндекс до сотен миллионов страниц. Пока новые результаты поиска выдаются только на 1% запросов.
Работа нового алгоритма напоминает вертикальный поиск или колдунщики Яндекса. В выдаче появляются блоки с новостным контентом, с предложениями интернет-магазинов. Информация берется с сайтов, которые наполняются информацией с помощью скриптов и шаблонов на основе баз данных. По словам одного из создателей MySQL Дэвида Эсмарка, таких сайтов в Интернете (не в Рунете) 80%. Технология Нигмы представляет собой еще один вариант использования «структурного» поиска – обращения поискового алгоритма к
структуре страницы и анализа её элементов.
Яндекс и Mail.ru практически одновременно (что вообще свойственно этим компаниям) выпустили исследования интересов пользователей поиска. Mail.ru сопоставил интересы с половозрастными характеристиками пользователей. Получилось, что за первый квартал 2009 года самой актуальной темой для женщин стала безработица, а для мужчин – повышение пошлин на иномарки. Пятерку замыкает у женщин – коррупция, у мужчин – отсрочка от армии, то есть тема,
связанная с одним конкретным видом коррупции.
Самыми популярными политическими партиями среди мужчин оказались КПРФ и ЛДПР. Среди напитков у женщин популярны чай и кофе, а у мужчин водка и пиво. Ознакомиться с этим любопытным исследованием можно на сайте gogo.ru. А Яндекс 14 мая открыл сервис, отслеживающий изменения поисковых интересов пользователей с привязкой их к региону проживания пользователей. Этот сервис сравнивали и с давним "НИНИ-Индексом" Яндекса
и с "Пульсом блогосферы", только для большого поиска. Кроме того, Яндекс обновил сервис статистики поисковых запросов wordstat.yandex.ru. Был усовершенствован алгоритм фильтрации накруток запросов, смотреть теперь можно запросы за период до 14 месяцев, планируется увеличить этот срок до двух лет.
Шестого мая в русскоязычном блоге Google появилась
cтатья о том, как в Google используют эксперименты для тестирования потенциальных изменений алгоритмов поиска. В каждый момент времени на сайтах Google по всему миру проводится от 50 до 200 экспериментов. Дело в том, что Google тестирует даже самые незначительные из планируемых изменений, в том числе и в способе отображения поисковой выдачи.
И, наконец, в нашу сегодняшнюю подборку хочется добавить ЖЖ-пост Кирилла Готовцева про альтернативный
поиск, который стоит читать вместе с комментариями. Не меньше внимания заслуживает свежая статья «Вебпланеты», построенная на комментариях выступавших на РОМИП специалистов по поиску: Ильи Сегаловича (технический директор Яндекса), Игоря Некрестьянова (НИИ математики и механики СПбГУ), Александра Антонова (руководителя департамента поисковых систем корпорации "Галактика") и Сергея Татевосяна («Поиск КМ.Ru»).
РЕКОМЕНДУЕМ ПРОЧЕСТЬ
Денис aka Slonсчитает, что региональные нововведения Яндекса ударят по региональному бизнесу. "Многие фирмы из глубинки получали заказы от московских компаний и выступали в качестве подрядчика по заказам, так как произведенный
за пределами Москвы товар вместе с доставкой стоит существенно ниже, чем его производство на месте. Таким образом, новая поисковая выдача нанесла серьезный удар по межрегиональному немосковскому бизнесу", - пишет он
Американская аналитическая компания Hitwiseобнаружила, что произошло снижение доли трафика с контекстной рекламы в общем количестве поискового трафика, приходящего на сайты. Hitwise наблюдает это снижение с весны прошлого года. В разных тематиках видна различающаяся динамика. Hitwise считет, что этот процесс - следствие кризиса, так как компании снизили бюджеты на контекстную рекламу. На Хабрахабре
высказано мнение, согласно которому причина происходящего - в улучшении качества поиска и в том, что рекламные ссылки "приелись". Возможно также, что долю контекстных кликов отъедают другие источники трафика, либо что аудитория Интернета прирастает пользователями, доверяющими больше поиску, чем рекламе.
22 мая Seonews и Seo-Study проведут бесплатный вебинар на тему "Тонкости SEO с учетом внутренних и внешних факторов". В вебинар войдут доклады "Составление семантического ядра и прогноз примерного количества трафика по нему" Евгения Ленеца, "Текстовое ранжирование в Яндексе. Особенности подхода TF*IDF" Дениса Бессонова, "Стратегия продвижения сайта в условиях кризиса и часто меняющихся алгоритмов" Максима Шиловича. Зарегистрироваться на вебинар можно на сайте onlinesem.ru
КАКЗАДАТЬ ВОПРОС ЭКСПЕРТАМ?
Cтатьи,исследования, экспертные ответы в рассылке "Продвижение сайта. Профессиональные советы экспертов" будут посвящены, прежде всего, тому, что больше интересует вас, наших подписчиков.