Приветствую читателей
новостей проекта "Горячие ссылки".
В данный момент у рассылки
следующее количество подписчиков: 957.
Тема наших обсуждений в ближайшие месяцы - анализ статистики посещений для
некоторых наиболее востребованных динамических страниц с точки зрения популярности
тех или иных параметров их вызова. Тема эта уже поднималась в рассылке, но последний
раз достаточно давно, в 2003 году - всего через год после введения
в строй системы учета обращений к динамическим страницам. С тех пор статистики
накоплено гораздо больше, так что и результаты будут представительнее. Вторая
причина - происходившие недавно сбои в работе сервера, потребовавшие реорганизации
и оптимизации всех обеспечивающих работу скриптов. Поэтому нелишне проанализировать,
какие возможности сервисов востребованы клиентами в большей степени, какие в
меньшей. Третья предпосылка - собственно уже произошедшая модернизация скриптов
(подробный рассказ о ней - тема следующих выпусков рассылки, и их будет как
минимум несколько), в результате которой учет используемых параметров вызова
частично заблокирован для ускорения работы системы. То есть доступные сейчас
данные - наиболее достоверные.
Обсуждаться будут три раздела проекта. Это оглавление молодежного Интернет-журнала
<ГАДский вестник>, рейтинги и страницы каталога сайтов. Конечно, точное измерение
популярности затруднительно - не всегда можно полностью выделить из общего числа
запросов к серверу автоматически генерируемые обращения поисковых роботов, с
другой стороны, важны они или нет - это вообще отдельный серьезный вопрос. С
одной стороны, ситуация за последнее время принципиально не изменилась - как
и в феврале 2006, доля запросов от роботов составляет около
20% от общего числа (см. таблицу), в сумме это многовато, будем стараться снизить
эту величину. Судя по таблице, некоторые роботы стали активнее, некоторые наоборот.
Строки в таблице, как видно, расположены в порядке убывания активности роботов
в нынешнем году.
Отдельного внимания стоит частота запросов к конкретным страницам от отдельных
роботов (некоторые из них слишком часто индексируют редко обновляемые страницы,
создавая ненужную нагрузку на сервер), но это не стоит обсуждать в рассылке
- достаточно сказать, что по мере обнаружения таких проблем они устраняются.
Робот
Запросы в мае 2007 года
Запросы в феврале 2006 года
Mail.Ru/1.0
8.5%
-
Yahoo! Slurp
7.8%
3.6%
Yandex
2.2%
11%
Link Valet
1.5%
1.2%
StackRambler
1.4%
0.39%
MsnBot
0.8%
0.64%
GoogleBot
0.5%
0.09%
C целью уменьшения числа повторяющихся запросов от поисковых роботов для них
заблокировано обращение к некоторым динамическим страницам - это как раз оглавление
<ГАДского вестника>, три рейтинга <20 лучших> и основные сервисы каталога сайтов.
Конечно, блокировка запросов от роботов запрещает им индексировать данные страницы,
значит, информация с них не попадет в поисковые системы. Но страшного в этом
ничего нет - в последующих выпусках рассылки будет показано, что вся уникальная
информация, которой обладает проект <Горячие ссылки>, остается доступной для
индексирования.
На сегодня это все, в следующий раз начнем обсуждение конкретных страниц.