Рассылка закрыта
При закрытии подписчики были переданы в рассылку "Деловые программы" на которую и рекомендуем вам подписаться.
Вы можете найти рассылки сходной тематики в Каталоге рассылок.
← Апрель 2003 → | ||||||
1
|
2
|
3
|
4
|
5
|
6
|
|
---|---|---|---|---|---|---|
8
|
9
|
10
|
11
|
12
|
13
|
|
14
|
15
|
16
|
17
|
18
|
19
|
20
|
21
|
22
|
23
|
24
|
25
|
26
|
27
|
28
|
29
|
30
|
Статистика
0 за неделю
Новости портала "Горячие ссылки"
Информационный Канал Subscribe.Ru |
Здравствуйте!
Приветствую читателей новостей проекта "Горячие ссылки". В данный момент у рассылки следующее количество подписчиков: 1100. Последнее время наш сайт функционировал нормально, и после простоя с 4 по 15 марта серьезных проблем больше не наблюдалось. По крайней мере, в течение ближайших месяцев все так же и будет. Что касается рассылки, сегодня наше внимание будет уделено в основном рейтингам.
Новый рейтинг TopRef
Рейтинг Top20: файлы сайта
TopXX: сайты интернет
Разные обновления
Новый рейтинг TopRef
У предоставляемых нами сервисов появились новые возможности, перечисление их начну с таблицы 1: разные характеристики сервера за 18 суток его работы. Представлена статистика по тем величинам, которые еще не обсуждались в предыдущем выпуске рассылки. После таблицы обсудим подробно, что означают ее данные:
Таблица 1
(1) "Отборные" IP-адреса | ||||
(2) Доля "отборных" IP-адресов | ||||
(3) Распознанные хосты | ||||
(4) Доля распознанных хостов |
Итак, сегодня я начну с рейтинга клиентов нашего сервера TopRef, которому и "посвящена" данная таблица. "Отборными" (1) считаются запросы к текстовым файлам, т.е. гипертексту или скриптам. Остальные, которых (судя по (2)) в примерно 30 раз больше, видят только логотип нашего проекта. Именно это разделение клиентов и выбрано в качестве критерия помещения участника рейтинга в общую или Gold-категорию.
Все IP-адреса, запросы с которых регистрирует сервер, попадают в основную категорию, и их там получается очень много. Даже если группировать их по повторяющимся первым числам (назовем это "тройной IP-зоной"), данных рейтинга все равно было бы много, и объем информации все время слишком быстро бы увеличивался. В таблице 2 представлено распределение по числу зон "разного уровня" после недели работы рейтинга в тестовом режиме:
Таблица 2
Принцип группировки | ||
(I) Все IP-адреса *.*.*.* | ||
(II) "Тройные" зоны *.*.* | ||
(III) "Двойные" зоны *.* | ||
(IV) Зоны первого уровня * |
В течение нескольких суток на странице рейтинга отображалась информация по всем IP-адресам (I). Потом из-за непомерного роста объема информации рейтинг был переведен на учет только "тройных" зон, учитывалось количество уникальных IP в пределах одной зоны. Оказалось, что такой способ учета так же неэффективен, что видно по строке (II) таблицы 2: "экономится" в среднем половина участников рейтинга, а информации по каждой зоне надо хранить много. И конца этим данным тоже не видно, собрать их можно в сотни раз больше. В таблице 3А перечислены лидирующие по числу уникальных IP 10 "тройных" зон, а в среднем их, напоминаю, всего 2,42.
Таблица 3А
|
Таблица 3Б
|
Таким образом, хранить информацию обо всех "тройных" зонах с уникальными IP в каждой было бы слишком расточительно. Поэтому было принято решение хранить список "двойных" зон вида (III) и считать, сколько "тройных" зон попадает в каждую из них. В таблице 3Б перечислены лидирующие по числу IP "двойные" зоны, в среднем их получается 11,2. Конечно, данные по зонам "первого уровня" (IV) были бы еще компактнее, но это уже слишком ограниченный вариант рейтинга.
В результате на странице основной категории рейтинга TopRef отображаются:
- перечень "двойных" IP-зон с указанием в раскрывающемся списке выбора учитываемых "тройных" IP-зон. Список выбора тройной зоны не имеет никакого смысла и отображается только для компактности представления данных.
- Суммарное число запросов с IP-адресов данной "двойной" зоны. Поскольку подавляющее большинство участников общей категории рейтинга скачивают только один и тот же файл логотипа, учитывать трафик и тем более его среднее значение нет никакого смысла.
- Общее количество "собственных" тройных зон.
Такие же проблемы с выбором представляемой информации проявились и в Gold-категории рейтинга. Поскольку ее новых участников ("настоящих" посетителей сайта) каждый день появляется не очень много, время позволяет попробовать определить домен для каждого клиента. Напоминаю, (это указывалось в предыдущем выпуске рассылки) что процедура определения домена по IP-адресу работает заметное время, и когда их несколько десятков, это время надо учитывать. Тут мы, наконец, добрались до строк (3) и (4) таблицы 1: получается, что в среднем удается распознать треть доменов. В таблице 4 указаны разные характеристики собранных таким образом данных отборной категории (это результат тех же нескольких суток работы, что и для общей категории, т.е. данных таблиц 2 - 3):
Таблица 4
Принцип группировки | |
Участники Gold-категории | |
Число разных доменных имен | |
Число разных доменов второго уровня |
Если в выборе данных для общей категории основной проблемой был объем учитываемой информации, то здесь важнее уже соображения дизайна: что показывать на странице рейтинга, разница в размере хранимой информации все равно будет небольшая. Если отображать отдельно все доменные имена, то список лидеров будет слишком однообразен. Дело в том, что домен второго уровня (окончание доменного имени) у лидеров рейтинга часто повторяется. В таблицах 5А и 5Б представлены списки доменов второго уровня, занимающих первые места по числу упоминаний в рейтинге, перечислены лидеры по числу разных IP или разных "тройных" IP-зон:
Таблица 5А
|
Таблица 5Б
|
В итоге для отображении в категории Gold рейтинга TopRef выбрана следующая информация:
- название домена второго уровня в виде ссылки на него и одна из "тройных" IP-зон для данного домена;
- число зарегистрированных запросов с данного домена, суммарный трафик и среднее его значение на каждый запрос (как в других рейтингах);
- число разных IP-адресов, соответствующих одному и тому же домену.
Общий вид страницы рейтинга TopRef ничем, кроме зеленой цветовой гаммы, принципиально не отличается от страниц рейтингов TopXX или Top20:
- так же работает сортировка по данным каждого из столбцов (нажатие на его заголовок);
- возможен отбор зон (поисковая форма справа);
- при нажатии на ссылку с конкретной двойной зоны происходит отбор соответствующих зон только "первого уровня";
- сортировка в поле "IP-зона" выполняется по младшему ее разряду.
Рейтинг Top20: файлы сайта
На страницах основной категории рейтинга, в которой участвуют все файлы сайта, расширена форма поиска файлов. Теперь можно с помощью одного списка выбора указывать папку на сервере, выделяя материалы определенной тематики. Второй список выбора позволяет независимо от первого производить отбор файлов определенного типа. Отдельное текстовое поле ввода позволяет найти конкретные файлы. Ссылка "весь список" работает так же, как и раньше: она отменяет как условие текстового поиска, так и выбор по обоим спискам. В таблицах 6А и 6Б представлены перечни папок нашего сервера с наибольшим количеством файлов в них и список лидирующих по количеству своих представителей типов файлов.
Таблица 6А
|
Таблица 6Б
|
TopXX: сайты интернет
Аналогичные расширения поисковых форм внесены на страницы рейтинга сайтов TopXX и самого каталога ресурсов. На страницах рейтинга элементы выбора домена отображаются всегда, а в каталоге они включены в расширенный вариант формы в левом фрейме интерфейса. Это списки выбора доменов второго уровня, при указании конкретного домена происходит отбор только соответствующих ему ссылок. В списке выбора кроме названия указывается также примерное число ссылок, которое соответствует данному условию для конкретного домена. В таблице 7А приведен перечень лидирующих доменов второго уровня по данным каталога и рейтинга. Для сопоставления в таблице 7Б приводится список всех доменов каталога, отсортированный в порядке убывания числа повторов в базе каталога.
Таблица 7А
|
Таблица 7Б
|
Второй список выбора, добавленный в формы рейтинга TopXX и каталога ресурсов, позволяет выбирать доменную зону, т.е. домен первого уровня, с указанием числа ее повторов. В таблице 8 приведен список лидирующих зон по данным рейтинга и каталога.
Таблица 8
Домен первого уровня | ||
RU | ||
COM | ||
UA | ||
NET | ||
ORG | ||
BY | ||
DE | ||
EE | ||
LV | ||
SU |
Разные обновления
- Проведено обновление базы данных каталога: с сервера зеркала Levchenya.H1.Ru перенесены 50 ссылок, зарегистрированные там через систему 1PS.Ru за время бездействия основного каталога с 4 по 15 марта.
- Планируется обновление аннотаций на 91 ссылку в каталоге, 12 ошибочных ссылок будут удалены.
- Введена в строй система регулярной проверки доступности ссылок базы данных каталога. Как и раньше, вся база должна быть проверена за несколько месяцев - подождем результатов.
- Исправлена ошибка подготовки данных рейтингов, из-за которой некоторые посещения засчитывались по два раза. Больше такого не будет, теперь все точно!
На сегодня это все, будем ждать следующих новостей.
До встречи, Ваш Александр
Левченя
WWW: http://hotlinks.ru
E-mail: webmaster@hotlinks.ru
http://subscribe.ru/
E-mail: ask@subscribe.ru |
Отписаться
Убрать рекламу |
В избранное | ||