Отправляет email-рассылки с помощью сервиса Sendsay
  Все выпуски  

Новости портала "Горячие ссылки"


Информационный Канал Subscribe.Ru

Здравствуйте!

Приветствую читателей новостей проекта "Горячие ссылки". В данный момент у рассылки следующее количество подписчиков: 1123. Обновления последнего месяца не столь масштабны, как октябрьская публикация "Рыбинского вальса", однако они коснулись многих разделов сервера. Расскажу обо всем подробно.

Рейтинг посетителей сайта TopRef
Статистика обращений к динамическим страницам
Новые возможности поиска в каталоге ресурсов
Материалы о ТВ и радио Санкт-Петербурга
Новое о модерне в архитектуре
Личная страница автора
Публикации "Гадского вестника"

Рейтинг посетителей сайта TopRef

Этот достаточно специфический сервис пользуется незначительной популярностью среди самих посетителей сайта по сравнению с другими динамически генерируемыми страницами. Приведу сравнение, имеющее отношение и к следующей части сегодняшнего выпуска. В таблице сравнивается суммарное число обращений к тому или иному сервису за последние месяцы (вторая колонка таблицы). В третьей колонке указано, сколько разных параметров использовалось при обращении к этим страницам:

Таблица 1

Сервис
Обращений
Параметров
Регистрация ссылки
11548
15
Переход по ссылке
6260
8
Список ссылок
2845
56
Список разделов
1990
133
Каталог в целом
1208
23
"ГАДский вестник"
595
32
Рейтинг Top20
263
9
Рейтинг TopXX
82
11
Рейтинг TopRef
71
12

Даже последняя, "отстающая", строка имеет право на внимание к себе. Другая причина модифицировать эту систему - большой объем информации, накопившийся в базе данных за несколько месяцев работы рейтинга. Основная категория рейтинга не должна создавать проблем, потому что число строк в таблице (количество разных "двойных" IP-зон) принципиально ограничено 65536, сейчас их около 10000. Создавая весной таблицу данных категории Gold, я не рассчитывал, что она будут столь быстро увеличиваться в размерах, однако осенью ситуация здесь выглядит следующим образом. В первой таблице - количество различных значений некоторых характеристик, во второй - лидирующие по числу упоминаний доменные имена. Напомню, что им "HotLinks.Ru" соответствует неопределенному имени:

Таблица 2А

Параметр
Число
(1) Доменные имена
4314
(2) Разные IP-адреса
40377
(3) "Двойные" IP-зоны
19172
(4) "Тройные" IP-зоны
4548

Таблица 2Б

Домен
Общее число
Hotlinks.ru
12052
rol.ru
1639
mtu-net.ru
1248
spb.ru
553
t-dialin.net
506
wplus.net
482
aol.com
481
net.il
451
Googlebot.com
332
rr.com
309

В работавшем полгода рейтинге базой для сбора информация служил IP-адрес (2), и таблица все росла и росла. Казалось бы, ничего не стоит хранить по одной отдельной записи для каждого домена (1), сохраняя упоминания о соответствующих ему IP. Однако не только самих адресов, но и их групп оказалось достаточно много для некоторых доменов. В первой таблице перечислены лидирующие по числу различных доменных имен соответствующие им "двойные" IP-зоны, во второй таблице - лидирующие по числу двойных зон домены:

Таблица 3А

Двойная зона
Число доменов
213.59
65
195.161
56
194.186
54
213.24
53
194.84
44
217.106
43
217.107
42
62.76
38
195.239
35
80.237
33

Таблица 3Б

Домен
Число зон
Hotlinks.ru
1876
rr.com
86
ne.jp
67
aol.com
64
attbi.com
63
Pacbell.net
61
t-dialin.net
57
co.uk
51
Comcast.net
49
com.ua
48

Таким образом, как не переформатируй таблицу данных, если их хранить все, информации все равно будет много. Поэтому принято решение упростить хранение данных для "отборной" категории: записывать только доменное им (табл. 2А, строка (2)) и суммировать все данные по нему вместо строки (1) - т.е. данных теперь хранится в 10 раз меньше. А внешне (на страницах рейтинга) почти ничего не изменилось, только не выводится число разных IP для одного доменного имени. Пользователи не обидятся, ведь их пока так немного...

Статистика обращений к динамическим страницам

Другой претендент "на упрощение" - таблица с протоколом обращения к вызовам скриптов. Кое-что об их числе указано в таблице 1, но дело даже не в значительном различии в популярности тех или иных страниц. Весной я решил собирать информацию обо всех вызовах, и вот что получилось:

Таблица 4

Характеристика
Количество
(1) Скрипты
79
(2) Параметры
228
(3) Значения
17412
(4) Всего вызовов
25250

Поскольку хранилось все вплоть до всех возможных строк (3), таблица данных увеличивалась на глазах. Теперь, хотя этого все равно никто не заметит (интерфейс открытого доступа к этим данным отсутствует), учитываются только разные скрипты и параметры, так что число строк в таблице также снизилось в 10 раз. Тем не менее, сбор данных ведется, при необходимости их можно будет обнародовать. Например, перечень страниц-лидеров по числу разных параметров их вызова приведен в таблице 1.

Новые возможности поиска в каталоге ресурсов

Путем перегруппировки частей программы была облегчена дальнейшая модификация скрипта поиска ссылок, за счет чего добавлять новые его возможности стало значительно легче. Первое небольшое обновление - новый параметр-переключатель расширенной формы поиска и отбора ссылок, отсекающий все "длинные" адреса (грубо говоря, URL-и со слэшами), в интерфейсе эта кнопка обозначена "только хосты". Если рассматривать для примера долю общего количества ссылок в трех разных категориях каталога, зарегистрированных в тот или иной год, получается следующее распределение "только хостов":

Таблица 5

Год

Все ссылки

Участники TopXX

Проверенные

1999

65,8%

48,5%

73,3%

2000

67,2%

42,7%

70,7%

2001

75,9%

46,5%

77,0%

2002

75,3%

49,6%

74,9%

2003

82,5%

68,1%

70,8%

Второе обновление - исправление механизма навигации по списку ссылок при многостраничном выводе результатов поиска. Раньше при переходе, например, с первой страницы на пятую, когда их всего девять, на экран выводилась неправильная панель навигации, без ссылок на другие страницы. Теперь ошибка исправлена Владиславом Арановым, спасибо ему. Впрочем, автором кода навигационной панели был именно он, так что корни ошибки уходят в начало 2000-го года...

Самая значительная модернизация механизма поиска тоже основана на идеях Владислава. Раньше текстовый поиск производился по всем подходящим полям (URL, название сайта, описание, E-mail автора) по условию полного соответствия со строкой поиска, причем использовать кавычки в запросе было невозможно. Теперь реализован гибридный механизм, в чем-то позаимствовавший лучшие принципы известных поисковых систем:

  • При обычном обращении производится поиск введенного слова без пробелов, строка с пробелами разделяется на отдельные слова, и каждое из них становится целью поиска (по условию ИЛИ). Чем-то это напоминает принцип работы Yandex'а, конечно, упрощенно: склонения, спряжения и падежи не учитываются, каждое слово ищется "как есть". Если Вы хотите найти строку с пробелами (т.е. фразу целиком), заключайте ее в кавычки. Так что "старый" вариант поиска - это "ЗАПРОС" в кавычках.
  • Слов или фраз в кавычках (кстати, кавычки эквивалентны одинарным апострофам и автоматически на них заменяются в поле ввода после перезагрузки страницы) может быть несколько, тогда между ними нужно указать ключевое слово условия поиска AND ("И") или OR ("ИЛИ") - это реверанс в сторону системы AltaVista. Получается, что СЛОВО ПРОБЕЛ СЛОВО эквивалентно "СЛОВО" OR "СЛОВО", и выгода здесь в том, что "СЛОВО" AND "СЛОВО" по первой методике никак не получить. Важно помнить, что СЛОВО может быть ФРАЗОЙ с пробелами... короче, возможностей поиска открывается все больше и больше!
  • Если открыть расширенную форму отбора ссылок, там появился список выбора полей дл текстового поиска, которые следует игнорировать при поиске. По умолчанию в этом списке множественного выбора ничего не отмечено, т.е. поиск производится по всем текстовым полям, как обычно. Но можно заблокировать, например, поиск "по описанию" сайта и исключить, таким образом, часть найденных ссылок.

Надеюсь, что новые возможности поиска значительно увеличат его эффективность.

Материалы о ТВ и радио Санкт-Петербурга

С одной стороны, на этих страницах ничего принципиально не изменилось - трудно придумать что-то новое в хорошо продуманном интерфейсе. Тем не менее, прошло некоторое время, пора "освежить" материалы, что и было сделано. Следующие изменения произошли в материале "Телевидение Санкт-Петербурга":

  • Исправлен и дополнен список действующих в городе телекомпаний и каналов, на которых производится вещание, информация о новых каналах вынесена в верхнюю часть статьи.
  • Проанализирована сетка вещания телеканалов Рамблер-ОТВ и СТО, соответствующим образом изменились диаграммы в статье, кнопки на "пульте ДУ телевизора" и страницы, открывающиеся при нажатии на новые кнопки пульта.

В статье о FM-радиостанциях Санкт-Петербурга значительно изменилась таблица с перечнем радиостанций, добавлено много новой информации и по "старым", и по "новым" станциям. В верхней части страницы - самые важные новости.

Новое о модерне в архитектуре

Стимул для обновлений на этих страницах оказался не совсем обычен, я впервые услышал серьезные критические замечания в свой адрес. Впрочем, это было личное мнение, к тому же, оно касалось текста реферата и иллюстраций, которые все равно не на что менять - так что по большому счету все останется, как было. Однако всплыли и некоторые недоработки, которые оказалось вполне возможно устранить:

  • Гостевая книга закрыта из-за непрерывного потока заливающего ее мусора в виде разнообразной непрофильной для сайта рекламы. Новую гостевую книгу открывать смысла нет, все равно уже год в нее никто не пишет. Архив "старой" гостевой книги опубликован в виде статического файла. Спасибо Александру Мамлыга за замечание о некорректной работе книги!
  • Ссылка на соответствующий раздел каталога HotLinks.Ru, посвященный архитектуре модерна, исправлена: раньше там было указание на прошлогодний статический файл, теперь осуществляется вызов динамической страницы с постоянно обновляющимися данными рейтинга ссылок.
  • За другое дополнение, которое уже нельзя назвать исправлением, следует поблагодарить Павла Каганера: он прислал подборку из нескольких десятков ссылок по истории Петербурга, которые и были добавлены в соответствующий раздел каталога ресурсов. Пусть это не относится напрямую к модерну, но большинство из ссылок относится именно к архитектуре, и все они - к Петербургу.

Личная страница автора

Обычное дело, все-таки, прошло несколько месяцев. Так что на этой странице просто перечислено все то, что было сделано по основной специальности за последние полгода (не считая того, что уже отражено ранее). Просто кое-что я пропустил весной и летом, так что информация о двух весенних докладах и об участии в июльском семинаре добавлена только сейчас.

Публикации "ГАДского вестника"

Как говорится, чем начинали (точнее, чему посвятили весь предыдущий выпуск рассылки), тем и заканчиваем нынешний выпуск:

  • Опубликовано продолжение фэнтези-романа "Средиземье - крохотный мирок", часть 10. История близится к завершению, но впереди еще достаточно приключений, хватит на много месяцев публикации продолжений...
  • Дополнен новыми особенностями интерфейс интерактивного оглавления интернет-журнала. По умолчанию список статей сортируется по дате публикации (выше оказываются более новые публикации), а не по номеру выпуска, как раньше. Таблицы, следующие за списком статей (информация о рубриках, авторах и выпусках), ограничиваются теперь в размере наравне с перечнем статей. На все три дополнительных списка действуют правила выбора страницы и числа ссылок на одной странице, то есть по умолчанию показаны первые 10 строк каждого списка, но второй странице - с 11 по 20 и так далее.

До встречи, Ваш Александр Левченя
Адрес сайта: http://hotlinks.ru
Электронная почта: webmaster@hotlinks.ru



http://subscribe.ru/
E-mail: ask@subscribe.ru
Отписаться
Убрать рекламу

В избранное