Отправляет email-рассылки с помощью сервиса Sendsay
  Все выпуски  

Новости портала "Горячие ссылки"


     Здравствуйте!

      Приветствую читателей новостей проекта "Горячие ссылки". В данный момент у рассылки следующее количество подписчиков: 953.

В нескольких предыдущих выпусках рассылки подведены итоги работы различных сервисов проекта за последние годы, целью этих обсуждений было сделать выводы о путях дальнейшей модернизации динамических страниц. Теперь можно рассказать собственно о реализованных изменениях. Отметим технический аспект: во все скрипты добавлено принудительное отключение от базы данных по окончании работы, это действие должно повысить надежность работы системы.

  1. Интернет-журнал "ГАДский вестник", точнее, его интерактивное оглавление подверглось наименьшим изменениям, на самом деле они малозаметны для пользователя. Текстовый поиск по описаниям материалов Журнала реализован на основе механизма т.н. полнотекстового поиска в базе данных MySQL, работает это так же, как реализованный несколько позже поиск в Каталоге сайтов - чему посвящен отдельный раздел в документации по Каталогу.
  2. Рейтинги "20 лучших" подверглись модернизации следующими по очереди. Здесь обновлений уже больше:
  • Из таблиц рейтингов удалены неиспользуемые строки:
    Рейтинг
    TopXX
    Top20
    TopRef
    Удалено строк
    739
    33
    369
    Доля общего числа
    2.3%
    0.4%
    1.4%
  • В рейтинге сайтов Интернет TopXX для ускорения загрузки страницы заблокирован отдельный текстовый поиск по доменам (доменным именам второго уровня) и зонам (доменным именам второго уровня). Переход в каталог при выводе информации о конкретном сайте выполняется через корректный поиск домена (исключены лишние ответы). После удаления из таблицы данных доменов, с которых зарегистрировано менее 5 запросов, размер таблицы сократился еще на 40%:
    Число запросов
    1
    2
    3
    4
    Число строк
    6935
    3286
    1276
    824
  • В рейтинге файлов проекта Top20 для ускорения загрузки страницы заблокирован отдельный текстовый поиск по типам файлов (по расширениям) и папкам сервера (разным тематическим материалам проекта). Кроме того, за счет удаления лишних записей число строк в таблице данных сокращено на 12%.
  1. Оптимизирована работа системы рейтингования сайтов посредством размещения кнопки-счетчика с логотипом проекта "Горячие ссылки" и числовыми параметрами конкретного сайта:
  • Таблица данных о запросах к счетчику оптимизирована (проиндексирована). Кроме того, теперь числа на кнопке определяются именно по ней, что ускорит отображение кнопки.
  • Из таблицы удалено 77 ошибочных (пустых) записей (это 1% от общего числа). Окончательно, из 6832 участников рейтинга 60% - зарегистрированные в Каталоге сайты.
  • Информация о принципах рейтинговой оценки, кроме ее предоставления при регистрации в Каталоге сайтов, добавлена в соответствующую статью о рейтингах.
  1. Наибольшее число изменений коснулись Каталога сайтов:
  • Проведена очистка основной таблицы данных от дублирующихся записей, причем проверка дублирования при регистрации реализована так, что впредь повторение URL, заголовка или описания просто невозможно. В таблице перечислено, сколько ссылок было в базе данных до проверки, сколько удалялось по той или иной причине и сколько в конце концов осталось:
    Проверка дублей Ссылок перед проверкой
    65532
    URL Дублирующиеся
    976
    Удалено лишних ссылок
    2407
    Максимальное число повторов
    12
    Заголовки (после URL) Дублирующиеся
    99
    Удалено лишних ссылок
    352
    Максимальное число повторов
    11
    Описания (после заголовков) Дублирующиеся
    93
    Удалено лишних ссылок
    >300
    Максимальное число повторов
    9
    Ссылок без описания
    224
    Ссылок после проверок
    63190 (-4%)

    Наиболее часто повторявшиеся заголовки:
    Заголовок
    Число повторов
    http://
    11
    Доска объявлений
    8
    No title
    7
    Интернет-магазин
    7
    Служба знакомств
    6
    Знакомства
    6
    Иммиграция в Канаду
    5
    Домашняя страничка
    5

Некоторые изменения произошли непосредственно в интерфейсе Каталога:

  • Работа программ-скриптов, генерирующих динамические страницы Каталога, по возможности оптимизирована - если вдаваться в технические подробности, там где можно, сокращено число запросов к базе данных; в результате, загрузка страниц должна происходить быстрее.
  • Исправлены ошибки, связанные с уходом от организации интерфейса посредством фреймов - в результате иногда происходила "потеря" некоторых параметров при выборе режима отсева ссылок. Например, при выборе конкретного тематического раздела и появлении ссылок из него в списке справа дерево слева "складывалось", пряча раскрытые группы разделов. При изменении количества ссылок, отображаемых на странице (форма справа), дерево разделов также сворачивалось. Теперь этого не происходит, и при выборе тех или иных параметров не происходит изменения внешнего вида тех частей страницы, на которые эти параметры непосредственно не влияют.
  • Временно отключена система отсылки сообщений авторам зарегистрированных в Каталоге сайтов, позволявшая прямо со страниц Каталога отправить письмо по электронной почте. Система работала неэффективно, а в силу своей привлекательности для взлома и последующего использования для спама (массовой рассылки нежелательных сообщений) излишне загружала наш сервер. Возможно, именно она вызвала серьезные технические проблемы, из-за которых и отмечены перебои в работе "Горячих ссылок". Теперь подозрительный сервис заблокирован, проблем с ним больше не будет.
  • Как и было обещано в предыдущих выпусках рассылки, из интерфейса поиска-отбора ссылок убраны параметры регистрирозависимого текстового поиска, выбора только доменных имен и выбора тех текстовых полей, по которым производится поиск. Сам поиск организован на основе механизма полнотекстового поиска в базе данных MySQL, документированного на вышеупомянутой странице.
  • Есть изменения, не важные для пользователя каталога и мало для него заметные: введено понятие идентификационного номера регистрируемого в Каталоге сайта, что оптимизирует и ускоряет работу Каталога, а также защищает от появления дублирующихся записей в нем.
  • Изменились некоторые условия ежедневного автоматического обновления таблиц баз данных: в таблицу сайтов - "Лидеров" (участников рейтинга TopXX) попадают только участники с положительным значением рейтинга как минимум больше месяца, то есть отсев стал жестче; одно время полностью бездействовавшая ежедневная автоматическая проверка доступности ссылок включена, но проверяются только сайты - участники Рейтинга. Еще несколько модернизаций ежедневной автоматики остаются за рамками рассылки, такие сугубо технические аспекты никого не интересуют.

Другое изменение не важно и незаметно, но так же оптимизирует и ускоряет: это внесение информации об ошибках регистрации в Каталоге не в текстовый файл протокола, а в особую таблицу Базы данных, не доступную для клиентов Каталога. Опять же, все оптимально и быстрее.

Кроме того, на сайте проведены следующие обновления:

  • Обновлены страницы архива рассылки, фактически представляющего собой документацию по принципам работы с каталогом и рейтингами.
  • Перечень важнейших требований к регистрируемым ссылкам выделен на справочной странице с информацией о заполняемых полях формы регистрации.

Кроме того, в процесс "ремонта" Каталога обнаружилось, что уже более полугода назад по техническим причинам прекратился поток ссылок от системы их автоматической регистрации 1PS.Ru. Ошибка исправлена, мы включены обратно в процесс работы системы регистрации, так что поток ссылок возобновился.

Таковы итоги многомесячной работы, будем ждать следующих новостей.

     Ваш Александр Левченя
      Адрес сайта: http://hotlinks.ru
      Электронная почта: webmaster@hotlinks.ru


В избранное