Поисковые системы представляют собой комплексные автоматизированные системы сбора, обработки, оценки и последующей выдачи информации.
На приведенной ниже схеме показана общая структура поисковых систем.
Рис. 1. Упрощенная структура поисковых систем.
Основная функциональная задача в работе ПС осуществляется с помощью специальных программ-роботов именуемых пауками или ползунами (spider, crawler). В их задачу входит выкачивание из сети веб-документов на сервер поисковика. В своей работе пауки используют специальную базу данных url (uniform resource locator), которая пополняется в автоматическом режиме при обнаружении новых входящих ссылок, а также за счет добавления через соответствующую форму - addurl. База данных url содержит все известные поисковой системе адреса веб-документов.
Частота визитов, глубина просмотра (скачивания документов) и пр. свойства программ-роботов определяются внутренними системными настройками поисковых систем. В частности, некоторые поисковики при незначительном ранге страниц ограничивают глубину индексации сайта; частота ревизита паука определяется динамикой роста и обновления ресурса.
Помимо внутренних настроек, пауки чувствительны к данным прописанных в специальном файле robots.txt и в самих документах (Standart for Robot Exclusion), определяющих права доступа и характер индексации.
Следующий этап работы ПС ложится на программу-индексатор. Теперь закаченные на сервер документы с помощью специальных алгоритмов проходят тщательную обработку - разложение на составные части, упорядочивание и внесение информации в индексную базу. Учитывается каждое слово, частота его использования в документе, место расположения и удаленность от других, учет тегов, ссылок и прочая информация. Таким образом, формируется база данных содержащая подробнейшую информацию по каждому документу.
В результате работы индексатора формируется прямой индекс, т.е. разложенное и структурированное описание каждого документа (документ = описание свойств) и обратный (инверсный) индекс - который описывает не документы, а непосредственно слова, т.е. каждому слову сопоставляется веб-документ, в котором оно встречается, его частота, удаленность и прочие характеристики (слово = документ и его свойства).
В процессе индексации происходит также сравнение всех ссылок с уже имеющейся базой url и при обнаружении новой, в начале она проверяется в службе DNS (domain name service) и затем в случае корректности заносится в основную базу и ставится в очередь на просмотр пауком.
Помимо прямого использования ссылок, они также анализируются и сопоставляются с общим индексом, в результате чего поисковики формируют внутреннюю оценку каждого документа (PR, вИЦ и пр.).
Также при индексации происходит восполнение специальной базы слов - словаря, которые поисковые системы используют при генерации результатов выдачи.
Завершающий этап работы поисковой системы является генерация результатов выдачи. Используя словарную базу, поисковик для каждого слова (запроса) формирует итоговый результат, который и получает пользователь на свой запрос. Порядок расположения в этих списках определяются свойствами определенными ПС для этих документов (релевантность, вес, дата, формат и пр.). Последующая регенерация результатов выдачи происходит только после обновления индексной базы.
«Мы предлагаем Вам возможность продвинуть Ваш сайт!»
Просто пришлите его краткое описание и он появится в рассылке. Заполнить форму »
Тем, кто уже участвует в нашей программе и держит нашу ссылку на своих страницах, я напоминаю, что повторное размещение вашей информации происходит через 5 - 6 выпусков.
Этим самым вы не только привлечете дополнительных посетителей на свой сайт, но, главное, увеличите цитируемость вашего ресурса! Все выпуски "Марио" размещаются в архивах почтовых служб. Ссылочное ранжирование, однако! Поэтому, прежде чем заполнить нашу форму хорошенько подумайте о названии ресурса, т.е. о тексте ссылки.
Сайты подписчиков
«Сайт международных знакомств. » Каталог девушек и женщин из Украины, России, Белоруссии, желающих найти друга по переписке, создать счастливую семью. Каталог мужчин из Западной Европы, США, Австралии.
«Регулируемые устройства света» Представление различных вариантов управления солнечным светом в помещении. Жалюзи на окнах предоставляет возможность легкого регулирования дневным светом в офисе и квартире, а также изменения дизайна помещения.
«АЛАС Интеллектуальная энергия» Активное оборудование, пассивное оборудование, телефония, монтажные работы, системы безопасности, ИБП постоянного тока, ИБП переменного тока, ДГУ, Аккумуляторы, Компьютеры, Ноутбуки и аксессуары. Интеллектуальное здание.
«Автозапчасти» Автозапчасти на Японские автомобили. Оптовые поставки со склада во Владивостоке.
«Представительство в России итальянских фирм "LEGEA" и "CONTE of FLORENCE"» Экипировка из Италии для игровых видов спорта : футбол, воллейбол, баскетбол, гандбол. Форма, спортивные костюмы, куртки, сумки, аксессуары. Одежда для горных лыж и гольфа "Conte of Florence".
«MAXIMUM-продажа велосипедов и велоаксессуаров» 'МАКСИМУМ' это один из крупнейших на Северо-Западе России оптовых поставщиков импортных велосипедов и велоаксессуаров.
«Фермерский бизнес» Сайт для тех, кто интересуется бизнесом фермера.
«Школа Своего Дела» Начни свое дело с нуля. Хватит работать на дядю! Система подготовки предпринимателей. Обучение происходит на практике. Результат - жизненый опыт. Сделай шаг и стань счастливым!
(Так отмечены сайты участвующие в нашем обмене)
Если у Вас возникли какие-нибудь вопросы, пожелания или предложения сотрудничества или же вы хотите узнать что-то более детальней, пишите. Задать вопрос »