Отправляет email-рассылки с помощью сервиса Sendsay

Поисковые системы

  Все выпуски  

Поисковые системы Рамблер


Здравствуйте! Если у Вас есть сайт и Вы хотите поднять его тИЦ и PR, то добавьте его в наш каталог www.katalog.skachkov.net

Описание поисковой системы   Рамблер

Рамблер - это российский поисковый робот обслуживает только сайты, находящиеся в следующих доменах первого уровня:

  • Российская Федерация: .ru, .su

  • Украина: .ua

  • Белоруссия: .by

  • Казахстан: .kz

  • Киргизия: .kg

  • Узбекистан: .uz

  • Грузия: .ge

 Чтобы Рамблер находил ваши документы необходимо соблюдать следующие правила:

  • Размер документа для роботов Рамблера составляет максимум 200 килобайт. Документы большего размера усекаются до указанной величины.

  •  Первые несколько позиций (до пяти) в результатах поиска отданы сайтам, зарегистрированных в Top100. Поисковая машина и рейтинг Рамблер Тор100 независимые системы, и регистрация в них производится раздельно.

  • Внимательно следите за соблюдением русско-латинского регистров. Ошибочно вместо русской буквы 'р' используют латинскую 'p', вместо русского 'с' - латинское 'c'.

  • Не следует также использовать невидимый текст (в котором цвет шрифта совпадает с цветом фона). На результат поиска это не отразится.

  • Комментарии в документе робот Рамблер тоже не сканирует, поэтому используйте их по прямому назначению. 

  • Целесообразно базовые понятия и ключевые для данного сайта слова  включать в следующие HTML-теги. Ниже расположены теги в порядке значимости:

<title>
<h1>...<h4>
<b>, <strong>, <u>
  • Заполняя поля мета тег "Название сайта" и "Описание" не следует вводить в них длинные перечни ключевых слов, так как при сканировании игнорируются поля <meta name="keywords"...> и все другие поля <meta...>, кроме <meta name="robots"...>. Это связано с тем, что робот Рамблер старается индексировать документ таким, каким его видит пользователь. 

  • Обрабатывает ссылки типа <a href=".../imagemap ...">, однако рекомендует поместить в текст документа конструкцию <map name="name">. Это ускорит индексацию документов.
  • Записи типа:
    <a href="directory" ...>
    и
    <a href="directory/" ...> ("слэш" в конце href)
    с точки зрения HTML являются разными ссылками. При запросе по первой ссылке робот получит редирект на вторую, а значит извлечет сам документ при обращении к вашему серверу только на следующем проходе. Тем самым замедляется индексация сайта.

  • Не индексируются части HTML, размеченные тегами <script ...> ...</script> и Macromedia Flash.
  •  Части документа, не требующие индексации, можно отделять в документе с помощью тегов <noindex> ... </noindex>. Из частей документа, размеченных этими тегами, также не будут выделены ссылки для дальнейшего обхода.
  • Исключить страницу из списка индексируемых  можно с помощью стандартного для Http механизма - посредством файла robots.txt в головной директории вашего сайта или HTML-тега <meta name="robots" ...>.

   Есть возможность организовать поиска по сайту, а также по всему Интернету на вашем сайте.

Регистрация в  Рамблер Тор100

  Регистрация сайта в интернет-рейтинге Рамблер Тор100 позволит вам регулярно получать достоверные данные о его посещаемости. Как уже упоменалось первые несколько позиций (до пяти) в результатах поиска отданы сайтам, зарегистрированных в Top100. 

Файл robots.txt

Когда робот-индексатор поисковой машины приходит на web-сайт , он прежде всего проверяет, нет ли в корневом каталоге сайта служебного файла robots.txt. Если робот обнаруживает этот документ, все дальнейшие действия по индексированию сайта осуществляются в соответствии с указаниями robots.txt. Вы можете запретить доступ к определенным каталогам и/или файлам своего сайта любым роботам-индексаторам или же роботам конкретной поисковой системы. Робот ищет robots.txt только в корневом каталоге вашего сервера. Под именем сервера здесь понимаются доменное имя и, если он есть, порт. Имя robots.txt должно быть набрано строчными (маленькими) буквами, поскольку имена интернет-ресурсов (URI) чувствительны к регистру.
    Следующий простой файл robots.txt запрещает индексацию всех страниц сайта всем роботам, кроме робота Рамблера, которому, наоборот, разрешена индексация всех страниц сайта.

# Инструкции для всех роботов
User-agent:   *
Disallow: /
# Инструкции для робота Рамблера
User-agent: StackRambler
Disallow: 
Любой файл robots.txt состоит из групп инструкций. Каждая из них начинается со строки User-agent, указывающей, к каким роботам относятся следующие за ней инструкции Disallow.
   Для каждого робота пишется своя группа инструкций. Это означает, что робот может быть упомянут только в одной строке User-agent, и в каждой строке User-agent может быть упомянут только один робот. Исключение составляет строка User-agent:*. Она означает, что следующие за ней Disallow относятся ко всем роботам, кроме тех, для которых есть свои строки User-agent.
   В каждой группе, вводимой строкой User-agent, должна быть хотя бы одна инструкция Disallow. Количество инструкций Disallow не ограничено. Строка "Disallow: /dir" запрещает посещение всех страниц сервера, полное имя которых (от корня сервера) начинается с "/dir".   Например:
"/dir.html", "/dir/index.html", "/directory.html".
  Чтобы запрещать посещение именно каталога "/dir", инструкция должна иметь вид: "Disallow: /dir/".
   Для того, чтобы инструкция что-либо запрещала, указанный в ней путь должен начинаться с "/". Соответственно, инструкция "Disallow:" не запрещает ничего, то есть все разрешает.
   В отличие от файлов robots.txt, описывающих индексацию сайта в целом, тег <meta name="Robots" content="..."> управляет индексацией конкретной web-страницы. При этом роботам можно запретить не только индексацию самого документа, но и проход по имеющимся в нем ссылкам.
      Инструкции по индексации записываются в поле content. Возможны следующие инструкции:
  • NOINDEX - запрещает индексирование документа;
  • NOFOLLOW - запрещает проход по ссылкам, имеющимся в документе;
  • INDEX - разрешает индексирование документа;
  • FOLLOW - разрешает проход по ссылкам.
  • ALL - равносильно INDEX, FOLLOW
  • NONE - равносильно NOINDEX, NOFOLLOW
Значение по умолчанию: <meta name="Robots" content="INDEX,FOLLOW">.
  В следующем примере робот может индексировать документ, но не должен выделять из него ссылки для поиска дальнейших документов:
    <meta name="ROBOTS" content="noindex, nofollow">
Имя тега, названия и значения полей нечувствительны к регистру.
   В поле content дублирование инструкций, наличие противоречивых инструкций и т.п. не допускается; в частности, значение поле content не может иметь вид "none, nofollow".
    Пустые строки допускаются между группами инструкций, вводимыми User-agent.
    Инструкция Disallow учитывается, только если она подчинена какой-либо строке User-agent - то есть если выше нее есть строка User-agent .
   Любой текст от знака решетки "#" до конца строки считается комментарием и игнорируется.

В избранное