Отправляет email-рассылки с помощью сервиса Sendsay

дуризм и поиск в инете

Доброго времени суток, всем :)

Давно обещала рассказать про поиск в инете. Тем паче, что
это один из методов познания языка, многим нюансам которого
своим примером меня научили переводчики из дискуссионного
листа переводчиков с русского и на русский - ruslant***@Y*****.com
А тут такой конкретный пример подвернулся ;)

Вот, вот - неплохо бы прежде чем заявлять, что такого слова
в языке нет - этот факт проверить. Надеюсь, Вы понимаете,
что отсутствие слова в бумажном словаре еще не означает
его отсутствие в языке?

Я согласна, что слово возможно не литературное. Но в
правилах листа нет требования изъясняться только на
литературном :)

К слову, у Даля "дурь" имеет только одно значение "гной",
а в каком-то более современном, только "наркотик" :-)

Язык - это протокол коннекта между людьми (кто-нибудь
переведите это на литературный!), т.е. основная его цель -
понимание между собеседниками. А то, что все _поняли_ это
слово (никто не спросил, а что же я имела в виду...), как
раз и означает, что слово "дуризм" существует в языке ;-p

Но логика логикой, а проверить наличие слова совсем не
сложно. Тут мы подошли к поиску в инете. И я сделаю
небольшое отступление.

Полагаю, что здесь все знают, что для поиска в инете
существуют "поисковики" - специальные программы,
которые "нюхают" существующие сайты, запоминая неким образом
содержание обнюханного, и выдают нам список сайтов
близких по "запаху" к введенной нами строки.

Каждый поисковик выбирает сайты для обнюхивания по разному.
Ни один из существующих физически не может обнюхать весь
существующий инет (и даже рунет), не говоря уже успевать
оперативно обнюхивать изменения и дополнения. Но к нашему
счастью и огорчению тоже каждая программа имеет свои
пристрастия в выборе и запоминании. А это означает, что мы
должны при поиске учитывать "пристрастия" каждой программы,
но эти пристрастия тоже эволюционируют, так как команда
создателей каждой программы старается улучшить алгоритмы
поиска и запоминания. Поэтому на данный момент единственный
способ учитывать возможности поисковиков - это регулярная
практика в поиске и обучение себя по результатам, выдаваемых
разными поисковиками.

На данный момент трока _моих_ предпочтений русского поиска
выглядит так
http://www.rambler.ru (в конце прошлого сделали качественный рывок)
http://www.google.com.ru (и качество поиска продолжает ухудшаться)
http://ya.ru (только в зоне .ru)

Это тройка наиболее общей направленности при хорошем охвате,
для слишком узких запросов, либо при необходимости наиболее
полного охвата следует использовать другие поисковики и
поиск в каталогах (другие поисковики и каталоги можно найти
спросив у вышеперечисленной тройки ;)

_Основное_ правило - ВСЕГДА искать, как минимум через два
поисковика. И те ссылки, которые у всех на первой странице,
наиболее характерны. Т.е. Вы сразу видите "правильную" фразу
Вы вели для поиска, или Ваш выбор не удачен и нужно подумать
как переформулировать вопрос. В этом большой помощник -
Рамблер. Для односложных запросов он приводит частотный список
фраз с этим словом запросов других пользователей. И вы
ориентируетесь по этому списку как дополнительному меню,
либо выбираете слова для исключения из строки поиска
(синтаксис запроса для каждого поисковика стоит распечатать
и повесить радом с компом ;)

Возвращаемся к "дуризму". Нас интересует частотный анализ
использования слова

http://www.yandex.ru/yandsearch?rpt=rad&text=%E4%F3%F0%E8%E7%EC
Результат поиска: страниц -- 241,
сайтов -- не менее 68
Статистика слов: дуризм -- 374

http://search.rambler.ru/srch?words=%C4%D5%D2%C9%DA%CD&where=1
Вы искали: дуризм, найдено сайтов: 67, документов: 100

http://www.google.ru/search?q=%E4%F3%F0%E8%E7%EC&ie=windows-1251&oe=windows-1251&hl=ru&lr=
60

Как видим, слово хотя и не очень повседневное, ощутимо присутствует в рунете.

На этом первая часть ликбеза по поиску закончена.
Далее (когда найдется хороший пример) "что делать, если
слишком много мусора" и "а почему я найти не могу"

Предложения принимаются - но должны быть связаны с топиком -
русским языком.

Ответить   Tatiana Kornienko Fri, 14 May 2004 00:06:28 +0400 (#144681)