Отправляет email-рассылки с помощью сервиса Sendsay

Электронная книга

За 2004-01-11

[еКнига] Re: scan

Добрый вечер, Михаил и остальные участники конференции!

10.01.2004 Вы написали мне письмо:
mid:20040111005538.515***@l*****.subscribe
Тема: "[еКнига] scan"

Михаил прислал макрос мне, а я выкладываю его на хостинге для желающих:
http://users.cosmostv.by/soros/temp/makros.zip всего лишь 3 кб !

Я его еще не тестировал (куча дел).
Наверняка кому-то из участников он пригодится больше (мне так почти не
нужен, ибо я редко выполняю подобные операции и всегда делал описанное
Михаилом вручную). Поэтому комментарии о работе макроса приветствуются!

--
11.01.2004 - 22:19

Ток-лист "НАЛОГОВОЕ ПЛАНИРОВАНИЕ: вопросы и ответы"
mailto:economics.school.taxplan-sub@subscribe.ru [~ 900 участников]

Ток-лист "КОНТРОЛЛИНГ: вопросы и ответы по теории и практике"
mailto:economics.school.controlling-sub@subscribe.ru [~ 850 участников]

Ток-лист "Аспирант и Соискатель"
mailto:job.education.aspirant-sub@subscribe.ru [~ 1050 участников]

С уважением, Славников Дмитрий.
*WWW: http://slavnikov.cjb.net
E-mail: slavnikov***@t*****.by
Mobile: (+375 29) 629-30-43
ICQ: 115041944
*В начале пути отклонишься на шаг - скоро будешь на чужой дороге. (Один из принципов
контроллинга.)


--
Сейчас нас 195 человек.

-*Информационный канал Subscribe.Ru
Написать в лист: mailto:lit.book.library.ebookaccess-list@subscribe.ru
Отписаться: mailto:lit.book.library.ebookaccess--unsub@subscribe.ru

http://subscribe.ru/ mailto:ask@subscribe.ru

   "Dmitry V. Slavnikov" 2004-01-11 23:22:18 (#52133)

[еКнига] настройка файнридера и сканера

Доброго времени суток!

У моего друга возникла проблема с настройкой сканера "Gemius ColorPage-HR6X
USB" и седьмого файнридера. пожалуйста помогите разобраться.

Проблема такова:
установлен сканер. установлен файнридер версии 7.0.
после настроек всё сохраняется в файл и файл подключается к программе. все
настройки сохранены и стабильно работают кроме "показывать диалог..."

не хочет программа сохранять "использовать диалог файнридера", постоянно
перескакивает на "использовать диалог Гениус".

Шестая версия работала чётко и проблем не возникало. пробывали
переустанавливать сканер и файнридер, но данный глюк остаётся.

С уважением,
Матроскин
--
Сейчас нас 195 человек.

-*Информационный канал Subscribe.Ru
Написать в лист: mailto:lit.book.library.ebookaccess-list@subscribe.ru
Отписаться: mailto:lit.book.library.ebookaccess--unsub@subscribe.ru

http://subscribe.ru/ mailto:ask@subscribe.ru

   2004-01-11 21:05:14 (#52034)

[еКнига] ^p и другие вещи...

Здравствуйте, уважаемые участники рассылки!
Недавно в этой и других рассылках заходила речь о Word'е и, в частности, о таких
вещах, как замена символов абзацев (^p) на что-нибудь другое. Скажите, а никто
случаем не знает _всех_ служебных последовательностей такого типа (разрыв строки,
по-моему, тоже как-то обозначается...). И вообще, где обо всём этом можно узнать
поподробнее?
А на закуску вопрос педанта и буквоеда. А что, если в моём документе действительно
встречается последовательность символов ^p, а мне её ни на что заменять не надо
(например, я пишу это письмо в Word'е)?

   2004-01-11 19:08:19 (#51968)

[еКнига] Вопрос и просьба

Здравствуйте, уважаемые участники рассылки!
Меня мучает вот какой вопрос. Установил FineReader'у параметр "Не сохранять деление
на строки", а строчки при распознавании всё равно получаются короткими, как в
книжке - читать неудобно. Скажите, отчего это может быть?
И просьба к собратьям по ремеслу (филологи, лингвисты...). Скажите, ни у кого
случаем нет отсканированного Реформатского или Маслова ("Введение в языкознание")?
Обыскался везде, никак найти не могу.

   2004-01-11 19:04:09 (#51964)

[еКнига] Re: Статья с обзором трёх говорящих программ

Доброго времени суток!

Руслан, в 348-ом выпуске листа вы писали, что нашли статью "Голос мыши, или
Компьютер, читающий вслух" и дали на неё ссылку. К сожалению данная вами
ссылка у меня не работает. Пожалуйста, пришлите мне эту статью на личный
e-mail или опубликуйте её в листе, предварительно очистив от ненужных ссылок
и рекламы.

С уважением,
Матроскин
--
Сейчас нас 195 человек.

-*Информационный канал Subscribe.Ru
Написать в лист: mailto:lit.book.library.ebookaccess-list@subscribe.ru
Отписаться: mailto:lit.book.library.ebookaccess--unsub@subscribe.ru

http://subscribe.ru/ mailto:ask@subscribe.ru

   2004-01-11 15:47:25 (#51846)

[еКнига] Re: scan

Здравствуй, Михаил!
С распознаванием оглавления я борюсь следующим образом. В настройках fine
reader в разделе "форматирование" надо установить "сохранять полное
оформление текста". Правда при распознавании журнальных статей, напечатанных
в несколько колонок, этот переключатель я устанавливаю в положение "не
сохранять оформление". Иначе текст так и сохраняется в несколько столбиков,
и читать его с помощью джоуса невозможно.
Алексей.
--
Сейчас нас 195 человек.

-*Информационный канал Subscribe.Ru
Написать в лист: mailto:lit.book.library.ebookaccess-list@subscribe.ru
Отписаться: mailto:lit.book.library.ebookaccess--unsub@subscribe.ru

http://subscribe.ru/ mailto:ask@subscribe.ru

   2004-01-11 15:02:23 (#51812)

[еКнига] новости листа. правила.

Здравствуйте, уважаемые участники листа!

Через два дня нашему листу исполнится 3 месяца. Я думаю, что мало у
кого возникло сомнение в том, что предприятие это оказалось достаточно
серьёзным, а значит и требует к себе серьёзного отношения. До сих пор
я был не очень щедр на замечания, хотя поводы были. Самыми
распространёнными нарушениями были письма с излишним цитированием, а
также письма, которые не могут быть в принципе интересными больше, чем
одному участнику, которому они и адресовались. Таким образом я
следующим образом конкретизирую правила. Во-первых, запрещается
отсылать в лист письма типа "и мне...", корреспонденты, отсылающие
такие письма будут получать замечания; во-вторых же, если в письме
необходимо использовать цитирование, то его нужно вводить без
инициалов в начале строк.

Остановлюсь на последнем пункте. В листах subscribe.ru предусмотрено
faq. Думаю, что в нём нужно осветить вопрос, как избавиться от
инициалов в начале строк при цитировании. В the bat это делается в
настройках почтового ящика на вкладке "шаблоны". Там есть группа
радиокнопок, переключающих различные варианты начала строк цитаты. В
конечном счете цитата должна начинаться только со знака цитирования >
(кажется), и только с него.

Я не знаю, возможно ли настроить цитирование для отдельного адреса в
the bat, а также как настроить в этом плане outlook express. Поэтому
большая просьба, пришлите мне на личный адрес ответы на эти вопросы.
Ибо обсуждение вопросов настройки почтовых программ, а также
составления правил листов, совершенно выходит за пределы тематики
конференции. Моё же письмо воспринимайте просто как анонс изменений
правил, о которых сообщаю как ведущий листа, и не больше того..

P.S. Или на "интеграции" вопрос о почтовиках открыто обсудить?

   2004-01-11 00:55:43 (#51531)

[еКнига] scan

Здравствуйте, уважаемые участники листа!

Как-то в другом листе тоже говорили о проблемах в распознавании
текста, и один очень хороший человек отослал туда инструкцию, как
очистить текст от мусора в виде переносов и лишних абзацев и
пробелов. Хотя у
меня и не было таких проблем, когда я сканировал сам, но в чужом
самоскане такого добра встречается много. Я сейчас попробовал, и просто
пришёл в восторг. Предлагаю публике тоже ознакомиться с этим
документом.

Очень часто поподаются тексты, в которых переход на следующую строку осуществлялся
не автоматически, а с помощью клавиши Enter. В
То есть речь идёт о текстах созданныхх в досовских редакторах ? текст с разлделением
на строки.
Теперь о преобразовании такого текста в Вордовский формат:
Ну во первых, лучше всего открыть ДОСовский текст симбаговым блокнотом
и от туда перетащить его в Ворд через буфер обмена.
Потом, Первым делом нужно очистить этот текст от лишних пробелов. Я
вообще удивляюсь, что Ворд не делает этого автоматически. Это же
очевидно!
Жмёшь CTRL+H, в поле "найти" ставишь 2 пробела, табом переходишь к
полю "заменить на" и ставишь там один пробел. После этого
переключаешься в русскую или украинскую раскладку и жмёшь Альт+В -
"заменить всё". Потом подгоняешь Джос-курсор к писи-курсору и одной
строчкой выше читаешь в отчёте сколько сделано замен. Потом не
переключаясь на Писи, жмёшь Энтер и снова - Альт+В. Читаешь строку -
Ins+стрелкаВверх. Ведь Джос-курсор никуда не сдвигался и мы снова
слышим отчёт с количеством замен. Так повторяем до тех пор, пока не
будет 0 замен.
Затем очень рекомендую ещё почистить концы строк. Там могут оставаться
ненужные пробелы перед символами концов абзаца. Для этого в поле
"найти" ставим пробел и "крышка" Пи ( ^p), а в поле "заменить" ставим
просто "крышка"Пи - символ конца абзаца. Другими словами, меняем
каждую пару состоящую из пробела и символа конца абзаца просто на
конец абзаца.
Если текст сканированный, то там, скорее всего, встречаются переносы.
Их обязательно нужно убрать. Для этого заменяем все пары состоящие из
тире и символа конца абзаца на ничего, то есть в поле "заменить" ни
должно быть ровным счётом ничего. (Просто пощёлкать в нём делитом). И
"заменить всё".
Если больше ничего не нужно очищать, то жмём Esc дважды, чтобы
вернуться обратно в текст.
После этого нужно подумать, как преобразовать текст в вордовский
формат. Фишка состоит в том, чтобы правильно определить регулярный
признак конца (или начала) абзаца. Тут могут быть варианты. Если текст
набирался в досовском редакторе, то в началах абзацев ставилось по
нескольку пробелов для отступа. Теперь после пробельной чистки,
сколько бы пробелов туда не вставлялось, в начале каждого такого
абзаца остался только один пробел, А значит признаком конца абзаца
может служить парочка состоящая из символа конца абзаца и следующего
за ним пробела.
Если же текст, сканированный, то там, обычно, никаких пробелов в
началах абзацев не ставится. Однако, абзацы часто разделяются пустыми
строками. А пустая строка в нашем случае - это просто символ конца
абзаца, который стоит сразу после предыдущего символа конца абзаца. То
есть признаком служит парочка состоящая из двух подряд идущих сиволов
конца абзаца.
Ну и я придумал ещё один довольно универсальный, хотя иногда и не
совсем надёжный приём: обычно абзац заканчивается точкой. Вот пара
состоящая из точки и конца абзаца и служит, скорее всего, искомым
признаком.
Для того, тобы легче было определить характеристики и особенности
преобразуемого текста, рекомендуется включить отображение всех
символов. Легче всего это сделать на панели форматирования. Жмём Альт,
попав в меню, нажимаем Ctrl+Tab и попадаем на панель инструментов. При
этом должно произнестись что-то вроде "Создать кнопка". Потом раза 2
или 3 жмём Shift+Tab пока не попадаем на "отобразить все символы
кнопка" и щёлкаем по ней энтером. После этой операции произносятся все
пробелы и символы концов абзаца.
Если же панель форматирования по каким-то соображениям не включена, то можно
сделать это прямо через меню "Сервис" (Alt+с русское, курсор вверх на
"параметры", Входим, и идём на флажки включающие отображение непечатаемых
символов. Обычно я просто нажимаю Alt+а русское и фокус сразу оказывается на
флажке для включения символов конца абзаца и при этом сразу же его
переключает. Там же рядом и флажки для пробелов...
Определившись с признаком конца абзаца, приступаем к собственно
преобразованию.
1. заменяем признак конца абзаца на метасимвол (что-нибудь вроде "$$$"
или "$$$" - 3 доллара или два номера). Главное, чтобы таких
последовательностей не встречалось в самом тексте.
2. заменяем все символы конца абзаца на пробел. При этом текст
превращается в один сплошной абзац и Ворду становится не по себе. Он
начинает отчаянно тормозить и сучить ногами. Тут главное не впадать в
панику и быстро, но неторопясь, сделать следующюю замену.
3. Заменить наш метасимвол из первого пункта на символ конца абзаца
(Крышкапи). При этом Ворду сразу полегчает.
Ну вот, в принципе и всё. не забудь сохранить своё детище!
При желании, этого узкого места можно избежать Только при конвертации из
Доса в
Ворд. Вместо трёх замен придётся делать четыре: 1. заменяем признак
абзаца на пару, состоящую из символа доллара и символа конца абзаца
($^p);
2. заменяем просто уже один символ конца абзаца снова на те же символ
доллара и символ конца абзаца. Теперь просто концы строк у нас
выглядят как пары символов $^p, а признаки абзацев превратились в
цепочки из двух долларов и конца абзаца ($$^p);
3. Теперь заменяем два доллара ($$) на ничего, они просто исчезают;
4. Заменяем пару ($^p) на пробел.
Вот и всё! Мы обошли узкое место, у нас всё время в ходе
преобразования остаётся достаточное количество символов абзаца в
тексте.
Всех благ!
С уважением Сергей Картавцев.

Ну и под конец - как же без вопроса? Я нашёл в интернете макрос для
word'а, который улучшает качество отсканированного текста. Подскажите,
пожалуйста (можно на личный адрес), что конкретно нужно сделать, чтобы
этот макрос установить и заставить работать. Впрочем, если тема
окажется интересной не только мне, можно и в листе поговорить. Макрос
солидных размеров - больше установленного лимита на размер писем, так
что отослать непосредственно в лист его не получится. На том жду ваших
откликов.

   2004-01-11 00:55:38 (#51530)

[еКнига] scan

Здравствуйте, уважаемые участники листа!

Друзья, каждый из вас, несомненно, знает, ибо не раз испытал на собственном опыте,
как много возникает вопросов, когда осваиваешь новую технологию! Я тут, конечно,
не исключение, и у меня так и чешутся руки завалить лист своими чайничьими вопросами.
Остановлюсь, однако на самых насущных, а также самых интересных. После подписи
я приведу текст ошибки, которую постоянно выдаёт программа в процессе сканирования
и распознавания. На работе она не отражается, но всё равно замаялся нажимать
на "закрыть". Может кто сталкивался с подобными проблемами? Сканер покупали в
магазине, так что всё ПО должно быть лицензионное.

Кто читал неочень качественно отсканированные или распознанные книги, тот наверное
встречался с таким явлением, когда некорректно получается оглавление - сначала
идёт блок из названий глав, расположенных на странице, а уже после них идёт столбик
из соответствующих им страниц. От чего так происходит и как с этим бороться?
В книгах у меня всё получилось ok, но когда я сканил вопросы к экзамену, то номера
вопросов оказались в одном столбце, а сами вопросы - в другом, ну и столбцы,
конечно, друг под другом. Не хотелось бы такой радости в книгах.

Терпеливого читателя, дошедшего до этого места я порадую тем, что в следующем
писме дам информацию, как избавиться от лишнего мусора в виде лишних абзацев
и переносов в отсканированном тексте.

   2004-01-11 00:55:07 (#51529)

[еКнига] новости листа. Я снова с вами!

Здравствуйте, уважаемые участники листа!

Дорогие друзья!

Немного разгрузившись, я получил возможность выйти из тени и включиться в виртуальную
беседу. Прежде всего хочу немного рассказать о последних событиях в моей жизни,
которые прямо касаются тем нашего общения. Самое главное событие - я обзавёлся
сканером! Всё таки дедушка Мороз - замечательное явление в нашей жизни. Сканер
- hp 3970, с fine reader очень даже дружит. С момента обретения сканера я уже
оформил две книги общим объёмом более пятисот страниц. Завтра выложу их на voslib.ioso.ru,
а для тех, кто не зарегистрирован там, с удовольствием вышлю эти книги по почте.
Книги следующие:

Тадтаев Х.Б. Этнос. Нация. Раса. Национально-культурные особенности детерминации
процесса познания
Проблемы управления в сфере межнациональных отношений (предпосылки и формы разрешения
межнациональных конфликтов).

Кроме того, благодаря Ихтику и семье Васильевых моя личная библиотека безмерно
обогатилась новыми книгами, за что им огромное спасибо. Теперь постепенно буду
разбирать полученные богатства и расширять фонды собственной библиотеки. Среди
полученных материалов много научной классики, энциклопедической и справочной,
а также учебной литературы.

Теперь о планах. Предлагаю начать работу в двух направлениях. Во-первых, дать
логическое продолжение теме сканирования и от обсуждения, скажем так, аппаратной
её составляющей перейти к вопросам, относящимся непосредственно работе со сканерами
- процессу сканирования и распознавания; во-вторых же, нужно дорабатывать документацию
листа.

Более подробно о каждом вопросе я напишу в следующих письмах.

   2004-01-11 00:55:03 (#51528)