Электронная книга (lit.book.library.ebookaccess) : Рассылка : Subscribe.Ru

← Июнь 2004 →
	1 01.06.2004 01:18:50 04:45:22 05:18:05 07:15:05 08:48:47 12:05:40 12:06:01 12:46:26 12:58:28 13:02:40 13:05:36 13:14:56 14:56:46 15:27:42 16:34:22 16:49:21 16:53:14 17:37:18 19:19:48 19:21:37 21:31:18 22:05:58 22:09:50	2 02.06.2004 00:13:29 00:45:48 01:23:01 07:21:02 09:06:35 10:18:45 10:56:36 11:32:55 12:36:17 13:31:18 13:31:48 13:32:05 13:39:44 14:09:39 14:19:09 15:17:37 15:18:27 16:06:44 16:20:19 17:40:32 17:40:52 19:16:35 20:32:40 21:18:14 21:26:54 22:07:15 22:16:20 23:13:07 23:25:15	3 03.06.2004 01:18:39 02:10:21 06:59:53 07:17:24 07:25:12 07:58:42 09:15:05 09:16:29 12:21:47 14:14:29 15:37:35 15:42:00 16:47:18 16:54:37 17:12:03 17:12:14 17:12:25 17:12:37 18:19:33 19:01:02 19:55:35 22:49:15	4 04.06.2004 06:00:13 09:48:58 15:13:40 15:48:37 16:09:43 19:27:41 19:51:48 20:20:51 20:21:07 20:56:43 22:33:16 22:57:51	5 05.06.2004 06:41:42 08:04:49 10:41:22 10:54:06 12:15:32 16:47:35 18:22:10 19:00:10 19:12:18 20:01:03 21:03:54	6 06.06.2004 00:11:49 04:16:53 10:01:38 10:19:26 10:27:06 11:26:36 11:39:52 14:17:12 14:55:48 21:00:15 21:43:30
7 07.06.2004 06:24:28 09:33:10 10:04:11 10:44:32 11:11:20 18:06:30 23:25:04 23:54:40	8 08.06.2004 00:06:33 07:36:15 07:56:00 09:50:15 10:44:24 20:43:38 21:06:10 23:05:28 23:37:23	9 09.06.2004 12:41:20 13:34:46 13:46:23 15:38:33 15:48:15 17:09:14 17:34:26 18:10:35 22:34:57 23:09:41	10 10.06.2004 08:20:03 12:51:38 23:42:16	11 11.06.2004 01:30:16 07:01:03 07:50:09 09:29:50 09:49:18 15:50:44 17:44:49 22:06:56	12 12.06.2004 08:09:09 08:28:23 11:29:48 18:17:20 20:37:27 22:02:05 23:31:40	13 13.06.2004 01:19:40 06:48:21 12:10:08 13:39:55 13:58:11 14:25:49 18:24:42 22:36:20 23:26:50
14 14.06.2004 00:33:18 07:38:37 10:11:25 13:27:17 15:33:31 16:02:49 19:53:23 20:29:30 21:02:03 22:30:45 22:59:45	15 15.06.2004 01:16:51 07:24:15 13:43:07 14:04:33 22:39:06 22:44:12	16 16.06.2004 00:58:56 01:03:48 01:09:49 11:29:35 15:49:06 17:22:45 20:56:37 21:14:50 21:35:26 23:50:23	17	18 18.06.2004 00:12:53 19:13:11 22:02:16 22:02:40 22:02:40	19	20 20.06.2004 10:34:14 11:45:17 12:06:50 18:24:10 22:50:39
21 21.06.2004 00:02:21 00:06:02 01:34:08 01:48:16 09:13:16 12:33:21 14:44:20 15:09:22 18:40:25 22:43:30 23:42:29 23:55:39	22 22.06.2004 00:01:32 00:17:39 00:26:42 00:50:24 01:57:28 07:26:16 07:42:11 08:44:05 10:50:29 12:40:56 13:48:49 14:44:31 20:12:25 20:26:54 20:38:59 20:48:59 21:57:35 22:29:43 22:31:56 22:41:23 22:53:56	23 23.06.2004 10:12:24 16:19:52 16:22:14 20:15:34 22:49:29 23:46:59	24 24.06.2004 00:16:23 00:59:43 02:35:43 05:55:40 05:58:04 07:30:58 07:32:37 09:29:53 10:31:56 10:50:46 13:51:02 16:28:51 22:36:03	25 25.06.2004 00:23:08 10:33:45 17:47:33 21:23:28 22:15:17 22:22:41	26 26.06.2004 10:28:25 10:55:33	27 27.06.2004 00:00:16 00:11:48 02:35:22 13:58:53 14:22:33 14:47:17 16:57:55 19:10:10 19:37:37 22:22:51 22:42:04
28 28.06.2004 02:28:40 07:42:23 09:57:50 11:59:32 12:51:09 13:08:56 16:52:57 17:44:00 18:45:22 18:47:56 19:27:30 23:17:43	29 29.06.2004 00:34:13 07:17:24 08:27:41 08:35:24 11:46:07 12:50:14 15:43:05 15:44:58 17:14:38 22:08:13	30 30.06.2004 03:22:34 09:04:11 11:09:27 13:12:26 15:17:12

Здравствуйте!

А с русским что? Он хотя бы выделяется?
Плагин я думаю один на всех. Но мне как-то надо было сделать реферат по математике.
Была книга в бумажном виде, была она же в формате djvu. Весь материал пришлось
или
набирать или сканировать, из djvu я так ничего и не достал, хотя упорно пытался;-).

› показать цитату

Откуда такие сведения? Как-то не очень во все это вериться.
Проблема распознавания по-моему не из простых, так что решать ее
в рамках этих программ и накладно, да и бессмысленно как-то.
Даже FineReader не распознает безошибочно, значит из Акробата
текст тоже с ошибками копироваться будет? И почему тогда
именно спец. форматы? Берем файл любого графич. формата (.tiff, .jpg)
и пусть с него текст и распознает ;-)). Все так просто становиться.

Вот было мнение о том, что текст перед созданием .djvu уже был распознан
и потому доступен. Это гораздо больше походит на правду.

С уважением,
Дмитрий.

--
Дискуссионный лист "Электронная книга"
Модератор - Михаил Духонин <mihail_***@m*****.ru>
Перед вами 2118 выпуск листа, разошедшийся для 661 человек.
Постоянный адрес выпуска этого письма в архиве -
http://subscribe.ru/archive/lit.book.library.ebookaccess/msg/176825

-*Информационный канал Subscribe.Ru
Написать в лист: mailto:lit.book.library.ebookaccess-list@subscribe.ru
Отписать : mailto:lit.book.library.ebookaccess--unsub@subscribe.ru

http://subscribe.ru/ mailto:ask@subscribe.ru

Ответить

"Рожанский Дмитрий"

Wed, 23 Jun 2004 22:56:09 +0300 (#176825)

Доброй ночи, Рожанский.

Вы писали 23 июня 2004 г., 23:56:09:

› показать цитату

Интересно, только сколько я не читал - формат дежавю не сохраняет в
своих снимках распознанный текст, для того, чтобы получить текст,
который можно переносить из приложения в приложение необходимо его
распознать, и это можно сделать, только если картинку дежавю
преобразовать в формат bmp и только потом распознать.

› показать цитату

формат tiff наиболее точно сохраняет саму картинку, без всяких потерь
качества, что как раз и необходимо системам OCR. А для распознавания
русского языка есть языковые модули в Finereader. Они все встроены
(хотя может быть не во всех версиях).
А по поводу сохранения в формате дежавю распознанного текста - не
слышал :(

Ответить

Алексей

Thu, 24 Jun 2004 00:11:30 +0400 (#176840)

Hello Рожанский,

Wednesday, June 23, 2004, 10:56:09 PM, you wrote:

› показать цитату

Нет, функция выделения текста в русских документах просто становится
неактивной. Причем, это наблюдается на всех русских документах,
которые я проверял, и напротив, во всех английских документах(что я
видел) в djvu все работает отлично.

› показать цитату

Сведения, на самом деле, исключительно из наблюдений и попыток
копировать текст, и, скорее всего, я действительно переборщил с OCR :)

› показать цитату

Да, скорее всего, так оно и есть. И по поводу .pdf ,наверное, та же
история.

› показать цитату

Я, кстати, наблюдал такие ошибки в Акробате. Видимо, изначально эти ошибки были
при распознавании и создании документа.

› показать цитату

Вот есть такой очень неплохой словарь Babylon (www.babylon.com). Так
вот он точно использует OCR при захвате текста( там даже есть
регулировка оптимизации OCR), и это очень удобно для "неберущихся
слов". Весь процесс ,включая перевод, длится, как правило, не больше
секунды. Так что там распознавание работает уже давно и очень успешно.

А с .pdf и .djvu все-таки надо будет разобраться ,хотя бы в общих
чертах.

Ответить

Igor

Wed, 23 Jun 2004 23:56:27 +0300 (#176857)

Hello Igor,

Thursday, June 24, 2004, 2:56:27 AM, you wrote:

› показать цитату

процесс создания djvu-файла с возможностью поиска на русском
языке описан на
http://home.farlep.net/~roman/books/djvu_ocr.html

англоязычные же djvu-файлы со встроенным распозннаным текстом
создаются с помощью "родного" ПО для создания djvu-файлов -
DjVu_Editor 4.0

И, насчет, наличия распознанного текста в djvu файлах - он может
быть а может и не быть - все зависит от желания того, кто делал
этот файл. То есть отсканированное изображение есть всегда,
а распознанный текст добавляется по желанию автора файла.

В pdf-файлах же мы имеем или текст или изображения (хотя могут
быть и экзотические варианты, когда половина страниц - текст,
другая сканы Ж-) итп).

С уважением,
Сергей Утляков.

--
Дискуссионный лист "Электронная книга"
Модератор - Михаил Духонин <mihail_***@m*****.ru>
Перед вами 2124 выпуск листа, разошедшийся для 663 человек.
Постоянный адрес выпуска этого письма в архиве -
http://subscribe.ru/archive/lit.book.library.ebookaccess/msg/176935

-*Информационный канал Subscribe.Ru
Написать в лист: mailto:lit.book.library.ebookaccess-list@subscribe.ru
Отписать : mailto:lit.book.library.ebookaccess--unsub@subscribe.ru

http://subscribe.ru/ mailto:ask@subscribe.ru

Ответить Sergey Utlyakov Thu, 24 Jun 2004 09:33:58 +0600 (#176935)

Привет!

› показать цитату

А что такое OCR?

Елена

--
Дискуссионный лист "Электронная книга"
Модератор - Михаил Духонин <mihail_***@m*****.ru>
Перед вами 2125 выпуск листа, разошедшийся для 663 человек.
Постоянный адрес выпуска этого письма в архиве -
http://subscribe.ru/archive/lit.book.library.ebookaccess/msg/176936

-*Информационный канал Subscribe.Ru
Написать в лист: mailto:lit.book.library.ebookaccess-list@subscribe.ru
Отписать : mailto:lit.book.library.ebookaccess--unsub@subscribe.ru

http://subscribe.ru/ mailto:ask@subscribe.ru

Ответить

Элена Ваурлэ

Thu, 24 Jun 2004 07:35:41 +0400 (#176936)

Привет!

› показать цитату

Елена, как было сказано выше "OCR - оптическое
распознавание ... Текста" Иными словами, это когда сканаешь книжки,
распознаешь и отправляешь в WORD/ Примерно так

--
Дискуссионный лист "Электронная книга"
Модератор - Михаил Духонин <mihail_***@m*****.ru>
Перед вами 2126 выпуск листа, разошедшийся для 663 человек.
Постоянный адрес выпуска этого письма в архиве -
http://subscribe.ru/archive/lit.book.library.ebookaccess/msg/177001

-*Информационный канал Subscribe.Ru
Написать в лист: mailto:lit.book.library.ebookaccess-list@subscribe.ru
Отписать : mailto:lit.book.library.ebookaccess--unsub@subscribe.ru

http://subscribe.ru/ mailto:ask@subscribe.ru

Ответить

"<Дэнил>"

Thu, 24 Jun 2004 09:32:46 +0400 (#177001)

Привет всем!

› показать цитату

Спасибо. В моей голове многое прояснилось.
Кстати, попробуйте так скопировать: опция Выделить всё (Select All), потом
Ctrl+Insert (это копирование), а потом вставить в Word или ещё куда-нибудь.
Относительно обсуждаемых форматов. Получится? В моём pdf-файле это
сработало.

Елена

--
Дискуссионный лист "Электронная книга"
Модератор - Михаил Духонин <mihail_***@m*****.ru>
Перед вами 2127 выпуск листа, разошедшийся для 663 человек.
Постоянный адрес выпуска этого письма в архиве -
http://subscribe.ru/archive/lit.book.library.ebookaccess/msg/177050

-*Информационный канал Subscribe.Ru
Написать в лист: mailto:lit.book.library.ebookaccess-list@subscribe.ru
Отписать : mailto:lit.book.library.ebookaccess--unsub@subscribe.ru

http://subscribe.ru/ mailto:ask@subscribe.ru

Ответить

Элена Ваурлэ

Thu, 24 Jun 2004 10:34:16 +0400 (#177050)

← Июнь 2004 →
	1 01.06.2004 01:18:50 04:45:22 05:18:05 07:15:05 08:48:47 12:05:40 12:06:01 12:46:26 12:58:28 13:02:40 13:05:36 13:14:56 14:56:46 15:27:42 16:34:22 16:49:21 16:53:14 17:37:18 19:19:48 19:21:37 21:31:18 22:05:58 22:09:50	2 02.06.2004 00:13:29 00:45:48 01:23:01 07:21:02 09:06:35 10:18:45 10:56:36 11:32:55 12:36:17 13:31:18 13:31:48 13:32:05 13:39:44 14:09:39 14:19:09 15:17:37 15:18:27 16:06:44 16:20:19 17:40:32 17:40:52 19:16:35 20:32:40 21:18:14 21:26:54 22:07:15 22:16:20 23:13:07 23:25:15	3 03.06.2004 01:18:39 02:10:21 06:59:53 07:17:24 07:25:12 07:58:42 09:15:05 09:16:29 12:21:47 14:14:29 15:37:35 15:42:00 16:47:18 16:54:37 17:12:03 17:12:14 17:12:25 17:12:37 18:19:33 19:01:02 19:55:35 22:49:15	4 04.06.2004 06:00:13 09:48:58 15:13:40 15:48:37 16:09:43 19:27:41 19:51:48 20:20:51 20:21:07 20:56:43 22:33:16 22:57:51	5 05.06.2004 06:41:42 08:04:49 10:41:22 10:54:06 12:15:32 16:47:35 18:22:10 19:00:10 19:12:18 20:01:03 21:03:54	6 06.06.2004 00:11:49 04:16:53 10:01:38 10:19:26 10:27:06 11:26:36 11:39:52 14:17:12 14:55:48 21:00:15 21:43:30
7 07.06.2004 06:24:28 09:33:10 10:04:11 10:44:32 11:11:20 18:06:30 23:25:04 23:54:40	8 08.06.2004 00:06:33 07:36:15 07:56:00 09:50:15 10:44:24 20:43:38 21:06:10 23:05:28 23:37:23	9 09.06.2004 12:41:20 13:34:46 13:46:23 15:38:33 15:48:15 17:09:14 17:34:26 18:10:35 22:34:57 23:09:41	10 10.06.2004 08:20:03 12:51:38 23:42:16	11 11.06.2004 01:30:16 07:01:03 07:50:09 09:29:50 09:49:18 15:50:44 17:44:49 22:06:56	12 12.06.2004 08:09:09 08:28:23 11:29:48 18:17:20 20:37:27 22:02:05 23:31:40	13 13.06.2004 01:19:40 06:48:21 12:10:08 13:39:55 13:58:11 14:25:49 18:24:42 22:36:20 23:26:50
14 14.06.2004 00:33:18 07:38:37 10:11:25 13:27:17 15:33:31 16:02:49 19:53:23 20:29:30 21:02:03 22:30:45 22:59:45	15 15.06.2004 01:16:51 07:24:15 13:43:07 14:04:33 22:39:06 22:44:12	16 16.06.2004 00:58:56 01:03:48 01:09:49 11:29:35 15:49:06 17:22:45 20:56:37 21:14:50 21:35:26 23:50:23	17	18 18.06.2004 00:12:53 19:13:11 22:02:16 22:02:40 22:02:40	19	20 20.06.2004 10:34:14 11:45:17 12:06:50 18:24:10 22:50:39
21 21.06.2004 00:02:21 00:06:02 01:34:08 01:48:16 09:13:16 12:33:21 14:44:20 15:09:22 18:40:25 22:43:30 23:42:29 23:55:39	22 22.06.2004 00:01:32 00:17:39 00:26:42 00:50:24 01:57:28 07:26:16 07:42:11 08:44:05 10:50:29 12:40:56 13:48:49 14:44:31 20:12:25 20:26:54 20:38:59 20:48:59 21:57:35 22:29:43 22:31:56 22:41:23 22:53:56	23 23.06.2004 10:12:24 16:19:52 16:22:14 20:15:34 22:49:29 23:46:59	24 24.06.2004 00:16:23 00:59:43 02:35:43 05:55:40 05:58:04 07:30:58 07:32:37 09:29:53 10:31:56 10:50:46 13:51:02 16:28:51 22:36:03	25 25.06.2004 00:23:08 10:33:45 17:47:33 21:23:28 22:15:17 22:22:41	26 26.06.2004 10:28:25 10:55:33	27 27.06.2004 00:00:16 00:11:48 02:35:22 13:58:53 14:22:33 14:47:17 16:57:55 19:10:10 19:37:37 22:22:51 22:42:04
28 28.06.2004 02:28:40 07:42:23 09:57:50 11:59:32 12:51:09 13:08:56 16:52:57 17:44:00 18:45:22 18:47:56 19:27:30 23:17:43	29 29.06.2004 00:34:13 07:17:24 08:27:41 08:35:24 11:46:07 12:50:14 15:43:05 15:44:58 17:14:38 22:08:13	30 30.06.2004 03:22:34 09:04:11 11:09:27 13:12:26 15:17:12

Электронная книга

Статистика

Ответы: