forum.englishteacher.ru

Болталка => Обо всем понемногу => Тема начата: ксандр от 14 Май 2010, 09:49



Название: быстрое сканирование
Отправлено: ксандр от 14 Май 2010, 09:49
научите. пожалуйста, как можно быстро отсканировать скачанный текст (в DJVU )?
или только постранично? имеется Finereader 8.


Название: Re: быстрое сканирование
Отправлено: Milika от 14 Май 2010, 09:59
Не поняла: что значит отсканироварь скачанный текст? Распознать?


Название: Re: быстрое сканирование
Отправлено: ксандр от 14 Май 2010, 10:05
виноват,отсканировать страницы скачанного учебника (любого английского)


Название: Re: быстрое сканирование
Отправлено: WS aka CE от 14 Май 2010, 15:32
Не поняла: что значит отсканироварь скачанный текст? Распознать?

Он имеет в виду - обработать OCR, перевести в текстовый формат, точнее - в формат DJVU. Тут неверно используется терминология. Сканировать - значит перевести в электронный (обычно - графический) формат. Если удается "скачать", то сканирование уже кем то выполнено. Тогда возникает вопрос насколько качественно оно выполнено, какими OCR средствами можно воспользоваться, оценить такие параметры как DPI), etc.


Название: Re: быстрое сканирование
Отправлено: polinomus от 14 Май 2010, 16:21
Если надо получить из книги в формате DJVU текст, который можно копировать, править (т.е. форматы DOC, TXT, PDF), то последние версии FineReader (у меня 10) открывают DJVU целиком, виртуально сканируют его, распознают и переводят в разные форматы (ну как и со страничками, полученными со сканера).
Чтобы открыть djvu книгу в меню Файл - Открыть PDF/изображение, выберите необходимый тип файла и открывайте, на здоровье. Запуститься процесс сканирования и через некоторое время будут открыты все страницы документа в виде одного пакета.


Название: Re: быстрое сканирование
Отправлено: WS aka CE от 14 Май 2010, 21:46
Тут другая проблема.

У него есть сканы текстового документа, вероятно - страниц англоязычного текста (или сочетания текстов на русском и английском) в формате JPG, BMP, или аналогичном.

Требуется перегнать текст с этих "фото" в файл формата DJVU. Постраничное распознавание отнимает слишком много времени, требуется ускорить этот процесс.

В его распоряжении имеется FineReader 8.


Название: Re: быстрое сканирование
Отправлено: polinomus от 15 Май 2010, 07:03
FineReader в djvu, насколько я знаю, не перегоняет, 8 версия так точно.
Я бы
1. через Файл - Открыть PDF/изображение загрузил все рисунки страниц в FineReader (хорошо если они находятся в одной папке и проименованы так, что их можно последовательно расположить по именам, тогда в окне "открыть файл" выделяем сразу все страницы и загрузиться пакет с ненарушенным порядком страниц).
2. при необходимости - обрезка, выделение блоков и другой макияж
3. выделить все страницы и распознать
4. сохранить результат в word или pdf, в зависимости от предпочтений и того, что будем делать дальше.
5. В принципе электронная книга готова, но если мы хотим djvu (он теперь нам нужен только в том случае, если текст не распознавался, а блоки текста были рисунками, тогда при перегонке в djvu можно выйграть на размере (в мегабайтах) полученной книги. Для преобразования в djvu используем виртуальный принтер DjvuPrinter от LizardTech интернет сервис http://any2djvu.djvuzone.org/, который позволяет перегнать многие форматы в djvu.

Софт для djvu: http://www.djvu-soft.narod.ru/soft/


Название: Re: быстрое сканирование
Отправлено: ксандр от 17 Май 2010, 09:17
следует сначала поблагодарить,Спасибо всем! теперь разберусь.
Автор: WS aka CE Требуется перегнать текст с этих "фото" в файл формата DJVU. Постраничное распознавание отнимает слишком много времени, требуется ускорить этот процесс.
вот это мне и надо,разрешите обратиться и позже.


Название: Re: быстрое сканирование
Отправлено: ксандр от 17 Май 2010, 12:23
позвольте продолжить, возьмём ,например, словарь Oxford-kid , 
1)если я подпишу английскую транскрипцию к словам данного пособия(для  личного пользования),это наказуемо?
2) данный словарь открывает программа WinDjView и дальше дело не двигалось. сегодня начинаю использовать Ваш опыт.
3) 10 версии FineReader пока не имею.
4) для меня это всё новое и сложно, но уж очень интересно.
5) и с терминологией у меня ....
 



Название: Re: быстрое сканирование
Отправлено: ксандр от 20 Май 2010, 10:14
polinomus и форумчане ! FineReader  10 выполняет уже все мои желания.merci.подскажите ,пожалуйста, как лучше сохранять параметры  вновь полученных страниц ,вероятно, это производится перед отправкой в Word (сомневаюсь, что правильно задаю вопрос)