Програма за висококачествено сканиране на документи. WinScan2PDF - сканиране в PDF формат

Вероятно всеки е запознат със ситуацията, когато сканиране на документ, например страница от книга, трябва да бъде преобразувано в печатен текст. За това има специални програми, но повечето от тях са известни на много малко хора. На устните на всички може би само ABBYY FineReader. Наистина, FineReader е извън конкуренцията. това най-добрата програмаза сканиране и разпознаване на текст на руски, но се произвежда изключително в платени версиии е доста скъпо. Колко хора са готови да платят почти 7000 рубли за най-бюджетния лиценз, ако планират да обработват една или две книги годишно?

Ако смятате, че закупуването на скъп търговски продукт е неоправдано, защо не използвате аналози, някои от които са безплатни? Да, те не са толкова богати на функции, но се справят доста успешно с много задачи, с които според мнозина само FineReader може да се справи. Така че нека да разгледаме някои от наличните алтернативи. И в същото време нека да видим как се различават от общоприетия стандарт.

За да сравним други програми с ABBYY FineReader, нека разберем защо е толкова добър. Ето списък на основните му функции:

  • Работа със снимки, сканирани и хартиени документи.
  • Редактиране на съдържанието на pdf файлове - текст, отделни блокове, интерактивни елементии други неща.
  • Конвертиране на pdf в Microsoft форматДума и обратно. Създавайте pdf файлове от всякакви текстови документи.
  • Сравнете съдържанието на документи на 35 езика, например сканирани хартиени и електронни (не във всички издания).
  • Разпознаване и конвертиране на сканирани текстове, таблици, математически формули.
  • Автоматично изпълнение на рутинни операции (не във всички издания).
  • Поддържа 192 национални азбуки.
  • Проверка на правописа на разпознат текст на руски, украински и 46 други езика.
  • Поддържа 10 графични и 10 текстови файлови формата, без да се включва pdf.
  • Запазване на файлове в графичен и текстови формати, а също и във формата електронни книги EPUB и FB2.
  • Четене на баркодове.
  • Интерфейс на 20 езика, включително руски и украински.
  • Мажоритарна подкрепа съществуващи моделискенери.

Възможностите на програмата са отлични, но за домашни потребители, които не обработват документи в индустриален мащаб, те са излишни. Въпреки това, за тези, които трябва да разпознаят само няколко страници, ABBYY предоставя услуги безплатно - чрез уеб услугата FineReaderOnline. След регистрация можете да обработвате 10 страници сканиран или фотографиран текст, а след това 5 страници на месец. Повече - срещу допълнително заплащане.

Цената на най-евтиния лиценз FineReader за инсталиране на компютър е 6990 рубли (стандартна версия).

Малка и изключително проста безплатна помощна програма, разбира се, не е в състояние да се конкурира с чудовището, но решава основната задача - разпознаването на сканиран текст - както се очаква. Освен това, за това дори не изисква инсталиране на компютър (преносим). И се управлява само с три бутона.

За да разпознаете текст с помощта на WinScan2PDF, щракнете върху „Избор на източник“ и посочете свързания скенер (програмата, за съжаление, не работи с готови файлове). Поставете документа си в скенера и щракнете върху Сканиране. Ако искате да отмените операцията, щракнете върху Отказ. Това са всички инструкции.

Помощната програма поддържа 23 езика, включително руски, и работи с многостранични файлове. Готовият резултат се записва в pdf формат, сканира се документът в jpg.

Уеб услуга Free-OCR.com

Free-OCR.com (OCR - Optical character recognition) е безплатна интернет услуга за разпознаване на сканирани или фотографирани текстове, записани във формат на графично изображение (jpg, gif, tiff, bmp) или pdf. Поддържа 29 езика, включително руски и украински, като потребителят може да избере не един, а няколко, ако изходният текст ги съдържа.

Free-OCR не изисква регистрация и няма ограничения за броя на качените документи. Единствено размерът на файла е ограничен - до 6 Mb. Услугата не обработва многостранични документи по-точно, игнорира всичко с изключение на първия лист.

Скоростта на разпознаване на сканиран текст е доста висока. Лист А4 с фрагмент от книга на руски беше обработен за около 5 секунди, но качеството не беше задоволително. Големи шрифтове- като в детските книжки разпознава 100%, а средните и малките - около 80%. При англоезичните документи нещата са малко по-добри - малкият и нискоконтрастен шрифт се разпознава правилно с около 95%.

Безплатна онлайн OCR уеб услуга

- друга безплатна уеб услуга, много подобна на предишната, но с разширена функционалност. Той:

  • Поддържа 106 езика.
  • Обработва многостранични документи, включително такива на няколко езика.
  • Разпознава текстове на сканирания и фотодокументи от много видове. В допълнение към 10 графични формата на изображения, той обработва документи pdf, djvu, doxc, odt, zip архивиИ компресирани файлове Unix.
  • Записва изходни файлове в един от 3 формата: txt, doc и pdf.
  • Поддържа разпознаване математически уравнения.
  • Позволява ви да завъртите изображението на 90-180° в двете посоки.
  • Разпознава правилно текст в няколко колони на една страница.
  • Може да разпознае един избран фрагмент.
  • След обработка предлага копиране на файла в клипборда, изтегляне на вашия компютър, качване в услугата Google Документиили да го публикувате в Интернет. Също така е възможно незабавно да преведете текста на друг език с помощта на Google Translateили Bing Translator.

Трябва да отдадем дължимото на Free Online OCR за факта, че чете изображения с ниска разделителна способност и нисък контраст доста добре. Резултатът от разпознаването на всички текстове на руски език, които му бяха дадени, беше 100% или близо до него.

Безплатният онлайн OCR според нас е един от най-добрите алтернативи FineReader, но безплатно обработва само 20 страници (макар че не е посочено за какъв период). По-нататъшна употребаУслугата струва от $0,5 на страница.

Microsoft OneNote

Програмата за водене на бележки Microsoft OneNote, с изключение на много старата и последна версия 17, също съдържа OCR функционалност. Не е толкова напреднал, колкото в специализирани приложения, но и използваем, ако няма други опции.

За да разпознаете текст от изображение с помощта на OneNote, вмъкнете изображението във файла („Картина“ - „Вмъкване“), щракнете върху него десен ключмишката и изберете „Копиране на текст от картина“.

След това поставете копирания текст навсякъде в бележката.

По подразбиране езикът за разпознаване е настроен на английски. Ако имате нужда от руски или друг, променете настройката ръчно.

Качеството на разпознаването на руски текст в Microsoft OneNote оставя много да се желае, така че не може да се нарече пълна замяна на FineReader. И е много неудобно да обработвате големи многостранични документи в него.

SimpleOCR

стари безплатна програма SimpleOCR също е много приличен инструмент за разпознаване на текст с електронни изображенияи сканира, но, за съжаление, без поддръжка на руски език. Но има уникална функция за четене на ръкописни думи, както и редактор, който ви позволява да коригирате грешки, преди да запазите готовия резултат.

Други функции на SimpleOCR:

  • Проверка на правописа с възможност за ръчно актуализиране на речника.
  • Четене на документи с ниска разделителна способност и с маркировки (има опция за изчистване на „шума“).
  • Най-близкият възможен избор на шрифтове и прехвърляне на стилове на писане (удебелен шрифт, курсив). Ако желаете, функцията може да бъде деактивирана.
  • Едновременна обработка на няколко листа или отделен фрагмент.
  • Избор възможни грешкив готовия текст за ръчна редакция.
  • Поддържа много модификации на скенери.
  • Входни формати на електронни документи: tif, jpg, bmp, ink, както и сканирания.
  • Запазване на готовия текст в txt форматии док.

Качеството на разпознаване както на печатни текстове, така и на ръкописи е доста високо.

Програмата може да се нарече универсална, ако не беше ограничената езикова поддръжка. Последна версияПоддържа само английски, френски и датски; вероятно няма планове за добавяне на други. Интерфейсът е изцяло на английски, но е лесен за разбиране. Освен това в главния прозорец има бутон „Демо“, който стартира обучително видео за работа със SimpleOCR.

Програмата на белгийската компания за разработка I.R.I.S наистина е истински конкурент на руския ABBYY FineReader. Мощен, бърз, междуплатформен, базиран на собствения OCR двигател, използван от Adobe, HP и Canon, той перфектно разпознава дори най-трудните за четене текстове. Поддържа 137 езика, включително руски и украински.

Характеристики и функции на Readiris:

  • Най-много висока скоростобработката на файлове сред приложения от този клас е предназначена за големи обеми.
  • Запазване на форматирането на изходния текст (шрифтове, размер, стил на писане).
  • Неженен и пакетна обработкафайлове, поддръжка на многостранични документи.
  • Разпознаване на математически уравнения, специални знации баркодове.
  • Изчистване на текст от „шум“ - линии, петна и др.
  • Интеграция с различни облачни услугиGoogle Документи, Evernote, Dropbox, SharePoint и някои други.
  • Подкрепа за всички модерни моделискенери.
  • Формати за входни данни: pdf, djvu, jpg, png и други, в които записват графични изображения, както и получени директно от скенера.
  • Изходни формати: doc, docx, xls, xlsx, txt, rtf, html, csv, pdf. Поддържа се конвертиране в djvu.

Интерфейсът на програмата е на руски език, използването е интуитивно. Той не предоставя на потребителите възможност да редактират съдържанието на pdf файлове като FineReader, но с основна задача— по наше мнение се справя добре с разпознаването на текст.

Readiris се предлага в две платени версии. Цена Професионални лицензие 99.00€, Корпоративен – 199€. Почти като ABBYY.

Freemore OCR

Freemore OCR - (! уебсайт на програмата http://freemoresoft.com/freeocr/index.phpможе да бъде блокиран от антивируси поради рекламен „боклук“, вграден в инсталатора) - друга проста, компактна и безплатна помощна програма, която също разпознава текстове добре, но по подразбиране само на английски. Други езикови пакети трябва да се изтеглят и инсталират отделно.

Други функции и възможности на Freemore OCR:

  • Едновременна работа с няколко скенера.
  • Поддържа много формати на графични данни, включително патентовани като psd (файл Adobe Photoshop). Стандартни форматиВсички графики се поддържат.
  • PDF поддръжка.
  • Запазване на готовия резултат във формат pdf, txt или docx и за експортиране на текст в Word, просто щракнете върху един бутон в лентата с инструменти.
  • Вграден редактор (за съжаление, програмата не запазва форматирането на изходния документ).
  • Преглед на свойствата на документа.
  • Отпечатайте разпознат текст директно от главния прозорец.
  • Защита с парола на pdf файлове.

На пръв поглед интерфейсът на програмата може да изглежда сложен, но всъщност е много лесен за използване. Инструментите са разделени на групи, като на лента Microsoft Office. Ако ги разгледате по-внимателно, бързо ще стане ясно предназначението на този или онзи бутон.

За изтегляне електронен документв прозореца на Freemore OCR, първо изберете неговия тип - изображение или pdf файл, след което щракнете върху съответния бутон „Зареждане“. За да започнете процеса на разпознаване, щракнете върху бутона „OCR“ в групата инструменти със същото име до изображението магическа пръчка(показано на екранната снимка).

Резултатът от сканирането на английски текстове от добре четими и трудни за четене изображения се оказа доста задоволителен. Единственото нещо, което не ми хареса беше, че заедно с програмата на компютъра се инсталират всякакви боклуци - някои фалшиви антивирусни скенери, оптимизатори и други ненужни неща, и без възможност да ги откажете по време на инсталация. С една дума, ако не беше този недостатък, приложението може да се препоръча като добро. безплатна алтернатива FineReader.

Понякога потребителите на скенери имат въпрос как да редактират сканиран документ и да конвертират неговия формат в PDF. Един от най прости начиниРешението на този проблем е да сканирате изображението и веднага да го запазите в pdf формат. За да направите това, трябва да използвате софтуера Acrobat DC, който можете да изтеглите от официалния уебсайт на разработчика или от всеки надежден уеб ресурс. Факт е, че този софтуер е операционни системи Windows и Mac OS имат поддръжка на драйвери за някои скенери.

За да запазите файл като PDF веднага след сканирането му, трябва да използвате функция, наречена Автоматично откриване цветен модел" Благодарение на това софтуеравтоматично ще открие типа съдържание на вашия документ. Освен това този софтуер предлага няколко други предварително зададени настройки.
За да изберете параметрите по свое усмотрение, трябва да използвате т.нар. "персонализирано сканиране". Но имайте предвид, че такава предварителна настройка на процеса на сканиране е достъпна само за онези драйвери на скенери, които поддържат режима на скриване на интерфейса. В Mac OS такава възможност изобщо не е предвидена. А сега повече за това как да сканирате документ в pdf формат с помощта на Acrobat:

  • Стартирайте програмата и в основния й прозорец отидете в менюто „Инструменти“.
  • Кликнете върху елемента, който предполага създаване на PDF файл, след което ще се отвори нов прозорец.
  • От левия списък изберете елемента, наречен „Скенер“, след това изберете конкретен тип устройство и изберете режима на сканиране, например „Автоматично разпознаване на цветовете“.
  • За да покажете всички настройки, щракнете върху иконата на зъбно колело вдясно.
  • След като зададете всички необходими параметри и запазите промените, щракнете върху „Сканиране“. В края ще трябва да запазите резултата от този процес.

Трябва да се добави, че ако резултатът не ви удовлетворява много, можете лесно да го подобрите или оптимизирате. За да направите това, трябва да отворите новосъздадения PDF файл от сканирания текст/снимка и да изберете елемента от менюто „Инструменти“, което предполага повишаване на качеството на сканирането. Там просто трябва да отидете на „Подобряване на качеството“ => „Сканиран документ“ и да щракнете върху иконата за настройки. Въведете необходими стойностии запазете промените си.

Преобразуване на сканиран документ в PDF формат

Ако първоначално сте запазили сканирания документ във формат, различен от PDF, например JPEG или TIFF, но в същото време трябва да го конвертирате, тогава един от най-простите и налични опциисе състои в използването на специални онлайн услуги. В допълнение, почти всички от тях работят абсолютно безплатно.

Но изберете най-добър варианттакава услуга е много трудна, т.к наистина са много. Като цяло страхотен избор този уеб ресурс: smallpdf.com. Просто трябва да кликнете върху бутона „Избор на файл“ и след това да маркирате необходим документили го изпратете до услугата, като използвате редовно плъзгане и пускане. Ако е необходимо, можете да изтеглите веднага голям бройсканирани документи - за целта до вече качения файл има бутон под формата на знак плюс.

След като изпълните всички стъпки за качване на сканирания, щракнете върху „Създаване на PDF веднага!!!“. След това ще бъдете пренасочени към нова страница, където трябва да запишете файла, като щракнете върху едноименния жълт бутон. Струва си да се добави, че тази онлайн услуга също така предоставя възможност за обединяване, разделяне и дори компресиране на PDF документи.

С помощта на специални програми

Можете също така да разрешите проблема как да конвертирате сканиран документ в pdf с помощта на специални програми и помощни програми. Чудесна опция е CutePDF, който е вид цифров принтер, който може да конвертира избран текст/изображение в PDF файл чрез натискане на бутон за печат. Тази помощна програма е истински спасител, ако вашият скенер може да записва сканирания само във формат JPG.

  • За да може този цифров принтер да конвертира файлове, трябва да изтеглите специална добавка за него - “Ghostscript”. Обикновено е достъпен за изтегляне на същата страница като самата програма CutePDF.
  • След като инсталирате и стартирате цифровия принтер, трябва да го инсталирате като системно устройство, като следвате всички съвети и препоръки.
  • Отворете всяко сканирано изображение или текст, които да бъдат конвертирани в PDF формат. За тази цел използвайте всяка програма, която поддържа изпращане на документ за печат.
  • Намерете елемента „Печат“, като първо отворите раздела „Файл“ или използвайте клавишната комбинация Ctrl+P.
  • Изберете виртуалното устройство CutePDF от списъка с налични принтери, като използвате падащото меню.
  • Дайте командата за печат, след което изберете папката, в която планирате да запишете сканирания файл, след като го конвертирате. След като щракнете върху бутона за запазване, вашият PDF документ ще бъде готов.

    Сканирането от Acrobat приема изображения в диапазона 10-3000 dpi. Когато изберете опцията Изображение с възможност за търсенеили ClearScan в секцията PDF Output Style изисква разделителна способност на изходното изображение от поне 72 dpi. В допълнение, разделителна способност на изходното изображение, по-голяма от 600 dpi, ще бъде намалена до 600 dpi или по-малко.

    Компресирането на изображения без загуба може да се извърши само върху монохромни изображения. За да компресирате сканираното изображение, без да губите качество, изберете една от следните опции в раздела Опции за оптимизиране на диалоговия прозорец Оптимизиране на сканиран PDF: следните параметри: "CCITT Group 4" или "JBIG2 (без загуби)" за монохромни изображения. Ако това изображение е добавено към PDF документ, можете да запишете файла с помощта на опцията Запазване; сканираното изображение остава некомпресирано. При спестяване PDF документИзползвайки функцията Запиши като, сканираното изображение може да бъде компресирано.

    За повечето страници сканирането в черно и бяло при 300 dpi ще даде резултат най-добри резултатиза преобразуване. При точност на резолюция 150 dpi оптично разпознаване на знациброят на грешките при разпознаване на шрифт леко намалява и се увеличава; При разделителна способност от 400 dpi и по-висока обработката се забавя и размерът на файловете с компресирани страници се увеличава. Ако страницата съдържа много неразпознати думи или текстът не е такъв голям размер(9 точки или по-малко), опитайте да сканирате на повече висока резолюция. Когато е възможно, сканирайте черно-бяло.

    Ако функцията Оптично разпознаване на знацие изключено, можете да използвате разделителна способност в диапазона 10–3000 dpi, препоръчителната разделителна способност е 72 dpi и по-висока. За параметър адаптивна компресияПрепоръчителни резолюции за сканиране: 300 dpi за изображения в сива скала и RGB и 600 dpi за черно-бели изображения.

    Страниците, сканирани в 24-битов цвят, 300 dpi, 8,5 x 11 инча (21,59 x 27,94 cm) преди компресиране, са големи изображения (25 MB). Системата може да изисква 50 MB виртуална памети повече за сканиране на изображение. При 600 dpi сканирането и обработката обикновено са четири пъти по-бавни, отколкото при 300 dpi.

    Избягвайте да регулирате настройките на смесването на полутонове и дифузия на скенера. Това може да се подобри външен вид, но ще стане трудно разпознаването на текста.

    За текстове, отпечатани на цветна хартия, се препоръчва увеличаване на яркостта и контраста с приблизително 10%. Ако вашият скенер осигурява филтриране на светлината, трябва да потискате фоновия цвят с помощта на специален филтър или лампа. Или, ако текстът не е потиснат, опитайте да регулирате контраста и яркостта на скенера, за да изчистите сканирания документ.

    Ако скенерът има ръчно управлениеяркост, регулирайте я така, че знаците да са ясни и добре оформени. Ако героите са свързани, използвайте по-високи настройки (по-ярки цветове). Ако знаците са разделени, използвайте по-ниски настройки (по-тъмен цвят).

WinScan2PDFpdf скенер за безплатно изтегляне
.
Сканирайте документи от домашния си скенер директно в PDF формат. Малко допълнение към вашия компютър за по-лесна работа със сканирани файлове.

WinScan2PDF pdf скенер е малък и проста програма, който е създаден като допълнение към скенера, който не може автоматично да конвертира данни в PDF формат. Сканираният документ се конвертира автоматично в PDF след сканиране. Програмата позволява маса PDF сканиране, тоест може да има произволен брой страници в един документ. Тази функция е особено полезна, когато потребителят преглежда многостранични документи или документи, които са свързани един с друг. Приложението е много малко по размер, образува се само един прозорец с три икони. Първият прозорец е за избор на източника, вторият е за започване на конвертирането в PDF, а третият е за завършване на работата.

WinScan2PDF предлага:

  • Сканирайте директно в PDF
  • възможност за сканиране на няколко страници в един документ
  • Програмата не се нуждае от инсталиране (преносима)
  • може да работи и от флашка
  • лесен за използване и малък по размер

Предимството на WinScan2PDF е, че е много малък размери не е необходимо потребителят да го инсталира на компютъра. Програмата дори може да се стартира от преносими устройства USB.
WinScan2PDF е многоезичен, има руски.

ИЗТЕГЛЯНЕ: (0.1 MB)


Препоръчва се за гледане:

Беше описано доста добре и подробно за този файлов формат и работата с него.
Това е доста добро, тъй като сканираните документи и файлове в крайна сметка имат по-малък размерв сравнение със сканираното изображение (около 3-5 пъти). Това е едно от предимствата му.
Вторият плюс е възможността за комбиниране на сканирани файлове в едно. Разбира се, можете да ги комбинирате в Word, но след като погледнете първия плюс, можете да откажете това. Особено ако файловете съдържат не само текст, но и изображения.

По един или друг начин, в тази статия ще разгледаме програми, специално предназначени за това необходима задача- сканиране и комбиниране на файлове в един pdf документ.

Първият е Scan2PDF, немски продукт.
Чудо, не програма. Ето предимствата му:

  • безплатно;
  • руски език на интерфейса;
  • малък размер на инсталационния/изпълним файл;
  • заема малко място по време на монтажа;
  • има преносима (не изисква инсталация) версия.
  • ви позволява да създавате PDF файлове от съществуващи изображения.

    Сред недостатъците може да се отбележи, че няма Поддръжка на Windows 8 и фактът, че не е актуализиран от 2005 г.

    И така, нека да преминем към ръководството.

    След инсталирането и стартирането ще се появи този главен прозорец на програмата:

    Веднага щракнете върху менюто Опциии изберете Опции =)


    В полето Езициизберете рускии прозорецът на програмата веднага ще се трансформира - ще бъде преведен на руски. Остава само да го затворите с бутона затвори:


    Сега програмата е на руски и е доста разбираема:


    Не мисля, че си струва да описвам предназначението на бутоните, те са ясни от изображението и изскачат подсказки.
    Работният прозорец на програмата е показан по-долу: