Помогнете на развитието на сайта, споделяйки статията с приятели!

Поздрави на всички читатели на блога!

Мисля, че тези, които често работят на компютър (не играе, т.е. работи), трябваше да се справят с текстовото разпознаване. Е, например, сте сканирали пасаж от книгата и сега трябва да вмъкнете тази част в документа. Но сканираният документ е картина и имаме нужда от текст - за това, тогава са необходими специални програми и онлайн услуги за разпознаване на текст от снимки.

За програмата за признаване вече написах в предишни публикации:

- сканиране на текст и разпознаване в FineReader (платена програма);

- работа в аналоговия FineReader - CuneiForm (безплатна програма).

В същата статия бих искал да се съсредоточа върху онлайн услугите за разпознаване на текст. В края на краищата, ако трябва бързо да получите текста с 1-2 снимки - няма смисъл да се притеснявате с инсталирането на различни програми …

Важно! Качеството на разпознаване (броят на грешките, четливостта и т.н.) зависи до голяма степен от оригиналното качество на картината. Ето защо, когато сканирате (фотографиране и т.н.), изберете качеството възможно най-високо. В повечето случаи качеството на 300-400 dpi ще бъде достатъчно (dpi е параметър, характеризиращ качеството на картината.) При настройките на почти всички скенери този параметър обикновено е показан.

Онлайн услуги

За да покажа работата на услугите, направих снимка на една от моите статии. Тази екранна снимка ще бъде изтеглена до всички описани по-долу услуги.

1) http://www.ocrconvert.com/

Харесва ми тази услуга много заради нейната простота. Сайтът обаче също е английски, но добре работи и с руски. Не е необходимо да се регистрирате. За да започнете разпознаването, трябва да направите три действия:

- качване на изображението;

- изберете езика на текста в снимката;

- Натиснете бутона за разпознаване на разпознаване.

Поддържани формати: PDF, GIF, BMP, JPEG.

Резултатът е показан по-долу на снимката. Трябва да кажа, че текстът е добре познат. Освен това много бързо - чаках буквално 5-10 секунди.

2) http://www.i2ocr.com/

Тази услуга работи по същия начин като горепосочената. Тук също трябва да изтеглите файла, да изберете езика за разпознаване и да кликнете върху бутона за извличане на текст. Услугата е много бърза: 5-6 сек. за една страница.

Поддържа формати: TIF, JPEG, PNG, BMP, GIF, PBM, PGM, PPM.

Резултатът от тази онлайн услуга е много по-удобен: веднага виждате два прозореца - първият е резултат от разпознаването, а вторият - оригиналното изображение. Ето защо е достатъчно лесно да направите редакции в хода на редактирането. Между другото, не е необходимо да се регистрирате за услугата.

3) http://www.newocr.com/

Тази услуга е уникална по няколко начина. Първо, той поддържа формат "newfangled" DJVU (между другото пълният списък с формати: JPEG, PNG, GIF, BMP, TIFF, PDF, DjVu). На второ място, той поддържа избора на текстови области в картината. Това е много полезно, когато имате в картината не само текстови области, но и графики, които не е нужно да разпознавате.

Качеството на разпознаване е над средното, не е необходимо да се регистрирате.

4) http://www.free-ocr.com/

Много проста услуга за разпознаване: изтегляне на изображението, определяне на езика, въвеждане на captcha (между другото, единствената услуга в тази статия, където трябва да се направи) и натиснете бутона, за да преведете изображението в текст. Всъщност всичко!

Поддържани формати: PDF, JPG, GIF, TIFF, BMP.

Резултатът от разпознаването е средно. Има грешки, но няма много от тях. Ако обаче качеството на оригиналния екранна снимка би било по-високо - грешките биха били с порядък по-малък.

PS

Това е всичко за днес. Ако знаете по-интересни услуги за разпознаване на текст - споделете в коментарите, ще бъда благодарен. Едно условие: желателно е да не се регистрира и услугата да е безплатна.

Всичко най-хубаво!

Помогнете на развитието на сайта, споделяйки статията с приятели!