Blog będę się starał pisać z pozycji 50-latka i dla osób, które są zainteresowane internetem,ale gramatyki uczyły się z elementarza, a nie z gadu-gadu, a pierwsze rysunki robiły kredkami zamiast GIMP-em.
Blog > Komentarze do wpisu

OnlineOCR - i to free

Niedawno pisałem o serwisie OnlineOCR, czyli aplikacji "czytającej" zeskanowaną stronę tekstu i przesyłającą ją do nas w postaci pliku tekstowego .doc
Po co? Taka funkcja czasem naprawdę się przydaje, gdy mamy dokument w postaci "papierowej", do którego chcemy wprowadzić poprawki czy też wykorzystać fragmenty. Przepisywanie jest nudne.

OnlineOCR ma ograniczenia, dotyczące ilości przesyłanych plików - tak zupełnie za free to możemy przesłać tylko 5 plików do konwersji.
Miłe jest to, że w Sieci można znaleźć coraz więcej usług za darmo (wbrew nieuchronnemu według niektórych wprowadzeniu mikropłatności za wszystko...); w serwisie MakeUseOf.com znalazłem opis serwisu NewOCR - a ten oferuje dużo więcej.

Przede wszystkim - serwis jak na razie jest za darmo, bez limitu przesyłanych do konwersji dokumentów!

Co dla nas ma pierwszorzędne znaczenie, NewOCR czyta dokumenty w 29 językach, w tym po polsku.

Nie wymaga rejestracji czy innych zabiegów - po prostu przesyłamy z dysku plik w formacie JPEG, PNG, GIF, BMP, TIFF (również wielostronicowe), o wielkości do 5 MB, wybieramy język dokumentu, a potem ściągamy na dysk treść dokumentu w formacie DOC lub TXT - do wyboru.

Można przesłać również plik w formacie PDF - wielostronicowy, do 20 MB... super.

Właśnie miałem taki plik - magazyn w.NET w formacie PDF, z lutego 2008 - archiwalny egzemplarz, jeszcze Paweł Wimmer to pisał, biały kruk...
Plik miał co prawda 24 strony i objętość 8,5 MB, a poza tym był złożony w trzech kolumnach, ale jak próba to próba...

Przesyłanie trwało dłuższą chwilę, ale potem już poszło. Po prawej stronie widzimy podgląd dokumentu - to akurat czwarta strona PDF.

Serwis poradził sobie nieźle - co prawda każdą stronę konwertuje oddzielnie, to znaczy - należy wybrać stronę i kliknąć Repeat Recognition, a tekst nie był w 100 procentach poprawny (mylił literki ć i d), ale jak na darmową usługę ne jest źle. Zamieszczam fragment:

Trzeba go będzie przy okazji przetestować na skanach, bo takie opcje są mi dość często potrzebne, a program do OCR kosztuje. Po co przepłacać?


czwartek, 12 listopada 2009, one.jack

TrackBack
TrackBack URL wpisu:
Komentarze
Gość: istvan, 81.95.206.1*
2009/11/14 09:04:48
Dziękuję za namiar.
Przetestowałem - program sprawuje się naprawdę dobrze, ilość błędów (literówek) na akceptowalnym poziomie.
Do domowych zastosowań - doskonałe rozwiązanie.