OCR/pl
Podczas poszukiwań swojego drzewa rodzinnego, wielokrotnie będziesz korzystał z książek czy dokumentów państwowych lub innych. Możesz zaoszczędzić sobie długiego i nużącego przepisywania tych tekstów do Grampsa jeśli skorzystasz z możliwości, jakie daje optyczne rozpoznawanie obrazów (Wikipedia: OCR).
Poniżej znajdziesz kilka wskazówek, jak postępować z obrazami lub jak skanować dokumenty, aby później skonwertować je na tekst.
Jak to działa?
- Obrazy muszą posiadać duży kontrast (czarny tekst, białe tło oraz dobrą rozdzielczość).
- Program OCR skanuje obraz i używa biblioteki glifów aby wykryć konkretne znaki. Te, które są rozpoznane, są następnie transformowane w odpowiadający im znak/tekst.
- Słowniki są wykorzystywane w celu minimalizacji błędów. Każde zeskanowane słowo jest porównywane do tych obecnych w słowniku w celu określenia, czy faktycznie ono istnieje i w celu minimalizacji błędów.
- Niektóre programy rozpoznają także formatowanie, np pogrubienie, kursywę czy inny rozmiar czcionki.
Użycie OCR wraz z Grampsem
Nie ma niestety wiele programów OCR na licencji open-source do rozpoznawania tekstu, i większość z nich używa tego samego silnika. Dla Intelligent Word Recognition (IWR) lub Intelligent Character Recognition (ICR), używany dla pisanych certyfikatów, są jeszcze rzadsze.
Możesz używać niektórych z tych programów równolegle z Grampsem. Dla narzędzi typu backend, tylko programy dla linii poleceń są dostępne (użyj -h aby zobaczyć ich opcje), ale na szczęście powstało również kilka wersji GUI:
- Tesseract może być dobrym rozwiązaniem dla anglojęzycznych użytkowników, ale aktualnie rozpoznaje tylko znaki US-ASCII ...
- GOCR/JOCR jest używany przez xsane oraz kooka. Można też generować własne bazy znaków z obrazu za pomocą polecenia:
mkdir ./db gocr -p ./db/ -m 130 -m 256 certificate.pnm
- Skutkować to będzie wyświetleniem pytania o każdy nowo rozpoznany znak jaką wartość posiada (a,b,c...), i będzie generować nowy indeks (db.list) + oraz portable-bitmap (pbm) dla Twoich liter.. Każdy wpis w db.list oznacza jeden plik .pbm i jest połączony do podanej przez ciebie wartości (a, b, c ...)
- Ten sposób nie jest jednakże bardzo skutecznym dla tekstu pisanego.
- With Ocrad, wymaga użycia formatu pgm dla pliku.
- Osoby używające KDE mogą prawdopodobnie znać Kooka, standardowe narzędzie skanujące KDE z wbudowaną funkcją OCR (używającą GOCR, Ocrad, które są na licencji OSS, albo komercyjnego KADMOS).
- Również, Conjecture jest narzędziem OCR, które oba rdzenie programów OCR o licencji open-source.
- Gamera Project jest natomiast bardzo obiecująco wyglądającym narzędziem napisanym w pythonie ...
Przykłady i informacje pokrewne
Wydaje się, że najłatwiejszym sposobem będzie użycie kooka albo xsane (np zeskanowanie obrazu i użycie OCR) albo import istniejącego już obrazu do programu kooka i wtedy wykonanie OCR.
Przegląd darmowych programów rozpoznawania tekstu (OCR) dla Linuksa.
Robot skanuje starożytny manuskrypt w 3-D. Również, (w 2007r), grupa studentów i absolwentów z Grecji podjęła studia na Center for Hellenic Studies w Waszyngtonie, D.C., aby stworzyć transkrypcję XML tego tekstu. Ewentualnie, ich praca będzie dostępna dla każdego pod adresem na licencji Creative Commons.
Jak zrobić pełny automatyczny skaner książek przy pomocy klocków LEGO ...