Hogyan használjuk a Tesseract OCR-t Java-ban

Tartalom

irányok

A Tesseract optikai karakterfelismerő könyvtárak lehetőséget nyújtanak a dokumentumok és szöveg beolvasására. Ezek a dokumentumok olyan képeinek tárolására szolgálnak, amelyeket többé nem kell papírra helyezni. Használhatja őket Java-ban úgy, hogy vezérlőhurkot hoz létre minden karakterhez, és mindegyiket írja egy fájlba. A Tesseract könyvtárak használatához be kell építeni a Java "névteret" az OCR funkciókhoz.

irányok

A Tesseract könyvtárak lehetővé teszik a felhasználók számára a dokumentumok beolvasását (John Foxx / Stockbyte / Getty Images)

Kattintson az egér jobb gombjával az OCR-dokumentum létrehozásához használni kívánt Java-fájlra. Kattintson a "Megnyitás" lehetőségre, és válassza ki az Ön által választott Java szerkesztőt.
Adja hozzá az OCR könyvtár névtérét a fájl tetején. Másolja és illessze be a következő kódot a forrásfájlba:

com.tplan.robot.imagecomparison.tesseractocr
Hozzon létre egy kódot, amely felelős a fájl karaktereinek szkenneléséért. A következő kód például létrehoz egy hurkot a fájl minden egyes karakterén, és azokat egy képfájlba írja:

(I = 1; {i} <{sorok} +1; i = {i}) olyan értékek halmaza, amelyek: +1) {Typeline "{_TOCR_LINE {i}}"}
Kattintson a szerkesztő "Mentés" gombjára, majd kattintson a "Futtatás" gombra a kód fordításához egy Java fordítóban.