Hogyan használjuk a Tesseract OCR-t Java-ban

Szerző: Randy Alexander
A Teremtés Dátuma: 25 Április 2021
Frissítés Dátuma: 26 November 2024
Anonim
Hogyan használjuk a Tesseract OCR-t Java-ban - Cikkek
Hogyan használjuk a Tesseract OCR-t Java-ban - Cikkek

Tartalom

A Tesseract optikai karakterfelismerő könyvtárak lehetőséget nyújtanak a dokumentumok és szöveg beolvasására. Ezek a dokumentumok olyan képeinek tárolására szolgálnak, amelyeket többé nem kell papírra helyezni. Használhatja őket Java-ban úgy, hogy vezérlőhurkot hoz létre minden karakterhez, és mindegyiket írja egy fájlba. A Tesseract könyvtárak használatához be kell építeni a Java "névteret" az OCR funkciókhoz.


irányok

A Tesseract könyvtárak lehetővé teszik a felhasználók számára a dokumentumok beolvasását (John Foxx / Stockbyte / Getty Images)
  1. Kattintson az egér jobb gombjával az OCR-dokumentum létrehozásához használni kívánt Java-fájlra. Kattintson a "Megnyitás" lehetőségre, és válassza ki az Ön által választott Java szerkesztőt.

  2. Adja hozzá az OCR könyvtár névtérét a fájl tetején. Másolja és illessze be a következő kódot a forrásfájlba:

    com.tplan.robot.imagecomparison.tesseractocr

  3. Hozzon létre egy kódot, amely felelős a fájl karaktereinek szkenneléséért. A következő kód például létrehoz egy hurkot a fájl minden egyes karakterén, és azokat egy képfájlba írja:


    (I = 1; {i} <{sorok} +1; i = {i}) olyan értékek halmaza, amelyek: +1) {Typeline "{_TOCR_LINE {i}}"}

  4. Kattintson a szerkesztő "Mentés" gombjára, majd kattintson a "Futtatás" gombra a kód fordításához egy Java fordítóban.