- IT
- Motoroleriai
- Pokaris
- Religija
- Anekdotai apie religiją
- Sivananda jogos grupės Lietuvoje: tarp religijos ir sveikatingumo
- Sivananda jogos grupės Lietuvoje. II. 1. Teorinis kontekstas
- Sivananda jogos grupės Lietuvoje. I. Įvadas
- Sivananda jogos grupės Lietuvoje. II. 2. Pagrindinės darbo hipotezės
- Sivananda jogos grupės Lietuvoje. II. 3.1-4. Pasaulyje ir Lietuvoje
- Sivananda jogos grupės Lietuvoje. II. 4. Interviu analizė
- Sivananda jogos grupės Lietuvoje. III. Išvados
- Sivananda jogos grupės Lietuvoje. Literatūra. Priedai
- Sivananda jogos grupės Lietuvoje: II.3.5-6. Pasaulyje ir Lietuvoje
- Trys bendruomenių tipai Lietuvos evangelikų baptistų bendruomenių sąjungoje
- KDE lietuvinimas
Tesseract-OCR apmokymas
Programą reikia papildomai apmokyti, nes šiuo metu ji apmokyta pažinti tik kelis šriftus (Arial, Times New Roman, Verdana, Courier New, DejaVu, Palemonas,Vytis), ir tai – gan paviršutiniškai. Jei skenuodami tekstą aptiksite, kad programa blogai susidoroja su užduotimi, galite padėti man ją papildomai apmokyti.
Apmokymo procesas
išrinkite geros skenavimo kokybės puslapį ar jo dalį iš to teksto, kurį skenuoja blogai; jei žinote, koks tai šriftas, parenkite vieną puslapį su tuo šriftu, šiek tiek padidinę tarpus tarp raidžių;
sukurkite pagal čia pateiktas instrukcijas *.tif ir *.box failus,
pataisykite iki geros būsenos *.box failą ir
atsiųskite *.box ir *.tif failų porą man.
Aš jais papildomai apmokysiu Tesseract-OCR.
Apmokymui naudoti failai
Šie failai buvo naudoti atitinkamoms tesseract-ocr-lit paketo versijoms „gaminti“:
boxtiff-2.03-0.1-lit.tar.gz – šiuose failuose yra nemažai klaidų…
- Dar nėra komentarų.