Įrašai, paženklinti „lietuvybė“ žyma

Pritaikom „tesseract-ocr“ lietuviškiems tekstams

Atnaujinimas (2008-08-11): yra nauja paketo versija, žr. pagrindinį tesserace-ocr-lit puslapį štai čia.

=======

Susidomėjau teksto nuskaitymo priemonėmis Linux aplinkoj po to, kai prireikė keletą puslapių nuskaityt. Po nesėkmingo bandymo įdiegti abby fine reader programą per wine teko pasižiūrėt, kokios gi programos tam skirtos Linux terpėje. Deja, ne kaži kas – geriausiai veikia komandinės eilutės programa tesseract-ocr, bet ji dar nėra pritaikyta lietuviškiems tekstams.

Tačiau ją galima išmokyti pažinti lietuviškus tekstus. Taigi, šiek tiek ties tuo pasėdėjau, ir pristatau visiems rezultatus: Debian programos paketą, kurį reikia įdiegti kartu su tesseract-ocr (pageidautina – ir tesseract-ocr-eng) paketu (čia nuorodos į naujausią versiją K/Ubuntu linux sistemai), bei paprastame archyve supakuotus lietuvių kalbos failus. Tuo pačiu prašau padėti man patobulinti lietuviško teksto atpažinimą – apie tai skaitykite žemiau. Skaityti visą įrašą »

, , ,

3 komentarai(-ų)

KDE 4 – pakeiskime „bylą“ į „failą“

Dėmesio, visa, ko prašoma šiame įraše, jau yra ATLIKTA – o archyvai jau pašalinti iš svetainės.

Kviečiu prisidėti prie KDE 4 vertimo tvarkymo. Šiuo metu baigiame perėjimą nuo termino „byla“ prie termino „failas“ – tai daro ir kiti atviro kodo projektai, mes irgi tai darome.

Liko visai nedaug – iš 2500 eilučių, turinčių keistiną terminą, yra likę dar apie 500 eilučių, kuriose yra žodis „byla“. Atsisiųskite pridedamus archyvus, sutvarkykite termino vertimus (daugeliu atvejų tereikės pakeisti konteksto informaciją, nes „byla“ į „failą“ daugeliu atvejų jau pakeista automatiškai), supakuokite iš naujo ir siųskite man e. paštu dgvirtual@akl.lt. Supakuokite failus lygiai taip pat, kaip radote.

Skaityti visą įrašą »

, , ,

6 komentarai(-ų)

Prieš savaitę pasirodęs WordPress 2.1 dar neišverstas…

Štai prieš savaitę pasirodė nauja internetinių dienoraščių sistemos WordPress versija 2.1. Kol kas ypatingų naujovių joje nepastebėjau.

Vienintelė naujovė – kuri vis pasikartoja atsiradus naujai versijai – kad senąjį vertimo failą reikia atnaujinti, nes jis nebeatitinka naujos sistemos galimybių. Atsiranda nemažai neišverstų eilučių tiek viešojoje sąsajoje, tiek ir administratoriaus.

Anksčiau vis versdavau WordPress, tačiau dabar, atnaujinus vertimo failą ir pamačius, kad reikės atnaujinti arba išversti iš viso 427 eilutes (iš 1364) rankos nusviro. Visai neturiu tam laiko.

Taigi, siūlau pasireikšti kitiems :)

Nebaigtas versti failas guli čia, o sukompiliuotas dvejetainis failas, kurį galima naudoti svetainei sulietuvinti – čia. Žinoma, jame dar trūksta tų 427 eilučių…

Kaip naudoti – paaiškinta čia (tik žinoma, atkreipkite dėmesį, kad reikia naudoti dabartinę (šiuo atveju – 2.1), o ne 2 versiją).

, ,

9 komentarai(-ų)