Žymų Archyvai: lietuvybė

Kaip efektyviai rengti nuasmenintas skaitmenines (ar popierines) dokumentų kopijas

Dar vasaros viduryje vienos valstybinės įstaigos užprašiau 12-os dokumentų kopijų. Įstaiga ilgai išsisukinėjo: laiku nepateikė atsakymo, apskųsta Vyriausiajai administracinių ginčų komisijai piktinosi, kad aš, esą, „piktybiškai“ trukdau jos darbą ir pan. Kai galiausiai atsakymą man pateikė, dokumentų kopijas pateikti atsisakė nes:

… Tenkinant Jūsų prašymą reikėtų kelti archyvines bylas, rasti dokumentus, juos kopijuoti, peržiūrėti ar juose nėra duomenų, kuriuos saugo Duomenų apsaugos įstatymas ir jeigu tokie yra juos slėpti, tvirtinti kopijas ir jas skenuoti sukuriant elektronines kopijas pdf formatu. Tokios informacijos rinkmenos sukūrimas susijęs su neproporcingai didelėmis daro ir laiko sąnaudomis.

Įstaiga skundžiasi visai nepagrįstai. Didelę tos įstaigos darbo dalį sudaro būtent darbas su archyvine medžiaga, įstaiga taip pat kuria elektronines dokumentų kopijas ir talpina jas svetainėje kgbveikla.lt. Dokumentų kopijas jie nuasmenina, ir tikrai – ne rankiniu būdu, kaip rašo man atsisakyme teikti dokumentus. KGBveikla.lt pateikiami dokumentai yra akivaizdžiai apdorojami elektroniniu būdu, gražiai su grafinio redagavimo programa iškerpant (ar uždengiant) dokumentų dalis, kurių neturi būti viešai skelbiamame dokumente, taip pat – pridedant vandenženklį (žr. pavyzdį čia).

Kam jau kam, o šiai įstaigai tikrai nereikia patarimo, kaip nuasmeninti skenuotus dokumentus.

Tačiau daugeliui valstybės įstaigų toks patarimas turbūt praverstų. Valstybės tarnautojai ir kiti viešojo sektoriaus darbuotojai dažnai susiduria su efektyvaus dokumentų nuasmenininimo (dokumente paminėtų privačių asmenų asmens duomenų šalinimo) problema. Toliau skaityti Kaip efektyviai rengti nuasmenintas skaitmenines (ar popierines) dokumentų kopijas

Pritaikom „tesseract-ocr“ lietuviškiems tekstams

Atnaujinimas (2008-08-11): yra nauja paketo versija, žr. pagrindinį tesserace-ocr-lit puslapį štai čia.

=======

Susidomėjau teksto nuskaitymo priemonėmis Linux aplinkoj po to, kai prireikė keletą puslapių nuskaityt. Po nesėkmingo bandymo įdiegti abby fine reader programą per wine teko pasižiūrėt, kokios gi programos tam skirtos Linux terpėje. Deja, ne kaži kas – geriausiai veikia komandinės eilutės programa tesseract-ocr, bet ji dar nėra pritaikyta lietuviškiems tekstams.

Tačiau ją galima išmokyti pažinti lietuviškus tekstus. Taigi, šiek tiek ties tuo pasėdėjau, ir pristatau visiems rezultatus: Debian programos paketą, kurį reikia įdiegti kartu su tesseract-ocr (pageidautina – ir tesseract-ocr-eng) paketu (čia nuorodos į naujausią versiją K/Ubuntu linux sistemai), bei paprastame archyve supakuotus lietuvių kalbos failus. Tuo pačiu prašau padėti man patobulinti lietuviško teksto atpažinimą – apie tai skaitykite žemiau. Toliau skaityti Pritaikom „tesseract-ocr“ lietuviškiems tekstams

KDE 4 – pakeiskime „bylą“ į „failą“

Dėmesio, visa, ko prašoma šiame įraše, jau yra ATLIKTA – o archyvai jau pašalinti iš svetainės.

Kviečiu prisidėti prie KDE 4 vertimo tvarkymo. Šiuo metu baigiame perėjimą nuo termino „byla“ prie termino „failas“ – tai daro ir kiti atviro kodo projektai, mes irgi tai darome.

Liko visai nedaug – iš 2500 eilučių, turinčių keistiną terminą, yra likę dar apie 500 eilučių, kuriose yra žodis „byla“. Atsisiųskite pridedamus archyvus, sutvarkykite termino vertimus (daugeliu atvejų tereikės pakeisti konteksto informaciją, nes „byla“ į „failą“ daugeliu atvejų jau pakeista automatiškai), supakuokite iš naujo ir siųskite man e. paštu dgvirtual@akl.lt. Supakuokite failus lygiai taip pat, kaip radote.

Toliau skaityti KDE 4 – pakeiskime „bylą“ į „failą“

Prieš savaitę pasirodęs WordPress 2.1 dar neišverstas…

Štai prieš savaitę pasirodė nauja internetinių dienoraščių sistemos WordPress versija 2.1. Kol kas ypatingų naujovių joje nepastebėjau.

Vienintelė naujovė – kuri vis pasikartoja atsiradus naujai versijai – kad senąjį vertimo failą reikia atnaujinti, nes jis nebeatitinka naujos sistemos galimybių. Atsiranda nemažai neišverstų eilučių tiek viešojoje sąsajoje, tiek ir administratoriaus.

Anksčiau vis versdavau WordPress, tačiau dabar, atnaujinus vertimo failą ir pamačius, kad reikės atnaujinti arba išversti iš viso 427 eilutes (iš 1364) rankos nusviro. Visai neturiu tam laiko.

Taigi, siūlau pasireikšti kitiems 🙂

Nebaigtas versti failas guli čia [nuoroda pašalinta], o sukompiliuotas dvejetainis failas, kurį galima naudoti svetainei sulietuvinti – čia [nuoroda pašalinta]. Žinoma, jame dar trūksta tų 427 eilučių…

Kaip naudoti – paaiškinta čia (tik žinoma, atkreipkite dėmesį, kad reikia naudoti dabartinę (šiuo atveju – 2.1), o ne 2 versiją).

Lietuviška klaviatūra

Šiandien pamėginau rašyti su standartine lietuviška klaviatūra LST 1582:2000, kuri atrodo štai taip:

LST 1582:2000 klaviatūra

Iki šiol naudojausi lietuviška „skaičių eilės“ klaviatūra, tačiau ją naudojant kyla problemų su skaičių, uždengtų lietuviškomis raidėmis, įvedimu.

Pagrindinė standartinės klaviatūros ypatybė tokia: joje yra visi lietuviški ir angliški simboliai, pasiekiami pagrindinėje klaviatūros dalyje, ir jie, beje, išdėstyti pagal pasitaikymo lietuvių kalboje dažnumą, kad dažniau naudojami simboliai būtų lengviau pasiekiami. Be to, naudojant šią klaviatūrą nereikia naudoti atskiros skaičių klaviatūros, taigi, žmogus turėtumei neprapulti staiga prisėdęs prie nešiojamo kompiuterio (kurį kažkada vis tiek teks įsigyti).

Toliau skaityti Lietuviška klaviatūra

WordPress 2 vertimas užbaigtas

Na štai, Audrius pasiūlė atsisiųsti jo parengtą WordPress 2.0 vertimą, kurį galite rasti čia. Pasinaudoję juo papildžiau sąvajį – gerai, kad gettext įrankiuose yra tokį procesą automatizuojančių priemonių 🙂

Taigi, galite parsisiųsti visiškai baigtą vertimą iš čia. Tai nereiškia, kad viską matysite lietuviškai – deja, WordPress leidėjai internacionalizacijos aspektus sutvarko gerokai vėliau, nei išleidžia stabilią WordPress versiją.

Toliau skaityti WordPress 2 vertimas užbaigtas