periodika.lv tagad publiski pieejami arī 1942. gada laikraksti

Līdz ar jauno, 2013. gadu ir iespējams pārskatīt autortiesību statusus vēsturiskajiem izdevumiem un tā, periodika.lv tagad publiski pieejami arī visi 1942. gada laikraksti.

Latvijas vēsturē tas ir Otrā pasaules kara laiks, vācu okupācijas gads, periods, kad Latvija bija daļa no Ostlandes teritorijas. Līdz ar to, vairāki no tagad pieejamajiem laikrakstiem ir vācu valodā, tomēr liela daļa – arī latviski.

"Laikmets", Nr. 46, 13.11.1942.
“Laikmets”, Nr. 46, 13.11.1942.

No vienas puses, viena gada izdevumi, varbūt nešķiet pārāk daudz, taču, no otras puses, tie ir vairāki desmiti laikrakstu un vairāk nekā 100 000 rakstu.

Lasiet un izglītojieties!

Periodikas digitalizēšana LNB

Šajās dienās LNB noslēdzas 3 gadu darbs pie jaunās portāla www.periodika.lv versijas. Jaunais periodikas portāls, viennozīmīgi, kļuvis par līdz šim apjomīgāko LNB digitalizācijas projektu. Projekta gaitā ar materiālu atlasi, skenēšanu, pēcapstrādi un portāla izveidi bijuši nodarbināti gandrīz 100 cilvēku: gan pašā LNB, gan piesaistītajās partner-organizācijās.

Līdz jūnija beigām/jūlija sākumam noslēgsies visu digitalizēto materiālu imports jaunajā portālā un tad tajā būs pieejami ~1 000 laikrakstu pilni komplekti un ~7 000 grāmatas.

Lai arī tradicionāli bibliotēkas lasītājiem asociējas ar grāmatām, nacionālo bibliotēku digitalizācijas projektu pamatmērķis un vienlaikus arī izaicinājums ir tieši periodisko izdevumu: avīžu un žurnālu digitalizācija. Šajā rakstā iepazīstināsim ar to, kā notiek laikrakstu digitalizācija LNB.

Visu periodisko izdevumu digitalizāciju var sadalīt četros soļos:

  1. Izdevumu atlase
  2. Skenēšana
  3. Segmentēšana
  4. Portāla izstrāde un izdevumu imports

Turpināt lasīšanu “Periodikas digitalizēšana LNB”

Digitālās bibliotēkas jaunumi turpmāk – LNB blogā

Nu jau apritējis gandrīz gads kopš pēdējā ieraksta LNDB blogā. Tas gan nenozīmē, ka šai laikā nav bijušas nekādas aktivitātes Digitālās bibliotēkas veidošanā. Taisni otrādi, pateicoties Eiropas Reģionālās attīstības fondu (ERAF) atbalstam, esam uzsākuši masveida digitalizācijas projektu un jau kopš šī gada sākuma notiek intensīvi LNB krājumos esošo grāmatu un periodikas skenēšanas darbi, ko veic Lattelecom BPO.

Tā kā ir krietni paplašinājies bibliotēkas blogā rakstošo darbinieku loks, tad par šiem un citiem digitālās bibliotēkas jaunumiem turpmāk lasiet LNB blogā, kurā ir pārcelta daļa arī no šī bloga ierakstiem.

Noteikti tuvākajā laikā LNB blogā pastāstīsim arī par digitālās bibliotēkas aktualitātēm, jo skenēšanas laikā jārisina gan dažādi interesanti tehniski jautājumi, gan arī digitalizējamais materiāls nereti sagādā mums pārsteigumus. Piemēram, digitalizējot 20. gs. 20-tajos, 30-tajos gados populāro žurnālu “Atpūta”, atklājās, ka tas patiesībā ir 13 gadus vecāks nekā līdz šim uzskatīts. Ja par “Atpūtas” dzimšanas gadu pieņemts uzskatīt 1924. gadu, tad LNB krājumos atradās “Atpūtas” numuri no 1911. un 1912. gadiem, kurus tad arī jau esam ieskenējuši.

Tāds, lūk, izskatījās 1911. gada 1. maijā izdotā “Atpūtas” 1. numura vāks.

Ceram, ka arī mūsu lasītājiem nākotnes digitālajā bibliotēkā būs gan patīkami pārsteigumi, gan negaidīti jaunatklājumi, jo digitalizēsim patiešām plašu izdevumu spektru: sākot no “zelta klasikas” līdz bibliogrāfiskiem retumiem.

Uzdod jautājumu par digitālo bibliotēku!

Digitālās bibliotēkas blogā šad tad uzrakstām par tēmām, kas konkrētajā brīdī šķiet aktuālas un interesantas, bet kādi jautājumi interesē mūsu lasītājus, kolēģus, IT ekspertus?

Piedāvājam uzdot jautājumus par Latvijas Nacionālo digitālo bibliotēku: par stratēģiju, projektiem, saturu, tehniskām niansēm, formātiem, ikdienas darbu, juridiskiem apsvērumiem un citām tēmām!

Jautājumi un atbildes šeit – komentāros.

Vēsturisko tekstu apstrādes rīks

LNB krājumos šobrīd ir ļoti liels daudzums vecās rakstības materiālu: gan periodika, gan grāmatas. Šie materiāli tiek skenēti un ievietoti arī digitālajā bibliotēkā, taču līdz šim bija dažādas tehniskas problēmas ar to apstrādi, sākot jau ar teksta atpazīšanas programmu nespēju strādāt ar latviešu gotikas fontiem. Šo problēmu LNB gan, šķiet, būs atrisinājusi, pasūtot ABBYY izstrādāt speciālu Finereader versiju tieši latviešu valodas gotikai. LNB saņems Finereader versiju, kas ar vismaz 85% precizitāti iegūs no skenētiem attēliem tekstuālu informāciju.

Tiesa, ar saburtošanu vēsturisko tekstu apstrāde nebeidzas, jo jācīnās ar tādām problēmām kā OCR kļūdas, novecojusi ortogrāfija un tekstos lietoti vecvārdi. Par visām šīm problēmām un cīņu pret tām var lasīt LNDB bloga ierakstā “Vecajai drukai – jauna elpa“.

Latvijas Universitātes Matemātikas un Informātikas institūts pēc LNB pasūtījuma izstrādājis latviešu gotikas apstrādes rīka arhitektūru. ” Gotikas analizators” apstrādās Finereader (vai jebkuras citas OCR programmas) iegūto rezultātu: novērsīs OCR kļūdas, cīnīsies ar novecojušo ortogrāfiju un vecvārdiem piemeklēs atbilstošos sinonīmus.

Piemēram, ja OCR programma tekstā būs atpazinusi vārdu “muschka”, Gotikas analizators mēģinās uzminēt, ka varbūt patiesībā tekstā bijis minēts vārds “wuschka”, kam mūsdienu ortogrāfijā atbilst vārds “vuška”, kam, savukārt, atbilst mūsdienu vārds: “aita”. Noindeksējot sākotnējo tekstu ar atpazīšanas rezultātā iegūtajiem vārdiem, tiks panākts efekts, ka tekstu varēs atrast pēc atslēgvārda “aita” pat tad, ja OCR programma tekstā būs atpazinusi vārdu “muschka”.

LU MII izstrādātā Gotikas analizatora demo programmu var apskatīt valoda.ailab.lv/gotika.

Gotikas analizatoru plānots integrēt projektā Periodika.lv un nākotnē arī vēsturisku grāmatu portālā, lai nodrošinātu meklēšanu vecos tekstos.

Kā digitālā bibliotēka plāno tērēt Eiropas naudu (I daļa)

Latvijas Nacionālā bibliotēka (LNB) ir viena no iestādēm, kas ir aicināta pieteikties ERAF aktivitātes “Publiskās pārvaldes elektronisko pakalpojumu un informācijas sistēmu attīstība” apakšaktivitātes “Informācijas sistēmu un elektronisko pakalpojumu attīstība” projektiem un līdz ar to pretendēt uz Eiropas naudu.

ERAF

Visi oficiālie dokumenti ir atrodami šajā E-ministrijas mājas lapas vietnē.

Digitālajai bibliotēkai ERAF aktivitāšu sarakstā ir atvēlēti veseli 2 ieraksti:

  • Digitālās bibliotēkas izveide – 2. kārta
  • Digitālās bibliotēkas pakalpojumu attīstība

Kas slēpjas aiz šiem nosaukumiem un ko abu projektu ietvaros plāno paveikt LNB?

Turpināt lasīšanu “Kā digitālā bibliotēka plāno tērēt Eiropas naudu (I daļa)”

Vecajai drukai – jauna elpa

Iespējams kāda mūsu lasītāja vecmāmiņas grāmatu plauktā vēl atrodamas vecas grāmatas, apdzeltējušām lapām, kas sarakstītas dīvainām rakstu zīmēm. Pie tam, atbildot uz jautājumu “kas tā par valodu?”, vecmāmiņa apgalvo, ka grāmata sarakstīta latviski. Ļoti iespējams jūsu vecmāmiņas īpašumā ir vecās rakstības (gotikas, fraktūras – kā nu kurā avotā pieņemts saukt) teksti. Piemēram, K. Herdera 1795. gadā izdotā “Ta pirma pawaru grahmata“:

Lai arī varbūt sākumā grūti pierast pie dīvainajām burtu formām, tomēr mazliet piešaujoties, tekstus var lasīt samērā raiti.

Šis , piemēram, ir burts “s”, bet šis  ir “ņ”.

Pāreja no vecās drukas uz jauno Latvijā notika diezgan ilgā laika periodā 20. gs. 20.-30. gados. Pie tam dažādi izdevumi tika galā ar jaunās drukas ieviešanu dažādos tempos. Piemēram, žurnāls “Ekonomists” jau 1923. gadā tika drukāts pilnībā jaunajā drukā:

kamēr laikraksts “Jaunākās ziņas” vēl 1930. gadā bija acīmredzamā pārejas procesā un tika iespiests joprojām dominējoši vecajā drukā:

Latvijas Nacionālās bibliotēkas (LNB) krājumos ir liels daudzums dažādu materiālu vecajā drukā: gan grāmatas, gan laikraksti un žurnāli. Daļa no vecās drukas materiāliem ir arī digitalizēti un pieejami Digitālajā bibliotēkā, taču tie nav apstrādāti tik detalizēti kā, piemēram, jaunās drukas avīzes, kas pieejamas atpazītā, segmentētā un meklējamā formātā “Periodikas” projekta lapā.

Tomēr LNB plāno rūpīgāk pievērsties arī vecās drukas materiālu apstrādei un tālāk – neliels apraksts par to, kā plānots apstrādāt gotikas tekstus un kādi iespējamie izaicinājumi sagaidāmi darba procesā.

Turpināt lasīšanu “Vecajai drukai – jauna elpa”

Jaunums! Laikrakstu arhīvs internetā

Šodien Latvijas Nacionālajai digitālajai bibliotēkai liela diena – tiek prezentēta digitālā kolekcija “Periodika”

Periodika

Iespējams daudzi mūsu lasītāji jau ir pazīstami ar LNB līdzšinējo digitalizēto avīžu arhīvu, kas joprojām ir arī apjoma ziņā lielākā digitālās bibliotēkas kolekcija – avīžu digitalizēšana aizsākusies jau 1999. gadā. Līdz ar digitālās kolekcijas “Periodika” izveidi, avīžu arhīvs ieguvis “jaunu elpu”. Vēsturiskās avīzes digitāli apstrādātas, segmentējot un optiski atpazīstot (OCR-ojot) avīžu tekstu.

Tālāk neliels apraksts par to, kā LNB nonāca līdz kolekcijai “Periodika” un kādi jaunievedumi un iespējas sagaida mūsu lasītājus…

Turpināt lasīšanu “Jaunums! Laikrakstu arhīvs internetā”

Dziesmu svētki digitālajā bibliotēkā

Šodien Latvijas Nacionālās bibliotēkas Mūzikas nodaļas telpās tika prezentēta jauna – XXIV Vispārējiem Latviešu Dziesmu un XIV Deju Svētkiem veltīta digitālā kolekcija. Šajā kolekcijā apskatāmi gan attēli, gan grāmatas par pirmajiem dziesmu svētkiem, kas notikuši laika periodā no 1873. līdz 1938. gadam.

Dziesmu svētki

Atšķirībā no līdzšinējām digitālajām kolekcijām, kuras lasītāji varēja apmeklēt tikai kā pasīvi novērotāji no malas, Dziesmu svētku kolekcijā iekļautos attēlus var komentēt ikviens tās apmeklētājs. Šoreiz komentāri varētu būt īpaši noderīgi, jo kolekcijā iekļauti daudzi neatpazīti attēli, par kuriem bibliotēkai nav gandrīz nekādu ziņu: ne par vietu, ne attēlā redzamajām personām, ne precīzu fotogrāfijas uzņemšanas datumu, tāpēc priecāsimies par jebkuru norādi un atšifrējumu, ko saņemsim no saviem lasītājiem! Tāpat komentāros būtu interesanti palasīt atmiņu stāstiņus, kuriozus gadījumus vai jebkuru vēsturisku faktu, ko mūsu lasītāji atminas vai nu paši vai dzirdējuši no saviem vecākiem, vecvecākiem, paziņām, kas paši piedalījušies šajos vēsturiskajos Dziesmu un deju svētkos.

Jāsaka, ka Dziesmu svētku kolekcija nebūt nav vienīgais Latvijas Nacionālās digitālās bibliotēkas projekts šajā vasarā. Jau tuvākajās nedēļās mūsu lasītājus gaida vēl kāds tehnoloģiski un saturiski ļoti patīkams pārsteigums…

DOM sistēmai – 1 gads!

Šajās dienās LNB un Microsoft Latvia kopīgi izstrādātajai Digitālo objektu pārvaldības sistēmai – DOM (angliskās versijas abreviatūra) aprit viens gadiņš! Ja pavisam precīzi, tad 2007. gada 27. aprīlī tika noslēgts trīspusējs līgums starp LNB, Valsts aģentūru “Kultūras informācijas sistēmas” un Microsoft Latvia par digitālo objektu pārvaldības sistēmas izstrādi, kura ļautu jebkurai Latvijas kultūras atmiņas institūcijai (bibliotēkai, muzejam, arhīvam) pievienot savus digitālos objektus Digitālajai bibliotēkai, ko pēc tam jebkurš interesents varētu apskatīt Digitālās bibliotēkas portālā. Patiesībā darbs pie DOM sistēmas aizsākās jau 2006. gadā un ideju līmenī – pat vēl agrāk, taču par galveno atskaites punktu šoreiz varētu uzskatīt tieši izstrādes līguma noslēgšanas brīdi.

 Vienošanās protokols

Vienlaicīgi ar DOM izstrādes līguma noslēgšanu tika parakstīts arī Vienošanās protokols starp LNB un Microsoft Latvia par sadarbību, popularizējot un attīstot Latvijas digitālās bibliotēkas risinājumus.

Kas paveikts šai laikā un kā pagāja šis DOM sistēmas izstrādes gads?

Turpināt lasīšanu “DOM sistēmai – 1 gads!”