periodika.lv tagad publiski pieejami arī 1942. gada laikraksti

Līdz ar jauno, 2013. gadu ir iespējams pārskatīt autortiesību statusus vēsturiskajiem izdevumiem un tā, periodika.lv tagad publiski pieejami arī visi 1942. gada laikraksti.

Latvijas vēsturē tas ir Otrā pasaules kara laiks, vācu okupācijas gads, periods, kad Latvija bija daļa no Ostlandes teritorijas. Līdz ar to, vairāki no tagad pieejamajiem laikrakstiem ir vācu valodā, tomēr liela daļa – arī latviski.

"Laikmets", Nr. 46, 13.11.1942.
“Laikmets”, Nr. 46, 13.11.1942.

No vienas puses, viena gada izdevumi, varbūt nešķiet pārāk daudz, taču, no otras puses, tie ir vairāki desmiti laikrakstu un vairāk nekā 100 000 rakstu.

Lasiet un izglītojieties!

Advertisements

Periodikas digitalizēšana LNB

Šajās dienās LNB noslēdzas 3 gadu darbs pie jaunās portāla www.periodika.lv versijas. Jaunais periodikas portāls, viennozīmīgi, kļuvis par līdz šim apjomīgāko LNB digitalizācijas projektu. Projekta gaitā ar materiālu atlasi, skenēšanu, pēcapstrādi un portāla izveidi bijuši nodarbināti gandrīz 100 cilvēku: gan pašā LNB, gan piesaistītajās partner-organizācijās.

Līdz jūnija beigām/jūlija sākumam noslēgsies visu digitalizēto materiālu imports jaunajā portālā un tad tajā būs pieejami ~1 000 laikrakstu pilni komplekti un ~7 000 grāmatas.

Lai arī tradicionāli bibliotēkas lasītājiem asociējas ar grāmatām, nacionālo bibliotēku digitalizācijas projektu pamatmērķis un vienlaikus arī izaicinājums ir tieši periodisko izdevumu: avīžu un žurnālu digitalizācija. Šajā rakstā iepazīstināsim ar to, kā notiek laikrakstu digitalizācija LNB.

Visu periodisko izdevumu digitalizāciju var sadalīt četros soļos:

  1. Izdevumu atlase
  2. Skenēšana
  3. Segmentēšana
  4. Portāla izstrāde un izdevumu imports

Continue reading “Periodikas digitalizēšana LNB”

Digitālās bibliotēkas jaunumi turpmāk – LNB blogā

Nu jau apritējis gandrīz gads kopš pēdējā ieraksta LNDB blogā. Tas gan nenozīmē, ka šai laikā nav bijušas nekādas aktivitātes Digitālās bibliotēkas veidošanā. Taisni otrādi, pateicoties Eiropas Reģionālās attīstības fondu (ERAF) atbalstam, esam uzsākuši masveida digitalizācijas projektu un jau kopš šī gada sākuma notiek intensīvi LNB krājumos esošo grāmatu un periodikas skenēšanas darbi, ko veic Lattelecom BPO.

Tā kā ir krietni paplašinājies bibliotēkas blogā rakstošo darbinieku loks, tad par šiem un citiem digitālās bibliotēkas jaunumiem turpmāk lasiet LNB blogā, kurā ir pārcelta daļa arī no šī bloga ierakstiem.

Noteikti tuvākajā laikā LNB blogā pastāstīsim arī par digitālās bibliotēkas aktualitātēm, jo skenēšanas laikā jārisina gan dažādi interesanti tehniski jautājumi, gan arī digitalizējamais materiāls nereti sagādā mums pārsteigumus. Piemēram, digitalizējot 20. gs. 20-tajos, 30-tajos gados populāro žurnālu “Atpūta”, atklājās, ka tas patiesībā ir 13 gadus vecāks nekā līdz šim uzskatīts. Ja par “Atpūtas” dzimšanas gadu pieņemts uzskatīt 1924. gadu, tad LNB krājumos atradās “Atpūtas” numuri no 1911. un 1912. gadiem, kurus tad arī jau esam ieskenējuši.

Tāds, lūk, izskatījās 1911. gada 1. maijā izdotā “Atpūtas” 1. numura vāks.

Ceram, ka arī mūsu lasītājiem nākotnes digitālajā bibliotēkā būs gan patīkami pārsteigumi, gan negaidīti jaunatklājumi, jo digitalizēsim patiešām plašu izdevumu spektru: sākot no “zelta klasikas” līdz bibliogrāfiskiem retumiem.

Uzdod jautājumu par digitālo bibliotēku!

Digitālās bibliotēkas blogā šad tad uzrakstām par tēmām, kas konkrētajā brīdī šķiet aktuālas un interesantas, bet kādi jautājumi interesē mūsu lasītājus, kolēģus, IT ekspertus?

Piedāvājam uzdot jautājumus par Latvijas Nacionālo digitālo bibliotēku: par stratēģiju, projektiem, saturu, tehniskām niansēm, formātiem, ikdienas darbu, juridiskiem apsvērumiem un citām tēmām!

Jautājumi un atbildes šeit – komentāros.

Vēsturisko tekstu apstrādes rīks

LNB krājumos šobrīd ir ļoti liels daudzums vecās rakstības materiālu: gan periodika, gan grāmatas. Šie materiāli tiek skenēti un ievietoti arī digitālajā bibliotēkā, taču līdz šim bija dažādas tehniskas problēmas ar to apstrādi, sākot jau ar teksta atpazīšanas programmu nespēju strādāt ar latviešu gotikas fontiem. Šo problēmu LNB gan, šķiet, būs atrisinājusi, pasūtot ABBYY izstrādāt speciālu Finereader versiju tieši latviešu valodas gotikai. LNB saņems Finereader versiju, kas ar vismaz 85% precizitāti iegūs no skenētiem attēliem tekstuālu informāciju.

Tiesa, ar saburtošanu vēsturisko tekstu apstrāde nebeidzas, jo jācīnās ar tādām problēmām kā OCR kļūdas, novecojusi ortogrāfija un tekstos lietoti vecvārdi. Par visām šīm problēmām un cīņu pret tām var lasīt LNDB bloga ierakstā “Vecajai drukai – jauna elpa“.

Latvijas Universitātes Matemātikas un Informātikas institūts pēc LNB pasūtījuma izstrādājis latviešu gotikas apstrādes rīka arhitektūru. ” Gotikas analizators” apstrādās Finereader (vai jebkuras citas OCR programmas) iegūto rezultātu: novērsīs OCR kļūdas, cīnīsies ar novecojušo ortogrāfiju un vecvārdiem piemeklēs atbilstošos sinonīmus.

Piemēram, ja OCR programma tekstā būs atpazinusi vārdu “muschka”, Gotikas analizators mēģinās uzminēt, ka varbūt patiesībā tekstā bijis minēts vārds “wuschka”, kam mūsdienu ortogrāfijā atbilst vārds “vuška”, kam, savukārt, atbilst mūsdienu vārds: “aita”. Noindeksējot sākotnējo tekstu ar atpazīšanas rezultātā iegūtajiem vārdiem, tiks panākts efekts, ka tekstu varēs atrast pēc atslēgvārda “aita” pat tad, ja OCR programma tekstā būs atpazinusi vārdu “muschka”.

LU MII izstrādātā Gotikas analizatora demo programmu var apskatīt valoda.ailab.lv/gotika.

Gotikas analizatoru plānots integrēt projektā Periodika.lv un nākotnē arī vēsturisku grāmatu portālā, lai nodrošinātu meklēšanu vecos tekstos.

Kā digitālā bibliotēka plāno tērēt Eiropas naudu (I daļa)

Latvijas Nacionālā bibliotēka (LNB) ir viena no iestādēm, kas ir aicināta pieteikties ERAF aktivitātes “Publiskās pārvaldes elektronisko pakalpojumu un informācijas sistēmu attīstība” apakšaktivitātes “Informācijas sistēmu un elektronisko pakalpojumu attīstība” projektiem un līdz ar to pretendēt uz Eiropas naudu.

ERAF

Visi oficiālie dokumenti ir atrodami šajā E-ministrijas mājas lapas vietnē.

Digitālajai bibliotēkai ERAF aktivitāšu sarakstā ir atvēlēti veseli 2 ieraksti:

  • Digitālās bibliotēkas izveide – 2. kārta
  • Digitālās bibliotēkas pakalpojumu attīstība

Kas slēpjas aiz šiem nosaukumiem un ko abu projektu ietvaros plāno paveikt LNB?

Continue reading “Kā digitālā bibliotēka plāno tērēt Eiropas naudu (I daļa)”

Vecajai drukai – jauna elpa

Iespējams kāda mūsu lasītāja vecmāmiņas grāmatu plauktā vēl atrodamas vecas grāmatas, apdzeltējušām lapām, kas sarakstītas dīvainām rakstu zīmēm. Pie tam, atbildot uz jautājumu “kas tā par valodu?”, vecmāmiņa apgalvo, ka grāmata sarakstīta latviski. Ļoti iespējams jūsu vecmāmiņas īpašumā ir vecās rakstības (gotikas, fraktūras – kā nu kurā avotā pieņemts saukt) teksti. Piemēram, K. Herdera 1795. gadā izdotā “Ta pirma pawaru grahmata“:

Lai arī varbūt sākumā grūti pierast pie dīvainajām burtu formām, tomēr mazliet piešaujoties, tekstus var lasīt samērā raiti.

Šis , piemēram, ir burts “s”, bet šis  ir “ņ”.

Pāreja no vecās drukas uz jauno Latvijā notika diezgan ilgā laika periodā 20. gs. 20.-30. gados. Pie tam dažādi izdevumi tika galā ar jaunās drukas ieviešanu dažādos tempos. Piemēram, žurnāls “Ekonomists” jau 1923. gadā tika drukāts pilnībā jaunajā drukā:

kamēr laikraksts “Jaunākās ziņas” vēl 1930. gadā bija acīmredzamā pārejas procesā un tika iespiests joprojām dominējoši vecajā drukā:

Latvijas Nacionālās bibliotēkas (LNB) krājumos ir liels daudzums dažādu materiālu vecajā drukā: gan grāmatas, gan laikraksti un žurnāli. Daļa no vecās drukas materiāliem ir arī digitalizēti un pieejami Digitālajā bibliotēkā, taču tie nav apstrādāti tik detalizēti kā, piemēram, jaunās drukas avīzes, kas pieejamas atpazītā, segmentētā un meklējamā formātā “Periodikas” projekta lapā.

Tomēr LNB plāno rūpīgāk pievērsties arī vecās drukas materiālu apstrādei un tālāk – neliels apraksts par to, kā plānots apstrādāt gotikas tekstus un kādi iespējamie izaicinājumi sagaidāmi darba procesā.

Continue reading “Vecajai drukai – jauna elpa”