Informācijas pirmavoti

Katra nopietna publikācija, zinātnisks raksts vai grāmata satur izmantotās literatūras avotu sarakstu, kam vajadzētu liecināt gan par to, cik nopietni autors iedziļinājies pētāmajā tēmā, gan arī par to, cik pats darbs ir faktos balstīts.

Līdz 20. gs. 90-to gadu sākumam literatūras avotu saraksti pilnībā sastāvēja no papīrā publicētiem izdevumiem, bet 90-to gadu otrajā pusē starp atsaucēm sāka parādīties arī pirmās norādes uz tīmekļa vietnēm. Sākotnēji, sevišķi akadēmiskā vidē, tīmekļa vietnes literatūras avotu sarakstā tika uztvertas ar izteiktu skepsi. Zinātnisku darbu recenzenti prātā svītroja no literatūras saraksta visas tīmekļa vietnes un par pilnu ņēma tikai “īstas” publikācijas. Tāda skepse arī bija saprotama, jo tolaik tīmekļa vietnes veidoja individuāli entuziasti un nevarēja būt nekādas pārliecības par viņu lapās publicētās informācijas autentiskumu un uzticamību.

Vēl 21. gs. sākumā augstskolu diplomdarbu izskatīšanas sēdēs komisijas locekļu smaidu izsauca jebkura recenzenta norāde, ka students savā darbā atsaucies uz Wikipedia, kā uz informācijas avotu. Kopš tā laika daudz kas mainījies un šobrīd atsauces uz tīmekļa vietnēm ir ne tikai leģitīmi literatūras avoti, bet ir pat izstrādāti standarti, kā pareizi noformēt šādas atsauces. Piemēram, tradicionāla tīmekļa vietnes atsauces sastāvdaļa ir norāde “[apskatīts <tādā-un-tādā datumā>]”.

Tīmekļa vietnēm literatūras avotu sarakstā, protams, ir lielas priekšrocības pār tradicionālajām publikācijām. Atšķirībā no dažādiem konferenču materiāliem, kas lasītājam darba lasīšanas brīdī, visticamāk, nebūs pieejami, tīmekļa vietni var apmeklēt jebkurā brīdī. Vajadzīgs tikai dators ar interneta pieslēgumu. Recenzentiem, tātad, vieglāk pārliecināties par publikācijā iekļautajiem faktiem no citur publicētas informācijas.

Tomēr tīmekļa vietnēm kā informācijas pirmavotam ir arī kāds būtisks trūkums. Potenciāli, ļoti īsais mūžs. Ja papīra publikācijas un sevišķi grāmatas bez īpašām problēmām ir pieejamas vairākus gadu desmitus pēc to izdošanas un pie labas attieksmes – arī vairākus gadu simtus, tad tīmekļa vietnēm sirms vecums iestājas aptuveni 5-10 gadu laikā. Tīmekļa vietnes, kas pieejamas vēl 10 gadus pēc to publicēšanas jau var uzskatīt par nopietnām ilgdzīvotājām. Un te kļūst svarīgs jautājums, kādas sekas uz zinātnisku darbu atstāj tīmekļa vietņu pazušana?

Illustrations for Google

Iztēlosimies, ka no bibliotēkas plaukta esam izcēluši 2001. gadā publicētu grāmatu ar 100 atsaucēm literatūras avotu sarakstā, starp kurām ir 20 atsauces uz tīmekļa vietnēm. Kāds varētu būt šo tīmekļa vietņu liktens un kādas sekas to nepieejamība varētu atstāt uz pašu izdevumu?

Vai pastāv zinātniska darba “dzīve” pēc literatūras avota “nāves”?

Tīmekļa vietnes literatūras avotu sarakstā, teorētiski, var pildīt divas saturiskās funkcijas:

  1. Tīmekļa lapā pieejamā informācija nav fundamentāli svarīga un tajā tikai izskaidrots kāds termins (Wikipedia šķirklis).
  2. Tīmekļa vietnē publicētā informācija ir fundamentāli svarīga un būtiskas darba atziņas tiek balstītas tieši uz šajā tīmekļa vietnē publicēto informāciju.

Tīmekļa vietnei pēc pazušanas, savukārt, atkal var būt divu veidu sekas:

  1. Tīmekļa vietne nav unikāla un tajā esošo informāciju var viegli restaurēt no citām vietnēm vai literatūras avotiem.
  2. Tīmekļa vietne ir unikāla. Respektīvi, vienīgais zināmais avots, kur bijusi publicēta konkrētā informācija ir tieši pazudusī vietne.

Savstarpēji kombinējot visas šīs iespējas, iegūstam četras dažāda smaguma situācijas, ko var izraisīt kādas tīmekļa vietnes pazušana.

Vienkāršākajā gadījumā, vairs nav pieejama tīmekļa vietne ar termina “elektromotors” definīciju. Pirmkārt, šādas informācijas pazušana diez vai sagrautu kāda darba argumentāciju. Otrkārt, pazūdot vienai lapai ar “elektromotora” definīciju, paliek vēl tūkstots citas, kur šo informāciju joprojām var iegūt.

Sliktākajā gadījumā, pazūd tīmekļa vietne ar kāda dokumenta vienīgo eksemplāru, uz kuru savukārt ir balstīts viss grāmatā iekļautais pētījums. Pie tam, dokuments nav pieejams ne kādā citā tīmekļa vietnē, ne oriģinālā izskatā. Šādā gadījumā ir apdraudēta arī visa grāmatā publicētās informācijas uzticamība.

Atsauces uz LNB resursiem

Jāņem vērā, ka par sava veida tīmekļa vietnes pazušanu var uzskatīt arī jaunas vietnes versijas ieviešanu kā rezultātā mainās lapu URL struktūra un parasti pārstāj strādāt visas iepriekšējās versijas lapu adreses. Pat tad, ja pati informācija kā tāda ir saglabājusies arī jaunajā vietnes versijā.

Šī gada maijā LNB publiskoja portāla www.periodika.lv jaunāko versiju, kas ir nevis vienkārši iepriekšējās vietnes uzlabojums, bet pilnīgi jauna, neatkarīga sistēma. Līdz ar to, nomainījusies arī visa objektu URL adrešu sistēma.

Pagaidām joprojām pieejama arī iepriekšējā portāla versija, taču nopietni apsveram domu to izslēgt, lai nebūtu lieki jādarbina divi serveri, uz kuriem šobrīd izvietota “vecā periodika”. Iepriekšējās versijas portāla saturs ir pārnests uz jauno periodika.lv, taču skaidrs, ka līdz ar vecās versijas portāla izslēgšanu, pārstās darboties visas atsauces uz šo resursu, lai kur nu arī tās būtu ievietotas.

Portāla periodika.lv migrācijas izraisītās sekas pēc augstākminētās klasifikācijas, visticamāk, ir kategorizējamas kā vidēja smaguma scenārijs:

informācija ir svarīga/tīmekļa vietne nav unikāla.

Respektīvi, ja pētnieks savā darbā iekļāvis atsauci uz kādu periodika.lv publicētu darbu, tad parasti tas ir uz kādu laikrakstā minētu faktu, kas var būt svarīgs arī pašam pētījumam. Tomēr, ja pārstāj darboties URL adrese uz “vecās” periodika.lv resursu, tas vai nu būs atrodams jaunajā periodika.lv versijā, vai sliktākajā gadījumā, bibliotēkā joprojām glabājas oriģinālais laikraksts.

Pagaidām plānojam, ka jaunā periodika.lv ar pašreizējo URL adrešu sistēmu būs ilglaicīgs risinājums, kaut gan IT nozarē kaut ko prognozēt tālāk kā 5 gadus uz priekšu, protams, ir grūti.

Katrā ziņā, ievietojot savā darbā atsauces uz tīmekļa vietnēm, ir vērts uzdot sev jautājumu – kādas sekas uz darbu atstās šīs konkrētas vietnes nepieejamība?

Advertisements

Kā veidot digitalizēto tekstu saskarni?

Nu jau kādu laiku mūsu blogā ir izvietota aptauja par projekta Periodika.lv novērtējumu. 10-baļļu skalā nu jau ir saņemti visi iespējamie vērtējumi no 1 līdz 10 un lai arī mums liels prieks, ka lielākā daļa vērtējumu ir 8 un vairāk, tomēr labi apzināmies, ka projektam ir arī savi trūkumi, kuru dēļ varētu saņemt arī zemāku vērtējumu.

Viens no trūkumiem, ko paši apzināmies, ir meklēšanas mehānisma “ātrdarbība”, ko noteikti varētu uzlabot, bet kādus trūkumus jūs esat novērojuši, meklējot informāciju Periodika.lv lapā? Varbūt ir kāda papildus funkcionalitāte, kas jums noteikti noderētu?

Tuvākajos gados LNB plāno digitalizēt vairāk kā 1 milj. grāmatu lappušu un vairāk kā 2 milj. avīžu lappušu. Līdz ar to lasītājiem digitālā formā pieejamo tekstu apjoms pieaugs 10-kārtīgi. Ņemot vērā gan materiālu apjomu, gan daudzveidību vajadzēs izstrādāt īpašu saskarni digitalizēto tekstu arhīvam. Šobrīd esam izpētes fāzē, noskaidrojot labo praksi lielapjoma teksta arhīvu veidošanā, formātu izvēlē, saskarņu veidošanā. Tā kā galamērķis ir radīt lasītājiem ērtāko iespējamo rīku darbam ar liela apjoma tekstu arhīvu, tad mūs ļoti interesē lasītāju vēlmes.

Pagaidām lielākie digitalizēto tekstu arhīvi internetā (tādi, kuru apjoms ir mērāms vismaz miljonos lappušu) ir:

Lai arī katrs ir pa savam labs, tomēr neviens nav arī perfekts. Piemēram, varētu vēlēties izsmalcinātu tekstu komentēšanas iespēju, iezīmējot daļu no teksta un pievienojot tam savu komentāru. Šādu iespēju varētu izmantot gan skolu, augstskolu pasniedzēji, komentējot mācību literatūras saturu, gan vēstures pētnieki, skaidrojot mūsdienu lasītājiem vēsturisku tekstu interpretācijas, utml.

Bet kādas ir jūsu domas, ieteikumi, komentāri?

Vizuālā noformējuma nozīme

Grāmatu, periodikas un citu tekstu saturošu materiālu digitalizācijā, viens no posmiem ir teksta atpazīšana jeb OCR. Rezultātā viss grāmatas teksts tiek iegūts tālāk ērti apstrādājamā XML formātā. Tam var pielietot XSLT transformācijas un citas apstrādes metodes, rezultātā iegūstot glīti noformētu grāmatas tekstu, tikai… vairs ne oriģinālā izskatā.

Piemēram, oriģinālā lapa.

gramatas_lapa

Pēc apstrādes šīs lapas virsraksts nonāktu atsevišķā XML tagā, bet pamatteksts – citā. Pēc tam šo grāmatas tekstu varētu attēlot tīmekļa lapā, veidojot hipersaišu satura rādītājus uz atsevišķām nodaļām, ļaujot samazināt/palielināt tekstu. Ļaujot ērti kopēt interesējošos fragmentus. Vienvārdsakot, ļaujot darīt visu, ko jau nu ar segmentētu tekstu var darīt.

XML dokumentu attēlošanas priekšrocība ir arī relatīvi ekonomiskais izmērs. 100 lappušu biezai grāmatai atbilstošais tekstu saturošais XML dokuments aizņem aptuveni 0.5Mb, kamēr pati grāmata PDF formātā – aptuveni 20Mb.

Bet.. varbūt grāmatas oriģinālajam vizuālajam izpildījumam tomēr ir pietiekami liela nozīme, lai tas atsvērtu aptuveni 40x lielāko datņu izmēru un pārējās neērtības. Cik nozīmīgs jūsu lasīšanas pieredzē ir grāmatas vizuālais noformējums vai jums svarīgāka ir tīrā informācija?

Europeana.eu atjaunojusi darbību

Pēc negaidīti lielās lietotāju intereses, atklājot Eiropas digitālās bibliotēkas portālu europeana.eu šī gada novembrī un gandrīz momentānās lapas slēgšanas, europeana.eu nu jau kādu laiku atkal strādā.

Interesanti, ka oficiālais europeana.eu “nobrukšanas” iemesls esot desmitiem tūkstošu vienlaicīgu pieprasījumu, meklēt “Monu Lisu”. Acīmredzot, daudzu interneta lietotāju acīs Mona Lisa ir Eiropas kultūras kvintesence un pirmais atslēgvārds, kas nāk prātā, ieraugot tukšu meklēšanas lauku. Tomēr portālā ir iespējams piekļūt praktiski jebkura Eiropas reģiona un laikmeta kultūrvēsturiski nozīmīgākajiem resursiem. Galu galā, līdz 2010. gadam portālā paredzēts apkopot saites uz 6 miljoniem objektu.

Europeana portāls

Latvijas Nacionālā bibliotēka, starp citu, Eiropas digitālajā bibliotēkā šobrīd piedalās ar savu Dziesmu svētku kolekciju, par ko var pārliecināties, ievadot europeana.eu meklētājā atslēgvārdus “dziesmu svētki”.

Vai Tu lasītu grāmatas internetā?

Jautājums, kas ik pa laikam pārņem Digitālās bibliotēkas veidotāju prātus: “Vai vispār un cik lielos apjomos vajadzētu digitalizēt grāmatas?

Delfos, tvnet-os un citos portālos grāmatu digitalizēšana vienmēr tiek piedāvāta kā alternatīva LNB jaunās ēkas celtniecībai. Parasti šāds viedoklis gan ir balstīts emocijās nevis vēsu prātu izvērtētā situācijā.

No tehniskā viedokļa tiešām nav nekādu būtisku šķēršļu grāmatu digitalizēšanai. Ir speciāla tehnika tieši grāmatu skenēšanai, ir uzņēmumi, kas specializējas masveida skenēšanas pakalpojumu sniegšanā, ir programmatūra un formāti, kas ļauj digitalizētās grāmatas gan OCR-ot, gan saglabāt ērti apstrādājamos veidos. Grāmatas ceļš no bibliotēkas plaukta līdz PDF datnei datu centra serverī ir paveicams ātri un bez problēmām. Grāmatu skenēšana

Toties šaubas rodas par tālāko – digitalizēto grāmatu reālo pielietojumu. Šai brīdī sarīkosim nelielu aptauju un esiet maksimāli godīgi! :)

Ja man pašam būtu jāatbild, tad esmu izlasījis precīzi vienu daiļliteratūras grāmatu PDF formātā. Grāmata pagadījās pietiekami interesanta, tāpēc neilgi pēc lasīšanas uzsākšanas vairs neapzinājos, ka lasu grāmatas tekstu no laptopa monitora. Teiksim tā, grāmatas sižets izrādījās saistošāks par datu nesēju.

Par spīti tam, man arī neradās atkarība no PDFu lasīšanas un tā arī vairs nevienu grāmatu, skatoties savā datora monitorā, neesmu izlasījis. Fragmentus jā, bet tā ka veselu grāmatu – kaut kā nav sanācis.

Un tāpēc arī šaubas par grāmatu digitalizēšanas lietderību, jo “digitalizēsim visas grāmatas!” var izrādīties tik vien kā skaists sauklis, bet vējā izmests laiks un nauda. Padalieties savos iespaidos! Vai jūs lasītu digitālās bibliotēkas portālā pieejamas grāmatas? Kādiem vajadzētu būt digitālo grāmatu parametriem (formāts, funkcionalitāte, utml.), lai jums būtu vēlēšanās lasīt grāmatas elektorniskā formātā? Nu un protams visam fonā atcerieties mazo vārdiņu… autortiesības.

Kvalitāte vai kvantitāte?

Nu jau labu laiciņu katrs LNDB bloga apmeklētājs var piedalīties aptaujā par digitālo bibliotēku. Viens no aptaujas jautājumiem ir saistīts ar kvantitātes un kvalitātes rādītājiem digitālajā bibliotēkā. Līdz šim lielais vairums (~67%) aptaujāto ir atbildējuši ļoti pārliecinoši par labu kvalitātei. 

Kvalitāte vai kvantitāte digitālajā bibliotēkā?

Šāds rezultāts protams ir ļoti labi saprotams. Vismaz pirmajā brīdī tā šķiet. Bet vai tiešām ir tik vienkārši? Vai tiešām digitālajā bibliotēkā kvalitāte būs nozīmīgāka par kvantitāti?

Continue reading “Kvalitāte vai kvantitāte?”

Cenzūra

Reiz kāds izdomas bagāts lasītājs vērsās 13 bibliotēku uzziņas nodaļās ar lūgumu atbildēt uz jautājumu: “Kā mājas apstākļos uzbūvēt pietiekami spēcīgu spridzekli, lai varētu pilnībā uzspridzināt kādu piepilsētas dzīvojamo māju?” Detalizētas atbildes esot sniegušas visas 13 bibliotēku uzziņu nodaļas…

No vienas puses, bibliotekāri noteikti bija uzdevumu augstumos, bet no otras puses – bibliotēkām varētu pārmest pārlieku paviršu situācijas izvērtēšanu. No vienas puses cenzūra ir slikti, no otras – varbūt ir situācijas, kad cenzūra ir vienīgais risinājums.

Kā rīkoties digitālajā bibliotēkā? Kura ir tā robežšķirtne, kuru nevajadzētu pārkāpt? Varbūt publicēt visu un tad lai katrs lasītājs pats izlemj, ko apskatīt un par ko interesēties? Tādi, lūk, jautājumi…