Sobota, 21 prosince, 2024

Kramerius: open-source systém pro vytváření digitální knihovny

Sdílet

Úvod

Rozvoj technických prostředků a internetu umožnil velmi rychle a efektivně vyhledávat informace a vytěžovat jejich hodnotu. Zároveň s tím roste počet elektronických dokumentů a děl. Na tento trend reagují i knihovny a instituce, které digitalizují a sdílejí svůj knihovní obsah s uživateli. Digitalizace děl s sebou nese také ochranu obsahu vzhledem ke stárnutí analogových médií. Jedním z řešení je Kramerius.

Co je Kramerius

Systém Kramerius je open-source software, který je používán institucemi pro digitalizaci knihovního obsahu. Systém využívají především instituce knihoven, ale také archivy, školy, muzea, ústavy nebo ministerstvo. Kramerius umožňuje digitalizovat různé druhy dokumentů, a to knihy, periodika (časopisy a noviny), dokumenty (vytvořené přímo v elektronické podobě), mapy, grafiky, zvukové nahrávky, archiválie, hudebniny, rukopisy, články a sbírky [1]. „Systém poskytuje rozhraní pro přístup koncových uživatelů, zajišťující vyhledávání v metadatech a v plných textech, generování vícestránkových PDF dokumentů z vybraných stran, vytváření virtuálních sbírek a další operace nad uloženou sbírkou digitálních dokumentů.“ [2] Aktuálně je implementováno 44 Krameriů, z nichž 43 je českých a 1 slovenský. 

Název instituceKramerius
Moravská zemská knihovna v Brněhttps://kramerius.mzk.cz
Vědecká knihovna v Olomoucihttps://kramerius.kr-olomoucky.cz
Studijní a vědecká knihovna v Hradci Královéhttps://kramerius4.svkhk.cz
Severočeská vědecká knihovna v Ústí nad Labemhttps://kramerius.svkul.cz
Knihovna Akademie věd ČRhttps://kramerius.lib.cas.cz
Městská knihovna Česká Třebováhttps://k5.digiknihovna.cz
Digitální studovna Ministerstva obrany ČRhttps://kramerius.army.cz
Městská knihovna v Prazehttps://kramerius4.mlp.cz
Krajská knihovna Karlovy Varyhttp://k4.kr-karlovarsky.cz
Krajská vědecká knihovna v Libercihttps://kramerius.kvkli.cz
Studijní a vědecká knihovna Plzeňského krajehttps://k5.svkpk.cz
Národní filmový archivhttps://library.nfa.cz
Židovské muzeum v Prazehttps://kramerius.jewishmuseum.cz
Národní muzeumhttps://kramerius.nm.cz
Západočeské muzeum v Plznihttps://kramerius.zcm.cz
Jihočeská vědecká knihovna v Českých Budějovicíchhttps://kramerius.cbvk.cz
Krajská knihovna Františka Bartoše ve Zlíněhttp://kramerius.kfbz.cz
Národní knihovna České republikyhttps://www.ndk.cz
Univerzita Karlova – Fakulta sociálních vědhttp://kramerius.fsv.cuni.cz
Národní technická knihovnahttps://kramerius.techlib.cz
Středočeská vědecká knihovna v Kladněhttp://kramerius.svkkl.cz
Lesnický a myslivecký digitální archivhttp://lesnickaprace4.cust.ignum.cz
Knihovna Antonína Švehlyhttps://kramerius.uzei.cz
Moravskoslezská vědecká knihovna v Ostravěhttps://kramerius.svkos.cz
Výzkumný ústav geodetický, topografický a kartografickýhttps://kramerius.vugtk.cz
Vysoká škola ekonomická v Prazehttps://kramerius.vse.cz
Národní lékařská knihovnahttps://kramerius.medvik.cz
Mendelova univerzita v Brněhttp://kramerius4.mendelu.cz
Krajská knihovna Vysočinyhttps://kramerius.kkvysociny.cz
Česká Digitální knihovnahttps://cdk.lib.cas.cz
Národní archivhttps://kramerius.nacr.cz
DiFMOEhttps://kramerius.difmoe.eu
Univerzita Karlova – 1. lékařská fakultahttps://kramerius.lf1.cuni.cz
Muzeum východních Čech v Hradci Královéhttp://k4.muzeumhk.cz
Muzeum Jindřichohradeckahttps://kramerius.mjh.cz
Vysoká škola uměleckoprůmyslová v Prazehttps://kramerius.vsup.cz
Uměleckoprůmyslové museum v Prazehttps://kramerius.upm.cz
Univerzita Karlovahttps://kramerius.cuni.cz
Krajská knihovna v Pardubicíchhttps://kramerius.knihovna-pardubice.cz
Národní pedagogické muzeum J. A. Komenskéhohttps://kramerius.npmk.cz
Katalóg digitálnej knižnicehttps://onk.snk.sk
Husitské muzeum v Tábořehttp://kramerius.husitskemuzeum.cz
Národní ústav lidové kulturyhttps://kramerius.nulk.cz
Historický ústav AV ČRhttp://147.231.23.44
Tabulka 1 – Seznam institucí a jejich Krameriů – Registr Krameriů [3]

Nespornou výhodou používání systému Kramerius je jeho rozšíření mezi českými knihovnami, tedy používání jednotného systému vyhledávání, kdy se uživatel nemusí přizpůsobovat různým systémům. Kromě jednotlivých instancí Krameria v institucích existuje instance Krameria použita jako tzv. národní agregátor digitálních knihoven, který se jmenuje Česká digitální knihovna. „Cílem je zajištění přístupu k digitálním dokumentům v knihovnách z jednoho místa. V současné době jsou k dispozici data z následujících knihoven:

  • Národní knihovna ČR
  • Moravská zemská knihovna v Brně
  • Knihovna Akademie věd ČR
  • Národní technická knihovna
  • Národní lékařská knihovna
  • Studijní a vědecká knihovna v Hradci Králové
  • Severočeská vědecká knihovna
  • Městská knihovna v Praze
  • Vědecká knihovna v Olomouci
  • Knihovna Antonína Švehly
  • Krajská knihovna Františka Bartoše ve Zlíně
  • Moravskoslezská vědecká knihovna v Ostravě
  • Národní filmový archiv“ [4].

Moravská zemská knihovna provozuje tzv. Registr Krameriů, který obsahuje podrobné informace o implementovaných Krameriech. Na hlavní stranánce jsou uvedeny informace jako:

  • logo instituce,
  • dostupnost aplikace,
  • informace o klientech,
  • název instituce,
  • kód instituce,
  • sigla,
  • verze Krameria,
  • odkaz na Kramerius,
  • odkaz na uživatelské rozhraní,
  • počty veřejných a všech digitalizovaných knih, periodik, map, grafik, nahrávek, archiválií, hudebnin, rukopisů a článků,
  • počet sbírek,
  • datum a počet posledního přírůstku,
  • odkaz na detail každého Krameria,
  • a další informace.

Detailní stránka z Registru Krameriů poskytuje informace jednotlivých institucí (viz Obrázek 1 – Registr Krameriů – detail České digitální knihovny [4]).

Registr Krameriů - detail České digitální knihovny
Obrázek 1 – Registr Krameriů – detail České digitální knihovny [4]

Pro indexaci v systému Kramerius je použita komponenta vyhledávacího enginu SOLR (indexer SOLR). Pro verzi Kramerius 7 jde o standalone engine SOLR verze 6 nebo vyšší, zatímco starší verze Krameria používají integrovaný index verze 4.

Licence

Obsah digitálních knihoven je chráněn autorským zákonem, tzn. některé dokumenty jsou přístupné veřejně, některé mohou v elektronické podobě prohlížet pouze registrovaní čtenáři, a to online nebo pouze v knihovně. Každý objekt má přiřazenou jednu nebo více licencí, přičemž může jít o licenci DNNT (díla nedostupná na trhu) nebo jsou díla označená jako veřejná [5]. Díla nedostupná na trhu jsou přístupná uživatelům buď online pod přihlášením ke svému knihovnímu účtu nebo přes terminál v knihovně s přístupem k Digitální knihovně Kramerius. 

Technické parametry

Kramerius je open-source software založen na technologii Java a jeho zdrojový kód je přístupný přes GitHub. Je dostupný pod licencí GNU GPL v3. Na vývoji softwaru spolupracují zaměstnanci několika níže uvedených knihoven, jejichž činnost koordinuje Knihovna Akademie věd ČR [6].

  • Knihovna AV ČR
  • Národní knihovna ČR
  • Moravská zemská knihovna v Brně
  • Národní lékařská knihovna
  • Národní technická knihovna
  • Městská knihovna v Praze
  • Severočeská vědecká knihovna v Ústí nad Labem

Systém se skládá ze dvou částí:

  • Jádro systému
  • Webový klient

Kromě základních částí umožňuje systém používat související moduly, které rozšiřují funkcionalitu Krameria. Dva moduly zpřístupňují digitální obsah prostřednictvím mobilních klientů, a to pro operační systémy iOS a Android.  Třetí modul Kramerius Journal se zaměřuje na vědecké časopisy a umožňuje jejich správu a publikaci. Poslední modul Zvukový přehrávač pro Kramerius umožňuje přehrávat audio soubory v běžných formátech (mp3, audio, wav), procházet a vyhledávat sklady, alba, umělce a žánry [7].

Systém prochází kontinuálním vývojem, momentálně je dostupný systém Kramerius verze 7, který byl uvolněn v prosinci 2021, nicméně dle registru Krameriů 95 % institucí používá verzi 5.

Vyhledávání v Krameriu

Systém umožňuje vyhledávat fulltextem nebo za použití metadat. Jednoduché vyhledávání lze začít napsáním libovolného textu do vyhledávacího řádku. Kromě vyhledávacího řádku lze použít filtry, kterými lze omezit nalezený výsledek nebo lze filtry použít samostatně pro nalezení určité skupiny objektů. Filtry lze mezi sebou kombinovat a lze vybrat více možností z jedné skupiny filtrů. Filtry obsahují skupiny Dostupnost, Typ dokumentu, Klíčové slovo, Autor, Místo uložení, Jazyk, Knihovna a nastavení intervalu Roku vydání. 

Vyhledávácí stránka České digitální knihovny
Obrázek 2 – Vyhledávácí stránka České digitální knihovny [8]

Pod tlačítkem Pokročilé hledání (Obrázek 2 – Vyhledávácí stránka České digitální knihovny [8]) lze najít funkcionalitu vyhledávání v polích metadat, a to v polích Název, Autor, Klíčové slovo, Geografický název, ISSN, ISBN, DDT a MDT. 

K vyhledávání lze používat booleovské operátory, zástupné znaky, proximitní operátory nebo výrazy. Pro vyhledávání přesné fráze lze použít anglické uvozovky, např. “pouštní bouře“. Booleovské operátory AND, OR a NOT lze použít standardním způsobem, operátor NOT lze nahradit znaménkem mínus. Hledání výrazu pouštní -bouře nebo pouštní NOT bouře vrací stejný výsledek. Hledané výrazy a operátory lze také kombinovat pomocí závorek. Ve výsledku vyhledávání je upřednostněna přesná shoda s hledaným výrazem, a to pro jméno autora a hlavní název publikace.

Dalšími možnostmi použití zástupných znaků je hvězdička * a otazník ?. Hvězdička zastupuje řetězec znaků, a to žádný, jeden nebo libovolně dlouhý. Hvězdička lze použít pro pravostranné rozšíření, např. no*, což může být Noe, noty, norma atd. Pokud bychom chtěli hledat slovo s jedním zástupným znakem, musíme použít místo znaku otazník, např. no?a, což může být nora, noha, nota apod. Jediným omezením hvězdičky a otazníku je, že nelze použít místo prvního písmene slova.

Proximitní vyhledávání lze realizovat pomocí znaků tilda ~ a číslem, které vyjadřuje vzdálenost od hledaného výrazu. Např. „pouštní bouře“~4 vyhledá výrazy, kde mezi zadanými slovy leží maximálně čtyři jiná slova.

Příklad použití

Příklady jsou znázorněny na instanci Krameria pro Digitální knihovnu Národní knihovny ČR, která je dostupná na webové stránce https://ndk.cz.

Vyhledávací řádek na domovské stránce knihovny nabízí vyhledávání fulltextem a v metadatech. Zároveň lze vyhledávání omezit pouze na veřejně dostupné, čímž se vyhledávání omezí pouze na dokumenty, které lze zároveň rovnou zobrazit bez přihlášení. 

Homepage Národní digitální knihovny
Obrázek 3 – Homepage Národní digitální knihovny [9]

V horní liště jsou kromě vyhledávacího řádku jiné možnosti vyhledávání v dokumentech, a to pod odkazy „Procházet“ a „Sbírky“. Dále jsou uvedeny informace o digitální knihovně, možnost přihlášení, která zpřístupní některé neveřejné dokumenty a anglická modifikace webových stránek.

V procházení (Obrázek 4 – Procházení kategorií [9]) lze filtrovat dokumenty po různých kategoriích s uvedením počtu dokumentů. Dokumenty lze procházet přes kategorie typ dokumentů jako je kniha, noviny a časopisy, mapy a hudebniny, dále lze procházet dokumenty podle licence (DNNT online, DNNT terminál), autora, klíčových slov, jazyka a sbírek knihovny (knihy pro děti, dobrodružná literatura, zdravověda, kuchařky, cestopisy aj.). Zároveň lze zvolit filtr dostupnosti, tedy pouze veřejné nebo pouze neveřejné. Po kliknutí na zvolenou kategorii se vyfiltrují dokumenty, které lze dále omezovat filtrem nebo v nich vyhledávat podle výrazu.

Procházení kategorií Národní digitální knihovny
Obrázek 4 – Procházení kategorií [9]

Možnost „Sbírky“ přesměruje čtenáře na stejnou stránku jako procházení, jen s vybranou kategorií Sbírky (viz Obrázek 4 – Procházení kategorií [9]).

Vyhledáním výrazu nebo kliknutím na tlačítko Procházet knihovnu na domovské stránce se dostanete na hlavní vyhledávací stránku knihovny, kde lze vyhledané dokumenty dále omezovat zvolením vhodných filtrů. Zároveň je možné upřesňovat hledaný výraz. Na obrázku 4 je zobrazena kombinace vyhledávání dokumentů pomocí výrazu a filtru. Tyto aktivní vyhledávací prvky jsou zobrazeny na levé straně nahoře jako „Aktivní filtry“. 

Příklad vyhledávání pomocí výrazu a filtru v Národní digitální knihovně
Obrázek 5 – Příklad vyhledávání pomocí výrazu a filtru [9]

Vyhledané dokumenty jsou seřazeny podle relevance s aktivními filtry. Řazení lze měnit na abecední, od nejnovějších nebo nejstarších a podle nově přidaných. Zároveň je na obrázku vidět, že na zobrazeném náhledu dokumentů jsou zámky, které reprezentují typ licence. Žlutý zámek označuje dokumenty s DNNT terminál licencí, šedý veřejně nedostupné dokumenty, dále se objevuje ještě přeškrtnutý fotoaparát, který je symbolem DNNT online licence.

Dokumenty s DNNT online licencí v Národní digitální knihovně
Obrázek 6 – Dokumenty s DNNT online licencí [9]

Dokumenty s DNNT online licencí lze po přihlášení do knihovny zobrazit online. Po rozkliknutí vybraného dokumentu se zobrazí digitalizovaná podoba hledaného dokumentu včetně zvýraznění hledaných slov. V pravé části jsou uvedeny informace o dokumentu, na příkladu periodikum Revue Proglas s ISSN, informace o ročníku a číslu včetně odkazů a dalších informací. 

Detail vyhledávaného dokumentu v Národní digitální knihovně
Obrázek 7 – Detail vyhledávaného dokumentu [9]

V pravé horní části lze najít tři ikony, které skrývají další informace a funkcionality, a to metadata, citace a sdílení. 

Metadata lze zobrazit v různých formátech včetně formátu indexeru SOLR. Metadata se zobrazují pro různé části dokumentu, na příkladu pro stránku, číslo periodika, ročník periodika a pro dokument v kategorii.

Metadata dokumentu – číslo periodika v Národní digitální knihovně
Obrázek 8 – Metadata dokumentu – číslo periodika [9]

Citace slouží pro zobrazení citace dle normy ČSN ISO 690 pro konkrétní stránku, číslo periodika, ročníku periodika či periodika. Sdílení generuje odkaz na stránku, číslo periodika, ročníku periodika či periodika a lze využít i funkci pro sdílení přímo na sociální sítě Facebook nebo Twitter.

Závěr

Systém pro digitalizaci knihovního obsahu Kramerius je komplexní software, jehož síla tkví zejména v implementaci v mnoha knihovnách a institucích, které zároveň spolu kooperují s cílem Kramerius dále rozvíjet. Zároveň roste množství digitalizovaného obsahu včetně rozvoje digitalizace dalších medií jako je například hudba v Kramerius Music. Kramerius je podporován Ministerstvem kultury ČR v rámci výzkumných projektů a lze očekávat, že se bude i nadále rozvíjet a zdokonalovat.

Zdroje

[1] Kramerius [online]. [cit. 2022-02-01]. Dostupné z: https://system-kramerius.cz

[2] GitHub ceskaexpedice: Home ceskaexpedice/kramerius Wiki [online]. 2022 [cit. 2022-02-01]. Dostupné z: https://github.com/ceskaexpedice/kramerius/wiki

[3] Registr Krameriů [online]. [cit. 2022-02-03]. Dostupné z: https://registrkrameriu.mzk.cz

[4] Registr Krameriů. Česká Digitální knihovna [online]. [cit. 2022-02-03]. Dostupné z: https://registrkrameriu.mzk.cz/libraries/cdk

[5] GitHub ceskaexpedice. Licence ceskaexpedice/kramerius Wiki [online]. 2022 [cit. 2022-02-04]. Dostupné z: https://github.com/ceskaexpedice/kramerius/wiki/Licence

[6] GitHub ceskaexpedice. GitHub – ceskaexpedice/kramerius at indexer [online]. 2022 [cit. 2022-02-03]. Dostupné z: https://github.com/ceskaexpedice/kramerius/tree/indexer

[7] GitHub ceskaexpedice. GitHub – ceskaexpedice/kramerius-music-frontend [online]. 2022 [cit. 2022-02-03]. Dostupné z: https://github.com/ceskaexpedice/kramerius-music-frontend

[8] Česká digitální knihovna: Digitální knihovna Kramerius [online]. [cit. 2022-02-03]. Dostupné z: https://cdk.lib.cas.cz

[9] Národní digitální knihovna: Digitální knihovna Kramerius [online]. [cit. 2022-02-04]. Dostupné z: https://ndk.cz/

Číst více

Další články