Sobota, 21 prosince, 2024

SCOAP3: Informační zdroj jako puzzle fyziky částic

Sdílet

Úvod

Informace. Na první pohled je každému z nás jasné, že se jedná o něco objemného a nekonečného. Zároveň je s přibývajícím množstvím stále více náročné s nimi pracovat a přehledně je uchovávat. Každá informace se skládá z více malých informací a tyto malé informace se poté skládají z někým nasbíraných a shromážděných dat.

Ovšem co teprve takoví vědci? Ti hledají každý den čím dál detailnější informace týkající se našeho světa, a to mnohdy až na úroveň molekul a částic. V tomto článku se dočtete o informačním zdroji, který jim umožňuje udržet si přehled o již nasbíraných informacích a objevech. Toto informační puzzle pak vědcům poskládá požadovaný obrázek segmentu fyziky částic, jimž se zabývají.

SCOAP3 – o co vlastně jde?

SCOAP3 (Sponsoring Consortium for Open Access Publishing in Particle Physics) je projekt (webový portál), který obsahuje záznamy týkající se oblasti fyziky částic, a to z více než 3,000 knihoven, klíčových finančních agentur a výzkumných center z 43 různých světových zemí a tří mezivládních organizací. SCOAP3 tak pomáhá vědcům zkoumajícím fyziku částic pracovat na jejich projektech a udržovat si přehled o již vydaných vědeckých pracech a objevených faktech.

scoap3 title page
Obrázek 1: Úvodní strana repo.scoap3.org [zdroj: screenshot autora]

Myšlenkou SCOAP3 je publikování vydaných vědeckých prací autorů vedle jejich vlastních platforem také na jedné ucelené platformě, na které jsou tyto informace centralizovány. Práce autorů jsou ukládány v různých datových formátech, kterými jsou výhradně PDF, PDF/A či XML a jsou publikovány pod licencí CC-BY. Díky této licenci mohou být jednotlivé práce dále stahovány a dále šířeny.

Projekt SCOAP3 byl spuštěn v únoru roku 2014 a je nadále udržován a vylepšován. Celý webový portál je postaven na knihovně CERN Invenio a jeho zdrojový kód je společně s podpůrnými programy uložen na platformě Github a to s veřejnou dostupností. (1)

Partneři a jejich registrace

CERN jako hostitelská organizace projektu SCOAP3 je jako signatář smluv zodpovědný za to, aby publikovaný obsah byl v souladu se smluvními specifikacemi. Jak již bylo zmíněno v představení portálu, práce musí být ve formátu XML, PDF či PDF/A. Každá práce musí být také dostupná nejpozději do 24 hodin po jejím zveřejnění. Měla by zde pak být uvedena i autorská práva. V případě, že tomu tak není měla by se práce alespoň odkazovat na licenci CC-BY.

Pro využívání všech dostupných nástrojů, a především nelimitovaných APIs (application programming interface) projektu SCOAP3 je nutná registrace partnera projektu, kterou je možné provést pomocí registračního formuláře dostupného na webovém portálu. Po schválení této registrace společností obdrží partner email s přístupovými údaji k jeho profilu a bude mu přidělen unikátní token pro volání APIs projektu. Následně je možné se kdykoliv do portálu přihlásit z jeho domovské stránky. Díky tokenu může partner při volání služeb projektu například zobrazovat neomezené množství výsledků. Pro neregistrovaného uživatele je však tento obsah omezen na 10 výsledků. (2)

Obrázek 2: Registrační formulář pro partnery [zdroj: screenshot autora]

Nástroje SCOAP3

Portál poskytuje svým registrovaným partnerům samoobslužné funkce (nástroje) a to pro často vyhledávané dokumenty. Mezi tyto funkce patří například exportní soubor, který obsahuje všechny články a autory s afilací za dané časové období a danou zemi. Vyžádaný výsledný soubor pak ve formátu CSV obdrží partner během 5 až 10 minut na svou emailovou adresu. Dalšími nástroji jsou například export autorů či export vyhledávání, který exportuje výsledek uživatelského rozhraní. (2)

Vyhledávání a rešeršní možnosti

První možností je, že cesta uživatele, který se rozhodne hledat v informacích týkajících se fyziky částic na portále SCOAP3, začíná zadáním požadovaného výrazu do vyhledávacího pole a kliknutím na tlačítko lupy zahájit vyhledávání.

Obrázek 3: Vyhledávací lišta repo.scoap3.org [zdroj: screenshot autora]

Další možností je pak vyhledávat dle vybraných vědeckých žurnálů, či partnerských zemí projektu odkud byly vědecké práce publikovány.

Obrázek 4: Vyhledávání dle žurnálu nebo země [zdroj: screenshot autora]

Jak vyhledávání dle výrazu tak i dle výběru vede uživatele na stejnou stránku, a to na stránku s výsledky hledání.

Obrázek 5: Strana výsledků hledání [zdroj: screenshot autora]

Výsledky hledání poté můžeme filtrovat dle pěti jednoduchých nabízených filtrů. Filtrovat lze dle roku publikace práce (konkrétní nebo rozsah), země odkud pochází některý z autorů práce (užitý vztah „AND“), v jakém vědeckém žurnále práce vyšla, a nakonec si výsledky můžeme seřadit od nejnovějších či těch s největší shodou hledání požadovaného výrazu. Výsledky mohou být zobrazeny buď v pořadí sestupném či vzestupném.

Jednotlivé výsledky jsou zobrazovány v náhledu, na kterém je možné vidět jméno práce, jména autorů, datum zveřejnění práce, náhled abstraktu, žurnál, ve kterém byla publikována, formáty a DOI (digital object identifier).

Celé uživatelské rozhraní je postaveno kolem služeb API, které byly navrženy k vyhledávání dotazů a založeny na ElasticSearch v6.2.4.

Společně s fasetami filtrů je však možné použít i řetězce dotazů. Tyto dotazy lze stavět nad použitelnými poli charakteristickými pro artefakt (záznam). Patří mezi ně:

  • jurnal: časopis, ve kterém byla práce publikována
  • author: celá jména autorů
  • country: země z přidružení autorů
  • affiliation: afilace od autorů
  • control_number: interní identifikátor přiřazený záznamu (record id)
  • record_creation_date: datum kdy byl záznam poprvé přidán do databáze
  • title: název práce
  • doi: DOIs článku
  • date: datum zveřejnění
  • year: dle roku vydání

Vyhledávání lze tedy provádět nad dostupnými poli. U vyhledávání podle časopisu (žurnálu), lze zadat buď jeho celý název, jako jurnal:“Acta Physics Polonica B“ nebo pouze jeho zkratku jurnal:“APPB“. U vyhledávání podle data pak lze hledat i v rozsahu jako date:=>2022-01-02.

Řetězce lze také různě kombinovat a to za pomocí operátorů „AND“ & „OR“. Například pokud bychom chtěli vyhledat práci, jejíž autoři pocházeli z Finska a zároveň z Francie, zadali bychom řetězec – country:(Finland AND France). Pokud bychom však chtěli, aby autoři pocházeli buď z Maďarska a nebo z Ruska tak bychom zadali řetězec – country:(Hungary OR Russia).

Poslední možností úpravy vyhledávacích řetězců je tzv. negace. Tedy pokud chceme vyhledat něco co neodpovídá naším požadavkům. Provedeme tak pomocí operátoru „NOT“. Dejme tomu, že hledáme všechny práce ze všech let kromě roku 2019 – year:NOT 2019. (2)

Popis indexu

Po rozkliknutí výsledku nalezenho artefaktu je uživatel přesměrován na stránku reprezentující vybranou práci (index). Zde je poskytnut její detailní popis. Detail nabízí výčtem shora název práce, abstrakt, jméno autorů a zaštiťující instituce, datum a místo publikace, DOI, metadata (možné prohlédnout ve formátu JSON), pod jakou vyšla práce licencí, copyright a v jakých formátech je práce k dispozici.

Obrázek 6: Detailní strana nalezeného artefaktu [zdroj: screenshot autora]

Od náhledového pole se však detailní zobrazení článku až na to, že poskytuje navíc metadata a celý nezkrácený abstrakt neliší.

„Help“ a dokumentace

Jak již bylo zmíněno dříve, celý zdrojový kód tohoto projektu je uložen na platformě Github a společně s ním i jeho dokumentace ve formě Github Wiki. Jelikož je autor článku zároveň vývojářem webových služeb a s tímto nástrojem má velké zkušenosti, byl mu tento fakt velikým potěšením a bylo velice snadné se v dokumentaci jako takové orientovat. Zároveň je ale nutné říci, že práci s tímto typem dokumentace zvládne i nezkušemný uživatel a vše je v ní velice dobře popsáno. Jsou zde popsány jak uživatelské návody pro ovládání rozhraní aplikace, tak i samotná implementace vlastních API pro případ, že by někdo chtěl využít tento informační zdroj například ve svém softwarovém řešení.

Obrázek 7: Repozitář projektu repo.scroap3.org na platformě GitHub [zdroj: screenshot autora]

V navigačním menu je také tlačítko „help“, které však uživatele odkáže pouze na základní a osekané shrnutí základních pravidel a popis způsobů užití tohoto portálu.

Závěr

SCOAP3 je webový portál obsahující záznamy autorů z pole fyziky částic. Jedná se nejen o projekt zajímavý obsahem ale i o technologicky vyspělý nástroj, který je uživatelsky příjemné využívat. Zároveň je jednoduché se orientovat v jeho výsledcích našeho hledání. Nástroj ocení především uživatelé, pro které fyzika částic znamená ať už profesní cestu a nebo „hlubší hobby“. Využití tohoto nástroje pak nejvíce padne na hlavu členů jednotlivých partnerských institucí projektu a vysokých škol zabývajících se touto vědní doménou.

Zdroje

[1] Sponsoring Consortium for Open Access Publishing in Particle Physics – SCOAP3 [online]. [cit. 1.5.2022]. Dostupné z: https://scoap3.org

[2] scoap3-next, wiki, documentation – SCOAP3 Repository [online]. [cit. 24.4.2022]. Dostupné z: https://github.com/SCOAP3/scoap3-next/wiki

[3] repo.scoap3.org – SCOAP3 Repository [online]. [cit. 24.4.2022]. Dostupné z: https://repo.scoap3.org/

Seznam obrázků

Obrázek 1: Úvodní strana repo.scoap3.org [zdroj: Autor]

Obrázek 2: Registrační formulář pro partnery [zdroj: Autor]

Obrázek 3: Vyhledávací lišta repo.scoap3.org [zdroj: Autor]

Obrázek 4: Vyhledávání dle žurnálu nebo země [zdroj: Autor]

Obrázek 5: Strana výsledků hledání [zdroj: Autor]

Obrázek 6: Detailní strana nalezeného artefaktu [zdroj: Autor]

Obrázek 7: Repozitář projektu repo.scroap3.org na platformě GitHub [zdroj: Autor]

Číst více

Další články