Pondělí, 18 listopadu, 2024

DataONE.org: téměř 950 tisíc datasetů o životě na zemi

Sdílet

Úvod

DataONE je komunitně řízený program, který poskytuje přístup k datům o životě na Zemi a prostředí, které jej podporuje, a to prostřednictvím několika členských repozitářů. Program podporuje pokročilé vyhledávání a objevování dat týkajících se Země a životního prostředí. DataONE podporuje nejlepší postupy v řízení dat prostřednictvím vzdělávacích zdrojů a materiálů. Vize programu je, aby výzkumníci, pedagogové a veřejnost používali DataONE pro lepší pochopení a ochranu života na Zemi a prostředí, které jej udržuje.

Informační zdroj DataONE

Platforma byla spuštěna v roce 2009 s finanční podporou National Science Foundation (NSF) jako jeden z prvních programů DataNet. Během posledních pěti let bylo dosaženo významných úspěchů, jako je zpřístupnění více než 260 000 veřejně dostupných dat a metadatových objektů prostřednictvím vyhledávače DataONE. Paralelně byla rozšířena síť o 22 národních a mezinárodních datových repositářů (DataONE 2023)

Vyhledávání repozitářů v DataONE

První možností, jak vyhledávat repositáře v nástroji dataOne.org je zadání požadavku přímo do vyhledávače na úvodní stránce.

Obrázek 1: Úvodní stránka dataOne.org a možnosti hledání. [zdroj obrázku: autor]

Duhou možností je pak využití rozšířeného vyhledávání, ke kterému se můžeme dostat dvěma způsoby. První je prokliknutím se přes úvodní stranu tlačítkem Advanced search nebo přes horní lištu Data-> Find data.

Obrázek 2: Úvodní stránka dataOne.org a možnost hledání přes lištu. [zdroj obrázku: autor]

Rozložení obrazovky

Vybereme-li možnost rozšířeného vyhledávání v levé části obrazovky jsou umístěny filtry, které umožňují detailní nastavení parametrů vyhledávání. Po aktivaci vybraného filtru se data odpovídající daným kritériím zobrazí v prostřední části obrazovky. Tím uživatel získá okamžitý přehled o repozitářích, které odpovídají specifickým požadavkům.Výsledky jsou následně prezentovány prostřednictvím strukturovaného rozložení, které zahrnuje nejen samotná data, ale také vizualizační prvky. Kromě samotných repozitářů je také patrný jejich počet v konkrétní oblasti.

Obrázek 3: Vyhledávání řepozitářů podle jednotlivých filtrů. [zdroj obrázku: autor]

Vyhledávání za pomocí filtrů

Vyhledávání podle datových atributů (Data atribute) v DataONE umožňuje uživatelům specifikovat konkrétní charakteristiky nebo vlastnosti dat, které hledají. Tyto atributy mohou zahrnovat různé informace o datech, jako jsou typy, kvalita dat a další konkrétním příkladem jsou pak statistický data viz Obrázek 5.

Obrázek 4: Vyhledávání za pomocí datového atributu – celsius. [zdroj obrázku: autor]

Vyhledávání podle anotace (Annotaion)představuje identifikaci a získání specifických vědeckých dat podle jejich detailního popisu.

Pokud rozklikneme Measurement Type a můžeme vybrat konkrétní možnost, například Area density Measurement Type atd. Po rozkliknutí plus u vybrané možnosti se zobrazí další nabídka s položkami. Například pro Temperature Measurement Type se nám otevře nabídka obsahující možnosti jako Air Temperature a Ground Temperature. Každou z těchto možností lze opět rozkliknout, aby se zobrazilo další detailní nabídka, jako jsou například dew point temperature a dry bulb temperature.

Obrázek 5: Vyhledávání za pomocí filtru anotace. [zdroj obrázku: autor]

Vyhledávání podle datových souborů (Data files) umožňuje uživatelům zaměřit své hledání na konkrétní datové soubory. Tato funkce slouží k efektivnímu nalezení specifických informací obsažených v datech. Výsledky budou filtrovány tak, aby zahrnovaly pouze ty položky, které mají konkrétní datový obsah nebo jsou spojeny s konkrétními datovými soubory. Filtr obsahuje také možnost hledání pouze repozitářů obsahující data.

Obrázek 6: Vyhledávání za pomocí filtru data files – pouze výsledky obsahující data. [zdroj obrázku: autor]

Filtr členský uzel (Member Node) slouží k omezení vyhledávání na konkrétní členské repozitáře nebo uzly. Tímto filtrem můžeme specifikovat, zda chceme hledat data pouze v určitých členských repositářích, pokud máme informace o konkrétním zdroji nebo organizaci.

Filtrování podle tvůrce (Creator)umožňuje omezit výsledky vyhledávání na data, která byla vytvořena konkrétním tvůrcem nebo týmem tvůrců. Stačí do vyhledávače vložit jméno vybraného tvůrce a systém vrátí relevantní výsledky spojené s tímto tvůrcem.

Filtrování podle roku (Year) umožňuje specifikovat časový rozsah, ve kterém byla data vytvořena nebo publikována. Tato funkce je užitečná při hledání dat v určitém časovém období. Filtr lze nastavit v rozmezí od roku 1800 do roku 2023, což umožňuje přesné omezení výsledků na konkrétní časové okno. U tohoto filtru je pak možné vybrat, jestli chceme hledat data publikovaná v tomto roce nebo data o tomto vymezeném období.

Obrázek 7: Vyhledávání za pomocí filtru rok. [zdroj obrázku: autor]

Filtrování podle identifikátoru (Identifier) je užitečné pro rychlé a přesné vyhledání specifických informací na základě konkrétního kódu nebo označen. Identifikátor představovuje jedinečný kód, označení nebo sérii znaků, které jednoznačně identifikují a odliší dané repozitáře od ostatních.

Obrázek 8:Ukázka výsledku vyhledávání podle identifikátoru a jeho identifikátor. [zdroj obrázku: autor]
Obrázek 9: Vyhledávání podle vybraného identifikátoru. [zdroj obrázku: autor]

Vyhledávání podle taxonu (Taxon) umožňuje uživatelům specifikovat konkrétní taxonomickou kategorii při hledání biologických dat. Taxonomickou kategorii může zahrnovat jména rostlin, živočichů nebo jiných biologických entit např. pěvci.

Obrázek 10: Vyhledávání za pomocí vybraného taxonu – pěvci. [zdroj obrázku: autor]

Zapnutí filtru lokace (Location) je užitečné pro omezení výsledků vyhledávání na data pocházející z konkrétních geografických oblastí, což může být důležité při studiu dat s regionálním významem.

Po kliknutí na některou část v mapě se uživateli otevře stránka se všemi repozitáři, které jsou publikovány v dané zemi. Na obrázku 12 jsou zobrazeny repozitáře publikované na území České republiky.

Obrázek 11: Nabídka repozitářů v České republice.  [zdroj obrázku: autor]

Každý repozitář je na identifikován těmito informacemi:

People and Associated Parties: jméno osob, které repozitář na portál publikovali, v našem příkladě Jiri Kadlec

Date Uploaded: rok ve kterém byl repozitář publikován na portálu, v našem příkladě 2021

Name: jméno repozitáře, v našem příkladě Ski tracks from Garmin 2012–2015, quality controlled

Id: uvádí unikátní identifikační číslo přidělené repozitáři, v našem příkladě sha256:0ca56cf76b7fb94f8db9b0b962614d480bc5edf4fd7567a163c6097fe6b51fd7

Obrázek 12: Ukázka repozitáře publikovaném v České republice. [zdroj obrázku: autor]

Stejný repozitář, jako je například „Ski tracks from Garmin 2012–2015, quality controlled“ bychom vyhledali také podle klíčových slov jako jsou gps, garmin, které jsou v popisu repozitáře uvedeny. Trvalo by to však výrazně delší dobu, protože repozitářů se pod každým uvedeným klíčovým slovem nachází velké množství.

Obrázek 13: Ukázka počtu nalezených repozitářů pod klíčovým slovem ski. [zdroj obrázku: autor]

Pokud rozklikneme vybraný repozitář zobrazí se nám ještě více detailních informací, které jsou rozděleny do několika částí:

Obecné (General):

  • Id repozitáře,
  • Abstrakt repozitáře,
  • Klíčová slova repozitáře.

Geografická oblast (Geographic Region):

  • Souřadnice jižní hranice,
  • Souřadnice severní hranice,
  • Souřadnice západní hranice,
  • Souřadnice východní hranice.

Lidé a přidružené strany (People and Associated Parties):

  • Původ

Řízení přístupu (Access Control ):

  • Veřejné
  • Předkladatel
  • Držitel práv
  • Práva pro čtení
  • Autoritativní MN

Další (Other):

  • Sériové id
  • Název souboru
  • Typ média
  • Formát id
  • Typ formátu
  • Povolení replikování
  • Počet replikování
  • Datum zveřejnění
  • Datum aktualizace
  • Datum úpravy
  • Zdroj dat
  • Stav replikace
  • Edice
  • Verze
  • a další…
Obrázek 14: : Detailní informace repozitáře. [zdroj obrázku: autor]

Příklady využití

Informační zdroj DataOne můžeme využit:

  • K nalezení rozsáhlých biologických dat o rozmanitosti flóry a fauny v ekosystémech.
  • K nalezení komplexních meteorologických dat týkajících se klimatických podmínek na globální úrovni.
  • K nalezení rozsáhlých ekologických dat o studiích populací mořských živočichů a jejich prostředí ve světových oceánech:

Příklad vyhledání konkrétního zdroje z České republiky:

Na obrázku můžeme vidět repozitář Ski tracks from Garmin 2012–2015, quality controlled, který podle abstraktu obsahuje data o Lyžařských stopách v Česku a okolních regionech, které sbírají běžkaři pomocí sítě Garmin Connect. Údaje o stopách byly kontrolovány z hlediska kvality a stopy zaznamenané na hlavních silnicích a na umělém sněhu byly odstraněny. Přiložený shapefile obsahuje data z období 2012-2015.

Obrázek 15: Vybraná ukázka konkrétního použití dataONE k vyhledání repozitáře. [zdroj obrázku: autor]

Kliknutím na odkaz je možné se dostat přímo na stránky hydroshare, kde je možné zobrazit data několika způsoby. Případně kliknutím na odkaz níže je možné si data přímo stáhnout.

Obrázek 16: URL odkaz nacházejíce v detailu repozitáře. [zdroj obrázku: autor]
Obrázek 17: URL odkaz nacházející se na stránkách repozitáře odkazující na stránku Hydroshare. [zdroj obrázku: autor]

Závěr

Tato práce popisuje, jak DataONE umožňuje přístup k repozitářům, podporuje vyhledávání a objevování informací prostřednictvím různých rešeršních možností. Rovněž se zabývá strukturou tohoto informačního zdroje, které zahrnují širokou škálu vědeckých disciplín.

DataONE nejenže umožňuje vědcům a výzkumníkům lépe porozumět životu na Zemi a ochraně životního prostředí, ale také poskytuje platformu pro spolupráci, vzdělávání a sdílení osvědčených postupů v oblasti vědeckých dat.

Zdroj DataONE hraje klíčovou roli v podpoře nových vědeckých poznatků a vytváření znalostí o životě na Zemi a prostředí, které ho udržuje. Je to nejen nástroj pro vědce a výzkumníky, ale také prostředek, který otevírá možnosti pro širokou veřejnost a vzdělávací instituce v oblasti environmentálního vzdělávání.

Zdroje

DataONE, 2023Wikipedia [online]. Získáno z : https://en.wikipedia.org/w/index.php?title=DataONE&oldid=1177615050 [cit. 06.12.2023]. Page Version ID: 1177615050

Data Observation Network for Earth | DataONE, DataOne [online]. Získáno z : https://www.dataone.org/ [cit. 06.12. 2023].

Seznam obrázků

Obrázek 1: Úvodní stránka dataOne.org a možnosti hledání. [zdroj obrázku: autor]

Obrázek 2: Úvodní stránka dataOne.org a možnost hledání přes lištu. [zdroj obrázku: autor]

Obrázek 3: Vyhledávání řepozitářů podle jednotlivých filtrů. [zdroj obrázku: autor]

Obrázek 4: Vyhledávání za pomocí filtru data atributů. [zdroj obrázku: autor]

Obrázek 5: Vyhledávání za pomocí filtru anotace. [zdroj obrázku: autor]

Obrázek 6: Vyhledávání za pomocí filtru data files – pouze výsledky obsahující data. [zdroj obrázku: autor]

Obrázek 7: Vyhledávání za pomocí filtru rok. [zdroj obrázku: autor]

Obrázek 8: Ukázka výsledku vyhledávání podle identifikátoru a jeho identifikátor. [zdroj obrázku: autor]

Obrázek 9: Vyhledávání podle vybraného identifikátoru. [zdroj obrázku: autor]

Obrázek 10: Vyhledávání za pomocí vybraného taxonu – pěvci. [zdroj obrázku: autor]

Obrázek 11: Nabídka repozitářů v České republice. [zdroj obrázku: autor]

Obrázek 12: Ukázka repozitáře publikovaném v České republice.[zdroj obrázku: autor]

Obrázek 13: Ukázka počtu nalezených repozitářů pod klíčovým slovem ski. [zdroj obrázku: autor]

Obrázek 14: Detailní informace repozitáře. [zdroj obrázku: autor]

Obrázek 15: Vybraná ukázka konkrétního použití dataONE k vyhledání repozitáře. [zdroj obrázku: autor]

Obrázek 16: URL odkaz nacházejíce v detailu repozitáře. [zdroj obrázku: autor]

Obrázek 17: URL odkaz nacházející se na stránkách repozitáře odkazující na stránku Hydroshare. [zdroj obrázku: autor]

Číst více

Další články