Sobota, 21 prosince, 2024

UNData: bohaté datové zdroje Spojených národů

Sdílet

UNdata je internetový volně dostupný vyhledávač, který usnadňuje dostupnost dat z databází, které jsou vlastněny organizací OSN. OSN působí po celém světě a hned v několika odlišných odvětvích, ať už se jedná o řešení globální krize vody nebo prevenci konfliktu mezi státy. I kvůli tomu je na UNdata dostupných mnoho datových řad, např. demografické, environmentální nebo komoditní. Mimo datových řad UNdata odkazuje na domovské stránce také na další data určené pro základní orientaci uživatelů, jedná se o:

  • Specializované databáze (MBS, SDG indicators a UNcomtrade),
  • oblíbené statistické tabulky,
  • statistické profily zemí, oblastí nebo regionů.

UNdata vznikli v rámci projektu „statistika jako veřejné dobro“ v roce 2005 za účelem poskytnout bezplatný přístup k světovým statistikám. (Division, UNdata | about us, 2021)

Základní uživatelské rozhraní, ze kterého návštěvník stránky může dále pokračovat na podrobné informace je jednoduché a přehledné. Obsahuje omezené množství prvků, ve kterých je možné se lehce zorientovat a dohledat tížená data. Celá webová aplikace je v anglickém jazyce a žádný další jazyk není bohužel dostupný.

Obr. 1 Základní rozhraní webové aplikace (Úvodní stránka portálu UNdata)

Rychlá navigace

Jak už bylo zmíněno v předchozí kapitole a je zřejmé z obr. 1 je možné přímo přejít na populární statistické tabulky, statistické profily zemí a specializované databáze, které mají ovšem vlastní domény a jedná se o další databáze poskytované UNSD.

V populárních statistických tabulkách je možné naleznout například témata jako populace (mapuje vývoj populace v letech), kriminalitu, cenové indexy a další. Jednotlivé tabulky je možné získat jako pdf nebo csv.

V rámci jednotlivých pdf tabulek je možné najít rozpad daných indexu na státy a rok.

Obr. 2 Index spotřebitelských cen (UNdata index spotřebitelských cen)

U některých států nejsou zaznamenána data za veškeré roky nebo v rámci obou indexu, jedná se zejména o státy rozvojové (Jemen, Zambie aj.). Pokud uživatel má zájem načíst stažený csv souboru s daty do vybraného analytického nástroje (v tomto případě jupyterlab) neměl by být žádný problém.

Obr. 3 Načtení indexu spotřebitelských cen do jupyterlab

V statistických profilech zemí, oblastí nebo regionů lze naleznout základní přehledy o dané zemi, které se zpravidla člení na:

  • Obecné informace,
  • ekonomické ukazatele,
  • sociální ukazatelé,
  • ukazatele stavu přírody a infrastruktury.

U některých zemí není tento přehled tak podrobný a je vynechán jeden nebo více bodů. V rámci samotného přehledu země lze tyto členění rozložit na podrobnější ukazatele. Některé metriky mají u sebe poznámky viz. „surface area“. Význam těchto poznámek je uveden pod ikonou v právem horním rohu.

Obr. 4 Statistický profil České republiky (UNdata obecné informace o České republice)

Ze specializovaných databází, které patří pod OSN jsou zmíněné tři. Jedná se o:

  • SDG indicators,
  • UN comtrade,
  • MBS.

SDG indicators poskytuje informace o vývoji a postupu v rámci jednotlivých indikátorů pro udržitelný rozvoj (Division, SDG Indicators, 2021). V základní nabídce lze nalézt jednotlivé cíle, skrze které je možné se dostat na podcíle a indikátory daných podcílů. Po vybrání indikátoru lze výběr zúžit na určitou geografickou část nebo vymezit jen určité časové období. Zobrazení dat je formě tabulky, kterou je možné stáhnout jako excel soubor.

UN comtrade je největším uložištěm údajů o mezinárodním obchodu. Obsahuje statistiky o mezinárodním obchodě dle typu komodit, služeb a partnerských zemí (STATISTICS, 2021). UN comtrade poskytuje mimo možnosti stažení dat i možnost rovnou si data vizualizovat.

MBS nabízí aktuální ekonomické a sociální statistiky pro více než 200 zemí a teritorii světa. V rámci statistik lze naleznout různé ukazatele ilustrující ekonomické trendy, vývoj počtu obyvatel, cenové indexy aj (Division, Monthly Bulletin of Statistics Online, 2021).Výběr dat lze provést za pomocí výběru tématu (finance, těžba aj.), země a časového období. Vybraná data pak lze zobrazit jako tabulku, stáhnout jako csv nebo XML.

Vyhledávání a získávání dat

Získání dat pomocí UNdata API

Data lze získat i pomocí API, které UNdata nabízí. Uživatelé mohou použít API k získání dat a zobrazení na webových stránkách nebo ke stažení do vlastního uložiště. API je implementováno jako webová služba REST a SOAP kterou lze použít k dotazovaní na datové tržiště pomocí SDMX. Pro úspěšné získání dat pomocí SOAP service je nutné vytvořit SDMX dotaz. Tento dotaz se dá vytvořit pomocí SDMX browseru ve kterém uživatel určí parametry dotazu.

Obr. 5 SDMX browser (UNdata SDMX Web Service)

Pro získání dat je nutné použít HTTP POST k odeslání dotazu SDMX, který získáte pomocí tlačítka Download Query v SDMX browseru. (Division, UNdata | api manual, 2021)

Jednoduché vyhledávání

Pro nenáročné uživatele nabízí UN data možnost vyhledávat jen pomocí klíčových slov. Výsledky jsou pak uživateli zobrazeny jako seznam, kde nastala shoda s klíčovým slovem. V rámci zjednodušení hledání nabízí stránka vybrání dalších filtrů, které konkretizují vyhledávání uživatele.

Obr. 6 základní vyhledávání na UNdata (UNdata search „Czechia“)

Vyhledávání pomocí procházení datových tržišť

Další možností procházení dostupných dat z webové aplikace UNdata je skrze odkaz „datamarts“. V rámci tohoto odkazu se uživatel dostane do módu „explorer“ ve kterém může procházet data dle samotného datového tržiště, tématu, kterého se data týkají nebo zdroje dat. Poté, co uživatel rozklikne jeden z bodů, tak se bod rozpadne na podtémata, které pod dané nadřazené téma patří.

Pro uživatele je zde připravena možnost pouhé ukázky dat, která zobrazí ukazateli prvních 10 záznamů v datové řadě a poskytne tak uživateli základní přehled o sloupcích v tabulce, datových typech nebo velikosti. Druhá možnost je přejít rovnou na data. V tomto případě je uživatel přesměrován na prostředí, ve kterém mu jsou nejen poskytnuty informace o daném datovém tržišti, ale lze data jednoduchými filtry prozkoumat nebo je možné data stáhnout ve formátu XML, csv nebo txt s různými separátory.

Obr. 7 mód explorer (UNdata explorer mode)

Pokročilé vyhledávání

Komplexní vyhledávání nabízí tzv. „advanced search“. Při použití pokročilého vyhledávání je možné definovat více kritérií, dle kterých chce uživatel vyhledávat. Tyto kritéria lze navolit skrze uživatelský přívětivé prostředí, nebo skrze textové pole pomocí zadání příkazu dle specifické syntaxe, kterou má tato webová aplikace.

Vymezení, která pro vyhledávání lze určit jsou pomocí státu, kontinentu nebo částí kontinentu. Dále lze upřesnit zdroj, ze kterého data mají pocházet (celkem je na výběr z 32 různých zdrojů) a na závěr časové období, které má být v datové řadě.

Obr. 8 Prostředí pro výběr pokročilého dotazu (UNdata advanced search)

Příkaz do textového pole je po vybrání kritérií vygenerován do textového pole a proveden. Poté jsou zobrazeny zdroje, které se shodují s kritérii, a zároveň je zobrazen příkaz, kterým je možné získat daný výpis. Pro komplexnější prohledávání webové stránky není ovšem nutné přecházet do grafického prostředí pokročilých filtrů, ale je možné napsat příkaz přímo do jakéhokoliv textového pole, které slouží pro vyhledávání.

Pokud bychom tedy chtěli hledat například v letech 2000 – 2020 pro Afriku ze zdroje „Population Estimates and Projections“ náš příkaz by vypadal takto:

area[Africa] 2000-2020 datamart[PopDiv]

Operátory pokročilého vyhledávání

Jak je zřejmé, v rámci „advanced search“ je možné si příkaz pro hledání napsat. Syntaxe pro příkaz hledání je specifická pro UNdata tento příkaz lze napsat do jakéholiv textového pole, které je připravené na vyhledávání v rámci webové stránky UNdata. 

Pro vymezení území je nutné použít klíčové slovo area a do hranatých závorek uvést jakých konkrétních území se má dotaz týkat. Je klíčové vědět, že je možné uvést pouze názvy v angličtině. Systém má předpřipravené vymezení území jako „All countries“ nebo jenom části kontinentu, např.: Central America, Eastern Asia nebo Eastern Africa. Vzorový příkaz pro vymezení území je například area[Africa, Australia].

Dále lze limitovat časové období, kterého se má datová řada týkat. Pro toto je možné použít klíčové slovo year a opět do hranatých závorek upřesnit jakých let se má dotaz týkat, například year[1990,2002,2010]. Pro vymezení časového období je možné také použít pouze zadání rozmezí, kterého se mají záznamy z časové řady týkat area[Africa, Australia] 1990-2020.

Poslední, co lze v dotazu u UNdata omezit je z jakého datového tržiště mají data pocházet. Toto lze učinit za pomocí klíčového slova datamart a vymezení jaké datové tržiště má vyhledávač uvažovat pomocí hranatých závorek datamart[UNAIDS,WHO].

Typologie a charakteristika dat

Datová tržiště obsahují data strukturovaná, většinou se jedná o prosté tabulky bez jakéhokoliv definovaného vztahu na jiné datové tržiště, a proto je možné jej jednoduše stáhnout a pracovat s nimi ve vlastním analytickém prostředí.

Obr. 9 Ukázka z vybraného datového tržiště (UNdata datamart WHO)

Z pohledu charakteristiky dat obsažených v datových tržištích je možné naleznout jak data kvantitativní (v obr. 13 sloupec „Value“) tak data kvalitativní.

Příklady využití dat

Vzhledem k obrovskému množství dat, které obsahuje webová aplikace UNdata je možné využití dat široké, ať už v soukromém sektoru tak veřejném.

Pro soukromý sektor je data možné využít například pro získání dat v rámci analýzy makroprostředí (např. PESTEL analýza), kde data získaná poskytnou informace o kvalitě infrastruktury v zemi (zdroj World Development Indicators), data o nezaměstnanosti (zdroj LABORSTA) nebo data o vzdělání (zdroj UIS Data Centre). Tyto data mohou pomoci rozhodnout se podniku, zdali se na daný zahraniční trh rozšíří nebo na jaké kritické problémy může podnik v rámci daného území narazit.

Pro využití ve veřejném sektoru je vhodné si představit nějakou veřejnou neziskovou organizaci (např. Člověk v tísni). Tato veřejná nezisková organizace může využít data OSN pro získání přehledu závažnosti problémů na jednotlivých územích a dle toho alokovat zdroje.

Závěr

UNdata obsahuje obrovské množství dat a data mohou být využita mnohými způsoby. Vyhledávání v rámci webové aplikace UNdata je jednoduché a syntaxe pro pokročilé vyhledávání je intuitivní. Pochopení webových stránek není elementární, protože obsahuje mnoho různých forem hledání, skrze které se dostane jednotlivec na totožné informace, nicméně každý způsob procházení datových tržišť si najde své uživatele, kteří budou daný přístup k datům preferovat.

Uživatelské rozhrání je jemné bez zbytečných prvků, které by uživateli mohli jakkoliv rozptylovat. Bylo by v každém případě vhodné udělat průvodce po stránkách, jehož cílem by bylo pomoci uživateli se zorientovat při prvním užívání.

 

Reference

Commission, E. (2021). NSI .NET Client. Načteno z data.un.org: https://data.un.org/SdmxBrowser/start

Division, U. N. (2021). Data.un.org. Načteno z Data.un.org: http://data.un.org/_docs/SYB/PDFs/SYB63_128_202009_Consumer%20Price%20index.pdf

Division, U. N. (2. 2 2021). Monthly Bulletin of Statistics Online. Načteno z https://unstats.un.org/: https://unstats.un.org/unsd/mbs/introduction.aspx

Division, U. N. (2. 2 2021). SDG Indicators. Načteno z https://unstats.un.org: https://unstats.un.org/sdgs/indicators/database

Division, U. N. (10. 2 2021). Undata. Načteno z UNdata: https://data.un.org/Default.aspx

Division, U. N. (31. 1 2021). UNdata. Načteno z http://data.un.org/default.aspx

Division, U. N. (1. 2 2021). UNdata | about us. Načteno z Web UNdata: http://data.un.org/Host.aspx?Content=About

Division, U. N. (2021). UNdata | advanced search. Načteno z data.un.org: http://data.un.org/AdvancedSearch.aspx

Division, U. N. (5. 2 2021). UNdata | api manual. Načteno z http://data.un.org/: http://data.un.org/Host.aspx?Content=API

Division, U. N. (2021). UNdata | explorer. Načteno z data.un.org: http://data.un.org/Explorer.aspx

Division, U. N. (2021). UNdata | record view | Age-standardized mortality rate by causes. Načteno z data.un.org: http://data.un.org/Data.aspx?q=age+standardized+mortality+rate&d=WHO&f=MEASURE_CODE%3aWHS2_3070_all

Division, U. N. (2021). UNdata | search results. Načteno z data.un.org: https://data.un.org/Search.aspx?q=Czechia

Division, U. N. (2021). UNdata app. Načteno z data.un.org: https://data.un.org/en/iso/cz.html

Kdo jsme a co děláme. (31. 1 2021). Načteno z https://www.osn.cz/icentrum/kdo-jsme-a-co-delame/

OSN. (31. 1 2021). Cíle organizace. Načteno z https://www.osn.cz/osn/cil/

STATISTICS, U. T. (2. 2 2021). What is UN comtrade? Načteno z https://unstats.un.org: https://unstats.un.org/unsd/tradekb/Knowledgebase/50075/What-is-UN-Comtrade

 

 

Číst více

Další články