Pondělí, 23 prosince, 2024

DATA.GOV: Otevřená data poskytovaná vládou USA

Sdílet

Úvod

Portál data.gov, pomocí kterého vláda USA poskytuje otevřená data veřejnosti vznikl v roce 2009. Založila ho a spravuje ho vládní agentura General Service Administration, sídlící ve Washington D.C.. Projekt je postavený na open source tenchologiích CKAN a WordPress a celý jeho vývoj je veřejně přístupný na platformě GitHub. [1] Celý projekt vznikl pod vedením Viveka Kundry, který byl do pozice jmenován prezidentem Barackem Obamou. [2] Vivek Kundra se kromě poskytování veřejných datasetů zasadil také o vytvoření portálu recovery.gov, kde vláda transparentně poskytovala informace o finančních tocích v rámci stimulačního balíčku ARRA (American Recovery and Reinvestment Act of 2009). [3] K datu 7. 2. 2021 je počet datasetů na portále data.gov 192 180. [1]

V rámci otevření dat veřejnosti byl tedy v roce 2009 zřízen server data.gov, který funguje pro shromažďování a vyhledávání dat, poskytovaných vládou USA. Na tomto portále by měla být všechna data, která vláda generuje a které zároveň nejsou soukromá nebo nemohou být veřejná z bezpečnostních důvodů. Celý projekt je postavený na součinnosti vlády a jednotlivců. Podle tvůrce tohoto portálu, Viveka Kundry projekt „měl zajistit, že se vláda dokáže vypořádat s novou realitou.” [2] Celá myšlenka otevřených dat poskytovaných státními orgány je postavena na tom, že lidé, kteří budou mít k dispozici všechna tato data, se mohou podílet na připomínkování vládních akcí, samotné kontrole nebo mohou pomocí dat nabídnout i lepší řešení. Taková občanská aktivita je pomocí portálu data.gov dokonce i finančně odměňována. Jak konkrétně, je uvedeno pod záložkou Challenges u jednotlivých témat dat portálu data.gov (např. https://www.data.gov/energy/energy-challenges u energií).

Rešeršní možnosti

První a základní možností, jak hledat datasety na portálu data.gov, je klasický search box, který se nachází buď defaultně v pravém horním horu obrazovky nebo po otevření data catalogu (kliknutí na záložku DATA) uprostřed stránky. Tento search box slouží ke klasickému vyhledávání datasetů a pro jednotlivé vyhledávací příkazy není k dispozici žádný speciální syntax.

Pro upřesnění vyhledávané fráze slouží několik nástrojů. Prvním z nich jsou témata obsahů datasetů. Po otevření nabídky TOPICS dostaneme na výběr 7 témat, konkrétně: Agriculture, Climate, Energy, Local Government, Maritime, Ocean a Older Adults Health. Po otevření jednotlivých témat se objeví vždy trochu odlišné prostředí. Vždy se zobrazí nová lišta se záložkami, ale každé téma má odlišné složení těchto záložek, proto je jejich souhrn zobrazen na obrázku 1.

Obrázek 1: Složení záložek u jednotlivých témat na portále data.gov. [zdroj obrázku: data.gov]
Obrázek 1: Složení záložek u jednotlivých témat na portále data.gov. [zdroj obrázku: data.gov]

Některá témata mají záložku Updates, která funguje jako úvodní stránka pro dané téma. Na záložce Data se otevře příslušný Data catalog, filtrovaný pouze na dané téma. Pod záložkou Apps se nacházejí existující aplikace, které byly vytvořeny uživateli na daných otevřených datech tohoto tématu. Jak již bylo zmíněno, Challenges jsou pobídky uživatelům vyřešit konkrétní problémy daného odvětví pomocí otevřených dat poskytovaných tímto portálem, za finanční odměnu. Dále jsou záložky pro přidání nových dat, frekventované dotazy, zdroje dat a kontaktní údaje na příslušné oddělení. Pro téma Older Adults Health se tato lišta nezobrazí vůbec a uživatel je přesunut přímo na příslušnou část Data catalogu.

Druhou možností, jak zúžit počet vyhledaných datasetů je přes filtry, umístěné na levé straně prostředí Data catalogu. Jejich seznam s krátkým popisem je uveden níže:

  • Topics – témata obsahu datasetů
  • Dataset Type – zda je dataset geoprostorový
  • Tags – tagy datasetů
  • Formats – formáty datasetů
  • Organization Types – typ organizace, která nahrála dataset
  • Organization – název organizace, která nahrála dataset
  • Publishers – název vydavatele datasetu
  • Bureaus – příslušný úřad, jehož se dataset týká

Třetí možností, jak omezit vyhledané datasety, je použití mapy, která je první položkou mezi filtry. Na této mapě můžeme po kliknutí na ikonu tužky vravo nahoře vymezit obdélníkovým tvarem území. Po vymezení území se nám najdou pouze datasety, které se týkají tohoto vymezeného území.

Poté, co spustíme vyhledávání, na pravé části prostředí Data catalogu se nám zobrazí počet vyhledaných datasetů a pod ním výsledky vyhledávání čili jednotlivé vyhledané datasety. U takto vyhledaných datasetů je zobrazen název datasetu, pod ním název jeho vydavatele a jeho krátký popis. Pod popisem jsou barevně zobrazeny formáty, ve kterých můžeme dataset získat a vpravo je graficky znázorněno, jakého typu územního celku země se dataset týká (Federal, State, City …). Příklad výsledků vyhledání slovního spojení „police victim“ je znázorněn na Obrázku 2.

Obrázek 2: Výsledky vyhledávání na portále data.gov. [zdroj obrázku: data.gov]
Obrázek 2: Výsledky vyhledávání na portále data.gov. [zdroj obrázku: data.gov]

Výsledky vyhledávání má uživatel možnost seřadit podle Relevance, Názvu vzestupně, Názvu sestupně, Data úpravy, Popularity a Data přidání. Sestupnost nebo vzestupnost seřazení lze volit jen u názvu, data lze seřadit pouze od nejnovějšího.

Po kliknutí na konkrétní dataset se zobrazí jeho stránka. Vše bude názorně ukázáno na příkladu datasetu Allegheny County 911 Dispatches – EMS and Fire. Na stránce datasetu je na levé straně název organizace, pod kterou dataset spadá, její krátký popis a v pravém horním rohu graficky znázorněn typ územního celku, viz Obrázek 3.

Obrázek 3: Profil organizace na stránce datasetu. [zdroj obrázku: data.gov]
Obrázek 3: Profil organizace na stránce datasetu. [zdroj obrázku: data.gov]

Pod informacemi o organizaci je dále téma obsahu datasetu, vydavatel a jeho kontakt, možnost sdílení a odkaz na podmínky použití. V pravé, hlavní, části této stránky je případné upozornění ohledně podmínek užití datasetu, dále název a pod ním datum poslední úpravy metadat. Následuje podrobný popis datasetu. Poté jsou zobrazeny informace o dostupnosti a použití, viz Obrázek 4.

Obrázek 4: Informace o dostupnosti a použití na stránce datasetu. [zdroj obrázku: data.gov]
Obrázek 4: Informace o dostupnosti a použití na stránce datasetu. [zdroj obrázku: data.gov]

Dále se zobrazí všechny soubory dostupné ke stažení, u kterých je ikona znázorňující formát, název, krátký popis a tlačítko Download pro stažení. Pod soubory jsou data vytvoření a upravení metadat, zdroj metadat, tagy související s datasetem a doplňující metadata tohoto datasetu.

Příklady použití

Portál data.gov zobrazuje seznam aplikací poskytovaných otevřených dat na stránce https://www.data.gov/applications.  Zde můžeme najít, jaké projekty byly vytvořeny na základě otevřených dat, které poskytuje vláda USA. Pro představu je to například mobilní aplikace AIRnow, která poskytuje informace v reálném čase o čistotě ovzduší. Slouží jak pro aktuální informace, tak i pro předpověď. [4]

Dalším příkladem je portál Alternative Fueling Station Locator. Tato webová aplikace poskytuje geoprostorové informace o lokacích čerpácích a nabíjecích stanic s alternativními palivy na území USA a Kanady. Na mapě si uživatel může najít stanice pro čerpání bio nafty, CNG, elektrické energie, ethanolu, vodíku, LNG a propanu. [5] Celý projekt je postavený na mapách OpenStreetMap, což je skvělá ukázka toho, jak otevřená data a open-source projekty mohou reálně pomáhat.

Data portálu data.gov jsou využity i pro mobilní aplikaci LeafSnap, která pomáhá uživatelům poznávat rostliny. Pomocí aplikace stačí neznámou rostlinu vyfotit a aplikace za pomoci algoritmů pro rozpoznávání obrázků dokáže rostlinám na fotografii přiřadit jejich název. [6]

Závěr

Portál data.gov byl vytvořen za účelem zapojení občanů do veřejného dění, pro lepší transparentnost veřejné správy a její možnou kontrolu. Je to databáze informací ze všech různých oblastí, ve kterých určitým způsobem figuruje vláda USA, která tato data zpracovává, generuje a všechna data, která neporušují soukromí nebo nenarušují bezpečnost, poskytuje veřejnosti. Jelikož jsou tato data otevřená mohou se uplatnit za pomoci kohokoli na světě a zároveň je dbáno na to, aby to byla data ve formě, ve které nemohou být zneužita. Díky příkladům aplikací, které jsou přímo na stránkách data.gov uvedeny, lze potvrdit, že účel, který tento portál má, je alespoň částečně naplňován.

Zdroje

[1] ANON., nedatováno. About Data.gov. Data.gov [online] [vid. 2021-02-07]. Dostupné z: https://www.data.gov/about/

[2] HANSELL, Saul, 2009. The Nation’s New Chief Information Officer Speaks. Bits Blog [online]. [vid. 2021-02-07]. Dostupné z: https://bits.blogs.nytimes.com/2009/03/05/the-nations-new-chief-information-officer-speaks/

[3] ANON., nedatováno. Recovery.gov | U.S. Department of Education [online] [vid. 2021-02-07]. Dostupné z: https://www.ed.gov/open/plan/recovery-gov

[4] ADMIN |, nedatováno. AIRNOW WIDGET – Developer Central [online]. [vid. 2021-02-07]. Dostupné z: https://developer.epa.gov/airnow-widget/

[5] ANON., nedatováno. Alternative Fuels Data Center: Alternative Fueling Station Locator [online] [vid. 2021-02-07]. Dostupné z: https://afdc.energy.gov/stations/#/find/nearest

[6] ANON., nedatováno. LeafSnap – Plant Identification [online] [vid. 2021-02-07]. Dostupné z: https://plantidentifier.info/

Seznam obrázků

Obrázek 1: Složení záložek u jednotlivých témat na portále data.gov. [zdroj obrázku: data.gov]

Obrázek 2: Výsledky vyhledávání na portále data.gov. [zdroj obrázku: data.gov]

Obrázek 3: Profil organizace na stránce datasetu. [zdroj obrázku: dat.gov]

Obrázek 4: Informace o dostupnosti a použití na stránce datasetu. [zdroj obrázku: data.gov]

 

Číst více

Další články