Úvod
V dnešnej dobe, ktorá poskytuje množstvo dostupných informácií je čím ďalej náročnejšie orientovať sa, ktoré zdroje na získavanie informácii je potreba si zvoliť. S neustále narastajúcimi zdrojmi, ktoré internet poskytuje je časovo náročné vybrať si práve tie zdroje, ktoré budú obsahovať presne informácie, ktoré potrebujeme a ich vypovedajúca hodnota je pravdivá.
Informačný zdroj data.gouv.fr
Tento post popisuje platformu slúžiacu na šírenie verejných údajov francúzskeho štátu „data.gouv.fr“, ktorej prvá verzia bola vyvinutá agentúrou Logica pod vedením predsedu vlády Francoisa Fillona a spustená 5.12.2011. V decembri 2013 bola spustená druhá verzia spoločnosťou Etalab.
Nové stránky sú však už vyvíjané interne, založené na bezplatnom softvéri „Comprehensive Knowledge Archive Network“ (CKAN) vyvinutom prostredníctvom Open Knowledge Foundation. Od roku 2014 je stránka vyvíjaná na špecifickom softvéri s názvom udata. Zdrojový kód softvéru uData je publikovaný na serveri Github a sprístupnený pod GNU Affero General Public License.
Stránka je síce vo francúzskom jazyku a však je možné hore v záložke zmeniť jazyk na angličtinu.
Vyhľadávanie v repozitári data.gouv.fr
Vyhľadávať požadované informácie v repozitári data.gouv.fr je možné viacerými spôsobmi.
1. Vyhľadávanie pomocou políčka Search, ktoré nám ponúkne najpopulárnejšie data-sety, reuses a organizations, ktoré sa týkajú kľúčového slova, ktoré sme zadali. Ukážeme si to na príklade slova „COVID“.
2. Vyhľadávanie pomocou Data-Setov v hornej časti obrazovky. Táto sekcia nám ponúka všetky dostupné data-sety, ku dňu 8.5.2021 dostupných 36 885, z repozitára, ktoré si vieme následne zoradiť na základe nasledujúcich kritérií:
- Dátum vytvorenia
- Množstvo odberateľov
- Naposledy modifikované
- Množstvo prepoužití
- Titul
Po výbere kritérií si vieme zvoliť zoradenie od maxima po minimum alebo naopak. Na danej záložke je možnosť exportu data-setov alebo zdrojov podľa potreby do formátu csv.
V danej sekcii je taktiež možné data-sety filtrovať na základe nasledujúcich filtračných podmienok:
- Organizácií
- Badges
- Tags
- Licencií
- Časového pokrytia
- Priestorového pokrytia
- Teritoriálnej granularity
- Formátov
- Podľa frekvencii prepužití
Aby sme správne porozumeli čo sa pod danými filtračnými podmienkami skrýva uvedieme si 5 najčastejšie používaných hodnôt pre jednotlivé filtračné podmienky. Tieto hodnoty vrátane filtračných podmienok ponecháme v anglickom jazyku aby nedošlo k zmene vypovedajúcej hodnoty kvôli nepresnému prekladu. V tabuľke budú taktiež znázornené počty data-setov, ktoré budú zobrazené po zafiltrovaní.
Organizations | |
Values | Counts |
Departmental Directorate of the Cher Territories | 1017 |
Departmental Directorate of Territories and the Sea of the Somme | 999 |
Departmental Directorate of Ariège Territories | 908 |
Ile-de-France region | 883 |
Datalocal resource center | 759 |
Badges | |
Values | Counts |
C³ | 361 |
Openfield 16 | 96 |
Nec Mergitur | 54 |
Base Local Address | 12 |
Reference Data | 9 |
Tags | |
Values | Counts |
open-data | 15810 |
gateway-inspires | 15727 |
geoscientific-information | 5164 |
cadastral planning | 5018 |
land-use | 4641 |
Licenses | |
Values | Counts |
Open License / Open License version 2.0 | 22857 |
Open License / Open License | 5448 |
Open Data Commons Open Database License | 3758 |
License Not Specified | 3257 |
Other (Attribution) | 136 |
Temporal coverage | |
Values | Counts |
From 01/01/0199 | N/A |
Till 12/31/2108 | N/A |
Territorial granularity | |
Values | Counts |
Other | 17374 |
French town | 1564 |
Country | 924 |
French country | 600 |
French intermunicipal (EPCI) | 556 |
Formats | |
Values | Counts |
json | 24391 |
shp | 20256 |
csv | 15126 |
zip | 13824 |
document | 4988 |
Known reuses | |
Values | Counts |
Never reused | 32204 |
Little reused | 1301 |
Quite reused | 80 |
Heavily reused | 56 |
Spatial coverage | |
Values | Counts |
World | 7092 |
European Union | 7005 |
France | 6959 |
Metropilitan France | 3674 |
Occitania | 1011 |
3. Vyhľadávanie pomocou Reuses v hornej časti obrazovky. Táto sekcia nám ponúka všetky dostupné reuses, ku dňu 8.5.2021 dostupných 2 654, z repozitára, ktoré si vieme následne zoradiť na základe rovnakých kritérií ako pre data-sety kritériá navyše doplnené o data-sety. Reuses taktiež zobrazujú z koľkých data-setov sú zhotovené.
Rovnako ako aj pre data-sety aj reuses vieme filtrovať a však k dispozíciu sú len nasledujúce filtračné kategórie:
- Organizations
- Badges
- Type
- Tags
- Datasets
- Followers
4. Vyhľadávanie pomocou Organizations v hornej časti obrazovky. Táto sekcia nám ponúka všetky dostupné organizácie, ku dňu 8.5.2021 dostupných 2 816, z repozitára, ktoré si vieme následne zoradiť na základe rovnakých kritérií ako pre reuses kritériá doplnené o reuses.
Rovnako ako aj pre reuses aj organizations vieme filtrovať a však k dispozíciu sú len nasledujúce filtračné kategórie:
- Datasets
- Badges
- Reuses
- Followers
Ďalšími dostupnými zdrojmi dát, ktoré je možné využiť v rámci data.gouv.fr sú nasledujúce dokumentácie:
Technické dokumentácie dostupné na: https://doc.data.gouv.fr/
Open data guides dostupné na: https://guides.etalab.gouv.fr/
Pre prehľadnosť je možné využiť dashboard:
Pridávanie do repozitára data.gouv.fr
Webový portál neslúži len na dohľadávanie informácií ale taktiež umožnuje informácie nahrávať. Nahrávanie je možné už hore zmienených datasetov, reuses a organizácií .
Podmienkou nahrávania informácii je však registrácia a následné prihlásenie na webový portál.
Závěr
Webový portál data.gouv.fr je globálny register, ktorý obsahuje primárne dáta týkajúce sa francúzska ako krajiny. Ucelené oblasti informácií, ktoré chceme dohľadať vieme pekne filtrovať na základe datasetov a zoradiť si ich podľa potreby. Jedná sa o otvorenú platformu pre francúzske verejné informácie. Na príklade môžeme vidieť, že množstvo aktuálne publikovaných informácii alebo čerstvo pridávaných informácií sa týka najmä COVID problematiky a dopadmi, ktoré na Francúzsko táto pandémia má. Cieľom data.gouv.fr však nie je poskytnúť informácie len občanom francúzska ale rovnako aj ostatným užívateľom, ktorí sa chcú dozvedieť viac, či už o politických záležitostiach francúzska ale rovnako aj kultúre, ekonomike, práve, transporte alebo ostatných oblastí týkajúcich sa francúzska obsiahnutých vo viac ako 36 000 datasetov.
Zdroje
[1] data.gouv.fr – Registry of Research Data Repositories [online]. [cit. 8.05.2021]. Dostupné z: https://www.data.gouv.fr/en/
Zoznam obrázkov
Obrázok 1: Úvodná stránka data.gouv.fr a možnosti prekladu [zdroj obrázku: autor] 1
Obrázok 3: Dashboard pre data.gouv.fr [zdroj obrázku: autor] 5
Obrázok 4: Nahrávanie dát do data.gouv.fr [zdroj obrázku: autor] 6
Zoznam tabuliek
Tabuľka 1: Filtrovanie podľa Oragnizations [zdroj tabuľky: autor] 3
Tabuľka 4: Filtrovanie podľa Licenses [zdroj tabuľky: autor] 3
Tabuľka 5: Filtrovanie podľa Temporal coverage [zdroj tabuľky: autor] 4
Tabuľka 6: Filtrovanie podľa Territorial granularity [zdroj tabuľky: autor] 4
Tabuľka 7: Filtrovanie podľa Territorial Formats [zdroj tabuľky: autor] 4
Tabuľka 8: Filtrovanie podľa Known reuses [zdroj tabuľky: autor] 4
Tabuľka 9: Filtrovanie podľa Spatial coverage[zdroj tabuľky: autor] 4