Úvod
Žijeme v dobe, keď najhodnotnejšou komoditou na svete sú dáta. A práve v dnešnej informatickej spoločnosti, keď sa dáta produkujú neuveriteľne rýchlim tempom, je kľúčovou otázkou pre každý podnik, ktorý sa snaží byť konkurencie schopný na konkrétnych trhoch, či má prístup ku kvalitným, relevantným a dobre predspracovaným dátam a či sú schopný z nich extrahovať podstatné informácie užitočné pre ich biznis.
Preto je zásadné mať poznanie o tom, kde je možné sa dostať práve k takýmto dátam, nakoľko verejne prístupných dát je obrovské množstvo, ale kvalitných a využiteľných je len malé percento z nich. V takejto situácii je potrebné siahnuť po spoľahlivých a overených poskytovateľoch dát.
Čo je Quandl.com
Quandl je verejne dostupný informační zdroj, ktorý poskytuje svojím užívateľom veľké množstvo finančných, ekonomických a alternatívnych dát. Tieto dáta sú generované spoľahlivými partnermi portálu Quandl, avšak tento portál dáva príležitosť aj novým firmám prispievať dátami, ktoré budú dostupné z tohto informačného zdroja. Podľa oficiálneho popisu tohto portálu, je cieľom Quandlu inšpirovať zákazníkov k novým objavom a začleniť ich do obchodných stratégií na základe dát nimi poskytovanými.[1]
História
Tento informační zdroj vznikol v roku 2013, keď pri svojom vzniku poskytoval prístup k viac ako miliónu dostupných dátových množín. Postupne na Quandli pribúdal počet poskytovateľov dát až do bodu, keď momentálne je cez tento informačný zdroj dostupných vyše 25 miliónov dátových množín pričom denne sa ich z tohto portálu stiahne viac ako 10 miliónov. Aktuálne je tento portál využívaný 400 000 užívateľmi. [1]
Vyhľadávanie dátových množín a možnosti filtrovania
Spôsob ako je možné sa dopracovať k žiadaným dátam v portály Quandl, je pomocou prehľadávania databáze dátových množín pomocou zadania slovného spojenia, ktoré chceme aby sa nachádzalo buď priamo v názve, v konkrétnom stĺpci dátovej množiny alebo v jednej zo špecifikácií konkrétnych dátových množín.
Obrázok 1: Základná stránka na prehľadávanie dát v zdroji Quandl. [zdroj: autor]
Vyhľadávač prejde cez všetky tieto parametre a následne vráti všetky dátové množiny, kde sa hľadaný výraz spomína aspoň v jednej zo spomínaných kategórií. Následne je možné výstupy ešte bližšie špecifikovať pomocou filtrov dostupných v užívateľskom rozhraní. Tieto filtre slúžia na zmenšenie celkového počtu vrátených výsledkov a pre presnejšie špecifikovania dotazu ktorý chceme prehľadávať. Filtre sú nasledovné:
- Asset Class (trieda aktív)
- Data Type (dátový typ)
- Region (región)
- Publisher (vydavateľ)
Po zadaní výrazu ktorý chceme vyhľadávať, nám vyhľadávač vráti počet dátových vzoriek ktoré vyhovujú nášmu dotazu, spolu so zobrazením dátových množín, ktoré sa najviac zhodujú so zadanou frázou.
Obrázok 2: Zobrazenie výsledkov vyhľadávania slova stocks. [zdroj: autor]
Po vrátení všetkých výsledkov vyhľadávania určitého dotazu, je následne možnosť sa bližšie pozrieť na detaily konkrétnej dátovej množiny. V detailoch každého výsledku je zobrazená štruktúra dát vo formáte, v akom sú ukladané.
Obrázok 3: Bližšie zobrazenie detailov prvej dátovej množiny pre výsledky vyhľadávania slova stocks. [zdroj: autor]
Zároveň sú v rovnakom okne zobrazené detaily o vydavateľovi konkrétnej dátovej množiny, ako aj podrobný prehľad o technických vlastnostiach dát spolu so štýlom ich indexácie.
Obrázok 4: Popis a technické detaily konkrétneho výsledku vyhľadávania. [zdroj: autor]
Veľkou výhodou je priama dokumentácia a popísanie spôsobu, ako sa konkrétna dátová množina pomocou aplikačného programového rozhrania môže natiahnuť do určitého analytického nástroju, na ktorú je odkaz priamo v hlavnom okne zobrazujúcom detaily dátovej množiny.
Typológia dát
Ako už bolo spomínané, portál Quandl disponuje veľkým množstvom finančných, ekonomických a alternatívnych dát. Avšak dátové množiny z každého zo spomínaných celkov, sú v jednom z dvoch poskytovaných dátových formátov. Pre bližšie pochopenie jednotlivých formátov, dokumentačná časť portálu Quandl poskytuje nasledovné porovnanie:
- Tabuľky:
Tabuľky môžu obsahovať rôzne netriedené typy údajov (reťazce, čísla, dátumy atď.) a môžu byť filtrované podľa rôznych polí.[2]
- Časové rady:
Časová rada je súbor pozorovaní alebo meraní uskutočňovaných za určité časové obdobie, zvyčajne v rovnakých intervaloch. Časové rady sa bežne zobrazujú pomocou spojnicových grafov, kde os X predstavuje dátumy a os Y ďalšie numerické pozorovania.[2]
Je ale potrebné spomenúť, že finančné dáta sa zvyčajne sledujú za určité časové obdobie a následne sa porovnávajú hodnoty za určité časové intervaly, preto sú finančné dáta poskytované informačným zdrojom Quandl typicky vo formáte časových rád a pri ostatných typoch dát sa využívajú práve tabuľky.
Využitie zdroja
Zásadná výhoda informačného zdroja Quandl oproti iným poskytovateľom verejne dostupných dát spočíva v tom, že dáta s ktorými by ste chceli pracovať nie je potrebné manuálne sťahovať a následne ich načítať do vývojového prostredia. Každý užívateľ tohto portálu pri registrácii dostane vygenerovaný jedinečný kľúč na využitie aplikačného programového rozhrania (API), ktoré slúži na priame načítavanie dát z Quandlu do rôznych populárnych programovacích jazykov ako aj do veľkého množstva rôznych iných analytických nástrojov pomocou príslušného modulu v konkrétnom nástroji. Medzi najpopulárnejšie nástroje pomocou ktorých je možné vykonávať rôzne dátové analýzy a do ktorých je možné priamo načítať dáta z Quandlu patria:
- Python
- R
- Excel
- Ruby
Zároveň je priamo v portály Quandl dostupná podrobná dokumentácia ako správne využiť možnosti tejto funkcionality v jednotlivých nástrojoch a programovacích jazykoch.
Licencie
Informační zdroj Quandl má obrovskú zbierku bezplatných a otvorených údajov zhromaždených od rôznych organizácií: centrálnych bánk, vlád, nadnárodných organizácií a ďalších, ktoré je možné využívať bez akýchkoľvek obmedzení.[1] Avšak niektoré údaje v službe Quandl sú prémiové a prístup k nim je možné získať iba získaním statusu prémiového užívateľa, ktoré prebieha na spôsobe pravidelných mesačných platieb.
Oproti bezplatnému spôsobu užívania má prémiový užívateľ prístup navyše k využívaniu všetkých funkcionalít aplikačného programového rozhrania, ako aj rozšírené možnosti integrácie s ďalšími knižnicami a nástrojmi, sťahovanie v ľubovoľnom formáte a viac možností pre export dát a ich vizualizáciu. [2]
Potrebné je ale ešte spomenúť, že veľká časť zdrojov na Quandli je prístupná a ešte aj v istých prípadoch prémiových dátových množín, je možnosť využívať istú vzorku z celého dátového súboru.
Záver
Quandl je voľne dostupný informačný zdroj využívaný viac ako 400000 užívateľmi, ktorý poskytuje prístup k veľkému množstvu finančných, ekonomických a alternatívnych dát, ktoré by mali slúžiť profesionálom v týchto sektoroch ako podklad pre robenie zásadných rozhodnutí pre ich jednotlivé podniky. Hlavnou misiou tohto zdroju, je extrahovať hodnotu zo svetových dát.[1]
Zdroje
[1] Quandl, Home page [online]. Dostupné z: https://www.quandl.com
[2] Quandl, Guids [online]. Dostupné z: https://docs.quandl.com
Obrázok 1: Základná stránka na prehľadávanie dát v zdroji Quandl. [zdroj: autor]
Obrázok 2: Zobrazenie výsledkov vyhľadávania slova stocks. [zdroj: autor]
Obrázok 3: Bližšie zobrazenie detailov prvej dátovej množiny pre výsledky vyhľadávania slova stocks. [zdroj: autor]
Obrázok 4: Popis a technické detaily konkrétneho výsledku vyhľadávania. [zdroj: autor]