Pátek, 8 listopadu, 2024

NerdyData.com: tento zdroj není pro každého

Sdílet

Úvod

Dle [1] můžeme „nerda“ definovat jako člověka, který se silně věnuje určitému tématu, hlavně počítačům, a ví o tomto tématu spoustu věcí.

Přestože u většiny zdrojů dat můžeme již z jejich názvu odhadnout, čeho se týkají, myslím si, že NerdyData v tomto ohledu vystupují z řady, a i přesto si myslím, že je to dobrý název, protože typ dat, které poskytuje jsou nejvíce využitelná právě „nerdy“.

NerdyData [2] se osobně popisují jako „search engine for source code“ tedy vyhledavač zdrojového kódu. V poslední řadě by se ještě hodilo dodat, že se jedná o zdrojový kód webových stránek.

Data

Tato služba slouží k hledání technologií – ať už uživatelem definovaných kusů kódu či již konkrétních technologií, pro které NerdyData nabízejí již napsané dotazy, v jimi zaindexovaných webových stránkách. Nerdy data aktuálně uvádějí, že se jedná o více než 350 milionů stránek [2], s tím, že osobně jsem zkoušel vyhledávání i pro české domény jako seznam.cz či společnost cleverlance.cz, kde NerdyData znala obě stránky.

Výsledkem dotazů uživatel získá seznam webových stránek, které dotazu odpovídají, a poměrně velké množství atributů k jednotlivým stránkám. Mimo základní údaje jako je URL adresa, pak například vrací Alexa popularity rating[1], odhad rozpočtu utraceného za technologie, seznam nalezených emailových adres a v poslední řadě seznam odkazů na sociální sítě LinkedIn, Twitter, Facebook a Instagram. [2]

Obrázek 1 – seznam sloupců, zdroj [2]

Rešeršní možnosti

Společnost NerdyData nabízí několik způsobů pro přístup k jejich informacím:

  • Vyhledávání na jejich webu
  • Přístup přes API

Druhou zmíněnou možnost využívají další nástroje, které NerdyData nabízejí, což jsou přídavný modul do prohlížeče a doplněk do Slacku, které jsou zdarma, či placená služba sloužící pro cílení reklam v platformě LinkedIn.

Vyhledávání přes web

                NerdyData se snaží ulehčit uživateli vyhledávání a nabízí 3 různé pole pro zadání vyhledávaných parametrů, kde každé pole používá jeden logický operátor AND, OR nebo negaci viz Obrázek 2 – vyhledávací pole.

                Tento design by ve výsledku mohl omezovat složitost uživatelských dotazů, aneb pokud by uživatel chtěl používat složené dotazy ve stylu:

(‚Stripe‘ AND ‚Shopify‘) OR (‚Stripe‘ AND ‚Google Universal Analytics‘)

tak by toho zde nebyl schopen. Avšak nechám otevřenou otázkou, jestli je toto vzhledem k povaze poskytovaných dat zásadní chyba designu či pouze menší nedostatek.

Obrázek 2 – vyhledávací pole, zdroj [2]

Předdefinované dotazy pro hledání

Jak jsem již zmínil v kapitole Data, je možné použít předem definované dotazy pro různé webové technologie, které jsou rozděleny do 6 skupin viz Obrázek 3 – Druhy technologií, zdroj [3]

  1. Advertising
  2. Analytycs
  3. E-commerce
  4. Website Building
  5. Marketing
  6. Sales and Support

Na první pohled by se mohlo zdát, že se tyto kategorie poměrně překrývají, ale po pročtení podkategorií si myslím, že je tato kategorizace bezproblémová. Dohromady zde aktuálně najdeme necelých 700 technologií připravených pro hledání. [3]

Obrázek 3 – Druhy technologií, zdroj [3]

Další zvláštností, na kterou jsem zde narazil, je omezení velikosti jednoho hledaného termu na 35 znaků, které mi jejich support potvrdil, avšak nevysvětlil.

Přístup přes API

Přídavný modul do prohlížeče

                Osobně jsem otestoval jejich přídavný modul, který by měl na aktuálně načtené stránce vyhodnotit, jestli používá nějaké známé technologie jako je Stripe či Shopify, a na jejich základě odhadovat kolik zhruba stojí provoz dané webové stránky.

                Poté, co mi u několika pseudo náhodných českých stránek doplněk nenahlásil žádné technologie, jsem vybral několik technologií, které NerdyData na svém webu sledují, např. Google Adwords, a otevřel 5 různých odkazů webů, které mají technologii obsahovat. Následně jsem na každé stránce spustil doplněk. Testy jsem prováděl jak přes Mozilla Firefox tak Google Chrome.

U žádné z testovaných stránek mi ovšem tento doplněk nenahlásil žádné známé technologie a to i přestože jsem přistupoval ke stránkám přes odkazy přímo z webu NerdyData na stránky, které by měly obsahovat jim známé technologie. Tedy tento doplněk shledávám nefunkčním.

Dostupné licence

Bezplatné využití

                Nerdy data nabízí neplacený omezený přístup k používání své služby, který uživateli dovoluje provádět neomezený počet dotazů, u kterých uvidí počet výsledků a několik příkladů výsledků. Tento přístup dává poměrně dostačující možnosti pro nějaký statistický výzkum.

Placené služby

                Základem placených služeb, které NerdyData nabízí, jsou reporty. Rozdílem oproti neplacené verzi pak je kompletní seznam webových stránek, které odpovídají dotazu, a dále je součástí této služby měsíční monitoring sledující změny výsledků tohoto dotazu – tedy webové stránky, které buď hledanou technologii implementovaly či naopak ji přestaly používat.

                Placené služby jsou poskytovány ve 3 hlavních balíčcích, kde první za 75 dolarů umožňuje tvorbu jednoho reportu a jeho měsíční sledování, druhý balíček za 295 dolarů měsíčně nabízí neomezený počet reportů pro jednoho přihlášeného uživatele a poslední balíček za 495 dolarů pak rozšiřuje možnosti posledního zmíněného balíčku pro 6 uživatelů.

            Custom crawl

Speciálním případem placené služby, kterou nově NerdyData nabízejí, pak je Custom crawl, který prochází mnohem větší dataset s více než 3 miliardami záznamů, avšak s rozdílem, že nerenderuje Javascript a tedy je omezen pouze na HTML a HTTP hlavičky. U této služby pak není specifikována cena. [4]

Obrázek 4 – cena, zdroj [5]

Možnosti využití této služby

                Samotná NerdyData uvádějí 3 možné způsoby využití jejich služeb, na nichž stavějí svůj business, která tedy uvedu i s mým vysvětlením.

Supply of leads

                Dle [6] můžeme „lead“ chápat jako osobu, která by měla zájem o produkt či službu, kterou nabízíme. NerdyData pak využití jejich služby vidí jako možnost pro poskytovatele nějakých technoogií najít webové stránky, které používají nějaké již existující (konkurenční) řešení, aby jim mohli nabídnout (své) „lepší“ řešení.

Account-Based Marketing (ABM)

                Dalším příkladem je ABM, který dle [7] můžeme chápat jako marketingovou strategii, jež se soustředí na konkrétní leads a používá peronalizovanou kampaň.

                Toto použití však souvisí se zmíněnou dodatečnou službou cílení reklam v síti LinkedIn, nikoliv se samotným vyhledávačem.

Inspect Any Prospect’s Tech Stack and Budget

                Toto využití chápu jako zkoumání používaných technologií potenciálním zákazníkem a odhad jeho rozpočtu na technologie.

Statistický výzkum

Dalším využití schopností NerdyData by mohlo být provádění statistického výzkumu o technologiích používaných na webových stránkách či o používanosti technologií dohromady – ve spojení s nějakou jinou technologií.

Ve zkratce prodejce technologie může mít přehled o počtu implementací své technologie, avšak nebude pravděpodobně vědět kolik procent uživatelů zároveň s ní využívá i nějakou další technologii, což může být hodnotná informace například pro zkvalitnění nabízených služeb či například navázání nějakého strategického partnerství.

Závěr

                V prvé řadě bych řekl, že jsem se nikdy nesetkal s projektem podobným NerdyData, avšak po krátkém hledání podobné projekty existují, např https://publicwww.com/.

                Jak jsem již zmínil na začátku, NerdyData podle mě mohou sloužit jako zdroj informací velmi specifickému okruhu uživatelů či spíše dokonce se specifickými use cases a průměrný uživatel podle mě nebude mít způsob jak NerdyData využít.

                Co se týče use cases zmíněných samotnými NerdyData přijde mi, že se velmi překrývají a k tomu navíc používají různé výrazy, které dle mého chápání označují v zásadě to stejné, tedy bych uvítal podrobnější popis zmíněných use cases.

                Dále si myslím, že by NerdyData mohly být lépe zdokumentované, množství informací dostupné na jejich webu je poněkud omezené. Nejen z hlediska technického jako například řešení indexace či crawlingu webu, které by mohly být považovány za obchodní tajemství, ale i jiné jako například omezení délky jednotlivých hledaných termů na 35 znaků, na které jsem přišel testováním, když mi NerdyData pouze hlásala, že toto nelze hledat.

                Podtrženo, sečteno, přestože se považuji za člověka poměrně znalého v technologiích, tak si nemyslím, že bych v brzké době našel nějaké využití pro NerdyData. Dále NerdyData nepovažuji za zdroj dat, o kterém by lidé jen tak měli vědět, že existuje. Pokud někdo bude potřebovat „search engine for source code“ a bude toto hledat, tak najde.

Reference

[1] Cambridge dictionary. Nerd. [Online] [Citace: 6. 2. 2021.] https://dictionary.cambridge.org/dictionary/english/nerd.

[2] NerdyData. Support. [Online] [Citace: 6. 2. 2021.] https://www.nerdydata.com/support.

[3] NerdyData. Technologies. [Online] [Citace: 8. 2. 2021.] https://www.nerdydata.com/technologies.

[4] NerdyData. Custom crawls. [Online] [Citace: 6. 2. 2021.] https://www.nerdydata.com/custom.

[5]NerdyData. Pricing. [Online] [Citace: 6. 2. 2021.] https://www.nerdydata.com/pricing.

[6] LeadSquared. What is a Business Lead and Why are They Important? [Online] [Citace: 8. 2. 2021.] https://www.leadsquared.com/what-is-a-business-lead/.

[7] Optimizely. Account Based Marketing. [Online] [Citace: 8. 2. 2021.] https://www.optimizely.com/optimization-glossary/account-based-marketing/.

Číst více

Další články