Pondělí, 25 listopadu, 2024

Similarweb: znáte informační chování návštěvníků stránek?

Sdílet

Úvod

A i když v dnešní době není tak důležité sledovat jakou má kdo návštěvnost a důležitá je hlavně kvalitativní analýza dat na konkurenčních sítích a stránkách. Některé platformy na internetu umožňují webové stránky srovnávat z různých hledisek a nabízet tak nejen kvantitativní informace o počtu návštěvníků a míře prokliku, ale také jaká nejčastější slova návštěvníci těchto stránek hledají, v jaké kategorii nebo z jakých stránek se dostávají.

Informační zdroj Similarweb

Similarweb je společnost zabývající se poskytováním služeb jako jsou analýzy webových stránek nebo mobilních aplikací, aby pomáhala podnikům různých velikostí s informacemi o jejich zákaznících nebo konkurenci. Základem je datová analýza. Tato platforma v neplacené verzi poskytuje přehled o digitálním provozu webových stránek nebo aplikací a aktualizuje se jednou měsíčně.

Obr. 1 Úvodní stránka similarweb [zdroj: vlastní zpracování]

Jejich mise je poskytovat nejdůvěryhodnější, nejobsáhlejší a nejdetailnější pohled na digitální svět tak aby pomohli jejich zákazníkům překonat konkurenci a stát se jedničkou na trhu. Protože věří, že díky znalostem a jiným pohledům na data mohou pak firmy dělat lepší rozhodnutí a uspět tak v digitálním světě (Similarweb © 2021a).

Tato společnost vznikla v roce 2007 v Izraeli, nyní má kanceláře po celém světě (Lunden 2020).

Analyzují provoz na více než 100 milionech webových stránek a 4,7 milionech mobilních aplikací (Similarweb © 2021b).

Pro analýzu provozu jsou hlavně důležitá data, která společnost sbírá se statisticky reprezentativních datových sad, které jsou rozmanité napříč zeměmi, zařízeními, uživateli a hlavně odvětvími. Sběr dat probíhá pomocí následujících čtyř hlavních zdrojů.

Přímé měření primárními analytickými aplikacemi

Jsou to data, která jsou poskytovaná uživateli vlastnícími webové stránky a aplikace, ti si zvolí, že budou sdílet data z primárních analytických aplikací jako je například Google Analytics. Takto jsou poskytována jejich vlastní data i data jejich partnerů. Uživatelé díky tomu, že udělí souhlas s poskytováním těchto dat získají přehled porovnání digitálního provozu s dalšími webovými stránkami a aplikacemi, mohou tak svůj byznys vidět v mnohem širším kontextu a zejména týkajícím se trhu na kterém figurují. Zejména společnosti, které zpeněžují provoz na svých webových stránkách si často volí zveřejnění údajů o provozu ne jich webu, protože tím budou více atraktivní pro své zákazníky (Similarweb © 2021c).

Anonymní data ze zařízení

Po tomto zdroji dat následují anonymní údaje o digitálním provozu shromažďované z produktů Similarweb, které jsou nainstalované na zařízeních uživatelů těchto produktů a získávají tak anonymní data o chování těchto zařízení. U takto shromažďovaných dat je dán důraz na získávání údajů napříč různorodým publikem.

Veřejně dostupná

Dalším zdrojem jsou data, která jsou veřejně dostupná, Similarweb je algoritmicky zachycuje a indexuje. Pro upřesnění odhadů se do prediktivních modelů používají i údaje ze sčítání lidu.

Spolupráce

Posledním zdrojem jsou předem analyzovaná data získaná z různých spoluprací se společnostmi zabývajícími se CI a sběrem digitálních informací po celém internetu. Většina těchto společností sdílí analyzovaná data například pro zprávy, firmy nebo technologie. Partneři poskytující internetové připojení nebo poptávkové platformy jsou také součástí tohoto zdroje dat.

Po sběru dat probíhá datová syntéza pomocí procesů k vyčištění, porovnávání, syntézy, splynutí a zpracování za účelem modelování dat. Shromážděná data jsou normalizovaná ze všech datových zdrojů do jednoho pohledu, čímž může similarweb porovnávat weby a aplikace mezi sebou. Čištění dat a formátování vstupů dat je první krok. Data se odprošťují od různých osobních informací tak aby byly anonymizované. Dalším krokem je konsolidace dat, kde probíhá spojení velikého množství datových vstupů, aby mohlo být využité pokročilé prediktivní modelování. Posledním krokem syntézy dat je klasifikace datových vstupů kvůli kategorizaci a další syntézu.

Z hlediska datového modelování se na normalizovaná data používá pokročilá kalibrace strojového učení a prediktivní modely. Tyto techniky jsou využívány za účelem poskytování pravdivých a konzistentních pohledů na digitální data v čase. Učící modely strojového učení jsou používány pro snížení zkreslení a hluku dat.

Data jsou pak dodávány pomocí intelligence modulů jako přehledy připravené k použití buď na platformě similarweb nebo pomocí API (Similarweb © 2021c).

Vyhledávání webů a aplikací

Jak již bylo zmíněno v úvodu similarweb umožňuje zobrazovat informace o provozu a chování lidí na různých webových stránkách. Tato funkcionalita je volně dostupná a není třeba si vytvářet účet k získání přístupu k těmto údajům. Avšak to má jistá omezení jako že je to pouze základní přehled informací bez možnosti hlubšího poznání a nabízí jen limitovaný pohled do historie. Pro hlubší analýzy, přístup k více datům nebo možnosti využití API společnost similarweb nabízí různé placené produkty, kterými jsou produkt Research Intelligence, zaměřený na porovnávání společností a výkonu v rámci průmyslu a nabízí hlavně analýzy průmyslu, společností, aplikací, segmentů a zákazníků. Dalším produktem, který byl vybudován k optimalizaci získávání většího provozu na stránkách uživatelů se nazývá Digital Marketing Intelligence a je zaměřený hlavně na nástroje pro klíčová slova, reklamy a média. Dalšími produkty jsou Sales Intelligence, Investor Intelligence a Shopper intelligence. Těmito placenými produkty similarweb se v této práci nezabývám a následuje bližší přiblížení základní funkcionality.

Na úvodní stránce similarwebu je možné vyhledávat webové aplikace nebo stránky jen podle názvu nebo jeho části.

Obr. 2 Základní vyhledávání [zdroj: vlastní zpracování]

Dále jde vyhledávat pomocí žebříčků webů nebo aplikací. Z hlediska webových stránek se jedná o seznam 100 nejlepších stránek i když ve volně dostupné verzi se ukazuje jen 50 z nich. Jak můžeme vidět na obrázku níže (Obr. 3) webové stránky lze vyhledávat podle kategorie do které jsou zařazené a podle země. Výsledek hledání ukazuje změnu v řebříčku, jaká je průměrná doba strávená na stránkách, kolik průměrně stránek návštěvník prokliká a jaké je procento návštěvníků, kteří stránku ihned opustí.

Obr. 3 Nejlepší webové stránky [zdroj: vlastní zpracování]

V tomto přehledu získáme možnost vidět kdo je vydavatelem aplikace, jaké má hodnocení z hlediska použití, které je vypočítáno na základě instalací za poslední měsíc a aktivních uživatelů a jeho změnu a stejně tak hodnocení, které dostává od obchodu, v kterém je k dispozici ke stažení a také změnu. Řadit aplikace můžeme buď podle hodnocení použití nebo hodnocení obchodu.

Obr. 4 Řebříček nejlepších aplikací [zdroj: vlastní zpracování]

Oproti webovým stránkám u aplikací můžeme sledovat i trendy. Platí zde stejné možnosti vyhledávání jako u žebříčku. Ale v tomto pohledu můžeme vidět, které aplikace jsou právě v kurzu, které se nově dostali do nejlepších 100 aplikací, kterým hodnocení klesá a vypadli ze 100 nejlepších.

Obr. 5 Trendy aplikací [zdroj: vlastní zpracování]

Ukázky výsledku hledání

Při vyhledání webové stránky na platformě similarweb se uživateli zobrazí následující přehled. Pro účely této práce jsem zvolila webovou stránku univerzity www.vse.cz. Jak můžeme vidět z obrázku níže (Obr. 6) jsou k dispozici data ze září 2021. V horní části stránky se můžeme dozvědět globální pořadí v porovnání s ostatními webovými stránkami po celém světě, další údaj udává pořadí v České republice. Třetí údaj je trochu diskutabilní, jelikož se jedná o pořadí z hlediska kategorie v rámci země, podle údaje na obrázku se zdá, že web Vysoké školy ekonomické v Praze je 4. nejnavštěvovanějším z hlediska vysokoškolských webových stránek, ale po bližším zkoumání jsem zjistila, že je jen zařazen do jiné kategorie než, v které jsou webové stránky ČVUT nebo Karlovy univerzity. Takže je třeba tento údaj brát s rezervou a polohy z hlediska řebříčku nejlepších zkoumat v jiném pohledu zobrazení.

Obr. 6 Výsledky vyhledávání – přehled provozu [zdroj:vlastní zpracování]

Pěkný rozdíl ve výsledcích růstu nebo poklesu digitální provozu lze pozorovat v plošném grafu, kde je znatelný růst návštěvnosti v období zkouškového a jeho postupný pokles v letních měsících a růst s novým semestrem. Napravo jsou viditelné stejné údaje, které jsme si již mohli zobrazit v řebříčku nejlepších stránek.

Dalšími analýzami, které jsou k dispozici z hlediska provozu, a hlavně jeho zdrojů je mapa ukazující z jaké země se návštěvníci webové stránky připojují. Z hlediska VŠE není překvapením, že se více než 90 % návštěvníků je z České republiky. Hned pod grafem s mapou jsou vidět různé typy zdrojů pro zobrazení webových stránek v jejich desktopové verzi.

Obr. 7 Výsledky vyhledávání – zdroje provozu [zdroj: vlastní zpracování]

Dalším dostupným údajem je přehled stránek, které odkazují na www.vse.cz nebo naopak stránky, které návštěvníci navštíví odkazem z webové stránky.

Obr. 8 Výsledky vyhledávání – přesměrování [zdroj: vlastní zpracování]

Z hlediska nejčastěji vyhledávaných výrazů, které vedou k najité této webové stránky pomáhá následující přehled dělící se na výrazy neplacené, volně vyhledávané návštěvníky stránek a placená klíčová slova.

Obr. 9 Výsledky vyhledávání – vyhledávané termíny [zdroj: vlastní zpracování]

Předposledním přehledem je ukazatel sociálních médií, z kterých se lidé dostanou na stránky VŠE.

Obr. 10 Výsledky vyhledávání – sociální sítě [zdroj: vlastní zpracování]

Dalším možným pohledem je ukazatel z kde umístěných reklam proudí nejvíce návštěvníků, jelikož ale VŠE reklamy nepoužívá na obrázku níže je zobrazen přehled pro internetový obchod www.alza.cz.

Posledním možná nejzajímavějším přehledem je pohled na zájmy návštěvníků. Jsou zde zobrazené kategorie, o které se také zajímají, stránky, které často navštěvují a témata, která se jich týkají.

Obr. 11 Výsledky vyhledávání – zájmy publika [zdroj: vlastní zpracování]

Dále platforma similarweb také poskytuje přehled stránek, které jsou podobné nebo mají podobnou pozici v řebříčku. A mobilní aplikace, které se stránkou souvisí.

Podobné informace v menším měřítku lze zobrazovat pomocí nainstalovaného rozšíření do prohlížeče, jak je ukázáno na obrázku níže.

Obr. 12 Ukázka similarweb rozšíření v prohlížeči [zdroj: vlastní zpracování]

Similarweb také nabízí porovnání více webových stránek spolu navzájem. Ve volně dostupné verzi lze porovnávat jen dvě stránky najednou. Zkoušela jsem porovnat VŠE s ČZU a obě vysoké školy s celkem podobnými statistikami.

Obr. 13 Ukázka porovnání webových stránek [zdroj: vlastní zpracování]

Závěr

Ačkoliv se z hlediska platformy similarweb jedná o velmi propracovaný projekt, společnost ve volně dostupném neplaceném základu nabízí opravdu jen omezené množství údajů a dat, které bez koupení lepší licence jdou využít pro sledování konkurence minimálně. Myslím si, že na trhu platforem měřící digitální provoz na jiných stránkách existují další zajímavé alternativy, které umožňují mnohem hlubší pohledy na data jako jetřeba SpyFu nebo SE Ranking.

Zdroje

LUNDEN, Ingrid, 2020. SimilarWeb raises $120M for its AI-based market intelligence platform for sites and apps. TechCrunch [online]. [vid. 2021-12-06]. Dostupné z: https://social.techcrunch.com/2020/10/27/similarweb-raises-120m-for-its-ai-based-market-intelligence-platform-for-sites-and-apps/

SIMILARWEB, © 2021a. About Us | Our Mission, Company, and History. Similarweb [online] [vid. 2021-10-17]. Dostupné z: https://www.similarweb.com/corp/about/

SIMILARWEB, © 2021b. Our Data. Similarweb [online] [vid. 2021-10-17]. Dostupné z: https://www.similarweb.com/corp/ourdata/

SIMILARWEB, © 2021c. Similarweb Data Methodology. Similarweb Knowledge Center [online] [vid. 2021-10-17]. Dostupné z: https://support.similarweb.com/hc/en-us/articles/360001631538-Similarweb-Data-Methodology

Seznam Obrázků

Obr. 1 Úvodní stránka similarweb [zdroj: vlastní zpracování]

Obr. 2 Základní vyhledávání [zdroj: vlastní zpracování]

Obr. 3 Nejlepší webové stránky [zdroj: vlastní zpracování]

Obr. 4 Řebříček nejlepších aplikací [zdroj: vlastní zpracování]

Obr. 5 Trendy aplikací [zdroj: vlastní zpracování]

Obr. 6 Výsledky vyhledávání – přehled provozu [zdroj:vlastní zpracování]

Obr. 7 Výsledky vyhledávání – zdroje provozu [zdroj: vlastní zpracování]

Obr. 8 Výsledky vyhledávání – přesměrování [zdroj: vlastní zpracování]

Obr. 9 Výsledky vyhledávání – vyhledávané termíny [zdroj: vlastní zpracování]

Obr. 10 Výsledky vyhledávání – sociální sítě [zdroj: vlastní zpracování]

Obr. 11 Výsledky vyhledávání – zájmy publika [zdroj: vlastní zpracování]

Obr. 12 Ukázka similarweb rozšíření v prohlížeči [zdroj: vlastní zpracování]

Obr. 13 Ukázka porovnání webových stránek [zdroj: vlastní zpracování]

Číst více

Další články