Úvod
Žijeme v době internetu. Komunikace mezi lidmi a přenos informací v rámci jednotlivých skupin či celé společnosti se neustále zrychluje a dosud nikdy nebyl snažší. Pro přenos informací a názorů lidí existuje mnoho kanálů. Zásadním nástrojem pro tuto činnost jsou sociální sítě. V našem okolí asi málokdo nemá účet na žádné sociální síti. Na nich jsou denně publikovány miliony a možná spíše miliardy příspěvků. Většina z těchto příspěvků se obvykle stává „mrtvými“ po uplynutí určité doby. U některých je to pár hodin, u některých den, výjimečně i více dní. Příspěvek a informace je předána a dále už se o ni tolik lidí nezajímá, protože již není prostě úplně nová a přebijí ji novější příspěvky a informace. Co když ale budeme chtít zpětně v příspěvcích bádat nebo dokonce příspěvky s určitými znaky agregovat a dělat nad nimi různé analýzy? O nástroji SocialBearing, který to umožňuje v rámci sítě Twitter, si povíme více v následujících kapitolách.
O nástroji
Vznik samotného nástroje se datuje do roku 2014. Autor uvádí, že při jeho tvorbě nevěděl, jaké cílové skupině nebo skupinám bude vlastně nástroj určen. Jeho primárním cílem bylo vytvořit „open search“ statistický nástroj pro kohokoli, kdo by se zajímalo o širší vhled do zajímavých tweetů, lidí, statistik nebo sentimenty o kterémkoli subjektu. Autor jmenuje 9 účelů vyhledávání, pro který je primárně možné nástroj využít.
- Analýza zmínek vaší značky nebo businessu
- Nejlepší tweety o vašem webu nebo článku
- Populární hashtagy, trendy nebo konverzace
- Nejvíce poutavé tweety obsahující obrázky či odkazy
- Zajímavá fakta a vhledy do vašich přátel a sledujících
- Zajímavé účty ke sledování
- Účty k ukončení sledování
- Analýza vlastní timeline
- Tweety s geolokačními prvky
Základní předpoklady a omezení
Pro používání nástroje je zapotřebí být přihlášen na Twitteru a autorizovat aplikaci k jeho využívání. API omezuje počet možných requestů za určitou dobu. V případě prohledávání uživatelských timeline je omezení na 180 requestů každých 15 minut a pro vyhledávání zmínek omezení činí 15 requestů na 15 minut. Vyhledávání probíhá tzv. „on demand“, čili v závislosti na aktuálním stavu tweetů a indexace a poskytuje výsledky založené na vyhledávání zmínek až 7 dní zpětně. V případě prohledávání uživatelských timeline může zobrazit až 3200 nejnovějších tweetů. Neprobíhá žádná archivace výsledků. S premium účtem je možné některá výše uvedená omezení odbourat a stejně tak získat nové funkcionality např. v rámci pokročilého filtrování výsledků.
Ne všechny tweety je však možné nástrojem nalézt a zahrnout do analýzy. Tweety od určitých uživatelů, kteří jsou méně aktivní, jsou také méně indexovány. Čili indexovány jsou prioritně tweety od aktivních uživatelů s většími počty sledujících. Stejně tak nejsou do analýz zahrnout tweety uživatelů, kteří mají chráněný (soukromý, zamčený) profil a jejich tweety nejsou veřejně dostupné komukoli. Stejně tak nebudou zahrnuty tweety, které byly z důvodu jejich vysoké citlivosti zablokovány. Nicméně u většiny citlivých tweetů Twitter poskytuje tzv. flag „possible sensitive content“, přes kterou je možné výsledky vyhledávání filtrovat.
Autor zdrůrazňuje, že sentiment skóre vyhledávaných tweetů není vždy přesné a že s použitím „natural language detection“ se budou vždy ve výsledcích vyskytovat tzv. „false positive“ výsledky. Zdůrazňuje také, že např. sarkasmus a ironie je obvykle velmi složité algoritmicky detekovat.
Nástroj vyhodnocuje pro každý tweet sentiment skóre takovým způsobem, že každé slovo ve tweetu je porovnáno se souborem pozitivních a negativních slov. Sentiment skóre pro každé slovo je pak přidáno k ostatním a je vytvořeno souhrnné sentiment skóre samotného tweetu.
Geolokace a soukromí uživatelů Twitter
Autor uvádí, že pro geolokační analýzy náhodně upravuje koordináty uložené v geolokační značce tweetu a to tak, že značka je posunuta libovolným směrem do vzdálenosti zhruba o velikosti fotbalového hřiště, což k neprozrazení přesné adresy uživatele zřejmě postačuje a zároveň jsme ještě pořád schopni tweety na základě geolokace efektivně shlukovat např. na základě konání nějaké hromadné akce. Během analýzy v roce 2016 bylo zjištěno, že zhruba 65% uživatelů umožňuje Twitteru ukládat geolokační data.
Použití nástroje
Po příchodu na hlavní stránku nástroje nám je nabídnuto především pole pro zadání našeho dotazu s tím, že je nabízeno 6 různých druhů vyhledávání:
- Tweets – prohledává tweety
- Timelines – analyzuje příspěvky konkrétního uživatele
- Geo – analyzuje klíčové slovo ve tweetech s geolokačními daty v určitém rádiusu od zadaného bodu
- People – vyhledává lidi, kteří jsou nejrelevantnější zadanému dotazu
- Followers – analyzuje sledující konkrétního zadaného uživatele
- Friends – analyzuje účty, které zadaný uživatel sleduje
U některých způsobů je také umožněno rozšířené nastavení:
- Tweets – přesná shoda, omezení na fotky/odkazy/video/ověřené, typ, ID
- Geo – radius vyhledávání od zadaného bodu
Pro vyzkoušení vyhledávání použijeme vyhledávání ve tweetech. Slova se zadávají v libovolném počtu a oddělují se mezerou. V takovém případě se zřejmě jedná o „OR“ vyhledávání. V případě zaškrtnutí možnosti „Exact match“ se zřejmě jedná o „AND“ vyhledávání. Využijeme aktuální politické situace ve Spojených státech amerických a zadáme vyhledávání s těmito parametry:
- Hledané slovní spojení: Trump
- Type: Popular
Po stisknutí vyhledávacího tlačítka se během pár sekund zobrazí výsledky. Zobrazí se 100 nejnovějších tweetů. Pod tímto číslem je tlačítko „Load more“, které umožňuje zhruba po stovkách načítat další tweety a promítnout je do analýzy.
Nechal jsem načíst zhruba 1000 nejnovějších tweetů. Dle dalšího čísla “Timeframe” se dozvídám, že se jedná o vhled za dobu pouhých 3 minut s dosahem téměř 4 mil., což mě osobně poměrně šokuje. Kromě toho mě zaujme analýza sentiment, kde se dozvídám, že z analyzovaných tweetů bylo pouze zhruba 15% pozitivního charakteru (“Great” nebo “Good) a přes 55 % negativního charakteru (“Terrible” a “Bad”). Dále vidím, že téměř 80% příspěvků jsou tzv. Retweety, což je sdílení původního příspěvku a pouhých zhruba 8% jsou nově napsané tweety. Další vhledy poskytují statistiky jako jsou druh přístupu (iPhone, Android, Web…) nebo jazyk tweetů.
Pokud se posunu na stránce o kousek dolů, mohu vidět zajímavý vhled do hashtagů a slov, které se prolínají analyzovanými tweety. Opět je vidět, že to odráží aktuální politickou situaci ve Spojených státech, kdy se v tzv. Hashtag I word cloudu vyskytují slova jako “impeachment” či “guilty”. Lze však nalézt i jiné faktické znaky jako “republicans” či “America”.
Je mi také nabídnuta analýza geolokačních dat a abych se pro ni rozhodl, tak mi nástroj napoví, že 64% uživatelů, kteří analyzované tweety publikovali, měli zapnutou geolokaci. To ukáže, že největší část tweetů pochází logicky ze Spojených států, ale i z dalších zemí Evropy či Asie.
Když půjdu po stránce ještě níže, tak se mi postupně zobrazují jednotlivé analyzované tweety s příslušnými statistikami, kterými se můžu probírat. Mohu je různě filtrovat, řadit, či načítat nové. Jsou v nich zvýrazněna slova použita k analýze sentimentu.
V levé části obrazovky se vyskytují filtry, které se dají aplikovat na celý set nalezených výsledků. Mezi ně patří například:
- Druh – plain tweets, retweets, replies, pictures, videos….
- Sentiment – great, good, neutral, bad, terrible
- Jazyk
- Statistiky tweetů – dosah, počet sledujících
- Ostatní – duplikáty apod.
Dále je možné filtrovat příspěvky dle nejlepších přispěvatelů ať už z pohledu jejich aktivity k danému tématu, nebo obecného dosahu příspěvku uživatelů. Možná je i filtrace přes hashtagy, slova, zmínky profilů, domény odkazů aj. Těch možností je skutečně mnoho.
Teoreticky bych si tedy mohl upravit vyhledávání tak, abych měl vhled do tweetů na příslušné téma od známějších osobností (většinou politiků) z Evropy.
Podobné statistiky a filtrace umožňují i ostatní druhy vyhledávání z nichž se mi nejvíce líbilo vyhledávání lidí na základě zadaného slova. Lze tak nalézt zajímavé účty ke sledování o kterých byste jinak třeba ani nevěděli a sledovat skutečně to, o co má daný člověk zájem. Pro společnosti a osobnosti s velkým počtem uživatelů může být zajímavý vhled do vlastních followerů a zjistit tak třeba, kdo je hlavním odběratelem jejich informací na twitteru a na základě takového vhledu rozvíjet určité kampaně.
Licence
Nástroj je možné využívat zdarma s určitými omezeními. Pro neomezené využití a ještě pokročilejší funkce je zapotřebí vlastnit premium účet. Data jsou získávána prostřednictvím API přímo z twitteru a nejsou nijak omezena na způsobu jejich využití a jsou mj. veřejně dostupná. Aplikace pouze přináší velmi rychlý způsob, jak je zpracovat a agregovat.
Závěr
Aplikace má z mého pohledu určitě široké spektrum potenciálních uživatelů. Bude se hodit ať už společnostem, které mohou na základě těchto dat upravovat své twitterové jednání a třeba i tvořit prodejní kampaně. Stejně tak aplikaci využijí známé osobnosti a influenceři, kteří chtějí získat povědomí o tom, kdo je vlastně jejich primárním konzumentem na Twitteru. Dále je možné nástroj využít např. při různých analýzách určité aktuálně nastalé politické či jiné situace k analýze názorů lidí. A pokud nemá někdo zájem o takové komplexnější analýzy a kroky, tak si minimálně může na základě svých zájmů najít nové účty ke sledování.
Zdroje
Twitter Analytics for Tweets, Timelines & Twitter Maps | Social Bearing. Twitter Analytics for Tweets, Timelines & Twitter Maps | Social Bearing [online]. Copyright © 2021 [cit. 11.02.2021]. Dostupné z: https://socialbearing.com/
Seznam obrázků
Obrázek 1: Úvodní obrazovka – vyhledávací pole, druhy vyhledávání, rozšířené nastavení [Zdroj: autor]
Obrázek 2: Výsledky vyhledávání [Zdroj: autor]
Obrázek 3: Hashtag & word cloud, tweets by country [Zdroj: autor]
Obrázek 4: Procházení analyzovaných tweetů [Zdroj: autor]