V dalším pokračování efektivnějšího hledaní v rámci Google upřeme naši pozornost na průzkum FTP serverů, které v řadě případů obsahují velmi zajímavé a mnohdy citlivé informace. Naučíme se přitom používat pokročilý operátor „inurl:“.
Pod zkratkou FTP se skrývá file transfer protocol. Tento termín se úzce pojí s informatikou a to v ohledu přenosu souborů mezi počítači v rámci FTP serverů. A právě tato funkce tohoto protokolu nás zajímá z hlediska vyhledávání dokumentů. Roboti Google totiž soubory na různých a nezabezpečených FTP serverech rovněž indexují.
Cesta k nim je poměrně jednoduchá, nicméně musíme využít opět naše oblíbené pokročilé operátory a k nim jeden nový, „inurl:“.
Hledáme v URL adresách
Pojďme si nejdříve popsat jeho funkci. Tento operátor nám umožní hledat požadované klíčové slovo v adresním řádku URL. Tedy například, pokud hledáme nějakou stránku s kontakty, můžeme předpokládat, že stránka nese název Kontakt nebo Kontakty. Zkusme si tedy nalézt stránku s kontakty společnosti Škoda Auto.
site:skoda-auto.cz (inurl:kontakt OR inurl:kontakty)
Dotaz si trochu vylepšíme a budeme chtít vyhledávat stránky s kontakty včetně nějakého telefonického kontaktu. Dotaz tedy můžeme zadat například takto:
site:skoda-auto.cz (inurl:kontakt OR inurl:kontakty) "+420 * * *"
Takto se dá i poměrně účinně ověřovat neznámé telefonické kontakty, které skončily na displeji vašeho mobilního telefonu.
Do světa souborů v rámci FTP serverů
Jak již jsme definovali, tyto servery jsou plné zajímavých a hodnotných informací ve formě různých druhů dokumentů (například adresáře, smlouvy, market reporty, technické zprávy, normy, produktové listy, …). Zkusme si tedy nejprve omezit vyhledávat dokumenty pouze na FTP protokol. Zadejme následující syntax:
inurl:ftp | inurl:"ftp://" (-inurl:http OR -inurl:https OR -inurl:www) inurl:pricelist
Tímto dotazem žádáme Google, aby nám, vyjevil dokumenty, které mohou obsahovat informace z ceníků. Dostali jsme poměrně zajímavé výsledky. Například velkoobchodní ceník společnosti Panasonic v rámci Severní Karolíny. To na první pohled není zajímavá informace (ačkoli v rámci konkurenčního prostředí to může být informace velmi důležitá), naši pozornost ale poutá adresní řádek URL. Zkusme nyní použít operátor site: následovně.
site:ftp://ftp.panasonic.com/computer/pricelist/
Tímto průzkumem jsme se dostali do složky pricelist na FTP serveru Panasonic a je v ní indexováno 92 dokumentů. To lze již označit za velmi pěkné.
Zkuste si operátor „inurl:“ na vaše informační potřeby. Napište nám, jaké zajímavé dokumenty jste našli.
Shrnutí:
- FTP znamená file transfer protocol
- Jedná se o protokol umožňující přenos souborů v rámci sítě.
- Operátor inurl: umožňuje vyhledávat v rámci adresních řádků URL.