Zapojte se do projektu -> Detekce botů


 
Projekt user-agent-string.info sbírá informace o robotech pomocí detekce jejich přístupu k souboru robots.txt (http://www.example.com/robots.txt). Přesný popis syntaxe a použití robots.txt je uveden v dokumentu the robot exclusion standard External link.
Myšlenka je jednoduchá. Každý slušně napsaný robot si dříve než začne procházet konkrétní web, stáhne soubor robots.txt. Pokud bude přístup k souboru monitorován, máme to co potřebujeme.

Umístíte-li monitorovací script na svůj server, pomůžete se sbíráním informací. Pokud to uděláte, nezapomeňte napsat ať můžete být uvedeni ve spolupracujících serverech.

 
Co bude zaznamenáno do naší DB?

- Zaznamenává se pouze UA, jeho IP a čas, nic jiného.
Může nedostupnost serveru user-agent-string.info způsobit problém mě?
- Ne, jen nebudou zapsána data o robotovi.
 


Řešení: APACHE + PHP + .htaccess

V souboru .htaccess bude uvedeno

Obsah souboru robots.txt

Příklad souboru robots.orig




UASparser používá
SAREAlza.cz a.s.Mailkit (Xland. CZ, spol. s r.o.)MailChimp (Rocket Science Group)




© 2005-2012 Jaroslav Mallat External link - Nově přidaní useragenti do DB - RSS - Kontakt