InternetRicerche



Webbot e spider i ragni della rete guida completa
EditoreApogeo
AutoreSchrenk Michael
Titolo originaleWebbots, Spiders, and Screen Scrapers
Editore originaleNo Starch Press
CollanaGuida completa
Pagine306
Volumi1
LivelloIntermedio-Avanzato
LinguaItaliano
Data pubblicazione06 - 2007
ISBN8850326587


 Prezzo di copertina  Sconto  Prezzo Librinformatica 
 Euro 35,00   10%  Euro 31,50 

 Presentazione       Indice      

La Rete è troppo ricca per essere esplorata armati solo di un semplice browser.
Internet Explorer, Firefox o Safari sono strumenti non abbastanza affilati per impadronirsi appieno delle informazioni che circolano online: questa è la convinzione che muove l’autore del volume. Ragni, webbot e spider, cioè programmi in grado i lavorare in autonomia, come robot, sono gli strumenti al servizio di sviluppatori e uomini d’affari desiderosi di avere più dati, più in fretta (e senza dover passare attraverso i “soliti” motori di ricerca o la “normale” navigazione web), per raggiungere vantaggi competitivi nel proprio business.
I lettori possono imparare a scrivere i propri ragni, utilizzando PHP e CURL,per automatizzare numerose operazioni, dapprima semplici quindi via via più complesse. Esempi pratici rafforzano le nozioni acquisite, per giungere a un livello di sofisticazione tale da creare spider sempre più potenti, in grado di svolgere analisi di mercato, catturare anonimamente migliaia di informazioni, rilanciare all’ultimo minuto nelle aste online e molto di più.

Argomenti trattati

  • Introduzione alla logica dei “ragni”
  • Siti web che facilitano o ostacolano gli spider
  • La cassetta degli attrezzi: PHP e CURL
  • Automatizzare operazioni comuni: scaricare pagine web, tecniche di parsing, gestire grandi quantità di informazioni, inviare dati via form, lavorare con i cookie, gestire connessioni FTP
  • Automatizzare operazioni complesse: monitorare prezzi, mantenere l’anonimato, aggregare news, leggere e inviare e-mail
  • Sempre più difficile: acquisti per procura, uso della crittografia, problemi di autenticazione
  • Fattori da non trascurare: non dare nell’occhio, ridurre le possibilità di errore, essere rispettosi per evitare guai

L'autore
Michael Schrenk studia l’utilizzo di webbott e spider in grado di recuperare informazioni dal web al fine di ottenere vantaggi nel business. E’ autore di numerosi articoli su riviste di settore e ha tenuto corsi di usabilità e Internet marketing. Inoltre ha partecipato alla convention hacker DEFCON come relatore sul tema del rapporto tra corporate intelligence e robot e spider in genere.



| Pagine numerata |