|
|
Webbot e spider i ragni della rete guida completa
|
| Editore | Apogeo |
| Autore | Schrenk Michael |
| Titolo originale | Webbots, Spiders, and Screen Scrapers |
| Editore originale | No Starch Press |
| Collana | Guida completa |
| Pagine | 306 |
| Volumi | 1 |
| Livello | Intermedio-Avanzato |
| Lingua | Italiano |
| Data pubblicazione | 06 - 2007 |
| ISBN | 8850326587 |
|
|
| Prezzo di copertina | Sconto | Prezzo Librinformatica |
| Euro 35,00 | 10% | Euro 31,50 |
|
La Rete è troppo ricca per essere esplorata armati solo di un semplice browser.
Internet Explorer, Firefox o Safari sono strumenti non abbastanza affilati per impadronirsi appieno delle informazioni che circolano online: questa è la convinzione che muove l’autore del volume. Ragni, webbot e spider, cioè programmi in grado i lavorare in autonomia, come robot, sono gli strumenti al servizio di sviluppatori e uomini d’affari desiderosi di avere più dati, più in fretta (e senza dover passare attraverso i “soliti” motori di ricerca o la “normale” navigazione web), per raggiungere vantaggi competitivi nel proprio business.
I lettori possono imparare a scrivere i propri ragni, utilizzando PHP e CURL,per automatizzare numerose operazioni, dapprima semplici quindi via via più complesse. Esempi pratici rafforzano le nozioni acquisite, per giungere a un livello di sofisticazione tale da creare spider sempre più potenti, in grado di svolgere analisi di mercato, catturare anonimamente migliaia di informazioni, rilanciare all’ultimo minuto nelle aste online e molto di più.
Argomenti trattati
- Introduzione alla logica dei “ragni”
- Siti web che facilitano o ostacolano gli spider
- La cassetta degli attrezzi: PHP e CURL
- Automatizzare operazioni comuni: scaricare pagine web, tecniche di parsing, gestire grandi quantità di informazioni, inviare dati via form, lavorare con i cookie, gestire connessioni FTP
- Automatizzare operazioni complesse: monitorare prezzi, mantenere l’anonimato, aggregare news, leggere e inviare e-mail
- Sempre più difficile: acquisti per procura, uso della crittografia, problemi di autenticazione
- Fattori da non trascurare: non dare nell’occhio, ridurre le possibilità di errore, essere rispettosi per evitare guai
L'autore
Michael Schrenk studia l’utilizzo di webbott e spider in grado di recuperare informazioni dal web al fine di ottenere vantaggi nel business. E’ autore di numerosi articoli su riviste di settore e ha tenuto corsi di usabilità e Internet marketing. Inoltre ha partecipato alla convention hacker DEFCON come relatore sul tema del rapporto tra corporate intelligence e robot e spider in genere. |
|
|
|