Agenzia.net: offre in Abruzzo un consulente personalizzato per consulenze SEO e consulenze SEM.


Consulenze SEO

Agenzia di consulenti SEO per consulenze SEO sulla Scansione, Indicizzazione e Calssificazione delle pagine web




Scansione, Indicizzazione e Classificazione delle pagine web

Scansione, Indicizzazione e Classificazione delle pagine web da parte dei motori di ricerca


Capire come l'algoritmo di un motore di ricerca, effettua la scansione, l'indicizzazione e il posizionamento di una pagina web, è fondamentale per chi fa SEO, poiché serve per determinare quali strategie devono essere messe in pratica per raggiungere i primi posti delle SERP dei motori di ricerca.

Per scansionare, indicizzare a classificare una pagina web nelle proprie SERP, i motori di ricerca devono eseguire molte attività (alcune molto complesse). La qualità di queste attività, determina la qualità dei risultati offerti agli utenti dopo una ricerca.

Semplificando al massimo il discorso, si può affermere che:


Scansione ed indicizzazione delle pagine web

Per offrire i migliori risultati possibili, i motori di ricerca devono scansionare ed indicizzare (catalogare) il maggior numero di pagine e file presenti sul World Wide Web e successivamente restituire i contenuti che meglio corrispondono al query di ricerca dell'utente.

Il primo passo in questo processo è la scansione del Web.


Scansione delle pagine web

Il concetto chiave nella costruzione di un motore di ricerca è capire e decidere da dove iniziare la scansione del web.

Le prime scansioni dei motori di ricerca che si sono affermeti per la qualità dei loro risultati, sono iniziate manualmente, partendo da pagine web o siti web con contenuti di altissima qualità (molto attendibili), quindi, seguono i collegamenti (link) per scansionare altre pagine Web.

La struttura dei collegamenti (link) del web, utilizzata per collegare i file online, è utilizzata dagli spider dei motori di ricerca per scansionarli.

Grazie ai link, percorsi dai loro robot (chiamati crawler, spider o ragni), i motori di ricerca riescono ad automatizzare il processo di scansione, riuscendo quindi a raggiungere miliardi di file interconnessi ta loro.

Ad esempio, Goolge ha deciso di iniziare a scansionare il web iniziando da USA.gov. Partendo dalla home page del sito web ufficiale del governo ufficiale degli Stati Uniti, e seguendo i link sulle varie pagine html, è riuscito a scansionare tutti i siti delle istituzioni pubbliche degli Stati Uniti d'America. Stesso discorso vale per la scansione di tutti i siti istituzionali delle altre nazioni.

Quindi ricapitolando: un motore di ricerca, partendo da una pagina web, tramite i link, scansiona le pagine web, analizza i contenuti, li classifica e continua nella sua azione di scansione e classificazione. Questo processo, anche se può sembrare semplice, richiede un enormemente utilizzo di risorse (fisiche e tecnologiche), in quanto il web è un luogo immenso e complesso, in cuntinua espansione ed evoluzione.

Anche se vengono scansionate miliardi di pagine, la loro classificazione non è scontata. La maggior parte degli algoritmi è in grado di valutare automaticamente (senza l'intervento umano) la qualità dei contenuti e se questi non vengono considerati rilevanti o non rispettano alcune regole, non verranno mai presentati nelle SERP (risultati delle ricerche).

Fatta questa breve considerazione, passiamo al processo di indicizzazione (catalogazione) delle pagine web.


Indicizzazione delle pagine web

Dopo il processo di scansione, segue l'indicizzazione (catalogazione) delle pagine web. Il primo passo dell' indicizzazione consiste nella costruizione di un indice dei termini (keyword) da associare ai file. Questo processo avviene tramite un enorme database che cataloga tutti i termini significativi, presenti in ciascuna pagina scansionata dal motore di ricerca.

Nel database vengono registrati, oltre alle keyword, anche molti altri dati. I più importanti sono: una mappa di tutte le pagine collegate a ciascuna pagina e gli ancor text dei link.

Per realizzare il monumentale compito di conservare i dati di centinaia di miliardi di pagine a cui è possibile accedere in una frazione di secondo, i motori di ricerca hanno costruito enormi data center per gestire tutti questi dati.


Classificazione e restituzione delle pagine web

Quando si effettua una query, i motori di ricerca, a loro volta, effettuano una ricerca nei loro database tra miliardi di documenti. Le operazioni esguite sono: