L’indicizzazione di un sito web è la fase in cui il motore di ricerca raccoglie, analizza ed archivia i dati per facilitare la rapida e accurata ricerca di informazioni da parte degli utenti di internet. La progettazione dell’indice del motore di ricerca incorpora i concetti interdisciplinari, dalla linguistica, psicologia cognitiva, matematica e informatica.
Nomi alternativi per il processo d’indicizzazione nel contesto dei motori di ricerca progettati per trovare le pagine web su internet è l’indicizzazione di un sito web o indicizzazione nei motori di ricerca.
L’indicizzazione è dunque la prima e importantissima operazione che i motori di ricerca compiono per poter trasmettere i risultati nelle loro pagine di risultato di ricerca (SERP: Search Engine Results Pages).
Se un sito non viene indicizzato, non può comparire nei risultati di ricerca. L’indicizzazione di siti internet viene effettuata in maniera automatica dal motore stesso. Tramite particolari programmi chiamati spider (“ragni”), che entrano in un sito e ne leggono il codice sorgente.
Motori popolari (come Google) si concentrano solo sull’indicizzazione “full-text indexing”, ossia leggono il contenuto testuale delle pagine web. Prima dell’avvento di questa tecnologia, che ha iniziato a consolidarsi verso la metà degli anni ’90, l’indicizzazione era basata unicamente su parole chiave inserite nei meta tag. Dati inseriti nel codice HTML nati appositamente per fornire informazioni sulle pagine ai motori di ricerca.
Oggi questi metadati, grazie alla “full-text indexing”, hanno perso importanza in favore dei contenuti presenti nella pagina. Questi costituiscono il vero valore di un sito per i motori di ricerca, così come per gli esseri umani.
Come essere indicizzati su Google
I principali motori di ricerca, utilizzano i crawler (o spider). Sono software automatici, per trovare pagine da indicizzare per i loro risultati di ricerca. Pertanto non è necessaria alcuna azione manuale per indicizzare un sito. È sufficiente aspettare che un sito ottenga almeno un link da un altro sito già indicizzato. Ed inoltre, che il crawler del motore di ricerca passi su questo sito, quindi “si accorga” della sua esistenza.
Le pagine web collegate con un link da altre pagine già indicizzate dal motore di ricerca, non hanno quindi necessità di essere segnalate al motore di ricerca. Questo le troverà automaticamente.
Differenza tra indicizzazione e posizionamento sui motori di ricerca
Come ho spiegato qualche riga sopra, se un sito non viente indicizzato, non compare nei risultati di ricerca. Quindi non esiste ottimizzazione o posizionamento (SEO Search Engine Optimization: ottimizzazione per i motori di ricerca) senza indicizzazione.
Come ho spiegato nel paragrafo precedente, i motori di ricerca utilizzano crawler automatici per trovare pagine da indicizzare. Tali programmi, però, garantiscono l’inserimento nel database del motore di ricerca (indicizzazione). Non garantiscono però, la classificazione specifica nei risultati della ricerca (ovvero il buon posizionamento del sito sul motore di ricerca).
Per questo motivo l’indicizzazione è solo la prima fase del processo di posizionamento. A seguire, per ottenere buone posizioni nelle classifiche dei motori, è necessario effettuare attività di ottimizzazione per i motori di ricerca (Search Engine Optimization o SEO).
Il crawler di un motore di ricerca considera una serie di fattori diversi per classificare un sito, e ogni pagina web viene indicizzata dai motori di ricerca in maniera diversa, a seconda del suo algoritmo.
Andrea Netti – Innovation Manager