Canonical: Definire una pagina canonica per pagine simili o duplicate

di Roberto Varriale

Quella di utilizzare nelle pagine un link rel canonical, è diventata una consueta attività seo da svolgere al fine di evitare che il crawler del motore di ricerca, indicizzi pagine duplicate.

Per spiegare correttamente la funzione del rel=canonical, altrimenti noto come canonical url o canonical tag, dobbiamo capire la sua composizione nel linguaggio informatico.

Nel linguaggio HTML il canonical è inserito nella sezione <head></head> con l’attributo rel=. Tale attributo, serve per indicare il tipo di correlazione esistente tra il documento in cui è presente e il collegamento ipertestuale specificato con l’attributo href= nella stessa riga.

La presenza dunque in una pagina web di un attributo rel canonical, serve a indicare al crawler del motore di ricerca, che in presenza di documenti simili o che differiscono anche solo di pochi elementi, l’url da tenere in considerazione per la scansione è quello indicato nell’attributo rel=canonical.

Quando lo spider dei motori di ricerca scansiona la pagina e trova la presenza di un canonical url, abbassa la frequenza di scansione delle pagine indicate come versioni duplicate perchè contenenti tale attributo rel canonical.

Inserendo un rel canonical in ogni pagina, si facilita il compito del motore di ricerca che potrà scegliere un unico URL canonico, ed eseguire le scansioni solo su questo, cosa che porta alla deindicizazione delle altre pagine simili e indicate come duplicate.

Quano in un documento web non è presente il rel=canonical, è lo stesso motore di ricerca a sceglierne uno. Tale situazione è da sconsigliare, in quanto per un errore il moore di ricerca potrebbe abbassare la frequenza di scansione fino a deindicizzare le pagine web che dovrebbero essere le versioni corrette e visibili all’utente.

Ecco perchè bisogna inserire sempre nelle pagine web il codice html che riporta l’url canonical. Si può fare inserendo nella sezione head di ogni pagina la seguente stringa di codice:

<link rel=”canonical” href=”https://www.paginacanonica.it/pagina1″.

Inserendo tale direttiva, il motore di ricerca considererà duplicate e dunque da non indicizzare e da non scansionare ogni pagina minimamente simile, come ad esempio:

  • https://www.paginacanonica.it/pagina1/
  • https://www.paginacanonica.it/pagina1.html
  • https://www.m.paginacanonica.it/pagina1

Ottenendo il risultato che il motore di ricerca eviterà di considerare pagine singole e dunque da scansionare quelle recanti gli elementi finali /, html o m.

Questo al fine di evitare che il motore di ricerca consideri duplicate le varianti citate nell’esempio, abbassando la scansione anche della pagina canonica, o addirittura penalizzando il sito web per la presenza di contenuti duplicati.

0 Condivisioni