Che cosa sono i meta tag?

meta tag
meta tag

Nel precedente articolo abbiamo parlato del nuovo meta tag news_keywords utilizzato per la ricerca semantica degli articoli su Google News.

Ma che cosa sono i meta tag?

I meta tag sono metadati presenti nel linguaggio HTML utilizzati per fornire informazioni sulle pagine agli utenti o ai motori di ricerca.

A differenza di ogni altro tag inseribile in una pagina web, i meta tag non forniscono al browser dati di formattazione della pagina, per cui non influiscono sul layout e sono invisibili all’utente se non attraverso la visualizzazione del codice sorgente in HTML della pagina.

Origine

La nascita dei meta tag è originariamente dovuta alla necessità di fornire un supporto ai motori di ricerca per una corretta indicizzazione dei siti e delle pagine, quando ancora non esistevano algoritmi di analisi mirati sul testo della pagina.

Inizialmente per motivi di potenza di calcolo e memoria, gli spider utilizzati dai motori di ricerca si limitavano a raccogliere ed analizzare le prime stringhe di testo della pagina, per questo motivo i webmaster inserivano nelle intestazioni della pagina dei tag appositamente destinati a contenere dei metadati che riassumessero il contenuto della pagina. Questo però lasciava ampio spazio a comportamenti opportunistici volti a sviare la corretta indicizzazione delle pagina per poter apparire in un maggior numero di ricerche. Ciò era possibile inserendo fra i metadati informazioni non pertinenti ai contenuti della pagina, ma legati agli argomenti di maggiore interesse cercati dagli utenti, come ad esempio “sesso” e “mp3”, seppure il sito trattasse di tutt’altro.

Grazie al superamento delle limitazioni tecniche e alla raffinazione degli algoritmi che divennero sempre più sofisticati, i motori di ricerca hanno permesso di aggirare l’uso improprio dei meta tag, orientando le indicizzazioni sull’analisi testuale dei contenuti e del numero di link entranti nel sito. Questo ha portato a una minore considerazione dei meta tag da parte dei motori, anche se un corretto uso dei i meta tag può ancora contribuire alla comparsa del sito nei risultati dei motori di ricerca, sebbene debba essere coadiuvato da altri strumenti.

Struttura

La struttura dei meta tag è abbastanza semplificata rispetto tutti gli altri tag html, con soltanto due attributi necessari per funzionare:

<meta name="proprietà" content="valore" />

L’attributo name indica il tipo di informazione contenuta nel tag, mentre l’attributo content indica il contenuto della informazione.

I primi sono codificati in un numero limitato e richiamati da una specifica parola, i secondi sono variabili e contestuali a sito o alla pagina cui fanno riferimento.

Esiste anche l’attributo http-equiv che unito all’attributo content restituisce al browser degli header http, come ad esempio:

<meta http-equiv="refresh" content="5" />
<meta http-equiv="Content-Type" content="text/html; charset=iso-8859-1" />

Il refresh aggiorna la pagina ogni 5 secondi, mentre il Content-Type  fornisce informazioni al browser circa il contenuto e la codifica della pagina.

Metadati per i motori di ricerca

Description

Il metadato description è destinato a contenere una breve descrizione dei contenuti della pagina, che può essere utile sia all’indicizzazione della pagina, oggi venuta un pò meno nei maggiori motori di ricerca, che ai potenziali visitatori in quanto sono riportati da molti motori nella visualizzazione della ricerca al posto del testo della pagina in cui sono state rintracciate le parole.

Keywords

Il metadato keywords contiene una serie di parole chiave, rappresentative del contenuto della pagina, che sarebbe indirizzato ai motori di ricerca non propriamente per il posizionamento del sito ma per l’individuazione dell’argomento trattato.

L’uso scriteriato dei metatag keywords ne ha decretato il declino del loro uso come aiuto all’indicizzazione dei siti per mezzo degli spider.

Nonostante tutto i motori, anche se ormai orientati sui contenuti delle pagine, fanno ancora uso di questo metatag anche se in maniera accessoria e subordinata; per questo alcuni esperti del posizionamento all’interno dei motori sconsigliano comunque di inserire parole fuorvianti, al solo scopo di tentare di avere un più vasto numero di risultati durante la ricerca, o non richiamate all’interno della pagina, poiché i motori di ricerca penalizzerebbero tali comportamenti scorretti peggiorandone il posizionamento a scopo punitivo e persino cancellando il sito dalle liste di indicizzazione.

Il contenuto dell’attributo content è quindi una lista di parole, che possono essere separate da virgole o spazi.

Robots

Il metatag robots è indirizzato esclusivamente agli spider fornendo due tipologie distinte di direttive: se indicizzare o meno la pagina, o se seguire o meno i collegamenti da questa ad altre pagine per indicizzarle.

L’attributo content quindi può contenere solo determinate variabili:

  • index: per indicare che la pagina può essere indicizzata;
  • noindex: per indicare invece di non indicizzare la pagina.

I due tipi di direttive possono essere liberamente abbinati secondo le esigenze del webmaster:

content="index,follow"

La disposizione è ininfluente, ma non possono contenere indicazioni contrastanti. Se il metatag robots non è inserito gli spider agiscono di default come se fossero indicati index e follow, la cui combinazione può essere indicata anche con il valore all, così come none deseleziona entrambe le possibilità.

È da notare che non tutti i motori di ricerca rispettano queste indicazioni.

A questi metatag base si aggiungono:

  • follow: per indicare di seguire i link a altre pagine collegate;
  • nofollow: per indicare di non seguire le pagine linkate;
  • nosnippet: per indicare di non mostrare snippet nei risultati di ricerca;
  • noarchive: per indicare di non salvare una copia della pagina nella memoria cache del motore;
  • date: per indicare di non indicizzare una pagina a partire da una certa data.

Fonte: Wikipedia – Meta Tag

Annunci

Rispondi

Inserisci i tuoi dati qui sotto o clicca su un'icona per effettuare l'accesso:

Logo WordPress.com

Stai commentando usando il tuo account WordPress.com. Chiudi sessione / Modifica )

Foto Twitter

Stai commentando usando il tuo account Twitter. Chiudi sessione / Modifica )

Foto di Facebook

Stai commentando usando il tuo account Facebook. Chiudi sessione / Modifica )

Google+ photo

Stai commentando usando il tuo account Google+. Chiudi sessione / Modifica )

Connessione a %s...