Accedi per seguire   
Seguaci 0
carlainz

Il File Robots

6 messaggi in questa discussione

ciao

non capisco bene il funzionamento del file robots.rxt nei siti .

Nel caso di un sito html , in base a cosa scelgo se metterlo o no ? ( premesso che tutte le cartelle al interno del sito devono essere visibili).

Se lo inserisco, nel index.html devo inserire :

<meta name="robots" content="index, follow"> ?

se , si solo nel index.html o anche nelle altre pagine ?

ciao e grazie :)

Condividi questo messaggio


Link di questo messaggio
Condividi su altri siti

Quello dei files robots.txt è uno standard per impedire agli spiders di prelevare la pagina o i gruppi di pagine specificati all'interno.

Dal momento che tu vuoi visualizzarle tutte non ne hai bisogno :up1:

Condividi questo messaggio


Link di questo messaggio
Condividi su altri siti

ciao grazie , questo tag sai che significa ?

<meta name="robots" content="index, follow">

Condividi questo messaggio


Link di questo messaggio
Condividi su altri siti

ciao grazie , questo tag sai che significa ?

<meta name="robots" content="index, follow">

I meta-tag predisposti per i motori di ricerca sono essenzialmente 3:

Description

Keywords

Robots

Quest ultimo a differenza dei primi due, serve per comunicare con lo spider del motore di ricerca e invitarlo a seguire alcune direttive circa l'uso della pagina web prelevata.

Attualmente, le direttive impartibili allo spider sono due ed hanno i seguenti scopi:

1. Richiesta di includere (o non includere) i contenuti della pagina nell'archivio del motore di ricerca.

2. Richiesta di seguire (o non seguire) tutti i link presenti nella pagina, al fine di individuare altre pagine del sito web.

I due tipi di direttive possono essere combinati a piacere e inclusi nel contenuto del tag ROBOTS separandoli con una virgola.

L'esempio da te proposto indica al robot di indicizzare la pagina e di seguirne tutti i link.

I valori possibili sono:

INDEX (indicizza) e NOINDEX (non indicizzare)

FOLLOW (segui i link) e NOFOLLOW (non seguire i link)

che producono 4 combinazioni:

INDEX, FOLLOW (Quella di default: non mettendo il tag il robot si comporta come se trovasse questi valori). Al posto di questa puoi usare ALL

NOINDEX, FOLLOW (non indicizzare ma segui i link)

INDEX, NOFOLLOW (indicizza ma non seguire i link)

NOINDEX, NOFOLLOW (non indicizzare e non seguire i link). Al posto di questa puoi usare NONE

Condividi questo messaggio


Link di questo messaggio
Condividi su altri siti

quindi se capisco bene , metto il robots.txt nella root e i meta tag solo nella index.html , nelle altre pagine non metto niente .....

funziona cosi ?

ciao

Condividi questo messaggio


Link di questo messaggio
Condividi su altri siti

quindi se capisco bene , metto il robots.txt nella root e i meta tag solo nella index.html , nelle altre pagine non metto niente .....

funziona cosi ?

ciao

Il file robots.txt serve per dire ai ROBOT quali pagine NON indicizzare. Senza dover, quindi, creare i metatag di esclusione per ogni pagina si voglia escludere.

Condividi questo messaggio


Link di questo messaggio
Condividi su altri siti

Crea un account o accedi per lasciare un commento

Devi essere un utente registrato per partecipare

Crea un account

Iscriviti per un nuovo account nella nostra community. È facile!


Registra un nuovo account

Accedi

Sei già registrato? Accedi qui.


Accedi Ora
Accedi per seguire   
Seguaci 0