Login
HOME        
Search
Web Marketing and SEO RSSBenvenuto in Seonida.
Attenzione: Se sei un utente registrato effettua il login per scrivere o accedere alle aree private. Se hai perso i tuoi dati di accesso effettua il recupero. Se vuoi iscriverti compila il form di registrazione.
Rispondi
 
LinkBack Strumenti discussione Modalità visualizzazione
  #1  
Vecchio 20-11-2009, 18.28.20
L'avatar di fradefra
fradefra fradefra non è connesso
utente
 
Data registrazione: 11-06-2007
Residenza: Lonigo (VI)
Età: 48
Messaggi: 367
Invia un messaggio via MSN a fradefra
Predefinito Esclusione cartella da indicizzazione

Ciao a tutti.
Nel robots di un sito, www.maisazi.com, voglio inserire l'istruzione di esclusione degli archivi.

Vengo alla domanda

se inserisco
Disallow: /2006/06/

sto praticamente dicendo che vorrei che non si leggano tutti i file che vi sono contenuti.
Invece, quello che serve a me, è che non si legga la sola pagina http://www.maisazi.com/2006/06/ che è quella che contiene l'indice dei contenuti.

Che faccio?

Stavo pensando di inserire
Disallow: /2006/06/index.php ma ho l'idea che non sia la stessa cosa.

Ho provato a leggere le specifiche in giro, ma non ho trovato nulla.
Qualcuno ha fatto qualche prova?
Rispondi citando
  #2  
Vecchio 22-11-2009, 13.47.14
L'avatar di fradefra
fradefra fradefra non è connesso
utente
 
Data registrazione: 11-06-2007
Residenza: Lonigo (VI)
Età: 48
Messaggi: 367
Invia un messaggio via MSN a fradefra
Predefinito

Vi indico la proposta che mi è stata data da un nostro allievo, che purtroppo non ha l'accesso a Seonida.

Anzi, direi che se l'è guadagnata, così

===========================
....
Avevamo il tuo stesso problema mesi fà, e in 3 persone ( di cui 1 programmatore) siamo andati in cerca nel web per una quindicina di giorni.
L'esito era stato negativo.
Avevamo risolto ( ma non del tutto) con l'introduzione del <meta name="robots" content="noindex,follow" /> nella sola pagina
ovviamente non è la stessa cosa.

qualche settimana dopo mi era venuta in mente di fare delle prove con questa sintassi nel google webmaster central l'esempio è adattato al tuo caso)

User-agent: *
Disallow: /2006/06/
Allow: /2006/06/01
Allow: /2006/06/02
Allow: /2006/06/03
...

Praticamente blocchi solo la cartella interessata, inserendo Allow per tutte le altre sottodirectory e/o pagine .
Nel webmaster central l'esito è positivo ,l'ho riprovato anche ora.
Dovresti anche risolvere la questione con la corrispondenza pattern, indicata da Google stessa.

http://www.google.com/support/webmas...&answer=156449

ma non ho fatto in tempo a provare le varie combinazioni.

Spero di esserti stato utile, magari facci sapere nel forum .
.....
.....
Simone
================================


Ok, ringrazio simone e mi metto in attesa di altre indicazioni, poi decido che fare
Rispondi citando
  #3  
Vecchio 24-11-2009, 09.37.29
L'avatar di fradefra
fradefra fradefra non è connesso
utente
 
Data registrazione: 11-06-2007
Residenza: Lonigo (VI)
Età: 48
Messaggi: 367
Invia un messaggio via MSN a fradefra
Predefinito

Da Mattia Ragni, invece, tramite email mi arriva questo suggerimento.

========================
....
A mio avviso la soluzione migliore è trapelata da uno scambio di commenti ad un mio post: http://www.wmlab.it/2009/11/12/crear...per-wordpress/
dal quale è emerso che l'utilizzo del <meta name="robots" content="noindex,follow" />
nelle pagine relative a tag, categories e archivi, è preferibile al Disallow via Robots.txt sulle pagine.

Il vantaggio del meta-tag rispetto al disallow da robots.txt è che, pur evitando in entrambi i casi l'indicizzazione delle pagine,
attraverso l'istruzione Follow viene preservato il link juice proveniente dalle pagine in questione.
....
========================
Rispondi citando
Rispondi



Utenti attualmente attivi che stanno leggendo questa discussione: 1 (0 utenti e 1 visitatori)
 
Strumenti discussione
Modalità visualizzazione

Regole di scrittura
Tu non puoi inserire nuovi messaggi
Tu non puoi rispondere ai messaggi
Tu non puoi inviare files
Tu non puoi modificare i tuoi messaggi

Il codice vB è Attivato
Le faccine sono Attivato
Il codice [IMG] è Attivato
Il codice HTML è Disattivato
Trackbacks are Attivato
Pingbacks are Attivato
Refbacks are Attivato


Tutti gli orari sono GMT +2. Adesso sono le 13.26.34.