Login
HOME        
Search
Web Marketing and SEO RSSBenvenuto in Seonida.
Attenzione: Se sei un utente registrato effettua il login per scrivere o accedere alle aree private. Se hai perso i tuoi dati di accesso effettua il recupero. Se vuoi iscriverti compila il form di registrazione.
Rispondi
 
LinkBack Strumenti discussione Modalità visualizzazione
  #1  
Vecchio 30-05-2008, 07.33.40
Agoago Agoago non è connesso
Utente
 
Data registrazione: 23-11-2007
Messaggi: 110
Predefinito Google e robots.txt

Google e' troppo simpatico.
Secondo me non lo riescono piu' a controllare, ha vita propria.

-----

Google ha bannato da anni un mio sito.
Tuttavia ogni giorno passava e spiderizzava alcune pagine del sito.

Stufo (dopo anni di inutili spiderizzazioni) blocco tramite file robots.txt l'accesso al sito allo spider di google.

-------

Dopo 6 mesi circa (dall'introduzione del robots.txt che ne vietava la spiaderizzazione) Google assegna pr3 al sito e lo sbanna.

Me ne frego e lascio il robots.txt cosi' come e'.
Permetto pertanto a chiunque di spiderizzarmi il sito, ma non a Google.

Ieri vado per curiosita' sugli strumenti di Google e verifico quel sito.
Come risultato ottengo il grafico che riporto.

Google e' arrivato a spiderizzarmi 133 pagine in un giorno, benche' da tempo il mio robots.txt ne inibisca l'accesso.

---------

Certo potrebbe avermi spiderizzato 133 volte (in un solo giorno) il file robots.txt... ma che senso avrebbe??

---------------------

Se chi gestisce google fosse in mala fede spiderizzerebbe cosa, come, quando vuole fregandosene dei robots.txt... ma tutto questo senza pero' palesarlo pubblicamente ed ufficialmente con grafici ufficiali.

--------

Google e' diventato cosi' imponente-complesso-articolato che il suo braccio destro non riesce piu' a controllare cosa fa il braccio sinistro e viceversa.

Per i piu' questa situazione potrebbe rappresentare una situazione critica... ed una critica alla situazione.

Invece a mio avviso e' un bene.
Perche' Google azienda si frazionera'.
Immagini allegate
Tipo file: png chart.png‎ (7.7 KB, 18 visite)
Rispondi citando
  #2  
Vecchio 30-05-2008, 08.03.07
paocavo paocavo non è connesso
Utente
 
Data registrazione: 16-11-2007
Residenza: Lecce (Italy)
Messaggi: 84
Predefinito

Citazione:
Originalmente inviato da Agoago Visualizza messaggio
---------
Certo potrebbe avermi spiderizzato 133 volte (in un solo giorno) il file robots.txt... ma che senso avrebbe??
---------------------
Ciao Ago,
Non puoi ottenere il dettaglio degli URL spiderizzati in quel dato giorno?
Rispondi citando
  #3  
Vecchio 30-05-2008, 09.00.54
dag dag non è connesso
Utente
 
Data registrazione: 19-11-2007
Residenza: Roma - Italia
Età: 32
Messaggi: 77
Manda un messaggio tramite Skype™ a dag
Predefinito

Citazione:
Originalmente inviato da Agoago Visualizza messaggio
Google e' arrivato a spiderizzarmi 133 pagine in un giorno, benche' da tempo il mio robots.txt ne inibisca l'accesso.
Questa tua osservazione riporta alla luce una questione che sollevai tempo fa...

Citazione:
La questione era più o meno questa:
Volendo nascondere determinate directory (o determinati file) ai motori, conviene di più usare il file robots.txt oppure far in modo che il motore ignori suddetti elementi?
Io ho sempre optato per la seconda alternativa, per il semplice fatto che il file robots.txt rappresenta un'istruzione impartita al motore, ma non comporta limitazioni fisiche.

Nel caso di elementi disallow, ma linkati all'interno del sito stesso (o anche da fonti esterne), ho sempre pensato che, se solo volessero, gli spider potrebbero ignorare ufficialmente gli elementi indicati nel robots.txt, per poi visitarli e spiderizzarli con useragent (oltre a località, ip_address etc.) anonimi o comuni....

In tal modo non allerterebbero neanche i webmaster più smaliziati, ma continuerebbero comunque a racimolare dati...

Tempo addietro feci alcuni test riguardanti le diverse possibilità di inibizione ai motori (meta tag, rel =nofollow, robots etc.), ma i risultati furono coerenti e non ebbi motivo di continuare i test; ammetto che il tuo caso è molto strano.

Non lo hai scritto, ma immagino che il tuo sito completamente disallow non sia presente in SERP ? Non è che per caso hai scritto male il robots.txt? Ovviamente sto scherzando...
__________________
DAG
Rispondi citando
  #4  
Vecchio 05-06-2008, 01.44.46
L'avatar di fradefra
fradefra fradefra non è connesso
utente
 
Data registrazione: 11-06-2007
Residenza: Lonigo (VI)
Età: 48
Messaggi: 370
Invia un messaggio via MSN a fradefra
Predefinito

Agoago ben sa, ma alcuni altri no, che il robots.txt è solo una gentile richiesta fatta allo spider di non leggere qualcosa. Gentile richiesta e niente altro. Chi vuole passa e basta.

Per inciso, io parto dal presupposto che non sia neppure scorretto, soprattutto quando poi noi SEO facciamo la stessa cosa con lui, quando controlliamo automaticamente i posizionamenti con appositi programmi, quando lui sempre ha detto che non gli piace

Che un sito bloccato venga "sbannato", secondo me ci sta tutta
Un po' come farebbe una donna che ti rifiuta, ma se poi tu te ne vai ti viene a cercare ...e Google è molto donna !!!

Agoago, quand'è che ti decidi a venire ad uno dei nostri happy hour milanesi al Art Factory?
Rispondi citando
  #5  
Vecchio 18-06-2008, 11.37.26
sjachille sjachille non è connesso
Utente
 
Data registrazione: 26-12-2007
Residenza: L'Aquila
Messaggi: 7
Manda un messaggio tramite Skype™ a sjachille
Predefinito

Ciao a tutti,
è vero quello che dica l'amico Francesco, ma è altrettanto vero che questa è una infrazione non solo di una netiquette ma anche di una regola che va anche sul legale: ricordo infatti qualche tempo addietro della causa di alcuni giornali contro GG che hanno insinuato l'usurpazione del diritto di indicizzare i contenuti - l'hanno persa fondamentalmente perché la risposta è stata "s e nonvuoi che io indicizzi i tuoi contenuti allora devi utilizzare il file robots.txt"

Ora se sta accadendo che GG se ne frega della richiesta di non accedere ai contenuti bloccati dal robots la vedo come una cosa abbastanza grave - voi che ne dite ??
Rispondi citando
  #6  
Vecchio 18-06-2008, 18.16.06
graziemamma graziemamma non è connesso
Utente
 
Data registrazione: 21-06-2007
Residenza: Roma
Messaggi: 21
Invia un messaggio via MSN a graziemamma
Predefinito

Grazie dell'ottima segnalazione, purtroppo non mi stupisce neanche molto... ormai Google fa come vuole... Magari tra 10 anni ci saranno delle regolamentazioni in merito o magari Google produrrà dentifrici...
__________________
Il mio Blog
Rispondi citando
  #7  
Vecchio 19-06-2008, 15.51.33
dag dag non è connesso
Utente
 
Data registrazione: 19-11-2007
Residenza: Roma - Italia
Età: 32
Messaggi: 77
Manda un messaggio tramite Skype™ a dag
Predefinito

Novità (almeno per me sono tali) riguardo al robots.txt da Search Engine Roundtable.
Google esegue la scansione del tuo sito in assenza del file robots.txt? Dipende...

In lingua italiana ne parla SimLeon su rankfirst.info.
__________________
DAG
Rispondi citando
  #8  
Vecchio 11-07-2008, 17.51.21
pigot4 pigot4 non è connesso
Utente
 
Data registrazione: 18-06-2007
Residenza: Roma
Età: 24
Messaggi: 26
Invia un messaggio via MSN a pigot4 Manda un messaggio tramite Skype™ a pigot4
Predefinito

Scusate ma io non ci vedo nulla di strano, con il robots diciamo a Google di non indicizzare, ma non di non visitare. Nessuno toglie la possibilità a Google di visitare una pagina e di non indicizzarla (la pagina è pubblica), se vogliamo che nemmeno la visualizzi dovremmo usare un htaccess o altra regola tramite server.

Il punto è un altro: perché Google "spreca" risorse per visualizzare queste pagine?

A tal proposito porto un'esperienza personale: tempo fa, per errore, impedì a Google di indicizzare l'intero dominio, tale regola rimase su per 4 giorni. Lo spider appena vista la richiesta girò tutte le pagine di tutto il sito che aveva precedentemente visitato e tornò a visitare il robots ogni giorno (a tal proposito allego l'img).

Perché guardare tutte le pagine quando ti ho appena detto che non voglio essere indicizzato?

PS per la cronaca: lo stesso comportamento è avvenuto su 20 domini diversi
Immagini allegate
Tipo file: png chart.png‎ (11.8 KB, 6 visite)
__________________
Blog su marketing - Blog Orazio Tassone
Rispondi citando
  #9  
Vecchio 11-07-2008, 18.21.03
L'avatar di fradefra
fradefra fradefra non è connesso
utente
 
Data registrazione: 11-06-2007
Residenza: Lonigo (VI)
Età: 48
Messaggi: 370
Invia un messaggio via MSN a fradefra
Predefinito

Citazione:
Originalmente inviato da pigot4 Visualizza messaggio
...

Perché guardare tutte le pagine quando ti ho appena detto che non voglio essere indicizzato?

...
Perché gli sembra strano che uno non voglia essere indicizzato?
Rispondi citando
  #10  
Vecchio 11-07-2008, 21.06.36
pigot4 pigot4 non è connesso
Utente
 
Data registrazione: 18-06-2007
Residenza: Roma
Età: 24
Messaggi: 26
Invia un messaggio via MSN a pigot4 Manda un messaggio tramite Skype™ a pigot4
Predefinito

Citazione:
Originalmente inviato da fradefra Visualizza messaggio
Perché gli sembra strano che uno non voglia essere indicizzato?
__________________
Blog su marketing - Blog Orazio Tassone
Rispondi citando
Rispondi



Utenti attualmente attivi che stanno leggendo questa discussione: 1 (0 utenti e 1 visitatori)
 
Strumenti discussione
Modalità visualizzazione

Regole di scrittura
Tu non puoi inserire nuovi messaggi
Tu non puoi rispondere ai messaggi
Tu non puoi inviare files
Tu non puoi modificare i tuoi messaggi

Il codice vB è Attivato
Le faccine sono Attivato
Il codice [IMG] è Attivato
Il codice HTML è Disattivato
Trackbacks are Attivato
Pingbacks are Attivato
Refbacks are Attivato


Tutti gli orari sono GMT +2. Adesso sono le 10.44.15.