Benvenuto in Seonida.GWT ed il mistero del nuovo server! |
![]() |
|
|
LinkBack | Strumenti discussione | Modalità visualizzazione |
|
#1
|
|||
|
|||
|
Un grazie da parte mia a chi mi aiutera' a risolvere un mistero che da qualche settimana mi impegna in basse ed alte (ma ad oggi del tutto deficienti) locubrazioni.
Ecco i fatti. ------ Un paio di mesi fa, a meta' giugno circa, decido di chiudere 3 miei server, server che rispettivamente contenevano 1 sito ognuno. Visto le rese non aveva senso pagare cosi' tanto per mantenerli su 3 server distinti. Non contento non solo chiudo i 3 server storici (oltre 10 anni di vita l'uno) ma decido di affidarmi ad una nuova societa di hosting, affittando da loro un nuovo unico server dove piazzo i 3 siti in questione. Questo e' quanto, semplice semplice. ------------- Adesso attenzione a cosa oggi mi riportano (per quei 3 siti) i grafici di google webmaster tools.... non posso caricare il sesto grafico, ma il trend e' identico ai primi 2. Cosa riporta Google' ? Ci dice che pur mantenendo in media il numero-valore giornaliero delle pagine spiderizzate ogni giorno per quei 3 siti, il numero di kbites da lui raccolti giornalmente e' diminuito-crollato. In poche parole, se prima spiderizzava di media, per esempio, 100 pagine al giorno per un sito... e downlodava di conseguenza 1000 k di media al giorno (10k per pagina) ora invece pur continuando a spiderizzare in media 100 pagine al giorno scarica solamente 200 k (2k per pagina)! ------------------ Questo per me ha dell'inspiegabile. Anche se il nuovo server fosse un rottame, anche se fosse lentissimo (ma non lo e'), le mie pagine oggi sono di dimensione identiche a come lo erano precedentemente. A parita' di numero di pagine spiderizzate non puo' pertanto diminuire il totale dei bytes raccolti. L'unica possibilita' che mi viene in mente e' che il numero di bytes raccolti da G potrebbe differire rispetto al numero di pagine spiderizzate solo nel caso il nuovo server restituisse un code differente rispetto prima (per dire prima tanti 200 ed ora tanti 304). Ma analizzando i log non riscontro questa situazione. (tra l'altro avete notato che lo spider di G non accetta piu' 304 per le homepage?) --------------- Ogni supposizione e' gradita, e di molto. --------------------- Bene, mentre vi scervellerete come me, su una cosa credo potremo essere tutti in accordo. Cambiare le basse classi di Ip, cambiare quello che gli americani chiamano location, cambiare server, raggruppare (o dividere) siti su uno stesso server, etc etc, giorno per giorno - man mano assume una valenza sempre piu' determinante. Avviene una specie di reset... se poi questo reset sia catalogabile come caldo o freddo chi lo sa. Quando e come possa convenire stravolgere lo status quo e' altrettanto misterioso. --------------- Riguardo la decisione di stravolgere l'esitenza di un nostro sito (e non solo di quello) mi rammento una massima di uno scrittore tedesco. Suonava pressapoco cosi': " L'unico grosso errore commesso nella mia vita e' stato quello di non aver avuto il coraggio di commettere grossi errori. " |
|
#2
|
||||
|
||||
|
Alla seconda implicita domanda - "quando convenga stravolgere lo status quo è misterioso" - una risposta so dartela, perché l'ho fatto due volte in questi ultimi anni.
Io l'ho fatto quando a conti fatti, assodavo che sistemare sarebbe costato più che fare un reset. In sostanza, due siti messi così male in termini di storia Google, che invece che sistemare un po' alla volta, si faceva prima a rifare. Anche grazie ad uno scambio telefonico e email con Enrico Altavilla, Simone Carletti e Piersante Paneghel, in uno di questi caso ho azzerato (spero) tutta la presenza di un sito su Google. L'ho lasciato fuori per tre mesi (ed era un sito che fatturava), gli sviluppatori hanno fatto una serie di modifiche (purtroppo non s'è potuto fare tutto ciò che avrei voluto), si è ributtato dentro tutto, cambiando anche le URL delle pagine. In relazione alla tua domanda, così al volo non so rispondere perché le mie conoscenze sistemistiche sono insufficienti. Invece, nei prossimi giorni vedo di ragionare su cose più concettuali. Vediamo se mi riesce di dare un contributo o uno spunto. Se risolvi prima, facci sapere ![]() |
|
#3
|
||||
|
||||
|
Le copie cache che dicono? Cioè, guardando una pagina che lui ha scaricato e cercandone le rappresentazione che ne ha nell'indice, ti risulta completa?
Cioè, se assodiamo che della pagina A, di cui prima scaricava in media 10k ed oggi solo 2K, in indice che c'è? Le prime due righe? Le ultime? Tutto (ed allora bisogna capire dov'è il buco). Altra domanda. Tu dici che prima scaricava mediamente 10 a pagina, oggi 2. Però non ci dici le pagine quanto sono pesanti in media. Perché se si scopre che mediamente pesano 2, allora la situazione strana era la vecchia, non è la nuova. Ovviamente è vero anche l'inverso. Altra cosa. Tu hai dato dei valori medi. Non hai dato il numero delle pagine. Ti sei accertato della corrispondenza tra byte letti e dimensione fisica da te conosciuta di quanto scaricato, nel primo e nel secondo caso? Cioè, non potrebbe essere che lui rileggesse (prima) troppe volte certe pagine ed ora non lo fa più? |
|
#4
|
|||
|
|||
|
Ciao Agoago,
situazione intrigante. Da un po' di tempo passo anche io + ore a controllare i GGWT e le statistiche di scansione in modo particolare. Quello che osservo è che c'è un nesso (certo come la morte) tra le prestazioni del server, i tempi di risposta al bot, e la resa sui motori. Assumo che i tempi di download siano gli stessi come dici (non hai allegato i grafici rossi) ma ti chiedo: 1) pag statiche o dinamiche? 2) lunghezza (peso) delle pagine? 3) inseriti ammenicoli tipo favicon.ico? Niente che prima ricevesse 404 e che ora riceve 304? 4) andamento dei 404? Cambiamenti nella gestione del 404? 5) robots.txt uguali tra prima e dopo? 6) i tag sono tutti chiusi per bene come dio comanda? Attendo info, ma mi viene da fare questo ragionamento/congettura: sappiamo che i tempi di attenzione che GG dedica ad un sito sono una quantità finita, che dipende da 100 fattori, ma è una quantità finita. E se anche la location del sito avesse un tempo di attenzione di default, che varia da IP a IP, e che viene applicato in mancanza di "digestione" completa del sito che insiste su quell'IP? In questo caso potrebbe essere che un reset conseguente al cambio del solo IP ha come implicazione che le pagine non vengono assorbite completamente in prima battuta, come avviene in un sito "maturo", ma solo assaggiate (tipo i primi xxx caratteri o kb), in attesa della valutazione. E' ovviamente una congettura tirata come un violino, ma se il colpevole naturale (il 304) è innocente.... potrebbe essere che per qualche ragione il bot fa assaggini invece di papparsi le pagine intere. A te la palla, ciao. |
|
#5
|
|||
|
|||
|
Ago:
1) hai già provato a uploadare una bella sitemap.xml (ed .htm)? Ultimamente noto che se le pappa come il pane appena sfornato (e le digerisce quasi in tempo reale)... 2) Hai analizzato quali URLs (e con che frequenza) vengono scandagliati da Googlebot? 3) Interessante l'osservazione di Piersante. Ci sarebbero altri motivi che giustificherebbero la sua ipotesi, primo fra tutti il risparmio di banda (con tutto quello che si deve pappare google..) ![]() |
|
#7
|
||||
|
||||
|
Anche a me piace la teoria di Pieropan
![]() |
|
#8
|
|||
|
|||
|
Eh, Agoago... ci lasci cosi'? In sospeso?
Ti sei fatta un'idea? |
|
#9
|
|||
|
|||
|
Eccomi!
Chiedo scusa a tuttii voi, ma sto finendo un gioco da tavolo (una versione moderna ed avanzata della classica dama... si dovrebbe chiamare "Colonne", per la serie cosa ci tocca fare per campare...) e pertanto ho tralasciato momentaneamente i soliti interessi. Inoltre sto finendo il programma di AI per la creazione di testo artificiale, se Phil Katz da lassu' vorra'.... entro fine anno potro' distrubuire (gratuitamente) a chi lo vorra' qualche decina di siti a testa per la fase di test iniziale. ------ Per quanto riguarda il "mistero del server" un bravissimo a Pieropan! G dopo il cambio del server non mi spiderizza mai oltre i 3900 e rotti bytes, Come dice Pieropan: "In questo caso potrebbe essere che un reset conseguente al cambio del solo IP ha come implicazione che le pagine non vengono assorbite completamente in prima battuta, come avviene in un sito "maturo", ma solo assaggiate (tipo i primi xxx caratteri o kb), in attesa della valutazione" Me ne sono accorto qualche giorno dopo aver postato, di certo per essere un' ipotesi tirata come una corda di violino quella corda suona come su di uno Stradivari. HTTP/1.1" 200 3199 "-" "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)" HTTP/1.1" 200 3860 "-" "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)" HTTP/1.1" 200 3213 "-" "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)" HTTP/1.1" 200 2693 "-" "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)" HTTP/1.1" 200 3578 "-" "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)" e le pagine sono tutte da 10k in su di codice e testo. --------- Ecco risolto il "mistero del server" mistero che segna un momento importante-significativo di cambio di rotta da parte di G che si pone l'obbiettivo di ottimizzare le proprie risorse in previsione del IPV6. --------- Ora, come sfruttare questa nuova realta'? Beh, mettiamola cosi'... in futuro se vorro' modificare una mia pagina (sperando che i motori ne prendano atto) mi converra' partire dall'alto o dal basso? I bytes a fondo pagina varranno cosi' poco da poter in futuro essere "inizialmente" ignorati dai motori? (oggi solo per i siti nuovi o da rivalutare... ma un domani... per tutti?'). ---- Proprio vero che ogni giorno se ne vede una nuova! Per esempio un mese fa ho scoperto che i.e. non esegue un semplice redirect via meta refresh su di una pagina 404 se quella pagina non pesa almeno 515 bytes. Per i.e. se una pagina di error code 404 non pesa almeno-circa 515 bytes non e' una pagina 404 presentabile agli utenti. Ecco un altro esempio in cui i bytes condizionano il web. Ed e' solo l'inizio. --- Torno al mio gioco, mi sbagliero' ma oggi mi danno piu' sicurezza-certezze 4 regole in croce e qualche pedina in una scatola di tutti i nuovi farneticanti e disperantissimi algoritmi dei motori. Pensavo dopo 15 anni di aver visto tutto e di piu', ma scoprire che oggi si ritenga possibile decidere se sia il caso di frequentare una ragazza unicamente gurdandogli le caviglie mi ha lasciato letteralmente di merda (i sommi direbbero basito, io dico di merda). Forse stiamo inesorabilmente invecchiando. |
|
#10
|
|||
|
|||
|
Citazione:
E se invece delle caviglie decidessimo sulle prime 3900 parole/bytes che vengono enucleate dalla giovine fanciulla? Forse sapremmo già tutto di lei...e cosi fa Google! 'notte Ago! |
![]() |
| Utenti attualmente attivi che stanno leggendo questa discussione: 1 (0 utenti e 1 visitatori) | |
| Strumenti discussione | |
| Modalità visualizzazione | |
|
|