Come trovare vecchie pagine web


Postato in data Agosto 1st, da Riccardo Esposito in Vita da Webmaster. No Comments

È possibile recuperare pagine web vecchie? Fino a un certo punto sì, c’è questa possibilità. Il web offre diversi strumenti per vedere un sito come era prima e trovare vecchie pubblicazioni.

recuperare pagine web vecchie
Come trovare vecchie pagine con la cache.

È giusto capire è che non esistono veri miracoli. Avere un backup di proprietà è l’unico modo, per noi comuni mortali, di recuperare un sito internet interno. In alternativa esistono passaggi per trovare le vecchie pagine dei siti con Google? Sì, qualcosa puoi fare e ottenere.

Recuperare pagina web da cache

Questa è la prima tecnica per trovare e visualizzare le versioni precedenti di una pubblicazione. Ogni pagina, infatti, viene mantenuta in memoria da Google fino a un certo periodo di tempo.

Se modifichi il testo o un’immagine non è detto che il motore di ricerca assimili subito i cambiamenti.

Anzi, è probabile che ci siano diversi giorni di ritardo dovuto al passaggio del crawler. Tu fai la modifica e l’utente vede la nuova pagina. Ma il motore di ricerca ha ancora la vecchia versione in memoria. Puoi anche velocizzare il passaggio del crawler con il controllo URL della search console.

Però il ritardo ti consente di recuperare pagine web vecchie, versioni precedenti rispetto a eventuali modifiche. Qual è la procedura da seguire per leggere le pagine originali del sito?

Da approfondire: cancellare una pagina dal motore di ricerca

Come usare la cache di Google

Per sfruttare la memoria del motore di ricerca per visualizzare versioni passate di una pagina web basta avviare l’opzione che si trova nello snippet. Subito dopo l’URL, infatti, trovi una freccia verso il basso: cliccala per accedere al menu che ti dà il link con la copia cache.

recuperare pagine web vecchie
Come guardare nella cache di Google, esempio su My Social Web.

È la versione in memoria della pagina web, il documento che Google ha in suo possesso. L’intervallo che passa tra una scansione e l’altra dipende da tanti motivi (vedi crawler budget) ma se devi recuperare una pagina web vecchia ti può far comodo questo ritardo.

Puoi copiare il testo e le immagini della versione che precede le modifiche. Ovviamente questa soluzione non può essere usata per trovare pagine vecchie di molte settimane o addirittura anni. Dopo il passaggio dello spider devi usare altri modi per recuperare pagine vecchie.

Diversi vantaggi SEO della cache

L’aspetto interessante della cache di Google: oltre a scoprire la vecchia pagina web, con il testo e i contenuti multimediali precedenti a diversi salvataggi, puoi avere la versione sorgente (il codice HTML) e quella testuale di una risorsa. In questo modo hai uno strumento SEO extra e scopri cosa vede Google a prescindere dalle regole imposte dall’aspetto grafico.

Vedere un sito come era prima

Per scoprire le versioni precedenti di un portale o un blog puoi usare uno strumento affascinante: Wayback Machine di Archive.org. Come suggerisce il nome stesso, su questo servizio trovi tanti contenuti pubblicati su internet. C’è anche una sorta di macchina del tempo che ti consente di vedere un sito web nel passato. Come sfruttare questa funzione di cache?

archivio pagine web
Internet time machine wayback.

Basta andare su archive.org e cercare nel form il portale che ti interessa. Qui trovi una barra con calendario e diversi elementi in evidenza. Sono gli screenshot effettuati nel tempo, i punti di backup consultabili. Non troverai tutte le pagine e il numero indicato non rappresenta le volte che il sito è stato modificato ma gli screenshot effettuati nel tempo.

Wayback Machine di archive.org è uno strumento decisivo per recuperare pagine web come erano anche in un passato lontano, a distanza di diversi anni. Spesso viene usato per fare SEO audit su siti web e analisi di dominio acquistati per scoprire cosa c’era in passato.

Velocizzare il recupero cache

Sia per Google che per Archive.org esistono dei comandi rapidi che ti consentono di visualizzare le vecchie versioni delle pagine con gli operatori avanzati. Per quanto riguarda il motore di ricerca basta usare il comando cache: seguito dall’URL. Ecco un esempio:

cache:mysocialweb.it

http://webcache.googleusercontent.com/search?q=cache:mysocialweb.it

Ovviamente puoi lavorare sul dominio principale o sulla singola pagina. Ci sono due versioni, la prima è una facilitazione che in passato potevi attivare solo su Chrome. Ora non è più così.

https://web.archive.org/web/*/https://www.mysocialweb.it/

Questa soluzione, invece, ti consente di guardare direttamente nella Wayback Machine di Archive.org senza passare dal sito. Basta andare su Google e digitare l’URL del servizio e quello della pagina separato da asterisco. Così puoi ottenere la vecchia versione.

Da leggere: differenza tra hosting e dominio

Come recuperare sito cancellato

Il modo per avere di nuovo un portale così come lo hai lasciato? Affidarsi alla cache di Google o ad Archive.org è un azzardo che non puoi permetterti. Devi lavorare in modo diverso.

Se stai analizzando un sito web concorrente o che vuoi acquistare questi metodi possono andar bene, ma per i tuoi progetti assicurati di avere un backup giornaliero o addirittura orario: per i grandi portali quest’ultima soluzione può far risparmiare tanto lavoro.

Riccardo Esposito

Blogger per Serverplan, webwriter freelance e autore di My Social Web. Scrivo ogni giorno. Ho pubblicato un libro dedicato al mondo del blogging. Ah, l'ho già detto che scrivo?




Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *

*

Shares