Take Back tuoi link perso

A+ A-
Recuperare i vostri collegamenti reindirizzate

E 'una storia familiare per molti nel settore: Una società ha appena lanciato un nuovo sito web, e il loro traffico è sceso! Ora, dobbiamo capire che cosa è andato storto.

Se siamo fortunati, il nuovo sito avrà un problema evidente - la società ha eliminato un sacco di contenuti, qualcosa sta interessando l'indicizzazione, o l'ottimizzazione on-page ha alcuni problemi. Altre volte, vedremo un calo evidente nel link in entrata e si rendono conto che qualcuno probabilmente non ha attuato correttamente i reindirizzamenti. Forse la società che ha costruito il sito saltato facendo redirect, che crea un problema in che probabilmente non abbiamo un elenco dei vecchi URL o struttura del sito per mappare correttamente e implementare i reindirizzamenti.

Quando non c'è colpevole Obvious

In rari casi, la struttura del sito può essere lo stesso, gli URL stesso, reindirizza dal sito precedente sono fatto, il contenuto è lo stesso, non ci sono problemi di indicizzazione e ottimizzazione on-page è altrettanto buono come la versione precedente; eppure in qualche modo, il traffico, le classifiche e collegamenti ancora cadere.

E 'possibile il problema è ancora reindirizza, ma da versioni precedenti del sito web che non sono esistiti in anni. Redirect 301 sono destinati a passare il valore dei collegamenti e l'utente da una pagina all'altra o un sito all'altro. Raramente sono redirect da precedenti versioni del sito riportati e aggiornate quando un nuovo sito web è stato lanciato.

Parte del problema deriva dal fatto che un redirect 301 è chiamato un “Permanent Redirect”, per cui v'è un malinteso comune che essi sono in realtà permanente. In realtà, i reindirizzamenti 301 sono permanenti solo finché i reindirizzamenti sono ancora in vigore.

Vedo spesso le aziende che hanno cambiato i domini, e pochi anni dopo, quando il loro vecchio dominio scade, provoca un calo nella classifica e di traffico. Questo è perché hanno perso i collegamenti dal vecchio sito web che hanno pensato era stato permanentemente reindirizzato. Chiunque abbia mai avuto un file .htaccess con un sacco di reindirizzamenti accidentalmente sovrascritti vi dirà subito che 301s non sono in realtà permanente.

Reindirizzamenti 301 sono permanenti solo finché i reindirizzamenti sono ancora in vigore.

Google Webmaster Tools sembra mantenere i dati su un sito web e il suo contenuto e collegamenti per sempre. Ho visto errori di scansione in cui la pagina è collegata da un'altra vecchia pagina su una versione del sito web che non è esistito in oltre 15 anni. Google sa ancora il contenuto che esisteva, così come i collegamenti interni ed esterni link a quelle pagine, dopo tutto quel tempo!

Perché un Business Care?

Se un'azienda ha pagato per SEO o l'acquisizione naturalmente i collegamenti nel corso degli anni, una parte del valore che avevano costruito può essere perso in un sito web di rilancio. Le pagine in cui tali legami puntati ora probabilmente restituiscono un - codice di stato “404 Not Found”, e questi link non passano più valore al loro sito web. A volte, siamo così concentrati su come ottenere nuovi link che ci dimentichiamo di mantenere tutti i vecchi!

L'esempio seguente mostra un sito web con traffico organico stabile. Dopo un sito web design, redirect non sono state attuate in modo corretto, e mi è stato portato in circa una settimana più tardi per risolvere il problema.

Entro un paio di settimane, i reindirizzamenti erano a posto; entro un mese, il traffico organico era raddoppiato rispetto ai precedenti livelli. Redirect sono stati fatti non solo dalla versione precedente del sito (che conteneva lo stesso contenuto con una struttura URL diverso), ma anche attraverso cinque generazioni di questo sito web.

Redirect fallito e fissi
Con Urlando Rana e la Wayback Machine, siamo in grado di raccogliere la maggior parte degli URL da precedenti generazioni del sito. Poi, usando Urlando Rana e Microsoft Excel, siamo in grado di verificare tutti i redirect sono fatto e recuperare quei preziosi legami perduti!

Urlando Setup Frog

Per eseguire la scansione del Wayback Machine con grida rana per raccogliere i nostri vecchi URL, è necessario configurare correttamente il ragno. In Urlando Rana, alla voce “Configurazione”> “Spider” possiamo regolare le impostazioni in base alle nostre esigenze.

Qui di seguito è uno screenshot con impostazioni consigliate. A seconda della verticale e la quantità di immagini il traffico al nostro sito web, potremmo voler afferrare URL di immagini pure.

Consigliato Urlando Frog Impostazioni cingolati per la Wayback Machine

In “Configurazione”> “Includi”, aggiungere. * Domain.com. * Con domain.com essere il nostro dominio. Questo aiuterà con le risorse cingolati includendo solo i collegamenti che includono il nostro nome di dominio. Per risparmiare tempo, dobbiamo anche aumentare il numero di thread che rende la scansione più veloce. Il numero di thread può essere cambiato in “Configurazione”> “Speed”.

Per essere in grado di eseguire la scansione del Web Archive, abbiamo bisogno di andare anche a “Configurazione”> “User Agent” e impostare l'agente a “Custom” e come ia_archiver che è crawler che viene utilizzato da Internet Archive.

Urlando Rana impostato come Internet Archive User Agent

Ora che abbiamo le impostazioni, inserire l'URL http://web.archive.org/web/*/www.domain.com dove www.domain.com viene sostituito con il nostro sito web. Se il nostro sito web è molto grande o ha avuto molte versioni archiviate, si consiglia di aumentare la memoria dal valore predefinito di 512 MB (vedi un tutorial qui).

Una volta che la scansione è completata, passare alla scheda “interno”, utilizzare l'opzione “Esporta”, e salvare come un documento di Excel.

Alternative per gli URL Gathering

La Wayback Machine ha un modo per elencare tutti gli URL per un dominio nel loro indice. Vai a https://web.archive.org/web/*/http://www.domain.com/* sostituzione www.domain.com con il nostro dominio, naturalmente.

Il problema con questo è che abbiamo ancora bisogno di raschiare i dati dalla pagina. Un'alternativa migliore potrebbe essere quella di utilizzare il loro API JSON e JSON convertire l'uscita in un file CSV. Ci sono una serie di strumenti che possono rendere questa conversione, ma quelli basati sul web possono esistere limiti di upload o problemi di timeout a seconda delle dimensioni del nostro file.

Per produrre i nostri collegamenti in formato JSON, andare a http://web.archive.org/cdx/search/cdx?url=domain.com/*&output=json&limit=99999999. Ancora una volta, sostituire domain.com con il nostro dominio. Siamo in grado di regolare il limite di uscita, nonché a seconda delle dimensioni del sito e quante volte è stato archiviato.

Pulizia URL presenti in Excel

Abbiamo raccolto i dati del Wayback Machine con Urlando Rana, così ora abbiamo bisogno di utilizzare Excel per ottenere i dati nel formato che ci serve.

  1. Una volta che abbiamo i dati in Excel, fare clic sul primo URL (che dovrebbe essere la cella A4) e premere CTRL + MAIUSC + GIÙ.
  2. Copiare tutti gli URL e incollarli in un altro foglio.
  3. Premere Ctrl + F e passare alla scheda “Sostituisci”.
  4. Tipo * domain.com nella “Trova:” campo con domain.com essendo il nostro sito web, e lasciare il “Sostituisci con:” campo vuoto per sbarazzarsi di tutte le estensioni di dominio, così come le cose che riguardano l'Internet Archive.
  5. Selezionare la colonna e andare a “dati”> “Rimuovi duplicati”, che ci lascerà con una lista pulita di tutte le vecchie URL.

Ci sono un paio di pagine a cui fare attenzione, come per esempio /, index.html, caratteri speciali nell'URL, e, naturalmente, tutte le pagine che esistono attualmente.

Questi dovranno essere rimossi dalla lista o possono avere condizioni speciali richiesti per riscritture di successo. Sappiate che l'attuazione improprio può causare un loop di reindirizzamento che può rendere il vostro sito inutilizzabile.

Eseguire la scansione del sito attuale e confronta i URL

Abbiamo bisogno di eseguire la scansione del sito web corrente con Urlando Rana e raccogliere gli URL correnti. Non vorremmo che per reindirizzare le pagine già esistenti. Abbiamo bisogno di pulire gli URL correnti prima di usare “Sostituisci” per mettere a nudo il dominio.

  1. Posizionare gli URL raccolte dal Wayback Machine nella colonna A e gli URL corrente nella colonna B.
  2. Nella colonna C, immettere = CERCA.VERT (A1, B: B, 1, FALSE) e copiare la formula. Questo sta per controllare il valore nella colonna A e confrontarlo con colonna B e se non v'è una corrispondenza, la formula restituirà un valore di “N / A”. Sono i valori “N / A” che vogliamo .
  3. Aggiungere una nuova riga nella parte superiore del foglio in modo che quando filtriamo, il primo valore non viene ignorato.
  4. Vai alla scheda “Dati” in Excel e selezionare l'opzione “Filtro”.
  5. Selezionare colonna C e clicca su “Filter”.
  6. Nel menu a discesa che appare, clicca su “Seleziona tutto” per deselezionare tutto e selezionare il valore “N / A” in fondo alla lista.
  7. Quello che dovrebbe essere lasciato sono i valori nella colonna A, che non sono stati abbinati agli URL attuali. Selezionare e copiare questi valori.

Scrivere il nostro Redirect

  1. In un nuovo foglio, incollare gli URL nella colonna B. Questi sono gli URL di cui abbiamo bisogno per riscritture.
  2. Nella colonna A, immettere “reindirizzamento 301” (senza virgolette) in un paio di righe e selezionare entrambe le righe così si è in grado di copiare questo valore verso il basso senza contare 301, 302, 303, etc.
  3. La parte più in termini di tempo di questo processo è la compilazione della colonna C, dove potrete inserire il percorso completo per le più rilevanti URL attuali.
  4. In una nuova colonna, inserire la formula = A1 &”‘& B1 &’“& C1 e copiare questo in giù. Questo dovrebbe ora scrivere standard 301 reindirizza per la pagina di redirect livello di pagina.
  5. Copiare la colonna e usare “Incolla speciale” per incollare come “Valori”, piuttosto che le formule, e si avrà il testo che può essere copiato nel file .htaccess o di un documento di testo.

Come accennato in precedenza, ci sono molti casi, come le pagine di indice o URL contenenti caratteri speciali o spazi che devono essere scritti in modo diverso in modo da essere a conoscenza di quelli.

Controllo Nostro Lavoro

Abbiamo bisogno di ricreare le URL completi delle nostre vecchie pagine al fine di verificare che essi vengono reindirizzati correttamente. Una funzione CONCATENA ci può aiutare a aggiungere il dominio torna alla nostra lista di URL.

  1. Utilizzare la formula = CONCATENATE ( “http://www.domain.com”, A2), ad esempio nella cella B2 per aggiungere il sentiero URL di nuovo al dominio.
  2. Copiare la formula verso il basso di ricreare tutti i nostri vecchi URL.
  3. Questi URL sono attualmente in formule, in modo da selezionare e copiarli e “Incolla speciale”, come “Valori” per ottenere un elenco utilizzabile.
  4. Copiare i nuovi valori a un documento .txt o in versioni più recenti di grida rana possiamo incollare direttamente.
  5. In Urlando Rana, andare a “Mode” e selezionare “List”.
  6. Caricare il documento .txt che hai appena fatto con il “... da un file” l'opzione o se si preferisce si può scegliere “Incolla” per caricare i valori dagli appunti.
  7. Urlando Frog ora strisciare i vecchi URL.

Supponendo che abbiamo posto le riscritture in .htaccess, le informazioni restituite possono essere ordinati per codice di stato per determinare se ci sono problemi con i reindirizzamenti. Si può anche andare a “Report”> “redirect Chains” per vedere se uno degli URL per essere reindirizzato più di una volta. Idealmente, tutti gli URL più anziani punterà direttamente alla più rilevanti nuovo URL, e nessuno degli URL dovrebbe restituire un codice di stato 404.

Mi consiglia di strisciare il sito web utilizzando Urlando Rana sia prima che dopo il redirect sono posti per assicurarsi che non nuovi errori sono causati da reindirizzamenti. Se avete lasciato in una pagina di indice o reindirizzato una pagina o una categoria esistente, il vostro sito potrebbe essere inutilizzabile o parte del sito web non può essere accessibile.

Questo è un sacco di riscritture

Troppo grande di un file .htaccess può rallentare il vostro sito web. Reindirizza coinvolgendo le espressioni regolari può essere più appropriato che i singoli redirect pagina.

Il file .htaccess può anche essere suddiviso in più file in base alla struttura di directory, che farà in modo che le riscritture vengono controllati solo quando qualcuno cerca di accedere a quella directory.

Un modo migliore per un gran numero di reindirizzamenti sarebbe quello di evitare l'uso di .htaccess a tutti, e utilizzare il file di configurazione del server httpd. Ci sono momenti in cui una riscrittura mappa può essere la soluzione appropriata pure. Consultare il proprio esperto del server per capire quale soluzione si adatta meglio alle vostre esigenze.

Può questo ottenere È penalizzato?

Se i link a un sito erano meno pulito in passato, il ripristino di questi collegamenti persi potrebbe tradursi in una sanzione per il sito web. I vecchi link da siti web articolo, guest post, comunicati stampa, o elenchi di link profondi possono avere molti collegamenti ricchi di parole chiave ad alcune di queste pagine e potrebbero innescare una algoritmica o anche un rigore manuale.

Vorrei raccomandare che i link in entrata in Google Webmaster Tools devono essere monitorati dopo l'implementazione dei reindirizzamenti e la strumento di rifiuto utilizzati per sbarazzarsi di qualsiasi link di spam che possono apparire.

Non lasciate che i vostri collegamenti persi! Assicurarsi che qualcuno presso l'azienda ha il controllo di tutti i domini e si occupa di rinnovi. Avere procedure per implementare e mantenere redirect al fine di preservare il valore dei link ottenuti nel corso del tempo.


Le opinioni espresse in questo articolo sono quelle dell'autore del cliente e non necessariamente Search Engine Land. Autori del personale sono elencate qui.


Ads

Condividere