Blekko Blocchi Più “Spam” Domini: 1.1 milioni di loro

A+ A-

Motore di ricerca Blekko ha annunciato che ha ormai bloccato 1,1 milioni di siti web da suoi risultati di ricerca utilizzando un nuovo sistema si chiama “AdSpam,” e nuove pagine da qualsiasi sito web non verranno aggiunti se non passano l'esame.

Bloccare lo spam prima che venga In

Dal comunicato stampa Blekko:

“Questa nuova tecnologia si blocca lo spam prima che mai si presenta in una pagina dei risultati di ricerca”, ha dichiarato Rich Skrenta, CEO di Blekko. “Abbiamo identificato algoritmicamente più segnali di spam per ogni pagina nel nostro indice. Eliminando tali domini dal nostro indice è drammaticamente ripulito nostri risultati di ricerca.”

E dal post sul blog della società:

Oggi, stiamo prendendo il prossimo grande passo in avanti con il lancio del nuovo algoritmo AdSpam di Blekko. Questa nuova tecnologia cambierà radicalmente ricerca. E 'il primo algoritmo di ricerca mai creato per trovare lo spam, piuttosto che i risultati di rango. L'algoritmo è stato appositamente progettato per riconoscere le pagine che sono spam e eliminarli prima che mai appaiono nei risultati di ricerca.

Questo è interessante, l'idea di bloccare pagine spam prima che si aggiungono a un indice di ricerca. Potrebbe essere stato fatto prima, ma se è così, non ricordo per quale servizio. Certo, non è mai qualcosa di abbastanza per me da ricordare degno di nota. Se si mantiene lo spam interamente, potenzialmente che rende per i risultati più puliti.

Poi di nuovo, è anche qualcosa che è molto più probabile di beneficiare Blekko rispetto a Google o Bing. La ragione è che entrambi i motori di ricerca hanno algoritmi di ricerca molto più maturi di Blekko, in modo che potrebbe già fare un lavoro migliore di tenere lo spam dai risultati migliori, anche se le pagine di spam stessi sono inclusi nel indice di ricerca complessiva - che è come un grande libro di tutte le pagine web che hanno raccolto.

Più importante, sia Google e Bing hanno ingenti risorse in cui l'indicizzazione di un milione o addirittura un miliardo di pagine di spam in realtà non lasciare meno “stanza” per memorizzare la roba “buona”. Hanno migliaia di server. Bagagli per loro è relativamente a buon mercato. Ma per Blekko, ogni pagina di spam che indice è potenzialmente più costosa.

Per quanto riguarda il nome “AdSpam” - è terribile. Mi sembra di capire che nasce dall'idea che queste sono pagine caricate con gli annunci - ma io lo trovo piuttosto confusa.

In precedenza in “Banned On Blekko”

Il mese scorso, Blekko ha guadagnato una certa attenzione vietando 20 siti di “spam” dal suo indice. Da allora la nostra copertura:

Rich Skrenta, CEO di Blekko ha confermato il divieto con noi oggi. Ci ha detto Blekko ha deciso di vietare i “primi 20 siti di spam dall'indice di Blekko del tutto, sulla base dei nostri utenti clicca / spam sui risultati.” Ciò include ehow.com, uno dei siti di generazione di web top di ricavo Demand Media.

I siti?

  • ehow.com
  • experts-exchange.com
  • naymz.com
  • activehotels.com
  • robtex.com
  • encyclopedia.com
  • fixya.com
  • chacha.com
  • 123people.com
  • download3k.com
  • petitionspot.com
  • thefreedictionary.com
  • networkedblogs.com
  • buzzillions.com
  • shopwiki.com
  • wowxos.com
  • answerbag.com
  • allexperts.com
  • freewebs.com
  • copygator.com.

Ma aspetta. Sono questi i siti di spam superiore a 20 o, come ha detto il rilascio di Blekko oggi, i “top 20 aziende di contenuti.” Entrambi. Nessuno dei due. È confusionario.

Spam è negli occhi del motore di ricerca Beholder

lo spam dei motori di ricerca è tutto ciò che un motore di ricerca decide che sia. Ad esempio, sia Google e Bing considererebbe generalmente pagine che “mantello” - Mostra contenuto per l'utente che è diverso da quello che loro crawler automatizzati vedere - essere spam. Entrambi concordano su molti altre tattiche che sarebbero considerati spam, ma potrebbero non essere d'accordo con precisione. Né saranno d'accordo con Blekko.

Praticamente nessuno dei siti di cui sopra, dalla mia rapida rassegna, sarebbe considerato spam da parte di entrambi Google o Bing. Certamente Google ha causato alcuni di loro di perdere posti nel suo recente aggiornamento Farmer / Panda. Ma non era perché erano spamming Google. E 'stato perché avevano alcuni contenuti che il nuovo algoritmo ha deciso di premiare non è più come in passato.

In breve, i contenuti di bassa qualità non è uguale lo spam, non a Google o Bing. E 'solo qualcosa che non rango come altamente, che è esattamente ciò che si suppone loro algoritmi di fare.

Con la lista di blocco iniziale di Blekko, ha deciso che i siti erano spam basata su segnalazioni degli utenti, indipendentemente dal fatto che questi siti violati eventuali linee guida tradizionali di spam dei motori di ricerca. Con l'ultima mossa, Blekko è ulteriormente decidendo che di bassa qualità è uguale spam. Anche in questo caso, da posta:

Che cosa è esattamente è AdSpam? In breve, si tratta di un algoritmo di apprendimento automatico che esamina le pagine per i segnali di spam specifici - la presenza di più posizioni di annunci display su una singola pagina e sottile per il contenuto zero.

Il risultato finale di approccio di Blekko contro Google potrebbe potenzialmente essere la stessa. Google mira a tenere aggiornati i contenuti “superficiale” da si presenta per molte ricerche, anche se le pagine sono tra quelli che ha raccolto. Blekko punta anche a tenere aggiornati i contenuti poco fuori - ma a differenza di Google, si applica l'etichetta “spam” per tali contenuti e impedisce che venga indicizzato in primo luogo.

Che cosa è andato adesso?

Nel corso al New York Times, Claire Caino Miller ha avuto una buona parte sulla mossa di Blekko e se buoni siti potrebbero essere danneggiati. No, dice Blekko:

Anche se sembra come molti siti legittimi potrebbe essere considerato spam in questo algoritmo - giornali coprono una vasta gamma di argomenti, per esempio, e molti blogger possono essere scrittori dilettanti, ma sono esperti nei loro campi - Mr. Skrenta detto che quando ha pettinato attraverso migliaia dei siti che l'algoritmo vietato, ha trovato solo due falsi positivi.

Esempi di siti Blekko ora vieta: cheap-refrigerators.net, best-weddinggifts e Boston.diningguide.com.

Aiuta?

Non ho fatto alcun test diffusa. Ma notando che il nome del sito web cheap-refrigerators.net sopra che è stato confermato come rimosso - “Frigoriferi Consigli per acquisti” - ho pensato che una ricerca su questo argomento potrebbe essere interessante:

È possibile fare clic per ingrandire l'immagine. Ho rimosso l'annuncio che era in cima ai risultati sia da Blekko e Google, in modo da poter concentrarsi sui primi cinque risultati editoriali. Il mio prendere:

blekko

  1. OK, ma breve e di base
  2. Irrilevante - si deve cercare ulteriormente nel sito per ottenere suggerimenti
  3. Alcuni buoni consigli fondamentali da grande distributore
  4. contenuti sottile che solo link a contenuti più sottile
  5. circa filtri per l'acqua per frigoriferi - Irrilevanza

Google

  1. Buono, sostanziale articolo in più parti
  2. Buono, brevi suggerimenti che portano a ulteriori recensioni
  3. Alcuni buoni consigli
  4. Alcuni buoni consigli da Consumer Reports, un importante marchio di fiducia
  5. suggerimenti OK, circa tre anni

Siamo spiacenti, Blekko - non posso dire che far cadere quel sito frigorifero, e tanto meno gli altri 1 milione o giù di altri siti, ti ha aiutato a tutti nei confronti di Google per questa query particolare. Utilizzando il / recensioni slashtag ha aiutato - ha ottenuto uno dei buoni siti che Google ha dovuto essere elencati prima. Ma gli altri tre buoni siti che Google aveva tra i primi cinque risultati non hanno mostrato.

Inoltre, la maggior parte dei ricercatori tipici non si ha intenzione di utilizzare slashtags - e c'è anche meno ragione per usare quando la stessa ricerca di Google porta in primo piano i migliori risultati, non slashtag richiesto.

Il fattore umano

Il post di Blekko dice anche:

A differenza di algoritmi utilizzati da altri motori di ricerca, AdSpam viene utilizzato in combinazione con curation umana per rilevare per continuare la guerra contro spam.

Vero - Blekko sta facendo uso di sforzi umani per decidere ciò che è bene e il male. In particolare, Blekko recentemente collaborato con Stack Exchange (ex Stack Overlow) per curatela di programmazione e di argomenti tecnici.

Aspettatevi Google per spingere indietro su tutto “non ha esseri umani” aspetto, tuttavia. E 'fatto prima, l'ultima volta quando entrambi Mahalo e Search Wikia ha provato che l'angolo. Google ha sottolineato che ha revisori umani, che servono come una sorta di “doppio controllo” sul algoritmo informatico cambia si fa, per esempio.

Google ha sottolineato di nuovo di recente, quando ha fatto l'aggiornamento Farmer, per sottolineare che il cambiamento computer basato sembrava essere supportato da dati umani che cerca di modellare. Google anche suggerito che ciò che la gente blocco utilizzando la sua estensione Chrome Personal Blocklist potrebbe essere i dati che viene utilizzato nel suo algoritmo di ricerca, in futuro.

Ancora, Google ha niente come il curation slashtag che Blekko offre. Detto questo, Blekko deve ancora dimostrare che questo curation si sta trasformando in risultati di qualità superiore, che riescono ad attirare gli utenti significativi da parte di Google, molto meno Bing. Ma sul fronte PR, non c'è dubbio che le mosse di Blekko stanno mantenendo la pressione su Google per migliorare pure.

Ulteriori informazioni

Non ho avuto la possibilità di parlare con Blekko di più sul sistema, come io sono attualmente alla nostra SMX West conferenza di search marketing a San Jose. Blekko - insieme a Google e Bing - partecipa nel nostro “The Spam Polizia” e “Chiedi i motori di ricerca” sessioni di domani, quindi mi aspetto più specifica under-the-hood dettagli emergeranno da questo. Restate sintonizzati (e anche guardare per la copertura relative su Techmeme). vedi anche gli articoli qui sotto per più di fondo su alcune delle cose che ho citato sopra.