Come Google utilizza machine learning nei suoi algoritmi di ricerca

A+ A-
google-brain-ai-rankbrain1-ss-1920

Uno dei più grandi parole d'ordine intorno Google e il mercato globale della tecnologia è di apprendimento automatico. Google utilizza con RankBrain per la ricerca e in altri modi. Abbiamo chiesto a Gary Illyes da Google nella seconda parte della nostra intervista come Google utilizza machine learning con la ricerca.

Illyes ha detto che Google utilizza per lo più per “venire con nuovi segnali e le aggregazioni di segnale”. Così essi possono guardare due o più differenti segnali non-machine-learning esistenti e vedere se la macchina aggiungendo imparando a l'aggregazione di essi può contribuire a migliorare la ricerca classifiche e la qualità.

Ha anche detto, “RankBrain, dove ... che ri-ranghi in base in base ai segnali storici,” è un altro modo in cui usano machine learning, e più tardi ha spiegato come funziona e che RankBrain Pinguino non usa davvero machine learning.

Ecco il file audio:

Ecco la trascrizione completa:

Danny Sullivan: In questi giorni sembra come se fosse davvero cool per le persone a dire solo l'apprendimento automatico è in uso in tutto.

Gary Illyes: E poi la gente fuori di testa.

Danny Sullivan: Sì. Che cosa è, che cosa stai facendo con apprendimento automatico? Come, in modo che quando si dice che non viene utilizzato l'algoritmo di base. Così nessuno di essere licenziato. Le macchine non hanno preso il sopravvento l'algoritmo, voi ragazzi sta ancora utilizzando un algoritmo. Hai ancora la gente cercando di capire il modo migliore per elaborare i segnali, e quindi cosa fare con l'apprendimento automatico; è [it] parte di questo?

Gary Illyes: sono tipicamente utilizzati per venire con nuovi segnali e aggregazioni di segnale. Quindi, fondamentalmente, diciamo che questo è un esempio a caso e non so se questo è vero, ma diciamo che vorrei vedere se la combinazione PageRank con Panda e qualsiasi altra cosa, non lo so, la frequenza token.

Se combinando quei tre in qualche modo si tradurrebbe in una migliore classifica, e per questo, per esempio, potremmo usare facilmente machine learning. E poi creare il nuovo segnale composito. Questo sarebbe un esempio.

L'altro esempio potrebbe essere RankBrain, dove ... che ri-ranghi in base in base a segnali storici.

Ma questo è anche, se, se ci pensate, è anche un segnale composito.

E 'utilizzando diversi segnali a venire con un nuovo moltiplicatore per i risultati che sono già ordinati per l'algoritmo di base.

Cos'altro?

Barry Schwartz: Non utilizzare in primo luogo come un perfezionamento ricerca? Destra? Questa è la cosa principale?

Gary Illyes: Non so che ...?

Barry Schwartz: Non era RankBrain tutto su un certo tipo di query comprensione e ...

Gary Illyes: Beh, fare in modo che per la query siamo il miglior risultato possibile, in fondo, si è ri-ranking in un certo senso.

Barry Schwartz: Danny, hai capito RankBrain a dire, forse è stato solo me, per dire, qualcuno va bene cercato X, ma RankBrain fa davvero [it] in Xish? E poi le domande sarebbero i risultati.

Danny Sullivan: quando è uscito prima, la mia comprensione è [che] RankBrain è stato utilizzato per le query long-tail a loro corrispondere a brevi risposte brevi. Quindi, qualcuno arriva e dice, perché è la marea super-alta a volte, quando non capisco - la luna sembrava essere molto grande, e questa è una domanda molto insolito, giusto? E Google potrebbe essere in corso, OK, c'è un sacco di cose qui. Come fare decomprimere questo e dove, e quindi ottenere la fiducia e l'utilizzo di cose tipiche in cui si sarebbe come, OK, vedremo se abbiamo tutte queste parole si ha un collegamento a qualsiasi altra cosa. Nel frattempo, in realtà ciò che la persona sta dicendo è il motivo per cui è l'alta marea, quando la luna è piena. E questo è una query più comune. E Google ha probabilmente molto più fiducia in quello che è classifica quando si tratta di questo, e la mia comprensione [è che] RankBrain aiutato Google a capire meglio che queste query più lunghe coresponded fondamentalmente per le query più brevi in ​​cui aveva un sacco di fiducia circa le risposte.

Questo era allora, che era come quello che, un anno fa, o giù di lì? A questo punto, Gary, quando si inizia a parlare che ri-ranking, è che il tipo di re-ranking stai parlando?

Gary Illyes: Sì.

Danny Sullivan: OK.

Barry Schwartz: Va bene. Quindi non dobbiamo classificare tutte queste cose come RankBrain, o dovremmo? Come potrebbe essere altro machine learning.

Gary Illyes: RankBrain è un componente del nostro sistema di classificazione. Ci sono più di 200, come abbiamo detto all'inizio, i segnali che usiamo e che ognuno di loro potrebbe diventare come macchina di apprendimento-based.

Ma quando voi o non mi aspetto che in qualunque momento presto o in un prossimo futuro tutti loro sarebbe diventato sede di apprendimento automatico. O questo è quello che noi chiamiamo l'algoritmo di base diventerebbe basato machine learning. La ragione principale di ciò è che le decisioni di apprendimento automatico di debug o decisioni AI, se si vuole, se si vuole, è incredibilmente difficile, soprattutto quando si hanno ... più strati di reti neurali. Diventa quasi impossibile eseguire il debug di una decisione. E questo è molto male per noi. E per questo cerchiamo di sviluppare nuovi modi per per tenere traccia di nuovo decisioni. Ma se si può facilmente nascondere i problemi, e che limiterebbe il nostro con la nostra capacità di migliorare la ricerca in generale.

Barry Schwartz: Così, quando la gente dice Penguin è oggi un apprendimento basato su vecchia macchina ...

Gary Illyes: Penguin non è ML.

Barry Schwartz: OK, c'è un sacco di gente che dice che macchina di apprendimento basato Penguin [è].

Gary Illyes: Certo che fanno. Voglio dire, se ci pensate, è una parola molto sexy. Destra. E se si pubblica si ...

Danny Sullivan: Le persone lo usano nei bar e on-line per tutto il tempo. Come hey, machine learning. O si.

Gary Illyes: Ma in fondo, se si pubblica un articolo con un titolo come apprendimento automatico è ora in pinguino pinguino o generato da machine learning è come .... Ma se si pubblica un articolo con questo titolo è molto più probabile che la gente potesse cliccare su quel titolo, e bene, probabilmente venire con l'idea che sei pazzo o qualcosa del genere. Ma è molto più probabile che avrebbero visitare il tuo sito che se si pubblica qualcosa con un titolo Penguin ha lanciato.

Nota: Questo articolo è stato pre-scritto e programmato per essere pubblicato oggi.


Ads

Condividere