una mia interpretazione:
l'utente cerca "cavallo", per google la parola cavallo equivale al numero "25414"
ora google in base ai suoi database sa che il numero "25414" in media compare in un testo circa 10 volte accoppiati ai numeri "287" e "10340", 9 volte con i numeri "23210" e "7650" e così via
per arrivare a questo è molto semplice:
prende i testi che preleva dai vari siti che ha nel suo database e con un po di statistica arriva a queste associazioni.
fin qui tutto chiaro ?
ora mettiamo che google fa questo ragionamento in base a tutto il testo di una pagina, quindi analizza parola per parola (escludendo punteggiatura o stopwords) una percentuale di incidenza
è facile comprende come possa capire il senso di una frase.. quindi siamo noi ad insegnargli "l'italiano"
il discorso poi è molto lungo, se volete approfondire..