"Yandex" ha aprendido a responder con mayor precisión a consultas complejas
Noticias Los Servicios Web / / December 19, 2019
El nuevo algoritmo "Yandex" convierte la solicitud de búsqueda, y varios sitios en las unidades semánticas o los llamados vectores semánticas. Una vez que un usuario introduce una consulta, el motor de búsqueda compara los vectores con el título y el contenido de sitios potencialmente adecuados. algoritmo anterior "Palekh" sólo podía comparar los vectores semánticas de la solicitud y los encabezados y páginas web escanea "Korolev" por completo.
"Yandex", explica el algoritmo "Korolev" como un ejemplo de "Guerra y Paz". Versión anterior puede buscar sólo para encontrar un libro de título o palabra clave asociada con el contenido: los nombres de los personajes, títulos de los capítulos, y así sucesivamente. Un nuevo algoritmo se lee como una novela y totalmente entiende el significado de la narración.
Según los desarrolladores, la principal ventaja de comprender el significado de las consultas que el idioma de búsqueda se vuelve más humano. El usuario no puede buscar una película por su nombre, sino simplemente describir brevemente la trama. Por ejemplo: "una película sobre el espacio en el que el héroe estaba hablando con su hija a través del reloj." Los algoritmos se da cuenta de que hay una película "interestelar", donde el héroe es Matthew McConaughey fue en el espacio y utilizan el reloj de comunicarse con su hija. Y esta película se mostrará en los resultados de búsqueda.
Para buscar entender como el significado de la consulta se relaciona con el contenido de una página web, es necesario utilizar una red neuronal a gran escala. Para su formación se necesita mil millones de ejemplos, por qué los usuarios "Yandex", para usar sus algoritmos de entrenamiento.
Si una persona se mueve de los resultados de búsqueda en el sitio y se mantuvo en él, lo más probable, el algoritmo funcionaba correctamente. La red neuronal es entrenado en un mal ejemplo: si el sitio se cierre inmediatamente o perdidas simplemente, el sistema recordará. Para que en el futuro la búsqueda debe trabajar cada vez mejor.