Google patenta el «Quiso decir…»

·

Desde prácticamente el inicio de Google hemos visto en los resultados de búsqueda un sistema que, al escribir de forma incorrecta una consulta se nos sugería otra escrita correctamente. Tiempo después hemos visto evoluciones de este servicio incluso dando directamente los resultados de búsqueda intercalando los correctos e incorrectos o incluso dando directamente los resultados corregidos completamente.

Han tenido que pasar 7 años para que Google ahora consiga la patente que permite corregir y sugerir automáticamente una consulta de búsqueda por otra.

Cuando el sistema recibe una consulta de búsqueda que incluye una entidad, se determina la posibilidad de ofrecer una consulta reescrita basada en la información recibida por consultas anteriores relacionadas con la entidad y reescribe la consulta de búsqueda cuando se determina que la consulta de búsqueda puede ser reescrita. El sistema determina la posibilidad de ofrecer una sugerencia de reescritura de la consulta de búsqueda, basada en la información previa de búsquedas de la entidad cuando la búsqueda no puede ser modificada. El sistema también genera la reescritura de la sugerencia cuando se determina la posibilidad de reescribirla. Permite que una búsqueda recibida pueda reescribir los resultados, presentarlos y mostrar la sugerencia cuando se provee una sugerencia.

Aunque suene un poco liado, básicamente lo que se contempla son varias posibilidades. Lo más simple es mostrar la sugerencia (el famoso «quiso decir…») pasando por mostrar directamente los resultados de la sugerencia en vez de la consulta original o intercalar los resultados.

Pero quizá lo más interesante no es el qué hace, sino cómo lo hace, y es que la patente ofrece algunos sistemas para calcular este sistema que calcula los resultados alternativos. El sistema básicamente lo que hace es recibir la consulta y la compara con consultas anteriores, donde se extrae, mediante estadísticas, el elemento principal (entidad), y donde por entropía se extrae una lista de elementos alternativos que se añaden a unas tablas de re escritura donde se relaciona con otras consultas anteriores y se determina si se ha de usar o no la consulta modificada. Para determinarlo se puede usar la cantidad de clics que se han realizado en la consulta corregida frente a la normal, o según el comportamiento del usuario en los resultados de búsqueda; también se puede tener en cuenta el tiempo en la página que le dedica el usuario, si se produce una conversión, si la consulta coincide con un hostname, con un identificador de producto… Esto mismo también se realizaría directamente sobre la tabla de re escritura para comprobar sobre sí misma las propias entidades (de forma que esta tabla es dinámica en el tiempo y puede cambiar).

Para determinar de una forma correcta las entidades es posible que se utilicen sistemas de eliminación de stop-words (tales como «a,» «the,» «inc,» «inc.,» «co,» y «co.»), sustituyendo guiones y espacios, eliminando apóstrofes, intercambiando «and» por «&», eliminando «www.» y/o «.com», y usando puntos, espacios y sus combinaciones para determinar otras entidades.

Además, la tabla de re escritura ha de tener en cuenta aquellos conceptos que pueden hacer referencia a distintas acepciones o conceptos. Por ejemplo [tiger] puede hacer referencia al animal, las tiendas o el sistema operativo.

Un ejemplo de re escritura podría ser: [harry potter barnes & noble,] donde la consulta cambiaría internamente a la siguiente: [harry potter store:barnesandnoble]. Este sería un ejemplo para una tienda, pero también podría ser aplicado en noticias. Por ejemplo, la consulta [george bush washingtonpost.] cambiaría a la siguiente: [george bush source:washington_post].

Sin duda Google dedica muchos recursos a trabajar por el usuario que «no sabe lo que quiere» y extrayendo entidades puede facilitar las consultas y los resultados de búsqueda, como en los ejemplos de tiendas o noticias en los que se ve claramente que el producto es una entidad y el sitio donde se quiere obtener esa entidad. De ahí que, de rebote, también sea tan importante el SERM, la reputación digital, ya que genera entidades a la hora de que alguien realice consultas.

Comments

6 respuestas a «Google patenta el «Quiso decir…»»

  1. Avatar de Oposfera

    Disculpa el offtopic Javier. Tengo esta duda existencial desde mucho antes de la actualización Panda. Termino de escribir un buen artículo orientando al SEO y me pregunto: ¿Dónde sería mejor publicarlo? En un portal de artículos bien indexado en Google, alto PR, de mi temática…o en el blog anexo a la web a posicionar. ¿Qué recomiendas?

    Un saludo y enhorabuena un vez más por tu blog, cada día entro y descubro cosas muy interesantes.

    1. Avatar de Javier Casares

      En principio lo ideal es publicarlo en algn sitio donde tengAs control. Si no tienes un sitio habitual donde publicar, entonces un blog en el que se hable de la tematica esta bien… Al final piensa en lo que ocurre en los periodicos.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *