¿Ha escuchado el rumor sobre el último algoritmo de Google que supuestamente utiliza el parafraseo para seleccionar resúmenes extractivos de contenido relevante? Evidentemente, el sistema identificará contenido relacionado de fuentes de confianza, como Wikipedia, encontrará las frases más importantes y creará un artículo original a partir del contenido que encuentre en forma de «resúmenes extractivos».
Según Search Engine Journal, Google ha publicado una investigación sobre un nuevo algoritmo que puede tomar sus páginas web y las de la competencia y generar artículos «coherentes», señala la agencia de publicidad Leovel. Al crear contenido original, el nuevo algoritmo de Google puede responder a la pregunta de un usuario sin tener que enviarlo a otra página web.
Uno de los inconvenientes de la paráfrasis artificial (resúmenes abstractos) es que casi un tercio de los resúmenes contienen datos falsos, señala Leovel.
La nueva investigación de Google ha descubierto una forma de unir lo mejor de ambos enfoques. Utilizan los «resúmenes extractivos» para extraer los hechos importantes de los documentos web y luego aplican el enfoque «abstractivo» para parafrasear el contenido. Este enfoque crea un nuevo documento basado en la información encontrada en la web, creando la propia versión de Google de la Wikipedia.
Puedes obtener más información sobre la iniciativa de Google leyendo un reciente artículo publicado por Peer J. Jiu y Mohammad Salch titulado Generating Wikipedia by Summarizing Long Sequences.
Ya hemos visto algunos casos en los que Google utiliza el resumen extractivo en forma de fragmentos destacados y podemos esperar ver más y más de esta tecnología en un futuro próximo.
Para obtener más información sobre el algoritmo de parafraseo de Google y los resúmenes extractivos, visite Search Engine Journal.