Thu. Mar 7th, 2024

Es frustrante hojear sus feeds y encontrarse con e artículos.

Esto sucede, por ejemplo, cuando tiene alertas de palabras clave superpuestas donde existen dos palabras clave diferentes en el mismo artículo. También sucede cuando algunas fuentes publican los mismos artículos en diferentes fuentes RSS. Finalmente, sucede mucho cuando una empresa emite un comunicado de prensa y otras fuentes publican ese comunicado de prensa con algunos cambios menores.

Brindarle las herramientas y el control para ajustar sus feeds es algo que nos apasiona. Hoy, nos complace anunciar el lanzamiento beta de una nueva habilidad de Leo llamada Deduplicación.

¿Qué es la deduplicación?

Esta habilidad ayuda a Leo a detectar que varios artículos son casi duplicados exactos entre sí y a eliminar ese ruido de sus feeds. En la versión web de TecnoFans, verá una pequeña notificación en la parte inferior derecha de la pantalla cada vez que Leo elimine un duplicado de sus feeds.

¿En qué idioma funciona la deduplicación?

¿La habilidad de deduplicación Leo funciona en todos los idiomas?

¿Qué plan de TecnoFans requiere esta habilidad?

Debido a que el procesamiento de duplicados a escala es costoso, esta habilidad se implementará inicialmente como parte del plan TecnoFans Teams.

Si formas parte de TecnoFans Teams, hay una perilla de preferencias en la página de configuración de Leo para desactivar esta habilidad.

Más allá de los duplicados casi exactos

La habilidad de deduplicación se centra en duplicados casi exactos. Estos son artículos que tienen un 85% o más de superposición. Estamos trabajando en una habilidad diferente llamada Eventos comerciales para artículos que informan sobre el mismo evento pero con contenido diferente. En el caso de eventos empresariales, el contenido se agrupará en lugar de eliminarse.

¡Gracias!

¡Queremos agradecerles a Aymeric Bernard e Iheb Benabdallah por hacer la investigación preliminar de ML detrás de esta habilidad de Leo!

Related Post

Leave a Reply

Your email address will not be published. Required fields are marked *