¿Qué significa filtrado heurístico?
El filtrado heurístico se refiere al uso de diversos algoritmos y recursos para examinar textos o contenidos de formas específicas. La palabra heurístico describe un tipo de análisis que se basa en la experiencia o en criterios intuitivos específicos, más que en simples métricas técnicas. El uso de algoritmos de alto nivel permite el análisis heurístico de contenidos, en el que los humanos pueden programar los ordenadores para que piensen de determinadas maneras en lugar de limitarse a aplicar un análisis puramente cuantitativo.
El filtrado heurístico es el más utilizado en Internet para filtrar el correo electrónico y el acceso a la Web.
Diccionario Techopedia: Filtrado heurístico
Un tipo común de filtrado heurístico es el llamado filtrado bayesiano. Se suele aplicar para filtrar el spam del correo electrónico. El filtrado bayesiano ayuda a un ordenador a reconocer ciertas palabras y la probabilidad de que estén relacionadas con el spam. En general, este tipo de técnicas implican entrenar a la máquina para que aplique un análisis de alto nivel del contenido con el fin de filtrar el spam.
Cualquiera que tenga un servicio público de correo electrónico con una carpeta de spam probablemente haya visto algún tipo de filtrado heurístico de spam en funcionamiento. Como el spam sigue siendo un reto importante en la comunicación por correo electrónico, los expertos en tecnología intentan idear formas más diversas de identificarlo.
Entre las alternativas al filtrado heurístico del spam se encuentran las listas negras de IP y el filtrado de URL, que utilizan direcciones IP y otra información en lugar de intentar identificar el spam mediante el análisis del contenido. Los críticos del filtrado heurístico del spam sostienen que un filtro basado en la asociación de palabras no siempre es del todo eficaz para separar el spam del correo legítimo.