¿Qué significa media estadística?
La media estadística es un cierto tipo de media matemática muy útil en informática, y en el aprendizaje automático en particular.
En pocas palabras, la media estadística es un proceso de media aritmética, en el sentido de que suma todos los números de un conjunto de datos y luego divide el total por el número de puntos de datos.
Eso es simple y directo, y por eso la media aritmética o media estadística se ha utilizado ampliamente en toda la era moderna y en la era de la programación informática.
Aquí podemos diferenciar la media estadística de otros dos tipos de medias que forman un grupo de tres métodos estadísticos denominados medias pitagóricas. Las otras dos medias se denominan media armónica y media geométrica.
Las tres pueden ser útiles en el aprendizaje automático y en nuevos tipos de ingeniería de algoritmos de inteligencia artificial
Definición de media estadística
En general, la media estadística es útil en todo tipo de tareas de clasificación y ayuda a la toma de decisiones del aprendizaje automático.
Piénsalo de este modo: el programa traza todos los puntos de datos y, a continuación, utiliza la media estadística para llegar a un promedio, que utiliza para ayudar al ordenador a aprender a través de sus procesos de aprendizaje automático.
La media armónica y la media geométrica, algo más complejas, también pueden utilizarse en el aprendizaje automático para cosas concretas.
Por ejemplo, la media armónica se utiliza a menudo para obtener una «puntuación F» que ayuda a evaluar la recuperación de datos en un sistema concreto.
Volviendo a la media estadística, supongamos que tienes cinco puntos de datos, y el total es 25. Tu media estadística sería cinco, pero no estás muy seguro de cuál es cada uno de esos cinco números. Podrías tener tres unos, un dos y un veinte, o podrías tener cinco cincos perfectamente simétricos.
Tienes un conjunto de datos como el del primer ejemplo mencionado, en el que la media estadística se desvía un poco. Podrías tener un conjunto de datos con los cinco números siguientes: dos, tres, seis, siete y 38.
El total es 56, pero sólo uno de esos números está por encima de la media estadística, lo que es un poco engañoso.
Aquí es donde los ingenieros de aprendizaje automático hablan de sesgo y de cómo los distintos tipos de medias y promedios pueden mostrar sesgo en un programa de aprendizaje automático.
Sin complicarse demasiado, los ingenieros pueden ofrecer una solución para estos tipos de sesgo haciendo que los algoritmos sean aún más elaborados para que puedan cuestionar o comprobar o reevaluar los datos de clasificación.
El modelo de bosque aleatorio es una de esas técnicas en las que, en lugar de un único conjunto de datos, distintos sistemas conocidos como «árboles» individuales capturan una serie de conjuntos de datos y tabulan los resultados colectivamente.
La conclusión es que la media estadística, como tipo básico de media aritmética, es muy ampliamente útil para proporcionar esas simplificaciones con las que funcionan los algoritmos de aprendizaje automático.
Si tienes un diagrama de datos dispersos y quieres filtrarlos para obtener una visión fácil de digerir, como hacen muchos cuadros de mando empresariales, la media estadística es una forma estupenda de facilitarlo.
Los matemáticos profesionales y los ingenieros de algoritmos suelen estudiar a fondo los detalles de las medias estadísticas, otros promedios y sus desviaciones.
Una media aritmética se calcula mediante la siguiente ecuación: