Creo que veo esto de forma un poco diferente a la mayoría. Como mínimo, necesitas conocimientos de Excel de nivel medio, curiosidad, pensamiento crítico y capacidad para aprender rápidamente. Excel es prácticamente la herramienta más básica a tu disposición como analista de datos, por lo que, independientemente de si otros lenguajes como Python podrían ser más adecuados para manejar conjuntos de datos más grandes, saber Excel sigue siendo una habilidad básica que no se puede ignorar. Excel se utiliza mucho para tareas analíticas rápidas y bases de datos más ligeras, y ser capaz de utilizar una función de búsqueda rápida aquí y allá es siempre imprescindible.
A partir de ahí, querrás saber cómo funcionan las bases de datos y cómo codificar SQL (Lenguaje de Consulta Estructurado) para poder profundizar en los conjuntos de datos que tengas. SQL es un estándar industrial que se requiere siempre que los conjuntos de datos son demasiado grandes para que los maneje Excel, y saber manejarlo es una necesidad absoluta si piensas trabajar con Big Data. Casi todas las organizaciones necesitan a alguien que sepa SQL, ya sea para gestionar y almacenar datos, conectar varias bases de datos o crear o modificar estructuras de bases de datos por completo.
Lee también: Datos no estructurados: Un obstáculo para adoptar la tecnología de IA
También es importante tener la capacidad de visualizar los resultados analíticos en un formato fácil de leer. Ser capaz de contar una historia convincente basada en datos es fundamental para captar la atención de todos los que van a poner en práctica esas ideas basadas en datos.
Los gráficos y diagramas deben presentar todos los resultados de forma clara, pero también deben ser concisos, y eso es algo que los analistas de datos suelen olvidar. Mi regla general es que no se debe tardar más de tres minutos en ver un gráfico y entender lo que intenta decir.
Lo que te hará destacar, sin embargo, es si también tienes algunos conocimientos sobre lo siguiente:
- Limpieza de datos
- Procesos ETL (extracción, transformación y carga)
- Procesos ELT (extraer, cargar y transformar)
- Cómo codificar en Python
- Capacidad para utilizar API para extraer datos
- Capacidad para utilizar un lenguaje de programación estadística llamado R.
Aunque el análisis y la exploración de datos puedan parecer la parte más interesante y atractiva de este trabajo, casi el 80% del mismo se compone de operaciones bastante aburridas de limpieza y agregación de datos. Sin embargo, estos pasos son necesarios, por lo que tener un buen grado de paciencia y el pensamiento crítico necesario para agilizar esta etapa y hacerla más eficiente son habilidades extremadamente valiosas.