10 Cosas que Debes y no Debes Hacer en el Big Data

Fiabilidad
Conclusión

El big data es un campo nuevo y emergente para la mayoría de las empresas. Hacer que funcione requiere un ajuste cuidadoso y el uso de las mejores prácticas.

Los macrodatos se utilizan y aplican en múltiples ámbitos empresariales a medida que la analítica de datos, la inteligencia artificial y el aprendizaje automático se van generalizando. La analítica de big data puede extraer el valor real de esta riqueza de datos, que pueden ser estructurados, no estructurados o semiestructurados.

La aparición de las redes sociales ha dado lugar a muchas nuevas oportunidades para recopilar datos sobre el comportamiento de los clientes. He aquí algunos ejemplos:

  • Los datos de flujo de clics proceden de interacciones en sitios web, como clics de ratón y desplazamiento por páginas web.
  • Las redes sociales son comunidades de clientes dispuestos a compartir información sobre sus hábitos de compra.
  • Los sensores proporcionan datos sobre el entorno físico de los clientes, como la temperatura, la humedad y las pautas de tráfico.

La información obtenida del análisis de datos puede ayudar a las organizaciones en su proceso de toma de decisiones. Pero el beneficio real del big data sólo se consigue si se gestiona de forma adecuada. Las organizaciones pueden evitar perderse en el espacio del big data asegurándose de que identifican el punto de partida con casos de uso sencillos y lo aplican para comprobar el resultado rápidamente.

El primer paso antes de poner en marcha cualquier iniciativa de big data es una planificación adecuada. Una organización debe conocer claramente el propósito del proyecto. También deben identificar qué valor quieren extraer y cómo va a repercutir en las decisiones empresariales. Para empezar, debe elegirse el área más prometedora.

En este artículo exploraremos algunas de las cosas que se deben y no se deben hacer en las iniciativas de big data.

1. Conocer la finalidad y el punto de partida

El propósito de la recopilación de datos y la identificación del punto de partida son muy cruciales para el éxito de cualquier proyecto de big data. Para empezar, el objetivo debería ser identificar los casos de uso más prometedores para la empresa. Esto ayudará a la organización a identificar los componentes para esos casos de uso.

A continuación, debe realizarse una planificación adecuada para aplicar las técnicas de Bigdata a estos casos de uso y extraer información valiosa para el crecimiento de la empresa. La prioridad de ejecución debe depender de factores como:

  • Coste de implementación.
  • Impacto previsto en el negocio.
  • Tiempo necesario para el lanzamiento.
  • Velocidad de implantación.

Las organizaciones deberían empezar siempre con una aplicación sencilla y fácil de implantar como proyecto piloto. (Lea también: Por qué debería cambiar su herramienta de gestión de proyectos por un sistema operativo de trabajo).

2. Evalúe correctamente las licencias de datos

Los datos son el combustible de cualquier proyecto de big data y análisis. Por lo tanto, es muy importante proteger sus datos de un uso indebido. Antes de conceder acceso a los datos a cualquier proveedor o usuario externo, deben establecerse los términos y condiciones de licencia adecuados. La licencia de datos debe mencionar claramente los siguientes puntos básicos. También habrá muchos otros parámetros críticos en el acuerdo de licencia.

  • ¿Quién va a utilizar los datos?
  • ¿A qué datos se podrá acceder?
  • ¿Cómo se utilizarán los datos?

Si hay algún fallo en la concesión de licencias, la pérdida de datos y el uso indebido resultantes tendrán un impacto negativo innegable en la empresa.

3. Permitir la democratización de los datos

La democratización de los datos puede definirse como un proceso continuo en el que todos los miembros de una organización pueden acceder a los datos. Las personas de una organización deben sentirse cómodas trabajando con los datos y expresando su opinión con confianza.

La democratización de los datos ayuda a las organizaciones a ser más ágiles y a tomar decisiones empresariales basadas en datos. Esto puede lograrse estableciendo un proceso adecuado. En primer lugar, los datos deben ser accesibles a todos los niveles, independientemente de la estructura organizativa. En segundo lugar, debe establecerse una única fuente de verdad (denominada “la fuente de oro”) tras validar los datos. En tercer lugar, todo el mundo debe poder comprobar los datos y dar su opinión. En cuarto lugar, las nuevas ideas pueden ponerse a prueba asumiendo riesgos calculados. Si la nueva idea tiene éxito, la organización puede seguir adelante; de lo contrario, puede considerarse una lección aprendida.

4. Construir una cultura de colaboración

En el juego de los macrodatos, la colaboración mutua entre los distintos departamentos y grupos de una organización es muy importante. Una iniciativa de big data sólo puede tener éxito cuando se construye una cultura organizativa adecuada en todos los niveles, independientemente de sus funciones y responsabilidades.

La dirección de una organización debe tener una visión clara del futuro y fomentar nuevas ideas. Debe permitirse a todos los empleados y sus departamentos encontrar oportunidades y construir pruebas de concepto para validarlas. No debe haber ninguna política que culpe y detenga el juego. Siempre es un proceso de aprendizaje, que debe aceptarse por igual tanto para el éxito como para el fracaso.

5. Evalúe la infraestructura de big data

La parte de infraestructura de cualquier proyecto de big data es igualmente importante. El volumen de datos se mide en petabytes, que se procesan para extraer información. Por ello, tanto la infraestructura de almacenamiento como la de procesamiento deben evaluarse adecuadamente.

Los centros de datos se utilizan con fines de almacenamiento, por lo que deben evaluarse en términos de componentes de coste, gestión, copias de seguridad, fiabilidad, seguridad, escalabilidad y muchos otros factores. (Lea también: 6 riesgos clave de la nube pública).

Del mismo modo, el procesamiento de big data y la infraestructura tecnológica relacionada deben comprobarse cuidadosamente antes de cerrar el trato. Los servicios en la nube suelen ser muy flexibles en términos de uso y coste. Entre los proveedores de nube establecidos se encuentran pesos pesados como AWS, Azure y GCP, pero también hay muchos más en el mercado.

6. No perderse en el mar de datos

Una buena gobernanza de los datos es muy importante para el éxito de los proyectos de big data. Antes de la implantación, debe planificarse una estrategia adecuada de recopilación de datos. En general, existe una tendencia común a recopilar todos los datos heredados de una empresa. Pero puede que todos estos datos no se ajusten bien a los escenarios empresariales actuales. Por eso es importante identificar primero los casos de uso empresarial y determinar dónde se aplicarán los datos.

Una vez que la estrategia de datos esté bien definida y conecte directamente con la aplicación empresarial de destino, podrá planificarse el siguiente paso de la implantación. Después de esto se pueden aumentar los nuevos datos para mejorar el modelo y su eficacia.

7. No te olvides del código abierto

La utilidad de la tecnología que estás considerando debe evaluarse en función del tamaño del proyecto y del presupuesto de la organización. Hay muchas plataformas de código abierto disponibles de forma gratuita para llevar a cabo proyectos piloto. Las organizaciones pequeñas y medianas pueden explorar esas soluciones de código abierto para iniciar su viaje de big data. Por tanto, la organización debe centrarse en los resultados y el retorno de la inversión.

Hadoop es un marco de software de código abierto que utiliza HDFS (Hadoop Distributed File System) y MapReduce para analizar big data en clusters de hardware básico, es decir, en un entorno informático distribuido. (Lea: ¿Cómo utilizar Hadoop para analizar big data?)

El movimiento Big Data ha madurado hasta el punto de que Hadoop se ha convertido en el estándar de facto para el procesamiento de big data. MapReduce es un modelo de programación para distribuir datos y procesarlos en paralelo en un clúster de ordenadores utilizando modelos de programación sencillos. Fue desarrollado por Google para procesar eficientemente grandes cantidades de datos en grandes clusters de ordenadores.

8. No empiece sin una planificación adecuada

Iniciar todos los proyectos de big data de una sola vez es una tendencia muy peligrosa. Lo más probable es que este enfoque sólo conduzca a un éxito parcial o a un fracaso total. Las organizaciones deben planificar adecuadamente antes de poner en marcha sus iniciativas de big data, en lugar de ir a por todas o dar un salto de fe. Siempre es recomendable empezar con una aplicación sencilla, pequeña y medible.

Una vez que el piloto tenga éxito, entonces se podrá implementar en aplicaciones a gran escala. Es fundamental tomarse el tiempo necesario para desarrollar un plan y seleccionar cuidadosamente el proyecto piloto.

9. No descuide la seguridad

La seguridad de los datos es otro aspecto importante de los proyectos de big data. En cualquier escenario de big data, se extraen petabytes de datos de diferentes sistemas fuente y luego se procesan. Los datos procesados son la entrada al modelo analítico. El resultado de la analítica es la información valiosa para la empresa. Una vez que los datos brutos se han refinado y se ha extraído información significativa de ellos, la confidencialidad, integridad y disponibilidad (CIA) de esa información se convierte en un factor crítico.

Cuando los datos contienen información empresarial crítica, se convierten en valiosos para la organización. Por lo tanto, estos datos deben protegerse de las amenazas externas. La seguridad de los datos debe planificarse como parte del ciclo de vida de la implementación de big data. (Lea también: Seguridad en la nube: 5 ciberriesgos comunes).

10. No se centre en unidades de negocio aisladas

En el complejo escenario empresarial actual, centrarse en una sola unidad de negocio no sirve de nada. Las organizaciones deben adoptar una visión de alto nivel de la empresa en su conjunto y pensar en términos de perspectiva global. El mejor enfoque debería ser dar pequeños pasos cada vez y mantener una visión global. El enfoque debe ser holístico en términos de unidades de negocio. Tendrá un impacto positivo y un mejor retorno de la inversión.

Conclusión

No existe una vía de éxito específica para la implantación del big data. Es una combinación de planificación, estrategia, enfoque y otros factores lo que conduce al éxito.

Cada organización tiene un objetivo específico que alcanzar, por lo que la estrategia debe planificarse en consecuencia, el proyecto piloto debe elegirse con cuidado y la información resultante debe protegerse y tratarse adecuadamente.

Kaushik Pal
Technology writer
Kaushik Pal
Editor

Kaushik es un arquitecto técnico y consultor de software con más de 23 años de experiencia en análisis de software, desarrollo, arquitectura, diseño, pruebas e industria de capacitación. Tiene interés en nuevas tecnologías y áreas de innovación, centrándose en arquitectura web, tecnologías web, Java/J2EE, código abierto, WebRTC, big data y tecnologías semánticas. Ha demostrado su experiencia en análisis de requisitos, diseño e implementación de arquitecturas, preparación de casos de uso técnico y desarrollo de software. Su experiencia ha abarcado diferentes sectores como seguros, banca, aerolíneas, envíos, gestión de documentos y desarrollo de productos, entre otros. Ha trabajado con una amplia…