¿Qué significa Data Sandbox?
Un sandbox de datos, en el contexto del big data, es una plataforma escalable y de desarrollo que se utiliza para explorar los ricos conjuntos de información de una organización mediante la interacción y la colaboración. Permite a una empresa darse cuenta del valor real de su inversión en big data.
Un sandbox de datos es explorado principalmente por equipos de ciencia de datos que obtienen plataformas sandbox a partir de datamarts analíticos autónomos o particiones lógicas en almacenes de datos empresariales.
Las plataformas sandbox de datos proporcionan la computación necesaria para que los científicos de datos aborden cargas de trabajo analíticas habitualmente complejas.
Definición de Sandbox de datos
Un sandbox de datos incluye unidades centrales de procesamiento paralelo masivo, memoria de alta gama, almacenamiento de alta capacidad y capacidad de E/S, y suele separar los entornos de experimentación de datos y de bases de datos de producción en los almacenes de datos.
El IBM Netezza 1000 es un ejemplo de plataforma sandbox de datos que es un data mart analítico independiente. Un ejemplo de partición lógica en un almacén de datos empresarial, que también sirve como plataforma sandbox de datos, es el IBM Smart Analytics System.
Un clúster Hadoop como IBM InfoSphere BigInsights Enterprise Edition también se incluye en esta categoría.