¿Qué significa almacenamiento de objetos?
El almacenamiento de objetos es un enfoque para organizar y gestionar unidades discretas de almacenamiento denominadas objetos en una arquitectura distribuida de computación en nube. En este contexto, un objeto contiene tres componentes principales:
- Datos: La carga útil del contenido del objeto puede ser un documento, una imagen, un vídeo, un archivo de audio o cualquier otra forma de datos estructurados o no estructurados.
- Metadatos ampliados: Los metadatos son datos que describen datos. En este contexto, los metadatos proporcionan un contexto para los datos que se almacenan dentro de un objeto. Los metadatos extendidos se almacenan normalmente como un par clave-valor (KVP), y la clave se utiliza a menudo como identificador único del objeto.
- Identificador único: Cada objeto se identifica de forma única mediante un identificador de objeto. El identificador se utiliza para localizar y recuperar un objeto específico dentro de una infraestructura de almacenamiento distribuido.
Parking valet para la nube
Los principales proveedores de la nube confían en gran medida en el almacenamiento de objetos para impulsar sus servicios de almacenamiento, y muchas aplicaciones y servicios basados en la nube utilizan este tipo de arquitectura para almacenar y acceder a los datos.
Por eso, el almacenamiento de objetos suele denominarse parking valet para la nube. Cuando alguien utiliza el servicio de parking, cambia la llave de su coche por un ticket numerado. La persona no necesita saber dónde aparca su coche porque, en la mayoría de los casos, eso es irrelevante. Sin embargo, sí tiene que presentar el ticket numerado cuando quiera recuperar su coche, para que se le devuelva el vehículo correcto.
Siguiendo con esta analogía, el identificador único de un objeto de almacenamiento es lo mismo que un ticket numerado de parking. Cuando un usuario o una aplicación quieren acceder a los datos que han almacenado en la nube, tienen que enviar el identificador del objeto que se les dio cuando “aparcaron sus datos” para que se les devuelvan los datos correctos.
Cómo funciona el almacenamiento de objetos
Cuando un cliente de almacenamiento en nube sube datos a la nube, el proveedor de la nube emite una respuesta que incluye el identificador único del contenido subido. Este identificador se denomina “clave de objeto”, “ID de objeto” o “URL de objeto”.
Cuando un usuario o aplicación quiere acceder a un objeto de almacenamiento, necesita incluir el ID del objeto en su solicitud. Esto requiere que el solicitante conozca el ID de objeto correcto. Si no conoce el ID del objeto porque no envió los datos para su almacenamiento -o no hizo un seguimiento de los ID de objeto que recibió-, tendrá que adquirir el ID único a través de una búsqueda de metadatos o navegando por los elementos del contenedor.
Al recibir la solicitud, el proveedor de almacenamiento utiliza algoritmos internos para determinar en qué nodo (o nodos) se encuentra el objeto solicitado. A continuación, recupera el objeto del nodo apropiado y lo entrega al solicitante.
Almacenamiento de objetos frente al almacenamiento tradicional
Los sistemas de archivos tradicionales tienen una estructura jerárquica que utiliza rutas de archivos para documentar dónde se almacenan los datos. Aunque esta arquitectura se ha utilizado ampliamente durante décadas, no es adecuada para almacenar big data y el volumen cada vez mayor de datos estructurados y no estructurados que generan las redes sociales, el Internet de las Cosas (IoT) y la programación generativa de IA.
Cuando los proveedores de almacenamiento en la nube como Amazon, empezaron a eliminar las restricciones de las rutas de archivos tradicionales almacenando objetos en un lago de datos plano, permitieron la asignación y distribución dinámicas de datos en un clúster de nodos o servidores, lo que a su vez facilita una escalabilidad sin fisuras.
Característica | Almacenamiento tradicional | Almacenamiento de objetos |
---|---|---|
Organización de datos | Organiza datos en un sistema de archivos jerárquico | Organiza datos en una estructura plana con identificadores únicos |
Escalabilidad | Típicamente restringido por limitaciones de hardware y sistema de archivos | Altamente escalable |
Método de acceso | Acceso basado en bloques o archivos | Acceso a través de APIs RESTful |
Metadatos | Metadatos limitados | Metadatos extendidos |
Recuperación de datos | Requiere ruta completa del archivo | Requiere ID de objeto único (clave) |
Redundancia de datos | Redundancia basada en replicación | Redundancia basada en codificación de borrado |
Casos de uso | Almacenamiento local, SANs y NAS | Almacenamiento en la nube |
Eficiencia de costes | Alto coste por GB a medida que el almacenamiento crece | Más rentable a gran escala |