A pesar de los muchos cambios en el almacenamiento de datos a lo largo de las décadas, quedan algunos fundamentos. Uno de ellos es que se accede al almacenamiento mediante uno de tres métodos: bloque, archivo y objeto.
Este artículo definirá y ampliará las características de estos tres, al tiempo que analiza los productos locales y en la nube que normalmente encontrará que usan almacenamiento de archivos, bloques y objetos.
Lo que vemos es que, si bien los productos de almacenamiento de objetos, archivos y bloques de factor de forma de hardware en las instalaciones (generalmente) están disponibles, estos tipos de acceso al almacenamiento también se ofrecen en la nube para atender las cargas de trabajo que los requieren.
El auge de la nube también ha dado lugar a formas híbridas (centro de datos y nube) y distribuidas de almacenamiento de archivos y objetos.
Entonces, aunque el archivo, el objeto y el bloque son fundamentos de almacenamiento de larga duración, las formas en que se implementan en la era de la nube están cambiando.
Archivo y bloque: todo y parte
El sistema de archivos siempre ha sido un pilar de la tecnología de almacenamiento. El almacenamiento de acceso a archivos y bloques ofrece dos formas de interactuar con el sistema de archivos.
El almacenamiento de acceso a archivos es cuando accede a archivos completos a través del sistema de archivos. Por lo general, eso es a través del almacenamiento conectado a la red (NAS) o una cuadrícula vinculada de nodos NAS de escalamiento horizontal. Dichos productos vienen con su propio sistema de archivos integrado y el almacenamiento se presenta a las aplicaciones y usuarios en formato de letra de unidad.
En el acceso por bloques, el producto de almacenamiento, que generalmente se implementa localmente en sistemas de red de área de almacenamiento (SAN), por ejemplo, solo aborda bloques de almacenamiento dentro de archivos, bases de datos, etc. En otras palabras, el sistema de archivos a través del cual hablan las aplicaciones reside más arriba en la pila.
Los sistemas de archivos ofrecen todo tipo de ventajas. Entre los más destacados está que así es como se escriben la mayoría de las aplicaciones empresariales, y eso no desaparecerá demasiado pronto.
Una característica clave de los métodos basados en el sistema de archivos es que existen métodos, como los que se encuentran dentro del conjunto de comandos de Posix, para bloquear archivos y garantizar que no se puedan sobrescribir simultáneamente, al menos no de forma que dañen el archivo o los procesos. alrededor.
El almacenamiento de archivos accede a archivos completos, por lo que se usa para el almacenamiento general de archivos, así como para cargas de trabajo más especializadas que requieren acceso a archivos, como en medios y entretenimiento. Y, en su forma de NAS de escalabilidad horizontal, es un pilar de los repositorios a gran escala para cargas de trabajo de análisis y computación de alto rendimiento (HPC).
El almacenamiento en bloque proporciona acceso a las aplicaciones a los bloques que componen los archivos. Este podría ser el acceso a la base de datos donde muchos usuarios trabajan en el mismo archivo simultáneamente y posiblemente desde la misma aplicación (correo electrónico, aplicaciones empresariales como la planificación de recursos empresariales (ERP), por ejemplo), pero con bloqueo en el nivel de subarchivo.
El almacenamiento en bloque tiene la gran ventaja de un alto rendimiento y de no tener que lidiar con metadatos e información del sistema de archivos, etc.
Archivo y bloque: nube y distribuido
El almacenamiento de archivos todavía existe en formato NAS independiente, especialmente en el nivel de entrada, y el NAS escalable, destinado a la implementación local, es un lugar común.
Pero la llegada de la nube, y su tendencia a globalizar las operaciones, ha afectado las cosas y ha tenido un doble efecto.
Por un lado, hay una serie de proveedores que ofrecen sistemas de archivos globales que combinan un sistema de archivos distribuido en la nube pública y el hardware de la red local, con todos los datos en un solo espacio de nombres. Los proveedores aquí incluyen Ctera, Nasuni, Panzura, Hammerspace y Peer Software.
Por otro lado, todos los proveedores clave de la nube -Amazon Web Services, Google Cloud Platform y Microsoft Azure- ofrecen sus propios servicios de almacenamiento de acceso a archivos, y también los de NetApp, en el caso de AWS. IBM también ofrece almacenamiento de archivos a través de su oferta en la nube.
Bloque en la nube
Algunos proveedores de almacenamiento, como IBM y Pure, ofrecen instancias de su almacenamiento en bloque en la nube. Y los tres grandes ofrecen servicios de almacenamiento en bloque en la nube, destinados a aplicaciones que requieren la latencia más baja, como bases de datos y almacenamiento en caché de análisis, así como trabajo de máquina virtual (VM).
Probablemente debido a la naturaleza del almacenamiento en bloque y sus requisitos de rendimiento, no parece haber surgido ningún almacenamiento en bloque distribuido como lo ha hecho con el archivo.
Almacenamiento de objetos: un mundo aparte
El almacenamiento de objetos se basa en una estructura “plana” con acceso a objetos a través de ID únicos, similar al método del sistema de nombres de dominio (DNS) para acceder a sitios web.
Por esa razón, el almacenamiento de objetos es bastante diferente a la estructura jerárquica del sistema de archivos en forma de árbol, y eso puede ser una ventaja cuando los conjuntos de datos crecen mucho. Algunos sistemas NAS sienten la tensión cuando llegan a miles de millones de archivos.
El almacenamiento de objetos accede a los datos al nivel equivalente al archivo, pero sin bloqueo de archivos y, a menudo, más de un usuario puede acceder al objeto al mismo tiempo. El almacenamiento de objetos no es muy consistente. En otras palabras, eventualmente es consistente entre las copias reflejadas que existen.
La mayoría de las aplicaciones heredadas no están escritas para el almacenamiento de objetos. Pero lejos de ser necesariamente una desventaja, históricamente hablando, el almacenamiento de objetos es, de hecho, el método de acceso al almacenamiento elegido para la era de la nube. Esto se debe a que, en general, la nube es mucho más una propuesta sin estado que el entorno empresarial heredado, y también comprende probablemente la mayor parte del almacenamiento ofrecido por los grandes proveedores de la nube.
Además, los objetos en el almacenamiento de objetos ofrecen un conjunto de metadatos más rico que en un sistema de archivos tradicional. Eso hace que los datos en el almacenamiento de objetos también sean adecuados para el análisis.
Objeto en la nube y local con archivo
La nube ha sido el hogar natural del almacenamiento de objetos. La mayoría de los servicios de almacenamiento que ofrecen los proveedores de la nube se basan en el almacenamiento de objetos, y es aquí donde han surgido nuevos estándares de facto, como S3.
Con su fácil acceso a los datos que pueden existir felizmente como en gran medida sin estado y eventualmente consistentes, el objeto es el almacenamiento masivo de la era de la nube.
Puede obtener almacenamiento de objetos para la implementación local, como Elastic Cloud Storage de Dell EMC, que es únicamente para la implementación del centro de datos. Mientras tanto, Hitachi Content Platform de Hitachi Vantara, Cloud Object Storage de IBM y StorageGrid de NetApp pueden operar en escenarios híbridos y de múltiples nubes.
Algunos proveedores de almacenamiento de objetos especializados, como Cloudian y Scality, ofrecen implementaciones locales e híbridas.
Y en el caso de Scality, junto con Pure Storage (y NetApp, hasta cierto punto), es posible el almacenamiento convergente de archivos y objetos, con la razón de que los clientes desean cada vez más acceder a grandes cantidades de datos no estructurados que pueden estar en archivos o formatos de almacenamiento de objetos.