Por qué los bump-in-the-wire boxes no pueden solucionar la latencia, la seguridad o la coherencia y por qué un sistema de archivos global por fin puede hacerlo.
Durante más de dos décadas, la aceleración de la WAN se ha comercializado como el antídoto necesario contra la distancia. A medida que las empresas alejaban las cargas de trabajo de archivos de los centros de datos centralizados, surgió una clase de dispositivos que prometían arreglar la WAN situándose en medio, manipulando el tráfico y enmascarando la latencia. Estos sistemas fueron ingeniosos en su momento, pero se diseñaron para un mundo que ya no existe: un mundo de protocolos sin cifrar, semántica de archivos poco coherente, protocolos de bloques simplistas para conjuntos de datos pequeños, sucursales con datos estáticos, servidores Microsoft Exchange como carga de trabajo principal y punto débil del cliente, y aplicaciones tolerantes a la aproximación. En la empresa moderna, definida por el cifrado omnipresente, los modelos de seguridad de confianza cero, la colaboración global y los datos no estructurados a escala de petabytes, la aceleración de la WAN no es simplemente insuficiente. A menudo es contraproducente.
El problema fundamental es físico. La latencia de área extensa está dominada por las limitaciones de la velocidad de la luz y el número de viajes de ida y vuelta necesarios para completar una operación. Los dispositivos de optimización WAN no pueden cambiar la velocidad de la luz. Lo que intentan, en cambio, es amortizar los viajes de ida y vuelta mediante protocolos proxy, colapsando los acuses de recibo, especulando sobre las lecturas y almacenando en caché de forma agresiva. Esto sólo funciona cuando el dispositivo puede ver y razonar sobre el protocolo, y sólo cuando la carga de trabajo subyacente tolera la desviación de la semántica estricta. A medida que los sistemas de archivos han ido evolucionando, ninguno de los dos supuestos se cumple.
Los protocolos de archivos modernos, como SMB3 y NFSv4, se diseñaron explícitamente para reforzar las garantías de corrección y la seguridad. El cifrado y la firma de SMB3, NFS autenticado por Kerberos con privacidad y TLS generalizado eliminan la visibilidad del optimizador sobre las cargas útiles y el estado del protocolo. Para recuperar la eficacia, los aceleradores WAN deben terminar el protocolo, descifrar el tráfico y volver a cifrarlo después de manipularlo. Esto no es una optimización, sino una intrusión arquitectónica. El dispositivo se convierte en un hombre en el medio al que hay que confiar las claves, los certificados y la pertenencia a un dominio. En el momento en que se hace esto, se ha ampliado el límite de seguridad, se han introducido nuevos modos de fallo y se han violado las garantías de integridad de extremo a extremo que exigen las empresas modernas, por no mencionar el reto de escalar horizontalmente los dispositivos "bump-in-the-wire" con flujos de tráfico de 100 Gbps y la complejidad de la redirección del tráfico.
Incluso cuando el cifrado finaliza de forma legítima, el proxy del protocolo introduce un sutil riesgo semántico. Los sistemas de archivos no son flujos de bytes; son complejas máquinas de estado finito con semántica de ordenación, bloqueo, delegación, oplocks, arrendamientos, manejadores duraderos y recuperación de fallos. Los aceleradores WAN se aproximan necesariamente a estos comportamientos. Especulan, adivinan. Almacenan metadatos en caché. Reconocen las operaciones antes de tiempo. Al hacerlo, cambian la corrección por la capacidad de respuesta percibida. En caso de fallo, colapso de enlaces, enrutamiento asimétrico o reinicio de dispositivos, surgen los casos extremos: lecturas obsoletas, bloqueos rotos, visibilidad retrasada e incoherencias difíciles de depurar que se manifiestan como fallos de la aplicación en lugar de fallos evidentes. Las empresas toleran esto hasta que no pueden, y para entonces la causa raíz está enterrada bajo capas de optimización.
Existe un problema más profundo que la optimización WAN nunca ha abordado realmente: la propia dependencia de ida y vuelta. Muchas cargas de trabajo de archivos son intrínsecamente parlanchinas porque el sistema de archivos es remoto. Cada apertura, getattr, bloqueo, escritura, confirmación y cierre requiere una coordinación a través de la distancia. Ninguna manipulación de la ventana TCP o acuse de recibo especulativo elimina la dependencia fundamental de una autoridad centralizada. La optimización de la WAN enmascara los síntomas de latencia, pero no elimina la causa arquitectónica.
Aquí es donde la industria debe cambiar su forma de pensar, de acelerar el tráfico a eliminar el tráfico innecesario, de optimizar los protocolos a replantearse dónde reside la autoridad del sistema de archivos. Este es precisamente el modelo sobre el que se construyó Qumulo.
Qumulo no intenta acelerar los protocolos de archivos y objetos sentándose en medio. En su lugar, extiende el propio sistema de archivos a través de ubicaciones. La diferencia es profunda. Cuando se amplía el sistema de archivos, ya no se intenta burlar el protocolo, sino que se redefine el ámbito del sistema al que pertenece la corrección. La arquitectura global del sistema de archivos de Qumulo establece un espacio de nombres único y coherente que abarca el núcleo, la nube y el perímetro, al tiempo que preserva la semántica POSIX y SMB. No hay proxy, ni terminación de protocolo, ni ruptura de encriptación. La autenticación y la autorización se mantienen de extremo a extremo, aplicadas por el sistema de archivos mediante integraciones de identidad nativas. El cifrado permanece intacto porque no hay ningún intermediario que necesite ver el interior de la carga útil.
Qumulo permite escrituras locales duraderas en el borde y en la nube. Esto significa que los clientes interactúan con una autoridad local para la mayoría de las operaciones. Los metadatos son locales. Los bloqueos son locales. Las aperturas y cierres de archivos y las pequeñas operaciones de E/S se completan sin atravesar la WAN. La dependencia de ida y vuelta que los aceleradores WAN intentan ocultar se elimina arquitectónicamente. La latencia no se optimiza, sino que se elimina.
La coherencia se mantiene porque Qumulo no aproxima la semántica. Las impone. Una escritura reconocida localmente es duradera de acuerdo con las garantías del sistema de archivos, no un reconocimiento de conjeturas de un proxy esperando que la WAN se comporte. Las reglas de visibilidad son precisas y deterministas. Cuando los datos deben ser compartidos a través de ubicaciones, Qumulo propaga los cambios utilizando mecanismos nativos del sistema de archivos que preservan el orden, la intención de bloqueo y la corrección. Esto es consistencia estricta, no visibilidad eventual disfrazada de rendimiento.
La compresión desempeña un papel, pero se aplica donde corresponde: dentro del sistema de archivos, sobre los datos que realmente necesitan moverse. Como Qumulo entiende los límites de los archivos, la disposición de los bloques y los patrones de cambio, puede comprimir y transmitir datos de forma eficiente sin depender de frágiles heurísticas de deduplicación de flujo cruzado que se colapsan en presencia de encriptación. Todos los tipos de archivos se benefician por igual: multimedia, PowerPoint, genómica, CAD, registros, puntos de control, porque el mecanismo opera por debajo de la aplicación y por encima del transporte, en el nivel en el que todavía existe el significado de los datos.
La replicación a nivel de bloque minimiza aún más la utilización de la WAN. En lugar de reenviar archivos enteros o confiar en la opaca deduplicación del flujo de bytes, Qumulo transmite sólo los bloques que realmente han cambiado. Esto es determinista, eficiente y robusto bajo encriptación porque opera sobre la representación interna del sistema de archivos, no sobre el texto cifrado. El resultado es un comportamiento WAN predecible, no una optimización del mejor esfuerzo que varía salvajemente con la entropía de la carga de trabajo.
Desde el punto de vista de la seguridad, el contraste no podría ser mayor. La optimización de la WAN amplía la superficie de ataque insertando intermediarios privilegiados en los flujos de autenticación y los intercambios de claves. Qumulo reduce la superficie de ataque eliminando por completo a los intermediarios. No hay necesidad de confiar en un dispositivo con credenciales de dominio, tickets Kerberos o claves privadas. Los principios de confianza cero se mantienen porque el sistema de archivos sigue siendo el único árbitro de acceso, y toda la comunicación permanece cifrada de extremo a extremo.
Desde una perspectiva operativa, la optimización de la WAN añade complejidad precisamente donde las empresas menos pueden permitírselo: a escala y en caso de fallo. Los dispositivos deben dimensionarse, emparejarse, actualizarse, parchearse y depurarse. Su comportamiento suele ser opaco y sus modos de fallo no son lineales. El modelo de Qumulo simplifica las operaciones colapsando lo que solía ser una pila de tres capas, sistema de archivos, optimizador WAN, red, en un sistema único y coherente que posee sus propias características de corrección y rendimiento.
La acusación más contundente contra la aceleración de la WAN es que su valor disminuye a medida que las empresas se modernizan. Cuanto más cifre, menos podrá ver. Cuanto más estrictos sean sus requisitos de coherencia, menos podrá especular. Cuanto más globales y colaborativos sean sus flujos de trabajo, menos ayuda el almacenamiento en caché. La optimización de la WAN fue una respuesta racional a las limitaciones de su década. En la nuestra es un anacronismo.
El futuro del almacenamiento distribuido de archivos no consiste en acelerar los protocolos de ayer en las redes de hoy. Se trata de diseñar sistemas de archivos que asuman la distancia, la seguridad y la escala desde el principio. Al ampliar el propio sistema de archivos, al permitir la durabilidad local y la autoridad en todos los lugares donde se consumen los datos, y al mover sólo los datos mínimos necesarios con total fidelidad semántica, Qumulo hace innecesaria la aceleración WAN. No porque la WAN se haya vuelto más rápida, sino porque la arquitectura por fin se ha puesto al día con la realidad.