데이터는 모든 것입니다. 저는 수십 년 동안 '네트워크가 플랫폼'이고 컴퓨팅이 산업을 재편하며 스토리지가 디지털 기반을 제공한다고 말해왔습니다. 하지만 진실, 즉 진짜 진실은 이 모든 영역이 중요한 것은 그 영역을 통해 흐르는 데이터 때문이라는 것입니다. 데이터가 없는 네트워크는 라우터를 통과하는 빈 패킷에 불과합니다. 데이터가 없는 스토리지는 차갑고 조용한 플래시와 회전하는 디스크에 불과합니다. 데이터 없는 컴퓨팅은 의미를 기다리는 프로세서에 불과합니다. 데이터는 배우, 대본, 무대입니다. 다른 모든 것은 조연에 불과합니다.
이 렌즈를 통해 세상을 바라보면 그림이 매우 선명해집니다. 데이터는 모든 카메라, 모든 제조 라인, 모든 자율 주행 차량, 모든 임상 기기, 모든 POS 시스템, 모든 위성 및 센서 등 엣지에서 생성됩니다. 데이터는 데이터 센터에서 지속되고 관리되어 내구성, 안정성, 분석이 가능해집니다. 그리고 클라우드에서 확장, 폭발, 변형되어 탄력적인 컴퓨팅을 통해 우리가 직접 구축할 수 없었던 일시적인 초능력을 제공합니다. 그리고 점점 더 이러한 세계는 더 이상 분리되어 있지 않습니다. 하나의 연속체입니다. 하나의 구조입니다. 우리가 접하는 모든 산업을 형성하는 하나의 힘입니다.
수십 년 동안 컴퓨팅을 데이터로 옮기자는 주장은 간단했습니다. 알고리즘, 검색, 정렬, 통계 처리 등 컴퓨팅이 가벼울 때는 데이터가 이미 있는 곳으로 푸시할 수 있는 것이 당연했습니다. 알고리즘은 작았습니다. 데이터는 방대했습니다. 쿼리를 옮기는 것은 저렴했습니다. 페타바이트를 옮기는 것은 그렇지 않았습니다. 이 논리는 세상이 우리 발밑에서 변할 때까지 유효했습니다.
오늘날 가속화된 컴퓨팅은 제한된 자원이 되었습니다. 전력망은 포화 상태입니다. 데이터센터 공간은 부족합니다. GPU, TPU, 맞춤형 가속기 등은 비싸고, 과잉 공급되며, 전 세계에 고르지 않게 분포되어 있습니다. 처음으로 중력의 중심이 이동했습니다. 컴퓨팅은 부족하고 일시적일 수 있지만 데이터는 풍부하고 어디에나 있습니다. 그리고 갑자기 한정된 컴퓨팅을 활용하려면 데이터를 컴퓨팅으로 옮겨야 한다는 현실에 직면하게 되었습니다.
그리고 두 번째 지각변동은 바로 적시성이라는 것입니다. 프론티어 및 기본 AI 모델은 페타바이트 규모의 정적 데이터로 학습되었습니다. 이 모델들은 인상적인 통계 엔진이었지만, 과거에 존재했던 세상을 추론했습니다. 추론과 실시간 추론에는 근본적으로 다른 것, 즉 최신의 정확하고 신뢰할 수 있는 데이터가 필요합니다. 데이터가 늦으면 인사이트가 잘못됩니다. 데이터가 일관되지 않으면 모델이 환각을 일으킵니다. 데이터가 불완전하면 결과가 위험해집니다. 적시성, 정확성, 완전성은 이 새로운 시대의 필수 요건이 되었습니다.
이것이 바로 우리가 Qumulo 데이터 패브릭을 구축한 이유입니다. 기업이 수백 페타바이트와 엑사바이트 규모로 확장하고, 데이터센터, 클라우드, 엣지 전반에서 글로벌 운영을 운영하고, 대규모로 AI 추론을 수행하려면 엄격한 일관성이 사치가 아니라는 것을 일찍이 깨달았습니다. 그것은 의무였습니다. 모든 읽기에는 최신 버전의 파일이 표시되어야 합니다. 모든 사이트가 정렬되어야 합니다. 모든 애플리케이션은 동일한 진실에 대한 관점을 가져야 합니다. 이러한 기반이 없으면 전체 AI 스택이 자체의 무게로 무너집니다.
클라우드 데이터 패브릭을 통해 애플리케이션을 리팩토링하지 않고도 필요한 곳에 실시간으로 정확하게 데이터를 투사할 수 있는 강력하고 일관된 글로벌 데이터 플레인을 구축했습니다. 엣지에서 수집된 데이터는 동일한 의미를 가진 코어, 소버린 클라우드 또는 하이퍼스케일러 GPU 팜으로 흐릅니다. 엑사바이트 규모의 데이터는 단일 랙의 데이터와 동일한 정밀도로 액세스됩니다. 예측 엔진인 NeuralCache는 데이터가 어디에 있든 가속화된 컴퓨팅을 최대한 활용할 수 있도록 데이터의 위치를 지속적으로 최적화합니다. 또한 Qumulo 데이터 운영 체제는 수십억 개의 파일과 개체를 노드와 지역 간에 동기화하여 워크로드가 어디에 있든 데이터 세트가 정확하고 최신이며 완전한 상태로 유지되도록 보장합니다.
이것은 이론이 아닙니다. 이것은 현실입니다. 자율 시스템은 하루에 차량당 수십 테라바이트의 데이터를 수집합니다. 미디어 및 엔터테인먼트 워크플로는 여러 대륙에 걸쳐 협업합니다. 생명 과학 파이프라인은 여러 세대에 걸친 게놈 및 단백질체 데이터 세트에서 모델을 훈련합니다. 금융 기관은 한 시간 전이 아니라 밀리초 전의 시장 상황을 반영해야 하는 리스크 모델을 운영합니다. 이러한 시스템은 드리프트를 용납할 수 없습니다. 오래된 판독값을 용납할 수 없습니다. 데이터가 때때로 맞을 때도 있고 아닐 때도 있는 세상을 용납할 수 없습니다. 항상 정확한 데이터 패브릭이 필요합니다.
그리고 지금이야말로 업계의 사고방식이 바뀌어야 할 때입니다. 수년 동안 우리는 스토리지 어레이, 네트워크 패브릭, 컴퓨팅 클러스터를 마치 기업의 일등 시민인 것처럼 설계해 왔습니다. 그렇지 않습니다. 데이터입니다. 스토리지, 네트워킹, 컴퓨팅은 데이터를 생성하고, 이동하고, 변환하고, 보존하고, 인텔리전스로 승화시키는 데이터의 여정을 지원하기 위해 존재합니다.
미래는 이를 이해하고 이를 위해 구축하는 기업의 것입니다. 엣지, 코어, 클라우드가 분리된 사일로가 아니라 하나의 연속체처럼 연결되는 세상. 컴퓨팅이 어디에 있든 적합한 데이터와 동적으로 결합되는 세상. 일관성과 정확성이 선택 사항이 아니라 AI의 신뢰성을 위한 기본이 되는 세상. 글로벌 데이터 패브릭이 모든 분석, 모든 추론, 모든 인간과 기계의 협업이 이루어지는 플랫폼이 되는 세상.
이것이 바로 우리가 꾸물로에서 만들고 있는 세상입니다. 데이터가 모든 것이기 때문입니다. 그리고 기업이 모든 위치의 모든 데이터를 완벽한 정확성과 확신을 가지고 제어할 수 있는 기능을 제공하면, AI의 잠재력을 완전히 실현할 수 있습니다. 즉, AI는 단순한 기술이 아니라 세상 작동 방식의 차세대 혁명이 될 것입니다.