검색
이 검색 상자를 닫습니다.

스토리지가 아닌 데이터 관리 – 오늘날의 머신 데이터 맹공격에서 살아남기

작성자 :

데이비드 베일리

우리는 오늘 머신 데이터 승수 또는 제XNUMX의 데이터 시대에 대해 이야기할 것입니다. 그러나 먼저 지난 수십 년 동안 폭발적으로 증가한 엔터프라이즈 데이터의 역사 교훈입니다.

초기: 1990년대 중후반
스토리지 시스템과 1990년대 중후반에 구축된 목적에 대해 생각해 보면 실제로 비즈니스 데이터를 처리하기 위해 만들어졌습니다. 시스템은 주로 데이터베이스 역할을 하거나 온라인 트랜잭션 처리를 처리하는 데 중점을 두었습니다. 그 당시에는 스토리지 시스템이 냉장고 크기의 거대하고 하나 또는 두 개의 작은 메인프레임 시스템(때로는 매우 큰 메인프레임 시스템도 지원)을 지원했음을 기억하십시오. 그러나 데이터베이스가 200GB 또는 심지어 TB인 경우 데이터베이스로 간주되던 시절이기도 했습니다. 매우 큰 데이터베이스와 관리해야 할 매우 많은 양의 스토리지.

또한 이러한 초기 시스템에는 시스템을 연결할 컨트롤러가 12개 이상 밖에 없었을 수 있습니다. 관리할 서버에 대한 연결이 많지 않았기 때문에 관리자는 데이터를 생성하는 수많은 서버를 관리하지 않았습니다.

따라서 1990년대 후반에 SAN 또는 SAN(Storage Area Network)의 발명을 보기 시작했습니다. 여기에서 이메일 서버용이든 기타 목적이든 동일한 스토리지 시스템에 연결하려는 시스템이 점점 더 많아졌습니다. SAN의 출현은 처리량 관점에서든 또는 단순히 출시되는 서버의 양으로 인해 해당 스토리지 시스템에 대해 만들 수 있는 총 연결 수의 개선을 실제로 제공했습니다.

이메일, 스프레드시트, 디지털 사진 등 "휴먼 엔터프라이즈 콘텐츠"의 등장
이로 인해 차세대 데이터 물결이 생성되었습니다. 우리는 이것을 많은 외부 소스에서 오는 "휴먼 엔터프라이즈 콘텐츠"로 분류합니다. 이것은 이메일, Word 문서, Excel 스프레드시트 등과 같은 소스에서 개별 사용자로부터 생성된 비정형 파일 데이터입니다. MySpaces of the world 등 새로운 소셜 네트워크가 출시되기 시작했습니다. NetApp 및 Isilon과 같은 회사는 시장에서 큰 발판을 마련하기 시작했습니다.

이 당시의 다른 주요 데이터 소스(10배 성장!)는 디지털 사진의 부상에서 비롯되었습니다. 1990년대 후반과 2000년대 초반에 디지털 카메라가 양산되기 시작했고 초기 디지털 카메라에는 저장 공간이 많지 않았기 때문에 소비자들은 사진을 저장할 장소가 필요하다는 것을 깨달았습니다. 사용자는 또한 해당 사진을 인쇄할 수 있기를 원했습니다. 이로 인해 소비자가 시스템에 디지털 사진을 업로드할 수 있도록 결실을 맺는 Ofoto 및 Shutterfly와 같은 회사가 등장했습니다.

마지막으로, 2000년대 초반에는 RealNetworks와 같은 회사에서 당시 야구, NFL 게임 및 기타 유형의 비디오 콘텐츠를 스트리밍했습니다. 물론 그 당시에는 작은 우표 크기의 비디오 콘텐츠였지만 더 많은 회사에서 사용자가 네트워크에 실시간 데이터를 실시간으로 제공하기 시작하면서 온라인 비디오 콘텐츠 측면에서 볼 수 있는 것은 시작에 불과했습니다. 보다.

기계 생성 데이터 시대 진입
그리고 이것은 우리를 오늘날에 이르게 합니다. 우리는 여전히 비정형 파일 데이터의 증가를 보고 있지만 지금은 대부분이 기계에서 생성됩니다. 이에 대한 예로는 위성 이미지 또는 유료 교량 및 유료 도로로 가는 자동차에 대한 정보를 수집하는 센서의 데이터가 있습니다. 또한 웹 로그와 관련하여 생성되는 방대한 양의 데이터가 있습니다. 파일 서버에서 나오는 로그, 감사의 관점에서 누가 이러한 리소스를 사용하고 있는지 확인하기 위한 스위치에서 나오는 로그입니다.

기계 생성 데이터의 또 다른 소스 – 경우에 따라 페타바이트 규모의 데이터는 유전자 분석기와 같은 것이 암 연구 등에 대한 분석을 수행하는 집안의 생물정보학 쪽에서 나옵니다. 이러한 데이터 볼륨은 100배 증가하고 있습니다!

그리고 이것이 바로 Qumulo가 엄청난 양을 처리하기 위해 완벽하게 자리 잡은 곳입니다. 따라서 고객은 데이터가 어떻게 증가하는지 확인하고 데이터가 어떻게 사용되는지 이해할 수 있을 뿐만 아니라 앞으로 해당 데이터를 매우 쉽게 관리할 수 있습니다.

크기가 수백 테라바이트이든 페타바이트이든 상관없이 기계 생성 데이터와 이러한 방대한 양의 정보를 관리할 때 발생하는 문제 중 하나는 데이터 맹목입니다. 이는 다양한 머신 데이터 소스에서 방대한 양의 데이터가 매우 빠르게 생성될 때 발생합니다. 해당 데이터가 어떻게 증가하는지, 그리고 해당 데이터에 실제로 무엇이 들어 있는지 이해할 수 있다는 것은 데이터를 관리하는 방법에 있어 가장 중요합니다. 많은 기업의 경우 이러한 스토리지 시스템에서 매일 100-5TB의 데이터가 증가하는 것은 드문 일이 아닙니다. 그 규모를 이해하고 해당 데이터가 증가하는 방식을 관리하는 방법은 매우 중요합니다.

기계 생성 데이터로 살펴봐야 하는 또 다른 사항은 배포 방법론 또는 유입 구성 요소입니다. 데이터를 온프레미스, 클라우드 또는 이 둘의 조합에 저장하시겠습니까? 다양한 플랫폼 또는 공급업체 시스템에서 데이터를 관리해야 합니까?

Qumulo로 파일 기반 데이터의 힘을 최대한 활용하십시오
Qumulo의 사명은 기업이 파일 기반 데이터의 힘을 최대한 활용할 수 있도록 돕는 것입니다. 우리는 이 데이터가 오늘날 혁신의 엔진이라고 믿습니다. 기업은 어디에서나 생성, 큐레이팅, 분석 또는 단순히 관리 요청을 받는 엄청난 규모의 데이터로 어려움을 겪고 있습니다. 테라바이트에서 페타바이트에 이르기까지 이 문제는 날로 커지고 있으며 해당 데이터에서 인텔리전스를 도출할 수 없다는 부담은 문제를 더욱 복잡하게 만듭니다.

사용자가 데이터에서 전략적이고 실행 가능한 결정을 내리기 위해서는 데이터를 효과적으로 저장, 관리 및 이해할 수 있어야 합니다.

XNUMX세대 데이터에 대해 자세히 알아보고 현재 스토리지 인프라가 증가하는 데이터 폭증을 충족할 수 있는지 알고 싶으십니까? 자세한 내용은 당사에 문의하십시오. 여기에서 지금 확인해 보세요..

관련 게시물

위쪽으로 스크롤