정형 데이터와 비정형 데이터: 기업이 알아야 할 사항

인간 조건을 발전시키고 우리 자신과 우리 아이들을 위해 더 나은 세상을 만드는 대부분의 현대 혁신과 서비스는 디지털입니다. 원시 데이터로 시작하고 진화하고 끝납니다. 유전자 매핑은 백신 생성에 사용되었으며 매핑된 유전자 데이터는 구조화되지 않은 파일에 저장됩니다. 최근 개봉한 블록버스터 영화와 같은 화질인 8K 고화질 XNUMXK로 휴대폰의 개인 동영상과 카메라의 보안 영상이 점점 더 많이 촬영되고 있습니다. 그리고 그 비디오 파일은 비정형 파일 형식으로 저장됩니다. 자동으로 자동차를 운전하는 것부터 석유 시추에 적합한 위치를 결정하는 것까지 모든 작업을 수행하도록 기계를 훈련하는 데 사용되는 데이터 세트는 방대한 양의 비정형 데이터를 훈련 세트의 일부로 활용합니다. 어디를 보든 비정형 데이터가 혁신을 주도하고 있습니다.

잘 관리되고 변형되면 이것은 비정형 데이터 우리의 현대 세계를 만드는 데 중요할 수 있습니다. 그러나 대부분의 최신 데이터 기술은 이를 활용하도록 구축되지 않았습니다. 비정형 데이터는 충분히 활용되지 않을 뿐만 아니라 상당한 문제에 직면해 있습니다. 그러나 이를 극복하는 현대 기업은 우리의 삶을 더 좋게 만들기 위해 혁신하고 놀라운 것을 만들고 있을 뿐만 아니라 그 과정에서 돈과 시간을 절약하고 있습니다.

우리는 더 이상 데이터가 없었던 시대에 살고 있습니다.

모든 데이터가 동일한 것은 아닙니다

사람들은 데이터에 대해 생각할 때 일반적으로 구조화된 데이터를 생각합니다. 그러나 실제로는 고객, 고객, 시민이 훨씬 더 많은 비정형 데이터를 생성합니다. 

구조화와 비정형 데이터 매우 중요하지만 결정적으로 구별됩니다. Fintech Futures에 따르면 비정형 데이터는 은행이 보유한 데이터의 약 80%를 차지합니다. 여기에는 오디오, 비디오 및 이메일 파일로 저장된 데이터가 포함되며 모두 비정형 데이터 파일입니다. 그러나 비정형 데이터의 가치를 실현하는 것과 관련하여 Ryan Stewart는 "수집한 정보를 활용하는 기업은 거의 없습니다"라고 말했습니다. Fintech Futures를 위한 글쓰기. "은행 부문의 가장 큰 장벽은 대규모의 구식 IT 인프라로, 세계 상위 92대 은행 중 100%가 여전히 레거시 시스템에 의존하고 있습니다."

정형 데이터와 비정형 데이터 

구조화 된 데이터 깔끔하고 단정하며 비교적 분석하기 쉽습니다. 행, 열, 테이블, 스프레드시트 및 데이터베이스에 쉽게 저장할 수 있습니다. 지난 10년 동안 거의 모든 데이터 기술이 이를 관리하고 조작하기 위해 만들어졌습니다. 비정형 데이터 기이하고 제멋대로인 사촌입니다.

비정형 데이터 기본적으로 파일 형식이며 파일 데이터라고도 하며 모든 엔터프라이즈 데이터의 80%를 구성합니다. 여기에는 이미지, 오디오, 텍스트 및 비디오 파일이 포함됩니다. 이메일, 팟캐스트, 소셜 미디어 게시물, 프레젠테이션, 영화, 의료 영상, 게놈 연구 등을 생각해 보십시오. 비정형 데이터가 표준 상자에 딱 들어맞는 경우는 드물지만 글로벌 변화, 혁신, 협업 및 변환의 본질입니다. 그리고 데이터가 가진 대부분의 기회와 가능성은 비정형 데이터에 있습니다. 주의를 기울여야 할 때입니다.

비정형 데이터가 혁신과 혁신을 주도합니다.

산업 전반에 걸쳐 비정형 데이터가 증가하고 있습니다. 주요 분석 회사에 따르면 기업은 2024년까지 온프레미스, 에지 또는 클라우드에 저장된 비정형 데이터를 XNUMX배로 늘릴 것입니다. 그리고 글로벌 전염병의 여파로 원격 작업이 보편화되면서 클라우드는 더 이상 선택 사항이 아닙니다. 오히려 경쟁 우위를 위해 필수적입니다.

비정형 데이터는 디지털 혁신을 가속화합니다. 그러나 신약을 만들고, 질병을 치료하고, 즐겁게 일하고, 더 빠르고 똑똑하고 지속 가능한 방식으로 일할 수 있는 지능형 기계를 개발하려면 비정형 데이터를 수집할 뿐만 아니라 이를 유용하고 유용한 것으로 변환해야 합니다.

데이턴 어린이 병원예를 들어, 비정형 데이터를 활용하여 환자 결과를 개선하고 생명을 구합니다. 이 최고 등급의 교육 병원의 의사들은 XNUMX등급 소아 외상 센터에서 진단 및 치료를 위해 고해상도 의료 이미지를 신속하게 검색하고 안전하게 보관해야 합니다.

현대모비스세계 최대의 자동차 부품 및 부품 공급업체 중 하나인 은 대규모 비정형 데이터 세트를 사용하여 자율 주행 및 커넥티드 카 기술을 위한 교육 시나리오를 개발하고 있습니다. 이 한국 기업은 수백 테라바이트의 비디오 데이터를 저장하고 분석하여 차량을 지능적으로 만드는 데 도움을 줍니다.

산업 형제, 클라우드가 없고 2020년 19월 이전에 원격 작업을 지원하지 않았던 풀 서비스 애니메이션 스튜디오는 비정형 데이터를 활용하여 어린이 프로그램을 만들고 제작하고 공동 작업을 수행합니다. 많은 조직과 마찬가지로 COVID-XNUMX에 대응하여 중앙 사무실을 폐쇄해야 했을 때 신속하게 전환해야 했습니다. 그들은 협업 스튜디오 경험을 가상화하고 모든 크리에이티브 및 프로덕션 워크로드를 클라우드로 마이그레이션했습니다.

이들은 비정형 데이터로 훌륭한 일을 하고 있는 수많은 회사 중 세 곳일 뿐입니다. 그들은 이를 활용하여 통찰력을 생성하고, 비즈니스 관행을 개선하고, 의사 결정에 정보를 제공하고, 혁신을 주도하고 있습니다. 그러나 이러한 유형의 작업을 수행하려면 구조화되지 않은 데이터를 잘 관리하고 쉽게 액세스할 수 있어야 합니다.

비정형 데이터의 사용 및 관리는 아직 초기 단계입니다. 그리고 오래된 시스템으로 데이터를 관리하고 저장하는 수많은 다른 조직이 발견했듯이 데이터 변환은 말보다 쉽습니다.

비정형 데이터가 큰 문제인 이유

의심할 여지 없이 비정형 데이터는 가능성으로 가득 차 있습니다. 그러나 많은 조직에서 이는 주요 문제가 될 수 있거나 될 수 있습니다. 다음은 가장 일반적인 XNUMX가지 이유입니다.

1. 조직은 충분한 스토리지를 유지, 관리 및 액세스하는 데 어려움을 겪고 있습니다.

종종 센서, 카메라, 시퀀서, 자동차 또는 기타 기계에서 캡처되는 원시 데이터는 학습 후 변환될 때까지 거의 중요하지 않습니다. 혁신에 대한 통찰력으로 데이터를 변환하려면 방대한 양의 데이터에 대한 협업이 필요한 경우가 많습니다. 그리고 데이터 혁신에는 데이터 접근성이 필요합니다. 조직은 종종 무기한 저장해야 하는 수백 테라바이트 또는 페타바이트의 데이터를 축적합니다. 이것은 1000개의 노트북에 해당하는 스토리지입니다! 데이터가 증가함에 따라 스토리지도 증가해야 합니다. 수많은 데이터에는 수많은 스토리지가 필요합니다.

2. 레거시 시스템은 최신 워크로드나 클라우드용으로 설계되지 않았습니다.

스케일 아웃 및 스케일 업 솔루션의 기존 보호 장치는 오늘날의 애플리케이션, 파일 유형, 워크로드 및 볼륨을 처리하도록 설계되지 않았습니다. 그리고 비정형 데이터를 저장하고 관리하는 두 가지 기본 방법인 개체 및 파일 스토리지 중 파일 시스템만 기본 파일 형식으로 데이터를 조작하도록 설계되었습니다. 레거시 및 개체 스토리지 시스템은 최신 데이터 관리 및 클라우드 마이그레이션에 필요한 성능, 가시성, 이식성, 제어 또는 확장성을 제공할 수 없습니다.

3. 레거시 아키텍처는 확장성을 제한합니다.

레거시 아키텍처는 종종 온프레미스 및 하드웨어 바인딩됩니다. 따라서 스토리지는 하나의 데이터 센터 아키텍처의 규모에 영향을 받습니다. 컴퓨팅이 확장됨에 따라 스토리지도 확장되어야 합니다. 그러나 데이터 센터 부동산은 비쌉니다. 이러한 한계는 창의성과 구조화되지 않은 데이터로 구축하는 새로운 방법에 대한 탐색을 억제할 수 있습니다.

4. 데이터 사일로는 액세스 및 협업을 방해합니다.

확장성 문제를 해결하기 위해 일부 조직에서는 스토리지 어레이 또는 다중 데이터 센터로 눈을 돌렸습니다. 이러한 솔루션은 일시적으로 스토리지 문제를 해결하지만 데이터 사일로와 서로 다른 스토리지 어레이로 인해 실시간 액세스 및 협업이 어려워집니다. 데이터 통찰력을 최적화하고 유용하게 만들려면 통합 데이터가 이상적입니다.

5. 통합 데이터는 저장 옵션을 제한합니다.

불행히도 통합 데이터에도 한계가 있습니다. 그것을 담기에 충분히 큰 버킷과 많은 사용자가 그것을 변환하기에 충분한 규모가 필요합니다. 데이터 센터나 퍼블릭 클라우드 모두 소수의 스토리지 옵션 이상을 제공하지 않으며 이러한 제한된 선택은 좋은 선택이 아닙니다. 맞춤형 데이터 센터 하드웨어에 대한 투자에는 더 많은 맞춤형 하드웨어에 대한 지속적인 투자가 필요합니다. 데이터 센터에 갇힌 경우 하이브리드 클라우드 환경으로 이동하지 않는 한 클라우드에 액세스할 수 없습니다. 특정 클라우드로 제한하는 퍼블릭 클라우드 옵션은 컴퓨팅, 네트워킹 및 워크플로도 제한합니다.

6. 경쟁업체가 클라우드로 마이그레이션하고 있습니다.

주요 분석가들은 2022년까지 데이터 및 분석 혁신의 90%에 퍼블릭 클라우드 서비스가 필수적일 것이라고 예측합니다. 그리고 미래 지향적인 기업과 경쟁업체는 이를 알고 있습니다. 그들은 워크플로를 퍼블릭 클라우드로 옮기고 있습니다. 그리고 비정형 데이터는 이러한 마이그레이션을 가속화하고 있습니다. 조직이 퍼블릭 클라우드에 더 빨리 접근할수록 더 많은 경쟁 우위를 확보할 수 있습니다.

7. 최고의 인재들이 원격 근무와 협업에 유리한 현대적인 직장으로 이동하고 있습니다.

재택 근무자는 대규모 데이터로 생산성을 높일 수 있는 인프라가 충분하지 않습니다. 그들은 작업을 완료하기 위해 사무실에 가야 합니다. 그러나 이것은 오래 가지 않을 것입니다. 최고의 인재는 결국 원격 작업과 협업에 도움이 되는 클라우드 기반 직장을 선택할 것입니다.

구조화되지 않은 데이터로 작업을 잘 수행하십시오.

혁신을 주도하기 위해 비정형 데이터를 대규모로 관리, 저장 및 변환하는 것이 어려울 수 있습니다. 그러나 새로운 비즈니스 모델을 수용하고 자유, 제어 및 실시간 가시성을 제공하는 데이터 플랫폼을 요구하고 데이터를 관리하고 저장하는 방식을 단순화함에 따라 이는 실행 가능하고 가능합니다.

다른 현대 혁신가와 마찬가지로 비정형 데이터를 활용하여 세상에서 좋은 일을 할 수 있습니다. 자신의 비정형 데이터 및 인프라 전략을 고려하고 재검토할 때 몇 가지 제안 사항이 있습니다.

1. 미래에 대해 겸손하십시오.

클라우드는 XNUMX년 전만 해도 의무 사항이 아니었지만 지금은 의무 사항입니다. 협상이 불가능해졌을 때 우리 모두는 모든 것이 클라우드로 가야 한다고 말했지만 옵션은 제한적이었습니다. 오늘날 AWS, Azure 및 Google Cloud Platform을 사용하면 옵션이 풍부하고 선택이 고려 사항이 되었습니다. 그러나 오늘 작동하는 것이 내일은 아닐 수도 있습니다. 따라서 결정을 내릴 때 미래에 대해 약간의 겸손을 가지십시오. 미래의 유연성을 제공하는 인프라 전략을 선택하십시오.

2. 당신이 가두는 것에 대해 의도적이어야 합니다.

전략에 집중할 때 집중하고 선택하십시오. 최종 사용자를 위한 가치를 창출하는 애플리케이션에 고정하십시오. 관행을 표준화하고 복잡성을 줄일 수 있는 인프라 소프트웨어에 고정하십시오. 기본 파일 형식의 비정형 데이터를 처리하는 안정적인 파일 데이터 플랫폼을 선택하십시오. 하드웨어, 데이터 센터 및 클라우드 제한을 초월하는 유연하고 비용 효율적인 스토리지를 선택하십시오. 그리고 이러한 유연성을 가로채는 솔루션이 있는 공급업체와 플랫폼에 대해 회의적입니다.

3. 클라우드로 이동할 때 전략적으로 행동하십시오.

기업을 클라우드로 이전할 때 통합, 확장, 변환이라는 XNUMX단계 프레임워크를 기억하십시오.

  1. 연결 비정형 데이터와 워크로드를 한 곳에서 처리합니다. 이렇게 하면 여러 시스템을 관리하는 비용과 복잡성이 줄어듭니다.
  2. 하다 비정형 데이터 및 인프라를 퍼블릭 클라우드로 전환합니다. 클라우드 버스트를 통해 또는 온프레미스와 클라우드 간에 변동할 수 있는 개별 워크로드를 구축하여 이를 수행할 수 있습니다.
  3. 변환 워크플로는 완전히 클라우드 기반이어야 합니다. 지속 가능한 디지털 혁신에는 시간이 걸립니다. 따라서 인내심을 갖고 전략적인 단계를 수행하고 곧바로 전환에 뛰어들지 않도록 주의하십시오.

인프라 전략에 대해 겸손하고 의도적이며 클라우드로 전환하기 위해 전략적 조치를 취하는 비즈니스 리더는 시간과 비용을 절약하고 최고의 인재를 유지할 수 있습니다. 올바른 데이터 플랫폼을 통해 데이터를 완전히 제어하고 비정형 데이터의 가치와 자유를 활용하여 혁신을 주도할 수 있습니다.

Qumulo를 사용할 준비가 되셨습니까?

엔터프라이즈 데이터 스토리지 솔루션을 평가할 때 고려해야 할 사항

Qumulo DataBytes: 임원의 43%는 데이터 액세스의 어려움으로 인해 IT가 비즈니스 저해 요소라고 말합니다.

이 게시물을 공유하기