검색
이 검색 상자를 닫습니다.

유전체학 연구 및 생명 과학 조직을 위한 데이터 볼륨, 가시성 및 미래에 대한 비전 관리

작성자 :

생물의학 연구, 신약 개발 및 개발, 의료 전문가들에게 흥미로운 한 주입니다. Bio-IT World Conference 및 Expo Virtual 오늘 시작합니다. 파일 데이터 캡처, 처리, 공동 작업 및 관리 요구 사항에 대한 참석자의 소식을 듣게 되어 기쁩니다.

일반적인 데이터 관리 과제

생명 과학 및 유전체학 연구자들이 컴퓨팅 성능을 향상시키는 데이터 플랫폼과 서비스는 물론 수십억 개의 데이터 포인트와 파일을 효율적으로 처리할 수 있도록 확장할 수 있는 솔루션을 찾고 있기 때문에 이번 주 데이터 관리가 뜨거운 주제가 될 것으로 예상합니다.

우리는 연구자와 기타 생물의학 전문가들이 방대한 양의 데이터에서 의미 있는 지식을 이끌어낼 뿐만 아니라 그 어느 때보다 빠르게 결과 데이터를 분석하고 전달할 수 있어야 한다는 도전을 받고 있음을 이해합니다.

Qumulo의 목표는 연구 조직이 스토리지보다 과학에 집중할 수 있도록 돕는 것입니다.

다음은 고객으로부터 듣는 일반적인 데이터 관리 문제와 Qumulo의 파일 데이터 플랫폼이 도움이 될 수 있는 방법입니다.

과제 #1: 데이터 볼륨

미래의 의학 연구소 단일 인간 게놈이 100GB의 저장 공간을 차지한다고 추정합니다. 점점 더 많은 게놈이 시퀀싱됨에 따라 스토리지 요구 사항은 기가바이트에서 페타바이트, 엑사바이트로 증가할 것입니다.

연구소에 따르면 "2025년까지 인간 게놈 데이터에 약 40엑사바이트의 저장 용량이 필요할 것"이라고 합니다.

그리고 그 데이터 증가는 조만간 멈추지 않을 것입니다.

이처럼 파일이 많으면 디렉토리 구조와 파일 속성 자체가 빅데이터가 된다.

Qumulo의 파일 데이터 플랫폼은 문제에 접근하는 방식이 독특합니다. 확장 성. 수십억 개의 파일로 확장하고 모든 파일 크기를 효율적으로 저장하도록 설계되었습니다. 플랫폼의 디자인은 현대의 대규모 분산 데이터베이스에서 사용되는 것과 유사한 원칙을 구현합니다. 그 결과 타의 추종을 불허하는 규모 특성을 가진 파일 데이터 플랫폼이 탄생했습니다.

과제 #2: 데이터 가시성

스토리지 시스템에 수십억 개의 파일이 있는 경우 이를 관리할 방법이 필요합니다.

레거시 파일 시스템의 관리자는 종종 "데이터 맹목성"으로 인해 방해를 받을 수 있습니다. 즉, 파일 시스템에서 무슨 일이 일어나고 있는지 정확하게 파악할 수 없습니다.

유타 대학교의 SCI(Scientific Computing and Imaging) 연구소 이 도전에 대해 너무나 잘 알고 있었습니다. 조직은 방대한 데이터 파일과 마찬가지로 막대한 처리 및 용량 문제에 직면했습니다.

SCI 연구소의 정보 기술 부국장인 Nick Rathke는 "용량이 부족하면 상위에서 불가피하게 '오래된 데이터를 삭제'하는 방향으로 가야 합니다."라고 말했습니다. “그런데 어떤 오래된 데이터요? 오래된 데이터와 중요한 데이터 사이에는 큰 차이가 있으며, 긴 수동 보고서를 실행하지 않고는 어느 것이 어느 것인지 알 수 없습니다.”

이러한 가시성의 부족을 감안할 때 Rathke의 팀은 또한 스토리지 관리에 관해 사용자와 협력하는 데 어려움을 겪었습니다. "나는 그들이 얼마나 많은 것을 사용하고 있는지 쉽게 말할 수 없고, 몇 년 동안 건드리지 않은 파일의 중요성에 대해 이의를 제기할 수 없고, 할당을 추적할 수 없습니다. 이는 매우 고통스러운 과정입니다."

Qumulo의 파일 데이터 플랫폼은 얼마나 많은 파일과 디렉토리가 있는지에 상관없이 정확히 그런 종류의 가시성을 제공하도록 설계되었습니다. 처리량 추세 및 핫스팟에 대한 즉각적인 통찰력을 얻을 수 있습니다. 또한 실시간 용량 할당량을 설정하여 레거시 스토리지의 시간 소모적인 할당량 프로비저닝 오버헤드를 방지할 수 있습니다. 정보는 그래픽 사용자 인터페이스를 통해 액세스할 수 있으며 프로그래밍 방식으로 정보에 액세스할 수 있는 REST API도 있습니다.

과제 #3: 온프레미스, 퍼블릭 클라우드 및 멀티클라우드 데이터 관리에 대한 비전 실현

연구 조직은 분석을 위한 더 많은 컴퓨팅 리소스를 제공하기 위해 점점 더 클라우드를 찾고 있습니다.

Accenture에 따르면 가장 흥미로운 점은 이것이 현재 생명 과학 분야에서 일어나고 있는 이유입니다. “다른 산업에서는 비용 효율적인 데이터 스토리지와 출시 시간 단축이 주요 동인입니다. 그러나 생명 과학 조직은 전문성을 활용하고 리소스를 혁신에 집중할 수 있는 능력을 클라우드로 마이그레이션할 때 얻을 수 있는 최고의 이점으로 보고 있습니다.

"클라우드는 기존의 대규모 IT 배포를 기다리지 않고 온디맨드 방식으로 인프라, 정보학 및 분석 기능을 확장할 수 있는 유연성과 능력을 기업에 제공하기 때문에 클라우드를 통해 조직은 아이디어에서 실험, 대규모 배포로 이동할 수 있습니다. 전례 없는 속도로."

파일 시스템을 온프레미스와 클라우드 모두에서 실행할 수 있도록 하는 Qumulo의 고유한 소프트웨어 정의 접근 방식입니다. 쿠물로 실행 HPE(Hewlett-Packard Enterprise) Apollo Gen10 서버, Fujitsu 및 클라우드에서 Amazon Web Services (AWS)Google Cloud Platform (GCP).

AWS 또는 GCP와 같은 퍼블릭 클라우드 플랫폼은 생명 과학 및 연구 조직에 유연성을 제공합니다. 클라우드 리소스의 고유한 '탄력성'을 통해 조직은 분석해야 하는 데이터의 양과 관련하여 계산 리소스를 확장할 수 있습니다.

자세히 알아보기

BioTeam, Inc.의 Adam Kraut 및 ARUP Laboratories의 Emric Delton과 함께 진행하는 이 무료 주문형 웨비나에서 유전체학 연구를 가속화하기 위한 업계 동향 및 팁을 확인하십시오.하이브리드 클라우드 솔루션으로 게놈 연구 가속화. "

등록된 참석자 바이오 IT 월드 대화형 Zoom 토론, 개인 데모 또는 사례 연구, 백서 및 기타 자료 다운로드를 위해 Qumulo의 부스를 방문할 수 있습니다. 쇼 Brian Conway(bconway@qumulo.com) 또는 Matt Boutin(mboutin@qumulo.com)에서 Qumulo의 담당자에게 이메일을 보내 회의를 주선하거나 트윗으로 @Qumulo를 보내주십시오.

잊지 마라. 블로그 구독!

관련 게시물

위쪽으로 스크롤