Azure Native Qumulo 이제 EU, 영국 및 캐나다에서 사용 가능 – 상세 보기

XNUMX가지 일반적인 스토리지 문제 및 해결 방법

작성자 :

많은 분들이 보셨을 보편적인 통증 척도 병원이나 응급실의 차트. 이 그래픽은 의료 전문가가 환자의 통증 정도를 평가하여 치료를 안내하고 리소스를 적절하게 할당하는 데 도움이 됩니다.

이전에 이곳 남부 캘리포니아의 일부 초대형 스토리지 환경에 대한 전문 서비스 업무에서 환경을 평가할 때 식별한 문제를 분류하기 위해 이와 같은 차트를 사용했습니다. 스토리지 아키텍처, 엔지니어링 및 관리 측면에서 고통은 사용자의 생산성에 미치는 영향을 정성적으로 측정한 것입니다.

예를 들어, XNUMX로 평가될 수 있는 쉬운 해결 방법이나 "무시할 수 있는" 문제가 있을 수 있습니다. 그러나 컴퓨팅 팜이 최대 용량으로 실행될 때마다, 예를 들어 사용자가 법적 증거 자료 제출 또는 게놈 분석과 같은 고성능 워크로드를 수행할 때 추악한 헤드를 일으키는 성능 문제가 있을 수 있습니다. 이 경우 통증은 집중하고 프로젝트를 완료하는 능력을 방해하여 통증 척도를 XNUMX으로 설정합니다("집중을 방해함").

또는 스토리지 시스템에 버그가 남아 한 번에 한 시간 동안 무작위로 다운될 수 있습니다. 그러면 데이터 저장이 완전히 중단되고 꽤 고통스러워집니다. 거의 10("기본 요구 사항을 방해합니다.")입니다. 그런 다음 XNUMX(완전한 침상 필요!)에 해당하는 완전한 데이터 손실이 발생합니다.

요점은 편집자, 컬러리스트, 건축가, 아티스트, 관리 또는 엔지니어 등 스토리지 환경에 많은 어려움이 있다는 것입니다. 기업이 더 적은 장비, 더 적은 인력, 더 적은 시간으로 더 많은 생산성과 비용을 짜내려고 함에 따라 워크로드가 증가하고 있습니다. 또한 프로젝트 해상도, 색상 깊이, 프레임 속도, 샷 복잡성 또는 처리 시간에 관한 클라이언트 요구 사항이 지속적으로 증가하고 있습니다.

여기서 우리는 스토리지 환경에서 고통 없이 유지하는 방법에 대해 이야기할 것입니다. 우리는 몇 가지 일반적인 스토리지 문제를 살펴보고 이에 대한 솔루션을 논의할 것입니다. 또한 특정 문제를 해결하는 다양한 도구와 솔루션에 대해서도 논의할 것입니다. 목표는 특정 통증 원인을 해결할 수 있도록 새로운 사고 방식을 제공하는 것입니다.

Qumulo에서 우리는 스토리지 문제에 대해 많은 기업 및 사용자와 이야기했습니다. 우리는 매우 데이터 중심적이며 사용자와의 인터뷰를 통해 작동하는 것과 작동하지 않는 것, 변경해야 할 것을 발견할 수 있었습니다. 우리의 대화를 통해 스토리지 문제의 가장 일반적인 원인은 다음과 같습니다.

1. 용량 문제(저장 용량이 충분하지 않음)
2. 성능 저하(스토리지가 충분히 빠르지 않음)
3. 예산 문제(스토리지는 항상 너무 비쌈)
4. 확장성 문제(성능이나 용량을 효과적으로 늘릴 수 없음)
5. 레거시 소프트웨어 문제(오래된 시스템이 사용자 성능에 영향을 미침)
6. 데이터 블라인드
7. 가용성 문제(스토리지가 탄력성이 없고 가끔 다운되어 생산성에 영향을 미침)
8. 데이터 손실의 고통(최악의 시나리오)

이러한 각 소스에 대해 이러한 문제가 나타나는 방법과 이유, 발생하는 고통의 종류 및 저장소 관리자가 이러한 문제를 처리하는 방법에 대해 설명합니다.

용량 문제

가장 오래된 불만은 "더 많은 공간이 필요합니다!"입니다. 이것은 우리가 곡물 창고에 물건을 보관했을 때로 거슬러 올라갑니다. 보관하려는 물건을 위한 더 많은 공간이 항상 필요합니다.

관리자로서 완전히 꽉 찬 파일 시스템을 처리해야 했던 적이 있습니까? 또는 사용자로서 하던 일을 멈추고 파일을 정리하거나 관리자가 더 많은 공간을 제공할 때까지 기다려야 했던 적이 있습니까? 전체 파일 시스템은 현실입니다. 때로는 사용자 실수, 때로는 엔지니어링 실수, 때로는 정상적인 작업 과정에서 발생합니다.

아무도 물건을 버리는 것을 좋아하지 않으며 사용자처럼 데이터의 미세한 가치를 아는 사람도 없습니다. 결과적으로 관리자는 사용자를 대신하여 안전하게 정리할 수 없는 경우가 많습니다. 불행히도 이것은 일반적으로 생산을 재개하는 데 필요한 첫 번째 단계입니다.

가장 먼저 파악해야 할 것은 디렉터리 구조를 분석하여 문제가 어디에 있는지입니다. 당신은 나무를 걷고, 그들이 찾은 모든 것을 통계하고, 용량을 더하면 답을 제시합니다. 이것은 파일 시스템에 10,000개의 파일만 있으면 훌륭하게 작동하지만 100억 또는 XNUMX억 개의 파일이 있으면 문제가 될 것입니다. XNUMX억 개의 파일을 방문하여 답을 찾는 데 하루가 걸릴 수 있으며, 검색할 때 파일 시스템으로 내려가면서 해당 프로세스를 헹구고 반복해야 할 수도 있습니다.

용량 문제를 해결하기 위한 몇 가지 빠른 팁:

  • 시장에 새로 진입하는 기업은 기존 기업보다 용량 분석을 처리하는 더 현대적인 방법을 갖게 될 것이므로 새로운 공급업체를 두려워하지 마십시오.
  • 모든 공급업체는 일정 수준의 스캔을 제공하므로 최적화를 찾으십시오.
  • 메타데이터에 대한 API 액세스를 찾으십시오. 접착 또는 긴밀한 워크플로 통합을 중요하게 생각하는 경우 해당 스캔 데이터에 프로그래밍 방식으로 액세스할 수 있는지 확인하십시오. 따라서 해당 용량 데이터를 프로덕션 관리 시스템, 미디어 자산 관리자 또는 네트워크 모니터링 시스템 등과 통합할 수 있습니다. 분석 데이터를 쉽게 사용하고 조작할 수 있기를 원합니다.
  • 할당량 또는 볼륨을 사용하여 사용자 행동에 도움을 주어 예를 들어, 방대한 개인 영화 컬렉션으로 스토리지를 가득 채울 수 있는 사용자를 확인할 수 있습니다.

성능 저하

성능은 꽤 모호한 용어일 수 있지만 스토리지 사람들이 그것에 대해 이야기할 때 일반적으로 처리량, iops 또는 대기 시간과 관련이 있습니다. 대기 시간에 매우 민감한 사용자와 처리량에 중점을 둔 렌더 팜 간의 균형을 맞춰야 합니다. 여기서 우리는 더 빠른 하드웨어, 플래시, 더 나은 데이터 레이아웃 기술, 더 나은 프로토콜 접근 방식을 통해 NAS가 실제로 따라잡기 시작했음을 알게 되었습니다. 이 모든 것이 NAS가 SAN/대역폭 요구 사항에서 칩을 제거하는 데 도움이 됩니다. SAN의 복잡성에 비해 NAS의 단순함을 추구하는 기업이 점점 더 많아질 것이라고 생각합니다.

성능 저하에 대한 기타 구제책:

  •  잠재적인 성능 문제를 미리 시도하고 해결하십시오. 가능하면 인프라를 자르기 전에 예상되는 워크플로를 잘 이해하십시오.
  • 시스템에 적합한 크기의 시스템을 선택했는지 확인하십시오. 확장 가능한 시스템을 사용하면 약간의 비용을 절약할 수 있으며 지금 필요한 스토리지만 구입할 수 있습니다. 가능하면 추가 헤드룸이 필요한지 여부와 더 필요할 때의 가능성을 계산하십시오.
  • 단일 고속 워크스테이션과 같이 매우 무거운 워크로드 이상값이 있는 경우 포인트 솔루션으로 해결할 수 있는지 확인하십시오. 예를 들어, 하나의 워크 스테이션이 엄청난 양의 스토리지를 구매하는 운전자가 되어서는 안 됩니다. 대부분의 워크로드에 낭비될 뿐입니다.

예산 문제

우리 모두 알다시피, 돈은 무한하지 않고 저장 공간은 공짜가 아니며, 자유 소프트웨어조차도 그것을 실행하기 위해 (무료가 아닌) 하드웨어와 엔지니어가 필요합니다. 스토리지 용량에는 깨끗한 비용이 따르며, 그 비용은 항상 너무 비싸다고 인식될 것입니다. 너무 자주 나는 사람들이 용량에 대한 달러에 매달리고 전체에 대한 달러 또는 iops에 대한 달러와 같은 다른 것들을 무시한다는 것을 발견합니다.

  • 워크플로에 적합한 스토리지 기술을 사용하십시오. 필요하지 않을 때 플래시를 사용하는 것은 돈을 낭비하는 것입니다. 플래시가 필요할 때 디스크를 사용하는 것은 작동하지 않습니다.
  • 또한 통합자 또는 변형자를 참여시키고 싶을 것입니다. 그들은 공급업체와 이야기하고 시장을 이해하는 데 많은 시간을 할애하고 시스템을 평가할 때 가치를 추가할 수 있습니다. 가치를 추가하지 않는 VAR을 지지하지 마십시오!
  • 이전 스토리지 경험을 기반으로 구매 프로세스에 들어가게 되며 상황은 엄청나게 빠르게 변합니다. 12-XNUMX개월 전에 생각했던 것이 오늘날에는 사실이 아닐 수도 있습니다. 새로운 스토리지 구매 또는 시설 증축을 계획할 때 조사를 수행하십시오.

스케일링 통증

비즈니스가 성장하면 워크로드도 증가할 수 있습니다. 스토리지 확장은 흥미롭습니다. 시스템을 상당히 사용할 수 없게 만들 수 있는 많은 작업 부하와 균형을 맞춰야 합니다. 대부분의 시스템은 확장하기가 쉽지 않으며 처음부터 크게 만들기가 정말 어렵습니다. 지난 XNUMX년 동안 우리는 스토리지 시스템에서 많은 발전을 이루었습니다.

예측할 수 없는 워크로드가 있는 경우 확장 용이성을 핵심 값으로 찾으십시오.

레거시 소프트웨어 문제

그들이 말하는 것과는 달리, 기존의 대규모 스토리지 공급업체는 더 이상 위험이 없습니다. 고객 지원을 매우 중요하게 생각합니다. 마감 기한이 촉박하거나 데이터 세트가 많은 경우 문제 해결에 어떻게 도움이 되었는지 추적 기록을 살펴보십시오.

  • 소프트웨어 개발 조사를 두려워하지 마십시오. 엔지니어링 로드맵이 얼마나 정확한지 기존 고객과 이야기하십시오.
  • 로드맵에서 예측된 요구 사항을 측정합니다. 당신은 당신이 구입하는 스토리지 시스템에 당신의 왕관 보석을 넣을 것이고 시스템이 클수록 거기에 더 오래있을 것입니다. 선택한 공급업체는 현재와 같은 방향으로 움직여야 합니다.

데이터 맹목

많은 스토리지 시스템이 시스템 관리에 적합하지 않습니다. 스토리지는 일종의 벙어리 또는 더 나은 단어에 대한 벙어리입니다. 대부분의 스토리지는 그 안에 있는 데이터나 클라이언트가 지금 무엇을 하고 있는지 알려주지 않습니다. 다른 방법으로 이러한 질문에 대한 답을 얻을 수도 있지만 모두 복잡합니다.

  • 스토리지는 다음과 같은 질문에 답할 수 있어야 합니다. 이 처리량을 모두 소모하는 것은 무엇입니까? 일요일에 내 용량이 어디로 갔습니까? 지금 내 용량을 소모하고 있는 것은 무엇입니까? 무엇을 백업해야 합니까? 무엇을 안전하게 보관할 수 있습니까? 언제 더 많은 스토리지가 필요합니까?
  • 대부분의 고급 스토리지 제공업체는 가시성 도구를 제공합니다. 어쨌든 스토리지는 데이터 센터에 가장 잘 위치하여 자체 및 액세스하는 항목에 대해 알려줍니다.
  • 연구 시각화 도구 – 기존 솔루션을 평가할 때 최근에 가지고 있던 질문에 대한 답을 제공합니까?
  • 관리 시스템과의 통합을 중요하게 생각한다면 API 액세스를 요구해야 합니다. 스토리지 공급업체가 액세스 권한을 제공하지 않는 경우 제공해야 합니다.

가용성 문제

데이터를 사용할 수 없으면 작업이 중지됩니다. 작업 비용 중단이 발생하며, 사용 불가능한 스토리지로 인해 차단되는 창의적 또는 기술 인력으로 구성된 대규모 팀이 있는 경우에는 더욱 그렇습니다.

모놀리식 시스템을 사용하면 가용성이 떨어질 수 있습니다. 종종 두 시스템을 구입한 다음 장애가 발생할 경우 두 시스템 간에 워크로드를 이동할 수 있는 소프트웨어 계층을 추가해야 합니다. 모놀리식 시스템에 중복성을 추가하는 비용을 주의 깊게 살펴보고 보험 정책이 그만한 가치가 있는지 확인하고 싶을 것입니다.

다운타임 비용이 매우 높은 경우 중복성을 위해 두 개의 시스템을 구입하는 것이 좋습니다. 그러나 가동 중지 시간 비용이 유연하거나 낮으면 추가된 시스템의 가치가 없을 수 있으므로 백업을 고려하고 있다면 생각해 보십시오.

일종의 절충안인 또 다른 옵션은 더 큰 SLA와 함께 고급 서비스 계약이 있는 솔루션을 찾는 것입니다. 수평 확장 시스템의 경우 단일 노드 오류가 전체 시스템을 중단시키지 않으므로 아키텍처에 고유한 보호 기능이 있지만 네트워크 문제로 인해 클러스터가 중단될 수 있습니다. 두 경우 모두 복구 및 비즈니스 연속성을 위한 백업을 갖게 됩니다. 두 개를 사는 데는 항상 본질적으로 높은 가치가 있습니다.

데이터 손실 고통

말하니 마음이 아픕니다. '데이터 손실'이라는 말만 들어도 소름이 돋는다. 명백히 말하면 데이터 보호는 매우 중요합니다. 이 산업에서 데이터는 우리가 작업하고 수정하는 실제 대상입니다. 따라서 손실된 데이터는 시간 손실, 비용 손실, 일자리 손실입니다. 데이터를 정말 잘 보호하는 시스템을 살펴보고 싶을 것입니다.

  • 드라이브 인구가 증가함에 따라 재구축 성능도 높아져야 합니다. 아래로 내려가면 잘못된 방향으로 움직이고 있는 것입니다. 드라이브 수가 증가함에 따라 증가해야 합니다. 일종의 병렬 재구축 시스템이 필요합니다.
  • 가능한 최소한의 보호 수준을 유지하십시오. 모든 것을 보호하려는 목표로 낮은 수준으로 뛰어들지 마십시오. 비용이 많이 들고 작은 임의 쓰기 비용이 증가합니다.
  •  파일별 데이터 보호를 수행하는 일부 개체 및 확장 시스템이 있습니다. 가능하면 피하십시오. 파일 수가 적은 경우에는 별 문제가 되지 않을 수 있지만 파일 수가 늘어나면 해당 전략이 적용되지 않습니다.

스토리지 문제를 줄이는 방법에 대해 자세히 알아보기

이러한 문제점에 대한 자세한 정보를 원하시면 여기를 확인하십시오. XNUMX시간 웨비나 데이터 골칫거리를 완화하는 일반적인 문제와 방법에 대한 심층 분석을 제공하는 Qumulo에서.

원하시면 여기로 연락주세요 회의 설정 또는 데모 요청. 과 블로그 구독 더 유용한 모범 사례 및 리소스를 위해!

관련 게시물

위쪽으로 스크롤