Azure Native Qumulo jetzt in der EU, im Vereinigten Königreich und in Kanada verfügbar – Erfahren Sie mehr

Verwaltung von Datenmengen, Sichtbarkeit und eine Vision für die Zukunft für Genomforschungs- und Life-Sciences-Organisationen

Geschrieben von:

Es ist eine aufregende Woche für biomedizinische Forschung, Wirkstoffforschung und -entwicklung sowie medizinisches Fachpersonal als Bio-IT World Conference und Expo Virtual geht heute los. Wir freuen uns, von den Teilnehmern über ihre Anforderungen an die Erfassung, Verarbeitung, Zusammenarbeit und Verwaltung von Dateidaten zu hören.

Häufige Herausforderungen beim Datenmanagement

Ich gehe davon aus, dass Datenmanagement diese Woche ein heißes Thema sein wird, da Forscher in den Bereichen Biowissenschaften und Genomik nach Datenplattformen und -diensten suchen, die eine höhere Rechenleistung ermöglichen, sowie nach Lösungen, die sich skalieren lassen, um Milliarden von Datenpunkten und Dateien effizient zu verarbeiten.

Wir wissen, dass Forscher und andere biomedizinische Fachkräfte vor der Herausforderung stehen, aus den riesigen Datenmengen nicht nur aussagekräftiges Wissen abzuleiten, sondern auch in der Lage zu sein, die resultierenden Daten schneller als je zuvor zu analysieren und bereitzustellen.

Das Ziel von Qumulo ist es, Forschungsorganisationen zu helfen, sich auf ihre Wissenschaft statt auf ihre Speicherung zu konzentrieren.

Im Folgenden sind einige der häufigsten Herausforderungen beim Datenmanagement aufgeführt, die wir von unseren Kunden hören, und wie die Dateidatenplattform von Qumulo dabei helfen kann.

Herausforderung Nr. 1: Datenvolumen

Das Medical Futurist Institute Schätzungen zufolge benötigt ein einzelnes menschliches Genom 100 Gigabyte Speicherplatz. Da immer mehr Genome sequenziert werden, wird der Speicherbedarf von Gigabyte über Petabyte bis hin zu Exabyte ansteigen.

„Bis 2025 werden schätzungsweise 40 Exabyte Speicherkapazität für humane Genomdaten benötigt“, so das Institut.

Und dieses Datenwachstum wird in absehbarer Zeit nicht aufhören.

Wenn Sie eine große Anzahl solcher Dateien haben, werden die Verzeichnisstruktur und die Dateiattribute selbst zu Big Data.

Die Dateidatenplattform von Qumulo ist einzigartig in der Art und Weise, wie sie das Problem der Skalierbarkeit. Es ist darauf ausgelegt, auf Milliarden von Dateien zu skalieren und alle Dateigrößen effizient zu speichern. Das Design der Plattform implementiert Prinzipien, die denen ähnlich sind, die von modernen, großen, verteilten Datenbanken verwendet werden. Das Ergebnis ist eine Dateidatenplattform mit unübertroffenen Skaleneigenschaften.

Herausforderungen #2: Datensichtbarkeit

Wenn Sie Milliarden von Dateien in einem Speichersystem haben, benötigen Sie eine Möglichkeit, diese zu verwalten.

Administratoren von Legacy-Dateisystemen können oft durch „Datenblindheit“ behindert werden, was bedeutet, dass sie sich kein genaues Bild von den Vorgängen in ihrem Dateisystem machen können.

Das Scientific Computing and Imaging (SCI) Institute der University of Utah war mit dieser Herausforderung nur allzu vertraut. Die Organisation war mit riesigen Datenbeständen konfrontiert – und ebenso massiven Herausforderungen bei der Verarbeitung und Kapazität.

„Wenn uns die Kapazität ausgeht, lautet die Anweisung von oben unweigerlich ‚nur alte Daten löschen‘“, sagte Nick Rathke, Assistant Director, Information Technology beim SCI Institute. „Aber welche alten Daten? Es gibt einen großen Unterschied zwischen alten und wichtigen Daten, und ich kann nicht sagen, welche welche sind, ohne langwierige manuelle Berichte zu erstellen.“

Angesichts dieses Mangels an Transparenz hatte Rathkes Team auch Schwierigkeiten, mit den Benutzern beim Speichermanagement zusammenzuarbeiten. „Ich kann ihnen nicht leicht sagen, wie viel sie verwenden, ich kann die Bedeutung einer Datei, die seit Jahren nicht mehr angerührt wurde, nicht bestreiten, ich kann keine Zuweisungen verfolgen – das ist ein äußerst schmerzhafter Prozess.“

Die Dateidatenplattform von Qumulo wurde entwickelt, um genau diese Art von Transparenz zu bieten, unabhängig davon, wie viele Dateien und Verzeichnisse vorhanden sind. Sie erhalten sofortigen Einblick in Durchsatztrends und Hotspots. Sie können auch Echtzeit-Kapazitätskontingente festlegen, um den zeitaufwändigen Overhead der Kontingentbereitstellung von Legacy-Speicher zu vermeiden. Auf Informationen kann über eine grafische Benutzeroberfläche zugegriffen werden, und es gibt auch eine REST-API, mit der Sie programmgesteuert auf die Informationen zugreifen können.

Herausforderung Nr. 3: Eine Vision für On-Prem-, Public-Cloud- und Multi-Cloud-Datenmanagement verwirklichen

Forschungsorganisationen setzen zunehmend auf die Cloud, um ihnen mehr Rechenressourcen für ihre Analysen zur Verfügung zu stellen.

Am interessantesten ist, warum dies laut Accenture jetzt in den Life Sciences geschieht. „In anderen Branchen sind kosteneffiziente Datenspeicherung und eine beschleunigte Markteinführung die Haupttreiber. Life-Science-Unternehmen sehen jedoch die wichtigsten Vorteile der Migration in die Cloud in der Nutzung von Fachwissen und der Fähigkeit, Ressourcen auf Innovationen zu konzentrieren.

„Da sie Unternehmen die Flexibilität und Möglichkeit bietet, Infrastruktur-, Informatik- und Analysefunktionen bedarfsgerecht zu skalieren, anstatt auf große herkömmliche IT-Implementierungen zu warten, ermöglicht die Cloud es Unternehmen, von der Idee über das Experimentieren bis hin zur groß angelegten Bereitstellung zu wechseln mit beispielloser Geschwindigkeit.“

Der einzigartige, softwaredefinierte Ansatz von Qumulo, mit dem unser Dateisystem sowohl lokal als auch in der Cloud ausgeführt werden kann. Qumulo läuft weiter Hewlett-Packard Enterprise (HPE) Apollo Gen10-Server, Fujitsu und in der Cloud auf Amazon Web Services (AWS) und Google Cloud Platform (GCP).

Öffentliche Cloud-Plattformen wie AWS oder GCP bieten Life Sciences und Forschungsorganisationen Flexibilität. Die inhärente „Elastizität“ von Cloud-Ressourcen ermöglicht es Unternehmen, ihre Rechenressourcen in Bezug auf die zu analysierende Datenmenge zu skalieren.

Mehr erfahren

Sehen Sie sich dieses kostenlose On-Demand-Webinar mit mir, Adam Kraut von BioTeam, Inc. und Emric Delton von ARUP Laboratories an, um Branchentrends und Tipps zur Beschleunigung der Genomforschung zu erfahren: „Beschleunigung der Genomforschung mit Hybrid-Cloud-Lösungen"

Registrierte Teilnehmer von Bio-IT-Welt können den Stand von Qumulo für interaktive Zoom-Diskussionen, private Demos oder zum Herunterladen von Fallstudien, Whitepapers und anderen Materialien besuchen. Senden Sie eine E-Mail an die Vertreter von Qumulo bei der Show, Brian Conway (bconway@qumulo.com) oder Matt Boutin (mboutin@qumulo.com), um ein Treffen zu vereinbaren, oder twittern Sie uns @Qumulo – wir würden uns freuen, mit Ihnen zu sprechen!

Vergiss nicht zu Abonnieren Sie unseren Blog!

Verwandte Artikel

Nach oben scrollen