Azure Native Qumulo ahora disponible en la UE, el Reino Unido y Canadá: Más información

Gestión de volúmenes de datos, visibilidad y visión de futuro para organizaciones de investigación en genómica y ciencias biológicas

Escrito por:

Es una semana emocionante para la investigación biomédica, el descubrimiento y el desarrollo de fármacos y los profesionales sanitarios como Conferencia y Expo Mundial Bio-IT comienza hoy. Estamos emocionados de escuchar a los asistentes sobre sus necesidades de captura, procesamiento, colaboración y administración de datos de archivos.

Desafíos comunes de la gestión de datos

Espero que la gestión de datos sea un tema candente esta semana, ya que los investigadores de ciencias biológicas y genómica buscan plataformas y servicios de datos que permitan una mayor potencia informática, así como soluciones que puedan escalar para manejar miles de millones de puntos de datos y archivos de manera eficiente.

Entendemos que los investigadores y otros profesionales biomédicos enfrentan el desafío no solo de obtener un conocimiento significativo de los enormes volúmenes de datos, sino también de poder analizar y entregar los datos resultantes más rápido que nunca.

El objetivo de Qumulo es ayudar a las organizaciones de investigación a centrarse en su ciencia frente a su almacenamiento.

A continuación, se muestran algunos de los desafíos comunes de administración de datos que escuchamos de nuestros clientes y cómo la plataforma de datos de archivos de Qumulo puede ayudar.

Desafío n. ° 1: volúmenes de datos

El Instituto Médico Futurista estima que un solo genoma humano ocupa 100 gigabytes de espacio de almacenamiento. A medida que se secuencian más y más genomas, las necesidades de almacenamiento crecerán de gigabytes a petabytes y exabytes.

“Para 2025, se necesitarán aproximadamente 40 exabytes de capacidad de almacenamiento para datos genómicos humanos”, según el Instituto.

Y ese crecimiento de datos no se detendrá pronto.

Cuando tiene una gran cantidad de archivos como estos, la estructura del directorio y los atributos del archivo se convierten en big data.

La plataforma de datos de archivos de Qumulo es única en la forma en que aborda el problema de escalabilidad. Está diseñado para escalar a miles de millones de archivos y almacenar todos los tamaños de archivo de manera eficiente. El diseño de la plataforma implementa principios similares a los utilizados por las bases de datos distribuidas modernas a gran escala. El resultado es una plataforma de datos de archivos con características de escala inigualables.

Desafíos n. ° 2: visibilidad de datos

Cuando tiene miles de millones de archivos en un sistema de almacenamiento, necesita una forma de administrarlos.

Los administradores de sistemas de archivos heredados a menudo pueden verse obstaculizados por la "ceguera de los datos", lo que significa que no pueden obtener una imagen precisa de lo que sucede en su sistema de archivos.

Instituto de Computación e Imágenes Científicas (SCI) de la Universidad de Utah estaba demasiado familiarizado con este desafío. La organización se enfrentó a archivos de datos masivos e igualmente desafíos masivos de procesamiento y capacidad.

“Cuando nos quedamos sin capacidad, la dirección desde arriba es inevitablemente 'simplemente borre los datos antiguos'”, dijo Nick Rathke, subdirector de tecnología de la información del SCI Institute. “¿Pero qué datos antiguos? Existe una gran distinción entre los datos antiguos y los importantes, y no puedo decir cuál es cuál sin ejecutar extensos informes manuales ".

Dada esta falta de visibilidad, el equipo de Rathke también tuvo problemas para trabajar con los usuarios en la gestión del almacenamiento. "No puedo decirles fácilmente cuánto están usando, no puedo discutir la importancia de un archivo que no se ha tocado en años, no puedo rastrear las asignaciones, es un proceso extremadamente doloroso".

La plataforma de datos de archivos de Qumulo está diseñada para brindar exactamente ese tipo de visibilidad, sin importar cuántos archivos y directorios haya. Puede obtener información inmediata sobre las tendencias de rendimiento y los puntos de acceso. También puede establecer cuotas de capacidad en tiempo real, lo que evita la sobrecarga de aprovisionamiento de cuotas que consume mucho tiempo del almacenamiento heredado. Se puede acceder a la información a través de una interfaz gráfica de usuario y también hay una API REST que le permite acceder a la información mediante programación.

Desafío n. ° 3: Realización de una visión para la gestión de datos local, en la nube pública y en múltiples nubes

Las organizaciones de investigación buscan cada vez más la nube para brindarles más recursos informáticos para sus análisis.

Lo más interesante es por qué está sucediendo esto en las ciencias de la vida ahora, según Accenture. “En otras industrias, el almacenamiento de datos rentable y el tiempo de comercialización acelerado son los principales impulsores. Sin embargo, las organizaciones de ciencias de la vida ven el aprovechamiento de la experiencia y la capacidad de concentrar los recursos en la innovación como los principales beneficios de migrar a la nube.

“Debido a que ofrece a las empresas la flexibilidad y la capacidad de ampliar la infraestructura, las capacidades informáticas y analíticas a pedido en lugar de esperar grandes implementaciones de TI tradicionales, la nube hace posible que las organizaciones pasen de la idea a la experimentación y a la implementación a gran escala. con una velocidad sin precedentes ".

El enfoque único definido por software de Qumulo que permite que nuestro sistema de archivos se ejecute tanto en las instalaciones como en la nube. Qumulo sigue corriendo Servidores Apollo Gen10 de Hewlett-Packard Enterprise (HPE), Fujitsu, y en la nube en Servicios Web de Amazon (AWS) y Google Cloud Platform (GCP).

Las plataformas de nube pública como AWS o GCP ofrecen flexibilidad a las organizaciones de investigación y ciencias de la vida. La 'elasticidad' inherente de los recursos de la nube permite a las organizaciones escalar sus recursos computacionales en relación con la cantidad de datos que necesitan analizar.

Más información

Mire este seminario web gratuito y bajo demanda conmigo, Adam Kraut de BioTeam, Inc. y Emric Delton de ARUP Laboratories, para conocer las tendencias de la industria y consejos para acelerar la investigación genómica: "Acelerando la investigación genómica con soluciones de nube híbrida."

Asistentes registrados de Mundo Bio-IT Puede visitar el stand de Qumulo para discusiones interactivas de Zoom, demostraciones privadas o para descargar estudios de caso, informes técnicos y otros materiales. Envíe un correo electrónico a los representantes de Qumulo en el programa Brian Conway (bconway@qumulo.com) o Matt Boutin (mboutin@qumulo.com) para programar una reunión, o envíenos un tweet a @Qumulo - ¡nos encantaría hablar con usted!

No olvides suscríbase a nuestro blog!

Artículos Relacionados

Ir al Inicio